Amazonの「A-EVO-Lab」の研究チームが開発した自律型AIシステムが、人間の介入なしに300億パラメータのNVIDIA Nemotronモデルの事後学習(ポストトレーニング)を完了した。このシステムは、学習の途中で自身の内部評価指標が形骸化していることを検知し、自己改善のための探索戦略を自律的に修正したという。2026年6月9日にarXivに投稿された論文で明らかになったこの成果は、フロ ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する