Amazonの「A-EVO-Lab」の研究チームが開発した自律型AIシステムが、人間の介入なしに300億パラメータのNVIDIA Nemotronモデルの事後学習(ポストトレーニング)を完了した。このシステムは、学習の途中で自身の内部評価指標が形骸化していることを検知し、自己改善のための探索戦略を自律的に修正したという。2026年6月9日にarXivに投稿された論文で明らかになったこの成果は、フロ ...