米OpenAIは6月2日(現地時間)、「Codex」の新機能を発表した。「Codex」はもともとソフトウェア開発向けに登場したコーディングエージェントだが、現在ではコーディング以外の用途にも広く使われている。そこで、アナリストやマーケター、オペレータ ...
近年はソフトウェア開発にコーディングAIを使用する開発者が一般的になっており、コーディングAIの性能を測るさまざまなベンチマークが存在します。そんなコーディングAI向けベンチマークの欠点を改善したという新たなベンチマーク「DeepSWE」が登場しました。