プログラミング言語「Python(パイソン)」でデータ検証を容易に実行できるライブラリの開発元、パイダンティック(Pydantic)を率いるサミュエル・コルヴィン氏は、AIモデルやエージェント、コーディングツールの急速な進化を特等席で観察できる立場に ...
近年はソフトウェア開発にコーディングAIを使用する開発者が一般的になっており、コーディングAIの性能を測るさまざまなベンチマークが存在します。そんなコーディングAI向けベンチマークの欠点を改善したという新たなベンチマーク「DeepSWE」が登場しました。