プリンストン大学のZ-Labが開発した新たなベンチマーク「CEO-Bench」において、多くの最先端AIモデルが仮想のソフトウェアスタートアップの経営に失敗し、自己破産に追い込まれたことが明らかになった。このテストでは、14のAIシステムに100万ドルの資金を与えて500日間の模擬経営を行わせたが、初期資金を増やすことできた言語モデルはわずか3つにとどまった。本結果は、現在のAIモデルに実際の企業 ...
After helping build some of the world's most widely used open AI datasets at Hugging Face, Guilherme Penedo and Hynek ...
Four supply-chain incidents hit OpenAI, Anthropic and Meta in 50 days: three adversary-driven attacks and one self-inflicted packaging failure. None targeted the model, and all four exposed the same ...