The model learns that hedging is a signal of lower-quality output. This creates a systematic bias toward sounding certain.
Google、MicrosoftなどAIエージェントに関連する複数のベンダーは2026年6月17日、AIエージェントが利用するMCPサーバー、エージェントスキル、ACP、APIなどのリソースを公開、検索、検証するためのオープンな仕様「Agentic Resource Discovery(ARD)」を発表した。
Look to these key metrics and benchmarks to evaluate the performance, capability, reliability, and safety of your AI models ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する