公開ベンチマークを用いた社内検証で89.1%の成功率を確認。再現性のある指標でAI脆弱性診断の実力を測定 ...