主要AIベンチマークが100%ハッキング可能と判明 - UC Berkeley研究が暴く評価の盲点2026年4月12日·5 分IT AIベンチマーク セキュリティ 評価指標 AI開発者UC Berkeleyの研究チームが8つの主要AIエージェントベンチマークをハッキングし、全て100%近いスコアを不正に獲得することに成功。AI性能評価の根本的な問題が明らかに。