
AnthropicのAIモデル輸出規制が解除された。何が変わったのか?#
米国政府がAnthropicの最新AIモデルに課していた輸出規制が解除された。 この一連の動きは、AIの安全保障をめぐる官民連携の新しい形を示している。
この記事でわかること:
- Fable 5およびMythos 5の規制解除の経緯
- Anthropicが実施した具体的な安全強化策
- ジェイルブレーク(安全制限の回避)評価の新しい枠組み
- 政府とAI企業の関係がどう変化したか
📖 約6分で読めます
要点: 規制解除の背景にある安全対策と、業界全体に波及する可能性のある新しい枠組みを理解できる記事です。
【結論】重要ポイント4選#
- Fable 5が世界向けに提供再開。Mythos 5は6月26日より米国内での提供が復活し、信頼パートナー向けの拡大も進行中。
- Anthropicはジェイルブレーク対策を大幅強化。問題の回避手法を99%以上のケースでブロックすると報告。
- ただしトレードオフあり。安全分類器の強化により、通常のコーディング・デバッグ作業で一部の無害なリクエストもブロックされる可能性がある。
- 政府との連携が深化。フロンティアモデルへの事前アクセス提供など、官民の協力体制が拡大。
詳細は以下のセクションで順を追って解説する。
Fable 5・Mythos 5とは?規制解除の経緯#
Anthropicが開発した最新のAIモデルがClaude Fable 5とClaude Mythos 5だ。
6月12日、米商務省はAnthropicに対し、米国外のユーザーへの最先端モデルへのアクセスを停止するよう命令した。 その理由は、中国・ロシアなどの国々がモデルを悪用し、電力網や銀行システムなど米国のインフラを攻撃する恐れがあるというものだった。
Anthropicは国別にユーザーをブロックする手段を持っていなかったため、すべてのアクセスを停止する対応をとった。
それから約3週間後、米国は輸出規制を解除した。
商務長官のHoward Lutnick氏は書簡の中で、AnthropicがClaude MythosおよびClaude Fableの輸出または国内移転にライセンスを必要としなくなったと明言した(Reuters・New York Times報道より)。
Fable 5とMythos 5の主な特徴と違い#
| 項目 | Fable 5 | Mythos 5 |
|---|---|---|
| 対象ユーザー | 一般公開向け | 制限付き(Glasswingプログラム) |
| サイバー攻撃能力 | 固有の攻撃的能力なし | 非常に高いサイバーセキュリティ能力を持つ |
| ベースモデル | 同一の基盤モデルを使用 | 同上 |
| 現在の提供状況 | グローバル展開再開 | 米国内および一部パートナーへの限定提供 |
Mythos 5の特殊性について: Anthropicによれば、Mythos 5は「ソフトウェアの脆弱性を他のどのモデルよりも効果的に発見・悪用できる」とされ、「最も熟練した人間のセキュリティ専門家を除くほぼすべてを上回る」サイバーセキュリティ能力を持つと説明されている。
そのため、サイバー攻撃を望む悪意ある行為者にとって「独自の魅力」を持つモデルとして位置づけられていた。
なお、Glasswingプログラムとは、信頼できる企業のサイバーセキュリティ研究者が防御目的でMythosにアクセスできる仕組みだ。 Anthropicは現在、Amazon・Microsoft・Googleなどのパートナーと連携してMythosへのアクセス拡大を進めている。
安全強化策の詳細:何が変わったのか#
このセクションでは、規制解除までにAnthropicが実施した具体的な対策を整理する。
Amazonが発見した脆弱性への対応#
もともとの規制のきっかけは、Amazon研究者が発見したバイパス(回避)手法だった。 この手法により、Fable 5が複数のソフトウェア脆弱性を特定し、さらにその脆弱性をどう悪用するかを示すコードを生成してしまうケースが確認された。
数週間にわたるテストの結果、このジェイルブレーク手法は現在99%以上のケースでブロックされていると、Anthropicは報告している。
他モデルとの比較で判明したこと#
Anthropicのテストにより、GPT-5.5やKimi K2.7などの競合モデルも同じ脆弱性を特定できたことが確認された。 これにより、報告された手法がMythosレベルの固有の能力を引き出すものではなく、「通常の防御的サイバーセキュリティ作業」の範囲にとどまることが示された、とAnthropicは説明している。
安全分類器の導入#
政府と協力して、問題となった動作を特定・ブロックする新しい安全分類器をトレーニングした。
ただし、ここにはトレードオフが存在する。 安全性を高めた結果、通常のコーディングやデバッグ作業において、一部の無害なリクエストもブロックされる可能性がある。 ブロックが発生した場合、ユーザーへの通知が行われ、リクエストはOpus 4.8に転送される仕組みだ。
24時間365日のモニタリング体制#
Anthropicは以下の体制を新たに整備した:
- 新興ジェイルブレーク脅威を24時間365日監視する専任内部チームの設置
- ハッカーがFable 5のサイバー系ジェイルブレークを報告できるHackerOneプログラムの立ち上げ
- ハッカーを活用したモデルのレッドチーミング(攻撃側視点での検証)の継続実施
ジェイルブレーク評価の新しい枠組み#
Anthropicは今回の経験を踏まえ、AI業界全体でジェイルブレークのリスクを体系的に評価する枠組みの策定に取り組んでいる。
Anthropicがより大きな脅威と位置づけるのは、幅広い脆弱性を一度に解放し、予測不能な攻撃を可能にするユニバーサルジェイルブレークだ。 Amazonが報告した手法はこれよりも低リスクと評価されている。
現在、Amazon・Microsoft・Googleなどのパートナーと共同でジェイルブレークの深刻度を評価するコンセンサス枠組みの草案を作成中だ。 この枠組みは4つの基準でジェイルブレークを評価する:
- 提供する能力の大きさ:ジェイルブレークがどれだけの能力を引き出すか
- 有効化される攻撃タスクの数:どれだけ多くの攻撃的タスクを可能にするか
- 武器化のしやすさ:シングルプロンプト型は最もリスクが高いと評価
- 発見に必要な専門知識の有無:発見に専門知識が必要かどうか
Anthropicは他の業界関係者もこの議論への参加を歓迎するとしているが、プロセスは「不完全」であることも認めている。
政府との関係強化:今後の官民連携の形#
Anthropicはかつて、米国政府の「国家安全保障リスク」指定をめぐって提訴していた経緯がある。 Anthropicによれば、その指定は自律型兵器の開発や国内の大規模監視を目的としたモデルへのアクセスを拒否したことへの報復だったとしている。
今回の規制解除を経て、Anthropicは政府とのパートナーシップ拡大を表明している。 具体的には、フロンティアモデルへの早期アクセスを政府に提供するなど、展開前テストと評価への関与を深める方針だ。
商務長官Lutnick氏は、米国は「いかなる時点でも輸出規制を再適用する権利を留保する」と書簡で言及しており、今後も政府の関与が続く見通しだ。
まとめ:規制解除が示すAI安全保障の新潮流#
AnthropicのFable 5・Mythos 5をめぐる約3週間の規制は、AIモデルの安全性と政府関与のあり方に関する重要な先例を作った。
今回のポイントを整理する:
- Fable 5はグローバルに提供再開。Mythos 5は限定的なパートナーへの提供が進行中
- ジェイルブレーク対策は強化されたが、通常業務への影響(一部ブロック)というトレードオフも存在する
- 業界横断のジェイルブレーク評価枠組みの策定が進んでいる
- 官民連携の深化が今後のフロンティアAI展開の前提条件になりつつある
Anthropicがどのようにこの連携を深めていくかについては、詳細は元記事を参照してほしい。
📰 出典: After spooking Trump into safety testing, Anthropic AI models get global release – Ars Technica



