
Claude Sonnet 5登場:価格・性能・安全性を整理#
Anthropicが新モデル「Claude Sonnet 5」を発表した。 AIエージェント分野で競合が激化する中、何が変わったのか気になっている方も多いだろう。
この記事でわかること:
- Claude Sonnet 5の概要と位置づけ
- 価格・性能に関する具体的な数値
- 上位モデルOpus 4.8や競合モデルとの違い
- 安全性に関する改善点と課題
📖 約5分で読めます。
この記事の価値: Sonnet 5の発表情報をまとめて把握し、導入検討の判断材料を得られる。
【結論】押さえるべき重要ポイント4選#
結論を先に把握したい方向けに、核心情報を整理する。
- Sonnet 5はエージェント性能が大幅向上。ブラウザやターミナルなどのツール使用、自律的なタスク実行が可能になった。
- 価格は8月31日まで入力100万トークンあたり2ドル、出力100万トークンあたり10ドル。9月1日以降は入力が3ドルに値上がりする。
- Opus 4.8に近い性能を、より低コストで実現。ただし最高精度が求められる用途ではOpus 4.8が引き続き推奨される。
- 安全性も前世代のSonnet 4.6より改善。ただしOpus 4.8やClaude Mythos Previewには及ばない。
詳細は以降のセクションで展開する。
Claude Sonnet 5とは?基本概念の解説#
Claude Sonnet 5は、Anthropicが2026年6月30日に発表した中規模モデルだ。
Anthropicの公式ブログによると、「数カ月前なら大規模で高コストなモデルが必要だったレベルで、計画立案・ツール使用・自律的な実行が可能」とされている。
前世代との関係:
- 前世代はSonnet 4.6(2026年2月リリース)
- 今回のSonnet 5は、エージェント性能・推論・ツール使用・コーディング・知識業務の各分野で大幅な改善が報告されている
リリース当日から、無料プランとProプランの両方でデフォルトモデルとして設定されており、全サブスクリプションで利用できる。
次のセクションでは、性能・価格・安全性の具体的な数値を確認していこう。
主な特徴と技術仕様#
このセクションでは、ソース記事に記載された具体的な数値と仕様を整理する。
パフォーマンス比較(ベンチマーク)#
| モデル | エージェントコーディングスコア |
|---|---|
| Opus 4.8 | 69.2% |
| Sonnet 5 | 63.2% |
| Sonnet 4.6 | 58.1% |
知識業務ベンチマークでは、Sonnet 5がOpus 4.8をわずかに上回るスコアを記録している。
Anthropicは「Opus 4.8は依然として最高精度を求めるタスク向けのモデルだが、Sonnet 5は以前より格段に高品質な低価格オプションを開発者に提供する」と説明している。
価格体系#
| 期間 | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| ~2026年8月31日 | $2 | $10 |
| 2026年9月1日~ | $3 | $10 |
主な機能・特性#
- ブラウザ・ターミナルなどのツール使用が可能
- 自律的なタスク実行能力を持つ
- 指示なしで自分の出力を確認する動作が報告されている
- 前世代モデルが途中で止まっていた複雑なタスクを最後まで完了する改善が見られる
テスターからの報告#
ZapierのシニアエンジニアであるDaniel Shepard氏は次のように述べている。
「Salesforceのアカウントティア更新と、エンタープライズ連絡先へのローンチアナウンス送信という2段階のタスクをClaude Sonnet 5に渡したところ、エンドツーエンドで完了した。以前は途中で止まっていた。日常的な自動化には迷わず使える。」
次のセクションでは、業界全体の文脈でSonnet 5がなぜ重要なのかを整理する。
業界への影響:なぜ今Sonnet 5が重要なのか#
エージェント性能はもはや差別化要素ではなくなりつつある。
TechCrunchの報道によると、AnthropicのSonnet 5発表に先立ち、競合他社も同様の動きを見せている。
- OpenAI:GPT-5.6 Solをプレビュー公開(Sonnet 5発表前週)。サブエージェントに作業を分割できる最もエージェント指向のモデルとして位置づけ。
- Google:Gemini 3.5 Flashを2026年5月に公開。会話型チャットボットからエージェント型ツールへの移行を訴求。
この状況について記事では次のように分析している。
「今や差別化要素は、誰がエージェント作業を最もうまくできるかではなく、いかに安くできるか、そして人間の監督なしにいかに信頼性高くできるかになる。」
つまり、コストと信頼性がAIエージェント競争の主戦場に移行しつつあるという構図だ。
Sonnet 5はOpus 4.8よりも低価格で、OpenAIのGPT-5.5やGoogleのGemini 3.1 Proよりも安いと記事では記載されている。ただし、Gemini 3.5 Flashよりは高価格である点も明記されている。
次のセクションでは、安全性に関する改善と残る課題を確認する。
安全性の改善点と残る課題#
エージェント用途では、安全性は特に重要な評価軸となる。
改善された点#
- 悪意あるリクエストの拒否精度が向上
- プロンプトインジェクション攻撃(外部からの指示乗っ取り試み)への耐性が強化
- ハルシネーション(事実と異なる情報の生成)率が低下
- 迎合的な応答(ユーザーに同意しすぎる挙動)率が低下
- Sonnet 4.6と比較して「望ましくない挙動」全般の発生率が低い
Lovableの共同創業者Fabian Hedin氏は次のように述べている。
「Lovableでは何百万人もの開発者に強力なツールを提供している。安全でないリクエストをいつ断るかを知っているモデルは、作り方を知っているモデルと同様に重要だ。」
残る課題#
- 危険なサイバーセキュリティタスクの実行能力抑制はOpus 4.8と比較して低い水準にとどまる
- **不整合な挙動(意図しない方向への動作)**においても、Opus 4.8やClaude Mythos Previewのレベルには達していない
安全性に最高水準が求められる用途では、上位モデルの選択を検討する必要があると記事は示唆している。
他社モデルとの比較#
ソース記事に記載された情報の範囲で、主要モデルを比較する。
| モデル | 開発元 | Sonnet 5との価格比較 |
|---|---|---|
| Claude Sonnet 5 | Anthropic | 基準 |
| Claude Opus 4.8 | Anthropic | Sonnet 5より高価格 |
| GPT-5.5 | OpenAI | Sonnet 5より高価格 |
| Gemini 3.1 Pro | Sonnet 5より高価格 | |
| Gemini 3.5 Flash | Sonnet 5より低価格 |
価格の具体的な差額については、ソース記事では明記されていないため、詳細は元記事を参照されたい。
パフォーマンス面では、エージェントコーディングスコアにおいてSonnet 5(63.2%)はOpus 4.8(69.2%)に次ぐ位置にある。知識業務ベンチマークではSonnet 5がOpus 4.8をわずかに上回る結果が出ている。
よくある疑問(FAQ)#
Q:Sonnet 5はいつから使えますか? A:2026年6月30日(発表日)から利用可能。無料プランとProプランでデフォルトモデルとして設定されている。
Q:価格はいつ上がりますか? A:2026年9月1日以降、入力トークンの価格が100万トークンあたり2ドルから3ドルに変更される。出力は引き続き10ドルのまま。
Q:Opus 4.8とどう使い分ければいいですか? A:Anthropicによると、日常的なエージェント業務や自動化にはSonnet 5が推奨される。精緻な判断が求められる高精度タスクや深いリサーチにはOpus 4.8が引き続き適しているとされている。
Q:前世代のSonnet 4.6から何が変わりましたか? A:エージェント性能・推論・ツール使用・コーディング・知識業務の各分野で改善が報告されている。安全性指標(ハルシネーション率、迎合的挙動率など)も低下している。
まとめ#
Claude Sonnet 5は、コストを抑えながらエージェント性能を向上させたAnthropicの中規模モデルだ。
重要ポイントを改めて整理する:
- 発表日から無料・Proプラン両方でデフォルト採用
- 8月末まで入力$2・出力$10、9月以降は入力$3に値上がり
- エージェントコーディングスコアは63.2%(Opus 4.8の69.2%に次ぐ水準)
- 安全性はSonnet 4.6から改善、ただし最上位モデルには及ばない
- OpenAIのGPT-5.5、GoogleのGemini 3.1 Proより安価だが、Gemini 3.5 Flashより高価格
AIエージェント競争は「できるかどうか」から「いくらで・どれだけ安定してできるか」へと軸が移行しつつある。Sonnet 5はその流れを象徴するリリースと言えるだろう。
📌 出典: Anthropic launches Claude Sonnet 5 as a cheaper way to run agents – TechCrunch(Rebecca Bellan、2026年6月30日)





