Anthropic⁠Opusクラスに迫る「Claude Sonnet 4.6」リリース —⁠—FigmaもClaude Codeを利用した⁠ブラウザ上のUIキャプチャ機能を発表

Claude Sonnet 4.6のリリース

Anthropicは2026年2月17日、同社の最新モデルClaude Sonnet 4.6をリリースした。Sonnetのモデルとして全面的なアップデートであり、多くの分野でOpusクラスの能力に近づいている。また、ベータ機能として100万トークンのコンテキストウィンドウにも対応している。

Claude Sonnet 4.6は、2025年5月までのインターネット上の公開情報を含むデータでトレーニングされている。

Claude Codeにおける初期テストでは、ユーザーの約70%がSonnet 4.5よりも、また59%がOpus 4.5よりもSonnet 4.6を高く評価しているとのこと。これは、コンテキストの読み取りや共有ロジックを複製せずに統合できる能力が向上した結果、過剰なエンジニアリングや幻覚(ハルシネーション⁠⁠、誤った成功の主張が減少し、複数ステップを要するタスクでの一貫性が高まったためだという。また、これまでOpusクラスのモデルを必要としていた経済的価値の高いオフィス業務も実行可能になっているとのこと。

そして、フロントエンドのコード生成や財務分析の分野でも改善が見られる。出力される視覚的なデザインやレイアウトは洗練され、期待する品質に到達するまでの修正の反復回数が減少しているという。ただし、コードベースのリファクタリングなどの深い推論が求められる作業ではOpus 4.6のほうが最適であることも言及されている。

100万トークンのコンテキスト全体にわたって推論できるようになったことで、ビジネスシミュレーション評価(Vending-Bench Arena)において、序盤で先行投資を行って終盤での収益性を上げるといった長期的計画の策定能力が大きく向上したとのこと。

コンピュータ操作のスキルは過去のモデルから大幅に改善されており、ベンチマーク(OSWorld-Verified)においてスコアが向上している。実際に、複雑なスプレッドシートの操作や複数のブラウザタブをまたいだ情報の集約など、現実の作業に近い操作を行う能力が確認されている。ただし、ベンチマークは限定された環境での評価であり、より曖昧でエラーリスクを伴う現実の操作を完全に反映していないのには注意が必要だとしている。

Webサイトに悪意のある指示を隠して、その指示を利用してモデルの動作に影響を与える「プロンプトインジェクション攻撃」への耐性も大幅に改善し、Opus 4.6と同程度の堅牢性を示している。また安全性評価においても、高リスク領域での重大な懸念の兆候はないとしている。詳しくはシステムカードを参照のこと。

なお、Claude in Excelのユーザー向けにはMCPコネクタ(S&P Global、LSEG、Daloopa、PitchBook、Moody’s、FactSetなど)がサポートされ、スプレッドシートを離れることなく外部コンテキストを取り込めるようになったことが報告されている(この機能はPro、Max、Team、Enterpriseの各プランで利用できる⁠⁠。

開発者向けプラットフォームであるClaude Developer Platformにおいては適応思考(adaptive thinking)や拡張思考(extended thinking)のほか、制限到達時に古いコンテキストを自動要約するコンテキスト圧縮(context compaction;ベータ機能)をサポートする。

Claude APIの新しいWeb検索/Webフェッチツールでは、新機能「動的フィルタリング」がSonnet 4.6およびOpus 4.6でデフォルトで有効化される。これは、検索結果や取得したHTMLをそのまま推論するのではなく、コンテキストに読み込む前にモデルがコードを記述・実行して関連情報のみに絞り込む仕組み。動的フィルタリングの有無(ほかのツールは無効)で比較した評価では、2つのベンチマーク(BrowseCompおよびDeepsearchQA)でパフォーマンスが平均11%向上し、入力トークンを24%削減できたことが報告されている。ただし、コード記述に伴って出力トークンが消費されることが影響して、価格加重トークン(実質コスト)はSonnet 4.6で減少したものの、Opus 4.6では逆に増加したとのこと。そのため事前のコスト評価が推奨されている。詳しくは以下のブログ記事を参照のこと。

そして、トークンを大量に消費するタスクにおいてエージェントの性能を底上げするため、プラットフォーム上の複数のツールが一般提供(General Availability)へと移行した。会話中にコードを実行するサンドボックス「コード実行(code execution⁠⁠、永続的なファイルディレクトリを通じてコンテキストを維持する「メモリ(memory⁠⁠、中間結果をコンテキストから除外してワークフローを実行する「プログラムによるツール呼び出し(programmatic tool calling⁠⁠、すべての定義を読み込まず動的にツールを発見する「ツール検索(tool search⁠⁠、ツール定義にサンプル呼び出しを含めてパラメータエラーを軽減する「ツール使用例(tool use examples⁠⁠」の各機能が含まれる。

Claude Sonnet 4.6は、すべてのClaudeプラン、Claude Cowork、Claude Code、API、および主要クラウドプラットフォームから利用可能となっており、Free/Proプランではclaude.aiとClaude Coworkのデフォルトモデルとして設定されている。そのほかFreeプランでもファイル作成、コネクタ、スキル、コンテキスト圧縮の各機能が追加されている。価格はSonnet 4.5から据え置かれており、API経由で利用する場合は100万トークンあたり入力3ドル・出力15ドルとなる。

おすすめ記事

記事・ニュース一覧