Anthropicは2026年4月7日、世界で重要なソフトウェアのセキュリティ確保を支援する緊急の取り組みとして、
Introducing Project Glasswing: an urgent initiative to help secure the world’s most critical software.
— Anthropic (@AnthropicAI) April 7, 2026
It’s powered by our newest frontier model, Claude Mythos Preview, which can find software vulnerabilities better than all but the most skilled humans.https://t. co/ NQ7IfEtYk7
Claude Mythos Previewは、推論やコーディング、エージェントタスク、数学、知識労働など多くの分野でOpus 4.
こうした能力を踏まえ、AnthropicはClaude Mythos Previewを利用して、世界が依存する重要なソフトウェアの脆弱性を発見し、修正する支援を行うため、Project Glasswingを開始することにした。このプロジェクトでは、Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networksとの提携が発表されている。さらに、パートナー組織と、オープンソースプロジェクトを含む重要なソフトウェアを保守する40以上の組織向けに、最大1億ドル分のMythos Preview利用クレジットが提供されるとのこと。
公開されたテクニカルレポートによれば、Mythos Previewはすでに数千件の深刻度の高い脆弱性を発見している。ユーザーがClaude Mythos Previewに指示した場合、主要なOSやブラウザにあるゼロデイを見つけ出し、その脆弱性を突くエクスプロイトを作成できることを確認しているとのこと。また、発見された脆弱性の中には10年から20年前のものも含まれており、たとえばOpenBSDにおける27年前のバグも特定されたという。
そのほか、複雑なJITヒープスプレーを用いたブラウザのサンドボックス回避や、レースコンディションやKASLRバイパスを利用したローカル権限の昇格など、高度なエクスプロイトを自律的に作成できるという。セキュリティの専門訓練を受けていないエンジニアであっても、モデルに指示を出すだけで一晩で動作するエクスプロイトを作成できた事例もあると言及している。さらに、クローズドソースのソフトウェアをリバースエンジニアリングして脆弱性を発見することも可能であることが確認されているとのこと。
現在発見された脆弱性の99%以上はまだ修正されていないということだが
Anthropicは、短期的には強力なAIモデルが攻撃者に有利に働く懸念があるものの、長期的には防御側に大きな利益をもたらし、ソフトウェアエコシステム全体の安全性を高めると考えている。その過渡期における防御を固めることが、Project Glasswingの主な狙いとなる。
Claude Mythos Previewのシステムカードによると、これまででもっとも人間の意図に沿って振る舞うモデルと評価される一方、その高い能力のため、まれに問題行動を起こした場合の被害は以前のモデルより大きくなりうることも示唆されている。具体例として、初期の内部版では、アクセスが許可されていないリソースへのアクセス、サンドボックス回避、権限昇格の試みなどの安全上の制約を無視した行動が確認されていたという。
こうした背景から、AnthropicはClaude Mythos Previewを一般公開する予定はないと明言している。ただし、Project Glasswingの参加組織には研究プレビューとして提供され、研究プレビュー終了後は参加者向けに有償で提供される予定。AnthropicはMythosクラスのモデルを安全かつ大規模に展開するために、危険な出力を確実にブロックするセーフガードが必要だとしている。今後リリース予定のClaude Opusモデルを使って、それらのセーフガードのテストを進めていくとのこと。