2026年5月22日、AnthropicはProject Glasswingの初回進捗レポートを公開した。 これは、Claude Mythos Previewを用いた脆弱性発見の共同プロジェクトであり、わずか1ヶ月で50以上のパートナー組織が共同で1万件以上の高・重大度脆弱性を発見したことを報告している。

本稿は、当サイトで既に公開した Claude Mythos Preview徹底解説 および AIセキュリティ時代のCTF変容 に続く、Mythosセキュリティ三部作の完結編として、Project Glasswingの具体的な成果と、そこから浮かび上がる新たな課題を詳述する。

Project Glasswingとは

Project Glasswingは、Anthropicが2026年4月に立ち上げた、AIを活用したソフトウェア脆弱性対策の共同プロジェクトである。Apple、Microsoft、Google、Cloudflare、Mozilla、IBM、Palo Alto Networks、Oracle、Ciscoなど、ソフトウェアエコシステムの最重要プレイヤーが参加し、Claude Mythos Preview(SWE-bench Verified 93.9%)の脆弱性発見能力を実際のセキュリティ業務に適用している。

初回アップデートが示した衝撃的なデータ

1. パートナーによる脆弱性発見:10,000件超

プロジェクト開始から1ヶ月で、50以上のパートナー組織がMythos Previewを用いて10,000件以上の高・重大度脆弱性を発見した。特筆すべきは、もはや「脆弱性を見つける」ことがボトルネックではなくなったことだ。Anthropicのレポートは明確に述べている:

「ソフトウェアセキュリティの進歩は、かつては新しい脆弱性をいかに速く見つけるかに制限されていた。今やそれは、AIが見つけた大量の脆弱性をいかに速く検証・開示・修正するかに制限されている。」

2. オープンソーススキャン:1,000リポジトリ、23,019件の脆弱性

Anthropicが独自に実施したオープンソースソフトウェアスキャンでは、1,000以上のOSSプロジェクトを対象にMythos Previewが脆弱性を検索。その結果は以下の通りだ:

指標 数値
スキャン対象リポジトリ 1,000以上
発見された脆弱性総数 23,019件
推定高・重大度(内訳) 6,202件
トリアージ済み(第三者セキュリティ企業またはAnthropic検証) 1,752件
うち真陽性(90.6%) 1,587件
確認された高・重大度 1,094件(62.4%)
メンテナに開示済み 530件
修正済み 75件
うち公開アドバイザリ発行 65件

真陽性率90.6% という驚異的な精度は、従来の静的解析ツールや人手によるコードレビューを大幅に上回る。Anthropicはこのペースが続けば、約3,900件の検証済み高・重大度脆弱性に到達すると見積もっている。

3. パートナー各社の具体的な成果

CloudflareはMythos Previewを用いて2,000件のバグ(うち400件が高・重大度)を発見。偽陽性率は人間のテスターを下回った。Cloudflare自身のブログでも詳細な技術分析が公開されている。

Mozillaでは、Firefox 150のコードベースをMythos Previewがスキャンし、271件の脆弱性を発見。これは従来のClaude Opus 4.6がFirefox 148で発見した件数の10倍以上である。

Palo Alto Networksは、Mythosを活用したリリースで、通常の5倍のパッチを1回のリリースに含めた。

Microsoftは、パッチボリュームが「今後も増加傾向が続く」と報告している。

Oracleは、脆弱性の検出と対応が「複数倍高速化」したと表明。

wolfSSLでは、Mythos Previewが証明書偽造を可能にする脆弱性を発見し、実際にエクスプロイトを構築することに成功した(CVE-2026-5194、既に修正済み)。

銀行パートナーでは、Mythos Previewの分析により、150万ドルの不正送金の検出・防止に成功した。

4. パッチボトルネック:新たな課題

最も重要な発見の一つが、脆弱性の発見速度が修正能力を上回ったという点だ。平均して、1件の高・重大度脆弱性の修正には2週間を要する。一部のメンテナからは、Anthropicに対して「開示のペースを落としてほしい」との要望が寄せられている。

530件の高・重大度脆弱性がメンテナに開示されたのに対し、修正済みは75件。開示済みの約86%が未修正という現実は、セキュリティ業界が直面する新たなパラダイムを示している。

# パッチボトルネックの試算
total_disclosed = 530
total_patched = 75
avg_patch_time_days = 14
monthly_new_vulns = 750  # 現在のスキャンペースからの推定

print(f"開示済み: {total_disclosed}件")
print(f"修正済み: {total_patched}件")
print(f"未修正率: {(1 - total_patched/total_disclosed)*100:.1f}%")
print(f"月間新規発見ペース: {monthly_new_vulns}件")
print(f"月間修正キャパシティ: {30/avg_patch_time_days * 75/530:.0f}件")

この試算が示すのは、現在のエコシステムでは発見される脆弱性のペースに対して修正キャパシティが圧倒的に不足しているということだ。攻撃者はMythos級のモデルを入手すれば、パッチが適用される前に脆弱性を悪用できる窓が生まれる。

Claude Securityパブリックベータとエコシステム

Anthropicはこのパッチボトルネックに対応するため、複数のツールとプログラムを公開している:

  • Claude Security(パブリックベータ): エンタープライズチームがコードベースをスキャンし、修正を生成するためのツール。わずか3週間でClaude Opus 4.7が2,100件以上の脆弱性を修正した実績を持つ。
  • サイバー検証プログラム: セキュリティ専門家が正当なサイバーセキュリティ目的でClaudeを使用することを許可するプログラム。通常の誤用防止ガードレールの一部が緩和される。
  • Mythos Previewツール(対象顧客向け): カスタムインストラクション(スキル)、コードベースマッピングハーネス、脅威モデルビルダーを提供。
  • Cisco Foundry Security Spec: 評価システム構築のためのオープンソース仕様。
  • OpenSSF Alpha-Omegaパートナーシップ: OSSメンテナがバグ報告を処理するための支援。

このデータが示す意味

Mythos三部作の総括

本稿で完結するMythos三部作を振り返る:

  1. Claude Mythos Preview徹底解説:SWE-bench 93.9%、17年放置されたFreeBSD RCEの自律的発見・悪用、Gary Marcus論争を網羅
  2. Frontier AIセキュリティ時代のCTF変容:CTF競技のAIによる崩壊、423台のHTBマシン分析、-67%のInsane圧縮率
  3. 本稿(Project Glasswing初回アップデート):実データに基づく脆弱性発見の現実とパッチボトルネック問題

三部作を通じて見えるのは、AIによるセキュリティはもはや理論上の議論ではなく、現実のインフラに影響を与えているという事実である。

開発者・セキュリティエンジニアへの示唆

Anthropicは「同様のサイバーセキュリティ能力を持つモデルは、まもなくより広く利用可能になる」と警告している。これは以下の3つのアクションを意味する:

  1. パッチサイクルの短縮: セキュリティ修正は即座にリリース可能な体制を整える。週次リリースサイクルでは不十分になりつつある。
  2. AIを防御に活用: Claude Securityのようなツールを自社のコードベーススキャンに導入する。攻撃者がAIを使う前に、防御側が先行する。
  3. パッチ適用の自動化: CI/CDパイプラインに脆弱性スキャンと自動修正を含める。人間の判断が必要な箇所と自動化できる箇所を区別する。

Mythos級モデルの一般公開はまだ先

重要な点として、AnthropicはMythos Previewクラスのモデルをまだ一般公開していない。理由は「十分なセーフガードが整っていない」ためだ。Project Glasswingのパートナー組織のみがアクセスできる限定提供であり、一般の開発者が同様の能力を利用できるのは、Claude Security(Opus 4.7ベース)を通じてのみである。

しかし、AnthropicはMythos級モデルの将来の一般リリースに向けて積極的にセーフガード開発を進めていると表明しており、その時が来れば、ソフトウェアセキュリティの風景は一変するだろう。


この記事はAIによって生成され、人間の編集を経て公開されています。 Appwright AI は AI によるコンテンツ制作の可能性を探求する実験的プロジェクトです。