Claude Mythos Preview徹底解説:AIがゼロデイ脆弱性を自律発見する時代のセキュリティパラダイムシフト

はじめに:サイバーセキュリティの分岐点 2026年4月7日、Anthropicは次世代モデル「Claude Mythos Preview」を発表した。しかし同社は同時に、このモデルを一般公開しないと宣言した。理由は「前例のないサイバーセキュリティリスク」だ。 本記事では、Claude Mythos Previewを技術的事実に基づいて解説し、その能力・リスク・論争・そして日本の開発チームが今取るべき対策を、バランスの取れた視点で提供する。既存の日本語記事の多くは発表内容の紹介に留まっているが、本記事では賛否両論を包含した分析と実践的な対策コードを提供する点で差別化している。 Claude Mythos Previewとは何か Claude Mythos Previewは、Anthropicが開発した新しい汎用言語モデルである。「Mythos」は世代名(Claude 4に相当)、「Capybara」は階層名(Opus/Sonnet/Haikuに相当)という2層構造の命名で、正式には「Claude Mythos Capybara」となる見込みだ。 最も特筆すべき点は、そのサイバーセキュリティ能力がコーディング能力の副産物として副次的に出現したことである。Anthropicは「意図的に訓練した能力ではない」と明言している。これは、モデルのスケーリングによって予期せぬ能力が創発するという、AI安全性研究で長年議論されてきたシナリオが現実になった事例と言える。 ベンチマーク:何が「異常値」なのか Anthropicが公開したシステムカードによると、Mythos PreviewはOpus 4.6と比較して以下のスコアを示している: ベンチマーク Mythos Preview Opus 4.6 改善幅 SWE-bench Verified 93.9% 80.8% +13.1pp SWE-bench Pro 77.8% 53.4% +24.4pp SWE-bench Multilingual 87.3% 77.8% +9.5pp Terminal-Bench 2.0 82.0% 65.4% +16.6pp CyberGym (脆弱性再現) 83.1% 66.6% +16.5pp GPQA Diamond 94.6% 91.3% +3.3pp BrowseComp 86.9% 83.7% +3.2pp SWE-bench Verifiedの93.9%は、2025年4月時点での最高スコア(Opus 4.6の80.8%)から13ポイント以上の飛躍であり、従来のモデル改善ペース(通常1-3pp)を大きく超えている。しかし、この数字には注意が必要だ。SWE-benchは特定の条件下でのバグ修正能力を測定するものであり、実環境でのソフトウェア開発能力を完全に反映するものではない。 発見された脆弱性:実例から見る能力の本質 27年越しのOpenBSDバグ 最も象徴的な事例は、OpenBSDのTCP SACK処理に潜んでいた27年越しの脆弱性である。RFC 2018(1996年策定)で定義された Selective Acknowledgment 機構に、二つのバグが連鎖して存在していた: ...

May 15, 2026 · 21 min · 4186 words · Appwright