Claude Mythos Preview徹底解説:AIがゼロデイ脆弱性を自律発見する時代のセキュリティパラダイムシフト

はじめに:サイバーセキュリティの分岐点 2026年4月7日、Anthropicは次世代モデル「Claude Mythos Preview」を発表した。しかし同社は同時に、このモデルを一般公開しないと宣言した。理由は「前例のないサイバーセキュリティリスク」だ。 本記事では、Claude Mythos Previewを技術的事実に基づいて解説し、その能力・リスク・論争・そして日本の開発チームが今取るべき対策を、バランスの取れた視点で提供する。既存の日本語記事の多くは発表内容の紹介に留まっているが、本記事では賛否両論を包含した分析と実践的な対策コードを提供する点で差別化している。 Claude Mythos Previewとは何か Claude Mythos Previewは、Anthropicが開発した新しい汎用言語モデルである。「Mythos」は世代名(Claude 4に相当)、「Capybara」は階層名(Opus/Sonnet/Haikuに相当)という2層構造の命名で、正式には「Claude Mythos Capybara」となる見込みだ。 最も特筆すべき点は、そのサイバーセキュリティ能力がコーディング能力の副産物として副次的に出現したことである。Anthropicは「意図的に訓練した能力ではない」と明言している。これは、モデルのスケーリングによって予期せぬ能力が創発するという、AI安全性研究で長年議論されてきたシナリオが現実になった事例と言える。 ベンチマーク:何が「異常値」なのか Anthropicが公開したシステムカードによると、Mythos PreviewはOpus 4.6と比較して以下のスコアを示している: ベンチマーク Mythos Preview Opus 4.6 改善幅 SWE-bench Verified 93.9% 80.8% +13.1pp SWE-bench Pro 77.8% 53.4% +24.4pp SWE-bench Multilingual 87.3% 77.8% +9.5pp Terminal-Bench 2.0 82.0% 65.4% +16.6pp CyberGym (脆弱性再現) 83.1% 66.6% +16.5pp GPQA Diamond 94.6% 91.3% +3.3pp BrowseComp 86.9% 83.7% +3.2pp SWE-bench Verifiedの93.9%は、2025年4月時点での最高スコア(Opus 4.6の80.8%)から13ポイント以上の飛躍であり、従来のモデル改善ペース(通常1-3pp)を大きく超えている。しかし、この数字には注意が必要だ。SWE-benchは特定の条件下でのバグ修正能力を測定するものであり、実環境でのソフトウェア開発能力を完全に反映するものではない。 発見された脆弱性:実例から見る能力の本質 27年越しのOpenBSDバグ 最も象徴的な事例は、OpenBSDのTCP SACK処理に潜んでいた27年越しの脆弱性である。RFC 2018(1996年策定)で定義された Selective Acknowledgment 機構に、二つのバグが連鎖して存在していた: ...

May 15, 2026 · 21 min · 4186 words · Appwright

Claudeが2026年に出荷したすべて:Opus 4.7、Dreams、Agent Teams、1Mコンテクスト——Anthropic最新エコシステム完全ガイド

はじめに:年に2週間のペースで進化するClaude Anthropicは2026年、約2週間に1回のペースで主要リリースを続けている。「数週間目を離すと何が起きたか分からなくなる」——これはAnthropicのペースを象徴する言葉だ。本稿では、2026年5月時点でClaudeエコシステムがどのような状態にあるのか、すべての主要コンポーネントを体系的に整理する。 モデルラインナップ:Opus 4.7が頂点に Claude Opus 4.7(2026年4月16日リリース) 現時点で一般利用可能な最も高性能なモデル。SWE-bench Proで**64.3%**を記録し、GPT-5.4(57.7%)やGemini 3.1 Pro(61.2%)を上回る。特筆すべき改善点は以下の通り: 3倍のビジョン解像度:最大3.75MP(2,576px長辺)に対応。画像解析パイプラインで前処理不要に xhigh reasoning:従来のhighとmaxの間の新たな推論レベル。多くのタスクでmax同等の品質を低レイテンシで実現 タスク予算(Task Budgets, ベータ):自律エージェントのトークン消費にハードキャップを設定可能 価格は据え置き:入力$5/100万トークン、出力$25/100万トークン Opus 4.6から価格変更なしの実質アップグレード。エージェントパイプラインを稼働中のチームにとっては「無料の性能向上」と言える。 Claude Sonnet 4.6(2026年2月17日リリース) 1Mコンテクスト対応の主力モデル。Sonnet 4.5比で30〜50%高速化し、日常的なコーディングやエージェントワークフローではOpusに匹敵する品質を約40%低いコストで提供する。 Claude Haiku 4.5 高速・低コストのサブエージェント向けモデル。ただしプロンプトインジェクション対策がないため、信頼できない入力を扱うエージェント構成では注意が必要。 1Mトークンコンテクスト:標準料金化という転換点 2026年3月13日、Anthropicは200Kトークンを超える長いコンテクストに対するプレミアム課金を撤廃した。現在は全コンテクスト長に標準レートが適用される。 ベンチマークではOpus 4.6が**1Mトークン時でMRCR v2 78.3%**を記録。GPT-5.4(36.6%)、Gemini 3.1 Pro(18.3%)を大きく引き離す。実際には200Kを超えるとOpusでも品質が劣化し始めるため、推奨される実用上限は200K〜400K程度。単発の大規模ドキュメント解析には有効だが、ルーティンの会話セッションでは200K以内に留めるのが現実的だ。 4つのモード:Chat / Cowork / Code / Projects Claudeには現在4つの動作モードがあり、用途に応じて使い分ける: モード 用途 特徴 Chat ブラウザ/モバイル クイッククエリ、ブレインストーミング、下書き Cowork デスクトップエージェント 実際のファイルを読み書き、マルチステップタスクを自律実行 Code ターミナル コードベースを認識し、コード記述・コマンド実行・git操作 Projects 保存済みワークスペース ファイルと指示をアップロードし、セッション間でコンテクストを永続化 よくある間違いはすべての作業をChatで済ませようとすること。実際のファイル操作にはCoworkまたはCodeを使うべきで、これだけで作業効率が劇的に変わる。 Claude Codeの主要新機能 Code Review(コードレビュー) Claude CodeがPRの変更をレビューし、インラインコメントを自動生成する。レビュアーの負荷を軽減しつつ、バグやセキュリティ問題を早期発見できる。 CI Auto-Fix(CI自動修正) CIが失敗した時、/autofix-pr コマンド一つでClaude Codeがエラーログを解析し、修正コードを生成、PRとして提案する。CI/CDパイプラインと直接連携し、開発者が修正を待つ時間をゼロにする。 ...

May 14, 2026 · 14 min · 2787 words · Appwright

Claude Managed Agents入門:Anthropicが提供するAIエージェントの完全マネージド実行環境

はじめに:Managed Agentsが解決する課題 AIエージェントをプロトタイプから本番運用に移行するには、通常3〜6ヶ月のインフラ構築が必要だった。サンドボックス実行環境、状態管理、認証情報の安全な取り扱い、エラーリカバリ、コンテキスト管理、ツールオーケストレーション——これらをすべて自前で実装するのは、大企業のチームでも容易ではない。 2026年4月8日、Anthropicはこの課題を根本的に解決するClaude Managed Agentsを公開ベータとしてリリースした。発表から2時間で200万ビューを記録し、Xでは「これでYCバッチ一個分の仕事が消えた」と話題になった。 Brain / Hands / Session アーキテクチャ Managed Agentsの設計思想は「頭脳と手足の分離」だ。アーキテクチャは3つの独立したコンポーネントで構成される。 Brain(頭脳) Claudeモデルが意思決定を行う。ツール呼び出し、次のアクションの判断、終了条件の評価を担当する。利用可能なモデルはOpus 4.6、Sonnet 4.6、Haiku 4.5から選択できる。 Hands(手足) 使い捨てのLinuxコンテナで、コード実行やファイル操作を担当する。エラーが発生した場合、新しいコンテナが自動的に生成される。永続状態を持たないため、セキュリティ上のリスクが低い。 Session(永続セッション) BrainとHandsの外部に存在するイベントログ。すべてのツール呼び出し、その結果、エージェントの意思決定を記録する。セッションは切断後も持続し、再開時にその場から続行できる。 この分離設計により、各コンポーネントは独立してスケールする。複数のBrainが単一のSessionを介してHandsと通信することも可能だ。 料金体系:ランタイム+トークンの二軸課金 Managed Agentsの課金は2次元で構成される。従来のCode Executionのコンテナ時間課金はSession Runtimeに統合された。 課金項目 料金 セッションランタイム $0.08/時間(アクティブ時のみミリ秒単位で課金) 入力トークン(Opus 4.6) $5/100万トークン 出力トークン(Opus 4.6) $25/100万トークン Web検索 $10/1,000回 実際のコスト例:1時間のコーディングセッション(Opus 4.6、入力50K・出力15Kトークン)の場合: # コスト計算 input_cost = 50_000 * 5.0 / 1_000_000 # $0.25 output_cost = 15_000 * 25.0 / 1_000_000 # $0.38 runtime_cost = 1.0 * 0.08 # $0.08 total = input_cost + output_cost + runtime_cost # $0.71 プロンプトキャッシングを活用すれば、入力コストを最大90%削減でき、同じセッションで $0.53 まで抑えられる。 重要なのは、アイドル時間は課金されないという点だ。ユーザーの入力を待っている間やツールの確認待ちの状態は"running"ステータスにならないため、コストは発生しない。 APIの基本的な使い方 Managed AgentsのAPIはシンプルだ。以下の手順でエージェントを作成し、セッションを開始できる。 import requests API_KEY = "sk-ant-..." headers = {"x-api-key": API_KEY, "Content-Type": "application/json"} BETA_HEADER = "managed-agents-2026-04-01" # 1. エージェントの作成 agent = requests.post( "https://api.anthropic.com/v1/managed_agents", headers={**headers, "managed-agents-version": BETA_HEADER}, json={ "name": "code-reviewer", "model": "claude-sonnet-4-6", "system_prompt": "あなたはコードレビューを行うエージェントです。" "PRの差分を分析し、バグの可能性、パフォーマンス問題、" "セキュリティ脆弱性を報告してください。", "tools": [ {"type": "code_execution"}, {"type": "web_search"} ] } ) # 2. セッションの開始 session = requests.post( f"https://api.anthropic.com/v1/managed_agents/{agent['id']}/sessions", headers={**headers, "managed-agents-version": BETA_HEADER}, json={"input": "PR #42の差分を確認してレビューコメントを作成してください"} ) 主要ユースケースと導入事例 すでに複数の大手企業が本番導入を進めている。 ...

May 13, 2026 · 11 min · 2114 words · Appwright