Claude Fable 5 完全解説:Mythos がついに「Fable」として公開された日

2026年6月9日午後1時(米東部時間)、AnthropicはClaude Fable 5およびClaude Mythos 5の2つの新モデルを同時発表した。Mythos Preview が2026年4月7日に限定公開されてから63日目、本連載で追い続けてきた「Mythos はいつ一般公開されるか」という問いがついに解消された。本稿は、4月から6月9日まで12本の本連載Anthropic記事の集大成として、Fable 5 を中心に Mythos 5 との「デュアルトラック戦略」、そして2026年6月23日に迫ったサブスクリプション期限までを包括的に解説する。

1. Mythos 級とは何か——Anthropic の命名体系を整理する

Anthropic は2025年末から2026年にかけて、文学形式に基づく独特の命名体系を整備してきた。5階層のうち、Mythos が最上位、Fable がその直下に位置する。

クラス パラメータ規模(推定) 命名由来 性格
Haiku 4.5 ~20B 日本の短詩 軽量・高速
Sonnet 4.6 ~1T 14行定型詩 中位
Opus 4.8 ~5T 大規模音楽作品 最上位「通常」モデル
Fable 5 ~6T ラテン語 fabula(語られるもの) Mythos の安全解放版
Mythos 5 ~6T ギリシャ語 mythos(神話・伝承) 安全分類器なしの制限版

注目すべきは、Fable と Mythos は同じ重みを共有している点だ。両者の違いは「アクセスポリシー」と「ガードレール」だけにある。Mythos は Project Glasswing のパートナー(米政府および一部サイバー防御組織)のみがアクセスでき、Fable は Fable 5 の安全分類器を備えた状態で一般公開される。The Memo by LifeArchitect.ai が「Literary forms naming scheme」と表現したこの階層化は、Anthropic が Mythos の能力を「段階的に解放する」設計思想の表れである。

2. Claude Fable 5 の核心:ベンチマークと「長時間タスクでの圧倒的リード」

Anthropic 公式ブログは、Fable 5 が「Anthropic がこれまで一般公開したどのモデルよりも能力が高い」と明言している。具体的なベンチマークを見てみよう(VentureBeat および Vellum の集計に基づく)。

ソフトウェアエンジニアリング

ベンチマーク Fable 5 Opus 4.8 GPT-5.5 備考
SWE-Bench Pro 80.3% 69.2% 58.6% エージェント型コーディング
Cognition FrontierCode(中程度) 最高スコア 2位 メンテナブルなコード基準
Cognition FrontierCode Diamond 29.3% 13.4% 5.7% 最難度スプリット、Opus 4.8 の2倍以上

Anthropic は「タスクが長時間・複雑になるほど、Fable 5 と他モデルの差は広がる」と強調している。これは従来の SWE-Bench Verified(単発タスク)とは異なる、長期自律エージェント時代の新評価軸だ。

知識労働とビジョン

ベンチマーク Fable 5 GPT-5.5 Opus 4.8 Gemini 3.1 Pro
GDPval-AA(シニアレベル推論) 1,932 1,769 1,890 1,314
GDPpdf(視覚文書、ツールなし) 29.8% 24.9% 22.5% 16.7%

Hebbia Finance Benchmark(シニア金融推論)でも「あらゆるモデル中最高スコア」、IMC のトレーディング分析では「全項目でほぼ満点」と評価された。

記憶と長期コンテキスト

Fable 5 は数百万トークンにわたって集中力を維持し、自分のノートで自身の出力を改善する。具体例として、Slay the Spire のテストでは Opus 4.8 比で3倍多く最終 Act 3 に到達した。物理学研究タスクでは、Matthew Pines(CEO)が「GPT-5.5 が4日で到達した地点に、Fable 5 は36時間でほぼ到達」と証言している。

3. Mythos 5 だけが許される領域:科学発見の自動化

Mythos 5 は Fable 5 から安全分類器を取り払ったバージョンで、承認された研究機関のみがアクセスできる。本連載のProject Glasswing 初回アップデート解説で詳述した脆弱性発見能力に加え、6月9日の発表で新たに公開された能力は科学的発見の領域に踏み込んでいる。

創薬設計の10倍高速化

Anthropic 内部のタンパク質設計専門家によれば、Mythos 5 は創薬プロセスの一部を約10倍高速化した。結合部位の選択、ツールの実行、失敗からの回復まで完全に自律的に行い、14のタンパク質標的のうち9つで強い候補が得られた

138 種に渡る比較ゲノミクス

1週間以上にわたるほぼ自律的な作業で、138動物種の単一細胞データを統合し、種を越えて同じ役割を持つ細胞を識別するカスタム ML モデルを設計・訓練した。Science 誌掲載の既存モデルよりも100倍小さいにもかかわらず、性能で上回ったという。

E. coli 仮説の bioRxiv による独立検証

Anthropic の科学者によるブラインド比較で、Mythos 5 の分子生物学仮説は Opus 級のそれを約80%のケースで上回ると評価された。E. coli タンパク質の新規メカニズム仮説は、bioRxiv 上の他研究チームの独立研究 で裏付けられている。

4. 安全分類器のフォールバック機構——95% は素通り、5% で Opus 4.8 へ

Fable 5 の最も重要な設計判断が3つの安全分類器だ。リクエストが以下のカテゴリに触れた場合、自動的に Claude Opus 4.8 にフォールバックされ、ユーザには通知される。

  1. サイバーセキュリティ関連のリクエスト
  2. 生物学・化学関連のリクエスト
  3. モデル蒸留(Fable の出力を用いて競合モデルを構築する行為)

Anthropic は「フォールバックはセッションの5%未満で発生し、95%以上は Fable 5 単体で動作する」と公表している。Karpathy はローンチ時の設定について「configured to be a little too trigger happy(やや敏感すぎる設定)」とコメントし、Anthropic も時間とともに調整する意向を示している。

これは実務上、ユーザーは自分が Fable 5 を使っていると思っていても、稀に Opus 4.8 の応答を受け取っている可能性が5%あることを意味する。ベンチマークの数値(ExploitBench で Mythos 5 が78.0%、Opus 4.8 が40.0%)は安全分類器のない Mythos 5 のものであり、Fable 5 の実効性能はこの中間に位置する点に注意が必要だ。

3つ目の分類器「モデル蒸留」は、安全対策であると同時に競争上の防衛策でもある。Anthropic 自身は「safety control and competitive moat」と表現しており、Gemini 3.1 Pro や GPT-5.5 との差別化要因となる。

5. 価格と ROI:$10/$50 は「高すぎる」のか

公式 API 価格

モデル 入力 出力 備考
Claude Fable 5 / Mythos 5 $10 / MTok $50 / MTok Mythos Preview の半額以下
Claude Opus 4.8 $5 / MTok $25 / MTok Fable 5 のちょうど半額
GPT-5.5 $5 / MTok $30 / MTok
Gemini 3.1 Pro $2 / MTok $12 / MTok
Claude Sonnet 4.6 $3 / MTok $15 / MTok

Fable 5 は現在世界で最も高額なメジャーモデルとなった。Opus 4.8 のちょうど2倍で、これは「難しいタスクには安いモデルより手戻りコストが低い」という価値提案を Anthropic が自信を持って提示していることを意味する。

キャッシュを効かせた実効コスト

プロンプトキャッシュは5分で10%、1時間で20%OFF、ヒット時は**0.1倍(90%OFF)**になる。長時間タスクでキャッシュヒット率を高めると、入力の実効単価は $1/MTok まで下がる。Fable 5 はトークン消費が多い(=「トークンを贅沢に使う」)傾向があるため、キャッシュ戦略の巧拙が ROI を決定する。

ROI 計算の Python 例

def fable5_cost(input_tokens: int, output_tokens: int,
                cache_hit_ratio: float = 0.0) -> float:
    """
    Fable 5 の実効コストを計算。
    cache_hit_ratio: 入力トークンのうちキャッシュヒットする割合(0.0-1.0)
    """
    cache_write = input_tokens * (1 - cache_hit_ratio) * 10.0 / 1_000_000
    cache_read = input_tokens * cache_hit_ratio * 1.0 / 1_000_000
    output = output_tokens * 50.0 / 1_000_000
    return cache_write + cache_read + output

# 100K入力 / 20K出力、キャッシュ50%ヒット
print(f"${fable5_cost(100_000, 20_000, 0.5):.3f}")
# → $1.55

# 同じタスクを Opus 4.8 で実行(キャッシュ50%)
def opus48_cost(input_tokens: int, output_tokens: int,
                cache_hit_ratio: float = 0.0) -> float:
    cache_write = input_tokens * (1 - cache_hit_ratio) * 5.0 / 1_000_000
    cache_read = input_tokens * cache_hit_ratio * 0.5 / 1_000_000
    output = output_tokens * 25.0 / 1_000_000
    return cache_write + cache_read + output

print(f"${opus48_cost(100_000, 20_000, 0.5):.3f}")
# → $0.78

# Fable 5 が手戻りを減らせるなら何回のリトライで元が取れるか
# 例: Fable 5 は1回で完了、Opus 4.8 は平均1.97回必要 → 78c * 1.97 = $1.54 ≒ $1.55
# → 完全に元が取れるケース

ROI の判断基準: タスクが「2回以上のリトライ」を必要とする複雑さなら、Fable 5 の倍額は正当化される。1回で完了する単純タスクは Opus 4.8 のほうが安い。

6. 提供プラットフォーム:ローンチ初日の同時 GA 戦略

Fable 5 は発表日(6月9日)に6つ以上のプラットフォームで同時 GAした。

プラットフォーム 備考
Claude API(claude-fable-5 公式 API、Anthropic Console
Claude Platform on AWS AWS 環境
Amazon Bedrock AWS マネージド
Google Cloud Vertex AI GCP マネージド
Microsoft Foundry Azure マネージド
GitHub Copilot VS Code / JetBrains / Visual Studio
Snowflake Cortex AI Snowflake CoCo / Cortex Agents / Cortex AI Functions
Google Gemini Enterprise Agent Platform GCP 経由のアクセス

OpenRouter をはじめとする AI ゲートウェイもローンチ直後に対応を完了している。

7. ⚠️ 6月23日サブスクリプション期限——今から備えるべきこと

Anthropic は Fable 5 のサブスクリプション提供について、以下のスケジュールを公表した。

  • 2026年6月9日〜22日: Pro / Max / Team / seat-based Enterprise プランで追加料金なしで利用可能
  • 2026年6月23日: 上記プランから Fable 5 を削除。以降は使用クレジットが必要
  • 将来: キャパシティが許せば、プラン標準への復帰を目指す

窓の杜(Impress Watch)の報道によれば、6月23日以降は Fable 5 が「Opus 4.8 よりも多くクレジットを消費する」ことも明言されている。Anthropic の Karpathy コメント(5月20日合流記事)と合わせて、**「6月22日までに主要な自律エージェントタスクを Fable 5 で回しきる」**ことが現実的な選択肢となる。

8. ローンチ時の評価:Karpathy の「メジャー級ステップ変化」

Karpathy はローンチ直後に X(旧 Twitter)で以下のように述べた。

「The benchmarks are great and it’s SOTA on everything by a margin but I’ll add that qualitatively also, this is a major-version-bump-deserving step change forward (imo of the same order as Claude 4.5 was in November), peaking especially for long problem-solving sessions on very difficult problems.」

Claude 4.5(2025年11月)以来の「メジャー版バンプ級」の評価であり、これは本連載が指摘し続けてきた Mythos の能力飛躍が、一般公開モデルとしても到来したことを意味する。

主要顧客の証言

  • Stripe: 「Fable 5 は months of engineering into days に圧縮する。5,000万行の Ruby コードベース移行を、1日で完了した」(人手なら2ヶ月以上かかる作業)
  • Cursor (Michael Truell CEO): 「CursorBench で state of the art。long-horizon problems の新領域を開いた」
  • Rakuten: 「高 Effort 設定で、自分の作業を自己検証する。extra thinking pays for itself」
  • Hex: 「Fable 5 は 90%超を初めて突破した分析ベンチマークで、Opus から 10 ポイントジャンプ」

9. Python 実装:Messages API と fallback の扱い

import anthropic

client = anthropic.Anthropic()

# 通常の呼び出し(自動フォールバック有効)
message = client.messages.create(
    model="claude-fable-5",
    max_tokens=2048,
    messages=[
        {"role": "user", "content": "5,000万行のモノレポを TypeScript 5 に移行する手順は?"}
    ],
    # フォールバック指定:Fable 5 が拒否したら自動的に Sonnet 4.6 に切り替え
    extra_body={
        "fallbacks": ["claude-sonnet-4-6"]
    }
)

# 拒否された場合のレスポンス処理
if message.stop_reason == "refusal":
    print(f"拒否分類器: {message.stop_details.get('classifier', 'unknown')}")
    # フォールバックで再試行 or 別モデルで代替
else:
    print(message.content[0].text)

# Effort パラメータで思考深度とコストを制御
# low/medium/high/max を指定可能
message_effort = client.messages.create(
    model="claude-fable-5",
    max_tokens=4096,
    effort="medium",  # low/medium/high/max
    messages=[{"role": "user", "content": "..."}]
)

Anthropic 公式ドキュメントによれば、Fable 5 ではAdaptive Thinking が常に ONで、thinking.display のデフォルトは "omitted"(生思考は返さない)になる。マルチターンで思考ブロックを渡す際はそのまま再送する必要がある。

10. 2026年6月の文脈:なぜ「いま」Fable 5 なのか

Fable 5 のローンチは、本連載が5月から6月にかけて追い続けた複数の文脈と結びついている。

Fable 5 のローンチは、Anthropic が S-1 後の最初の major model release で「収益ポテンシャル」を示す必要があった6月の文脈で読むと、その意味がさらに深まる。

11. バランス評価:「Fable 5 を誰が使うべきか」

Fable 5 は万人向けではない。3つの評価軸を示す。

✅ Fable 5 を選ぶべきケース

  • 数日かかる自律エージェントタスク(Stripe の 5,000万行 Ruby 移行のような作業)
  • 科学研究・創薬・金融モデリング で2回以上のリトライを許容できないケース
  • キャッシュヒット率 50%以上が確保できる長期システム
  • 6月22日までに 主要ワークロードを評価し、6月23日以降のクレジット消費計画を立てたいチーム

❌ Opus 4.8 で十分なケース

  • 単発の Q&A、コード補完、短い文章生成
  • 1回で完了するルーチンタスク
  • キャッシュ戦略が組めない短期プロジェクト

⚠️ 注意点

  • フォールバック 5%: 自分のタスクがセキュリティ/バイオ/蒸留に分類される可能性があるなら、Opus 4.8 の素の応答が来る前提で設計する
  • トークン消費: Fable 5 は Opus 4.8 より多くのトークンを使う傾向。キャッシュなしの長文生成は予算を圧迫する
  • 6月23日のサブスク除外: 期限後は seat-based Enterprise プランでも使用クレジットが必要。組織的な予算承認を前倒しで取得する

12. まとめ:Mythos は Fable になり、Mythos 5 は引き続き「影の最強モデル」

Claude Fable 5 は、本連載が Mythos Preview から追いかけてきた「Mythos 級モデル」の一般公開であり、4月から6月までの 12本の Anthropic 関連記事で断片的に見えてきた全体像が、一つのモデルとして結実した瞬間である。SWE-Bench Pro 80.3%、FrontierCode Diamond 29.3%(Opus 4.8 の2倍以上)、創薬 10x、138 種比較ゲノミクス——これらの数字は、Anthropic が「Anthropic 史上最強」と呼ぶに足る。

同時に、Fable 5 は「Mythos 5 の安全解放版」という設計により、95% のセッションでは真の能力を発揮しつつ、5% では Opus 4.8 にフォールバックする。このデュアルトラック戦略は、Project Glasswing との役割分担(6月6日の連邦AI政策メタ解説で詳述)とも整合し、Anthropic が「規制の崖」を避けつつ能力を段階解放する新しいテンプレートとなっている。

6月22日までは Pro / Max / Team / Enterprise プランで追加料金なく試せる。それまでに自分のワークロードの Fable 5 ROI を測定し、6月23日以降の運用設計に移行することが、AI エンジニアにとっての6月10日からの最重要アクションである。


この記事はAIによって生成され、人間の編集を経て公開されています。 Appwright AI は AI によるコンテンツ制作の可能性を探求する実験的プロジェクトです。