トッププレイヤーが宣言した「CTFの終わり」

2026年5月、Hacker Newsのトップページに衝撃的な記事が登場した。タイトルは “The CTF scene is dead” 。著者のKabirは2021年からCTF(Capture The Flag)に参戦し、オーストラリア最大のDownUnderCTFを複数回制覇、国際トップチームTheHackersCrewの一員としてトップ10に常に食い込んできた現役プレイヤーだ。

「スコアボードはもはや人間のスキルをきれいに測れない。古いゲームは二度と戻らない。」

この主張は単なる議論ではない。325件以上のコメントが殺到し、AIセキュリティコミュニティに波紋を広げた。本記事では、Kabirの分析、423台のHack The Boxマシンを解析した統計データ、そしてAI時代におけるセキュリティ人材育成の未来像を整理する。

3段階の進化:GPT-4からGPT-5.5へ

KabirはCTFにおけるAIの影響を3つのフェーズに分類している。

Phase 1: GPT-4時代 — ミディアムの問題が「ワンショット」に

GPT-4の登場により、中程度の難易度のCTFチャレンジが1回のプロンプトで解けるようになった。ただし、Hard以上の難問にはほとんど影響がなく、「時間節約」の域を出なかった。

Phase 2: Claude Opus 4.5時代 — エージェント化の始まり

Claude Opus 4.5とClaude Codeの組み合わせにより、Mediumの大半と一部のHardチャレンジがエージェントで解けるようになった。CTFd APIと組み合わせれば、全チャレンジに対してエージェントを並列起動するオーケストレーターが数行のコードで構築できる。

# CTF自動ソルバーオーケストレーターの概念例
import requests
from claude_code import ClaudeCodeAgent

ctfd_url = "https://example-ctf.chals.io"
challenges = requests.get(f"{ctfd_url}/api/v1/challenges").json()

agents = []
for ch in challenges["data"]:
    agent = ClaudeCodeAgent(
        challenge=ch["name"],
        files=[ch["file_url"]],
        context=f"Solve this CTF challenge: {ch['description']}"
    )
    agents.append(agent)

# 並列実行
results = [a.run() for a in agents]

この時点で、スコアボードは「セキュリティスキル」ではなく「フロンティアモデルを使う意欲」を測るものに変わり始めた。

Phase 3: GPT-5.5時代 — Insane難易度がワンショット可能に

GPT-5.5および5.5 Proの登場で、Hack The Boxの Insane(最高難易度) のチャレンジまでもがワンショットで解かれる事例が報告された。Kabirはこれを「ペイ・トゥ・ウィン(金を払った方が勝つ)」と表現する。多いトークン=より速いスコアボード消化という構図だ。

「CTFは、誰がより多くのエージェントを、より多くのコンテキストで、より長く実行できるかの競争になりつつある」

統計が示す衝撃の数字

セキュリティ研究者Jacob Krellは、2017年3月から2025年10月までにリリースされた 423台 のHack The Boxマシンのファーストブラッドデータを分析した(Security Boulevard, 2026年3月)。

難易度 LLM以前 (中央値) LLM以降 (中央値) 変化率 p値
Easy 54.8分 28.9分 -47% 0.0001
Medium 106.0分 72.5分 -32% 0.0011
Hard 261.1分 191.1分 -27% 0.0279
Insane 926.6分 302.5分 -67% 0.035

特に注目すべきはInsane難易度で67%もの時間短縮が発生している点だ。権限昇格(privesc)の時間は全難易度で27〜41%圧縮されており、単なる「入口の自動化」ではなく、攻撃チェーン全体がAIによって加速されていることがわかる。

2026年に入ってからも、BSidesSF 2026のCTFでは自律型AIエージェントが全52チャレンジを完全攻略して優勝。イスラエルのスタートアップTenzaiのAIは12万5000人中99%以上の人間を上回る成績を記録している。

競技としてのCTFはなぜ「終わった」のか

スコアボードの意味喪失

Kabirが指摘する最も深刻な問題は、スコアボードが「何を測っているのかわからない」状態になったことだ。CTFは本来、参加者の実力が如実にスコアに反映される「梯子(ラダー)」だった。しかし現在は、AIの利用の有無・利用量が結果を大きく左右する。

チェスのアナロジーがわかりやすい。チェスで最強のエンジンを対局中に自由に使わせたら、それはチェスではなくなる。にもかかわらず、現在のオープンCTFにはAI利用を禁止する実効性のあるルールが存在しない。

主催者側の無力感

CTF運営側はさまざまな対策を試みた:

  • チャレンジに「AIに解かせない」ための特殊な文字列を仕込む
  • プロンプトインジェクションを仕掛ける
  • 参加規約でLLM利用を禁止する

しかし、これらはいずれも一時的な摩擦にしかならなかった。Claude Codeはこうした妨害を無視し、フロンティアモデルはプロンプトインジェクションを検知できる。チャレンジをAIに「解きにくく」することは、人間にとっても「不愉快な」問題設計につながる。

初心者への影響が最も深刻

「アクティブラーニングを妨げる。能動的な格闘こそが本当に教える部分なのに。」

Kabirが最も懸念するのは初心者への影響だ。CTFはスキルの可視化と段階的な成長を提供してきた。しかし梯子が壊れた今、初心者はAIに頼る以外の選択肢が見えにくくなっている。実力をつける前にAIに依存するアンチパターンが蔓延するリスクがある。

AI時代のセキュリティ人材育成:何が代わりになるのか

学習プラットフォームへの移行

Kabirが勧めるのは、picoGymやHack The Boxの学習モード、TryHackMeなどの教育目的のラボ環境だ。競技としてのCTFではなく、学習としての実践的トレーニングにリソースを振る方が、これからの時代は現実的だ。

コミュニティの維持

CTFが失うのは競技性であってコミュニティではない。SecTalks、学生カンファレンス、ローカルミートアップなど、セキュリティに関心のある人が集う場の価値はむしろ高まっている。

実践的セキュリティスキルの評価軸の変化

注目すべきは、CTFと現実の脆弱性診断が本質的に異なるという指摘だ。実際のペネトレーションテストで求められるのは「フラグを取る」ことではなく、リスクの文脈理解・報告・修正提案を含む総合的なスキルである。AIが低〜中難易度の診断を自動化する時代、人間に求められるスキルは高次元の判断力へとシフトする。

Claude Mythos Previewが示したように、AIは27年もの間発見されなかったFreeBSDの脆弱性を自律的に発見する段階に入っている。こうした文脈で、CTFのスコアボードに一喜一憂するよりも、AIと人間の協業モデルをいかに構築するかが、これからのセキュリティエンジニアの本質的な競争力となる。

まとめ

観点 変化
競技の性質 人間のスキル測定 → ペイ・トゥ・ウィン
Easy-Mediumチャレンジ 事実上AIが完全自動化
Insaneチャレンジ 67%の時間短縮、ワンショット解法も登場
初心者への影響 梯子(ラダー)の崩壊、AI依存リスク
代替案 学習プラットフォーム、コミュニティイベント
求められるスキル 低次元の技術 → 高次元の判断力・協業設計

Kabirの「CTFは終わった」という主張は、競技フォーマットが変わったという事実の指摘であって、セキュリティ学習の終わりではない。むしろ、 「何を測るのか」「どう学ぶのか」を再定義する過渡期 にわれわれはいる。CTFが提供してきた価値—実践的スキルの習得、コミュニティとの交流、挑戦の楽しさ—を新しい形で継承していくことが、これからのセキュリティエンジニアに課せられた宿題だ。


この記事はAIによって生成され、人間の編集を経て公開されています。 Appwright AI は AI によるコンテンツ制作の可能性を探求する実験的プロジェクトです。