今週のAIまとめ:2026年5月第2週(5/12-5/16)— 10本の記事で振り返るAIエージェント革命の1週間

今週(5月12日〜16日)は初のフル稼働週となり、計10本の記事を公開した。本記事では各トピックを整理し、1週間のストーリーを俯瞰する。 今週のハイライト 2026年5月第2週は「AIエージェントの実用化」が明確なテーマだった。 Claude Mythos Preview — AIが自律的にゼロデイ脆弱性を発見 SubQ 1M-Preview — 非二次アーキテクチャで12Mトークンコンテキスト AIモデル価格戦争 — 5極化、SubQが$0.11/Mで破壊的 Google I/O 2026 — 5月19日開催目前 Claude Mythos Preview(5/15公開) 今週最大の話題。SWE-bench Verified 93.9% を記録。内部テストでFreeBSDの17年間放置されたRCEやFFmpegの16年放置バグを自律発見した。英国AISIの評価では30%の確率で企業ネットワークを完全乗っ取り可能。Gary Marcusの反論もあるが、AIサイバーセキュリティが理論から現実に移ったことを示す。 Claude Mythos Preview徹底解説 AIモデル価格戦争2026(5/15公開) Anthropicの67%値下げ、SubQの$0.11/M(Opus比1/23)、DeepSeek V4-Flashの$0.04/Mと、モデル選定基準が「性能」から「性能×コスト」へシフト。タスク別の最適モデル選択手法を解説。 AIモデル価格戦争2026 SubQ 1M-Preview(5/14公開) SSAアーキテクチャでTransformerのO(n²)問題を解決。12Mトークンコンテキスト、SWE-Bench 81.8%、MRCR v2 65.9%(GPT-5.5超え)。$0.11/MはOpus比1/23以下。 SubQ 1M-Preview完全解説 Claude 2026年出荷全容(5/14公開) Opus 4.7、Dreams、Agent Teams、1Mコンテクスト標準価格化、Code Review / CI Auto-Fix / Security Reviews、エンタープライズ80倍成長。Anthropicのプラットフォーム企業転換を包括的に解説。 Claudeが2026年に出荷したすべて Google I/O 2026直前プレビュー(5/16公開) Jules V2(目標駆動型エージェント)、Gemini 4(1000万トークン)、Firebase Studio、ADK/MCP、Googlebook。テーマは「Agent-First開発」。 Google I/O 2026直前プレビュー 週前半の記事(5/12-5/13) 公開日 記事 トピック 5/12 AI Coding Agents比較 Claude Code / Cursor / Copilot / Codex 実践比較 5/12 AI Agent Frameworks比較 LangGraph / Claude Agent SDK / CrewAI 5/12 なぜPythonなのか AI時代の言語選定の考察 5/13 Claude Managed Agents入門 完全マネージド実行環境の総合ガイド 5/13 Xiaomi MiMo-V2.5-Pro解説 1.02Tパラメータ、MITライセンスの衝撃 来週の注目ポイント Google I/O 2026(5/19-20) Agent-First開発のビジョンが製品としてどう具現化されるか。イベント後は速報レポートを公開予定。 ...

May 16, 2026 · 6 min · 1179 words · Appwright

AIモデル価格戦争2026:GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro vs DeepSeek V4 vs SubQ — 開発者のためのコスト最適化ガイド

2026年、AIモデル価格はどこまで下がったか 2024年のLLM API費用相場は入力トークン100万トークンあたり$15〜30が当たり前だった。2026年5月、その常識は完全に書き換えられている。AnthropicはClaude Opusの価格を67%引き下げ、DeepSeekはV4 Flashを$0.14/Mトークンで提供し、さらにSubQはClaude Opus比1/5のコストを謳う。本記事では、2026年5月時点の主要フロンティアモデルのAPI料金と、実務で使えるコスト最適化手法をまとめる。 2026年5月の主要モデルAPI料金一覧 以下の表は2026年5月15日時点の各社公式発表および第三者検証サイトのデータを基に集計したものだ。 フロンティアモデル(最高性能) モデル 入力 ($/1M tok) 出力 ($/1M tok) コンテキスト GPT-5.5 (OpenAI) $5.00 $30.00 1M GPT-5.5 Pro (OpenAI) $30.00 $180.00 1M Claude Opus 4.7 (Anthropic) $5.00 $25.00 1M Claude Sonnet 4.6 (Anthropic) $3.00 $15.00 1M Gemini 3.1 Pro (Google) $2.00 $12.00 1M DeepSeek V4 Pro (DeepSeek) $1.74 $3.50 1M コスパ重視モデル モデル 入力 ($/1M tok) 出力 ($/1M tok) コンテキスト DeepSeek V4 Flash $0.14 $0.28 1M Claude Haiku 4.5 $1.00 $5.00 1M Gemini 2.5 Flash $0.30 $2.50 1M SubQ 1M-Preview (Subquadratic) ~$1.50 ~$7.50 1M 料金の変化を理解する 2024年ベースラインと比較すると、同程度の性能を得るためのコストは以下の通り: ...

May 15, 2026 · 12 min · 2261 words · Appwright

SubQ 1M-Preview完全解説:12Mトークンコンテキストを実現した非二次アーキテクチャの衝撃

SubQ 1M-Previewとは 2026年5月5日、マイアミ拠点のAIスタートアップSubquadraticが「SubQ 1M-Preview」を発表した。同社は29Mドルのシード調達を行い、評価額は500Mドルに達する。注目すべきは、このモデルが世界初の完全subquadraticアーキテクチャを採用している点だ。従来のTransformerが抱えるO(n²)の計算量制約を、アーキテクチャレベルで解決したと主張する。 SSA(Subquadratic Sparse Attention)の仕組み SubQの中核技術はSSA(Subquadratic Sparse Attention)である。従来のDense Attentionが全トークンペアを比較するのに対し、SSAはコンテンツ依存の選択的ルーティングを行う。つまり、クエリに対して意味的に重要なトークンのみを動的に選び、そのペアに対してのみ正確なAttentionを計算する。 方式 計算量 特徴 Dense Attention O(n²) 全ペア比較、正確だが非効率 SSA(SubQ) O(n·k) コンテンツ依存の選択、線形に近い FlashAttention O(n²) 実行効率は改善するがスケーリング則は不変 SSAが従来手法と異なるのは、位置ベースの固定パターン(スライディングウィンドウ等)ではなく、意味に基づいてアテンション先を決定する点だ。これにより、12Mトークンの研究段階でAttention計算量を従来比約1,000分の1に削減したとされる。 学習パイプライン SSAの学習は3段階で行われる: Pre-training — 大規模な長文脈データセットでの事前学習 Supervised fine-tuning — 推論・コード生成・指示追従のチューニング Reinforcement learning — 長文脈検索タスクを直接最適化。モデルが「近くの情報にデフォルトする」問題を回避するための設計 ベンチマーク評価:何ができて、何ができないか Subquadraticが公開した第三者検証済みのベンチマークは3つで、いずれも長文脈検索とコーディングに特化している。 SWE-Bench Verified(コード修正能力) モデル スコア Claude Opus 4.7 87.6% SubQ 1M-Preview 81.8% Claude Opus 4.6 80.8% DeepSeek 4.0 Pro 80.0% Gemini 3.1 Pro 80.6% Opus 4.7には及ばないものの、Opus 4.6やDeepSeek 4.0 Proと同等の水準。ただし同社自身「SWE-Benchの差はモデル本体よりもエージェントハーネスの影響が大きい」と認めており、コード能力の優劣を断定するのは早計だ。 RULER 128K(長文脈推論) SubQ: 95.0% vs Claude Opus 4.6: 94.8%。誤差の範囲だが、注目すべきはコスト差だ。SubquadraticはRULER 128Kの実行コストを約**$8と主張。一方Claude Opusでは約$2,600**と試算されている。精度は同等でコストは約300分の1という計算になる。 ...

May 14, 2026 · 15 min · 2820 words · Appwright