SubQ | Appwright AI

今週のAIまとめ：2026年5月第2週（5/12-5/16）— 10本の記事で振り返るAIエージェント革命の1週間

今週（5月12日〜16日）は初のフル稼働週となり、計10本の記事を公開した。本記事では各トピックを整理し、1週間のストーリーを俯瞰する。今週のハイライト 2026年5月第2週は「AIエージェントの実用化」が明確なテーマだった。 Claude Mythos Preview — AIが自律的にゼロデイ脆弱性を発見 SubQ 1M-Preview — 非二次アーキテクチャで12Mトークンコンテキスト AIモデル価格戦争 — 5極化、SubQが$0.11/Mで破壊的 Google I/O 2026 — 5月19日開催目前 Claude Mythos Preview（5/15公開）今週最大の話題。SWE-bench Verified 93.9% を記録。内部テストでFreeBSDの17年間放置されたRCEやFFmpegの16年放置バグを自律発見した。英国AISIの評価では30%の確率で企業ネットワークを完全乗っ取り可能。Gary Marcusの反論もあるが、AIサイバーセキュリティが理論から現実に移ったことを示す。 Claude Mythos Preview徹底解説 AIモデル価格戦争2026（5/15公開） Anthropicの67%値下げ、SubQの$0.11/M（Opus比1/23）、DeepSeek V4-Flashの$0.04/Mと、モデル選定基準が「性能」から「性能×コスト」へシフト。タスク別の最適モデル選択手法を解説。 AIモデル価格戦争2026 SubQ 1M-Preview（5/14公開） SSAアーキテクチャでTransformerのO(n²)問題を解決。12Mトークンコンテキスト、SWE-Bench 81.8%、MRCR v2 65.9%（GPT-5.5超え）。$0.11/MはOpus比1/23以下。 SubQ 1M-Preview完全解説 Claude 2026年出荷全容（5/14公開） Opus 4.7、Dreams、Agent Teams、1Mコンテクスト標準価格化、Code Review / CI Auto-Fix / Security Reviews、エンタープライズ80倍成長。Anthropicのプラットフォーム企業転換を包括的に解説。 Claudeが2026年に出荷したすべて Google I/O 2026直前プレビュー（5/16公開） Jules V2（目標駆動型エージェント）、Gemini 4（1000万トークン）、Firebase Studio、ADK/MCP、Googlebook。テーマは「Agent-First開発」。 Google I/O 2026直前プレビュー週前半の記事（5/12-5/13）公開日記事トピック 5/12 AI Coding Agents比較 Claude Code / Cursor / Copilot / Codex 実践比較 5/12 AI Agent Frameworks比較 LangGraph / Claude Agent SDK / CrewAI 5/12 なぜPythonなのか AI時代の言語選定の考察 5/13 Claude Managed Agents入門完全マネージド実行環境の総合ガイド 5/13 Xiaomi MiMo-V2.5-Pro解説 1.02Tパラメータ、MITライセンスの衝撃来週の注目ポイント Google I/O 2026（5/19-20） Agent-First開発のビジョンが製品としてどう具現化されるか。イベント後は速報レポートを公開予定。 ...

AIモデル価格戦争2026：GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro vs DeepSeek V4 vs SubQ — 開発者のためのコスト最適化ガイド

2026年、AIモデル価格はどこまで下がったか 2024年のLLM API費用相場は入力トークン100万トークンあたり$15〜30が当たり前だった。2026年5月、その常識は完全に書き換えられている。AnthropicはClaude Opusの価格を67%引き下げ、DeepSeekはV4 Flashを$0.14/Mトークンで提供し、さらにSubQはClaude Opus比1/5のコストを謳う。本記事では、2026年5月時点の主要フロンティアモデルのAPI料金と、実務で使えるコスト最適化手法をまとめる。 2026年5月の主要モデルAPI料金一覧以下の表は2026年5月15日時点の各社公式発表および第三者検証サイトのデータを基に集計したものだ。フロンティアモデル（最高性能）モデル入力 ($/1M tok) 出力 ($/1M tok) コンテキスト GPT-5.5 (OpenAI) $5.00 $30.00 1M GPT-5.5 Pro (OpenAI) $30.00 $180.00 1M Claude Opus 4.7 (Anthropic) $5.00 $25.00 1M Claude Sonnet 4.6 (Anthropic) $3.00 $15.00 1M Gemini 3.1 Pro (Google) $2.00 $12.00 1M DeepSeek V4 Pro (DeepSeek) $1.74 $3.50 1M コスパ重視モデルモデル入力 ($/1M tok) 出力 ($/1M tok) コンテキスト DeepSeek V4 Flash $0.14 $0.28 1M Claude Haiku 4.5 $1.00 $5.00 1M Gemini 2.5 Flash $0.30 $2.50 1M SubQ 1M-Preview (Subquadratic) ~$1.50 ~$7.50 1M 料金の変化を理解する 2024年ベースラインと比較すると、同程度の性能を得るためのコストは以下の通り： ...

SubQ 1M-Preview完全解説：12Mトークンコンテキストを実現した非二次アーキテクチャの衝撃

SubQ 1M-Previewとは 2026年5月5日、マイアミ拠点のAIスタートアップSubquadraticが「SubQ 1M-Preview」を発表した。同社は29Mドルのシード調達を行い、評価額は500Mドルに達する。注目すべきは、このモデルが世界初の完全subquadraticアーキテクチャを採用している点だ。従来のTransformerが抱えるO(n²)の計算量制約を、アーキテクチャレベルで解決したと主張する。 SSA（Subquadratic Sparse Attention）の仕組み SubQの中核技術はSSA（Subquadratic Sparse Attention）である。従来のDense Attentionが全トークンペアを比較するのに対し、SSAはコンテンツ依存の選択的ルーティングを行う。つまり、クエリに対して意味的に重要なトークンのみを動的に選び、そのペアに対してのみ正確なAttentionを計算する。方式計算量特徴 Dense Attention O(n²) 全ペア比較、正確だが非効率 SSA（SubQ） O(n·k) コンテンツ依存の選択、線形に近い FlashAttention O(n²) 実行効率は改善するがスケーリング則は不変 SSAが従来手法と異なるのは、位置ベースの固定パターン（スライディングウィンドウ等）ではなく、意味に基づいてアテンション先を決定する点だ。これにより、12Mトークンの研究段階でAttention計算量を従来比約1,000分の1に削減したとされる。学習パイプライン SSAの学習は3段階で行われる： Pre-training — 大規模な長文脈データセットでの事前学習 Supervised fine-tuning — 推論・コード生成・指示追従のチューニング Reinforcement learning — 長文脈検索タスクを直接最適化。モデルが「近くの情報にデフォルトする」問題を回避するための設計ベンチマーク評価：何ができて、何ができないか Subquadraticが公開した第三者検証済みのベンチマークは3つで、いずれも長文脈検索とコーディングに特化している。 SWE-Bench Verified（コード修正能力）モデルスコア Claude Opus 4.7 87.6% SubQ 1M-Preview 81.8% Claude Opus 4.6 80.8% DeepSeek 4.0 Pro 80.0% Gemini 3.1 Pro 80.6% Opus 4.7には及ばないものの、Opus 4.6やDeepSeek 4.0 Proと同等の水準。ただし同社自身「SWE-Benchの差はモデル本体よりもエージェントハーネスの影響が大きい」と認めており、コード能力の優劣を断定するのは早計だ。 RULER 128K（長文脈推論） SubQ: 95.0% vs Claude Opus 4.6: 94.8%。誤差の範囲だが、注目すべきはコスト差だ。SubquadraticはRULER 128Kの実行コストを約**$8と主張。一方Claude Opusでは約$2,600**と試算されている。精度は同等でコストは約300分の1という計算になる。 ...