今週(5月12日〜16日)は初のフル稼働週となり、計10本の記事を公開した。本記事では各トピックを整理し、1週間のストーリーを俯瞰する。
今週のハイライト
2026年5月第2週は「AIエージェントの実用化」が明確なテーマだった。
- Claude Mythos Preview — AIが自律的にゼロデイ脆弱性を発見
- SubQ 1M-Preview — 非二次アーキテクチャで12Mトークンコンテキスト
- AIモデル価格戦争 — 5極化、SubQが$0.11/Mで破壊的
- Google I/O 2026 — 5月19日開催目前
Claude Mythos Preview(5/15公開)
今週最大の話題。SWE-bench Verified 93.9% を記録。内部テストでFreeBSDの17年間放置されたRCEやFFmpegの16年放置バグを自律発見した。英国AISIの評価では30%の確率で企業ネットワークを完全乗っ取り可能。Gary Marcusの反論もあるが、AIサイバーセキュリティが理論から現実に移ったことを示す。
AIモデル価格戦争2026(5/15公開)
Anthropicの67%値下げ、SubQの$0.11/M(Opus比1/23)、DeepSeek V4-Flashの$0.04/Mと、モデル選定基準が「性能」から「性能×コスト」へシフト。タスク別の最適モデル選択手法を解説。
SubQ 1M-Preview(5/14公開)
SSAアーキテクチャでTransformerのO(n²)問題を解決。12Mトークンコンテキスト、SWE-Bench 81.8%、MRCR v2 65.9%(GPT-5.5超え)。$0.11/MはOpus比1/23以下。
Claude 2026年出荷全容(5/14公開)
Opus 4.7、Dreams、Agent Teams、1Mコンテクスト標準価格化、Code Review / CI Auto-Fix / Security Reviews、エンタープライズ80倍成長。Anthropicのプラットフォーム企業転換を包括的に解説。
Google I/O 2026直前プレビュー(5/16公開)
Jules V2(目標駆動型エージェント)、Gemini 4(1000万トークン)、Firebase Studio、ADK/MCP、Googlebook。テーマは「Agent-First開発」。
週前半の記事(5/12-5/13)
| 公開日 | 記事 | トピック |
|---|---|---|
| 5/12 | AI Coding Agents比較 | Claude Code / Cursor / Copilot / Codex 実践比較 |
| 5/12 | AI Agent Frameworks比較 | LangGraph / Claude Agent SDK / CrewAI |
| 5/12 | なぜPythonなのか | AI時代の言語選定の考察 |
| 5/13 | Claude Managed Agents入門 | 完全マネージド実行環境の総合ガイド |
| 5/13 | Xiaomi MiMo-V2.5-Pro解説 | 1.02Tパラメータ、MITライセンスの衝撃 |
来週の注目ポイント
Google I/O 2026(5/19-20)
Agent-First開発のビジョンが製品としてどう具現化されるか。イベント後は速報レポートを公開予定。
Mythos正式リリース
現在はAWS Bedrockゲーテッドプレビュー。一般公開とAPI利用開始のタイムラインに注目。
エージェント運用基盤
OpenHands Agent Control Plane($18.8M Series A)など、エージェントスプロール管理の新カテゴリが浮上。来週以降カバレッジを予定。
この記事はAIによって生成され、人間の編集を経て公開されています。 Appwright AI は AI によるコンテンツ制作の可能性を探求する実験的プロジェクトです。