Posts

Claude Agent SDK分離の衝撃——Anthropicの6月15日サブスクリプション変更が、AIエージェントのコスト構造を根本から書き換える

はじめに——「使い放題」は終わるのか 2026年5月14日、Anthropicは公式ヘルプセンターで重要な告知を出した。6月15日から、Claude Agent SDK（Python/TypeScript）、claude -p ヘッドレスモード、Claude Code GitHub Actions、Agent SDK経由の第三者アプリ——これらがすべて、月額サブスクリプションの利用枠から外れて独立した「Agent SDKクレジット」プールに移行する。Pro $20、Max 5x $100、Max 20x $200という月額クレジットが新たに設定され、枯渇後はAPI従量課金（オプトイン）または完全停止という2択になる。この変更は、4月4日のOpenClaw全面禁止、1月のOAuthブロック、2月のToS改訂を経た一連の政策変更の最終局面に位置する。日本語の一次情報はITmedia AI+、GIGAZINE、Zenn、Qiita、note.comにすでに15本以上存在するが、Impress Watch・ASCII.jp・@ITといった主要IT専門メディアによる本格編集記事は現時点でほぼ存在しない。本記事では公式一次情報をもとに、エンジニアが6月15日前後に直面する実務課題——「サイレント停止」リスク、組織設計、Direct API移行の損益分岐、HITL/AFKの境界線、競合ツールへの乗り換え判断——を体系的に整理する。何が変わって何が変わらないのか対象（Agent SDKクレジットから消費される） Claude Agent SDK（Python / TypeScript） claude -p ヘッドレス実行 Claude Code GitHub Actions Agent SDK上に構築された第三者アプリ（Conductor、OpenClaw等）対象外（従来通りサブスクリプション枠）対話的Claude.aiチャット（Web/Desktop/Mobile）ターミナル/IDE上のClaude Code（人間参加型 = HITL） Claude Cowork API Key直接利用（最も重要）クレジット額の全体像プラン Agent SDK月次クレジット 1ユーザーあたり Pro $20 $20 Max 5x $100 $100 Max 20x $200 $200 Team Standard $20 $20 Team Premium $100 $100 Enterprise（usage-based） $20 $20 Enterprise（seat-based Premium） $200 $200 Enterprise Standard（seat-based） $0 $0（対象機能利用不可）クレジットはper-user（チーム内で共有・プール不可）、月次リセット（繰越不可）、1回限りのオプトイン。月次クレジット枯渇後は「Extra Usage」を有効化していれば標準APIレートで従量課金、無効ならリクエストが停止する。 ...

Uber $1,500/月キャップが示す新基準——エンジニア1人あたり年$36K、AIツールが「人件費の内訳」になる日

はじめに：UberのAI予算が4ヶ月で枯渇した日 2026年4月、UberのCTO Praveen Neppalli NagaはThe Informationに対して「2026年通年のAI予算を4ヶ月で使い切った」と明言した。CEO Dara Khosrowshahiも「Uberのコードの約10%がAIエージェントによって生成・提出されている」と公に認めている。その直後の6月2日、BloombergのNatalie Lungが報じた新たな方針が、業界に静かな衝撃を与えた。Uberは全従業員に対し、AIコーディングツール1ツールあたり月額$1,500の利用上限を設けたのである。本稿はこれを「AIコスト破綻時代」シリーズの第6弾として位置づけ、per-tool（1ツールあたり）上限という新しい企業AIコスト統制パターンの戦略的意味と、日本企業・個人開発者への実装インパクトを整理する。 1. 何が起きたのか：Bloomberg報道の核心 Bloomberg 2026年6月2日報道（元記事、Simon Willison経由）の要点は次の通りである。対象ツール: agentic coding software。具体的にはCursor、Anthropic Claude Codeなど上限額: 1ツールあたり月額$1,500（per-tool cap、aggregate ではない）独立性: あるツールの消費は他ツールの予算に影響しない適用範囲: エンジニアだけでなく全従業員ダッシュボード: 従業員別利用状況を可視化する社内ダッシュボードを配備例外: 上限超過は承認申請により可能期間: ここ数ヶ月以内に導入済み（6月2日報道時点） Uber広報の公式コメントは「責任ある方法で全社的なagentic AI導入と実験を促す、極めて明確な手段」としている。注目すべきは、MicrosoftのClaude Code締め出し（2026年5月30日記事で詳述）が「特定ベンダーの排除」というブランケット禁止型だったのに対し、Uberはマルチベンダーを維持しつつ上限で歯止めをかけるまったく異なる統制パターンを採用したことである。 2. 数字で見る衝撃：$36K/年と11% Simon Willisonが指摘した計算が、この上限のリアリティを浮かび上がらせる。1人のエンジニアがCursorとClaude Codeの2ツールを上限まで利用した場合の年間コストは次のようになる。項目値 1ツールあたり月額上限 $1,500 1ツールあたり年額 $18,000 2ツール利用時の年額 $36,000 米国Uber SWE中央値報酬（Levels.fyi）約$330,000 AIツール上限の報酬に占める割合約11% 日本円換算（$1=¥150）約¥5,400,000/年 11%——これは「補助的なSaaS費」の枠を完全に逸脱している。日本企業の場合、エンジニア人件費の中央値がおよそ¥10M〜¥15Mであることを踏まえると、Uber基準のAIツール上限を適用すれば、1人あたり年¥3.6M〜¥5.4Mが「エンジニア人件費の内訳」として恒常的に発生することになる。これはもう「ツール予算」ではなく「採用予算の代替」あるいは「第2の人件費」と呼ぶべき性質の支出である。 3. なぜ今この数字なのか：4ヶ月の予算枯渇と10%の現実 Uberの動きを理解するには、2つの社内数値を押さえる必要がある。 1つ目は4ヶ月で年間AI予算を使い切ったという事実である。CTOのNaga氏自身が「年央にして年間予算を超過した」と語っている。Microsoft（$500-2K/エンジニア/月）、DataPro（46,000%の請求スパイク）、GitHub Copilot（$29→$750）と並ぶ2026年H1のAI予算破綻群の一例にほかならない。 2つ目はコードの10%がAI生成というKhosrowshahi発言である。これは「効率化した」ことを意味すると同時に、残りの90%はまだ人間であることを意味する。COO Andrew MacdonaldはRapid Responseポッドキャストで「25%多く価値ある消費者機能を生み出している、と線引きするのは難しい」と慎重な姿勢を示しており、ROIの翻訳可能性は社内でさえ不透明なままだ。つまりUberは、爆発するAI支出に対して、明確なKPIとの因果関係を示す前に、物理的な歯止めを入れたのである。これは「上限を厳しくする」こと自体が目的化しており、効果測定よりコスト防衛を優先する、典型的な2026年型エンタープライズAI統制の文脈である。 4. 2つの企業AIコスト統制パターン：Uber vs Microsoft ここで重要なのは、UberとMicrosoftがまったく逆の統制哲学を取っている点である。 ...

Gemma 4 12B完全解説：Googleが切り拓くEncoder-Free統一マルチモーダルの新時代

Google DeepMindが2026年6月3日、Gemma 4ファミリの中量級モデル「Gemma 4 12B」を公開した。Apache 2.0ライセンス、11.95Bパラメータのdense構成、16GBのVRAM/ユニファイドメモリでノートPC上に完全ローカル動作する。本モデルはGemma 4として初めてネイティブ音声入力を備え、しかもvision/audioエンコーダを一切使わないencoder-free統一アーキテクチャを採用した。本記事では、そのアーキテクチャ革新、制限事項、競合モデルとの定量比較、Gemma Skillsリポジトリの使い方、日本市場での業務適用シナリオまで、実装視点で詳細に解説する。 1. リリースの位置付け Gemma 4 12Bは2026年4月2日にリリースされたGemma 4ファミリ（E2B/E4B/26B MoE/31B dense）の中量級を埋める位置付けのモデルである。エッジ向けE4Bと26B MoEの間で、26Bに近い性能をより小さいメモリで実現することを狙う。Gemma 4ファミリ全体では1.5億ダウンロードを突破し、150M+ milestoneを記録している。モデルの配布物は3種類： gemma-4-12B — ベース（pre-trained） gemma-4-12B-it — チャット調整（instruction-tuned） gemma-4-12B-it-assistant — MTP（Multi-Token Prediction）投機的デコーディング用のドラフトモデル 3番目のドラフトモデルが同梱される点が特徴で、Gemma 4ファミリの中でもMTPがout-of-the-boxで付属する初のモデルとなる。 2. Encoder-Free統一アーキテクチャの革新従来のマルチモーダルモデルは、視覚情報と音声情報をそれぞれ別のエンコーダで処理してからLLMバックボーンに渡す構成が一般的であった。Gemma 4 12Bはこの設計を全面的に見直した。 Vision（画像・動画）の処理：従来のvision encoderを、軽量な埋め込みモジュールに置換中身は単一の行列乗算 + 位置埋め込み + 正規化のみの約3,500万パラメータのモジュール以降の視覚処理は全てLLMバックボーンが直接担当 Audio（音声）の処理： Audio encoderを完全削除生の音声波形を、テキストトークンと同じ次元空間に直接射影この結果、エンコーダ分のメモリ・レイテンシが削減され、16GBユニファイドメモリという厳しい制約下でもテキスト・画像・動画・音声を同時に扱える。Google DeepMindのOlivier LacombeとGus Martinsは「Gemma 4 12B is designed to bring high-performance multimodal intelligence directly to your laptop, combining mobile-first efficiency with advanced reasoning」と説明している。 ...

GitHub Copilotトークン課金ショック：$29→$750の実態と5つの回避戦略

はじめに：6月1日、Copilotの課金体系が変わった 2026年6月1日、GitHub Copilotは従来の定額制からトークンベースの従量課金制へと移行した。この変更により、開発者コミュニティは大きな衝撃に包まれている。RedditやHacker Newsでは「What a joke」「RIP Copilot」といった怒りの声が相次ぎ、GitHubのFAQスレッドには435件のコメントと904のdownvoteが集まった。最も衝撃的な報告として、月$29のPro+プランから月$750（約25倍）に跳ね上がったケースや、$50から$3,000（60倍）に急増したケースが確認されている。本稿はこのトークン課金ショックをAIコスト破綻シリーズ第5弾として位置づけ、新課金体系の実態、Microsoftの戦略、代替ツールのコスト比較、そして開発者のための実践的な回避戦略を提供する。何が変わったのか：GitHub AI Creditsの全容新課金単位「GitHub AI Credits」従来の「Premium Requests」制度は廃止され、新たに「GitHub AI Credits」が導入された。1 Credit = $0.01（1円弱）の計算で、各プランごとに月間クレジット枠が設定されている。プラン月額料金月間クレジット実質クレジット価値 Pro $10 1,000 Credits $10相当 Pro+ $39 3,900 Credits $39相当 Business $19/user 1,900 Credits $19相当 Enterprise $39/user 3,900 Credits $39相当ただし、これらはモデルごとに異なる乗数（Multiplier）が適用される。具体的には： GPT-5.4：1倍（基準） Claude Sonnet 4.6：3倍 Claude Opus 4.7：27倍（従来7.5倍から大幅引き上げ） GPT-5.5：6倍 DeepSeek V4：2倍つまり、Opus 4.7のプロンプト1トークンは、GPT-5.4の27倍のクレジットを消費する。高品質モデルを多用するユーザーほど、クレジットの消費が加速する仕組みだ。課金の対象範囲コード補完（Completions）とNext Edit Suggestions（NES）は引き続き無制限・無料である。課金の対象となるのはチャットベースの対話、エージェントセッション、コードレビューだ。しかし、Copilotの価値はコード補完だけではない。エージェントモードで複数ファイルにまたがるリファクタリングを実行すれば、1セッションあたり$30〜40ものクレジットを消費すると報告されている。これはProプランの月間枠（$10相当）を1回のセッションで超過する計算になる。廃止されたセーフティネット最も批判を集めている点のひとつが、フォールバック機能の廃止である。従来はクレジットを使い切ると自動的に安価なモデルに切り替わる仕組みがあったが、新制度ではそれが削除された。クレジットが尽きると課金が発生するか、Copilotが事実上使えなくなる。実被害の声：4.7Mユーザーへの衝撃数字で見る反響影響を受ける有料ユーザー数：470万人 Reddit r/GithubCopilot：複数の報告スレッドが炎上 Hacker News メインスレッド（ID: 47838508）：長大な議論が展開 GitHub コミュニティスレッド：435コメント、904 downvote、22 upvote（圧倒的不評）実際のコスト急増報告 TechCrunchのLucas Ropek記者による5月30日の記事が、この問題を広く知らしめた。具体的な被害報告の例： ...

Microsoft Build 2026 2日目完全解説：MAI-Thinking-1、MAI-Code-1-Flash、Scout——Microsoft AIエコシステムの全貌

Microsoft Build 2026は6月3日（現地時間6月2日）に2日目を迎え、Day 1のProject PolarisやWindows Agent Framework 1.0に続き、さらに大規模な発表が行われた。前回のDay 1レポートに続き、本記事ではDay 2で発表された全アナウンスを、エージェントファーストプラットフォームという統一的な視点から解説する。 MAI-Thinking-1：Microsoft初の自社推論モデル最大の目玉は、Microsoft初の自社開発推論モデル MAI-Thinking-1 の発表である。 35BアクティブパラメータのMoE（Mixture of Experts）アーキテクチャを採用し、256Kトークンのコンテキストウィンドウを備える。特筆すべきは、他社モデルからの蒸留（distillation）を一切行わず、ゼロから学習した点だ。ベンチマーク結果はClaude Sonnet 4.6を上回り、AIME 2025で97%、AIME 2026で94.5%、SWE-Bench Proで52.8%を記録している。 MAI-Thinking-1は現在Foundryでプライベートプレビューとして提供されており、M365 CopilotのAgent Modeの中核エンジンとしても利用される。 MAI-Code-1-Flash：コーディングに特化した軽量モデル MAI-Code-1-Flash は、5Bパラメータの軽量コーディング特化モデルで、SWE-Bench Pro 51%を達成。Claude Haiku 4.5を60%少ないトークンで上回る性能を持つ。GitHub Copilot（Free/Pro/Pro+/Max）のVS Code向けに順次展開中で、HNでは368ポイントと170コメントを集めた。 MicrosoftがOpenAI GPT-4 Turboから自社モデルへの移行を進める中、MAI-Code-1-FlashはCopilotのコーディングモデルとしての第一歩となる。今後、Polaris（Maia 200ベース、2026年8月投入予定）に置き換わるまでの橋渡し的な位置づけだが、5Bという軽量さでHaikuクラスを凌駕する現時点の性能は驚異的だ。 Scout：OpenClawベースの常時稼働パーソナルエージェント Scout は、これまでで最も本格的なパーソナルAIエージェントとして発表された。Day 1でMITライセンス公開されたOpenClawを基盤とし、M365と統合された常時稼働型エージェントである。具体的には以下の機能を持つ：スケジュール調整、資料作成、電話発信などの自律実行 Entra IDによるエージェント単位のID管理とPurview DLPによるデータ損失防止 Frontierプレビューでの初期アクセス（3,000人以上のMS社員が社内試験中） Sandbox実行（untrustedモード）によるセキュリティ保護 MicrosoftはScoutの基盤技術であるOpenClawにアップストリームコントリビューションを行うことも表明しており、オープンソースコミュニティとの協業姿勢を示した。 PC WatchやITmediaだけでなく、日本経済新聞もScoutを取り上げており、一般メディアでも注目度の高さがうかがえる。 7つのMAIモデルファミリー MAI-Thinking-1とMAI-Code-1-Flashに加え、合計7つのMAIモデルが発表された。GIGAZINEが最も詳細なスペック一覧を掲載しているが、全体を横断的に整理する。モデル用途価格（100万トークンあたり）ステータス MAI-Thinking-1 推論・思考未公開（Foundry Preview）プライベートプレビュー MAI-Code-1-Flash コード生成未公開 Copilot展開中 MAI-Image-2.5 画像生成 $5 GA（PowerPoint連携） MAI-Image-2.5 Flash 高速画像生成 $8 GA MAI-Transcribe-1.5 音声認識（43言語SOTA） $0.36/時間 GA MAI-Voice-2 音声合成（感情制御対応）未公開 GA MAI-Voice-2 Flash 高速音声合成 $47 GA MAI-Voice-2は日本語を含む15言語以上に対応し、音声クローニングと感情制御が可能。MAI-Transcribe-1.5は競合比5倍の速度で43言語においてSOTAを達成している。 ...

Microsoft Build 2026完全レポート：Project Polaris、Windows Agent Framework 1.0、Azure Agent Meshが切り拓くエージェントAIプラットフォーム時代

サンフランシスコで開催されたMicrosoft Build 2026 2026年6月2日〜3日、Microsoftは年次開発者会議Build 2026をサンフランシスコで開催した。キーノートは日本時間6月3日午前0時30分から行われ、WindowsをAIエージェントのプラットフォームにするという明確なビジョンのもと、複数の革新的発表が行われた。本稿では全12の主要発表を整理し、日本のAIエンジニアにとって実践的な視点で解説する。特に、これまで本サイトでカバーしてきたAnthropicシリーズ、エージェントツール比較、AIコスト最適化の文脈とどう接続するかに重点を置く。 1. Project Polaris：Microsoftが自社コーディングモデルに切り替える日最もインパクトの大きい発表は、Project Polaris——Microsoftが独自開発したコーディング専用AIモデルの発表だ。ベースアーキテクチャ: Maia 200カスタムシリコン上で動作するMoE（Mixture of Experts）モデルポジショニング: 「ピアプログラマー」——コードレビューと共同開発に最適化された役割移行計画: 2026年8月よりGitHub CopilotのGPT-4 Turboを順次置き換え。3ヶ月のフォールバック期間ありベンチマーク: HumanEvalおよびMBPPでGPT-4 Turboを上回るスコアを達成（詳細な数値は未公開だが、Microsoftは「あらゆるコーディングタスクで有意な改善」と主張） Polarisは単なる「より賢いモデル」ではない。Visual Studio / VS Codeでのコードレビュー体験に特化した設計思想を持ち、PRの変更差分に対するコンテキスト理解、複数ファイルにまたがるリファクタリング提案、テストカバレッジの自動補完などに特化している。実務への影響: 2026年8月までに、Copilot利用組織は以下の準備が必要になる： Polarisのコードレビュー品質を現在のGPT-4 Turboと比較評価するベンチマーク設定フォールバック期間中に移行計画を策定カスタムモデル利用（Azure OpenAI Service）との併用戦略の再検討 2. Windows Agent Framework 1.0：MITライセンスで公開サプライズ発表の一つが、Windows Agent Framework（WAF）1.0のMITライセンスでのオープンソース公開だ。Microsoftは従来Semantic KernelやAutoGenを個別に提供していたが、WAF 1.0はこれらを統合した統一エージェントフレームワークとして設計されている。 WAF 1.0の4つのOS能力：ファイルシステム操作: 読み取り、書き込み、ディレクトリ構造の変更ネットワーク通信: HTTPリクエスト、WebSocket、API連携 UI自動化: ウィンドウ操作、スクリーンショット解析、クリック/タイピングプロセス管理: プロセスの起動、停止、標準入出力の制御さらに、状態永続化と人間承認キューの2つのメカニズムが組み込まれており、長時間実行タスクでの信頼性とセキュリティを両立する。以下は、WAF 1.0のYAML定義ファイルの最小構成例： # WAF 1.0 Agent Definition (MIT License) name: "CodeReviewAgent" version: "1.0.0" runtime: "semantic-kernel" capabilities: - file_system: read_paths: ["/workspace/src"] write_paths: ["/workspace/review"] - network: allowed_hosts: ["api.github.com", "*.azurecr.io"] - process: allowed_commands: ["dotnet", "npm", "python"] state: persistence: local approval_queue: required_for: ["network.send", "file_system.write"] timeout: 300 models: default: "polaris" fallback: "gpt-4-turbo" このYAML定義は、Claude Code（2026年5月29日記事）やForge guardrails（5月27日記事）と比較して、より粒度の細かいパーミッション制御を提供する。特に approval_queue の仕組みは、日本のエンタープライズ環境で求められる監査要件を満たしやすい設計だ。 ...

AnthropicがS-1を非公開提出：$965Bから上場への道、PBCガバナンスと$60B+ IPOの全貌

非公開S-1提出が意味するもの 2026年6月1日、AnthropicはSEC（米国証券取引委員会）に新規株式公開（IPO）に向けたドラフトS-1の非公開提出を行ったと発表した。これは2012年のJOBS法により可能となった手続きで、株式数や価格帯はまだ設定されていない。SECの審査が完了し次第、公開S-1が提出される見込みだ。本稿の目的は、AnthropicのIPOを取り巻く戦略的全貌を——既存の日本語ニュース要約ではカバーされていない深さで——解説することにある。財務軌道：$1Bから$47Bへの14ヶ月 AnthropicのARR（年間経常収益）は、2025年初頭の$1Bから2025年12月に$9B、2026年4月に$30B、そして2026年5月のSeries H発表時には**$47B**に達している。これは556%のCAGRに相当し、企業向けAI市場における前例のない成長率だ。より重要なのは収益性の転換点だ。WSJの報道によれば、2026年第1四半期の売上高は$4.8B、第2四半期の予測売上高は$10.9B（前期比130%増）で、初の四半期営業利益**$559M**を見込んでいる。しかも、売上$1あたりの計算コストは$0.71から$0.56へ低下傾向にあり——Dynamic WorkflowsやFast Mode（Opus 4.8）による効率化が奏功している形だ。 Claude CodeはARR$2.5Bを達成（2026年2月時点）。AIコーディング市場では54%のシェアを握り、OpenAIの21%を大きく引き離している（Menlo Ventures調べ）。ガバナンスの独自性：PBC + LTBT構造 Anthropicの最大の差別化要因は、そのガバナンス構造にある。同社はデラウェア州の**Public Benefit Corporation（PBC）として登記され、「人類の長期的利益のための責任ある高度AI開発」を使命として掲げている。2023年9月に設立されたLong-Term Benefit Trust（LTBT）**は、5人の財務的に独立した受託者から構成され、特別なClass T株式を保有する。このClass T株は、時間の経過とともに取締役会の過半数を選任する権限を獲得する設計だ。現在は創業者（Dario Amodei、Daniela Amodeiら7名、各約1.8%以上を保有）が実質的な支配権を握るが、4年以内（2027年頃）にはLTBTが取締役会の過半数を選任するフェーズに移行する。特筆すべきは、AmazonとGoogleが最大の少数株主であるにもかかわらず、議決権も取締役会席位も持たない点だ。両社は巨額の算出力契約を結んでいるが、経営への影響力は完全に排除されている。これはOpenAIの迷走した非営利→営利転換プロセスや、Musk訴訟によるガバナンス不安と対照的だ。算出力契約の「隠れバランスシート」 AnthropicのS-1で最も注目されるべき開示項目の一つが、算出力コミットメントの会計処理だ。 AWS：10年間で$100B+、最大5GWのTrainium2/3/4コンピュート容量。既に100K以上のBedrock顧客がClaudeを利用。 Google Cloud：5年間で$200B（The Information報道）。これはGoogle Cloudのバックログの40%超に相当する巨額。 Google/Broadcom：約3.5GWのTPU契約。Broadcomは現在約1GWを供給、2027年には3GW超を見込む。これらの契約は固定費でありながら、売上成長によりコスト比率が改善している（Q1: $0.71/$1 → Q2予測: $0.56/$1）。しかし、これらは同時に巨額のキャンセル不能コミットメントでもあり、競合モデルへのスイッチングコストを極めて高くしている面もある。この「両刃の剣」は、公開S-1で初めて正確な数字が明らかになるだろう。引受シンジケートと$60B+ IPO Bloombergが2026年3月に報じたところによれば、主幹事はGoldman Sachs、JPMorgan Chase、Morgan Stanleyの3行。調達額は**$60B以上**を見込んでおり、SpaceXの推定$75Bに次ぐ史上最大級のIPOとなる。 $965Bの評価額は、$61.5B（2025年3月）→$183B（2025年9月）→$380B（2026年2月）→$965B（2026年5月）という14ヶ月で15倍の軌跡を描いている。OpenAIの$852B（2026年3月ラウンド）を上回り、現在フロンティアAIラボの中で最も高い評価額だ。競合とのIPOレースでは、SpaceXが2026年5月20日に申請（6月12日上場目標）、Anthropicが6月1日に申請、OpenAIが「数週間以内」に申請予定と報じられている。3社合計で$3T超のIPO価値が見込まれる前代未聞の状況だ。競合比較：Anthropic vs OpenAI 指標 Anthropic OpenAI 評価額 $965B $852B ARR $47B (May 2026) ~$20B+ (推定) AIコーディング市場シェア 54% 21% エンタープライズLLM支出 40% 27% ガバナンス PBC+LTBT（明確）非営利→営利転換中（訴訟中） CEO株式保有約1-2% 約0%（非営利構造の制約）収益性 Q2 2026に初の黒字予想未定クラウド可用性 AWS+GCP+Azure全3社 AWS+Azure（GCP限定的） OpenAIは2026年3月に$852Bの評価額を達成したが、Anthropicはその後わずか2ヶ月で$965Bと逆転した。AIコーディング市場でのClaude Codeのシェア拡大（OpenAI Codexから54%対21%へシフト）が最大の原動力だ。 ...

LLMエージェントによる初の自律型サイバー攻撃（BadHost CVE-2026-48710）：Starletteホストヘッダー脆弱性がAIインフラを脅かす

LLMエージェントが「自律的に」サイバー攻撃を実行した——そんな報告が2026年5月下旬に相次いでいる。原因はStarlette（FastAPIの基盤となるASGIフレームワーク）に存在したHostヘッダー処理の脆弱性 CVE-2026-48710（通称 BadHost）だ。この脆弱性は、従来の「手動攻撃」とは異なり、LLMエージェントが自ら脆弱性を発見・悪用する可能性を示した点で、AIセキュリティ史上初めての事例として注目されている。脆弱性の概要 Starlette 1.0.0以前では、request.url を構築する際にクライアントから送られてくる Host ヘッダーをそのまま使用していた。この処理に問題があり、攻撃者が細工したHostヘッダーを送信することで、request.url.path の値と実際にルーティングされるパスが乖離する状態を作り出せた。具体的には、以下のようなリクエストを送ることで認証ミドルウェアを欺くことが可能だった： GET /admin/users HTTP/1.1 Host: example.com/health?x= このリクエストに対し、Starletteは内部で request.url を http://example.com/health?x=/admin/users のように再構築してしまう。一部のミドルウェアが request.url.path を信頼してアクセス制御を行っていた場合、/health が許可リストに含まれていれば /admin/users へのアクセスが通ってしまう。 AIインフラへの影響が特に深刻な理由この脆弱性がAIエージェント基盤に特に危険な理由は3つある。 1. MCP（Model Context Protocol）の設計思想との相性 MCPサーバーはOAuth discoveryエンドポイントを公開することが仕様上求められる。これらのエンドポイントは意図的に認証なしでアクセス可能に設計されているため、BadHost攻撃の「スケルトンキー」として機能しやすい。 2. ミドルウェアの一般的な実装パターン多くのAIフレームワーク（FastAPI、vLLM、LiteLLM、BentoMLなど）で、以下のようなパターンが一般的だった： from starlette.middleware.base import BaseHTTPMiddleware class AuthMiddleware(BaseHTTPMiddleware): async def dispatch(self, request, call_next): if request.url.path in self.public_paths: return await call_next(request) # 認証処理... このパターンがBadHost攻撃の標的になる。 3. 325M週次ダウンロードという爆発的な普及 Starletteは2026年時点で週325百万回のダウンロードを記録している。AIエージェントのほとんどがこのフレームワークの上に構築されているため、影響範囲が極めて広い。実践的な対策即時対応（優先度高） Starletteを1.0.1以上にアップデート公式パッチでHostヘッダーの検証が強化された scope["server"] へのフォールバック処理が追加 request.url.path ではなく scope["path"] を使用 ASGIスコープから取得したパスはHTTPリクエストラインから来るため、Hostヘッダーによる汚染を受けないリバースプロキシの導入 nginx、Caddy、TraefikなどでHostヘッダーを検証・正規化する RFC準拠のプロキシは不正なHostヘッダーを拒否するコード例（FastAPI + MCPサーバー向け） # 推奨パターン from starlette.requests import Request @app.middleware("http") async def secure_path_check(request: Request, call_next): # 悪い例: request.url.path を使用 # path = request.url.path # 良い例: scopeから直接取得 path = request.scope["path"] if path in PUBLIC_PATHS: return await call_next(request) ... まとめ BadHostは「AIエージェントが自律的に攻撃を実行する」時代が到来したことを象徴する脆弱性だ。従来のセキュリティ対策が「人間の攻撃者」を前提としていたのに対し、今後は「LLMエージェントが自ら脆弱性を発見・連鎖させる」シナリオを想定した防御設計が必要になる。 ...

Pi-Mono完全入門：43.9k★のオープンソースAIエージェントツールキットで作るカスタムエージェント

Pi-Mono（GitHub: badlogic/pi-mono）は、2026年5月時点で43.9k starsを記録したオープンソースのAIエージェントツールキットである。Mario Zechner氏が開発したこのmonorepoは、LLM APIの統一、coding agent CLI、TUI/Web UI、Slack bot、vLLM podsまでを単一リポジトリにまとめ、断片化されたエージェント開発を大幅に簡素化する。本記事では、Pi-Monoの構成要素、インストール方法、拡張の考え方、そして実践的なカスタムエージェント構築例を解説する。 Pi-Monoが解決する課題 AIエージェント開発では、以下のような断片化が常態化している： LLMプロバイダごとのAPI差異（OpenAI、Anthropic、Google、Groq、Ollamaなど） Agent runtime、tool calling、state managementの個別実装 CLI / TUI / Web UI / Slack botなどのフロントエンドのばらばらな選択デプロイ基盤（vLLM、Docker、サーバーレス）の個別対応 Pi-Monoはこれらをmonorepoとして統合し、interchangeable components（交換可能な部品）として提供する。哲学は明確だ。「Adapt Pi to your workflows, not the other way around.」最小限のコアを保ち、必要な機能はextensionsやskillsとして自分で追加する設計になっている。主なパッケージ構成 Package 役割特徴 @earendil-works/pi-ai Unified LLM API 15+プロバイダ、数百のモデルに対応。セッション中に /model で切り替え可能 @earendil-works/pi-agent-core Agent runtime Tool calling + state management @earendil-works/pi-coding-agent Coding agent CLI 対話型TUI、tree-structured history @earendil-works/pi-tui Terminal UI Differential rendering対応他にもSlack bot向けの pi-chat リポジトリや、vLLM pods向けのサポートが用意されている。 ...

OpenRouter Series B $113M完全解説：CapitalG/NVIDIAが出資するAI推論ルーティングAPIの戦略的意義

2026年5月27日、AIモデルルーティングAPIのパイオニアOpenRouterが、Series Bラウンドで1億1300万ドル（約170億円）を調達したと発表した。評価額は約13億ドル（約1950億円）で、2025年6月のSeries A時（約5.5億ドル）から1年足らずで倍増している。本稿では、この調達ラウンドの構造的意義、競合地図の変化、そして日本企業にとっての含意を、既存のコスト最適化シリーズと接続しながら分析する。ラウンドの全体像：$113M、投資家構成、成長指標今回のSeries Bを率いたのはCapitalG（Google/Alphabetの独立成長ファンド）である。参加投資家は極めて戦略的な布陣で構成されている： CapitalG（Alphabet独立ファンド） — リード NVentures（NVIDIAベンチャー部門） ServiceNow Ventures MongoDB Ventures Snowflake Ventures Databricks Ventures AMP PBC、Pace Capital 既存投資家：a16z、Menlo Ventures（Series Aから継続）この投資家リストを一見して気づくのは、競合関係にあるはずのクラウド・データ基盤企業が一堂に会していることだ。SnowflakeとDatabricksの両ベンチャー部門が同時に参加していることは、OpenRouterがポストクラウド時代の「ニュートラルな推論ネットワーク層」として認識されている証左と言える。 OpenRouterの成長指標も驚異的だ：指標 6ヶ月前現在伸び率週間トークン処理量 5T 25T 5倍ユーザー数非公開 800万+ — 対応モデル数 200+ 400+ 2倍評価額 $547M $1.3B 2.4倍現在のペースでは年間1兆トークン（1 quadrillion）を超える処理量に達すると見込まれている。 CapitalGパラドックス：Googleはなぜ自社Geminiを競合させるのか最も興味深い論点の一つが、CapitalG（Alphabet）がOpenRouterに出資する逆説である。OpenRouterは400以上のモデルの中から最適なものを選んでルーティングする——つまり、GoogleのGeminiシリーズだけでなく、Anthropic Claude、OpenAI GPT-5.5、DeepSeek V4、そしてオープンソースモデルも同等に扱う。 CapitalGのJane Alexanderパートナーはこの点について次のように述べている：「OpenRouterはユニークなポジションにあり、AIモデルのためのデータクリアリングハウス兼統合インテリジェンス層になる可能性を秘めている。」この発言の背景には、エンタープライズのマルチモデル戦略が不可避であるという認識がある。Deloitteの2026年調査では、エンタープライズの67%が月間10億トークン以上を消費しており、F5の調査では平均7モデルを同時評価している。このマルチモデル需要に対し、一つのベンダーにロックインを強いる戦略は通用しない。ならば「ニュートラルなルーティング層」の一部になることで、エコシステム全体に関与し続ける——これがCapitalGの戦略的判断である。この構図は、Google Cloudがマルチクラウド戦略（BigQueryがAWS/Azure上でも使える等）を取っているのと構造的に同じだ。中立性こそが最大の防衛線という認識が、競合を出資するという一見矛盾した行動を説明する。 Portkey買収競合マップの一変：OpenRouterの追い風 OpenRouterにとって、2026年4月30日に発生したPortkeyの買収は決定的な追い風となった。PortkeyはOpenRouterの最大のエンタープライズ競合だったが、Palo Alto Networksに買収され、独立したAIゲートウェイとしての立場を失った。現在の競合地図を整理する：カテゴリプレイヤー資金調達戦略パブリックルーター OpenRouter $113M（Series B）アグリゲーション特化、ニュートラル独自インフラ型 Together AI $535M（Series C）自社クラスタ + 推論最適化買収済み Portkey —（Palo Alto Networks傘下）エンタープライズセキュリティへ統合セルフホスト型 LiteLLM オープンソース 100%セルフホスト、変換レイヤークラウド内蔵 Vertex AI / Bedrock クラウドバンドルエコシステムロックイン型 Portkeyの消失により、**「ニュートラルなモデルアクセス層」**としてのOpenRouterのポジションは著しく強化された。エンタープライズが「特定クラウドに縛られず、かつセルフホストの手間もかけずにマルチモデル運用したい」場合、OpenRouterが現時点で最も現実的な選択肢となる。 ...