Microsoft Build 2026 2日目完全解説:MAI-Thinking-1、MAI-Code-1-Flash、Scout——Microsoft AIエコシステムの全貌

Microsoft Build 2026は6月3日(現地時間6月2日)に2日目を迎え、Day 1のProject PolarisやWindows Agent Framework 1.0に続き、さらに大規模な発表が行われた。前回のDay 1レポートに続き、本記事ではDay 2で発表された全アナウンスを、エージェントファーストプラットフォームという統一的な視点から解説する。 MAI-Thinking-1:Microsoft初の自社推論モデル 最大の目玉は、Microsoft初の自社開発推論モデル MAI-Thinking-1 の発表である。 35BアクティブパラメータのMoE(Mixture of Experts)アーキテクチャを採用し、256Kトークンのコンテキストウィンドウを備える。特筆すべきは、他社モデルからの蒸留(distillation)を一切行わず、ゼロから学習した点だ。ベンチマーク結果はClaude Sonnet 4.6を上回り、AIME 2025で97%、AIME 2026で94.5%、SWE-Bench Proで52.8%を記録している。 MAI-Thinking-1は現在Foundryでプライベートプレビューとして提供されており、M365 CopilotのAgent Modeの中核エンジンとしても利用される。 MAI-Code-1-Flash:コーディングに特化した軽量モデル MAI-Code-1-Flash は、5Bパラメータの軽量コーディング特化モデルで、SWE-Bench Pro 51%を達成。Claude Haiku 4.5を60%少ないトークンで上回る性能を持つ。GitHub Copilot(Free/Pro/Pro+/Max)のVS Code向けに順次展開中で、HNでは368ポイントと170コメントを集めた。 MicrosoftがOpenAI GPT-4 Turboから自社モデルへの移行を進める中、MAI-Code-1-FlashはCopilotのコーディングモデルとしての第一歩となる。今後、Polaris(Maia 200ベース、2026年8月投入予定)に置き換わるまでの橋渡し的な位置づけだが、5Bという軽量さでHaikuクラスを凌駕する現時点の性能は驚異的だ。 Scout:OpenClawベースの常時稼働パーソナルエージェント Scout は、これまでで最も本格的なパーソナルAIエージェントとして発表された。Day 1でMITライセンス公開されたOpenClawを基盤とし、M365と統合された常時稼働型エージェントである。 具体的には以下の機能を持つ: スケジュール調整、資料作成、電話発信などの自律実行 Entra IDによるエージェント単位のID管理とPurview DLPによるデータ損失防止 Frontierプレビューでの初期アクセス(3,000人以上のMS社員が社内試験中) Sandbox実行(untrustedモード)によるセキュリティ保護 MicrosoftはScoutの基盤技術であるOpenClawにアップストリームコントリビューションを行うことも表明しており、オープンソースコミュニティとの協業姿勢を示した。 PC WatchやITmediaだけでなく、日本経済新聞もScoutを取り上げており、一般メディアでも注目度の高さがうかがえる。 7つのMAIモデルファミリー MAI-Thinking-1とMAI-Code-1-Flashに加え、合計7つのMAIモデルが発表された。GIGAZINEが最も詳細なスペック一覧を掲載しているが、全体を横断的に整理する。 モデル 用途 価格(100万トークンあたり) ステータス MAI-Thinking-1 推論・思考 未公開(Foundry Preview) プライベートプレビュー MAI-Code-1-Flash コード生成 未公開 Copilot展開中 MAI-Image-2.5 画像生成 $5 GA(PowerPoint連携) MAI-Image-2.5 Flash 高速画像生成 $8 GA MAI-Transcribe-1.5 音声認識(43言語SOTA) $0.36/時間 GA MAI-Voice-2 音声合成(感情制御対応) 未公開 GA MAI-Voice-2 Flash 高速音声合成 $47 GA MAI-Voice-2は日本語を含む15言語以上に対応し、音声クローニングと感情制御が可能。MAI-Transcribe-1.5は競合比5倍の速度で43言語においてSOTAを達成している。 ...

June 3, 2026 · 21 min · 4144 words · Appwright

Microsoft Build 2026完全レポート:Project Polaris、Windows Agent Framework 1.0、Azure Agent Meshが切り拓くエージェントAIプラットフォーム時代

サンフランシスコで開催されたMicrosoft Build 2026 2026年6月2日〜3日、Microsoftは年次開発者会議Build 2026をサンフランシスコで開催した。キーノートは日本時間6月3日午前0時30分から行われ、WindowsをAIエージェントのプラットフォームにするという明確なビジョンのもと、複数の革新的発表が行われた。 本稿では全12の主要発表を整理し、日本のAIエンジニアにとって実践的な視点で解説する。特に、これまで本サイトでカバーしてきたAnthropicシリーズ、エージェントツール比較、AIコスト最適化の文脈とどう接続するかに重点を置く。 1. Project Polaris:Microsoftが自社コーディングモデルに切り替える日 最もインパクトの大きい発表は、Project Polaris——Microsoftが独自開発したコーディング専用AIモデルの発表だ。 ベースアーキテクチャ: Maia 200カスタムシリコン上で動作するMoE(Mixture of Experts)モデル ポジショニング: 「ピアプログラマー」——コードレビューと共同開発に最適化された役割 移行計画: 2026年8月よりGitHub CopilotのGPT-4 Turboを順次置き換え。3ヶ月のフォールバック期間あり ベンチマーク: HumanEvalおよびMBPPでGPT-4 Turboを上回るスコアを達成(詳細な数値は未公開だが、Microsoftは「あらゆるコーディングタスクで有意な改善」と主張) Polarisは単なる「より賢いモデル」ではない。Visual Studio / VS Codeでのコードレビュー体験に特化した設計思想を持ち、PRの変更差分に対するコンテキスト理解、複数ファイルにまたがるリファクタリング提案、テストカバレッジの自動補完などに特化している。 実務への影響: 2026年8月までに、Copilot利用組織は以下の準備が必要になる: Polarisのコードレビュー品質を現在のGPT-4 Turboと比較評価するベンチマーク設定 フォールバック期間中に移行計画を策定 カスタムモデル利用(Azure OpenAI Service)との併用戦略の再検討 2. Windows Agent Framework 1.0:MITライセンスで公開 サプライズ発表の一つが、Windows Agent Framework(WAF)1.0のMITライセンスでのオープンソース公開だ。Microsoftは従来Semantic KernelやAutoGenを個別に提供していたが、WAF 1.0はこれらを統合した統一エージェントフレームワークとして設計されている。 WAF 1.0の4つのOS能力: ファイルシステム操作: 読み取り、書き込み、ディレクトリ構造の変更 ネットワーク通信: HTTPリクエスト、WebSocket、API連携 UI自動化: ウィンドウ操作、スクリーンショット解析、クリック/タイピング プロセス管理: プロセスの起動、停止、標準入出力の制御 さらに、状態永続化と人間承認キューの2つのメカニズムが組み込まれており、長時間実行タスクでの信頼性とセキュリティを両立する。 以下は、WAF 1.0のYAML定義ファイルの最小構成例: # WAF 1.0 Agent Definition (MIT License) name: "CodeReviewAgent" version: "1.0.0" runtime: "semantic-kernel" capabilities: - file_system: read_paths: ["/workspace/src"] write_paths: ["/workspace/review"] - network: allowed_hosts: ["api.github.com", "*.azurecr.io"] - process: allowed_commands: ["dotnet", "npm", "python"] state: persistence: local approval_queue: required_for: ["network.send", "file_system.write"] timeout: 300 models: default: "polaris" fallback: "gpt-4-turbo" このYAML定義は、Claude Code(2026年5月29日記事)やForge guardrails(5月27日記事)と比較して、より粒度の細かいパーミッション制御を提供する。特に approval_queue の仕組みは、日本のエンタープライズ環境で求められる監査要件を満たしやすい設計だ。 ...

June 3, 2026 · 21 min · 4145 words · Appwright