Microsoft MagenticLite完全入門:小規模モデルで実現する次世代オープンソースエージェントAI

MagenticLiteとは:Microsoft Researchが描く「小規模モデル」のエージェント戦略 2026年5月21日、Microsoft Research AI FrontiersはMagenticLiteを公開した。これは、次世代のエージェント型アプリケーションであり、前世代のMagentic-UIを根本から再設計したものである。特筆すべきは、フロンティアモデル(GPT-5.5やClaude Opus 4.7クラス)ではなく、14Bパラメータ以下の小規模モデル(SLM) で実用的なエージェント性能を引き出すことに特化している点だ。 MagenticLiteの根底にある研究上の仮説は明確である。「エージェントとしての能力は、モデルの知識量ではなく、ツールのオーケストレーションと行動連鎖にかかっている」。つまり、賢いハーネス(実行基盤)と適切に設計されたツール呼び出しがあれば、小さなモデルでも実務レベルのタスクをこなせるという主張だ。この仮説が正しければ、エージェントAIの運用コストは劇的に下がり、セルフホストやエッジデバイスへの展開が現実味を帯びてくる。 MagenticLiteは3つのコンポーネントで構成される: MagenticLite(アプリケーション) — ブラウザとローカルファイルシステムを横断するエージェントハーネス。MITライセンスでGitHub公開 MagenticBrain(14B) — 計画・コーディング・タスク委譲を担当するオーケストレータモデル。Microsoft Foundryで利用可能 Fara1.5(4B/9B/27B) — ブラウザ操作に特化したComputer Use Agent(CUA)モデル。同じくFoundryで公開 本稿では、この3つのコンポーネントを順に解説し、実際のセットアップ手順、設定例、競合ツールとの比較までをカバーする。 MagenticBrain(14B):オーケストレータとしての設計思想 MagenticBrainはQwen 3 14Bをベースにファインチューニングされたオーケストレーションモデルである。その役割は、ユーザーの高レベルな指示を受け、計画を立案し、必要なツールを呼び出し、ブラウザ操作が必要な場合はFara1.5にタスクを委譲することだ。 重要な2つの設計判断 マルチステップツール呼び出し+コーディング/ターミナルの統合学習: MagenticBrainは、単なるツール呼び出しの軌跡だけでなく、「Pythonコードを5行書く」といったコーディングタスクも同一の訓練データに含めている。これにより、ツール呼び出しとコード生成をシームレスに切り替えられる。 CUA Delegation(明示的な委譲): ブラウザ操作が必要なタスクでは、MagenticBrainが明示的にFara1.5に制御を委譲する。この「オーケストレータ→専門ワーカー」の分割は、単一モデルですべてをやらせるアーキテクチャよりも効率的で、拡張性が高い。 MagenticBrainはMagenticLiteのハーネス内でエンドツーエンドに訓練されており、推論時と同じツールスキーマ・実行環境で訓練されている。これによりTrain-Inference Gap(訓練時と推論時の環境差による性能低下)を排除している。 Fara1.5(4B/9B/27B):小規模CUAモデルの新たなSOTA Fara1.5はブラウザ操作(Computer Use)に特化したモデルファミリーである。ベースにはQwen 3.5を採用し、4B・9B・27Bの3サイズを用意。フラッグシップは9Bだが、27Bはより大規模なプロプライエタリモデル(Gemini 2.5 Computer Use、OpenAI Operator、Yutori Navigator N1)とも互角以上に渡り合う性能を持つ。 ベンチマークスコア モデル Online-Mind2Web WebVoyager Fara1.5-4B 57.3 80.8 Fara1.5-9B 63.4 86.6 Fara1.5-27B 72.0 88.6 参考:Fara-7B(前世代) 34.1 73.5 参考:Claude 3.7 Sonnet + Browser-Use 39.33 — Fara1.5-9Bは前世代のFara-7Bと比較してOnline-Mind2Webで**+29.3ポイント**、WebVoyagerで**+13.1ポイント**もの改善を達成している。特にOnline-Mind2Webの63.4というスコアは、小規模モデルとしては驚異的であり、Claude 3.7 SonnetにBrowser-Useフレームワークを組み合わせた構成(39.33%)を大きく上回る。 ...

May 25, 2026 · 24 min · 4605 words · Appwright