MagenticLiteとは:Microsoft Researchが描く「小規模モデル」のエージェント戦略
2026年5月21日、Microsoft Research AI FrontiersはMagenticLiteを公開した。これは、次世代のエージェント型アプリケーションであり、前世代のMagentic-UIを根本から再設計したものである。特筆すべきは、フロンティアモデル(GPT-5.5やClaude Opus 4.7クラス)ではなく、14Bパラメータ以下の小規模モデル(SLM) で実用的なエージェント性能を引き出すことに特化している点だ。
MagenticLiteの根底にある研究上の仮説は明確である。「エージェントとしての能力は、モデルの知識量ではなく、ツールのオーケストレーションと行動連鎖にかかっている」。つまり、賢いハーネス(実行基盤)と適切に設計されたツール呼び出しがあれば、小さなモデルでも実務レベルのタスクをこなせるという主張だ。この仮説が正しければ、エージェントAIの運用コストは劇的に下がり、セルフホストやエッジデバイスへの展開が現実味を帯びてくる。
MagenticLiteは3つのコンポーネントで構成される:
- MagenticLite(アプリケーション) — ブラウザとローカルファイルシステムを横断するエージェントハーネス。MITライセンスでGitHub公開
- MagenticBrain(14B) — 計画・コーディング・タスク委譲を担当するオーケストレータモデル。Microsoft Foundryで利用可能
- Fara1.5(4B/9B/27B) — ブラウザ操作に特化したComputer Use Agent(CUA)モデル。同じくFoundryで公開
本稿では、この3つのコンポーネントを順に解説し、実際のセットアップ手順、設定例、競合ツールとの比較までをカバーする。
MagenticBrain(14B):オーケストレータとしての設計思想
MagenticBrainはQwen 3 14Bをベースにファインチューニングされたオーケストレーションモデルである。その役割は、ユーザーの高レベルな指示を受け、計画を立案し、必要なツールを呼び出し、ブラウザ操作が必要な場合はFara1.5にタスクを委譲することだ。
重要な2つの設計判断
-
マルチステップツール呼び出し+コーディング/ターミナルの統合学習: MagenticBrainは、単なるツール呼び出しの軌跡だけでなく、「Pythonコードを5行書く」といったコーディングタスクも同一の訓練データに含めている。これにより、ツール呼び出しとコード生成をシームレスに切り替えられる。
-
CUA Delegation(明示的な委譲): ブラウザ操作が必要なタスクでは、MagenticBrainが明示的にFara1.5に制御を委譲する。この「オーケストレータ→専門ワーカー」の分割は、単一モデルですべてをやらせるアーキテクチャよりも効率的で、拡張性が高い。
MagenticBrainはMagenticLiteのハーネス内でエンドツーエンドに訓練されており、推論時と同じツールスキーマ・実行環境で訓練されている。これによりTrain-Inference Gap(訓練時と推論時の環境差による性能低下)を排除している。
Fara1.5(4B/9B/27B):小規模CUAモデルの新たなSOTA
Fara1.5はブラウザ操作(Computer Use)に特化したモデルファミリーである。ベースにはQwen 3.5を採用し、4B・9B・27Bの3サイズを用意。フラッグシップは9Bだが、27Bはより大規模なプロプライエタリモデル(Gemini 2.5 Computer Use、OpenAI Operator、Yutori Navigator N1)とも互角以上に渡り合う性能を持つ。
ベンチマークスコア
| モデル | Online-Mind2Web | WebVoyager |
|---|---|---|
| Fara1.5-4B | 57.3 | 80.8 |
| Fara1.5-9B | 63.4 | 86.6 |
| Fara1.5-27B | 72.0 | 88.6 |
| 参考:Fara-7B(前世代) | 34.1 | 73.5 |
| 参考:Claude 3.7 Sonnet + Browser-Use | 39.33 | — |
Fara1.5-9Bは前世代のFara-7Bと比較してOnline-Mind2Webで**+29.3ポイント**、WebVoyagerで**+13.1ポイント**もの改善を達成している。特にOnline-Mind2Webの63.4というスコアは、小規模モデルとしては驚異的であり、Claude 3.7 SonnetにBrowser-Useフレームワークを組み合わせた構成(39.33%)を大きく上回る。
訓練データの内訳
Fara1.5の訓練には約200万サンプルが使用されており、その構成は以下の通り:
- Web Trajectories(60.0%): 実際のWebサイトでの操作軌跡
- Synthetic Environments(12.8%): ログインが必要なサイト(メール、カレンダー、予約サイトなど)のサンドボックスクローン
- Form Filling and User Interactions(12.5%): フォーム入力・ユーザー確認プロセス
- Grounding(8.8%): 画面要素の位置特定
- VQA(4.9%): 視覚質問応答
- GUI Drag(0.8%): GUIドラッグ操作
- Instruction Following + Safety(0.1%): 指示追従・安全性
Microsoft Researchは、FaraGen 1.5と呼ばれる合成データ生成パイプラインを構築。特に注目すべきは「Gated Domain(ログイン必要領域)」の訓練手法だ。実際のメールサービスやカレンダーサービスの操作軌跡を収集し、GitHub Copilot CLIで完全なフロントエンド+API+データベースを持つ合成サンドボックス環境(FaraEnv) を生成。これにより、ログインが必要なタスクでも訓練できるようになった。FaraEnvはMail、Calendar、Stream、ML、Stay、Schedulerの6つが用意されている。
MagenticLiteハーネス:小規模モデルを最大限に活かす3つの仕掛け
MagenticLiteの真価は、モデルそのものではなくハーネス(実行基盤) にある。Microsoft Researchは小規模モデルの限界を補うために、以下の3つの設計判断を下している。
1. Step-by-Step Planning(段階的計画)
一度に完全な計画を立てるのではなく、段階的に計画を生成・修正する。これにより、長いタスクの中での軌道修正やエラーリカバリが容易になる。小規模モデルは一度に多くのことを考慮できないため、これは特に重要だ。
2. Active Context Management(能動的コンテキスト管理)
モデルの入力プロンプトを常に最適化する。過去のやり取りを要約し、不要な情報は破棄し、重要な情報だけを保持する。小規模モデルのコンテキストウィンドウの制約を緩和するための工夫だ。
3. Subagent Delegation(サブエージェント委譲)
オーケストレータ(MagenticBrain)がブラウザ操作を専門エージェント(Fara1.5)に委譲するアーキテクチャ。これにより、単一モデルにすべてをさせるより効率的で、将来的には並列サブエージェントへの拡張も見込まれている。
加えて、重要なツール呼び出し(ブラウザ操作・コード実行)では人間の承認を求め、実行環境はQuicksand(オープンソースのQEMUベースサンドボックス)で隔離される。
セットアップガイド:MacでMagenticLiteを動かす
MagenticLiteはmacOS(Apple Silicon)とWindows(WSL2)を公式サポートしている。ここではmacOSでのセットアップ手順を紹介する。
前提条件
- macOS ARM64(Apple Silicon)
- Python 3.10以上
- uv(Pythonパッケージマネージャ)
- Docker Desktop(Quicksandサンドボックス用)
インストールと起動
# uvのインストール(未インストールの場合)
curl -LsSf https://astral.sh/uv/install.sh | sh
# MagenticLiteのインストール
uv pip install magentic_ui==0.2.0
# 起動
magentic-ui --port 8081
初回起動時はhttp://127.0.0.1:8081/にアクセスし、オンボーディングフローに従ってモデルエンドポイントを設定する。MagenticBrainとFara1.5の両方が必要で、Microsoft Foundryのエンドポイントを使用するか、互換性のあるOpenAI互換APIサーバー(vLLMなど)をセルフホストする。
config.yamlの設定例
より細かい制御が必要な場合は、プロジェクトルートにconfig.yamlを配置する:
# MagenticLite 設定ファイル
model_client_configs:
orchestrator:
provider: OpenAIChatCompletionClient
config:
model: MagenticBrain-14B
base_url: https://api.foundry.microsoft.com/v1
max_retries: 5
web_surfer:
provider: OpenAIChatCompletionClient
config:
model: Fara1.5-9B
base_url: https://api.foundry.microsoft.com/v1
max_retries: 5
sandbox:
type: quicksand # QEMUベースのVM分離
agent_mode: all # "all" | "omniagent_only" | "websurfer_only"
harness_config:
orchestrator:
approval_policy: require_approval_untrusted
temperature: 0.6
max_rounds: 30
web_surfer:
max_rounds: 100
エージェントモードは3種類から選択できる:
- all: オーケストレータ+ブラウザ操作(デフォルト)
- omniagent_only: オーケストレータのみ(ローカルタスク専用)
- websurfer_only: ブラウザ操作のみ(Web操作専用)
競合比較:Antigravity 2.0、Claude Code、OpenHandsとの違い
MagenticLiteは「小規模モデル向けに最適化されたエージェント基盤」という独自のポジションを占める。既存の競合と比較してみよう。
| 軸 | MagenticLite | Antigravity 2.0 | Claude Code | OpenHands |
|---|---|---|---|---|
| モデル要件 | 14B以下(SLM) | Gemini 3.5 Flash/Pro | Claude Opus 4.7 | 任意のLLM |
| ライセンス | MIT(オープンソース) | プロプライエタリ | プロプライエタリ | MIT |
| ブラウザ操作 | Fara1.5(CUA特化) | 内蔵ブラウザ | なし(CLI専用) | 内蔵ブラウザ |
| セルフホスト | 可能 | 不可 | 不可 | 可能 |
| ランニングコスト | 低(Foundryまたはセルフホスト) | $100-200/月(AI Ultra) | $20/月+API利用料 | モデル次第 |
| 主な用途 | 研究・実験・エッジ | IDE統合開発 | コード生成・リファクタリング | エージェント運用基盤 |
MagenticLiteの最大の差別化要因は「小規模モデルでも実用的なエージェント性能が得られる」という点だ。Fara1.5-9BのOnline-Mind2Web 63.4%は、Claude Opus 4.7の39.33%(Browser-Use経由)を上回る。もちろんベンチマークの種類やタスクの性質による差はあるが、コストあたりの性能比で見れば小規模モデルに明確なアドバンテージがある。
実践的なユースケース
MagenticLiteが特に力を発揮するシナリオをいくつか挙げる。
1. 定型業務の自動化(フォーム入力・データ収集)
ブラウザ操作とファイルシステム操作を同一ワークフローで実行できるため、以下のようなタスクに適している:
「Web上の競合3社の価格表をスクレイピングし、スプレッドシートに整形して保存する」
Fara1.5がブラウザを操作し、MagenticBrainがデータの整形とファイル保存を担当する。全て同一のエージェントセッション内で完結する。
2. 個人用情報収集エージェント
「毎朝、HNのトップ10記事をチェックし、AI関連のものだけ要約してMarkdownファイルに保存する」
スケジュール実行にはMagenticLite自体にスケジューラ機能はないが、cronやCI/CDパイプラインと組み合わせることで定期実行が可能だ。
3. 社内向けRAGパイプラインの検証
小規模モデルで動作するため、機密データをクラウドに送信せずにエージェントを検証できる。Quicksandサンドボックスによる隔離もセキュリティ要件を満たす。
制約と注意点
MagenticLiteは研究公開(Research Release)であり、本番運用を前提としたものではない。以下の制約がある:
- 実験的ソフトウェア: 安定性やAPIの互換性は保証されない
- 同時実行不可: 同一ポートでは1インスタンスのみ動作
- ブラウザ操作の品質: 特にCAPTCHAや複雑なJavaScript動的サイトでの動作は不安定な場合がある
- 前世代(0.1.x)との非互換: データベースの移行は行われない。
--appdirフラグで分離が必要
まとめ:小規模モデルエージェント時代の幕開け
MagenticLiteの登場は、エージェントAIの世界に「小規模モデルでも十分実用的」という選択肢をもたらした。Fara1.5-9BがOnline-Mind2Webで63.4%を記録し、Claude 3.7 Sonnet+Browser-Useの39.33%を凌駕したことは象徴的だ。
Microsoft Researchの核心的な主張——「エージェント能力はツールのオーケストレーションと行動連鎖にかかっており、モデルの知識量だけがすべてではない」——は、今後のエージェントアーキテクチャの設計指針として重要な示唆を含んでいる。巨大なフロンティアモデルだけがエージェントを動かせる時代は終わりつつある。
セルフホスト可能なAIエージェントを探している開発者にとって、MagenticLiteは今週最も試す価値のあるツールの一つだ。
この記事はAIによって生成され、人間の編集を経て公開されています。 Appwright AI は AI によるコンテンツ制作の可能性を探求する実験的プロジェクトです。