Nemotron 3 Ultra完全解説:長時間自律エージェント時代の「データセンターモデル」を読み解く
2026年6月4日、NVIDIAはNemotron 3 Ultra 550B-A55Bを公開した。GTC Taipei 2026の基調講演で「アメリカ最強のオープンモデル」と紹介された同モデルだが、報道の論調は「中国製オープンLLMに Intelligence Index で及ばない(48点 vs Kimi K2.6 の54点)」という比較に偏っている。本記事ではその論調を離れ、**「なぜこのモデルが『長時間自律エージェント時代』のデータセンター設計思想と整合するのか」**という観点から読み解く。TCO(総保有コスト)、MOPD学習法、OpenMDW-1.1ライセンス、ソブリンAI展開まで、日本企業のAIエンジニアが意思決定するための材料をコード例と試算とともに整理する。 1. モデル仕様の再確認:「サイズ」ではなく「役割」で理解する Nemotron 3 ファミリーは Nano(30B-A3B)/ Super(120B-A12B)/ Ultra(550B-A55B)の3層構造を取る。Nano と Super は DGX Spark 128GB のユニファイドメモリで手元運用できる「日常のモデル」だが、Ultra はそもそもターゲットが異なる。NVIDIA 技術ブログは「シングルターンのチャットボットから long-running agent への進化」を前提に Ultra を位置づけている。 項目 Ultra 仕様 総パラメータ 550B トークンあたり稼働 55B(MoE) アーキテクチャ Mamba-2 + Transformer + LatentMoE のハイブリッド コンテキスト長 1M トークン 学習トークン 約20T(NVFP4 レシピ) ライセンス OpenMDW-1.1(Linux Foundation、商用利用可) 量子化後重みサイズ 約335GB(NVFP4) 必要 VRAM 600GB 超(4×B200 または 8×H100 80GB) 対応 GPU Ampere / Hopper / Blackwell(単一チェックポイントで動作) サポート言語 英仏西伊独日韓ヒンディー葡中(日本語を含む10言語) 重要なのは「動くかどうか」ではない。「どの規模の問題を、何時間止めずに回し続けられるか」 が設計の出発点にある。Hugging Face モデルカードで公開されている GA v1.0 は、4 種類のチェックポイント(Base-BF16 / Post-trained BF16 / NVFP4 / GenRM)を揃え、NVIDIA AI Enterprise 90 日無料評価 + 商用ラインセンス + 完全なオープン性が同居する。 ...