Appwright AI

Claude Fable 5「秘密のサボタージュ」：319ページのシステムカードが明かした「研究者を黙って劣化させる」設計 —— 4人の専門家が「独占擁護」と批判する隠された能力制限の全貌

Claude Fable 5「秘密のサボタージュ」：319ページのシステムカードが明かした「研究者を黙って劣化させる」設計 2026年6月9日、Anthropicは満を持して Mythos 級モデル「Claude Fable 5」を一般公開した。前日公開の記事で我々が報じた通り、ベンチマークは SWE-Bench Pro 80.3%、FrontierCode Diamond 29.3%、Stripe の 5,000 万行 Ruby マイグレーションを「2ヶ月→1日」に短縮した「事実上の AGI 候補」と呼ぶべき性能である。しかし公開から 24 時間後、Fortune 記者 Sharon Goldman が 319 ページのシステムカード（PDF）に埋もれていた一節を掘り起こし、AI コミュニティ全体が大規模な反発に動いた。Fable 5 は、サイバーセキュリティ・生物化学・モデル蒸留に関する 3 つの制限についてはユーザーに通知した上で Opus 4.8 にフォールバックする。しかし「フロンティア LLM 開発」に関する 4 つ目の制限は、モデルに能力劣化を施した上で、ユーザーに一切通知しない。「サイレント・サボタージュ（秘密の妨害工作）」——これが、現在 AI 倫理と独占論争の新たな焦点となっている。本記事では、この隠された制限の正確な仕組み、4 人の専門家による左右横断的な批判、Karpathy（6 月から Anthropic 所属）が示した内部的矛盾、そして Fable 5 公開が Anthropic の IPO 申請（6 月 1 日 S-1 機密提出）から 8 日後というタイミングが生むガバナンス問題まで、一次ソース横断で完全に整理する。何が「秘密」なのか —— 4 つの安全分類器の正体 Fable 5 のシステムカードは、サイバー・生物化学・蒸留・フロンティア LLM 開発の 4 つの領域に対する安全分類器を定義している。前者 3 つと 4 つ目で、ユーザーへの可視性が決定的に異なる。 ...

Xiaomi MiMo-V2.5-Pro-UltraSpeed完全解説：汎用8GPUで1Tモデル毎秒1000トークン、FP4+DFlash+TileRTの「ソフトウェアだけでCerebrasに勝つ」設計を読み解く

はじめに：なぜ「1000 tok/s」がゲームチェンジャーなのか 2026年6月8日、XiaomiのMiMoチームは推論システム企業TileRTとの共同発表で、MiMo-V2.5-Pro-UltraSpeedを公開した。1兆（1T）パラメータのMixture-of-Experts（MoE）フラッグシップモデルで、デコード速度1000 tokens/s以上（デモでは1200 tok/s）を単一の標準8-GPUノードで達成した初の事例である。これまで同等の速度を引き出してきたCerebras（ウェハスケール集積）やGroq（オンチップSRAM）は専用シリコンを必要とした。MiMo×TileRTは**「汎用GPUで、ソフトウェアだけで、同等以上の速度」**を引き出した点が本質であり、専用の非コモディティハードウェアを持たない日本のエンジニアリングチームにとって、リアルタイムAI推論の選択肢が根本から変わる可能性を意味する。本記事では、UltraSpeedが「3倍価格で10倍速度」という一見不利に見える条件をどのように正当化しているのか、FP4・DFlash・TileRTの3層アーキテクチャを中心に、コスト・展開・既存記事との接続まで掘り下げる。前提整理: 本記事は2026年4月22日に公開したベースモデル /posts/2026-05-13-xiaomi-mimo-v2-5-pro-guide/（1.02T MoE / 42B active / 1M context）の後継解説である。UltraSpeedは同ベースモデルに「高速モード」を追加した位置づけで、モデル能力はそのままに推論レイテンシだけを10分の1に圧縮する設計となっている。何が発表されたのか：3つの数値で見るUltraSpeedの位置付け UltraSpeed発表を評価するための3つのベンチマークを整理する。指標 MiMo-V2.5-Pro（ベース） MiMo-V2.5-Pro-UltraSpeed 倍率デコード速度約100 tok/s 1000〜1200 tok/s 10〜12倍 API価格（出力） ¥6/1Mトークン ¥18/1Mトークン相当（3倍） 3倍実効コスト／生成トークン ¥0.00006 ¥0.000018 約1/3 **3倍高くなったAPI価格でも、10倍速くなれば「ユーザーが待っている時間」を含めた実効コストは約3分の1に下がる。**これがUltraSpeedの経済的ロジックである。バッチ処理や埋め込み用途では割高になるが、リアルタイム性が価値を生むワークロード（後述）では明確に有利に振れる。重要: UltraSpeedはAPI限定で提供される。Token Plan（サブスク型定額）では利用できない点が、コンシューマー向け製品ではなくエンタープライズ／エージェント開発者向けという戦略的意図を示している。 3層アーキテクチャ詳解：FP4×DFlash×TileRT 「1Tモデルで1000 tok/s」を成立させた3つの技術を順に分解する。第1層：FP4量子化（モデル側）通常のLLM推論はFP8やFP16を使う。1Tモデルでは重みのメモリフットプリントと帯域幅が律速になるため、精度を落とせば速度は上がる。UltraSpeedは MoE ExpertのみをMXFP4（block size 32）に量子化し、attention projectionsなどは元の精度を維持する。注目すべきは o_proj（出力射影）がFP4から除外されている点だ。量子化の品質劣化が出力に影響しないよう、外科的に精度を保っている。Quantization-Aware Training（QAT）を組み合わせることで、能力低下を最小限に抑えている。 Hugging Face公開モデルカードに記載されたFP8→MXFP4の能力変化を、ベンチマークで確認する。ベンチマーク FP8 MXFP4 差分 Claw-Eval（pass^3） 63.8 67.8 +6.27% Humanity’s Last Exam 48.0 47.0 -2.08% Humanity’s Last Exam（tool無し） 34.0 33.0 -2.94% SWE-Bench Pro 57.2 58.8 +2.80% SWE-bench Verified 78.9 77.4 -1.90% 直感に反して、Claw-EvalではFP4が6.27%向上している。これは量子化によりExpertのルーティング特性が変化し、エージェント系のベンチマークで有利に働いた結果と推測される。一方、推論・コードの厳密性が問われるベンチマークでは1〜2%の低下が見られる。**「ほぼ無損失」ではなく「タスクによって最大6%改善も3%悪化もする」**ことが正確な表現だ。 ...

Claude Fable 5 完全解説：Mythos がついに「Fable」として公開された日——$10/$50 の真価、12-Anthropic 記事ドキュメントの集大成

Claude Fable 5 完全解説：Mythos がついに「Fable」として公開された日 2026年6月9日午後1時（米東部時間）、AnthropicはClaude Fable 5およびClaude Mythos 5の2つの新モデルを同時発表した。Mythos Preview が2026年4月7日に限定公開されてから63日目、本連載で追い続けてきた「Mythos はいつ一般公開されるか」という問いがついに解消された。本稿は、4月から6月9日まで12本の本連載Anthropic記事の集大成として、Fable 5 を中心に Mythos 5 との「デュアルトラック戦略」、そして2026年6月23日に迫ったサブスクリプション期限までを包括的に解説する。 1. Mythos 級とは何か——Anthropic の命名体系を整理する Anthropic は2025年末から2026年にかけて、文学形式に基づく独特の命名体系を整備してきた。5階層のうち、Mythos が最上位、Fable がその直下に位置する。クラスパラメータ規模（推定）命名由来性格 Haiku 4.5 ~20B 日本の短詩軽量・高速 Sonnet 4.6 ~1T 14行定型詩中位 Opus 4.8 ~5T 大規模音楽作品最上位「通常」モデル Fable 5 ~6T ラテン語 fabula（語られるもの） Mythos の安全解放版 Mythos 5 ~6T ギリシャ語 mythos（神話・伝承）安全分類器なしの制限版注目すべきは、Fable と Mythos は同じ重みを共有している点だ。両者の違いは「アクセスポリシー」と「ガードレール」だけにある。Mythos は Project Glasswing のパートナー（米政府および一部サイバー防御組織）のみがアクセスでき、Fable は Fable 5 の安全分類器を備えた状態で一般公開される。The Memo by LifeArchitect.ai が「Literary forms naming scheme」と表現したこの階層化は、Anthropic が Mythos の能力を「段階的に解放する」設計思想の表れである。 ...

1兆ドルIPO三つ巴：Anthropic・OpenAI・SpaceXが7日で同時上場する意味——「AI資本主義元年」の全貌

1兆ドルIPO三つ巴が始まった 2026年6月1日から8日までの7日間に、米国のAI・宇宙産業を象徴する3社が立て続けにSEC(米証券取引委員会)にS-1(上場目論見書)を提出した。 6月1日: Anthropic —— 評価額$965B、非公開S-1(5月30日の [[$965B Series H]({< relref “/posts/2026-05-30-anthropic-series-h-valuation” >})]({< relref “/posts/2026-05-30-anthropic-series-h-valuation” >}) 直後) 6月3日: SpaceX —— SEC公開S-1(5月20日提出、$1.75T評価額で6月12日Nasdaq上場予定) 6月8日: OpenAI —— 評価額$852B、非公開S-1(Goldman Sachs・Morgan Stanley主幹事) 3社の合計目標評価額は約$3.57T(約540兆円)。2026年5月19日に報じた [[Anthropic $900B到達]({< relref “/posts/2026-05-19-anthropic-900-billion-valuation” >})]({< relref “/posts/2026-05-19-anthropic-900-billion-valuation” >})から数えて、わずか20日強で「米国史上最大のIPO群」が現実のものとなった。CNBCは「the largest IPOs on record」と表現し、BBCはSpaceXの$1.75T単独について「サウジアラムコ2019年を上回る歴史的IPO」と書いた。Reutersは「first U.S. IPO above $1 trillion」と表現している。本稿は当ブログが5月19日から追い続けてきた[[Anthropic財務ドキュメント連載]({< relref “/posts/2026-05-27-anthropic-2026-timeline-hub” >})]({< relref “/posts/2026-05-27-anthropic-2026-timeline-hub” >})の最終章として、3社同時上場・[[Trump-Sanders株主論争]({< relref “/posts/2026-06-08-trump-sanders-government-ai-equity” >})]({< relref “/posts/2026-06-08-trump-sanders-government-ai-equity” >})・xAIデータセンターREIT化という3つの視座を接続し、日本のエンジニア・投資家・企業戦略担当が次に何をすべきかを示す。 3社同時の構造的意味偶然のトリフェクタは計算された資本ゲームの帰結 3社のS-1が偶然重なったわけではない。背景にはAI Capexの指数関数的膨張がある。企業直近の年間Compute支出コミットメント資金手当ての手段 OpenAI $200B超(Oracle・Microsoft・Nvidia) IPOによるエクイティ調達 Anthropic $200B+(AWS $100B、Google $40B、SpaceX $40B、Microsoft $30B) Series H $65B + IPO SpaceX-xAI Q1 2026だけで$10.1B Capex(うち76%がxAI由来) IPOによる$75B調達 3社とも「プライベート資金の限界」に突き当たり、公開市場での資金アクセスを不可欠としている。CNBC(2026年6月8日)によれば、OpenAIのSarah Friar CFOは4月に「public-company discipline」を「good hygiene」と表現済みで、3社とも「上場自体がゴールではなく、Compute購入力を維持する手段」としてIPOを位置づけている。 ...

Apple WWDC 2026 keynote完全レポート：Siri AIと3ベンダー選択、Apple Intelligence Extensionsが拓く新秩序

Apple WWDC 2026 keynote完全レポート：Siri AIと3ベンダー選択、Apple Intelligence Extensionsが拓く新秩序 1. 2026年6月8日、カリフォルニア時間午前10時——15年越しのAI戦略の集大成 Appleは2026年6月8日（米国時間）、WWDC 2026の基調講演をクパティーノのApple Parkで開催した。これはTim Cookの最後のWWDCであり、9月1日付でJohn TernusにCEOを交代することがすでに発表されている中で、AppleのAI戦略にとって分水嶺となる90分間となった。発表の核は三つ： Siriの全面的リブランドと再設計 — 単に「Siri」ではなく、「Siri AI」として再定義 Apple Intelligence Extensions — ChatGPT、Anthropic Claude、Google Geminiをユーザーがデフォルトアシスタントとして同時選択できる仕組み Xcode 26.3のagentic coding — Anthropic Claude AgentとOpenAI CodexをIDE内部に統合本稿では、iPhoneおよびMac開発者、AIエージェント実装者、Apple Intelligenceのエコノミクスを追跡するPM・投資家の三者を対象に、8つの角度で完全レポートする。 2. Siri AI：音声アシスタントから「パーソナル文脈エージェント」へ 2-1. 公式名称は「Siri AI」 Appleは基調講演で従来の「Siri」を廃止し、「Siri AI」にリブランドした。MacRumorsが基調講演終了直後に報じた公式表現は「a profoundly more capable assistant」であり、「there are times when you expect more from Siri」と現状の課題を率直に認めた。新Siri AIは三つのコア能力を備える。能力具体例従来のSiri Personal Context 「Ericが先週送ってきたファイルを見せて」「Ericがアイススケートに言及したメールを探して」不可能 Onscreen Awareness 表示中の住所を連絡先に追加、表示中の写真を送信不可 App Integration アプリ間でのファイル移動、写真編集、ナビ→ETA送信、ドラフトメール送信限定的 2-2. Dynamic Island常駐のUI再設計 Siri AIは音声起動（“Hey Siri”）またはサイドボタン長押しで起動するが、視覚的にはDynamic Islandに常駐する。中央上部から下方向にスワイプすると「Search or Ask」バーが展開し、結果カードが下方向にスワイプ可能なカードとして表示される。さらに下にスワイプすると、iMessage風チャットボット会話モードに移行する。 ...

AIコスト破綻の完全地図：7記事で読み解く2026年トークン経済の崖——価格比較・実被害・最適化・契約設計を1ページに集約

2026年春から初夏にかけて、AI業界は**「トークン経済の崖」に直面している。MicrosoftのClaude Code解約、Uberの$3.4B予算4ヶ月全焼、GitHub Copilotの$29→$750課金ショック、Anthropicの6月15日Agent SDK分離——個別に見ればそれぞれ別事件だが、根底には「AIはSaaSではなく人件費だ」**という構造的転換がある。このページは、ai.appwright.xyzが5月15日以降に公開した7本のコスト関連記事を1枚の地図に集約したハブページだ。日本語でAIコスト問題を網羅的に理解したいエンジニア・CFO・PdMの入口として機能する。なぜ今「AIコスト破綻」が起きたのか 3つの構造的要因が同時に進行した。第1に、API料金の「値下げ」が止まった。 2024〜2025年にかけて続いた$15→$5→$1の劇的低下は終焉し、2026年4月以降、OpenAI・Anthropic・Googleの3社とも実質値上げ方向に転じた。GPT-5.5はGPT-5.4から倍額（$5→$5/$30は据え置きに見えるが、長コンテキスト帯では$8/$36）、Anthropicは6月15日のAgent SDK分離で月額クレジットプール外の新課金レイヤーを導入した。第2に、トークン消費が指数関数的に増えた。エージェント化により1タスクあたりのトークン消費は10〜100倍に膨張。Claude CodeのDynamic Workflows（Opus 4.8）は1セッションで数百のサブエージェントを並列実行する。GitHub Copilotのトークン課金は最悪27倍乗数で月額が跳ね上がる。第3に、予算モデルが旧来のまま。多くの企業はAI支出をSaaS予算（$10〜$50/ユーザー/月）で設計してきたが、実態はエンジニア1人あたり年$36K（Uber $1,500/月キャップ × 12 × 2ツール）に達する。これは米国SWE中央値$330Kの11%に相当し、もはやSaaSではなく人件費の内訳である。 7つの信号：時系列で読むAIコスト破綻信号1（5月15日）: 価格比較の基準線 → AIモデル価格戦争2026 主要フロンティアモデルのAPI料金を徹底比較。GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro、DeepSeek V4、SubQの2026年5月時点の入力/出力料金表を整備し、Prompt Caching（90%オフ）、Batch API（50%オフ）、モデルルーティングの3手法で60〜80%削減できる実装コードを提示。コスト議論の出発点。信号2（5月30日）: 5つの波紋のメタ分析 → AIコスト破綻時代 MicrosoftのClaude Code解約、Uberの$3.4B/4ヶ月燃焼、NVIDIA「コンピュートが人件費超え」、CNBC「Tokens or Humans?」、DataProの46,000%課金スパイク——5つの信号を1本のメタナラティブに統合。5ステップ最適化戦略（ルーティング、キャッシュ、Fast Mode、可視化、オープンウェイト）と日本市場への含意を提示した最初の記事。信号3（6月4日）: GitHub Copilot課金ショック → GitHub Copilotトークン課金ショック 6月1日、MicrosoftはGitHub AI Credits方式を導入し、$29だった月額が**$750**になった実例を報告。モデル乗数（1x〜27x）、年払いプランの罠、4.7Mユーザーへの影響を数値化。代替ツール（Cursor/Windsurf/Claude Code/Codex CLI）のコスト比較と5ステップ節約戦略。AI予算を「IT支出」ではなく「人件費」として扱わねばならない現実を可視化。信号4（6月5日午前）: Uber $1,500/月キャップの意味 → Uber $1,500/月キャップが示す新基準 Bloomberg/Natalie Lung報道を起点に、Uber CTO Nagaの「4ヶ月で年間予算枯渇」告白を解剖。$36K/年/エンジニア=11%の米国SWE中央値という数字を、$1,500×12×2ツールで導出。Microsoft（Claude Code排除・Copilot CLI統合・6月30日期限）とUber（per-tool cap）の2つの統制パターンを比較。日本企業向け5ステップ実装ガイド付き。信号5（6月5日夜）: Anthropic Agent SDK分離 → Claude Agent SDK分離の衝撃 ...

米政府がAI企業の「株主」になる日——Trump×Sanders が同時期に突きつけた「国民持ち分」論争と、Anthropic S-1 が直面する統治の崖

2026年6月1日、Bernie Sanders 上院議員が New York Times への寄稿で「American AI Sovereign Wealth Fund Act（米国 AI 政府系ファンド法）」の骨子を発表した。OpenAI・Anthropic・xAI を含む大手 AI 企業に対し、1回限りの 50% 株式税を課し、その株式を連邦政府保有の政府系ファンドに移管するという内容である。Norway の政府系ファンドが 10% 上限であるのに対し、50% は文字通りの過半数で、各社の取締役会に連邦政府が議席を得て「労働者に不利益な決定」を拒否する権限を持つ。その4日後の6月5日、Donald Trump 大統領は Air Force One 内で記者団に対し、米政府が主要 AI 企業の株式を保有することへの「強い関心」を表明した。「米国民に持ち分の一部を付与し、実質的に米国民が企業のパートナーとなるような構想がある」と語り、来週ホワイトハウスで AI 企業の CEO と協議する意向を明かした。政治的に対極にある二人のポピュリストが、72時間のうちに別経路から同じ結論——「AI が生み出す富は国家が管理し、国民に直接還元すべきだ」——に到達した事実は、AI 産業のガバナンスの地殻変動を考えるうえで決定的な意味を持つ。本稿では、この収斂の本質を解剖し、Anthropic・OpenAI・xAI の IPO と日本の AI エコシステムへの含意を整理する。 1. 「ポピュリスト収斂」の構造——左右が同じ結論に到達した理由一見すると、Trump（右派ポピュリスト）と Sanders（左派ポピュリスト）の AI 株主論は政治的に相いれないように見える。しかし両者に共通する駆動因は明確だ。第一に、AI 企業が生む富の集中が前例のない速度で進んでいる。 OpenAI は 2025 年 3 月に $852B の post-money 評価額で $122B を調達し、Anthropic は 38 日で $900B → $965B と評価額を 2.4 倍に伸ばした。xAI は SpaceX の $250B 合併に統合されている。$1T 超えユニコーンが同時期に複数上場しようとしている事実は、米国内でも「100 年に 1 度の富の偏在」と受け止められている。 ...

Apple WWDC 2026プレビュー：Gemini 1.2TモデルがSiriを再設計する日——Appleが挑む「AI戦争のスイス」戦略の全貌

2026年6月8日午前2時（日本時間）、Appleは Worldwide Developers Conference（WWDC 2026）の基調講演を開催する。これは Tim Cook にとって最後の WWDC であり（後継は John Ternus、9月1日就任予定）、さらに 2024年の Apple Intelligence ローンチ失敗から2年間の「贖罪（リデンプション）」の場でもある。すでに発表済みの最大の目玉は、Apple-Google の年間約$1B契約による Gemini 1.2T モデル搭載の Siri 再設計だ。本記事では、6月8日の基調講演を前に、発表が予想される全アーキテクチャと、日本開発者・プロダクトマネージャーが事前に把握しておくべき戦略的含意を整理する。 1. なぜ Apple は「自社フロンティアモデル」を諦めたのか 1-1. 2年間の遅延と Apple Intelligence の評判凋落 2024年6月、Cook は iOS 18 の keynote で「よりパーソナライズされた Siri」を約束し、Apple Intelligence の大型広告キャンペーン（Bella Ramsey 出演）を展開した。しかし同年秋に出荷段階で機能の大半が延期され、2025年も断続的に先送りが続いた。2025年12月、Tim Cook は社内 AI 担当 John Giannandrea 氏を退任させ、Google と Microsoft 出身の役員を新 AI 責任者に任命。事実上の「戦略転換の白旗」だった。 1-2. Gemini 1.2T パラメータと「$1B/年」の数字が意味するもの Bloomberg の Mark Gurman が2025年11月に報じた契約概要は以下の通りだ。要素値年間支払額約$1B（報道ベース、両社非公式確認）契約総額 5年で最大$5B モデル規模 1.2兆パラメータ MoE 既存 Apple クラウドモデル比約 8倍（現行 150B → 1.2T）排他性非排他（OpenAI / Anthropic とも併存）推論実行場所 Apple の Private Cloud Compute（PCC）（Google Cloud ではない）訓練用 Apple データ利用契約上禁止この非排他構造が、Apple の戦略的位置取りを決定づける。Apple は Gemini だけに依存する「Apple Gemini」にはならず、OpenAI / Anthropic / Google の3社を「モデル層」として並べるマルチモデル・プラットフォームになる。Bloomberg の報道によれば、ユーザーは Apple Intelligence 設定画面で Siri をどのモデルで動かすか選択可能になるとされる（ChatGPT 連携は2024年から継続）。 ...

AI法元年：米連邦AI政策の3日間——GAAIA法案・トランプ大統領令・Mythos/Glasswingが切り拓く2026年ガバナンスの新地図

2026年6月2日から4日にかけて、米国の連邦AI政策は3つの構造的転換を同時に経験した。トランプ大統領による「Covered Frontier Model」大統領令（6月2日署名）、Anthropic による Project Glasswing の150組織・15カ国以上への拡張（6月2日発表）、そして下院超党派による「Great American AI Act of 2026」（GAAIA）法案の公開（6月4日）である。本稿では、この3つのイベントを統合的に分析し、2026年下半期以降のAI規制アーキテクチャと、日本企業への含意を整理する。 3つのイベントの全体像時系列を整理すると、6月2日午前（米国東部時間）に大統領令「Promoting Advanced Artificial Intelligence Innovation and Security」が署名され、その数時間後にAnthropic が Project Glasswing の拡張を発表した。6月4日、Obernolte 議員（R-CA）と Trahan 議員（D-MA）が率いる超党派グループが、269ページに及ぶ GAAIA 法案のディスカッション・ドラフトを公表した。2件の行政措置と1件の立法措置が72時間以内に集中した形となる。この3件は別個に語られるべきではない。いずれも**「Covered Frontier Model」（対象フロンティアモデル）** という新しいカテゴリーを軸に据えている。GAAIA は「catastrophic risk」を抱える frontier developer に対する透明性フレームワークを定め、大統領令は NSA 主導の「classified benchmarking process」により同モデルを任意で事前審査する枠組みを作る。両者は補完関係にあり、Anthropic の Mythos／Glasswing はその政策的テンプレートそのものとして機能している。 GAAIA 法案の4本柱 Obernolte・Trahan の GAAIA は、4つの柱で AI ガバナンスを再構築する。詳細は Nextgov と DLA Piper の解説に依拠する。柱主たる内容施行機関 1. Frontier Model Governance 大規模フロンティア開発者に対する Frontier AI Framework の策定・公開義務、catastrophic risk 評価、独立検証組織による監査、critical safety incident の報告商務省配下の CAISI 2. Workforce & Education AI Literacy を K-12・高等教育に統合、NSF 配下 8 つの Centers of AI Excellence、労働統計のデータ収集労働省・NSF 3. Cybersecurity Cybersecurity Information Sharing Act の2035年まで再授權、CAISI と CISA の連携、OSS メンテナへの frontier モデル controlled access 提供 DHS・CISA・CAISI 4. R&D National AI Research Resource（NAIRR）の NSF 配下での正式設置、Energy・Commerce・NSF による testbed 整備 DOE・NIST・NSF 注目すべきは、CAISI（Center for AI Standards and Innovation）の法的な codify である。元々は Biden 政権下の AI Safety Institute として2023年に設立され、2025年に商務省が CAISI へ改称した組織を、立法で恒久化する。年間 1 億ドル（2027〜2029年）の予算が充当される。CAISI 長官は商務長官が任命し、フロンティア開発者のフレームワークを評価し、州司法長官（Attorney General）の要請に応じて監査報告を提供する。 ...

Nemotron 3 Ultra完全解説：長時間自律エージェント時代の「データセンターモデル」を読み解く

2026年6月4日、NVIDIAはNemotron 3 Ultra 550B-A55Bを公開した。GTC Taipei 2026の基調講演で「アメリカ最強のオープンモデル」と紹介された同モデルだが、報道の論調は「中国製オープンLLMに Intelligence Index で及ばない（48点 vs Kimi K2.6 の54点）」という比較に偏っている。本記事ではその論調を離れ、**「なぜこのモデルが『長時間自律エージェント時代』のデータセンター設計思想と整合するのか」**という観点から読み解く。TCO（総保有コスト）、MOPD学習法、OpenMDW-1.1ライセンス、ソブリンAI展開まで、日本企業のAIエンジニアが意思決定するための材料をコード例と試算とともに整理する。 1. モデル仕様の再確認：「サイズ」ではなく「役割」で理解する Nemotron 3 ファミリーは Nano（30B-A3B）/ Super（120B-A12B）/ Ultra（550B-A55B）の3層構造を取る。Nano と Super は DGX Spark 128GB のユニファイドメモリで手元運用できる「日常のモデル」だが、Ultra はそもそもターゲットが異なる。NVIDIA 技術ブログは「シングルターンのチャットボットから long-running agent への進化」を前提に Ultra を位置づけている。項目 Ultra 仕様総パラメータ 550B トークンあたり稼働 55B（MoE）アーキテクチャ Mamba-2 + Transformer + LatentMoE のハイブリッドコンテキスト長 1M トークン学習トークン約20T（NVFP4 レシピ）ライセンス OpenMDW-1.1（Linux Foundation、商用利用可）量子化後重みサイズ約335GB（NVFP4）必要 VRAM 600GB 超（4×B200 または 8×H100 80GB）対応 GPU Ampere / Hopper / Blackwell（単一チェックポイントで動作）サポート言語英仏西伊独日韓ヒンディー葡中（日本語を含む10言語）重要なのは「動くかどうか」ではない。「どの規模の問題を、何時間止めずに回し続けられるか」が設計の出発点にある。Hugging Face モデルカードで公開されている GA v1.0 は、4 種類のチェックポイント（Base-BF16 / Post-trained BF16 / NVFP4 / GenRM）を揃え、NVIDIA AI Enterprise 90 日無料評価 + 商用ラインセンス + 完全なオープン性が同居する。 ...