<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>投機的デコード on Appwright AI</title>
    <link>https://ai.appwright.xyz/tags/%E6%8A%95%E6%A9%9F%E7%9A%84%E3%83%87%E3%82%B3%E3%83%BC%E3%83%89/</link>
    <description>Recent content in 投機的デコード on Appwright AI</description>
    <generator>Hugo</generator>
    <language>en-US</language>
    <lastBuildDate>Wed, 10 Jun 2026 19:00:00 +0800</lastBuildDate>
    <atom:link href="https://ai.appwright.xyz/tags/%E6%8A%95%E6%A9%9F%E7%9A%84%E3%83%87%E3%82%B3%E3%83%BC%E3%83%89/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Xiaomi MiMo-V2.5-Pro-UltraSpeed完全解説：汎用8GPUで1Tモデル毎秒1000トークン、FP4&#43;DFlash&#43;TileRTの「ソフトウェアだけでCerebrasに勝つ」設計を読み解く</title>
      <link>https://ai.appwright.xyz/posts/2026-06-10-mimo-v2-5-pro-ultraspeed-1000tps/</link>
      <pubDate>Wed, 10 Jun 2026 19:00:00 +0800</pubDate>
      <guid>https://ai.appwright.xyz/posts/2026-06-10-mimo-v2-5-pro-ultraspeed-1000tps/</guid>
      <description>Xiaomiが2026年6月8日に発表したMiMo-V2.5-Pro-UltraSpeedを、FP4量子化・DFlash投機的デコード・TileRTランタイムの3層アーキテクチャから徹底解説。CerebrasやGroqなど専用ハードウェアなしで1Tパラメータ・1000tok/sを実現した技術的ブレイクスルーを、Hugging Face公開ウェイトのSGLang/vLLMデプロイコード付きで日本語エンジニア向けに整理する。</description>
    </item>
  </channel>
</rss>
