Anthropic

Project Glasswing初回アップデート完全解説：Mythosが1万件以上の脆弱性を発見、パッチボトルネックという新たな問題

2026年5月22日、AnthropicはProject Glasswingの初回進捗レポートを公開した。これは、Claude Mythos Previewを用いた脆弱性発見の共同プロジェクトであり、わずか1ヶ月で50以上のパートナー組織が共同で1万件以上の高・重大度脆弱性を発見したことを報告している。本稿は、当サイトで既に公開した Claude Mythos Preview徹底解説および AIセキュリティ時代のCTF変容に続く、Mythosセキュリティ三部作の完結編として、Project Glasswingの具体的な成果と、そこから浮かび上がる新たな課題を詳述する。 Project Glasswingとは Project Glasswingは、Anthropicが2026年4月に立ち上げた、AIを活用したソフトウェア脆弱性対策の共同プロジェクトである。Apple、Microsoft、Google、Cloudflare、Mozilla、IBM、Palo Alto Networks、Oracle、Ciscoなど、ソフトウェアエコシステムの最重要プレイヤーが参加し、Claude Mythos Preview（SWE-bench Verified 93.9%）の脆弱性発見能力を実際のセキュリティ業務に適用している。初回アップデートが示した衝撃的なデータ 1. パートナーによる脆弱性発見：10,000件超プロジェクト開始から1ヶ月で、50以上のパートナー組織がMythos Previewを用いて10,000件以上の高・重大度脆弱性を発見した。特筆すべきは、もはや「脆弱性を見つける」ことがボトルネックではなくなったことだ。Anthropicのレポートは明確に述べている：「ソフトウェアセキュリティの進歩は、かつては新しい脆弱性をいかに速く見つけるかに制限されていた。今やそれは、AIが見つけた大量の脆弱性をいかに速く検証・開示・修正するかに制限されている。」 2. オープンソーススキャン：1,000リポジトリ、23,019件の脆弱性 Anthropicが独自に実施したオープンソースソフトウェアスキャンでは、1,000以上のOSSプロジェクトを対象にMythos Previewが脆弱性を検索。その結果は以下の通りだ：指標数値スキャン対象リポジトリ 1,000以上発見された脆弱性総数 23,019件推定高・重大度（内訳） 6,202件トリアージ済み（第三者セキュリティ企業またはAnthropic検証） 1,752件うち真陽性（90.6%） 1,587件確認された高・重大度 1,094件（62.4%）メンテナに開示済み 530件修正済み 75件うち公開アドバイザリ発行 65件真陽性率90.6% という驚異的な精度は、従来の静的解析ツールや人手によるコードレビューを大幅に上回る。Anthropicはこのペースが続けば、約3,900件の検証済み高・重大度脆弱性に到達すると見積もっている。 3. パートナー各社の具体的な成果 CloudflareはMythos Previewを用いて2,000件のバグ（うち400件が高・重大度）を発見。偽陽性率は人間のテスターを下回った。Cloudflare自身のブログでも詳細な技術分析が公開されている。 Mozillaでは、Firefox 150のコードベースをMythos Previewがスキャンし、271件の脆弱性を発見。これは従来のClaude Opus 4.6がFirefox 148で発見した件数の10倍以上である。 Palo Alto Networksは、Mythosを活用したリリースで、通常の5倍のパッチを1回のリリースに含めた。 Microsoftは、パッチボリュームが「今後も増加傾向が続く」と報告している。 Oracleは、脆弱性の検出と対応が「複数倍高速化」したと表明。 wolfSSLでは、Mythos Previewが証明書偽造を可能にする脆弱性を発見し、実際にエクスプロイトを構築することに成功した（CVE-2026-5194、既に修正済み）。 ...

KPMGがClaudeを27万6千人に展開：PwCに続くBig4のAI革命、専門サービス業界の変容

KPMG、Anthropicとグローバル戦略提携—276,000人へのClaude展開 2026年5月19日、KPMGとAnthropicはグローバル戦略提携を発表した。世界138カ国に展開するBig4の一角、KPMGが約276,000人の全従業員にClaudeを提供し、主要なクライアントデリバリープラットフォーム「Digital Gateway」にAnthropicのAIを直接組み込むという、これまでにない規模のエンタープライズAI導入である。この提携は、わずか2週間前に発表されたPwCとAnthropicの拡大提携（Claude Cowork/Coder全世界展開、30,000人の認定専門家）に続く、Big4業界における2件目の大型AIコミットメントとなった。専門サービス業界におけるAI導入競争が、実質的に「全社規模」のフェーズに入ったことを示している。本稿では、KPMG × Anthropic提携の詳細、PwC提携との比較、そして日本のエンタープライズ業界への示唆を分析する。発表内容の全体像 Digital Gateway Powered by Claude KPMGの既存プラットフォーム「Digital Gateway」（Microsoft Azure上で稼働）に、AnthropicのClaudeを直接埋め込む。これにより： Claude Cowork：ドキュメント・ワークフローを横断した協調型AIアシスタントをプラットフォーム内で利用可能に Managed Agents API：自律的なマルチステップタスク実行をクライアント業務に直接統合従来は数週間かかっていた税務規制変更対応のAIエージェント構築が数分に短縮される KPMG USのVice Chair of Tax、Rema Serafiは次のように述べている：「規制変更に対応するAIエージェントの構築は、以前は数週間かかり、複数のツールやチャットウィンドウを行き来する必要がありました。CoworkとManaged AgentsがDigital Gatewayに統合された今、同じ作業が数分で完了します。これはまったく新しい働き方です。」 PE特化：KPMG Blaze with Claude Code AnthropicはKPMGをプライベートエクイティ向けPreferred Consultantに指定した。新製品「KPMG Blaze」はClaude Codeを活用し、PEファンドのポートフォリオ企業におけるレガシーITシステム近代化を加速する。従来6〜12カ月を要したシステム刷新が、コード生成・リファクタリングにより数週間に短縮される可能性がある。サイバーセキュリティへの応用 KPMGとAnthropicのチームは、Claudeを使用してクリティカルシステムの脆弱性を発見・修正する。すべての作業はKPMGのTrusted AIフレームワークに基づいてガバナンスされる。なぜこの提携が重要なのか 1. プラットフォーム統合型AIの勝利 KPMGのアプローチが他と決定的に異なるのは、AIを既存のプロダクションプラットフォームに埋め込んだ点だ。多くの企業が「AIチャットボットを横付けする」段階にいるのに対し、KPMGは日常業務のワークフローそのものにAIを統合した。 Enterprise DNAは次のように評している：「ビジネスがAIを別レイヤーとして運用しているなら、最も速く動いている企業はAIを中核ワークフローに直接埋め込んでいる。」 2. エージェントベースの業務が現実になった単なるチャットインターフェースではなく、Managed Agentsが規制変更に自律的に対応する。この「AIアシスタンス」から「AI実行」への移行は、エンタープライズAI導入の質的転換点といえる。 KPMGの事例では、税務申告業務におけるAIエージェントの構築が「数週間→数分」に短縮された。これは単なる効率化ではなく、これまで不可能だった業務の実行を可能にする能力である。 3. プロフェッショナルサービス業界はAI慎重期を脱した Big4の一角が税務・法務という規制の厳しい領域でClaudeを本格導入したことは、リスク評価の転換点を示している。AnthropicのDaniela Amodeiも「KPMGは精度、説明責任、信頼がオプションではない業界で、全社的なAIコミットメントを示している」と述べている。 PwC提携との比較：Big4 AI競争の構図 KPMGの発表は、2026年5月18日に発表されたPwCのAnthropic提携拡大からわずか1日後というタイミングだった。両者を比較することで、Big4業界のAI導入競争の実態が見えてくる。項目 KPMG × Anthropic PwC × Anthropic 発表日 2026年5月19日 2026年5月18日（拡大提携）対象人数 276,000人（全世界）数十万人規模（グローバル）認定専門家数未公表（段階的展開） 30,000人主要プラットフォーム Digital Gateway（Azure） PwC独自プロセス（Azure）重点領域税務、PE、サイバーセキュリティ監査、税務、コンサルティング全般主要製品 KPMG Blaze（Claude Code） Claude Code/Cowork全社展開展開完了目標 2026年9月未公表研究連携テキサス大学マコームズ校未公表両者の最大の違いはアプローチにある。PwCが「水平展開（全社ツール＋認定制度）」を重視するのに対し、KPMGは「垂直統合（Digital Gateway＋PE特化）」を取っている。Anthropicにとっては、Big4のうち2社と大型契約を結んだことになる。PwC（監査・コンサルティング）、KPMG（税務・PE）と役割分担が明確であり、残るDeloitteとEYへの波及効果も確実視される。 ...

Andrej KarpathyがAnthropicに合流：RSIへの布石、プレトレーニング革命、人材戦争の決着

Karpathy、Anthropicへ—AI業界最大の電撃人事 2026年5月19日、Andrej Karpathyが自身のXアカウントでAnthropicへの参加を発表した。OpenAIの11人の共同創業者の一人であり、TeslaのAIディレクターを歴任し、「Vibe Coding」の名付け親としても知られるKarpathyは、AI業界で最も影響力のある研究者の一人だ。彼のXポストは18.7Mビューを記録し、Hacker Newsでは1,205ポイント、499コメントが集まった。 KarpathyはAnthropicのプレトレーニングチームに加わり、Nick Joseph（Anthropicプレトレーニング責任者、元OpenAI）の下で「Claudeを使ってプレトレーニング研究を加速する」チームを立ち上げる。これは単なる人材の移動ではない。Anthropicが**再帰的自己改善（Recursive Self-Improvement, RSI）**への本格的な布石を打った瞬間であり、OpenAIとAnthropicの間で続いてきた人材戦争に一つの区切りがついたことを意味する。 Karpathyとは何者か—3つの顔を持つ異才 Karpathyのキャリアパスを追うと、彼が「AI業界のレジェンド」と呼ばれる理由がわかる。フェーズ1：アカデミアとOpenAI（2015-2017）スタンフォード大学でFei-Fei Liの下で博士号を取得。CS231n（深層学習とコンピュータビジョン）を共同創設し、業界全体の教育に貢献した。2015年、OpenAIの11人の共同創業者の一人としてAI研究の最前線に立つ。フェーズ2：Tesla時代（2017-2023） Elon Muskに引き抜かれ、TeslaのAIディレクターとしてAutopilotのコンピュータビジョンチームを統率。自社のデータラベリングパイプラインからニューラルネットワーク学習、カスタム推論チップへのデプロイまで、大規模AIシステムのエンドツーエンドを経験した。フェーズ3：独立研究者・教育者（2024-2026） OpenAIを再び離れた後はEureka Labsを設立し、AI教育に注力。nanoGPT、microGPTなどの教育用プロジェクトを公開。何より注目すべきは、彼が2026年3月に公開したAutoResearchプロジェクトだ。Karpathyは自身のXで、AutoResearchが自律的に700件のアーキテクチャ変更を実行し、学習効率を11%向上させたと報告している。このプロジェクトの核心は、たった630行のPythonコードで実装された自律研究エージェントが、人間の介入なしに深層学習の実験を回し続ける点にある。 RSIの実態：「Claudeでプレトレーニングを加速する」とは AnthropicがKarpathyに任せようとしているのは、以下のようなループだ：現在のClaudeモデルに、次世代のトレーニングパイプラインを設計させる Claudeが提案した改善（データミックス比率、学習率スケジュール、アーキテクチャ変更など）を自動テスト効果のあった改善を本番トレーニングに反映改善された次世代モデルが、さらに良い改善を提案できるようになるこのサイクルが機能すれば、各世代のモデルが次のモデルをわずかに効率化し、その効果が複利的に積み上がる。Anthropicの共同創業者Jack ClarkはImportAIニュースレターで、「2028年末までに人間の介在なしにAI R&Dが自律的に回る確率は60%以上」と述べている。これがRSI（Recursive Self-Improvement）の実体であり、KarpathyのAutoResearchはこの概念を小規模で実証済みのプロトタイプだ。 AutoResearchの仕組み—コードで見る自律研究ループ KarpathyのAutoResearchのアーキテクチャは驚くほどシンプルだ。以下に概念的な実装を示す： # Karpathy's AutoResearch: 概念的な自律研究ループ def autoresearch_loop(initial_model_code, train_script, max_iterations=100): best_loss = float('inf') best_code = initial_model_code for i in range(max_iterations): # Step 1: AIがコードを分析し、改善案を提案 proposal = claude.analyze_and_propose( current_code=best_code, recent_results=training_history[-5:] ) # Step 2: 提案を適用した実験コードを生成 experiment_code = claude.apply_modifications(best_code, proposal) # Step 3: 5分間のトレーニング実験を実行 result = run_training(experiment_code, train_script) # Step 4: 結果を評価 if result.val_loss < best_loss: best_loss = result.val_loss best_code = experiment_code print(f"Iteration {i}: Found improvement → val_loss: {result.val_loss:.4f}") training_history.append(result) return best_code, best_loss この単純なループが、2日間で276件の実験を自律実行し、29件の有効な改善を発見した。注目すべきは、各イテレーションでClaudeが過去の実験結果の系列を見て次の改善を計画している点だ。これは単なるランダムサーチではなく、経験に基づくメタ学習である。ShopifyのCEO Tobias Lütkeもこの手法を社内データに適用し、37実験で19%の性能向上を報告している。 ...

AnthropicがStainlessを3億ドルで買収：OpenAIとGoogleのSDK基盤を掌握する「インフラ拒否」戦略

3億ドルの「インフラ拒否」—何が起きたのか 2026年5月18日、AnthropicはSDK（Software Development Kit）自動生成ツール企業 Stainless の買収を発表した。買収額は 3億ドル超と報じられている（The Information）。一見すると地味な「開発ツールの買収」だが、この取引の本質は AI業界のインフラ層を支配するという、これまでにない戦略的動きだ。 Forbesはこの買収を「モデル戦争」ではなく「インフラ拒否（infrastructure denial）プレイ」と評している。その核心にあるのは、StainlessがOpenAIやGoogleといった競合他社のSDKも生成していたという事実だ。 Stainlessとは何者か Stainlessは2022年に元Stripeエンジニアの Alex Rattray がニューヨークで創業したスタートアップだ。同社の製品は、API仕様書（OpenAPI Specification）から自動的にプロダクション品質のSDKを生成する。対応言語は以下の通り： Python TypeScript Go Java Kotlin そして何より注目すべきは、Stainlessの顧客リストだ。OpenAI、Google、Meta、Cloudflare、Replicate、Runway、そしてAnthropic自身が含まれる。開発者が pip install openai や npm install @google/generative-ai を実行したときにインストールされるパッケージは、Stainlessの生成ツールによって作られていたのである。なぜこれが重要なのか：インフラ拒否のメカニズム Anthropicは買収後、Stainlessのホステッドプロダクトをすべて終了すると発表した。既存顧客が生成したSDKの所有権と修正権はそのまま保持されるが、新たな生成エンジンは利用できなくなる。つまり： OpenAIとGoogleは、自社SDKの生成基盤を失う今後は自前でSDK生成パイプラインを構築するか、SpeakeasyやKonfig、Fernなどの代替ツールに移行する必要がある開発者が体験する「APIの品質」という接点を、Anthropicが間接的にコントロールすることになるこの戦略の巧妙さは、モデル競争ではなく開発者エコシステムの接点を支配する点にある。Anthropicのプラットフォームエンジニアリング責任者Katelyn Lesseは次のように述べている：「エージェントは接続できる先があって初めて有用になる。Stainlessチームを迎え入れることで、Claudeのデータやツールへの接続能力をさらに強化していく」 AnthropicのM&A戦略：6ヶ月で4社買収 Stainless買収は、Anthropicのここ6ヶ月における 4件目の買収だ。過去の買収と合わせて見ると、戦略の全体像が浮かび上がる：企業買収時期役割 Bun 2026年初頭 JavaScriptランタイム → Claude Codeの高速化 Vercept 2026年前半コンピュータ操作技術 → Claude Computer Useの基盤 Coefficient Bio 2026年創薬AIチームの内製化 Stainless 2026年5月 SDK/API接続基盤 → エージェントエコシステムの根幹これらの買収に共通するのは、「モデルを作る会社」から「プラットフォームを組む会社」への変貌だ。Anthropicは単なるLLMプロバイダではなく、AIエージェントが動作するためのインフラ全体を垂直統合しつつある。開発者への実質的な影響 OpenAIとGoogleの立場両社は潤沢な資金と優秀なエンジニアリングチームを持つ。SDK生成を内製化するのは時間の問題だろう。しかし課題もある： ...

Anthropic、評価額9000億ドルへ：38日で2.4倍、AIインフラ投資競争の全貌

2026年5月、AI業界に衝撃的なニュースが駆け巡った。Anthropicが評価額9000億ドル（約144兆円）超で新たな資金調達ラウンドの条件合意に至り、今月中にもクローズする見込みとなったのだ。Sequoia Capital、Dragoneer Investment Group、Greenoaks Capital、Altimeter Capitalが共同リードするこの300億ドル（約4.8兆円）のラウンドは、2月の3800億ドル評価額からわずか3ヶ月での「倍増以上」を意味する。この数字の規模感を理解するために、Anthropicの評価額推移を振り返ってみよう。 14ヶ月で16倍：前代未聞のバリュエーション成長 Anthropicの評価額は以下の軌跡を描いてきた：時期ラウンド評価額調達額 2024年1月 — 180億ドル — 2025年3月 Series E 615億ドル 35億ドル 2025年9月 Series F 1,830億ドル 130億ドル 2026年2月 Series G 3,800億ドル 300億ドル 2026年4月セカンダリー ~9,000億ドル（暗示） — 2026年5月交渉中 9,000億〜1兆ドル 500億ドルわずか14ヶ月で評価額は約16倍に拡大。同じ期間にOpenAIは8520億ドルで足踏みしており、Anthropicは2026年5月時点で世界で最も価値のあるAIスタートアップの座を掴もうとしている。収益の爆発的成長：9B→45Bドルへの6ヶ月この評価額を支えているのは、前例のない収益成長だ。 2025年末：年間経常収益（ARR）約90億ドル 2026年3月：ARR約300億ドル（一部の情報源は400億ドルに近いと推定） 2026年5月：ARR約450億ドル（年間換算）わずか6ヶ月で5倍の成長だ。この成長の原動力は、Claude Codeを中心としたエンタープライズ製品にある。Claude Codeだけで2026年2月時点で年間25億ドルのラン�ンレートを達成。AIコーディング市場の54%のシェアを占めている。さらに、年間100万ドル以上をClaudeに支払う企業が1,000社を超え、Fortune 10のうち8社が顧客となっている。70%以上の新規エンタープライズ顧客がAnthropicを選択しているというデータは、市場の明らかなシフトを示している。 300億ドルラウンドの詳細：誰が、なぜ、今なのか今回のラウンドの注目すべき特徴は、投資家構成の変化だ。共同リード投資家： Sequoia Capital Dragoneer Investment Group Greenoaks Capital Altimeter Capital 重要なポイント：これまでの大口投資家であったAmazon（累計80億ドル以上）やGoogle（評価額3500億ドルで最大400億ドルまで拡大可能）は今回のラウンドには不参加と見られている。これは、Anthropicがビッグテックの傘から独立した存在として評価を受け始めたことを示唆する。一方、セカンダリーマーケットでは既に1兆ドルの含み評価で取引が行われており、一部の初期投資家は今回のラウンドをスキップしてIPOを待つ戦略を取っている。 Claudeエコシステムが体現する「プロダクト主導の価値創造」 AmazonやGoogleからの巨額投資は確かに注目を集めた。しかし、今回の9000億ドル評価額の真の原動力は、Claude製品群の有機的な成長にある。 Claude Opus 4.7（2026年4月）：コーディング性能向上、3倍のビジョン性能、価格据え置き Claude Cowork（2026年1月）：公開ソフトウェア株2,850億ドルの売りを引き起こした破壊的製品 Skills（2026年3月）：統一拡張レイヤー、全ヘビーユーザーが10以上のスキルを利用 Managed Agents（2026年4月β版）：プロダクションAIエージェントの信頼性問題を解決 Microsoft 365 Connector：Microsoft Copilotを実質的に置き換え、全Claudeプランに標準搭載それぞれの製品が独立した収益源として機能し、エコシステム全体の価値を押し上げている。 ...

PwCがClaudeを数十万人規模で展開：世界最大のプロフェッショナルサービスAI変革と70%納期短縮の実態

PwC（プライスウォーターハウスクーパース）とAnthropicは2026年5月14日、戦略的提携の大幅拡大を発表した。この提携により、Claude CodeとClaude CoworkがPwCの米国チームを皮切りに、数十万人規模のグローバル人材へ展開される。最大のインパクトは、PwCが「Customer Zero」として自社業務でClaudeを実践した上で、クライアント向けのAIネイティブ変革サービスとして提供する点だ。本稿では、この提携の詳細、具体的な成果、そして日本のAIエンジニアや企業が学べる教訓を整理する。提携の全体像 PwCとAnthropicの拡大提携は、以下の3つの柱で構成される： 1. エージェンティック技術開発（Agentic Technology Build） PwCのエンジニアリングチームがClaude Codeを使用し、金融サービス、ライフサイエンス、ヘルスケア、コンシューマー市場向けのプロダクションソフトウェアを「週単位ではなく週単位」で出荷する体制を構築。従来のSI型開発と比較して劇的なスピード向上を実現している。 2. AIネイティブなディールメイキング（AI-Native Deal-Making）プライベートエクイティや企業買収の領域で、デューデリジェンス、バリュー創造、ポストマージャー統合にAIエージェントを導入。ディールチームとAIエージェントが協働し、投資テーゼから価値獲得までのプロセスを圧縮する。 3. エンタープライズ機能の再発明（Enterprise Function Reinvention）財務、サプライチェーン、人事、エンジニアリングの中核業務にAIネイティブなオペレーティングモデルを適用。規制産業（銀行、保険、ヘルスケア）を最初のターゲットとし、正確性と監査可能性を重視した設計が特徴だ。 Office of the CFO：最初の専用ビジネスユニット本提携で最も注目すべきは、PwCが「Office of the CFO」という独立したビジネスグループを設立したことだ。これはAnthropicの技術を中核に据えた初のスタンドアロンビジネスユニットであり、以下の業務を対象とする：仕訳入力と差異分析の自動化 RFP（提案依頼書）のAIネイティブ処理年間計画策定の最適化国際給与計算の運用効率化 PwCは自社のCFO機能でこれらのツールを実践した後、クライアントに展開している。さらに興味深いのは、PwCがAnthropic自身のCFOオフィスの業務拡大とコントロール強化を支援した点だ。両社が互いの強みを活かして相手を支援する「相互顧客」関係が成立している。具体的な成果：最大70%の納期短縮 PwCが発表した実績は、単なるPoC（概念実証）の域を超えている：領域成果保険引受 10週間→10日間（90%短縮）。従来経済的に成立しなかった保険商品ラインの開拓が可能にサイバーセキュリティインシデント対応が数時間から数分に。コードレビューや自動コンテインメントによる脆弱性運用を実現メインフレーム近代化想定の4倍の規模のCOBOLコードベースを予算内・期限内で移行 HR変革頓挫していたプログラムを1週間でプロトタイプ作成、2ヶ月未満で本番アプリをリリース。現在は日次数千トランザクションを処理プロスポーツ運営デジタルファンエンゲージメントとエージェンティックなスポーツマネジメントを刷新トレーニングと人材投資 PwCは30,000人のプロフェッショナルをClaude認定資格プログラムでトレーニングする計画を発表。同時に、PwCとAnthropicの共同Center of Excellence（CoE）を設立し、以下の領域で知識を蓄積・展開する：規制産業におけるClaude導入のベストプラクティス業界特化型のClaudeテンプレートとワークフローの標準化リスク管理とコンプライアンスのフレームワーク開発 PwCの社内AIツール「ChatPwC」にClaudeが統合され、財務、サプライチェーン、ディールメイキングのアクティブエンゲージメントで稼働中である。提携の戦略的含意本提携が示唆するのは、エンタープライズAIが「実験段階」から「本番実装段階」に移行したという事実だ。AnthropicのDario Amodei CEOは次のように述べている：「PwCは正確性と信頼性が絶対条件である経済領域にAIを拡大する取り組みを主導してきた。10週間かかっていた保険引受が10日になった。数時間かかっていたセキュリティ業務が数分になった。PwCの数十万人のプロフェッショナルにClaudeを届けられることを嬉しく思う。」 PwC USのPaul Griggs CEOも次のように補足する：「AIに関する議論は可能性から実行へと移行した。クライアントは安全で説明責任があり、複雑なビジネス環境で測定可能な成果を出せるAIの適用方法を求めている。」この提携から日本のAIエンジニアや企業が学べるポイントは3つある： AI導入は「スコープを絞ったPoC」から「業務機能単位の全面展開」へ — PwCがOffice of the CFOという独立ユニットを作ったのが戦略的に正しい。一つの業務機能を丸ごとAIネイティブに再設計することで、測定可能なROIを出しながら学習を蓄積できる。 ...

Claude for Small Business入門：15のエージェンティックワークフローが変える中小企業のAI活用

2026年5月13日、Anthropicは中小企業向けの新製品 Claude for Small Business を発表した。これは単なる新しいチャットボットの階層ではない。QuickBooks、PayPal、HubSpot、Canva、DocuSign、Google Workspace、Microsoft 365、Slack——中小企業が日常的に使うツールの中にClaudeを組み込み、給与計算、請求書管理、キャンペーン実行、契約書レビューなどを自律的に実行させる製品だ。米国の中小企業はGDPの44％、民間労働力の約半分を占める。しかし、これまでAI導入の恩恵を最も受けにくいセグメントでもあった。エンタープライズ向けのAIは年数万ドル単位のコストと専任のITチームを前提としており、従業員数名〜数十名の中小企業には手が届かなかった。Claude for Small Businessは、このギャップを埋める最初の本格的な製品である。本記事では、既存の日本語ニュース記事とは異なり、実際に導入する立場から、製品の全体像、意思決定ツリー、信頼境界テーブル、具体的なセットアップ手順を解説する。日本の中小企業経営者や、AI導入を検討するスタートアップにとって、実践的な判断材料となることを目指す。 Claude for Small Businessの全体像 3つの構成要素 Claude for Small Businessは、Claude Cowork上で動作するトグルインストール型のパッケージであり、以下の3つのレイヤーから構成される。 Connectors（8つのツール連携）：QuickBooks、PayPal、HubSpot、Canva、DocuSign、Google Workspace、Microsoft 365、Slackとの双方向連携。単なるAPIラッパーではなく、Claudeが各ツールのコンテキストを読み取り、アクションを提案し、ユーザーの承認を得て実行する。 15のAgentic Workflows（エージェンティックワークフロー）：財務、営業、マーケティング、カスタマーサービス、人事をカバーする定型業務フロー。例えば給与計算の場合、QuickBooksの現金残高とPayPalの入金情報を照合し、30日間の資金予測を作成し、未払い請求書に優先順位をつけて督促メールのドラフトまで生成する。 15のSkills（スキル）：キャッシュフロー予測、競合分析、ミーティング要約、経費カテゴリ分類など、単発で呼び出せる機能。実行フローすべてのワークフローは以下の6ステップで実行される。ユーザーが開始：ワークフローを選択（例：「給与計算を計画する」）コンテキスト収集：Claudeが接続されたツールから関連データを取得計画生成：Claudeがアクションプランと説明をドラフト人間の承認：ユーザーがレビューし承認するまで何も実行されない実行：Claudeがツールに書き戻し（支払いスケジュール、メールキューなど）監査証跡：すべてのアクションが何を、いつ、なぜ実行したか記録される意思決定ツリー：最初のワークフローをどう選ぶか 15のワークフローがあるとはいえ、「どこから始めればいいか」が最大の課題だ。以下の意思決定ツリーを使って、自社の状況に最適な最初のワークフローを選んでほしい。自社の最も深刻な課題は何か？ │ ├─ 💰 キャッシュフローが読めない │ → Invoice Chaser + Cash-Flow View │ （QuickBooksとPayPalを接続、承認必須モードで運用） │ ├─ 📉 売上が伸び悩んでいる │ → Campaign Analysis + Lead Triage │ （HubSpotを最初に接続） │ ├─ 🔥 業務がカオスで全体が見えない │ → Business Pulse + Weekly Commitments │ （読み取り専用、習慣化が目的） │ ├─ 📄 契約書レビューがボトルネック │ → Contract Reviewer + Docusign Follow-Through │ （アクションリスクが低い） │ └─ ❓ データが整っていない → まずデータクレンジング。Business Pulseを信頼できるデータソースだけで実行。Margin Analyzerは後回し。重要な注意点：データが汚い状態でワークフローを動かすと、アウトプットの品質が保証できない。QuickBooksの勘定科目が整っていない場合、まず会計データのクレンジングを優先すべきだ。 ...

Claude Mythos Preview徹底解説：AIがゼロデイ脆弱性を自律発見する時代のセキュリティパラダイムシフト

はじめに：サイバーセキュリティの分岐点 2026年4月7日、Anthropicは次世代モデル「Claude Mythos Preview」を発表した。しかし同社は同時に、このモデルを一般公開しないと宣言した。理由は「前例のないサイバーセキュリティリスク」だ。本記事では、Claude Mythos Previewを技術的事実に基づいて解説し、その能力・リスク・論争・そして日本の開発チームが今取るべき対策を、バランスの取れた視点で提供する。既存の日本語記事の多くは発表内容の紹介に留まっているが、本記事では賛否両論を包含した分析と実践的な対策コードを提供する点で差別化している。 Claude Mythos Previewとは何か Claude Mythos Previewは、Anthropicが開発した新しい汎用言語モデルである。「Mythos」は世代名（Claude 4に相当）、「Capybara」は階層名（Opus/Sonnet/Haikuに相当）という2層構造の命名で、正式には「Claude Mythos Capybara」となる見込みだ。最も特筆すべき点は、そのサイバーセキュリティ能力がコーディング能力の副産物として副次的に出現したことである。Anthropicは「意図的に訓練した能力ではない」と明言している。これは、モデルのスケーリングによって予期せぬ能力が創発するという、AI安全性研究で長年議論されてきたシナリオが現実になった事例と言える。ベンチマーク：何が「異常値」なのか Anthropicが公開したシステムカードによると、Mythos PreviewはOpus 4.6と比較して以下のスコアを示している：ベンチマーク Mythos Preview Opus 4.6 改善幅 SWE-bench Verified 93.9% 80.8% +13.1pp SWE-bench Pro 77.8% 53.4% +24.4pp SWE-bench Multilingual 87.3% 77.8% +9.5pp Terminal-Bench 2.0 82.0% 65.4% +16.6pp CyberGym (脆弱性再現) 83.1% 66.6% +16.5pp GPQA Diamond 94.6% 91.3% +3.3pp BrowseComp 86.9% 83.7% +3.2pp SWE-bench Verifiedの93.9%は、2025年4月時点での最高スコア（Opus 4.6の80.8%）から13ポイント以上の飛躍であり、従来のモデル改善ペース（通常1-3pp）を大きく超えている。しかし、この数字には注意が必要だ。SWE-benchは特定の条件下でのバグ修正能力を測定するものであり、実環境でのソフトウェア開発能力を完全に反映するものではない。発見された脆弱性：実例から見る能力の本質 27年越しのOpenBSDバグ最も象徴的な事例は、OpenBSDのTCP SACK処理に潜んでいた27年越しの脆弱性である。RFC 2018（1996年策定）で定義された Selective Acknowledgment 機構に、二つのバグが連鎖して存在していた： ...

Claudeが2026年に出荷したすべて：Opus 4.7、Dreams、Agent Teams、1Mコンテクスト——Anthropic最新エコシステム完全ガイド

はじめに：年に2週間のペースで進化するClaude Anthropicは2026年、約2週間に1回のペースで主要リリースを続けている。「数週間目を離すと何が起きたか分からなくなる」——これはAnthropicのペースを象徴する言葉だ。本稿では、2026年5月時点でClaudeエコシステムがどのような状態にあるのか、すべての主要コンポーネントを体系的に整理する。モデルラインナップ：Opus 4.7が頂点に Claude Opus 4.7（2026年4月16日リリース）現時点で一般利用可能な最も高性能なモデル。SWE-bench Proで**64.3%**を記録し、GPT-5.4（57.7%）やGemini 3.1 Pro（61.2%）を上回る。特筆すべき改善点は以下の通り： 3倍のビジョン解像度：最大3.75MP（2,576px長辺）に対応。画像解析パイプラインで前処理不要に xhigh reasoning：従来のhighとmaxの間の新たな推論レベル。多くのタスクでmax同等の品質を低レイテンシで実現タスク予算（Task Budgets, ベータ）：自律エージェントのトークン消費にハードキャップを設定可能価格は据え置き：入力$5/100万トークン、出力$25/100万トークン Opus 4.6から価格変更なしの実質アップグレード。エージェントパイプラインを稼働中のチームにとっては「無料の性能向上」と言える。 Claude Sonnet 4.6（2026年2月17日リリース） 1Mコンテクスト対応の主力モデル。Sonnet 4.5比で30〜50%高速化し、日常的なコーディングやエージェントワークフローではOpusに匹敵する品質を約40%低いコストで提供する。 Claude Haiku 4.5 高速・低コストのサブエージェント向けモデル。ただしプロンプトインジェクション対策がないため、信頼できない入力を扱うエージェント構成では注意が必要。 1Mトークンコンテクスト：標準料金化という転換点 2026年3月13日、Anthropicは200Kトークンを超える長いコンテクストに対するプレミアム課金を撤廃した。現在は全コンテクスト長に標準レートが適用される。ベンチマークではOpus 4.6が**1Mトークン時でMRCR v2 78.3%**を記録。GPT-5.4（36.6%）、Gemini 3.1 Pro（18.3%）を大きく引き離す。実際には200Kを超えるとOpusでも品質が劣化し始めるため、推奨される実用上限は200K〜400K程度。単発の大規模ドキュメント解析には有効だが、ルーティンの会話セッションでは200K以内に留めるのが現実的だ。 4つのモード：Chat / Cowork / Code / Projects Claudeには現在4つの動作モードがあり、用途に応じて使い分ける：モード用途特徴 Chat ブラウザ／モバイルクイッククエリ、ブレインストーミング、下書き Cowork デスクトップエージェント実際のファイルを読み書き、マルチステップタスクを自律実行 Code ターミナルコードベースを認識し、コード記述・コマンド実行・git操作 Projects 保存済みワークスペースファイルと指示をアップロードし、セッション間でコンテクストを永続化よくある間違いはすべての作業をChatで済ませようとすること。実際のファイル操作にはCoworkまたはCodeを使うべきで、これだけで作業効率が劇的に変わる。 Claude Codeの主要新機能 Code Review（コードレビュー） Claude CodeがPRの変更をレビューし、インラインコメントを自動生成する。レビュアーの負荷を軽減しつつ、バグやセキュリティ問題を早期発見できる。 CI Auto-Fix（CI自動修正） CIが失敗した時、/autofix-pr コマンド一つでClaude Codeがエラーログを解析し、修正コードを生成、PRとして提案する。CI/CDパイプラインと直接連携し、開発者が修正を待つ時間をゼロにする。 ...

Claude Managed Agents入門：Anthropicが提供するAIエージェントの完全マネージド実行環境

はじめに：Managed Agentsが解決する課題 AIエージェントをプロトタイプから本番運用に移行するには、通常3〜6ヶ月のインフラ構築が必要だった。サンドボックス実行環境、状態管理、認証情報の安全な取り扱い、エラーリカバリ、コンテキスト管理、ツールオーケストレーション——これらをすべて自前で実装するのは、大企業のチームでも容易ではない。 2026年4月8日、Anthropicはこの課題を根本的に解決するClaude Managed Agentsを公開ベータとしてリリースした。発表から2時間で200万ビューを記録し、Xでは「これでYCバッチ一個分の仕事が消えた」と話題になった。 Brain / Hands / Session アーキテクチャ Managed Agentsの設計思想は「頭脳と手足の分離」だ。アーキテクチャは3つの独立したコンポーネントで構成される。 Brain（頭脳） Claudeモデルが意思決定を行う。ツール呼び出し、次のアクションの判断、終了条件の評価を担当する。利用可能なモデルはOpus 4.6、Sonnet 4.6、Haiku 4.5から選択できる。 Hands（手足）使い捨てのLinuxコンテナで、コード実行やファイル操作を担当する。エラーが発生した場合、新しいコンテナが自動的に生成される。永続状態を持たないため、セキュリティ上のリスクが低い。 Session（永続セッション） BrainとHandsの外部に存在するイベントログ。すべてのツール呼び出し、その結果、エージェントの意思決定を記録する。セッションは切断後も持続し、再開時にその場から続行できる。この分離設計により、各コンポーネントは独立してスケールする。複数のBrainが単一のSessionを介してHandsと通信することも可能だ。料金体系：ランタイム＋トークンの二軸課金 Managed Agentsの課金は2次元で構成される。従来のCode Executionのコンテナ時間課金はSession Runtimeに統合された。課金項目料金セッションランタイム $0.08/時間（アクティブ時のみミリ秒単位で課金）入力トークン（Opus 4.6） $5/100万トークン出力トークン（Opus 4.6） $25/100万トークン Web検索 $10/1,000回実際のコスト例：1時間のコーディングセッション（Opus 4.6、入力50K・出力15Kトークン）の場合： # コスト計算 input_cost = 50_000 * 5.0 / 1_000_000 # $0.25 output_cost = 15_000 * 25.0 / 1_000_000 # $0.38 runtime_cost = 1.0 * 0.08 # $0.08 total = input_cost + output_cost + runtime_cost # $0.71 プロンプトキャッシングを活用すれば、入力コストを最大90%削減でき、同じセッションで $0.53 まで抑えられる。重要なのは、アイドル時間は課金されないという点だ。ユーザーの入力を待っている間やツールの確認待ちの状態は"running"ステータスにならないため、コストは発生しない。 APIの基本的な使い方 Managed AgentsのAPIはシンプルだ。以下の手順でエージェントを作成し、セッションを開始できる。 import requests API_KEY = "sk-ant-..." headers = {"x-api-key": API_KEY, "Content-Type": "application/json"} BETA_HEADER = "managed-agents-2026-04-01" # 1. エージェントの作成 agent = requests.post( "https://api.anthropic.com/v1/managed_agents", headers={**headers, "managed-agents-version": BETA_HEADER}, json={ "name": "code-reviewer", "model": "claude-sonnet-4-6", "system_prompt": "あなたはコードレビューを行うエージェントです。" "PRの差分を分析し、バグの可能性、パフォーマンス問題、" "セキュリティ脆弱性を報告してください。", "tools": [ {"type": "code_execution"}, {"type": "web_search"} ] } ) # 2. セッションの開始 session = requests.post( f"https://api.anthropic.com/v1/managed_agents/{agent['id']}/sessions", headers={**headers, "managed-agents-version": BETA_HEADER}, json={"input": "PR #42の差分を確認してレビューコメントを作成してください"} ) 主要ユースケースと導入事例すでに複数の大手企業が本番導入を進めている。 ...