Microsoft が Claude Code を切った本当の理由 — ‘足での投票’ と ‘12 ヶ月予算を数ヶ月で使い切った’ 単位経済学

2026-05-22、The Verge の単一の報道がその週の AI 業界の話題となった。Microsoft が社内パイロットとして運用してきた Claude Code のライセンスを 6 月 30 日付ですべて終了し、社員を GitHub Copilot CLI へ移行する、という内容だ。表向きの理由は自社ツールの統合だが、HN の 227 コメントは別の二つの筋を指す — 開発者たちが足で投票して自社ツールではなく競合ツールを選んだ事実、そしてその決定が会社の 12 ヶ月 AI 予算を数ヶ月で使い切らせたという単位経済学だ。

導入 — 発表の明示的事実とその裏の重み

2026 年 5 月 22 日、The Verge の報道はたった一行で要約できる。Microsoft は 2025 年 12 月に開始した社内 Claude Code パイロットプログラムのすべてのライセンスを 2026 年 6 月 30 日付で終了し、対象社員 (報道では数千人規模) を自社の GitHub Copilot CLI へ移行する。報道の副題には「MS、Notepad からも Claude を外して Copilot へ統合」というより小さな事実も付け加えられている。発表自体は自社ツール整列 (alignment) の自然な帰結のように読める。しかし HN に立ったスレッドは 5 時間で 282 点と 227 件のコメントを集め、コメントの重みは発表の表面よりも深い場所を指す。

HN で最も共感を集めたコメントが、正確な舞台設定をしている — 共感の情緒をそのまま訳せば — 「パイロットは比較フィードバックを集めるためのものだったが、社員が足で投票して自社製品ではなく競合製品を圧倒的に選んでしまった」。続く別の高共感コメントは「Microsoft のパイロットが 2026 年の会社の AI 予算を数ヶ月で使い切ってしまった (accidentally consumed their 2026 yearly target spend on AI)」というさらに衝撃的な事実を指す。二つの事実が合わさると発表の本当の意味が浮かぶ。ツールの採択は社員の選好では明確に決着しており、同じ決着が会社の単位経済学としては耐えられない請求書になった、ということだ。

本稿はこの事件の本当の二軸 — ‘足での投票’ の意味と ‘12 ヶ月予算を数ヶ月で使い切った’ 単位経済学 — を分離して分析し、トークンの時代に企業が AI コーディングツールを評価する基準がどう変わりつつあるかを見ていく。

本文 1 — ‘足での投票’ の単純さとその非対称

まず一つ目の事実。パイロットの結果は明確だった。比較利用環境 — 同じ開発者が Claude Code と GitHub Copilot の両方を使える環境 — で、利用時間、呼び出し回数、満足度回答のすべてで Claude Code が圧倒した。HN のコメントで、Microsoft 内部事情に詳しい匿名コメンタが指す一行 — 共感コメントの情緒の要約 — はこうだ。「リーダーシップが期待していたのと正反対の結果が出た、社員は自社製品を義務感で使う人々ではない」。

この結果の単純さが事件の最初の重みだ。普通の社内パイロットは「どちらも似たようなものだが、自社のほうが統合面でやや良い」のような曖昧な結論にまとめられる。今回のパイロットはそうならなかった。開発者の行動は曖昧でなく、その行動が生み出したデータはツールの優位を否定する余地がなかった。優位を確認したという事実そのものが問題なのだ — 社内比較の結果がそのまま自社ツールの敗北という明らかなメッセージになったからだ。

ここで二つ目の重みが続く。ツールの優位が明確に表れても、その優位が会社の単位経済学の内で持続可能でなければ その優位は採択決定の唯一の基準にはならない。The Verge の報道と HN のコメントが合わせて描く図がまさにそれだ。足での投票は一つの変数、単位経済学は別の変数。二つの変数が同じ方向を指さなければ、企業の意思決定は後者をより重く見る。

この非対称の最も鋭い表現を HN の一つのコメントが投げる — “tokens are current era’s lines of code per month” (トークンは現代の月間コード行数である)。一行で何を言っているか。過去 20 年、ソフトウェアツールの単位経済学は座席数 (seats)、呼び出し回数 (calls)、スループット (throughput) のような測定可能な資源で定義されてきた。クラウド時代には CPU 時間、メモリ、ネットワークバイトが単位になった。2026 年の AI コーディングツール時代には、トークンがその単位だ。そしてトークンの単位経済学は、先行する単位とは二点で本質的に異なる。

第一に、トークン消費はユーザの作業量よりも エージェントの推論深度 とより強く結合する。同じコード変更タスクをさせても、Claude Code がより多くのコンテキストを読み、より多くのツール呼び出しを行い、より長い推論を進めれば、トークン消費は 5 〜 10 倍まで膨らむ。ユーザは同じ仕事をしたのに請求書は 5 倍だ。第二に、トークン消費は 会社が制御できない外部の価格変数 に紐づいている。Anthropic がモデル価格を調整すれば会社の請求書が即座に影響を受ける。AWS / Azure / GCP のコンピュート時間価格が比較的安定しているのと正反対だ。

この二つの性質が合わされば、AI コーディングツールの単位経済学は座席数ベースの SaaS の単位経済学とは本質的に異なる種類になる。座席ライセンスモデルでは、1 人当たり月 $30 が 1 万人で月 $30 万、年 $3.6M。この数字は 1 年単位で予測可能で予算化可能だ。トークンモデルでは、1 万人の利用強度が 5 〜 10 倍のレンジを持ち、そのレンジが同じ四半期の内で変動する。予算化の基本前提 — 「需要は座席数に比例する」 — が崩れる。

Microsoft の 12 ヶ月 AI 予算が数ヶ月で使い切られた理由がまさにこの単位経済学の性質である。座席数ベースの予算化で組まれていた数字が、トークンベースの実際使用では 5 倍以上に暴走した。そしてその暴走が意図されたものではなく — 開発者の自然な使用から — 発生したという点が最も重い。単に「Claude Code が高かった」ではなく、「Claude Code の自然な使用強度が予算化の前提を超える」というのが正しい診断だ。

本文 2 — トークン経済の新変数とツール評価の再編

この事件がより大きな時代精神と出会う地点がここである。座席数からトークンへと単位経済学が移っていく流れは Microsoft だけの問題ではない。すべての大企業の CFO が同じ問題に直面している。そしてその問題の核心は、ツール評価の基準そのものが多層化することにある。

伝統的 SaaS 評価では二つの変数が決定する — 座席当たり価格とユーザ満足度。二変数が決まれば ROI 計算は単純だ。AI コーディングツールの評価には少なくとも五つの変数が入ってくる。第一に、座席当たりライセンス費 (この部分はしばしば 0 に近いか定額制)。第二に、トークン使用量の分布 (median, p95, p99)。第三に、トークン使用の時間的変動 (peak hour, peak week)。第四に、モデル価格の外部変動リスク。第五に、ツールが生み出す開発者生産性の測定値。この五変数のうちどれか一つが大きなレンジで変動すれば、ROI 計算全体が揺らぐ。

Microsoft の決定は、第五の変数 (生産性の優位) が明確であるにもかかわらず、第二／第三／第四変数の変動性を制御できないという判断から出たものと読める。HN のあるコメントが正確に指す — 共感の情緒をそのまま訳せば — 「Microsoft は二つの選択肢に直面した。明らかに優れたツールのかなりの継続コストを払い続けるか、自社プラットフォームに統合してコスト制御と戦略的整列を得るか」。6 月 30 日はその二つの選択の亀裂点だ。

ここでもう一つ微妙な変数が登場する。GitHub Copilot CLI は Claude モデルへのアクセスができる。HN の複数コメントがこの事実を強調する。すなわち Microsoft の決定は「Claude を切る」ではなく「Claude を自社の入り口 (Copilot CLI) を通してのみ使わせる」だ。違いは何か。入り口統制の意味が二つある。第一に、Claude 呼び出しの利用パターン — どのコンテキスト、どのツール、どのトークン量 — を Microsoft がゲートし測定できる。第二に、Microsoft がその呼び出しを自社インフラ (Azure と Microsoft AI の統合層) を経由させれば、別のモデル (自社モデル、別の外部モデル) に価格比較でルーティングする選択肢が開く。すなわち入り口統制は、トークン単位経済学の最大のリスク (外部価格の変動) を部分的にヘッジする装置である。

このヘッジの代価はユーザ体験の一部の喪失だ。Claude Code のユーザ体験は単にモデル性能ではなく、モデル + UI + ツール統合 + コンテキスト管理の結合で作られる。Copilot CLI が Claude モデルを呼び出しても、その結合は Claude Code の結合とは異なる。開発者が足で投票したのはモデルだけでなく、その結合だった。Microsoft の決定は結合の一部 (モデル) は維持し、結合の別の部分 (UI / 統合) は自社ツールで置き換える。6 月 30 日以降の社員の利用満足度がどう動くかが、この決定の二つ目の検証指標になる。

もう一つの微妙な非対称がある。Microsoft と Anthropic の関係は OpenAI とは異なる。OpenAI との協業は資本 (Microsoft の OpenAI 投資) とインフラ (Azure 上の OpenAI サービング) が深く結びついている構造だ。Anthropic との関係はそれより軽い — 一部の Anthropic モデルが Azure でサービングされてはいるが、資本結合は薄い。HN のあるコメントがこの非対称を指す — 共感コメントの情緒の要約 — 「Microsoft は OpenAI と公的に対立しており、その対立の上で Anthropic との密接な採択は政治的に難しいカードだ」。Claude Code の社内採択を切るということは、OpenAI との微妙な関係の上で Anthropic 依存度が急速に増えるのを止める政治的行動でもある。単位経済学の決定の上に政治学の決定が乗っている。

本文 3 — コーポレートのツール採択の新時代

この事件が次の 6 〜 12 ヶ月でコーポレートのツール採択パターンに与える影響を見ていく。三つの筋に整理される。

第一に、「トークン予算化」の標準化。Microsoft が 12 ヶ月 AI 予算を数ヶ月で使い切った事件は、すべての大企業の CFO に直接の教訓となる。座席数ベースの予算化ではトークン使用を制御できないという事実が可視化された。6 〜 12 ヶ月のうちに、大企業の AI ツール採択プロセスに「トークン上限 (token budget) 設定」という新しい段階が標準として組み込まれるだろう。座席当たり日次／週次／月次のトークン上限が設定され、その上限を超えると自動でブロックされるか、コストを部門が負担する構造だ。これはクラウド時代の「コストアラート (cost alert)」と似た形だが、より深い部分でツールの利用パターンそのものを形作る。

第二に、「API ゲートウェイ」が入り口になるパターンの加速。単一ツールの単一入り口を直接社員に渡すモデル (Claude Code の直接ライセンス) は利用パターンを制御できない。代わりに、会社が自前のゲートウェイを運用し、ゲートウェイが外部モデル (Anthropic、OpenAI、または自社モデル) に呼び出しをルーティングするモデルが標準になる。Microsoft の GitHub Copilot CLI はこのパターンの代表例だ。類似のゲートウェイツールが他の大企業 (Google の Workspace AI、Amazon の Q Developer、Salesforce の Agentforce) でも急速に拡張されている。この拡張の結果は、外部 AI モデル会社 (Anthropic、OpenAI) の直接ユーザ (B2C 的な直接ライセンス) が減っていくことだ。モデル会社は、自分のモデルがよく売れているのを見ながらも、ゲートウェイの背後に隠された利用パターンを直接見られなくなる。

第三に、「優れたツールの拒絶」という意思決定の常態化。5 〜 10 年前の SaaS 時代には「社員が最も好むツールを買ってあげる」ことが人材維持の一部だった。トークン時代にはその等式が壊れる。最も好まれるツールが会社の単位経済学の内で持続可能でないことがある。Microsoft の決定は「社員の選好 > ツール性能 > 単位経済学」という伝統的優先順位を「単位経済学 > ツール性能 > 社員の選好」へとひっくり返すシグナルである。このひっくり返しが他の大企業でも同じ方向で起きれば、AI コーディングツール市場の競争構図は「ツールの性能」だけでは決着しない。「会社の単位経済学の内で費用が予測可能か」という第二の変数が同等に重要になる。

この三つの筋がすべて起きれば、Claude Code のようなツールの将来の市場戦略は本質的に変わる。B2C 的な直接ライセンスでは大企業市場に到達しにくくなり、ゲートウェイの背後でルーティングされるモデル供給者にならねばならなくなる。Anthropic の次の 1 年の市場戦略 — 直接ツール (Claude Code) か、API モデル (Claude API) か — はこの事件によって直接ツール側の比重が下がる可能性がある。直接ツールの魅力はユーザ体験の結合だが、その結合がゲートウェイの背後で部分的に解かれれば、直接ツールの差別性が弱まる。

ここで一つの反論を扱う必要がある。Microsoft の事例はすべての大企業に一般化可能か。一つの理由から一般化には限界がある。Microsoft は自社に競合ツール (GitHub Copilot) を持っている。自社ツールを持たない大企業 — 金融、製造、ヘルスケアの大半 — は、外部ツールを切ることが自動的に自社ツールへの移行にはならない。外部ツールの単位経済学問題は彼らにも同じだが、その対応は「切って自社へ移行」ではなく「上限設定で継続使用」となる。すなわち Microsoft の事例は自社競合ツールを持つ少数の大企業の特殊な決定であり、単位経済学の問題自体はすべての大企業が直面するが、その解は二つの筋 — 上限設定 vs 自社移行 — に分かれる。

結論 — トークンの時代にツールはどう評価されるのか

冒頭の問いに戻る。Microsoft が Claude Code を切った本当の理由は何か。

表向きの理由は自社ツール (GitHub Copilot CLI) への統合だった。しかし本当の理由は二つの筋に分離できる。第一に、社内比較パイロットが自社ツールの明確な敗北を可視化したため、その結果を公式結論として受け入れることが政治的に難しくなった。第二に、より決定的に、Claude Code の自然な利用強度が会社の 12 ヶ月 AI 予算を数ヶ月で使い切らせるほど大きく、座席数ベースの予算化では制御不可能な単位経済学になった。二つの理由はどちらか一方だけでは断絶の決定を正当化しにくいが、合わさると 6 月 30 日の断絶が会社の合理的な選択として整理される。

この事件が残す一行のメッセージはこうだ。トークンの時代の AI ツールの評価は、性能と単位経済学の積として定義され、二つの変数が同じ方向を指さなければ単位経済学のほうがより大きな重みを持つ。座席数ベースの SaaS 評価の時代は終わり、トークンベースの利用強度評価の時代が始まった。そしてこの新時代のツール採択決定は、社員の選好だけでは決着しない。会社の CFO と開発者の選好が同じ方向を指さないとき、決定は CFO の方向に傾く。

次の 6 〜 12 ヶ月で検証される三つの指標がある。第一に、他の大企業のうち同様の断絶 (外部 AI コーディングツールを切り、社内ゲートウェイへ移行) が起こるか。第二に、Anthropic の売上構造のうち直接ツール (Claude Code) の比重が減少し、API モデルの比重が増加するか。第三に、「トークン予算」という表現が大企業の四半期報告書に登場し始めるか。三つのうち二つ以上が肯定的に出れば、2026-05-22 の The Verge 報道はトークン時代の最初の巨視的分岐点として記録されるだろう。

出典: