国産モデルがOpenRouterのトークン呼び出し量急増の背後に、プログラミングとインテリジェンスが勝利の鍵となる

春节期間の国内大規模モデルの利用状況はまさに盛況を極めています。OpenRouterの最新週次データによると、プラットフォーム上のトップ10モデルの総トークン量は約8.7兆で、そのうち中国モデルが5.3兆を占めており、全体の61%を占有しています

**当週のトークン呼び出し量トップ3のモデルはすべて国内大規模モデルであり、**それぞれMinimax M2.5、Kimi K2.5、GLM-5で、呼び出し量は前週比でそれぞれ197%増、20%減、158%増となっています。その中で、MiniMax M2.5は2.45兆トークンでトップに躍り出ており、Kimi K2.5は1.21兆トークンで続き、智谱のGLM-5とDeepSeek V3.2がそれぞれ3位と5位に位置しています。

OpenRouterは世界最大の大規模モデルAPI集約プラットフォームであり、開発者に対して統一されたAPIインターフェースを提供し、世界中の数百種類の大規模言語モデルにアクセスできるようにしています。主な機能は複数モデルの呼び出し、インテリジェントルーティングの最適化、性能ランキングの透明性であり、多モデル統合の複雑さやベンダーによる制限の解決を目指しています。

このプラットフォームのデータから見ると、プログラミング(Coding)とエージェント(Agent)が大規模モデルの二大競争ポイントとなっています。

OpenRouterの呼び出し総量は最近大きく増加しています。公式によると、M2.5は長文(10万字から100万字)における増分呼び出し需要を牽引しており、これはインテリジェントエージェントのワークフローの典型的な消費シナリオです。

トークン呼び出し量の観点では、このプラットフォームの上位3つの国内大規模モデルはプログラミング能力とエージェント(Agent)タスクの自動化レベル向上に焦点を当てており、2026年初頭における国内大規模モデルのアプリケーション面での重要な突破口となっています。

稀宇科技(MiniMax)は2月13日にMiniMax M2.5を発表し、同モデルは世界初のエージェントシナリオにネイティブに設計された生産レベルのフラッグシップモデルと称しています。リリース後わずか7日で呼び出し量は3.07兆トークンを突破し、プログラミングとエージェントワークフローにおける卓越した性能と低コストにより、開発者の第一選択となっています。

月之暗面(Moonshot AI)は1月27日にKimiK2.5をリリースし、原生のマルチモーダルアーキテクチャを採用、最大100の「エージェント分身」を並行してスケジューリングし、複雑なタスクの効率を3倍から10倍に向上させました。このモデルは複数の細分化されたランキング(プログラミング、ツール呼び出しなど)で1位を獲得し、その呼び出し量はGemini 3やClaudeモデルを大きく上回っています。澎湃新聞の報道によると、この大規模モデルのリリースから1か月も経たないうちに、Kimiの収益は2025年の年間総収入を超え、主に海外の有料ユーザーとAPI呼び出し量の増加に牽引されています。

智谱は2月12日にGLM-5をリリースし、モデルのパラメータ規模をさらに拡大、疎な注意機構を採用し、複雑なシステムエンジニアリングや長距離エージェントタスクに特化したフラッグシップモデルです。無料、200Kのコンテキストウィンドウなどの利点により、リリース後はユーザー数が急増しています。智谱はCoding Planに対して販売制限や価格引き上げなどの措置を講じ、除夜の日には全ネットワークで「計算能力パートナー」を募集する公式発表も行われました。

AIモデルの応用シナリオが深まるにつれ、ユーザーは単純な質問応答から複雑なワークフローへと移行し、コードのリファクタリングやファイルの書き換え、ドキュメント生成、インテリジェントエージェントの普及などにより、現在のトークン消費は明らかに「インフレ」傾向を示しています。

性能向上とともに、国内モデルはコストパフォーマンスの優位性で差別化を図っています。例えば、MiniMax M2.5と智谱GLM-5はClaude Opus 4.6と比較して、コスト面で顕著な優位性を持ちます。入力段階では、MiniMax M2.5とGLM-5の価格はともに0.3ドル/百万トークンですが、Claude Opus 4.6は5ドル/百万トークンと約16.7倍の差があります。出力段では、MiniMax M2.5は1.1ドル/百万トークン、GLM-5は2.55ドル/百万トークンに対し、Claude Opus 4.6は25ドル/百万トークンで、それぞれMiniMax M2.5の約22.7倍、GLM-5の約9.8倍となっています。

これらの国内モデルは国内のモデルメーカーのトークン呼び出し量を完全には反映していません。海通国際証券のデータによると、火山エンジンの大規模モデルの日次トークン呼び出し量は2024年末の2兆から2025年末には63兆に増加しています。阿里雲の外部顧客の2025年の平均日次トークン呼び出しも約5兆に近づいており、2026年には少なくとも15〜20兆を目標としています。内部業務の平均呼び出しも16〜17兆から100兆に引き上げる計画です。業界全体を見ると、中国の平均日次トークン消費は2024年初めに1000億に過ぎませんでしたが、2025年中には30兆を突破し、2026年2月には主流の大規模モデルの合計日次トークン消費は180兆規模に達しています。

東莞証券の最新レポートは、国内モデルのプログラミングやインテリジェントエージェント能力の向上に伴い、その呼び出し量が大幅に増加していると指摘し、国内大規模モデルがグローバルトップモデルと競合し、応用の実現をさらに加速させ、トークン消費量の増加を促進すると予測しています。

長江証券は以前、プログラミングやマルチモーダルモデル・製品の成熟に伴い、下流の応用シナリオが本格的に開かれ、多くの高品質なトークン需要が生まれると述べています。海外のAI産業の発展パターンを参考にすると、資本支出からトークン需要の爆発までには約2年の遅れがあり、国内大手企業のAI投資サイクルは海外より約1年遅れて2024年後半に始まると予測しています。そのため、国内クラウド事業者の収益はすでに成長を実現しつつあり、トークン数の本格的な爆発は2026年に到来すると見られています。

(出典:財聯社)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン