シャオミ、MiMo-V2シリーズAIモデルを発表、Pro版の性能はClaude Opus 4.6に迫り、価格はわずか1/5

ゲートニュースによると、3月19日、小米は今朝、MiMo-V2シリーズのAIモデルを正式に発表しました。これには、フラッグシップ推論モデルのPro、全モーダル基盤のOmni、音声合成TTSの3つの製品が含まれます。

MiMo-V2-Proは総パラメータ数が1兆超(42Bの活性化パラメータ)、100万トークン超の長大なコンテキストに対応し、エージェントの作業シナリオ向けに設計されています。Artificial Analysisランキングで世界第8位、国内第2位に入り、PinchBenchとClawEvalの評価でも世界第3位を獲得。全体的な性能はClaude Sonnet 4.6を超え、Opus 4.6に迫るものの、価格は後者の1/5です。256K以内の入力は$1、出力は$3/百万トークン、1M以内の入力は$2、出力は$6/百万トークンです。MiMo Clawモジュールは金山WebOfficeエコシステムと連携済みで、WPSのLingxiとも同期接続されています。

MiMo-V2-Omniは全モーダル基盤で、テキスト、画像、音声、動画の4つの入力に対応し、256Kのコンテキストを持ちます。価格は入力$0.4、出力$2/百万トークンです。音声面では10時間超の長時間音声理解をサポートし、総合評価でGemini 3 Proを超えています。画像理解もClaude Opus 4.6を超え、Gemini 3 Proに迫ります。

MiMo-V2-TTSは自社開発のAudio Tokenizerを基に、数億時間の音声データで事前学習されており、全体のスタイルから局所的な感情まで多粒度のコントロールが可能です。高品質な歌声の合成や、東北弁、四川弁、河南弁、粤語、台湾訛りの方言にも対応しています。

これら3つのモデルは現在、Xiaomi miclaw、MiMo Studio、金山办公、小米ブラウザに接続されており、OpenClaw、OpenCode、KiloCode、Blackbox、Clineの5つのエージェント開発フレームワークを通じて呼び出すことができ、期間限定で1週間無料提供中です。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし