ME Newsによると、xAIは2つの独立した音声API:Grok STTとGrok TTSをリリースしました。これらは同じ音声スタックに由来し、Grok Voice、テスラ車載システム、Starlinkカスタマーサポートなどをサポートします。STTはRESTバッチ転写とWebSocketリアルタイムストリームを提供し、単語レベルのタイムスタンプ、話者分離、多チャンネル、逆テキスト正規化を備え、25以上の言語をカバーします。TTSは感情と韻律のインラインタグをサポートします。また、WER比較も公開されており、Grokは多くのシナリオでリードしていますが、第三者による再検証はまだありません。価格設定は、STTバッチ処理が0.10ドル/時間、ストリーミングが0.20ドル/時間、TTSは100万文字あたり4.20ドルです。
ME Newsによると、Xiaomi miclawは中国情報通信研究院のスマートフォン向けインテリジェントアシスタントClawの評価に合格し、国内初の評価を受けたスマートフォン向けインテリジェントエージェントとなった。評価は《インテリジェントアシスタント基準テスト共通フレームワーク》に基づき、基本能力、端末側アプリケーション、総合能力の三次元で評価された。このシステムは自社開発のMiMo大モデルを基盤とし、全エコシステムの底層サポート、深度記憶、クロスドメイン連携、継続的自己進化の四大能力を備え、スマートフォン、PC、座席、AIoTなどのデバイスを連携し、複雑な指示を自主的に実行できる。(出典:BlockBeats)