xAI 這音頻 API 定價有點意思,STT 批量才 0.1 刀/小時,TTS 反而貴到 4.2 刀/百萬字符,情感標籤值這個溢價嗎?

查看原文
ME News
xAI開放Grok STT與TTS音頻API,STT整體詞錯率壓到6.9%
ME News 報導,xAI 推出兩項獨立音頻 API:Grok STT 與 Grok TTS,源自同一音頻棧,支持 Grok Voice、特斯拉車載系統及 Starlink 客服等。STT 提供 REST 批量轉錄與 WebSocket 實時流,具詞級時間戳、說話人分離、多通道與逆文本歸一化,覆蓋 25+ 種語言;TTS 支持情感與韻律的內聯標籤。並公布 WER 對比,Grok 在多場景領先,尚無第三方復測。定價:STT 批處理 0.10 美元/小時、流式 0.20 美元/小時,TTS 4.20 美元/百萬字符。
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆