有人在Apple Watch上運行了一個語音模型。不是玩具演示。Granite 4.0 1B語音模型在OpenASR排行榜上首次排名第一。這裡的精彩之處在於: • 1B參數——只有Granite 3.3 2B的一半大小 • 英語轉錄準確率高於更大的模型 • 針對微型硬件的推測解碼,加快推理速度 • 6種語言——英語、法語、德語、西班牙語、葡萄牙語、日語 • 關鍵詞列表偏置,確保能正確識別名字和縮寫 沒有人在談論的部分: 你每個月都在為Whisper API調用付費,而一個比前一代模型小一半的模型卻在你的手腕上裝置上表現優異。 這不是微小的優化。這是邊緣語音應用的整個成本結構崩潰。 更小的模型。更高的準確率。零雲端依賴。

查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言