XAI Grok 推 Custom Voices:2 分鐘克隆、雙階段身分驗證

鏈新聞abmedia

xAI 5 月 2 日於官方部落格推出 Grok Custom Voices 功能,使用者只需在 xAI 控制台錄製約 1 分鐘的自然語音、系統會在 2 分鐘內處理完成、產出可用於 TTS 與 Voice Agent API 的客製聲音模型。同步推出的還有 Grok 4.3 模型、以及彙整全部聲音資源的 Voice Library 介面。Custom Voices 並設計雙階段身分驗證機制、防止克隆他人聲音。

功能:1 分鐘錄音、2 分鐘生成、整合 TTS 與 Voice Agent API

使用者在 xAI 控制台錄製約 1 分鐘的自然語音、後台流程依序完成:(1)身分驗證、(2)語音處理、(3)模型產出。整體 2 分鐘內可拿到可用的聲音模型。Custom Voices 繼承所有 TTS 能力、包含 speech tags(語音標籤)、多語輸出、以及 REST 與 WebSocket 串流;可直接搭配 xAI 的 TTS 端點或 Voice Agent API 用於即時對話 agent。

同步推出的 Voice Library 是 xAI 控制台中統一管理聲音資源的介面、可瀏覽、預覽、管理使用者自製與預建的所有聲音、避免分散在多個介面。預建聲音庫提供 80 種以上聲音、支援 28 種語言。

雙階段身分驗證:防止克隆他人聲音

Custom Voices 在語音生成前設置兩道身分驗證關卡:第一道、使用者朗讀一段驗證句、系統即時轉錄該段語音;第二道、系統從驗證句與完整錄音中分別計算 speaker embedding(說話者特徵向量)、比對兩者是否屬於同一人。只有兩階段都通過、才會進入聲音模型產出流程。

xAI 明確聲明:使用者無法用既有錄音檔克隆聲音、也無法克隆他人聲音。這套設計排除「拿到他人公開演講錄音直接複製」的使用情境、把克隆聲音的範圍限縮在「使用者本人即時錄製」這一個入口。對於關注 AI 語音生成濫用議題(如電話詐騙、未經授權配音)的觀察者而言、這套機制是 xAI 對防偽議題的具體回應。

後續觀察:與 Grok 4.3 同步推出、Voice Library 擴增節奏

Custom Voices 與 Grok 4.3 模型同日推出、xAI 將「模型升級 + 語音工具線完整化」綁在同一波發表。下一個觀察點是 Voice Library 預建聲音庫從 80 種往上擴增的節奏、以及 28 語言版圖能否進一步覆蓋繁體中文等小語種;另一個觀察點是 Voice Agent API 的具體採用案例公開、特別是客服自動化、podcast 錄製、多語客戶服務等場景的整合範例。

這篇文章 xAI Grok 推 Custom Voices:2 分鐘克隆、雙階段身分驗證 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

美國海軍與 Domino Data Lab 簽署近 1 億美元的 AI 合約,用於在荷姆茲海峽進行地雷探測

根據新華社報導,美國海軍資訊戰系統司令部近日與總部位於舊金山的 AI 公司 Domino Data Lab 簽署合約,採購並部署機器學習軟體解決方案。若合約全部執行,合約金額近 1 億美元,旨在

GateNews1小時前

OpenAI Codex 桌面版加寵物功能:3 狀態提示、依使用語言孵化

OpenAI Codex 桌面版近期上架「寵物」(Pets)功能、讓開發者能在編碼時透過懸浮的動畫角色即時掌握 Codex 任務狀態。根據 OpenAI 官方文件,寵物 overlay 會根據 Codex 當下狀態切換 3

鏈新聞abmedia4小時前

MoonPay 於週五推出 MoonAgents 卡,供 AI 代理使用的虛擬萬事達卡

根據 The Block,MoonPay 於週五推出 MoonAgents Card,一款虛擬 Mastercard 借記卡。該卡旨在同時服務 AI 代理與使用者,能在付款當下將穩定幣兌換為法幣,並讓使用者可在全球任何接受 Mastercard 的線上商家消費。 這張卡 i

GateNews14小時前

Berkeley GEPA 解析:不更新權重就能讓 AI 學會新任務、35 倍少訓練成本勝 RL

GEPA 是 UC Berkeley 團隊提出的 AI 訓練新法:不更新權重、不需 GPU,透過讓反思 LLM 閱讀完整任務紀錄並重寫提示,而非僅以分數回饋。六項任務平均勝 GRPO 6%、最高 20%,訓練 rollouts 減少 35 倍;與 DSPy 整合的 Full Program Adapter 在數學與多模組工作流顯著提升,93% 準確。程式碼開源,作者包含 Matei Zaharia 等。

鏈新聞abmedia22小時前

OpenAI 發布 Codex Pets,具備客製化生成功能的 AI 驅動虛擬伴侶

根據 Beating,OpenAI 已在 Codex 桌面應用程式中新增一項「Codex Pets」功能,讓使用者能夠生成並與一個動畫化的虛擬夥伴互動。使用者可以在編輯器中輸入 /pet 來啟用寵物。此功能會作為代理狀態指示器運作,顯示一個

GateNews23小時前

MoonPay 推出 MoonAgents 卡,供 Mastercard 網路上的 AI 代理使用

根據 The Block,MoonPay 於週五推出 MoonAgents Card,這是一張虛擬萬事達卡(Mastercard)借記卡,可在付款當下即時將穩定幣轉換為法幣。該卡由 Monavate 發行,Monavate 是一家受監管的支付平台,也是萬事達卡主要成員,並與 Exodus M

GateNews05-02 01:11
留言
0/400
暫無留言