Gate News 訊息,4 月 17 日——Google 於 4 月 15 日揭曉 Gemini 3.1 Flash TTS,這是一款先進的文字轉語音模型,強化了情感表達與控制功能。新模型將透過開發者 API、企業 Vertex AI,以及協作工具逐步推出。
模型的核心能力包括基於自然語言的音訊標籤,以便針對速度、語調與情感進行微調,並提供「Director Mode」用於指定場景與角色定位,以生成更細緻的語音輸出。多說話人功能可讓對話同時生成,使對話流程更自然,適用於播客、音訊內容與 AI 助理。模型支援超過 70 種語言與方言,反映不同地區的口音與表達方式,以在全球範圍提供在地化的語音體驗。
Google 強調效能與成本效率,透過 Flash 架構在盲測的人類評估基準上取得高分,同時降低運算成本——該架構旨在支援大規模的企業採用。生成的音訊包含 SynthID 水印,用於辨識由 AI 生成的內容並打擊錯誤資訊。
此舉反映語音介面競爭的加劇。OpenAI 正將即時語音功能與對話式 AI 結合,以實現類人互動;而 Meta 則擴大投資 AI 角色,並以語音為基礎的社交體驗來推動。產業觀察人士指出,儘管高水準的表演與創意工作或許仍將以人類主導為主,但重複性且規模化的製作市場,可能會在配音、廣告與有聲讀物等領域逐步導入 AI。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
AI Agent 已可獨立重現複雜學術論文:Mollick 稱錯誤多在人類原文而非 AI
Mollick 指出,公開方法與資料即可讓 AI agent 在無原始論文與程式碼情況下重現複雜研究;若重現與原論文不符,多是論文本身的資料處理錯誤或結論過度,而非 AI。 Claude 先重現論文,再由 GPT‑5 Pro 交叉驗證,多數成功,僅遇到資料過大或 replication data 問題時受阻。此趨勢大幅降低人力成本,使重現成為普遍可執行的檢驗,也提出審稿與治理的制度挑戰,政府治理工具或成關鍵議題。
鏈新聞abmedia2小時前
OpenAI 從 GPT-5.4 起將 Codex 合併進主模型,並終止獨立的編程系列
Gate News 消息,4 月 26 日——OpenAI 的開發者體驗主管 Romain Huet 在近期於 X 上的聲明中透露,該公司獨立維護的專用編程模型系列 Codex 已自 GPT-5.4 起並入主模型,且將不再獲得單獨的
GateNews2小時前
Salesforce 將為 AI 產品僱用 1,000 名畢業生與實習生,並上調 2026 財年營收指引
Gate News 訊息,4月26日——Salesforce 將僱用 1,000 名畢業生與實習生,協助開發 AI 產品,包括 Agentforce 與 Headless360;隨著公司擴大其 AI 軟體業務,執行長 Marc Benioff 於 X 上宣布。
該公司亦上調其 2026 財年營收指引至介於 41.45–41.550o十億美元之間
GateNews2小時前
阿里雲推出 Qwen-Image-2.0-Pro:統一文字轉圖片與編輯,支援多語言文字渲染
快訊訊息,4月26日——阿里雲百鍊平台已推出 Qwen-Image-2.0-Pro,這是一個功能完備的 Qwen-Image-2.0 系列版本,將文字生成圖片與影像編輯整合到單一模型中。使用者可透過自然語言指令直接修改物件、文字與風格
GateNews4小時前
DeepSeek V4-Pro API 享受 75% 折扣,至 5 月 5 日止;輸出價格降至每百萬 tokens $0.87
門戶新聞訊息,4 月 26 日—DeepSeek 宣布在限時期間提供 V4-Pro API 定價 75% 折扣,折扣有效期截至 5 月 5 日 15:59 UTC。折扣後,每百萬 tokens 的定價為:輸入快取命中 $0.03625
GateNews5小時前
Anthropic 在 2026 年中期選舉前為 Claude 部署選舉防護措施
Anthropic 週五宣布了一套選舉可信度措施,旨在防止其 Claude AI 聊天機器人被武器化,以在 2026 年美國中期選舉以及今年全球其他重大競選活動之前散播錯誤資訊或操縱選民。總部位於舊金山的
Crypto Frontier10小時前