Tin nhắn Gate News, ngày 17 tháng 4 — Google đã công bố Gemini 3.1 Flash TTS, một mô hình nâng cao chuyển văn bản thành giọng nói với các tính năng thể hiện cảm xúc và kiểm soát được tăng cường, vào ngày 15 tháng 4. Mô hình mới sẽ được triển khai dần dần thông qua các API dành cho nhà phát triển, Vertex AI cho doanh nghiệp và các công cụ cộng tác.
Các khả năng cốt lõi của mô hình bao gồm các thẻ âm thanh dựa trên ngôn ngữ tự nhiên để tinh chỉnh tốc độ, ngữ điệu và cảm xúc, cùng với “Director Mode” để chỉ định cảnh và vai trò nhân vật nhằm tạo ra các đầu ra giọng nói tinh tế hơn. Tính năng nhiều người nói cho phép tạo hội thoại đồng thời, giúp luồng trò chuyện tự nhiên hơn, phù hợp cho podcast, nội dung âm thanh và trợ lý AI. Mô hình hỗ trợ hơn 70 ngôn ngữ và phương ngữ, phản ánh giọng và cách diễn đạt theo khu vực cho trải nghiệm giọng nói được bản địa hóa trên toàn cầu.
Google nhấn mạnh hiệu năng và tối ưu chi phí, đạt điểm cao trên các chuẩn đánh giá con người mù trong khi giảm chi phí tính toán nhờ kiến trúc Flash—được thiết kế cho việc triển khai doanh nghiệp quy mô lớn. Âm thanh được tạo ra bao gồm gắn watermark SynthID để nhận diện nội dung do AI tạo ra và chống lại tin giả.
Động thái này phản ánh sự cạnh tranh ngày càng gay gắt trong các giao diện giọng nói. OpenAI đang kết hợp các tính năng giọng nói thời gian thực với AI hội thoại để tạo ra tương tác giống con người, trong khi Meta đang mở rộng đầu tư vào các nhân vật AI với trải nghiệm xã hội dựa trên giọng nói. Các nhà quan sát trong ngành cho rằng dù hoạt động diễn xuất cấp cao và công việc sáng tạo có thể vẫn do con người dẫn dắt trong hiện tại, nhưng các thị trường sản xuất lặp lại và quy mô lớn có thể sẽ chứng kiến việc AI dần được áp dụng trong các lĩnh vực lồng tiếng, quảng cáo và sách nói.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Alibaba Cloud Ra Mắt Qwen-Image-2.0-Pro với Văn Bản Tới Ảnh và Chỉnh Sửa Hợp Nhất, Hỗ Trợ Hiển Thị Văn Bản Đa Ngôn Ngữ
Thông điệp Cổng Tin Tức ngày 26 tháng 4 — Nền tảng Bailian của Alibaba Cloud đã ra mắt Qwen-Image-2.0-Pro, phiên bản đầy đủ tính năng của dòng Qwen-Image-2.0, kết hợp tạo ảnh từ văn bản và chỉnh sửa ảnh trong cùng một mô hình. Người dùng có thể chỉnh sửa các đối tượng, văn bản và phong cách trực tiếp thông qua các lệnh ngôn ngữ tự nhiên
GateNews32phút trước
API DeepSeek V4-Pro giảm 75% đến ngày 5 tháng 5, giá đầu ra giảm xuống còn $0.87 mỗi một triệu token
Tin tức từ Gate, ngày 26 tháng 4 — DeepSeek đã công bố giảm giá 75% trong thời gian giới hạn đối với giá API V4-Pro, có hiệu lực đến ngày 5 tháng 5 lúc 15:59 UTC. Sau khi giảm giá, giá cho mỗi một triệu token là: hit bộ nhớ cache đầu vào $0.03625
GateNews1giờ trước
Anthropic Triển khai các biện pháp bảo vệ bầu cử cho Claude trước thềm cuộc bầu cử giữa nhiệm kỳ năm 2026
Anthropic đã công bố vào thứ Sáu một loạt biện pháp nhằm bảo vệ tính toàn vẹn bầu cử, được thiết kế để ngăn chatbot AI Claude của hãng bị biến thành công cụ vũ khí nhằm lan truyền thông tin sai lệch hoặc thao túng cử tri trước thềm cuộc bầu cử giữa kỳ năm 2026 tại Mỹ và các cuộc tranh cử lớn khác trên khắp thế giới trong năm nay. Trụ sở tại San Francisco-based
CryptoFrontier6giờ trước
DeepRoute.ai Hệ thống hỗ trợ lái nâng cao đột phá 300.000 xe triển khai: Mục tiêu 2026 là đội xe NOA 1 triệu xe trong các thành phố
DeepRoute.ai thông báo rằng hệ thống hỗ trợ lái nâng cao của họ đã được triển khai tích lũy hơn 300.000 xe tại Trung Quốc, và trong năm qua đã giúp tránh hơn 180.000 lần tai nạn tiềm ẩn. Mục tiêu cho năm 2026 là đội xe NOA tại các thành phố đạt 1 triệu xe, với tỷ lệ sử dụng vượt quá 50%, được xem là chìa khóa cho việc thương mại hóa quy mô lớn của Robotaxi. Động thái này cho thấy việc lái xe tự động tại Trung Quốc đã bước vào giai đoạn sử dụng thường nhật, đồng thời tạo ra sự phân kỳ so với lộ trình tích hợp dọc với Mỹ, ảnh hưởng đến tiến độ của chuỗi cung ứng khu vực châu Á – Thái Bình Dương.
ChainNewsAbmedia8giờ trước
DeepSeek phát hành mô hình V4-Pro và V4-Flash với chi phí thấp hơn 98% so với GPT-5.5 Pro của OpenAI
Tin cổng Gate News, ngày 25 tháng 4 — DeepSeek đã phát hành các phiên bản xem trước của V4-Pro và V4-Flash vào ngày 24 tháng 4, cả hai đều là các mô hình open-weight với cửa sổ ngữ cảnh một triệu token. V4-Pro có 1,6 nghìn tỷ tổng tham số nhưng chỉ kích hoạt 49 tỷ trên mỗi lượt suy luận, sử dụng kiến trúc Mixture-of-Experts.
GateNews13giờ trước
Thẩm phán bác bỏ các cáo buộc gian lận trong vụ kiện OpenAI của Elon Musk; Vụ án tiến tới xét xử với hai cáo buộc còn lại
Tin Cổng, ngày 24 tháng 4 — Một thẩm phán liên bang đã bác bỏ các cáo buộc gian lận trong vụ kiện của Elon Musk chống lại OpenAI, Sam Altman, Greg Brockman và Microsoft, mở đường để vụ việc được đưa ra xét xử dựa trên hai cáo buộc còn lại: vi phạm tín thác từ thiện và làm giàu bất chính. Mỹ.
GateNews16giờ trước