Google Meluncurkan Gemini 3.1 Flash TTS dengan Ekspresi Emosional yang Ditingkatkan serta Kemampuan Multi-Pembicara

Pesan Gate News, 17 April — Google mengungkap Gemini 3.1 Flash TTS, model text-to-speech canggih dengan fitur ekspresi emosional dan kontrol yang ditingkatkan, pada 15 April. Model baru akan diluncurkan secara bertahap melalui API pengembang, Vertex AI untuk perusahaan, serta alat kolaborasi.

Kemampuan inti model ini mencakup tag audio berbasis bahasa alami untuk penyetelan kecepatan, intonasi, dan emosi, ditambah “Director Mode” untuk menentukan adegan dan peran karakter guna menghasilkan keluaran suara yang lebih bernuansa. Fitur multi-pembicara memungkinkan pembuatan dialog secara simultan, sehingga menghasilkan alur percakapan yang lebih natural dan cocok untuk podcast, konten audio, serta asisten AI. Model ini mendukung lebih dari 70 bahasa dan dialek, mencerminkan aksen dan ekspresi regional untuk pengalaman suara lokal di seluruh dunia.

Google menekankan performa dan efisiensi biaya, meraih skor tinggi pada tolok ukur evaluasi manusia buta (blind) sambil menurunkan biaya komputasi melalui arsitektur Flash—yang dirancang untuk adopsi skala besar di perusahaan. Audio yang dihasilkan menyertakan watermark SynthID untuk mengidentifikasi konten yang dihasilkan AI dan melawan misinformasi.

Langkah ini mencerminkan persaingan yang semakin ketat dalam antarmuka suara. OpenAI menggabungkan fitur suara real-time dengan AI percakapan untuk interaksi yang menyerupai manusia, sementara Meta memperluas investasi pada karakter AI dengan pengalaman sosial berbasis suara. Pengamat industri mencatat bahwa meskipun akting tingkat tinggi dan pekerjaan kreatif mungkin tetap digerakkan manusia untuk saat ini, pasar produksi yang berulang dan berskala besar bisa melihat adopsi AI secara bertahap dalam sektor dubbing, periklanan, dan buku audio.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

API DeepSeek V4-Pro Mendapat Diskon 75% Hingga 5 Mei, Harga Output Turun Menjadi $0,87 Per Satu Juta Token

Pesan Gate News, 26 April — DeepSeek mengumumkan diskon 75% terbatas untuk harga API V4-Pro, berlaku hingga 5 Mei pukul 15:59 UTC. Setelah diskon, harga per satu juta token adalah: input cache hit $0.03625

GateNews3menit yang lalu

Anthropic Menerapkan Perlindungan Keamanan Pemilu untuk Claude Menjelang Pemilihan Legislatif Paruh Waktu 2026

Anthropic mengumumkan pada hari Jumat serangkaian langkah integritas pemilu yang dirancang untuk mencegah chatbot AI Claude mereka dimanfaatkan sebagai senjata untuk menyebarkan misinformasi atau memanipulasi para pemilih menjelang pemilihan paruh waktu AS 2026 dan kontes besar lainnya di seluruh dunia tahun ini. Berbasis di San Francisco

CryptoFrontier5jam yang lalu

DeepRoute.ai Sistem bantuan mengemudi tingkat lanjut menerobos 300.000 unit kendaraan dideploy: target 1 juta armada kota NOA pada 2026

DeepRoute.ai mengumumkan bahwa sistem bantuan mengemudi tingkat lanjutnya telah dideploy secara kumulatif lebih dari 300.000 kendaraan di Tiongkok, dan dalam setahun terakhir telah membantu menghindari lebih dari 180.000 kali potensi kecelakaan. Target pada tahun 2026 adalah armada kendaraan NOA di tingkat kota mencapai 1.000.000 unit, dengan tingkat penggunaan lebih dari 50%, yang dipandang sebagai kunci untuk komersialisasi skala besar Robotaxi. Langkah ini menunjukkan bahwa self-driving di Tiongkok telah memasuki penggunaan yang lazim, sekaligus membentuk perbedaan dari jalur integrasi vertikal dengan Amerika Serikat, yang memengaruhi urutan waktu rantai pasokan Asia-Pasifik.

ChainNewsAbmedia6jam yang lalu

DeepSeek Merilis Model V4-Pro dan V4-Flash dengan Biaya 98% Lebih Rendah daripada GPT-5.5 Pro Milik OpenAI

Gate News, 25 April — DeepSeek merilis versi pratinjau V4-Pro dan V4-Flash pada 24 April, dua model open-weight dengan jendela konteks satu juta token. V4-Pro memiliki total 1,6 triliun parameter tetapi hanya mengaktifkan 49 miliar per pass inferensi menggunakan arsitektur Mixture-of-Experts.

GateNews11jam yang lalu

Hakim Menolak Klaim Penipuan dalam Gugatan Elon Musk terhadap OpenAI; Perkara Maju ke Persidangan dengan Dua Tuduhan yang Tersisa

Berita Gate, 24 April — Seorang hakim pengadilan federal telah menolak klaim penipuan dari gugatan Elon Musk terhadap OpenAI, Sam Altman, Greg Brockman, dan Microsoft, sehingga membuka jalan bagi perkara untuk dilanjutkan ke persidangan atas dua tuduhan yang tersisa: pelanggaran kepercayaan amal dan pengayaan yang tidak semestinya. AS.

GateNews15jam yang lalu

CEO OpenAI Sam Altman Meminta Maaf karena Gagal Melaporkan Akun Terlarang Pihak Penembak Sekolah ke Polisi

Pesan Berita Gate, 25 April — CEO OpenAI Sam Altman meminta maaf kepada komunitas Tamborine di Kanada atas kegagalan perusahaan tersebut dalam memberi tahu polisi tentang akun terlarang yang dikaitkan dengan Jesse Van Rootselaar, yang membunuh delapan orang di sebuah sekolah pada bulan Februari sebelum mengakhiri hidupnya sendiri. OpenAI

GateNews15jam yang lalu
Komentar
0/400
Tidak ada komentar