Google Meluncurkan Gemini 3.1 Flash TTS dengan Ekspresi Emosional yang Ditingkatkan serta Kemampuan Multi-Pembicara

Pesan Gate News, 17 April — Google mengungkap Gemini 3.1 Flash TTS, model text-to-speech canggih dengan fitur ekspresi emosional dan kontrol yang ditingkatkan, pada 15 April. Model baru akan diluncurkan secara bertahap melalui API pengembang, Vertex AI untuk perusahaan, serta alat kolaborasi.

Kemampuan inti model ini mencakup tag audio berbasis bahasa alami untuk penyetelan kecepatan, intonasi, dan emosi, ditambah “Director Mode” untuk menentukan adegan dan peran karakter guna menghasilkan keluaran suara yang lebih bernuansa. Fitur multi-pembicara memungkinkan pembuatan dialog secara simultan, sehingga menghasilkan alur percakapan yang lebih natural dan cocok untuk podcast, konten audio, serta asisten AI. Model ini mendukung lebih dari 70 bahasa dan dialek, mencerminkan aksen dan ekspresi regional untuk pengalaman suara lokal di seluruh dunia.

Google menekankan performa dan efisiensi biaya, meraih skor tinggi pada tolok ukur evaluasi manusia buta (blind) sambil menurunkan biaya komputasi melalui arsitektur Flash—yang dirancang untuk adopsi skala besar di perusahaan. Audio yang dihasilkan menyertakan watermark SynthID untuk mengidentifikasi konten yang dihasilkan AI dan melawan misinformasi.

Langkah ini mencerminkan persaingan yang semakin ketat dalam antarmuka suara. OpenAI menggabungkan fitur suara real-time dengan AI percakapan untuk interaksi yang menyerupai manusia, sementara Meta memperluas investasi pada karakter AI dengan pengalaman sosial berbasis suara. Pengamat industri mencatat bahwa meskipun akting tingkat tinggi dan pekerjaan kreatif mungkin tetap digerakkan manusia untuk saat ini, pasar produksi yang berulang dan berskala besar bisa melihat adopsi AI secara bertahap dalam sektor dubbing, periklanan, dan buku audio.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

DeepSeek Mencari Pendanaan $1,8B dengan Penilaian $20B di Tengah Eksodus Talenta

Pesan Berita Gate, 25 April — DeepSeek berencana menggalang dana sebesar $1,8 miliar, menilai perusahaan itu pada sekitar $20 miliar, menurut sumber yang mengetahui masalah tersebut. Dorongan penggalangan dana ini muncul ketika perusahaan rintisan AI tersebut menghadapi penurunan karyawan berbakat yang signifikan, dengan beberapa peneliti inti berangkat untuk

GateNews3jam yang lalu

Hakim Menolak Klaim Penipuan dalam Gugatan Elon Musk terhadap OpenAI; Perkara Maju ke Persidangan dengan Dua Tuduhan yang Tersisa

Berita Gate, 24 April — Seorang hakim pengadilan federal telah menolak klaim penipuan dari gugatan Elon Musk terhadap OpenAI, Sam Altman, Greg Brockman, dan Microsoft, sehingga membuka jalan bagi perkara untuk dilanjutkan ke persidangan atas dua tuduhan yang tersisa: pelanggaran kepercayaan amal dan pengayaan yang tidak semestinya. AS.

GateNews7jam yang lalu

CEO OpenAI Sam Altman Meminta Maaf karena Gagal Melaporkan Akun Terlarang Pihak Penembak Sekolah ke Polisi

Pesan Berita Gate, 25 April — CEO OpenAI Sam Altman meminta maaf kepada komunitas Tamborine di Kanada atas kegagalan perusahaan tersebut dalam memberi tahu polisi tentang akun terlarang yang dikaitkan dengan Jesse Van Rootselaar, yang membunuh delapan orang di sebuah sekolah pada bulan Februari sebelum mengakhiri hidupnya sendiri. OpenAI

GateNews7jam yang lalu

UEA Mengumumkan Peralihan Ke Model Pemerintahan Berbasis AI dalam Dua Tahun Ke Depan

Yang Mulia Syekh Mohammed bin Rashid Al Maktoum menyatakan bahwa tujuannya adalah agar 50% sektor pemerintahan beroperasi melalui agen AI otonom. Transisi ini juga akan mencakup pelatihan pegawai federal untuk “menguasai AI” dan akan diawasi oleh Syekh Mansour bin Zayed. Poin-Poin Penting:

Coinpedia7jam yang lalu

Platform Perdagangan AI Fere AI Menggalang $1,3M dalam Pendanaan yang Dipimpin oleh Ethereal Ventures

Pesan Berita Gate, 25 April — Fere AI, platform perdagangan aset digital berbasis AI, mengumumkan penyelesaian putaran pendanaan sebesar $1,3 juta yang dipimpin oleh Ethereal Ventures, dengan partisipasi dari Galaxy Vision Hill dan Kosmos Ventures, menurut Globenewswire. Platform ini mendukung jaringan lintas-rantai

GateNews8jam yang lalu

Google menambah investasi sebesar 40 miliar dolar ke Anthropic: membayar lebih dulu 10 miliar, lalu melepaskan 30 miliar berdasarkan kinerja, dengan dukungan komputasi 5GW TPU

Alphabet menambah dukungan untuk Anthropic hingga 40 miliar dolar, dalam dua tahap: tahap pertama penyuntikan kas 10 miliar dolar, valuasi 380 miliar dolar; sisa 30 miliar dolar dilepaskan secara bertahap setelah target kinerja tercapai. Google Cloud menyediakan sumber daya komputasi TPU sebesar 5 GW dalam lima tahun; pada saat yang sama, Amazon juga mengumumkan investasi maksimum 25 miliar dolar, menunjukkan bahwa dukungan daya komputasi dan modal untuk Anthropic meningkat secara bersamaan.

ChainNewsAbmedia9jam yang lalu
Komentar
0/400
Tidak ada komentar