Google เปิดตัว Gemini 3.1 Flash TTS พร้อมการแสดงอารมณ์ที่ดีขึ้นและความสามารถหลายผู้พูด

ข้อความจาก Gate News วันที่ 17 เมษายน — Google เปิดตัว Gemini 3.1 Flash TTS ซึ่งเป็นโมเดลแปลงข้อความเป็นเสียงขั้นสูง พร้อมฟีเจอร์การแสดงอารมณ์และการควบคุมที่ได้รับการปรับปรุง เมื่อวันที่ 15 เมษายน โมเดลใหม่นี้จะทยอยเปิดให้ใช้งานผ่าน API สำหรับนักพัฒนา Vertex AI ระดับองค์กร และเครื่องมือสำหรับการทำงานร่วมกัน

ความสามารถหลักของโมเดล ได้แก่ แท็กเสียงที่อิงตามภาษาธรรมชาติสำหรับการปรับแต่งความเร็ว อินโทเนชัน และอารมณ์ รวมถึง “Director Mode” สำหรับการระบุฉากและบทบาทตัวละครเพื่อสร้างผลลัพธ์เสียงที่มีความละเมียดมากขึ้น ฟีเจอร์หลายผู้พูดช่วยให้สร้างบทสนทนาแบบพร้อมกัน ทำให้การไหลของการสนทนามีความเป็นธรรมชาติมากขึ้น เหมาะสำหรับพอดแคสต์ คอนเทนต์เสียง และผู้ช่วย AI โมเดลรองรับมากกว่า 70 ภาษาและภาษาถิ่น สะท้อนสำเนียงและสำนวนตามภูมิภาคเพื่อประสบการณ์เสียงที่ปรับให้เข้ากับท้องถิ่นทั่วโลก

Google เน้นทั้งประสิทธิภาพและความคุ้มค่าด้านต้นทุน โดยทำคะแนนได้สูงในเกณฑ์ประเมินของมนุษย์แบบไม่ระบุว่าเป็นใคร ในขณะเดียวกันก็ลดค่าใช้จ่ายด้านการคำนวณผ่านสถาปัตยกรรมแบบ Flash ซึ่งออกแบบมาเพื่อการนำไปใช้ในองค์กรขนาดใหญ่เชิงระบบ เสียงที่สร้างขึ้นมาพร้อมการฝังลายน้ำ SynthID เพื่อระบุคอนเทนต์ที่สร้างโดย AI และต่อสู้กับข้อมูลที่บิดเบือน

ความเคลื่อนไหวนี้สะท้อนการแข่งขันที่เข้มข้นขึ้นในส่วนต่อประสานเสียง OpenAI กำลังผสานฟีเจอร์เสียงแบบเรียลไทม์เข้ากับ AI เชิงสนทนาเพื่อการมีปฏิสัมพันธ์ที่เหมือนมนุษย์ ขณะที่ Meta กำลังขยายการลงทุนในตัวละคร AI พร้อมประสบการณ์ทางสังคมที่ขับเคลื่อนด้วยเสียง ผู้สังเกตการณ์ในอุตสาหกรรมมองว่าแม้งานแสดงและงานสร้างสรรค์ระดับสูงอาจยังคงขับเคลื่อนโดยมนุษย์ในตอนนี้ แต่ตลาดการผลิตที่ซ้ำๆ และขนาดใหญ่ อาจเห็นการนำ AI ไปใช้แบบค่อยเป็นค่อยไปในด้านพากย์โฆษณา การโฆษณา และหมวดสำนักพิมพ์เสียง (audiobook)

news.article.disclaimer

btc.bar.articles

DeepSeek มองหาเงินทุน 1.8 พันล้านดอลลาร์ที่การประเมินมูลค่า $20B ท่ามกลางการแย่งตัวบุคลากร

ข้อความ Gate News วันที่ 25 เมษายน — DeepSeek กำลังวางแผนจะระดมทุน 1.8 พันล้านดอลลาร์ โดยประเมินมูลค่าบริษัทไว้ที่ประมาณ $20 billion ตามแหล่งข่าวที่คุ้นเคยกับเรื่องนี้ การระดมทุนครั้งนี้เกิดขึ้นขณะที่สตาร์ทอัพด้าน AI กำลังเผชิญกับการสูญเสียบุคลากรที่มีนัยสำคัญ โดยนักวิจัยแกนหลักหลายคนได้ออกจากบริษัทเพื่อไปเข้าร่วมกับ ByteDance, Tencent, Xiaomi และบริษัทเทคโนโลยีขับเคลื่อนอัตโนมัติ Horizon Robotics.

GateNews4 ชั่วโมง ที่แล้ว

ผู้พิพากษายกฟ้องข้อกล่าวอ้างเรื่องการฉ้อโกงในคดีของ Elon Musk ต่อ OpenAI; คดีเดินหน้าสู่การพิจารณาคดีด้วยข้อกล่าวหาที่เหลืออยู่ 2 ประการ

ข่าวประตู ข่าวเมื่อวันที่ 24 เมษายน — ผู้พิพากษาศาลรัฐบาลกลางได้ยกฟ้องข้อกล่าวอ้างเรื่องการฉ้อโกงจากคดีความของ Elon Musk ที่ยื่นฟ้อง OpenAI, Sam Altman, Greg Brockman และ Microsoft ซึ่งทำให้คดีสามารถเดินหน้าสู่การพิจารณาคดีได้ โดยยังคงเหลือข้อกล่าวหาอีก 2 ประการ: การละเมิดความไว้วางใจทางการกุศล และการได้รับประโยชน์โดยไม่เป็นธรรม U.S.

GateNews8 ชั่วโมง ที่แล้ว

ซีอีโอของ OpenAI แซม อัลท์แมน ขอโทษที่ไม่รายงานบัญชีที่ถูกแบนของมือปืนในโรงเรียนต่อเจ้าหน้าที่ตำรวจ

ข่าวประตูเมือง, 25 เมษายน — ประธานเจ้าหน้าที่บริหารของ OpenAI แซม อัลท์แมน ได้ขอโทษชุมชนแทมโบรีนในแคนาดา สำหรับความล้มเหลวของบริษัทในการแจ้งตำรวจเกี่ยวกับบัญชีที่ถูกแบนซึ่งเชื่อมโยงกับเจสซี แวน รูทเซลาร์ ผู้ซึ่งฆ่าคนแปดคนที่โรงเรียนในเดือนกุมภาพันธ์ ก่อนจะจบชีวิตตัวเอง OpenAI

GateNews8 ชั่วโมง ที่แล้ว

สหรัฐอาหรับเอมิเรตส์ประกาศการเปลี่ยนผ่านสู่โมเดลรัฐบาลที่ขับเคลื่อนด้วย AI ภายในสองปีข้างหน้า

สมเด็จพระอาตะหก ชีค โมฮัมเหม็ด บิน ราชิด อัล มักตูม ได้กล่าวว่า เป้าหมายคือให้ภาคส่วนของรัฐบาล 50% ดำเนินการผ่าน AI แบบเอเจนต์อัตโนมัติ การเปลี่ยนผ่านดังกล่าวจะรวมถึงการฝึกอบรมพนักงานระดับสหพันธรัฐให้ “เชี่ยวชาญ AI” และจะอยู่ภายใต้การกำกับดูแลของชีค มันซูร์ บิน ซาเยด หัวข้อสำคัญ:

Coinpedia8 ชั่วโมง ที่แล้ว

แพลตฟอร์มเทรดด้วย AI อย่าง Fere AI ระดมทุนได้ 1.3 ล้านดอลลาร์ นำโดย Ethereal Ventures

ข้อความจาก Gate News ประจำวันที่ 25 เมษายน — Fere AI ซึ่งเป็นแพลตฟอร์มการเทรดสินทรัพย์ดิจิทัลที่ขับเคลื่อนด้วย AI ประกาศเสร็จสิ้นการระดมทุนมูลค่า 1.3 ล้านดอลลาร์ ซึ่งนำโดย Ethereal Ventures โดยมี Galaxy Vision Hill และ Kosmos Ventures เข้าร่วม ตามข้อมูลจาก Globenewswire แพลตฟอร์มรองรับเครือข่ายข้ามสายโซ่

GateNews9 ชั่วโมง ที่แล้ว

Google ลงทุนเพิ่ม 40 พันล้านดอลลาร์ใน Anthropic: จ่ายล่วงหน้า 10 พันล้านก่อน แล้วปล่อย 30 พันล้านตามผลการดำเนินงาน พร้อมจัดสรรกำลังประมวลผล TPU 5GW

Alphabet เพิ่มการลงทุนให้กับ Anthropic อีกเป็น 40,000 ล้านดอลลาร์สหรัฐ แบ่งเป็น 2 ระยะ: เงินงวดแรก 10,000 ล้านดอลลาร์สหรัฐ ฉีดเข้ากระแสเงินสด คิดมูลค่า 380,000 ล้านดอลลาร์สหรัฐ; ส่วนที่เหลือ 30,000 ล้านดอลลาร์สหรัฐ จะปล่อยออกเป็นระยะหลังจากบรรลุเป้าหมายผลการดำเนินงานแล้ว Google Cloud จัดหาทรัพยากรคอมพิวต์ TPU 5 GW ภายใน 5 ปี; ในช่วงเวลาเดียวกัน Amazon ก็ประกาศการลงทุนสูงสุด 25,000 ล้านดอลลาร์สหรัฐเช่นกัน ซึ่งแสดงให้เห็นว่าการสนับสนุนด้านประสิทธิภาพการประมวลผลและเงินทุนของ Anthropic ได้เพิ่มพูนขึ้นอย่างสอดคล้องกัน

ChainNewsAbmedia10 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น