This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
กูเกิลเพิ่งกลายเป็นบริษัทเดียวที่สามารถสร้างข้อความ รูปภาพ วิดีโอ และเพลงภายในแอปเดียว
lyria 3 เปิดตัววันนี้ นี่คือเหตุผลที่มันสำคัญกว่าที่คนคิด
คะแนนบอร์ดมัลติโหมดในตอนนี้:
Google Gemini: ข้อความ ✅ รูปภาพ ✅ วิดีโอ ✅ เพลง ✅
OpenAI: ข้อความ ✅ รูปภาพ ✅ วิดีโอ ✅ เพลง ❌ (กำลังมา)
Meta: ข้อความ ✅ รูปภาพ ✅ วิดีโอ ✅ เพลง ❌
Anthropic: ข้อความ ✅ รูปภาพ ❌ วิดีโอ ❌ เพลง ❌
กูเกิลเพิ่งตรวจสอบทุกกล่องเป็นอันดับแรก
lyria 3 ทำข้อความเป็นเพลง, รูปภาพเป็นเพลง, และวิดีโอเป็นเพลง 30 วินาที พร้อมเนื้อเพลงที่ปรับแต่งได้ คุณอัปโหลดรูปภาพของสุนัขของคุณ แล้วมันเขียนเพลงเกี่ยวกับสุนัขของคุณ
โง่ไหม? อาจจะ แต่แบบนี้คือจุดเริ่มต้นของการนำไปใช้
สตาร์ทอัป AI ด้านดนตรีที่ทุ่มเทควรให้ความสนใจ
suno ทำรายได้ 200 ล้านดอลลาร์ต่อปี ระดมทุนที่มูลค่า 2.45 พันล้านดอลลาร์ มีผู้ใช้ 100 ล้านคนใน 2 ปี udio เจรจา settle กับ universal และ warner elevenlabs เปิดตัวการสร้างเพลงและทำรายได้ $200M ARR
แต่กูเกิลเพิ่งทำให้การสร้างเพลงฟรีในแอปที่คนเป็นพันล้านใช้แล้ว
นี่คือกลยุทธ์การรวมที่ฆ่าสตาร์ทอัป
จำได้ไหมว่าเมื่อแอปสร้างภาพแบบสแตนด์อโลนกลัวว่า dall-e จะถูกรวมเข้าไปใน chatgpt? แผนเดียวกันเลย การมีฟีเจอร์นี้มักจะชนะผลิตภัณฑ์เมื่อการกระจายอยู่ 1000 เท่าใหญ่กว่า
วันนี้ lyria 3 เป็นของเล่น 30 วินาที suno ให้ stems, การเติมภาพ, เพลง 15 นาที, บุคคลเสียง ไม่มีการเปรียบเทียบด้านคุณภาพในตอนนี้
แต่ suno เคยมีความได้เปรียบเดียวกับโมเดลเพลงแรกของกูเกิล แล้ว v2 แล้ว v3 ช่องว่างก็ปิดลงในแต่ละเวอร์ชัน
openai ก็สร้างหนึ่งเช่นกัน พันธมิตรกับนักเรียน Juilliard เพื่อทำ annotation ข้อมูลฝึกสอน รายงานว่าโมเดลเสียงใหม่จะมาในเดือนมีนาคม
แต่ "คาดหวัง" กับ "จัดส่ง" เป็นคำที่แตกต่างกัน กูเกิลจัดส่งวันนี้
กลยุทธ์ของพวกเขาเหมือนกับของกูเกิล รวมทุกอย่างไว้ในบทสนทนาเดียว
"ทำวิดีโอเกี่ยวกับ X ให้ฉันหน่อย ตอนนี้เพิ่มเพลงเข้าไป ตอนนี้เขียนคำบรรยาย"
นั่นคือผลิตภัณฑ์ ไม่ใช่แค่เครื่องสร้างเพลง แต่เป็นเครื่องสร้างทุกอย่าง
ไทม์ไลน์ของมัลติโหมดบอกเล่าเรื่องราวทั้งหมด:
2022: การสร้างข้อความ (ทุกคนวุ่นวาย)
2023: การสร้างภาพ (midjourney ระเบิด)
2024: การสร้างวิดีโอ (sora, runway, kling)
2025: การสร้างเพลง (suno ทำรายได้ 200M)
2026: ทุกอย่างในแอปเดียว จากคำสั่งเดียว
การแข่งขันไม่ได้เกี่ยวกับใครมี AI เพลงที่ดีที่สุด หรือ AI รูปภาพที่ดีที่สุด หรือ AI วิดีโอที่ดีที่สุด
แต่มันเกี่ยวกับใครจะรวมทุกอย่างเข้าด้วยกันเป็นอันดับแรกในแบบที่รู้สึกง่ายดาย
กูเกิลเพิ่งขึ้นนำ
สิ่งที่ฉันจะดูต่อไป:
openai จัดส่งเพลงก่อน Q2 ไหม?
รายได้ของ suno ยังคงอยู่เมื่อกูเกิลรวมการสร้างเพลงฟรีหรือไม่?
"ของเล่น 30 วินาที" จะกลายเป็น "เครื่องมือผลิต 3 นาที" ได้เร็วแค่ไหน?
การแข่งขันมัลติโหมดเพิ่งมีเส้นชัยใหม่