ข่าว Gate ประจำวันที่ 23 เมษายน — ทีม Seed ของ ByteDance ได้เปิดตัว Seed3D 2.0 ซึ่งเป็นโมเดลแปลงข้อความเป็น 3D ที่สร้างแอสเซ็ต 3D พร้อมพื้นผิวจากภาพเพียงภาพเดียว การอัปเกรดเน้นความแม่นยำเชิงเรขาคณิตและความสมจริงของวัสดุ โดยตอนนี้ API พร้อมให้ใช้งานบน Volcano Ark การสร้างเชิงเรขาคณิตใช้กลยุทธ์สองขั้นแบบ Coarse-to-Fine โดยโมเดล DiT ที่มีพารามิเตอร์จำนวนมากจะสร้างโครงสร้างโทโพโลยีแบบหยาบก่อน จากนั้นจึงฟื้นขอบที่คมชัดและพื้นผิวละเอียดขึ้น การสร้างวัสดุใช้สถาปัตยกรรม Mixture of Experts (MoE) เพื่อยกระดับรายละเอียดความละเอียดสูง พร้อมทั้งผสาน Vision Language Model (VLM) priors เพื่อเพิ่มเสถียรภาพของการแยกสลายวัสดุภายใต้สภาพแสงที่ไม่ทราบแน่ชัด โดยให้ผลลัพธ์เป็นแผนที่ PBR แบบครบชุดที่เข้ากันได้กับไพพ์ไลน์การเรนเดอร์มาตรฐาน ผู้ประเมินจำนวน 60 คนที่มีประสบการณ์ด้านการสร้างแบบจำลอง 3D ได้ทำการเปรียบเทียบแบบไม่รู้ข้อมูล (blind comparisons) ในเคสทดสอบประมาณ 200 เคส โดยเปรียบเทียบ Seed3D 2.0 กับ Hunyuan3D-2.5/3.1, Tripo 3.0, Rodin Gen2, HiTem v2.0 และ Seed3D 1.0 รุ่นก่อนหน้า อัตราความชอบสำหรับการสร้างเชิงเรขาคณิตอยู่ระหว่าง 65.1% ถึง 98.3% ขณะที่อัตราความชอบสำหรับแอสเซ็ต 3D แบบมีพื้นผิวสูงกว่า 69% ในทุกการเปรียบเทียบ สำหรับการใช้งานต่อยอด Seed3D 2.0 สามารถแยกแอสเซ็ต 3D ออกเป็นส่วนประกอบอิสระพร้อมข้อมูลร่วมกัน โดยส่งออกในรูปแบบ URDF ที่เข้ากันได้กับ Isaac Sim และเอนจินจำลองอื่น ๆ สำหรับสถานการณ์ปฏิสัมพันธ์แบบไดนามิก เช่น การจับยึดด้วยหุ่นยนต์ ในระดับซีน รองรับอินพุตแบบข้อความ ภาพหลายมุมมอง หรือวิดีโอ โดยรวมแอสเซ็ตหลายชิ้นเพื่อสร้างซีนที่สมบูรณ์
btc.bar.articles
Worxphere รีแบรนด์ JobKorea ด้วยเครื่องมือการจ้างงานที่ขับเคลื่อนด้วย AI
Olenox ประกาศการควบรวมกิจการกับ CS Digital เพื่อพัฒนาโอกาสในการขุด Bitcoin แบบนอกโครงข่ายที่มีต้นทุนต่ำ
ComfyUI ระดมทุนได้ $30M ที่มูลค่า $500M ในรอบที่มี Craft Ventures เป็นผู้นำ
XChat เปิดตัวบน App Store พร้อมการเข้ารหัสแบบเอนด์ทูเอนด์และการผสาน Grok
DeepSeek V4-Flash ขึ้นบน Ollama Cloud, โฮสต์ในสหรัฐอเมริกา: Claude Code, OpenClaw เชื่อมต่อด้วยปุ่มเดียว