ข่าวประจำเกต Gate News วันที่ 10 เมษายน Tencent Hunyuan เปิดตัวโมเดลพื้นฐานสำหรับปัญญาเชิงกายภาพ HY-Embodied-0.5 โดยเวอร์ชันพารามิเตอร์ 2B ได้เปิดซอร์สอย่างเป็นทางการแล้ว ชุดโมเดลนี้ออกแบบมาเพื่อเอเจนต์ปัญญาเชิงกายภาพในโลกความจริง โดยเน้นการพัฒนาความสามารถในการรับรู้มิติด้านเวลา-พื้นที่และการอนุมานเชิงกายภาพ สามารถนำไปใช้ในสถานการณ์ต่างๆ เช่น การคาดการณ์สภาพแวดล้อม การปฏิสัมพันธ์และการลงมือปฏิบัติ และการวางแผนงาน
ตระกูลโมเดลนี้มี 2 เวอร์ชันคือ 2B และ 32B: โมเดล 2B มุ่งเป้าไปที่อุปกรณ์ขอบและการปรับใช้แบบเบาน้ำหนัก ส่วนโมเดล 32B ใช้สำหรับงานอนุมานที่ซับซ้อนและการตัดสินใจที่มีความฉลาดระดับสูง ในแง่สถาปัตยกรรมทางเทคนิค HY-Embodied-0.5 ได้นำกลไก Mixture-of-Transformers(MoT)มาใช้เพื่อให้เกิดการแบ่งงานคำนวณสำหรับหลายโมดัล ผ่าน Token ที่อยู่ในเชิงศักย์เพื่อยกระดับความสามารถในการแสดงความหมายเชิงการรับรู้ ผสานการฝึกหลังการวิวัฒนาการด้วยตนเอง (self-evolving post-training) และวิธีการกลั่นด้วยการอิงนโยบาย (policy-based distillation) เพื่อทำให้การเพิ่มประสิทธิภาพแบบร่วมมือกันระหว่างโมเดลขนาดเล็กและขนาดใหญ่เกิดขึ้น
ด้านประสิทธิภาพ ชุดโมเดลนี้ทำผลงานเด่นในการทดสอบมาตรฐาน 22 รายการ โดยโมเดล 2B ทำได้ดีกว่าโมเดล SOTA ในขนาดเดียวกันใน 16 งาน เวอร์ชัน 32B เข้าใกล้ระดับแนวหน้าแล้ว แสดงให้เห็นความสามารถในการทำให้การปรับใช้ปัญญาเชิงกายภาพทั่วไปได้ดีและศักยภาพในการใช้งานจริงที่แข็งแกร่ง
btc.bar.articles
พาร์ทเนอร์ของ Y Combinator แบ่งปันวิธีใช้ AI เพื่อเริ่มต้นสร้างบริษัทตั้งแต่ศูนย์ และสตาร์ทอัพควรมอง AI เป็นระบบปฏิบัติการ ไม่ใช่เครื่องมือ
ผลกระทบของ AI ต่อบริษัทสตาร์ทอัพ ไม่ใช่แค่ทำให้นักพัฒนาเขียนโค้ดได้เร็วขึ้น ปรับกระบวนการบริการลูกค้าให้เป็นอัตโนมัติ หรือเพิ่ม Copilot เข้าไปในผลิตภัณฑ์ที่มีอยู่แล้ว เพิ่งเร็วๆ นี้ พาร์ทเนอร์ของ YC อย่าง Diana ชี้ว่า ความเปลี่ยนแปลงที่แท้จริงอยู่ที่ AI กำลัง “เขียนใหม่” ว่าบริษัทควรจะถูกสร้างขึ้นจากศูนย์อย่างไร สำหรับผู้ก่อตั้งในระยะเริ่มต้น AI ไม่ควรเป็นแค่เครื่องมือเพิ่มประสิทธิภาพที่บริษัทใช้เป็นครั้งคราว แต่ควรถูกออกแบบให้เป็นระบบปฏิบัติการของทั้งบริษัทตั้งแต่วันแรก
มุมมองด้านประสิทธิภาพการผลิตล้าสมัยแล้ว AI กำลังเปลี่ยนจุดเริ่มต้นการออกแบบของบริษัท
Diana เห็นว่า ในตอนนี้ เมื่อพูดถึง AI ในตลาด มักยังคงติดอยู่กับกรอบ “การเพิ่มประสิทธิภาพการผลิต” เช่น วิศวกรสามารถเขียนโค้ดได้เร็วขึ้น ทีมสามารถทำให้กระบวนการต่างๆ เป็นอัตโนมัติมากขึ้น บริษัทสามารถเปิดตัวฟีเจอร์ได้มากขึ้น แต่คำกล่าวนี้กลับประเมินการเปลี่ยนแปลงเชิงโครงสร้างที่ AI นำมามาต่ำเกินไป เธอชี้ว่า การจับคู่อย่างถูกต้องกับ AI 工
ChainNewsAbmedia11 นาที ที่แล้ว
เอเจนต์ Cursor AI ทำงานพลาด! โค้ดบรรทัดเดียวล้างข้อมูลฐานข้อมูลของบริษัทภายใน 9 วินาที การรักษาความปลอดภัยกลายเป็นแค่คำพูดลอยๆ
ผู้ก่อตั้ง PocketOS อย่าง Jer Crane ระบุว่า Cursor AI agent ได้ดำเนินการบำรุงรักษาโดยตัวมันเองในสภาพแวดล้อมทดสอบ ใช้ประโยชน์จาก token ของ API ที่เพิ่ม/ลบโดเมนที่กำหนดเองอย่างไม่เหมาะสม เพื่อส่งคำสั่งลบไปยัง Railway's GraphQL API ภายใน 9 วินาที ข้อมูลและสแนปช็อตในโซนเดียวกันถูกทำลายทั้งหมด โดยล่าสุดสามารถกู้คืนได้ถึงสามเดือนก่อนเท่านั้น เอเจนต์ยอมรับว่ามีการละเมิดข้อกำหนดสำหรับการดำเนินการที่ไม่สามารถย้อนกลับได้ ไม่ได้อ่านเอกสารทางเทคนิค และไม่ได้ตรวจสอบการแยกสภาพแวดล้อม ผู้เสียหายคือกลุ่มลูกค้าธุรกิจให้เช่ารถ การจองและข้อมูลทั้งหมดหายไป และต้องใช้เวลานานสำหรับวิศวกรรมการปรับยอด Crane เสนอการปฏิรูป 5 ข้อ: การยืนยันด้วยมือ สิทธิ API แบบละเอียด แยกการสำรองข้อมูลกับข้อมูลหลัก เผยแพร่ SLA และกลไกบังคับในระดับพื้นฐาน
ChainNewsAbmedia13 นาที ที่แล้ว
DeepSeek V4 Pro บน Ollama Cloud: เชื่อมต่อ Claude Code แบบกดครั้งเดียว
ตามทวีตของ Ollama DeepSeek V4 Pro เปิดตัวเมื่อ 4/24 ได้ถูกเพิ่มเข้าไปในไดเรกทอรีของ Ollama ในโหมดคลาวด์ และสามารถเรียกใช้เครื่องมือต่างๆ เช่น Claude Code, Hermes, OpenClaw, OpenCode, Codex ฯลฯ ได้ด้วยคำสั่งเดียวเท่านั้น V4 Pro1.6T พารามิเตอร์, context 1M, Mixture-of-Experts; การอนุมานบนคลาวด์ไม่ดาวน์โหลดน้ำหนัก (weights) ลงในเครื่อง หากต้องการใช้งานแบบโลคอลให้ดาวน์โหลด weights ด้วยตนเอง และรันด้วย INT4/GGUF และ GPU หลายการ์ด การทดสอบความเร็วในช่วงแรกได้รับผลกระทบจากภาระงานของคลาวด์ โดยค่าปกติอยู่ที่ประมาณ 30 tok/s และค่าสูงสุด 1.1tok/s; แนะนำให้ใช้ต้นแบบบนคลาวด์ เมื่อเข้าสู่การผลิตจำนวนมากแล้วค่อยทำการอนุมานด้วยตนเองหรือใช้ API เชิงพาณิชย์
ChainNewsAbmedia1 ชั่วโมง ที่แล้ว
DeepSeek ลดราคาของ V4-Pro ลง 75%, ตัดค่าใช้จ่ายแคชของ API เหลือเพียงหนึ่งในสิบ
ประกาศ Gate News วันที่ 27 เมษายน — DeepSeek ประกาศส่วนลด 75% สำหรับโมเดลใหม่ V4-Pro ของตนสำหรับนักพัฒนา และลดราคาการเข้าถึงแคชอินพุตทั่วทั้งไลน์อัป API เหลือเพียงหนึ่งในสิบของระดับเดิม
โมเดล V4 ซึ่งเปิดตัวเมื่อวันที่ 25 เมษายนในเวอร์ชัน Pro และ Flash ได้รับการปรับให้เหมาะสมสำหรับโปรเซสเซอร์ Ascend ของ Huawei
GateNews1 ชั่วโมง ที่แล้ว
Coachella หันไปใช้ AI ของ DeepMind ของ Google เพื่อจินตนาการคอนเสิร์ตใหม่ให้ก้าวไปไกลกว่าบนเวที
Coachella ได้ร่วมมือกับ Google DeepMind เพื่อทดสอบเครื่องมือ AI ชุดใหม่ที่เปลี่ยนวิธีการสร้างและประสบการณ์ที่ผู้คนได้รับจากการแสดงดนตรีสด
สรุป
Coachella ได้ทดสอบเครื่องมือ AI กับ Google DeepMind เพื่อเปลี่ยนการแสดงสดให้กลายเป็นสภาพแวดล้อมดิจิทัลแบบโต้ตอบ
ได้มีการสร้างต้นแบบสามชิ้นแล้ว,
Cryptonews1 ชั่วโมง ที่แล้ว