ตามการตรวจสอบ Beating การตรวจจับ NVIDIA เปิดให้ใช้งานน้ำหนักโมเดล Cosmos-Reason2-32B
Cosmos Reason 2 เป็นโมเดล AI เชิงฟิสิกส์สำหรับการวิเคราะห์ภาพและภาษา (VLM) ที่ NVIDIA เปิดตัวเมื่อปลายปีที่แล้ว ซึ่งสามารถประมวลผลภาพ วิดีโอ และข้อความได้โดยเฉพาะ เพื่อสอนให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจพื้นที่ เวลา และกฎฟิสิกส์พื้นฐาน
ในตอนนั้นมีเพียงเวอร์ชันขนาดเล็ก 2 รุ่นคือ 20 พันล้านและ 8 พันล้านพารามิเตอร์เท่านั้น รุ่นเรือธง 320 พันล้านพารามิเตอร์เปิดให้ใช้งานครั้งแรกจนถึงตอนนี้
ฐานข้อมูลคือ 通义千问 Qwen3-VL-32B-Instruct ใบอนุญาตโมเดลเปิดของ NVIDIA สามารถใช้งานเชิงพาณิชย์ได้

ให้วิดีโอการขับรถแก่มัน มันสามารถดูและวิเคราะห์เพื่อประเมินความปลอดภัยในการเลี้ยวขวาได้ในขณะเดียวกัน; ให้ภาพคลังสินค้าแก่มัน มันสามารถระบุพิกัด 2D/3D และกรอบขอบเขตของสินค้าทุกชิ้น
วัตถุประสงค์หลักมีสามด้าน: วิเคราะห์สตรีมวิดีโอของเมืองและโรงงาน, การทำป้ายข้อมูลเซ็นเซอร์แบบกลุ่ม, และเป็นสมองวางแผนสำหรับหุ่นยนต์มนุษย์และยานพาหนะขับเคลื่อนอัตโนมัติ
เมื่อเทียบกับรุ่นก่อนหน้า เพิ่มการตรวจจับเป้าหมายและการระบุเวลาที่แม่นยำ, หน้าต่างบริบทขยายเป็น 256K โทเค็น

news.article.disclaimer

btc.bar.articles

Forefront Tech เสร็จสิ้นการกำหนดราคาการเสนอขาย IPO ของ $100M แล้ว เข้าจดทะเบียนใน Nasdaq ภายใต้รหัส FTHAU

Stocks AI Industry News

ตามรายงานของ ChainCatcher บริษัทจัดหาทุนเพื่อการเข้าซื้อกิจการเฉพาะวัตถุประสงค์ Forefront Tech ได้กำหนดราคาเสนอขายหุ้น IPO มูลค่า 100 ล้านดอลลาร์สหรัฐเสร็จสิ้นเมื่อวันที่ 30 เมษายน และจะเข้าจดทะเบียนใน Nasdaq ภายใต้สัญลักษณ์ FTHAU บริษัทวางแผนจะนำเงินที่ได้ไปใช้แสวงหาโอกาสในการควบรวมกิจการและการเข้าซื้อกิจการในบล็อกเชน, ฟินเทค, ปัญญาประดิษฐ์ และ

GateNews47 นาที ที่แล้ว

Anthropic Claude Code เรียกเก็บเงินเกินจากผู้ใช้ 200.98 ดอลลาร์สหรัฐเนื่องจากบั๊กระบบเรียกเก็บเงิน โดยในตอนแรกปฏิเสธการคืนเงินก่อนจะชดเชยเต็มจำนวน

AI Industry News

จากการติดตามของ Beating บั๊กด้านการเรียกเก็บเงินในบริการ Claude Code ของ Anthropic ทำให้สมาชิกแบบ Max เกินไปถึง 20x ถูกเรียกเก็บเงินเกิน $200.98 สำหรับค่าธรรมเนียมการใช้งานเพิ่มเติม ทั้งที่ใช้งานเพียง 13% ของโควต้ารายเดือน บั๊กดังกล่าวถูกกระตุ้นเมื่อประวัติ commit ของคลังโค้ด git ของผู้ใช้มีตัวอักษรพิมพ์ใหญ่

GateNews1 ชั่วโมง ที่แล้ว

DeepSeek เปิดตัววิธี Visual Primitives เพื่อยกระดับการให้เหตุผลแบบมัลติโหมดในวันที่ 30 เมษายน

AI Industry News

ตามรายงานทางเทคนิคของ DeepSeek เมื่อวันที่ 30 เมษายน บริษัทได้เปิดตัว Visual Primitives ซึ่งเป็นวิธีที่ฝังหน่วยภาพพื้นฐาน เช่น จุด (points) และกรอบครอบ (bounding boxes) ลงในสายโซ่การให้เหตุผล เพื่อแก้ปัญหา Reference Gap ในงานมัลติโหมด วิธีนี้ช่วยลดการใช้โทเคนของภาพ

GateNews1 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัวน้ำหนักโมเดลเรือธง Cosmos-Reason2-32B และขยายขนาดบริบทเป็น 256K โทเค็น

AI Industry News

ตาม Beating NVIDIA ได้เปิดตัวน้ำหนัก (weights) สำหรับ Cosmos-Reason2-32B ซึ่งเป็นรุ่นเรือธงของโมเดลการให้เหตุผลเชิงกายภาพด้านวิสัยทัศน์-ภาษา (VLM) ที่ออกแบบมาเพื่อช่วยให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจหลักการเชิงพื้นที่ เชิงเวลา และเชิงกายภาพ โมเดลพารามิเตอร์ 32 พันล้าน ซึ่ง

GateNews1 ชั่วโมง ที่แล้ว

OpenAI เปิดเผยว่าเหตุใด Codex จึงห้ามพูดคำว่า “ก็อบลิน”: การให้รางวัลบุคลิกแบบนักเนิร์ดหลุดการควบคุม

AI Industry News

OpenAI ในบล็อกทางการได้อธิบายว่า Codex ถูกห้ามไม่ให้พูดถึงสิ่งมีชีวิตจำพวกก็อบลินและสิ่งมีชีวิตอื่น ๆ เนื่องมาจากสัญญาณรางวัลที่ชอบการเปรียบเทียบกับสิ่งมีชีวิตในกระบวนการฝึกบุคลิกของ “คนขี้หมกมุ่น” ทำให้เกิดการปนเปื้อนข้ามบุคลิกและทำให้ RLHF เข้าใจผิด เหตุการณ์นี้ถูกเปิดโปงโดย Barron Roth หลังจากที่มีการเผยคำสั่งระบบ จากนั้น OpenAI จึงใช้สองกลยุทธ์ ได้แก่ การฮาร์ดโค้ดแบบระยะสั้นและการล้างสัญญาณรางวัลในระยะยาว เพื่อเตือนถึงความเปราะบางของการออกแบบสัญญาณรางวัล และการตรวจสอบหลังการฝึกจำเป็นต้องละเอียดมากขึ้น

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

โมดูลการตีความ Qwen-Scope แบบโอเพนซอร์สของ Alibaba เปิดเผยแล้ว ครอบคลุม 7 โมเดล ในวันที่ 30 เมษายน

AI Industry News

ตาม PANews เมื่อวันที่ 30 เมษายน Qwen ของ Alibaba ได้ประกาศการเปิดซอร์ส Qwen-Scope ซึ่งเป็นโมดูลด้านความสามารถในการตีความ (interpretability) ที่ฝึกบนโมเดลตระกูล Qwen3 และ Qwen3.5 โดยการเปิดตัวครอบคลุมโมเดลภาษาขนาดใหญ่ 7 รุ่น ทั้งในแบบ dense และแบบ mixture-of-experts พร้อมด้วย sparse autoencoder จำนวน 14 ชุด

GateNews3 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น