ตามรายงานของ PANews เมื่อวันที่ 30 เมษายน Alibaba ได้ประกาศการเปิดซอร์ส Qwen-Scope ซึ่งเป็นโมดูลด้านการตีความ (interpretability) ที่ฝึกบนโมเดลตระกูล Qwen3 และ Qwen3.5 โดยการปล่อยดังกล่าวครอบคลุมโมเดลภาษาขนาดใหญ่ 7 ตัว ในทั้งแบบที่มีความหนาแน่น (dense) และแบบ mixture-of-experts พร้อมด้วยชุดน้ำหนัก sparse autoencoder จำนวน 14 ชุด
btc.bar.articles
DeepSeek เปิดตัววิธี Visual Primitives เพื่อยกระดับการให้เหตุผลแบบมัลติโหมดในวันที่ 30 เมษายน
ตามรายงานทางเทคนิคของ DeepSeek เมื่อวันที่ 30 เมษายน บริษัทได้เปิดตัว Visual Primitives ซึ่งเป็นวิธีที่ฝังหน่วยภาพพื้นฐาน เช่น จุด (points) และกรอบครอบ (bounding boxes) ลงในสายโซ่การให้เหตุผล เพื่อแก้ปัญหา Reference Gap ในงานมัลติโหมด วิธีนี้ช่วยลดการใช้โทเคนของภาพ
GateNews14 นาที ที่แล้ว
NVIDIA เปิดตัวน้ำหนักโมเดลเรือธง Cosmos-Reason2-32B และขยายขนาดบริบทเป็น 256K โทเค็น
ตาม Beating NVIDIA ได้เปิดตัวน้ำหนัก (weights) สำหรับ Cosmos-Reason2-32B ซึ่งเป็นรุ่นเรือธงของโมเดลการให้เหตุผลเชิงกายภาพด้านวิสัยทัศน์-ภาษา (VLM) ที่ออกแบบมาเพื่อช่วยให้หุ่นยนต์และระบบขับเคลื่อนอัตโนมัติเข้าใจหลักการเชิงพื้นที่ เชิงเวลา และเชิงกายภาพ โมเดลพารามิเตอร์ 32 พันล้าน ซึ่ง
GateNews17 นาที ที่แล้ว
OpenAI เปิดเผยว่าเหตุใด Codex จึงห้ามพูดคำว่า “ก็อบลิน”: การให้รางวัลบุคลิกแบบนักเนิร์ดหลุดการควบคุม
OpenAI ในบล็อกทางการได้อธิบายว่า Codex ถูกห้ามไม่ให้พูดถึงสิ่งมีชีวิตจำพวกก็อบลินและสิ่งมีชีวิตอื่น ๆ เนื่องมาจากสัญญาณรางวัลที่ชอบการเปรียบเทียบกับสิ่งมีชีวิตในกระบวนการฝึกบุคลิกของ “คนขี้หมกมุ่น” ทำให้เกิดการปนเปื้อนข้ามบุคลิกและทำให้ RLHF เข้าใจผิด เหตุการณ์นี้ถูกเปิดโปงโดย Barron Roth หลังจากที่มีการเผยคำสั่งระบบ จากนั้น OpenAI จึงใช้สองกลยุทธ์ ได้แก่ การฮาร์ดโค้ดแบบระยะสั้นและการล้างสัญญาณรางวัลในระยะยาว เพื่อเตือนถึงความเปราะบางของการออกแบบสัญญาณรางวัล และการตรวจสอบหลังการฝึกจำเป็นต้องละเอียดมากขึ้น
ChainNewsAbmedia1 ชั่วโมง ที่แล้ว
เซิร์ฟเวอร์ AI ของ Nvidia B300 ทำยอดทะลุ 1 ล้านดอลลาร์ในจีน ท่ามกลางภาวะขาดแคลนอุปทาน
ตามรายงานของ Reuters เซิร์ฟเวอร์ AI B300 ของ Nvidia ขณะนี้ขายได้ในจีนในราคาโดยประมาณ 7 ล้านหยวน (1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากการปราบปรามเครือข่ายลักลอบนำเข้าอย่างเข้มงวด และความต้องการที่ยังคงสูงจากบริษัทเทคโนโลยีท้องถิ่น ราคาดังกล่าวพุ่งขึ้นจากราว 4 ล้านหยวน (585,000 ดอลลาร์สหรัฐ) ในช่วงปลายปี 2025 อย่างมีนัยสำคัญ
GateNews1 ชั่วโมง ที่แล้ว
กำไรจากการดำเนินงานของ LG CNS เพิ่มขึ้น 19% ในไตรมาส 1 จากการเติบโตของ AI และคลาวด์
ตามรายงานของ Chosun Daily เมื่อวันที่ 30 เมษายน LG CNS รายงานว่ากำไรจากการดำเนินงานไตรมาสแรกเพิ่มขึ้น 19.4% เมื่อเทียบปีต่อปี สู่ 94.2 พันล้านวอน (64.1 ล้านดอลลาร์สหรัฐ) โดยได้รับแรงหนุนจากความต้องการด้าน AI และคลาวด์ รายได้เพิ่มขึ้น 8.6% สู่ 1.3 ล้านล้านวอน (894 ล้านดอลลาร์สหรัฐ)
หน่วยงานด้าน AI และคลาวด์ของบริษัทสร้าง 765.4 พันล้าน
GateNews2 ชั่วโมง ที่แล้ว
OpenAI เปิดตัว GPT-5.5-Cyber: ปะทะ Anthropic Mythos
OpenAI ประกาศเปิดตัว GPT-5.5-Cyber ซึ่งออกแบบมาโดยเฉพาะสำหรับงานด้านความปลอดภัยไซเบอร์ โดยจะนำไปใช้งานด้วยกลไกการเข้าถึงที่เชื่อถือได้ผ่านความร่วมมือกับภาครัฐใน “อีกไม่กี่วันข้างหน้า” สำหรับหน่วยงานป้องกันที่สำคัญเท่านั้น ไม่ใช่เพื่อการจำหน่ายแบบเปิดสาธารณะ เป็นภาพตรงข้ามกับเส้นทางแบบเปิดของ Anthropic Mythos ขณะที่ทำเนียบขาวคัดค้านการขยายไปยัง 70 แห่ง Preparedness Framework ประเมินระดับ High (ยังไม่ถึง critical) พร้อมทั้งเสริมมาตรการป้องกันความปลอดภัยทางไซเบอร์ในทันที ต่อจากนี้ต้องจับตารายชื่อหน่วยงานที่จะได้รับการนำไปใช้งานว่า CISA อาจถูกเพิ่มเข้ารายชื่อหรือไม่ และความแตกต่างของมาตรฐานด้านความปลอดภัยไซเบอร์ระหว่างทั้งสองฝ่าย
ChainNewsAbmedia3 ชั่วโมง ที่แล้ว