ข่าว Gate News วันที่ 22 เมษายน — Google Research เปิดตัว ReasoningBank ซึ่งเป็นกรอบงานหน่วยความจำของเอเจนต์ที่ช่วยให้เอเจนต์ที่ขับเคลื่อนด้วยโมเดลภาษาขนาดใหญ่สามารถเรียนรู้อย่างต่อเนื่องหลังการใช้งานจริง กรอบงานจะสกัดกลยุทธ์การให้เหตุผลทั่วไปจากทั้งประสบการณ์ที่ทำสำเร็จและที่ทำไม่สำเร็จ โดยเก็บไว้ในแหล่งหน่วยความจำเพื่อใช้ค้นคืนและดำเนินการในงานในอนาคตที่คล้ายกัน กระดาษที่เกี่ยวข้องถูกเผยแพร่ที่ ICLR และโค้ดถูกเปิดซอร์สบน GitHub.
ReasoningBank พัฒนาต่อยอดจากแนวทางที่มีอยู่ 2 แบบ ได้แก่ Synapse ซึ่งบันทึกเส้นทางการกระทำแบบครบถ้วนแต่มีความสามารถในการถ่ายโอนจำกัดเนื่องจากความละเอียดที่ละเอียดเกินไป และ Agent Workflow Memory ซึ่งเรียนรู้จากกรณีที่ทำสำเร็จเท่านั้น ReasoningBank ทำการเปลี่ยนแปลงสำคัญ 2 ประการ: การเก็บ “รูปแบบการให้เหตุผล” แทนที่จะเป็น “ลำดับการกระทำ” โดยหน่วยความจำแต่ละรายการมีฟิลด์เชิงโครงสร้างสำหรับชื่อ คำอธิบาย และเนื้อหา; และการนำเส้นทางที่ล้มเหลวมาใช้ในการเรียนรู้ กรอบงานใช้โมเดลเพื่อประเมินเส้นทางการปฏิบัติอย่างละเอียดด้วยตัวเอง แปลงประสบการณ์ความล้มเหลวให้กลายเป็นกฎเพื่อหลีกเลี่ยงกับดัก ตัวอย่างเช่น กฎ “คลิกปุ่ม Load More เมื่อเห็น” จะพัฒนาไปเป็น “ตรวจสอบตัวระบุหน้าปัจจุบันก่อน หลีกเลี่ยงลูปการเลื่อนอย่างไม่สิ้นสุด แล้วค่อยคลิก load more”
บทความยังนำเสนอ Memory-aware Test-time Scaling (MaTTS) ซึ่งจัดสรรกำลังประมวลผลเพิ่มเติมระหว่างการอนุมานเพื่อสำรวจเส้นทางหลายแบบ และจัดเก็บข้อค้นพบไว้ในแหล่งหน่วยความจำ การขยายแบบขนานรันเส้นทางที่แตกต่างกันหลายชุดสำหรับงานเดียวกัน โดยปรับปรุงกลยุทธ์ที่ทนทานยิ่งขึ้นผ่านการเปรียบเทียบด้วยตนเอง ส่วนการขยายแบบต่อเนื่องจะปรับปรุงเส้นทางเดียวแบบวนซ้ำ โดยเก็บเหตุผลระดับกลางไว้ในหน่วยความจำ.
ในงานท่องเว็บของ WebArena และงานโค้ดดิ้ง SWE-Bench-Verified โดยใช้ Gemini 2.5 Flash เป็นเอเจนต์แบบ ReAct ReasoningBank ทำอัตราความสำเร็จได้สูงขึ้น 8.3% บน WebArena และสูงขึ้น 4.6% บน SWE-Bench-Verified เมื่อเทียบกับฐานที่ไม่มีหน่วยความจำ ลดจำนวนขั้นเฉลี่ยต่อภารกิจลงประมาณ 3 เมื่อเพิ่ม MaTTS ด้วยการขยายแบบขนาน (k=5) ยิ่งทำให้อัตราความสำเร็จบน WebArena ดีขึ้นอีก 3 จุดเปอร์เซ็นต์ และลดขั้นเพิ่มเติมได้อีก 0.4.
btc.bar.articles
OpenAI สรรหาบุคลากรซอฟต์แวร์องค์กรชั้นนำ ขณะที่เอเจนต์แนวหน้ากำลังพลิกโฉมอุตสาหกรรม
Worxphere รีแบรนด์ JobKorea ด้วยเครื่องมือการจ้างงานที่ขับเคลื่อนด้วย AI
AI Agent สามารถสร้างซ้ำงานวิจัยทางวิชาการที่ซับซ้อนได้อย่างอิสระแล้ว: Mollick ระบุว่าข้อผิดพลาดส่วนใหญ่มาจากต้นฉบับของมนุษย์ ไม่ใช่จาก AI
สหรัฐอาหรับเอมิเรตส์ประกาศการเปลี่ยนผ่านสู่โมเดลรัฐบาลที่ขับเคลื่อนด้วย AI ภายในสองปีข้างหน้า
แพลตฟอร์มเทรดด้วย AI อย่าง Fere AI ระดมทุนได้ 1.3 ล้านดอลลาร์ นำโดย Ethereal Ventures
Nvidia ปรับใช้เอเจนต์ AI Codex ของ OpenAI ทั่วทั้งองค์กรบนโครงสร้างพื้นฐาน Blackwell