Ramp Labs เสนอแนวทางใหม่สำหรับการแชร์หน่วยความจำแบบหลายเอเจนต์ โดยการใช้โทเคนสูงสุดลดลง 65%

GateNews

ข่าว Gate News วันที่ 11 เมษายน บริษัทโครงสร้างพื้นฐานด้าน AI Ramp Labs เปิดเผยผลการวิจัย “Latent Briefing” โดยบีบอัดแคช KV ของโมเดลขนาดใหญ่โดยตรงเพื่อทำให้เกิดการแชร์ความจำอย่างมีประสิทธิภาพระหว่างระบบหลายเอเจนต์ (multi-agent) ภายใต้เงื่อนไขที่ไม่ทำให้ความแม่นยกลดลง และลดการใช้ Token ได้อย่างมาก ในสถาปัตยกรรมหลายเอเจนต์ที่เป็นกระแสหลัก ผู้ประสานงาน (Orchestrator)จะแยกงานออกและเรียกใช้โมเดลผู้ปฏิบัติงาน (Worker)ซ้ำ ๆ เมื่อระยะเส้นทางการอนุมาน (inference) ยาวขึ้น ปริมาณ Token ก็จะเพิ่มขึ้นแบบทวีคูณ Latent Briefing มีแนวคิดหลักคือใช้กลไกความสนใจ (attention) เพื่อระบุส่วนที่สำคัญจริง ๆ ในบริบท จากนั้นจึงทิ้งข้อมูลที่ซ้ำซ้อนทันทีในชั้นการแทนค่า (representation) ไม่ใช่พึ่งพาสรุปด้วย LLM ที่ช้ากว่า หรือการค้นคืน RAG ที่เสถียรภาพต่ำ ในการทดสอบเกณฑ์มาตรฐาน LongBench v2 วิธีนี้ทำผลงานได้เด่น: การใช้ Token ของโมเดล Worker ลดลง 65% การประหยัด Token สำหรับเอกสารความยาวปานกลาง (32k ถึง 100k) มีค่ามัธยฐานอยู่ที่ 49% ความแม่นยำโดยรวมสูงขึ้นประมาณ 3 จุดเปอร์เซ็นต์เมื่อเทียบกับฐาน (baseline) และเวลาเพิ่มเติมที่ใช้สำหรับการบีบอัดแต่ละครั้งอยู่ที่ราว 1.7 วินาทีเท่านั้น ทำให้เร็วขึ้นประมาณ 20 เท่าจากอัลกอริทึมเดิม การทดลองใช้ Claude Sonnet 4 เป็นผู้ประสานงาน และ Qwen3-14B เป็นโมเดลผู้ปฏิบัติงาน ครอบคลุมสถานการณ์เอกสารหลายประเภท เช่น บทความวิชาการ เอกสารทางกฎหมาย นวนิยาย และรายงานของรัฐบาล งานวิจัยยังพบว่า “ขีดจำกัดการบีบอัดที่เหมาะสมที่สุด” จะแตกต่างกันตามความยากของงานและความยาวของเอกสาร—งานที่ยากเหมาะกับการบีบอัดแบบก้าวร้าวเพื่อกรองสัญญาณรบกวนจากการอนุมานเชิงคาดเดา (speculative) ขณะที่เอกสารยาวเหมาะกับการบีบอัดแบบเบาเพื่อคงรักษาข้อมูลสำคัญที่กระจายอยู่

news.article.disclaimer

btc.bar.articles

สตาร์ทอัพเอเจนต์ AI Band ระดมทุนรอบเมล็ดพันธุ์ $17M นำโดย Sierra Ventures, Hetz Ventures, Team8

ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — Band ซึ่งเป็นสตาร์ทอัพที่กำลังพัฒนาแพลตฟอร์มการสื่อสารและการทำงานร่วมกันสำหรับเอเจนต์ AI ได้ปิดการระดมทุนรอบเมล็ดพันธุ์ $17 ล้านดอลลาร์ โดยมี Sierra Ventures, Hetz Ventures และ Team8 เป็นผู้นำการลงทุน ก่อตั้งขึ้นในช่วงกลางปี 2025 โดย CEO Arick Goomanovsky และ CTO Vlad Luzin บริษัทพัฒนาซอฟต์แวร์สำหรับ

GateNews40 นาที ที่แล้ว

การรั่วไหลด้านความปลอดภัยของ Vercel ขยายวงสู่ผู้ใช้หลายร้อยคน; นักพัฒนา AI เสี่ยงสูงขึ้น

ข้อความข่าว Gate วันที่ 23 เมษายน——Vercel เปิดเผยเมื่อวันที่ 19 เมษายนว่าเหตุการณ์ด้านความปลอดภัย ซึ่งเดิมอธิบายว่า “กระทบลูกค้ากลุ่มจำกัด” ได้ขยายวงกว้างไปสู่ชุมชนนักพัฒนาซอฟต์แวร์ที่กว้างขึ้นมาก โดยเฉพาะผู้ที่กำลังสร้างเวิร์กโฟลว์ของเอเจนต์ AI การโจมตีอาจกระทบผู้ใช้หลายร้อยคน

GateNews5 ชั่วโมง ที่แล้ว

OpenAI เปิดตัว GPT-5.5: บริบท 12M, ดัชนี AA ขึ้นอันดับหนึ่ง, และ Terminal-Bench 82.7% ปรับปรุงมาตรฐานพร็อกซีใหม่

OpenAI ประกาศ GPT-5.5 โดยเน้นการทำงานแบบตัวแทน (agentic) และการจัดการความรู้ขององค์กร และเปิดตัวพร้อมกันใน ChatGPT และ Codex จุดเด่นได้แก่ หน้าต่างบริบท 1200 ล้าน token, AA Intelligence Index 60, นำหน้า Claude Opus 4.7 และ Gemini 3.1 Pro ราคาอยู่ที่ 5 ดอลลาร์สหรัฐต่อทุก 1 ล้าน token สำหรับการป้อน และ 30 ดอลลาร์สหรัฐต่อทุก 1 ล้าน token สำหรับการส่งออก โดยจำนวน token ที่ส่งออกลดลงประมาณ 40% และต้นทุนที่แท้จริงเพิ่มขึ้นประมาณ 20%

ChainNewsAbmedia5 ชั่วโมง ที่แล้ว

MagicBlock เปิดตัว Mirage เครื่องมือชำระเงินเพื่อความเป็นส่วนตัวแบบบรรทัดคำสั่งสำหรับ Solana

ข้อความจาก Gate News วันที่ 23 เมษายน — MagicBlock ได้เปิดตัว Mirage ซึ่งเป็นเครื่องมือชำระเงินเพื่อความเป็นส่วนตัวแบบบรรทัดคำสั่ง ออกแบบมาสำหรับเครือข่าย Solana เครื่องมือนี้ช่วยให้ผู้ใช้สร้างวอลเล็ต ฝากเงิน และส่งธุรกรรมแบบเป็นส่วนตัวผ่านคำสั่งในเทอร์มินัล บอท หรือเอเจนต์ AI Mirage ถูกสร้างบน Private

GateNews10 ชั่วโมง ที่แล้ว

OpenClaw 2026.4.22 รวมวงจรชีวิตของปลั๊กอินเข้ากับ Codex และ Pi Harness ลดเวลาในการโหลดปลั๊กอินได้สูงสุด 90%

ข่าว Gate ประจำวันที่ 23 เมษายน — OpenClaw แพลตฟอร์มตัวแทน AI แบบโอเพนซอร์ส ได้เปิดตัวเวอร์ชัน 2026.4.22 เมื่อวันที่ 22 เมษายน โดยการเปลี่ยนแปลงที่สำคัญที่สุดคือการทำให้วงจรชีวิตของ Codex harness และ Pi harness สอดคล้องกัน ก่อนหน้านี้ ปลั๊กอินทำงานไม่สอดคล้องกันในเส้นทาง harness ทั้งสอง โดยมีบาง hook ที่หายไปในบางสภาพแวดล้อม พร้อมด้วย

GateNews11 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น