Оновлення Gate News: 11 квітня компанія з інфраструктури для AI Ramp Labs опублікувала результати дослідження «Latent Briefing». Вона забезпечує ефективний обмін пам’яттю між багатосистемними агентами шляхом прямого стиснення KV-кешу великих мовних моделей, значно зменшуючи витрати на Token без втрати точності. У більшості поширених архітектур багатосистемних агентів оркестратор (Orchestrator) розкладає завдання на частини та неодноразово викликає модель робітника (Worker). У міру того, як ланцюжок міркувань постійно подовжується, обсяг Token стрімко зростає експоненційно. Ключова ідея Latent Briefing полягає в тому, щоб за допомогою механізму уваги визначити в контексті справді важливі фрагменти, а в шарі представлення прямо відкидати надлишкову інформацію, а не покладатися на повільні LLM-зведення або ненадійний RAG-пошук. У бенчмарку LongBench v2 цей підхід показав вражаючі результати: витрати Token у моделі Worker знизилися на 65%, а медіанна економія Token для документів середньої довжини (32k до 100k) досягла 49%. Загальна точність підвищилася приблизно на 3 відсоткові пункти порівняно з базовим рівнем, тоді як додатковий час на кожне стиснення становить лише близько 1,7 секунди, що прискорює роботу приблизно у 20 разів порівняно з початковим алгоритмом. Експерименти проводилися з Claude Sonnet 4 як оркестратором і Qwen3-14B як моделлю робітника, охоплюючи сценарії з документами різних типів, зокрема наукові статті, юридичні документи, романи та урядові звіти. Дослідження також виявило, що оптимальний поріг стиснення залежить від складності завдання та довжини документа: для складних задач підходить більш агресивне стиснення, щоб відфільтрувати шум спекулятивного міркування, а для довгих документів краще підходить м’яке стиснення, щоб зберегти розосереджену ключову інформацію.

Переглянути джерело

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Luffa співпрацює з платформою для цифрових активів, щоб інтегрувати ШІ-підсилену криптоторгівлю

Партнерства та екосистема AI Agent Інструменти та застосунки ШІ

Luffa, соціальна екосистема Web3, співпрацює з платформою для торгівлі цифровими активами, щоб інтегрувати торговельні функції на основі ШІ, покращуючи безпечну комунікацію та торгівлю в єдиному інтерфейсі, зберігаючи децентралізацію та зменшуючи ризики.

GateNews45хв. тому

AI-вендинг-агент «Валері» керує вендинговим автоматом у Сан-Франциско за допомогою OpenClaw

AI Agent Новини індустрії ШІ

AI-агент «Valerie» тепер керує вендинговим автоматом у Сан-Франциско на OpenClaw, тестуючи, наскільки далеко люди підуть у довірі до коду з ціноутворенням, маркетингом і реальною готівкою. Підсумок AI-агент «Valerie» запускає фізичний вендинговий автомат у Сан-Франциско, використовуючи фреймворк OpenClaw, встановлюючи ціни, даючи назви

Cryptonews16год тому

Mastercard забезпечує платежі для AI-агентів завдяки партнерству з Lobstercash і Crossmint

AI Agent

Mastercard об’єдналася з Lobstercash і Crossmint, щоб полегшити платежі для AI-агентів через наявні кредитні та дебетові картки, інтегрувавшись у чинні фінансові системи без потреби у нових гаманцях. Ця партнерська угода дозволяє AI автоматизувати транзакції, підвищуючи ефективність і безпеку.

GateNews21год тому

Китайська команда EvoMap розлютилась через раптову популярність Hermes Agent: у власній еволюційній системі існує висока схожість

AI Agent Новини індустрії ШІ

Команда з Китаю EvoMap звинувачує Hermes Agent від Nous Research у плагіаті їхньої архітектури Evolver/GEP, вважаючи, що обидва рішення мають високу схожість у кількох ключових модулях. EvoMap зазначає, що в дизайні Hermes не було посилань або подяк за їхній попередньо опублікований матеріал; суперечка викликала широкий інтерес у спільноті. Частина китайських користувачів мережі підтримала EvoMap і розкритикувала плагіатні дії Hermes. Хоча команда Nous Research ще не спростувала звинувачення в розрізі кожного пункту, подія швидко поширилася в AI-інформаційному просторі.

ChainNewsAbmedia21год тому

OpenAI Оновлює Codex до AI-агента, який керує робочим столом, автоматизуючи процеси розробки

AI Agent Новини індустрії ШІ

Удосконалений Codex від OpenAI еволюціонує від інструмента для написання коду до автономного агента для настільних середовищ: він здатний керувати застосунками, автоматизувати робочі процеси та інтегруватися більш ніж із 100 застосунками. Цей зсув посилює безперервність виконання задач і автоматизацію робочих процесів, відображаючи конкурентний ландшафт у сфері інструментів для кодингу з використанням ШІ.

GateNews21год тому

Agile Soda запускає платформу Agentic OCR із 98% точністю класифікації документів

AI Agent Інструменти та застосунки ШІ

Agile Soda запустила Agentic OCR — платформу автоматизації документів, керовану ШІ, яка усуває необхідність попереднього навчання та дає змогу здійснювати миттєве розгортання. Вона забезпечує високу точність класифікації та витягування, постійно покращуючись завдяки виправленням користувачів, а також має плани щодо майбутніх удосконалень.

GateNews04-17 05:21

Прокоментувати

0/400

Немає коментарів