Новости Gate News: 11 апреля компания по инфраструктуре ИИ Ramp Labs опубликовала результаты исследования «Latent Briefing». Они достигаются за счет прямого сжатия KV-кэша больших языковых моделей для эффективного обмена памятью между многоагентными системами — при этом точность не снижается, а потребление токенов существенно уменьшается. В большинстве распространенных архитектур многоагентных систем оркестратор (Orchestrator) разбивает задачу и многократно вызывает модели рабочих (Worker). По мере того как цепочка рассуждений постоянно удлиняется, количество токенов растет экспоненциально. Ключевая идея Latent Briefing — использовать механизм внимания, чтобы выявлять в контексте действительно важные части, а на уровне представлений напрямую отбрасывать избыточную информацию, а не полагаться на LLM-сводки, которые работают медленно, или на RAG-поиск, который отличается нестабильностью. На бенчмарке LongBench v2 этот подход показал впечатляющие результаты: потребление токенов у модели Worker снизилось на 65%, для документов средней длины (от 32k до 100k) медианный объем сэкономленных токенов составил 49%, общая точность относительно базовой линии выросла примерно на 3 процентных пункта, при этом дополнительное время на каждое сжатие — лишь около 1,7 секунды, что ускоряет исходный алгоритм примерно в 20 раз. Эксперименты проводились с Claude Sonnet 4 в роли оркестратора и Qwen3-14B в роли модели рабочего, охватывая разнообразные сценарии документов, включая научные статьи, юридические документы, романы и правительственные отчеты. Исследование также выявило, что оптимальные пороги сжатия зависят от сложности задачи и длины документа: для сложных задач подходит более агрессивное сжатие, чтобы отфильтровать спекулятивный шум рассуждений, а для длинных документов лучше применять более легкое сжатие, чтобы сохранить разрозненные ключевые сведения.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
OristaPay запускает платежную систему с AI-поддержкой в Telegram, обеспечивает мгновенные расчеты USDT в TON
Сообщение Gate News, 24 апреля — OristaPay, бренд, работающий под управлением RD Technologies, объявил о создании полного платежного пути, позволяющего AI-агентам выполнять транзакции в экосистеме Telegram во время Гонконгского Web3-фестиваля. Система позволяет пользователям инициировать транзакции с цифровыми активами через естественноязычные взаимодействия, не покидая интерфейс чата.
Во время прямой демонстрации AI-агент, работающий на базе BytePlus, обработал запрос на обслуживание, интерпретировал намерение пользователя и инициировал платеж через канал OristaPay. Транзакция была завершена мгновенно с использованием USDT в сети блокчейна TON. Инфраструктура платформы построена на пяти ключевых финансовых возможностях: дебиторская задолженность, кредиторская задолженность, депозиты, денежные переводы и управление капиталом, что создает единую экосистему, соединяющую активы блокчейна с коммерческими сценариями использования.
OristaPay предоставляет разработчикам стандартизированные интерфейсы для интеграции платежных функций в AI-приложения с минимальной сложностью. Платформа работает в рамках нормативно-правовой базы Гонконга, позиционируя себя как безопасное решение для компаний, переходящих к коммерции на базе Web3. Инициатива направлена на устранение ограничений традиционных платежных шлюзов за счет объединения больших языковых моделей, инфраструктуры блокчейна и социальных платформ в единую финансовую экосистему.
GateNews1ч назад
Project Prometheus Джеффа Безоса привлекает $10B по $38B оценке
Сообщение Gate News, 24 апреля — Project Prometheus, AI-лаборатория, основанная основателем Amazon Джеффом Безосом и бывшим руководителем Google Виком Баджаджом, закрыла раунд финансирования на $10 миллиардов долларов при оценке в $38 миллиардов долларов. JPMorgan Chase и BlackRock являются
GateNews6ч назад
OpenAI представляет GPT-5.5, разработанную для задач агентов и сложных рабочих процессов
Сообщение Gate News, 24 апреля — OpenAI официально выпустила GPT-5.5, модель следующего поколения ИИ, предназначенную для решения сложных целей, интеграции инструментов, самопроверки и выполнения задач в несколько этапов. Модель особенно сильна в написании и отладке кода, онлайн-исследованиях, анализе данных, создании документов
GateNews6ч назад
ИИ-стартап Band привлекает посевной раунд $17M под руководством Sierra Ventures, Hetz Ventures, Team8
Новостное сообщение Gate, 24 апреля — Band, стартап, создающий платформу для коммуникации и совместной работы для ИИ-агентов, закрыл раунд посевного финансирования на $17 миллионов долларов под руководством Sierra Ventures, Hetz Ventures и Team8. Основанная в середине 2025 года генеральным директором Ариком Гумановским (Arick Goomanovsky) и техническим директором Владом Лузиным (Vlad Luzin), компания разрабатывает программное обеспечение для ре
GateNews7ч назад
Утечка в системе безопасности Vercel расширилась до сотен пользователей; разработчики ИИ находятся в группе повышенного риска
Сообщение Gate News, 23 апреля — Vercel сообщила 19 апреля, что ее инцидент в области безопасности, первоначально описанный как затрагивающий «ограниченное подмножество клиентов», расширился и теперь затрагивает гораздо более широкое сообщество разработчиков, особенно тех, кто создает рабочие процессы для ИИ-агентов. Атака может затронуть сотни пользователей
GateNews11ч назад
OpenAI 推出 GPT-5.5:12M контекст, AA-индекс на первом месте, Terminal-Bench 82,7% переписывает эталон для агентов
OpenAI опубликовала GPT-5.5, с акцентом на агентную работу и обработку корпоративных знаний, и одновременно запустила его в ChatGPT и Codex. Ключевые моменты включают контекстное окно 12 000 000 token, AA Intelligence Index 60, опережение Claude Opus на 4.7 и Gemini на 3.1 Pro; цена — 5 долларов за 1 млн token на вход и 30 долларов за 1 млн token на выход, количество выходных token снижено примерно на 40%, а фактическая стоимость выросла примерно на 20%.
ChainNewsAbmedia12ч назад