Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Fere AI Conclui Rodada de Financiamento de US$ 1,3 Milhão Liderada pela Ethereal Ventures
Mensagem do Gate News, 24 de abril — A Fere AI, uma plataforma de agente de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures.
A plataforma oferece suporte a redes cross-chain, incluindo Ethereum,
GateNews10h atrás
Principal Carteira de CEX Lança Agentic Wallet para Agentes de IA com Zero Taxas Durante Período Promocional
Mensagem do Gate News, 24 de abril — Uma grande corretora de criptomoedas lançou a AgenticWallet, uma carteira sem chaves especializada, projetada para agentes de IA. A plataforma permite que os usuários autorizem agentes de IA a executar com segurança operações de negociação, transferências e gerenciamento de ativos dentro de parâmetros configurados
GateNews12h atrás
Web3 AI Infrastructure AIW3 Capta $2M na Rodada Seed Liderada pela Buffalo Capital
Mensagem do Gate News, 24 de abril — A plataforma de infraestrutura de IA Web3 AIW3 anunciou a conclusão de uma rodada de captação seed de $2 milhões. A rodada foi liderada pela Buffalo Capital, com GalaXin Capital e Three-stones Ventures participando como co-investidoras.
A AIW3 está fazendo a transição para um paradigma de execução on-chain de Agente-como-Serviço
GateNews14h atrás
O governo dos Emirados Árabes anunciou a introdução de agentes de IA, com a conclusão mais rápida em 2028 de que metade dos processos estará funcionando automaticamente
Os Emirados Árabes Unidos anunciaram que, em dois anos, 50% dos órgãos do governo federal, serviços e operações serão conduzidos por agentes de IA autônomos, tornando-se o primeiro caso no mundo. A IA se tornará a parceira de execução do governo, auxiliando na tomada de decisões, aprimorando serviços e se otimizando continuamente. Todos os servidores públicos são obrigados a passar por treinamento, e o desempenho dos ministros e a eficácia da adoção de IA serão vinculados, impulsionados por um comitê especializado supervisionado pelo presidente. Esta iniciativa decorre de mais de uma década de acumulação de políticas e da estratégia de IA, com foco central na abordagem centrada no ser humano.
ChainNewsAbmedia15h atrás
OristaPay Lança Sistema de Pagamentos com IA no Telegram, Habilita Liquidações Instantâneas de USDT na TON
Mensagem da Gate News, 24 de abril — OristaPay, uma marca operada sob a RD Technologies, anunciou um caminho completo de pagamentos que permite que agentes de IA executem transações dentro do ecossistema do Telegram durante o Hong Kong Web3 Festival. O sistema permite que os usuários iniciem transações de ativos digitais por meio de interações em linguagem natural sem sair da interface de bate-papo através de na
GateNews17h atrás