Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A Agile Soda Lança a Plataforma Agentic OCR com 98% de Precisão na Classificação de Documentos
A Agile Soda lançou o Agentic OCR, uma plataforma de automação de documentos orientada por IA que elimina a necessidade de pré-treino e permite uma implementação imediata. Oferece elevada precisão na classificação e na extração, melhorando continuamente com base nas correções dos utilizadores, com planos para futuras melhorias.
GateNews34m atrás
American Express vai adquirir a startup de despesas com IA Hyper no 2.º trimestre de 2026
A American Express vai adquirir a startup de IA Hyper para melhorar as suas ferramentas de gestão de despesas para clientes empresariais. A aquisição, prevista para ser concluída no 2.º trimestre de 2026, segue-se a uma parceria que lançou em 2024 um cartão de recompensas co-branded.
GateNews1h atrás
Startup Cloud de Singapura OrtCloud Angaria 1,7M em Rodada Pré-Seed Liderada pela Golden Gate Ventures
OrtCloud, uma startup singapurense, angariou 1,7 milhões de dólares em financiamento pré-seed para a sua infra-estrutura cloud especializada, concebida para cargas de trabalho de IA. Com clientes como OpenAI e Samsung, a empresa pretende melhorar o desenvolvimento de produtos e expandir-se na Ásia-Pacífico e nos EUA.
GateNews1h atrás
A Canva lança a plataforma de IA 2.0, expandindo-se de ferramenta de design para um Work OS unificado
O Canva AI 2.0 transforma o Canva de uma ferramenta de design numa plataforma abrangente de operações de trabalho. Usa inteligência artificial generativa para agilizar fluxos de trabalho, permitindo aos utilizadores criar e editar designs através de linguagem natural, automatizar tarefas e integrar-se com várias aplicações.
GateNews3h atrás
A Sahara AI lança o agente de investimento Sorin, com suporte para cripto, acções e mercados de previsão
A Sahara AI lançou a Sorin, um agente de investimento para negociação de vários activos como criptomoedas e acções. Oferece negociação autónoma, automação de estratégias quantitativas e gestão de risco personalizada para todos os utilizadores, após testes com 20,000 participantes.
GateNews16h atrás
AlphaNet angaria ronda Seed $10M liderada pela Joffre Capital para lançar uma plataforma de trading quantitativo de nível institucional
Plataforma de trading quantitativo com IA AlphaNet assegura $10 milhões em financiamento seed, preparando-se para um lançamento público com mais de 30 estratégias de elevado desempenho. Os planos incluem uma Open Platform para integração de estratégias até 2026, com o objectivo de alcançar 100+ estratégias.
GateNews18h atrás