Mensagem da Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória de agente que permite que agentes baseados em modelos de linguagem aprendam continuamente após a implantação. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas quanto de tarefas fracassadas, armazenando-as em um banco de memória para recuperação e execução em tarefas futuras similares. O artigo associado foi publicado no ICLR, e o código foi disponibilizado como open source no GitHub.
O ReasoningBank melhora em relação a duas abordagens existentes: Synapse, que registra trajetórias completas de ação, mas tem transferibilidade limitada devido à granularidade fina, e Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank faz duas mudanças importantes: armazenar “padrões de raciocínio” em vez de “sequências de ação”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajetórias de falha ao aprendizado. O framework usa um modelo para se autoavaliar trajetórias de execução, transformando experiências de falha em regras anti-armadilhas. Por exemplo, a regra “clicar no botão Carregar Mais quando for visto” evolui para “verificar primeiro o identificador da página atual, evitar loops infinitos de rolagem e depois clicar em carregar mais.”
O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca computação adicional durante a inferência para explorar múltiplas trajetórias e armazenar os achados no banco de memória. A expansão em paralelo executa múltiplas trajetórias distintas para a mesma tarefa, refinando estratégias mais robustas por meio de auto comparação; a expansão sequencial refina iterativamente uma única trajetória, armazenando o raciocínio intermediário na memória.
Em tarefas de navegador do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou 8,3% a mais na taxa de sucesso no WebArena e 4,6% a mais no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de etapas por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu as etapas em mais 0,4.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
OpenAI recruta principais talentos de software corporativo enquanto agentes de fronteira perturbam a indústria
Mensagem do Gate News, 26 de abril — A OpenAI e a Anthropic têm recrutado executivos seniores e engenheiros especializados de grandes empresas de software corporativo, incluindo Salesforce, Snowflake, Datadog e Palantir. Denise Dresser, ex-CEO do Slack pela Salesforce, ingressou na OpenAI como diretora de receitas, enquanto Jennifer Majlessi, também da Salesforce, recentemente se tornou a chefe de go-to-market da OpenAI. A OpenAI também recrutou, em silêncio, engenheiros com atuação antecipada na Palantir, funções consideradas entre as mais especializadas do setor.
GateNews6h atrás
Worxphere Rebatiza JobKorea Com Ferramentas de Contratação com IA
Mensagem do Gate News, 26 de abril — A plataforma sul-coreana de RH Worxphere rebatizou a JobKorea à medida que faz a transição de quadros tradicionais de empregos online para soluções de contratação orientadas por IA. A empresa está consolidando serviços, incluindo JobKorea e Albamon, em uma plataforma unificada que cobre emprego permanente, trabalho temporário e recrutamento de trabalhadores estrangeiros.
GateNews16h atrás
O Agente de IA já pode reproduzir de forma independente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto original humano do que na IA
Mollick aponta que, com métodos e dados públicos, é possível que agentes de IA reproduzam pesquisas complexas sem acesso ao artigo original e ao código; se a reprodução não corresponder ao artigo original, geralmente é um erro no processamento dos dados do próprio artigo ou um excesso de conclusões, e não da IA. A Claude primeiro reproduz o artigo, e então o GPT‑5 Pro faz uma validação cruzada; na maioria das vezes funciona, apenas ficando impedida quando os dados são grandes demais ou quando há problemas com replication data. Essa tendência reduz significativamente os custos de mão de obra, fazendo com que a reprodução se torne uma forma comum e executável de verificação, além de também levantar desafios institucionais para revisão e governança, em que ferramentas de governança governamental podem se tornar um tema-chave.
ChainNewsAbmedia18h atrás
Emirados Árabes Unidos anuncia mudança em direção a um modelo de governo com IA nos próximos dois anos
Sua Alteza Sheikh Mohammed bin Rashid Al Maktoum afirmou que o objetivo era fazer com que 50% dos setores do governo operassem por meio de IA agentica autônoma. A transição também incluirá o treinamento de funcionários federais para “dominar IA” e será supervisionada por Sheikh Mansour bin Zayed.
Principais destaques:
Coinpedia04-25 08:39
Plataforma de negociação com IA Fere AI arrecada US$ 1,3M em financiamento liderado pela Ethereal Ventures
Mensagem de notícias da Gate, 25 de abril — A Fere AI, uma plataforma de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire.
A plataforma oferece suporte a redes cross-chain
GateNews04-25 07:46
Nvidia Implementa o Agente de IA Codex da OpenAI em Toda a Força de Trabalho na Infraestrutura Blackwell
Mensagem do Gate News, 25 de abril — A Nvidia lançou o Codex, da OpenAI, um agente de IA alimentado pelo GPT-5.5, para toda a sua força de trabalho após um teste bem-sucedido com aproximadamente 10.000 funcionários, de acordo com comunicações internas do CEO Jensen Huang e do CEO da OpenAI, Sam Altman.
Codex é projetado para ajudar com
GateNews04-25 03:11