Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando-as num banco de memória para recuperação e execução em tarefas futuras semelhantes. O artigo associado foi publicado na ICLR, e o código foi disponibilizado em open-source no GitHub.

O ReasoningBank melhora duas abordagens existentes: a Synapse, que regista trajectórias completas de acções, mas tem capacidade de transferência limitada devido à granularidade fina, e a Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank introduz duas alterações-chave: armazenar “padrões de raciocínio” em vez de “sequências de acções”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajectórias de falha na aprendizagem. O framework usa um modelo para autoavaliar trajectórias de execução, transformando experiências de falha em regras anti-erro. Por exemplo, a regra “clicar no botão Carregar mais quando o vir” evolui para “verificar primeiro o identificador da página actual, evitar ciclos de scroll infinito e, em seguida, clicar em carregar mais.”

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca compute adicional durante a inferência para explorar múltiplas trajectórias e guardar os resultados no banco de memória. A expansão em paralelo executa múltiplas trajectórias distintas para a mesma tarefa, refinando estratégias mais robustas através de auto-comparação; a expansão sequencial refina iterativamente uma única trajectória, guardando raciocínio intermédio em memória.

Em tarefas de browser do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou uma taxa de sucesso 8,3% superior no WebArena e 4,6% superior no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de passos por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu os passos em mais 0,4.

Ver fonte

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

OpenAI recruta principais talentos de software empresarial à medida que agentes de fronteira perturbam a indústria

Ações Agente de IA Notícias da indústria de IA

Mensagem do Gate News, 26 de abril — A OpenAI e a Anthropic têm estado a recrutar executivos seniores e engenheiros especializados de grandes empresas de software empresarial, incluindo Salesforce, Snowflake, Datadog e Palantir. Denise Dresser, antiga CEO da Slack sob a Salesforce, juntou-se à OpenAI como diretora de receitas, enquanto Jennifer Majlessi, também da Salesforce, se tornou recentemente a responsável de go-to-market da OpenAI.

GateNews6h atrás

Worxphere Rebrands JobKorea With AI-Powered Hiring Tools

Agente de IA Ferramentas e aplicações de IA

Gate News message, April 26 — South Korean HR platform Worxphere has rebranded JobKorea as it transitions from traditional online job boards to AI-driven hiring solutions. The company is consolidating services including JobKorea and Albamon into a unified platform covering permanent employment,

GateNews16h atrás

O Agente de IA já consegue reproduzir autonomamente artigos académicos complexos: Mollick afirma que os erros se devem mais ao texto original humano do que à IA

Agente de IA Notícias da indústria de IA

Mollick indica que os métodos de publicação e os dados, por si só, permitem que agentes de IA reproduzam investigação complexa sem a existência do artigo original e do código; se a reprodução não corresponder ao artigo original, isso deve-se na maioria das vezes a erros no processamento dos dados do próprio artigo ou a uma extrapolação excessiva das conclusões, e não à IA. A Claude primeiro reproduz o artigo, e depois o GPT‑5 Pro faz uma validação cruzada; na maioria dos casos, é bem-sucedido, apenas ficando bloqueado quando os dados são demasiado grandes ou quando há problemas com replication data. Esta tendência reduz drasticamente os custos de mão-de-obra, tornando a reprodução numa verificação geralmente executável, além de colocar desafios institucionais para a revisão pelos pares e para a governação; as ferramentas de governação por parte do governo ou tornar-se-ão numa questão fundamental.

ChainNewsAbmedia17h atrás

Os EAU Anunciam uma Mudança Para um Modelo de Governo Baseado em IA nos Próximos Dois Anos

Agente de IA Notícias da indústria de IA

Sua Alteza o Sheikha Mohammed bin Rashid Al Maktoum afirmou que o objectivo era fazer com que 50% dos sectores do governo operassem através de IA agentic autónoma. A transição irá também incluir a formação dos funcionários federais para “dominar a IA” e será supervisionada por Sheikh Mansour bin Zayed. Principais Conclusões:

Coinpedia04-25 08:39

Plataforma de Negociação com IA Fere AI Angaria $1,3M em Financiamento Liderado pela Ethereal Ventures

Agente de IA Notícias da indústria de IA

Notícia da Gate, 25 de abril — Fere AI, uma plataforma de negociação de ativos digitais com base em IA, anunciou a conclusão de uma ronda de financiamento de $1,3 milhões liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire. A plataforma suporta redes de interoperabilidade entre cadeias, incluindo Ethereum, Solana e Base, permitindo que os utilizadores descrevam os seus objetivos de negociação em linguagem natural enquanto os agentes de IA executam as operações.

GateNews04-25 07:46

Nvidia Implementa o Agente de IA Codex da OpenAI em Toda a Força de Trabalho na Infraestrutura Blackwell

Agente de IA Notícias da indústria de IA

Mensagem da Gate News, 25 de Abril — A Nvidia lançou o Codex da OpenAI, um agente de IA alimentado por GPT-5.5, para toda a sua força de trabalho após um ensaio bem-sucedido com cerca de 10.000 empregados, segundo comunicações internas do CEO Jensen Huang e do CEO da OpenAI, Sam Altman. O Codex foi concebido para ajudar com tarefas de programação, planeamento e de fluxo de trabalho

GateNews04-25 03:11

Comentar

0/400

Nenhum comentário