Message de Gate News, 22 avril — Google Research a publié ReasoningBank, un cadre de mémoire d’agent qui permet à des agents pilotés par de grands modèles de langage d’apprendre en continu après leur déploiement. Le cadre extrait des stratégies universelles de raisonnement à partir d’expériences de tâches à la fois réussies et échouées, les stockant dans une banque de mémoire pour la récupération et l’exécution sur des tâches futures similaires. L’article associé a été publié à l’ICLR, et le code a été open-sourcé sur GitHub.
ReasoningBank améliore deux approches existantes : Synapse, qui enregistre des trajectoires d’action complètes mais dispose d’une transférabilité limitée en raison d’une granularité trop fine, et Agent Workflow Memory, qui n’apprend que des cas réussis. ReasoningBank apporte deux changements clés : stocker des « modèles de raisonnement » au lieu de « séquences d’action », chaque mémoire contenant des champs structurés pour le titre, la description et le contenu ; et intégrer des trajectoires d’échec à l’apprentissage. Le cadre utilise un modèle pour s’auto-évaluer sur les trajectoires d’exécution, transformant les expériences d’échec en règles anti-pièges. Par exemple, la règle « cliquer sur le bouton Charger plus lorsqu’il est visible » évolue vers « vérifier d’abord l’identifiant de la page actuelle, éviter les boucles de défilement infini, puis cliquer sur charger plus. »
L’article introduit également Memory-aware Test-time Scaling (MaTTS), qui alloue une puissance de calcul supplémentaire pendant l’inférence afin d’explorer plusieurs trajectoires et de stocker les résultats dans la banque de mémoire. L’expansion parallèle exécute plusieurs trajectoires distinctes pour la même tâche, en affinant des stratégies plus robustes grâce à une auto-comparaison ; l’expansion séquentielle affine itérativement une seule trajectoire, en stockant un raisonnement intermédiaire en mémoire.
Sur les tâches de navigateur WebArena et les tâches de codage SWE-Bench-Verified en utilisant Gemini 2.5 Flash comme agent ReAct, ReasoningBank a atteint un taux de réussite supérieur de 8,3 % sur WebArena et de 4,6 % sur SWE-Bench-Verified par rapport à une référence sans mémoire, en réduisant d’environ 3 le nombre moyen d’étapes par tâche. L’ajout de MaTTS avec expansion parallèle (k=5) a encore amélioré le taux de réussite sur WebArena de 3 points de pourcentage et réduit les étapes d’un supplément de 0,4.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
OpenAI recrute de grands talents des logiciels d’entreprise alors que des agents de nouvelle frontière perturbent l’industrie
Message de Gate News, 26 avril — OpenAI et Anthropic recrutent des cadres supérieurs et des ingénieurs spécialisés issus de grandes entreprises de logiciels d’entreprise, dont Salesforce, Snowflake, Datadog et Palantir. Denise Dresser, ancienne PDG de Slack sous Salesforce, a rejoint OpenAI comme directrice des revenus de
GateNewsIl y a 4h
Worxphere rebaptise JobKorea avec des outils de recrutement alimentés par l’IA
Message de Gate News, 26 avril — La plateforme coréenne de RH Worxphere a rebaptisé JobKorea alors qu’elle passe des sites d’offres d’emploi en ligne traditionnels à des solutions de recrutement pilotées par l’IA. L’entreprise consolide des services, dont JobKorea et Albamon, dans une plateforme unifiée couvrant l’emploi permanent,
GateNewsIl y a 14h
Un agent IA peut déjà reproduire de manière autonome des articles universitaires complexes : Mollick affirme que les erreurs proviennent davantage des textes originaux humains que de l’IA
Mollick indique que des méthodes et des données publiques suffisent pour permettre aux agents IA de reproduire des recherches complexes sans disposer des articles originaux et du code ; si la reproduction ne correspond pas à l’article original, cela vient le plus souvent d’erreurs dans le traitement des données de l’article lui-même ou d’une conclusion trop poussée, plutôt que de l’IA. Claude reproduit d’abord l’article, puis GPT‑5 Pro en fait une vérification croisée ; dans la plupart des cas, cela réussit, et seuls les cas où les données sont trop volumineuses ou où il y a des problèmes de replication data bloquent le processus. Cette tendance réduit considérablement les coûts en main-d’œuvre, faisant de la reproduction un test largement exécutable, et soulève aussi des défis institutionnels liés à l’évaluation par les pairs et à la gouvernance : les outils de gouvernance gouvernementaux ou deviennent un sujet clé.
ChainNewsAbmediaIl y a 15h
Les Émirats arabes unis annoncent une transition vers un modèle de gouvernement basé sur l’IA au cours des deux prochaines années
Son Altesse Cheikh Mohammed bin Rashid Al Maktoum a déclaré que l’objectif était que 50% des secteurs gouvernementaux fonctionnent grâce à une IA agentique autonome. La transition comprendra également la formation des employés fédéraux pour « maîtriser l’IA », et sera supervisée par Cheikh Mansour bin Zayed.
Points clés :
Coinpedia04-25 08:39
La plateforme de trading d’IA Fere AI lève 1,3 M$ de fonds, menée par Ethereal Ventures
Message de Gate News, 25 avril — Fere AI, une plateforme de trading d’actifs numériques propulsée par l’IA, a annoncé avoir finalisé un tour de financement de 1,3 million de dollars mené par Ethereal Ventures, avec la participation de Galaxy Vision Hill et de Kosmos Ventures, selon Globenewswire.
La plateforme prend en charge des réseaux inter-chaînes
GateNews04-25 07:46
Nvidia déploie l’agent IA Codex d’OpenAI auprès de l’ensemble de son personnel sur l’infrastructure Blackwell
Message de Gate News, 25 avril — Nvidia a déployé Codex d’OpenAI, un agent IA alimenté par GPT-5.5, auprès de l’ensemble de son personnel après un essai concluant avec environ 10 000 employés, d’après des communications internes du PDG Jensen Huang et du PDG d’OpenAI Sam Altman.
Codex est conçu pour aider à
GateNews04-25 03:11