Google Research veröffentlicht ReasoningBank: KI-Agenten lernen Verarbeitungsstrategien aus Erfolg und Misserfolg

Gate News-Nachricht, 22. April — Google Research hat ReasoningBank veröffentlicht, ein Framework für Agentenspeicher, das modellbasierte Agenten mit großen Sprachmodellen ermöglicht, nach der Bereitstellung kontinuierlich dazuzulernen. Das Framework extrahiert universelle Verarbeitungsstrategien aus sowohl erfolgreichen als auch fehlgeschlagenen Aufgaben-Erfahrungen und speichert sie in einem Speicher-Bank-System zur späteren Suche und Ausführung bei ähnlichen zukünftigen Aufgaben. Das zugehörige Paper wurde auf ICLR veröffentlicht, und der Code wurde auf GitHub open-sourced.

ReasoningBank verbessert zwei bestehende Ansätze: Synapse, das vollständige Aktionsverläufe aufzeichnet, jedoch nur eingeschränkt übertragbar ist, da es eine sehr feingranulare Granularität hat, und Agent Workflow Memory, das nur aus erfolgreichen Fällen lernt. ReasoningBank bringt zwei zentrale Änderungen: das Speichern von “reasoning patterns” statt von “action sequences”, wobei jede Memory strukturierte Felder für Titel, Beschreibung und Inhalt enthält; und das Einbeziehen von Failure-Trajectories in das Lernen. Das Framework verwendet ein Modell, um Ausführungsverläufe selbst zu bewerten, und verwandelt damit Misserfolgserfahrungen in Anti-Fallstrick-Regeln. Beispielsweise entwickelt sich die Regel “klicke auf die Schaltfläche „Load More“, wenn sie sichtbar ist” zu “prüfe zuerst die ID der aktuellen Seite, vermeide dann unendliche Scroll-Schleifen, und klicke anschließend auf „load more“.”

Das Paper führt außerdem Memory-aware Test-time Scaling (MaTTS) ein, das während der Inferenz zusätzliche Rechenleistung bereitstellt, um mehrere Verläufe zu erkunden und die Erkenntnisse in der Speicher-Bank zu speichern. Parallel Expansion führt mehrere unterschiedliche Verläufe für dieselbe Aufgabe aus und verbessert robustere Strategien durch Selbstvergleich; sequentielle Expansion verfeinert iterativ genau einen Verlauf und speichert dabei die Zwischenerkenntnisse im Speicher.

Bei WebArena-Browsing-Aufgaben und SWE-Bench-Verified-Coding-Aufgaben, bei denen Gemini 2.5 Flash als ReAct-Agent eingesetzt wird, erreichte ReasoningBank eine um 8,3% höhere Erfolgsquote bei WebArena und um 4,6% höhere bei SWE-Bench-Verified im Vergleich zu einer Baseline ohne Memory. Dabei reduzierte es die durchschnittliche Anzahl der Schritte pro Aufgabe um etwa 3. Das Hinzufügen von MaTTS mit Parallel Expansion (k=5) verbesserte die WebArena-Erfolgsquote zusätzlich um 3 Prozentpunkte und reduzierte die Schritte um weitere 0,4.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

OpenAI rekrutiert Top-Talente aus der Unternehmenssoftwarebranche, während Frontier-Agents die Branche aufmischen

Gate-News-Meldung, 26. April — OpenAI und Anthropic rekrutieren leitende Führungskräfte und spezialisierte Ingenieure von großen Unternehmens-Softwareunternehmen, darunter Salesforce, Snowflake, Datadog und Palantir. Denise Dresser, ehemalige CEO von Slack bei Salesforce, ist als Chief Revenue Officer zu OpenAI gekommen, während Jennifer Majlessi, ebenfalls von Salesforce, kürzlich zur Leiterin für Go-to-Market bei OpenAI geworden ist.

GateNews5Std her

Worxphere Rebrands JobKorea With AI-Powered Hiring Tools

Gate News message, April 26 — South Korean HR platform Worxphere has rebranded JobKorea as it transitions from traditional online job boards to AI-driven hiring solutions. The company is consolidating services including JobKorea and Albamon into a unified platform covering permanent employment,

GateNews15Std her

KI-Agenten können komplexe wissenschaftliche Arbeiten inzwischen selbstständig nachbilden: Mollick sagt, dass Fehler eher im menschlichen Original als in der KI liegen

Mollick weist darauf hin, dass allein öffentliche Methoden und Daten es einem KI-Agenten ermöglichen, komplexe Forschungen auch ohne ursprüngliche Paper und Code nachzubilden; wenn die Reproduktion nicht mit dem Originalpaper übereinstimmt, liegt das meist an Fehlern in der Datenaufbereitung des Papers selbst oder daran, dass die Schlussfolgerungen überzogen sind, nicht an der KI. Claude rekonstruiert zuerst das Paper, dann verifiziert GPT‑5 Pro im Abgleich, und die meisten Versuche gelingen; nur wenn die Daten zu groß sind oder es Probleme mit replication data gibt, wird dies blockiert. Dieser Trend senkt die Arbeitskosten erheblich, sodass Reproduktion zu einer weit verbreiteten, praktisch durchführbaren Prüfung wird; außerdem wirft er institutionelle Herausforderungen für Begutachtung und Governance auf, wobei staatliche Governance-Tools oder als entscheidendes Thema hervortreten.

ChainNewsAbmedia16Std her

VAE kündigen eine Verlagerung hin zu einem KI-Regierungsmodell in den nächsten zwei Jahren an

Seine Hoheit Scheich Mohammed bin Rashid Al Maktoum erklärte, das Ziel sei, dass 50% der staatlichen Ressorts über autonome agentische KI betrieben werden. Der Übergang wird außerdem die Schulung von Bundesbediensteten umfassen, um „KI zu meistern“, und wird von Scheich Mansour bin Zayed überwacht. Wichtige Erkenntnisse:

Coinpedia04-25 08:39

KI-Handelsplattform Fere AI nimmt 1,3 Mio. US-Dollar ein, angeführt von Ethereal Ventures

Gate-News-Meldung, 25. April — Fere AI, eine KI-gestützte Plattform für den Handel mit digitalen Vermögenswerten, gab die Abschließung einer Finanzierungsrunde in Höhe von 1,3 Millionen US-Dollar bekannt, die von Ethereal Ventures angeführt wurde; beteiligt waren Galaxy Vision Hill und Kosmos Ventures, wie Globenewswire berichtet. Die Plattform unterstützt Cross-Chain

GateNews04-25 07:46

Nvidia setzt OpenAIs Codex-KI-Agenten auf der gesamten Belegschaft auf Blackwell-Infrastruktur ein

Gate News Nachricht, 25. April — Nvidia hat OpenAIs Codex eingeführt, einen KI-Agenten, der von GPT-5.5 angetrieben wird, für die gesamte Belegschaft, nachdem ein erfolgreicher Pilot mit ungefähr 10.000 Mitarbeitern durchgeführt wurde, wie interne Mitteilungen von CEO Jensen Huang und OpenAI-CEO Sam Altman berichten. Codex ist darauf ausgelegt,

GateNews04-25 03:11
Kommentieren
0/400
Keine Kommentare