ゲートニュース 4月22日 — Google Researchは、エージェントのメモリーフレームワークであるReasoningBankをリリースしました。これは、大規模言語モデル主導のエージェントが、デプロイ後も継続的に学習できるようにするものです。このフレームワークは、成功したタスク経験と失敗したタスク経験の両方から普遍的な推論戦略を抽出し、それらをメモリーバンクに保存して、同様の将来のタスクでの検索と実行に活用します。関連論文はICLRで公開されており、コードはGitHubでオープンソース化されています。
ReasoningBankは、既存の2つのアプローチを改良しています。Synapseは完全な行動の軌跡を記録しますが、きめ細かな粒度のために転用可能性が限られています。また、Agent Workflow Memoryは成功したケースのみから学習します。ReasoningBankは2つの重要な変更を行います。"アクションシーケンス"ではなく"推論パターン"を保存し、各メモリにタイトル、説明、コンテンツの構造化フィールドを含めること。そして、失敗の軌跡を学習に取り込むことです。このフレームワークは、実行軌跡を自己評価するモデルを使用し、失敗の経験を「落とし穴回避ルール」へと変換します。たとえば、ルール"見かけたらLoad Moreボタンをクリックする"は、"まず現在のページ識別子を確認し、無限スクロールのループを避けてから、load moreをクリックする"へと進化します。
この論文は、Memory-aware Test-time Scaling (MaTTS)も導入しています。これは推論中に追加の計算を割り当て、複数の軌跡を探索して、その発見をメモリーバンクに保存するものです。並列拡張では同一タスクに対して複数の異なる軌跡を実行し、自己比較によってより頑健な戦略を洗練します。一方で逐次拡張では単一の軌跡を反復的に改良し、推論の途中結果をメモリに保存します。
Gemini 2.5 FlashをReActエージェントとして用いたWebArenaのブラウザタスク、およびSWE-Bench-Verifiedのコーディングタスクでは、ReasoningBankは、メモリなしのベースラインと比べてWebArenaで成功率が8.3%高く、SWE-Bench-Verifiedでは4.6%高くなりました。さらに、タスクあたりの平均ステップ数を約3%減らしました。並列拡張 (k=5)でMaTTSを追加すると、WebArenaの成功率はさらに3ポイント向上し、ステップ数もさらに0.4減少しました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
OpenAIが最上級のエンタープライズソフト人材を採用 フロンティアのエージェントが業界を攪乱
ゲートニュース 4月26日 — OpenAIとAnthropicは、Salesforce、Snowflake、Datadog、Palantirなどの大手エンタープライズソフトウェア企業から、シニア幹部および専門エンジニアを採用している。Salesforce傘下でSlackの元CEOだったDenise Dresserは、OpenAIの最高収益責任者として入社した
GateNews8時間前
Worxphere、AI搭載の採用ツールでJobKoreaをリブランディング
ゲートニュース(4月26日)— 韓国のHRプラットフォームWorxphereは、従来型のオンライン求人ボードからAI駆動の採用ソリューションへ移行するにあたり、JobKoreaをブランド変更しました。同社は、JobKoreaやAlbamonを含むサービスを統合し、正社員雇用、ギグワーク、外国人労働者の採用を対象とする統一プラットフォームを構築しています。
GateNews18時間前
AIエージェントは、複雑な学術論文を独力で再現できるようになっている:Mollickは、誤りはAIではなく人間の原文に多いと述べている
Mollick は、公開された手法とデータだけで、AI agent が元の論文やコードがない状況でも複雑な研究を再現できると指摘している。再現が原論文と一致しない場合は、多くの場合 AI ではなく、論文自体のデータ処理の誤り、または結論の過度な解釈によるものだという。Claude はまず論文を再現し、その後 GPT‑5 Pro によるクロス検証を行い、多くは成功するが、データが大きすぎる場合や replication data の問題がある場合には阻まれることがある。この傾向は人力コストを大幅に下げ、再現が一般的に実行可能な検証となり得ることを示すとともに、査読やガバナンスの制度上の課題も提起しており、政府のガバナンスツール、あるいはそれに関連する事項が重要な論点となっている。
ChainNewsAbmedia20時間前
UAEは今後2年間でAI政府モデルへの移行を発表
モハメド・ビン・ラシッド・アル・マクトゥーム殿下は、目標は政府の分野の50%を自律的なエージェント型AIを通じて運用することだと述べました。移行には「AIをマスターする」ための連邦職員の訓練も含まれ、シェイク・マンスール・ビン・ザイードが監督します。
要点:
Coinpedia04-25 08:39
Ethereal Venturesが主導する資金調達でFere AIが$1.3Mを調達:AI取引プラットフォーム
Gate Newsメッセージ、4月25日 — Globenewswireによると、AIを活用したデジタル資産取引プラットフォームであるFere AIは、Ethereal Venturesが主導した資金調達ラウンド($1.3 million)の完了を発表した。Galaxy Vision HillおよびKosmos Venturesが参加した。
このプラットフォームは
GateNews04-25 07:46
Nvidia、Blackwellインフラ上で全従業員にOpenAI Codex AIエージェントを展開
ゲートニュースのメッセージ、4月25日—Nvidiaは、GPT-5.5を搭載したOpenAIのCodexというAIエージェントを、CEOのジェンセン・フアン氏とOpenAI CEOのサム・アルトマン氏からの社内コミュニケーションによれば、約10,000人の従業員との成功した試験の後、全従業員に展開しました。
Codexは、複数の部門にまたがるコーディング、計画、ワークフロー業務を支援するよう設計されています。
GateNews04-25 03:11