Hugging Face 开源 ml-intern:用于自主机器学习研究的 AI 代理

Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款机器学习研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。

ml-intern 工具链围绕 Hugging Face 生态系统设计。它从 arXiv 和 HF Papers 检索论文,同时追踪引文链以便更深入阅读;在 HF Hub 上浏览数据集,验证质量,并将数据重新格式化以用于训练;当本地 GPU 资源不可用时,它会调用 HF Jobs 来启动基于云端的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。

Hugging Face 展示了三个使用案例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度等级从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮监督微调,使 GPQA 分数在 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其放大 50 倍用于训练,在 HealthBench 上相较 Codex 的表现提升了 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后开展了消融实验。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Worxphere 以 AI 驱动的招聘工具为 JobKorea 完成品牌重塑

Gate 新闻消息,4月26日——韩国人力资源平台 Worxphere 已在从传统在线招聘网站转向由 AI 驱动的招聘解决方案的过程中,将 JobKorea 更名为新品牌。该公司正在整合包括 JobKorea 和 Albamon 在内的服务,打造一个覆盖正式就业、零工工作以及外籍劳工招聘的统一平台,

GateNews5小时前

AI 智能体 已可独立重现复杂学术论文:Mollick 称错误多在人类原文而非 AI

Mollick 指出,仅凭公开方法与数据即可让 AI 代理在没有原始论文与代码的情况下重现复杂研究;若重现与原论文不符,多是论文本身的数据处理错误或结论过度,而非 AI。Claude 先重现论文,再由 GPT‑5 Pro 交叉验证,多数成功,只有在数据过大或 replication data 问题时受阻。该趋势大幅降低人力成本,使重现成为普遍可执行的检验,并提出审稿与治理的制度性挑战,政府治理工具或将成为关键议题。

鏈新聞abmedia6小时前

阿联酋宣布在未来两年内转向 AI 政府模式

谢赫·穆罕默德·本·拉希德·阿勒马克图姆殿下表示,目标是让50%的政府部门通过自治的代理式AI运作。转型还将包括培训联邦雇员以“精通AI”,并将由谢赫·曼苏尔·本·扎耶德监督。 要点:

Coinpedia04-25 08:39

AI 交易平台 Fere AI 融资 130 万美元,融资由 Ethereal Ventures 牵头

Gate News 消息,4 月 25 日——据 Globenewswire 报道,由 Ethereal Ventures 牵头、Galaxy Vision Hill 和 Kosmos Ventures 参与的 130 万美元融资轮已完成,Fere AI(一个由人工智能驱动的数字资产交易平台)宣布了该消息。 该平台支持跨链

GateNews04-25 07:46

英伟达在 Blackwell 基础设施上向全体员工部署 OpenAI Codex AI 代理

Gate News 消息,4 月 25 日——据首席执行官 Jensen Huang 和 OpenAI 首席执行官 Sam Altman 的内部沟通内容,英伟达已在一次成功试点后(约有 10,000 名员工参与),将由 GPT-5.5 驱动的 OpenAI Codex——一款 AI 代理——部署到其全体员工中。 Codex 的设计用于协助

GateNews04-25 03:11

AI 编码初创公司 Cognition 就 $25B 估值融资轮次展开商谈

Gate 新闻消息,4月25日——据知情人士称,AI 编码初创公司 Cognition 正处于早期洽谈阶段,拟筹集数亿美元或更多资金,估值大约为 $25 十亿(billion),消息人士称。此前在 SpaceX 收购一家竞争对手的 AI 编码初创公司之后,相关兴趣有所增加。 Co

GateNews04-25 02:51
评论
0/400
暂无评论