Hugging Face 开源 ml-intern:面向自主 ML 研究的 AI 代理

Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款 ML 研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果,并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。

ml-intern 工具链围绕 Hugging Face 生态系统设计。它会从 arXiv 和 HF Papers 获取论文,同时追踪引文链以便进行更深入阅读;在 HF Hub 上浏览数据集、验证质量,并对数据进行重格式化以用于训练;当本地 GPU 资源不可用时,会调用 HF Jobs 来启动基于云的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。

Hugging Face 展示了三个用例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度级别从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮有监督微调,使 GPQA 分数在不到 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其扩展 50 倍用于训练;其在 HealthBench 上的表现比 Codex 高出 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后进行了消融研究。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Worxphere 以 AI 驱动的招聘工具重新打造 JobKorea

Gate News 消息,4 月 26 日——韩国人力资源平台 Worxphere 已将 JobKorea 更名为其品牌,随着其从传统在线招聘网站转向由 AI 驱动的招聘解决方案。该公司正将包括 JobKorea 和 Albamon 在内的服务整合到一个统一平台中,涵盖长期雇佣、零工业务以及外籍劳工招聘。

GateNewsمنذ 4 د

يمكن لوكلاء الذكاء الاصطناعي الآن إعادة إنتاج المقالات الأكاديمية المعقدة بشكل مستقل: مولّيك يقول إن الأخطاء غالبًا ما تكون في النص الأصلي البشري وليست في الذكاء الاصطناعي

يشير مولليك إلى أنه يمكن للأساليب والبيانات المتاحة للجمهور فقط أن تُمكّن وكلاء الذكاء الاصطناعي من إعادة إنتاج الأبحاث المعقدة دون الحاجة إلى الأوراق البحثية الأصلية وكودها؛ وإذا كانت عملية إعادة الإنتاج لا تتطابق مع الورقة الأصلية، فعادةً تكون الأخطاء في معالجة بيانات الورقة نفسها أو أن الاستنتاجات قد تكون مبالغًا فيها، وليس بسبب الذكاء الاصطناعي. يعيد كلود أولاً إنتاج الورقة، ثم يقوم GPT‑5 Pro بالتحقق المتبادل، وتنجح الأغلبية، ويُعرقل فقط عند مواجهة بيانات ضخمة أو مشكلات تتعلق بـ replication data. وقد خفّض هذا الاتجاه بشكل كبير تكلفة العمل البشري، مما يجعل إعادة الإنتاج فحصًا شائعًا وقابلًا للتنفيذ، كما يطرح تحديات مؤسسية أمام التحكيم والحوكمة، وقد تصبح أدوات حوكمة الحكومة أو قضايا محورية.

ChainNewsAbmediaمنذ 1 س

الإمارات تعلن تحولاً نحو نموذج حكومي مدعوم بالذكاء الاصطناعي خلال العامين المقبلين

قال صاحب السمو الشيخ محمد بن راشد آل مكتوم إن الهدف هو أن تعمل 50% من القطاعات الحكومية من خلال وكلاء ذكاء اصطناعي ذوي استقلالية. وستشمل عملية الانتقال أيضًا تدريب الموظفين الفيدراليين على “إتقان الذكاء الاصطناعي”، وسيُشرف على ذلك الشيخ منصور بن زايد. النتائج الرئيسية:

Coinpediaمنذ 20 س

منصة تداول بالذكاء الاصطناعي Fere AI تجمع 1.3 مليون دولار في تمويل تقوده Ethereal Ventures

رسالة أخبار Gate، 25 أبريل — أعلنت Fere AI، وهي منصة تداول أصول رقمية مدعومة بالذكاء الاصطناعي، عن إتمام جولة تمويل بقيمة 1.3 مليون دولار بقيادة Ethereal Ventures، مع مشاركة من Galaxy Vision Hill وKosmos Ventures، وفقًا لـ Globenewswire. تدعم المنصة شبكات عبر السلاسل

GateNewsمنذ 21 س

Nvidia 在 Blackwell 基础设施上将 OpenAI Codex AI 代理部署到全体员工

Gate News 消息,4 月 25 日——据首席执行官 Jensen Huang 和 OpenAI 首席执行官 Sam Altman 的内部沟通,Nvidia 已将 OpenAI 的 Codex 推送给其全部员工,这是一款由 GPT-5.5 驱动的 AI 代理,且在一次成功试点后进行部署;该试点约有 10,000 名员工参与。 Codex 被设计用于协助

GateNews04-25 03:11

AI编程初创公司Cognition就$25B 估值融资轮次进行洽谈

Gate News消息,4月25日——根据知情人士称,AI编程初创公司Cognition正在进行早期洽谈,计划筹集数亿美元或更多资金,估值约为$25 十亿美元。据悉,SpaceX收购一家竞争对手AI编程初创公司后,相关兴趣有所增加。 Co

GateNews04-25 02:51
تعليق
0/400
لا توجد تعليقات