Hugging Face відкриває вихідний код ml-intern — AI-агент для автономних досліджень у сфері ML

Повідомлення Gate News, 22 квітня — Hugging Face відкрила вихідний код ml-intern, агенту для досліджень ML, здатного автономно виконувати повний робочий процес: читання статей, організація датасетів, запуск тренування на GPU, оцінювання результатів і ітерація покращень. Проєкт створено на основі фреймворку smolagents від Hugging Face і надає як CLI, так і веб-інтерфейси, а код доступний на GitHub.

Пакет інструментів ml-intern розроблено з акцентом на екосистему Hugging Face. Він отримує статті з arXiv та HF Papers, водночас відстежуючи ланцюжки цитувань для глибшого читання; переглядає датасети на HF Hub, валідовує якість і переформатовує дані для тренування; а коли локальні ресурси GPU недоступні, викликає HF Jobs, щоб запускати хмарні задачі тренування. Після завершення тренування агент автоматично читає результати оцінювання, діагностує причини невдач і перезапускає експерименти. За замовчуванням він використовує Claude Sonnet 4.5 для керування циклом прийняття рішень, із максимальною кількістю 300 ітерацій на один запуск і автоматичним стисненням контексту, коли перевищується 170k токенів.

Hugging Face продемонструвала три сценарії використання. У задачі на наукове міркування агент ідентифікував датасети OpenScience та NemoTron-CrossThink через ланцюжки цитувань, відфільтрував сім варіантів із ARC, SciQ та MMLU за рівнем складності та провів 12 раундів керованого fine-tuning на Qwen3-1.7B, покращивши бали GPQA з 10% до 32% менш ніж за 10 годин. Для медичного застосування агент визначив, що наявні датасети є недостатніми, написав скрипти для генерації 1,100 синтетичних зразків даних і масштабував їх у 50 разів для тренування, перевищивши продуктивність Codex на 60% на HealthBench. У змагальному сценарії з математики агент написав скрипт тренування GRPO та запустив тренування на GPU A100 через HF Spaces, а потім провів ablation-дослідження після спостереження колапсу винагород.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Worxphere перейменовує JobKorea, додаючи інструменти для найму на базі ШІ

Повідомлення Gate News, 26 квітня — Платформа з управління персоналом у Південній Кореї Worxphere перейменувала JobKorea, переходячи від традиційних онлайн-дошок вакансій до рішень для найму, керованих ШІ. Компанія об’єднує сервіси, зокрема JobKorea та Albamon, в єдину платформу, що охоплює постійну зайнятість, гіг-роботу та рекрутинг іноземних працівників.

GateNews1год тому

AI-агент уже здатний самостійно відтворювати складні академічні статті: Mollick стверджує, що помилки здебільшого трапляються в людських оригіналах, а не в AI

Моллік зазначає, що опубліковані методи та дані дозволяють AI-агентам відтворювати складні дослідження без наявності оригінальних наукових праць і коду; якщо відтворення не відповідає оригінальній статті, то найчастіше проблема не в AI, а в помилках обробки даних у самій статті або в надмірному узагальненні висновків. Claude спочатку відтворює статтю, а потім GPT‑5 Pro перехресно верифікує; у більшості випадків це вдається, лише коли дані надто великі або виникають проблеми з replication data. Ця тенденція значно знижує трудовитрати, роблячи відтворення поширеною, практично здійсненною перевіркою, а також висуває інституційні виклики для рецензування та управління (governance): інструменти державного управління можуть стати ключовим питанням.

ChainNewsAbmedia2год тому

ОАЕ оголошують перехід до моделі AI-держави протягом наступних двох років

Його Високість шейх Мохаммед бін Рашид Аль Мактум заявив, що метою було забезпечити роботу 50% державних секторів через автономний агентний ШІ. Перехід також включатиме навчання федеральних працівників, щоб «опанувати ШІ», і перебуватиме під наглядом шейха Мансура бін Зайєда. Ключові висновки:

Coinpedia21год тому

Платформа для ШІ-торгівлі Fere AI залучила $1,3 млн фінансування під проводом Ethereal Ventures

Повідомлення Gate News, 25 квітня — Fere AI, платформа для торгівлі цифровими активами з підтримкою ШІ, оголосила про завершення раунду фінансування на $1,3 млн під проводом Ethereal Ventures за участі Galaxy Vision Hill та Kosmos Ventures, повідомляє Globenewswire. Платформа підтримує кросчейн

GateNews22год тому

Nvidia розгортає AI-агента OpenAI Codex для всієї команди працівників на інфраструктурі Blackwell

Повідомлення Gate News, 25 квітня — Nvidia розгорнула Codex від OpenAI, AI-агента з підтримкою GPT-5.5, для всієї своєї команди працівників після успішного випробування приблизно з 10,000 співробітників, повідомляють внутрішні матеріали від CEO Дженсена Хуанга та CEO OpenAI Сема Альтмана. Codex розроблено для того, щоб допомагати з

GateNews04-25 03:11

Стартап з розробки коду за допомогою ШІ Cognition веде переговори про фінансування за оцінкою $25B

Повідомлення Gate News, 25 квітня — стартап з розробки коду за допомогою ШІ Cognition перебуває на ранніх переговорах щодо залучення сотень мільйонів доларів або більше за приблизною оцінкою в $25 мільярда, повідомили люди, обізнані з цією справою. Інтерес зріс після придбання SpaceX конкуруючого стартапу з розробки коду за допомогою ШІ. Co

GateNews04-25 02:51
Прокоментувати
0/400
Немає коментарів