Hugging Face phát hành mã nguồn mở ml-intern, một tác nhân AI cho nghiên cứu ML tự chủ

Tin từ Gate News, ngày 22 tháng 4 — Hugging Face đã phát hành mã nguồn mở ml-intern, một tác nhân nghiên cứu ML có thể tự động hoàn thành toàn bộ quy trình gồm đọc bài báo, tổ chức tập dữ liệu, khởi chạy huấn luyện GPU, đánh giá kết quả và lặp lại để cải tiến. Dự án được xây dựng trên framework smolagents của Hugging Face và cung cấp cả giao diện dòng lệnh (CLI) lẫn giao diện dựa trên web, với mã nguồn được công khai trên GitHub.

Bộ công cụ của ml-intern được thiết kế xoay quanh hệ sinh thái Hugging Face. Nó truy xuất các bài báo từ arXiv và HF Papers đồng thời lần theo chuỗi trích dẫn để đọc sâu hơn; duyệt tập dữ liệu trên HF Hub, xác thực chất lượng và định dạng lại dữ liệu để huấn luyện; và khi không có tài nguyên GPU cục bộ, nó gọi HF Jobs để khởi chạy các tác vụ huấn luyện trên đám mây. Sau khi quá trình huấn luyện hoàn tất, tác nhân tự động đọc các đầu ra đánh giá, chẩn đoán nguyên nhân thất bại và chạy lại các thí nghiệm. Theo mặc định, nó sử dụng Claude Sonnet 4.5 để điều khiển vòng lặp ra quyết định, với tối đa 300 lần lặp cho mỗi lần chạy và nén ngữ cảnh tự động khi vượt quá 170k token.

Hugging Face đã trình diễn ba trường hợp sử dụng. Trong một tác vụ suy luận khoa học, tác nhân xác định các tập dữ liệu OpenScience và NemoTron-CrossThink từ chuỗi trích dẫn, lọc bảy biến thể từ ARC, SciQ và MMLU theo mức độ khó, rồi chạy 12 vòng tinh chỉnh giám sát trên Qwen3-1.7B, giúp cải thiện điểm GPQA từ 10% lên 32% trong dưới 10 giờ. Với một ứng dụng y tế, tác nhân kết luận rằng các tập dữ liệu hiện có là chưa đủ, viết các script để tạo ra 1.100 mẫu dữ liệu tổng hợp, và mở rộng chúng gấp 50 lần để huấn luyện, vượt hiệu năng Codex thêm 60% trên HealthBench. Trong một bối cảnh toán học cạnh tranh, tác nhân đã viết script huấn luyện GRPO và khởi chạy huấn luyện trên các GPU A100 thông qua HF Spaces, sau đó tiến hành các nghiên cứu ablation sau khi quan sát hiện tượng sụp đổ phần thưởng.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI

Thông điệp Cổng Tin Tức, ngày 26 tháng 4 — Nền tảng nhân sự của Hàn Quốc Worxphere đã đổi thương hiệu JobKorea khi chuyển từ các bảng tuyển dụng trực tuyến truyền thống sang các giải pháp tuyển dụng dựa trên AI. Công ty đang hợp nhất các dịch vụ, bao gồm JobKorea và Albamon, thành một nền tảng thống nhất bao phủ việc làm lâu dài,

GateNews5giờ trước

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia6giờ trước

Các Tiểu vương quốc Ả Rập Thống nhất (UAE) Công bố Chuyển hướng sang Mô hình Chính phủ dựa trên AI trong Hai Năm Tiếp theo

H.H. Sheikh Mohammed bin Rashid Al Maktoum cho biết mục tiêu là 50% các lĩnh vực của chính phủ hoạt động thông qua AI tác nhân tự chủ. Quá trình chuyển đổi cũng sẽ bao gồm việc đào tạo các nhân viên liên bang để “thành thạo AI” và sẽ được giám sát bởi Sheikh Mansour bin Zayed. Các điểm chính:

Coinpedia04-25 08:39

Nền tảng giao dịch AI Fere AI huy động 1,3 triệu USD, được dẫn dắt bởi Ethereal Ventures

Tin tức từ Gate, ngày 25 tháng 4 — Fere AI, một nền tảng giao dịch tài sản số được hỗ trợ bởi AI, đã công bố việc hoàn tất một vòng gọi vốn trị giá 1,3 triệu USD do Ethereal Ventures dẫn dắt, với sự tham gia của Galaxy Vision Hill và Kosmos Ventures, theo Globenewswire. Nền tảng hỗ trợ các mạng xuyên chuỗi bao gồm Ethereum, Solana và Base, cho phép người dùng mô tả mục tiêu giao dịch của họ bằng ngôn ngữ tự nhiên trong khi các tác nhân AI thực hiện lệnh giao dịch. Số vốn mới huy động sẽ được phân bổ để mở rộng phát triển nền tảng và tối ưu hóa các chiến lược giao dịch.

GateNews04-25 07:46

Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell

Tin từ Gate News, ngày 25 tháng 4 — Nvidia đã triển khai Codex của OpenAI, một tác nhân AI được cung cấp bởi GPT-5.5, cho toàn bộ lực lượng lao động của mình sau một thử nghiệm thành công với khoảng 10.000 nhân viên, theo các trao đổi nội bộ từ CEO Jensen Huang và CEO OpenAI Sam Altman. Codex được thiết kế để hỗ trợ

GateNews04-25 03:11

Startup mã hóa bằng AI Cognition đang đàm phán vòng gọi vốn định giá $25B

Tin tức Cổng thông tin, ngày 25 tháng 4 — Theo những người am hiểu vấn đề, startup mã hóa bằng AI Cognition đang ở giai đoạn đàm phán ban đầu để huy động hàng trăm triệu đô la hoặc hơn, với định giá xấp xỉ $25 tỷ, theo những người quen thuộc với vụ việc. Mức độ quan tâm đã tăng lên sau thương vụ SpaceX mua lại một startup mã hóa AI đối thủ. Co

GateNews04-25 02:51
Bình luận
0/400
Không có bình luận