Hugging Face Open-Sources ml-intern, Agen AI untuk Riset ML Otonom

Pesan Gate News, 22 April — Hugging Face telah merilis ml-intern secara open-source, sebuah agen riset ML yang mampu menyelesaikan sepenuhnya alur kerja membaca paper, mengorganisasi kumpulan data, menjalankan pelatihan GPU, mengevaluasi hasil, dan mengiterasi perbaikan secara otonom. Proyek ini dibangun di atas framework smolagents milik Hugging Face dan menyediakan antarmuka CLI maupun berbasis web, dengan kode yang tersedia di GitHub.

Toolchain ml-intern dirancang berpusat pada ekosistem Hugging Face. Ia mengambil paper dari arXiv dan HF Papers sambil menelusuri rantai sitasi untuk bacaan yang lebih mendalam; menjelajahi kumpulan data di HF Hub, memvalidasi kualitas, dan memformat ulang data untuk pelatihan; dan saat sumber daya GPU lokal tidak tersedia, ia memanggil HF Jobs untuk menjalankan tugas pelatihan berbasis cloud. Setelah pelatihan selesai, agen secara otomatis membaca output evaluasi, mendiagnosis penyebab kegagalan, dan menjalankan ulang eksperimen. Secara default, ia menggunakan Claude Sonnet 4.5 untuk menggerakkan loop keputusan, dengan maksimum 300 iterasi per sesi dan pemampatan konteks otomatis saat melebihi 170k token.

Hugging Face menunjukkan tiga kasus penggunaan. Dalam tugas penalaran ilmiah, agen mengidentifikasi dataset OpenScience dan NemoTron-CrossThink dari rantai sitasi, menyaring tujuh varian dari ARC, SciQ, dan MMLU berdasarkan tingkat kesulitan, dan menjalankan 12 putaran supervised fine-tuning pada Qwen3-1.7B, meningkatkan skor GPQA dari 10% menjadi 32% dalam waktu kurang dari 10 jam. Untuk aplikasi medis, agen menyimpulkan bahwa dataset yang ada tidak mencukupi, menulis skrip untuk menghasilkan 1.100 sampel data sintetis, dan menskalakannya 50 kali lipat untuk pelatihan, melampaui performa Codex sebesar 60% pada HealthBench. Dalam skenario kompetisi matematika, agen menulis skrip pelatihan GRPO dan meluncurkan pelatihan pada GPU A100 melalui HF Spaces, lalu melakukan studi ablation setelah mengamati runtuhnya reward.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Worxphere Mengganti Merek JobKorea dengan Alat Perekrutan Berbasis AI

Berita Gate, 26 April — Platform HR Korea Selatan, Worxphere, telah mengganti merek JobKorea saat beralih dari papan lowongan online tradisional ke solusi perekrutan berbasis AI. Perusahaan ini mengonsolidasikan layanan termasuk JobKorea dan Albamon ke dalam satu platform terpadu yang mencakup pekerjaan tetap,

GateNews4menit yang lalu

AI Agent kini bisa secara mandiri mereproduksi makalah akademis yang kompleks: Mollick mengatakan kesalahan lebih banyak berasal dari teks asli manusia, bukan dari AI

Mollick 指出, metode dan data publik saja sudah cukup bagi AI agent untuk mereplikasi penelitian kompleks tanpa adanya naskah dan kode program asli; jika replikasi tidak sesuai dengan naskah asli, biasanya itu karena kesalahan dalam pengolahan data pada naskah itu sendiri atau kesimpulan yang terlalu berlebihan, bukan karena AI. Claude terlebih dahulu mereplikasi naskah, lalu GPT‑5 Pro melakukan verifikasi silang; sebagian besar berhasil, hanya terhambat ketika data terlalu besar atau ada masalah replication data. Tren ini secara besar mengurangi biaya tenaga kerja, sehingga replikasi menjadi pemeriksaan yang umum dan dapat dilakukan, serta juga mengajukan tantangan institusional untuk proses peninjauan dan tata kelola; alat kebijakan tata kelola pemerintah atau menjadi isu kunci.

ChainNewsAbmedia1jam yang lalu

UEA Mengumumkan Peralihan Ke Model Pemerintahan Berbasis AI dalam Dua Tahun Ke Depan

Yang Mulia Syekh Mohammed bin Rashid Al Maktoum menyatakan bahwa tujuannya adalah agar 50% sektor pemerintahan beroperasi melalui agen AI otonom. Transisi ini juga akan mencakup pelatihan pegawai federal untuk “menguasai AI” dan akan diawasi oleh Syekh Mansour bin Zayed. Poin-Poin Penting:

Coinpedia20jam yang lalu

Platform Perdagangan AI Fere AI Menggalang $1,3M dalam Pendanaan yang Dipimpin oleh Ethereal Ventures

Pesan Berita Gate, 25 April — Fere AI, platform perdagangan aset digital berbasis AI, mengumumkan penyelesaian putaran pendanaan sebesar $1,3 juta yang dipimpin oleh Ethereal Ventures, dengan partisipasi dari Galaxy Vision Hill dan Kosmos Ventures, menurut Globenewswire. Platform ini mendukung jaringan lintas-rantai

GateNews21jam yang lalu

Nvidia Meluncurkan Agen AI OpenAI Codex ke Seluruh Tenaga Kerja dengan Infrastruktur Blackwell

Pesan Gate News, 25 April — Nvidia telah meluncurkan Codex dari OpenAI, sebuah agen AI yang didukung oleh GPT-5.5, ke seluruh tenaga kerjanya setelah uji coba yang berhasil dengan sekitar 10.000 karyawan, menurut komunikasi internal dari CEO Jensen Huang dan CEO OpenAI Sam Altman. Codex dirancang untuk membantu

GateNews04-25 03:11

Startup Pengkodean AI Cognition dalam Pembicaraan untuk Putaran Pendanaan dengan Valuasi $25B

Gate News, 25 April — Startup pengkodean AI Cognition sedang dalam pembicaraan awal untuk menggalang ratusan juta dolar atau lebih dengan valuasi sekitar $25 miliar, menurut orang-orang yang mengetahui hal tersebut. Minat meningkat setelah akuisisi SpaceX terhadap startup pengkodean AI pesaing. Co

GateNews04-25 02:51
Komentar
0/400
Tidak ada komentar