NVIDIA dan MIT Rilis Kerangka Lightning OPD, Meningkatkan Efisiensi Distilasi Model 4x Sambil Menghapus Masalah Memori GPU

Menurut laporan, peneliti NVIDIA dan MIT merilis Lightning OPD (Offline On-Policy Distillation), sebuah kerangka pasca-pelatihan baru untuk model bahasa besar yang menghilangkan kebutuhan untuk terus menjalankan model pengajar selama pelatihan. Dengan menghitung sebelumnya log-probabilitas model pengajar secara offline, kerangka ini meningkatkan efisiensi pelatihan 4x sambil membebaskan semua sumber daya GPU untuk pelatihan model siswa.

Dalam pengujian pada 8 GPU NVIDIA H100, Lightning OPD berhasil mendistilasi Qwen3-30B-A3B-Base (model MoE dengan 30 miliar parameter) dan meraih 71,0 pada tolok ukur AIME 2024, sedangkan OPD standar kehabisan memori pada perangkat keras yang sama. Untuk model Qwen3-8B yang lebih kecil, kerangka ini hanya membutuhkan 30 jam GPU untuk mencapai 69,9 poin.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Wawancara khusus Blockchain di wilayah Bonnie: Eric Trump membahas AI, energi, dan Bitcoin di Amerika, mengungkap bahwa Trump masih memanggilnya “honey” secara pribadi

台灣區塊鏈 YouTuber「邦尼區塊鏈」近日專訪 Eric Trump,圍繞美國比特幣挖礦公司 American Bitcoin、川普政府的加密貨幣政策、美國 AI 與能源競爭力,以及 Eric Trump 個人為何投入數位資產產業展開對談。 川普兒子:美國要在能源、AI、加密貨幣勝出 Eric Trump 在訪談中多次強調,川普政府的核心敘事是「讓美國在所有領域勝出」,而其中包含能源、人工智慧與加密貨幣。他表示,Donald Trump 是以「加密貨幣總統」的定位參選,並相信比特幣、數位資產與更高效率的金融交易方式。因此在 Eric Trump 看來,川普核心圈內的人物也會傾向支持同樣方向,包含對 AI、生產力與比特幣較為友善的政策思維。 訪談中也談到 Kevin Warsh 與聯準會政策方向。美國參議院已於 5 月 12 日確認 Kevin Warsh 出任聯準會理事,接下來預期將對其出任聯準會主席進行投票。Warsh 曾在聽證中表示 AI 可能帶來顯著供給面提升,進而對通膨形成下行壓力,但 Fed 內部對 AI 生產力是否一定會降低通膨仍有不同看法。 Eric Trump 則從

ChainNewsAbmedia2jam yang lalu

Anggota DPR dari Partai Republik Mengupayakan Investigasi terhadap Investasi Pribadi Altman senilai $3,75 miliar dan Konflik OpenAI

Menurut ChainCatcher, Ketua Komite Pengawasan DPR AS, James Comer, baru-baru ini menuntut CEO OpenAI Sam Altman mengungkapkan informasi tentang investasi pribadinya serta potensi konflik kepentingan dengan OpenAI. Permintaan Comer berfokus pada portofolio investasi Altman yang luas, yang mencakup sekitar 3,5 miliar dolar AS kekayaan bersihnya, termasuk kepemilikan di Helion, Stripe, dan Reddit. Secara spesifik, menurut laporan Wall Street Journal, Altman mendorong OpenAI untuk menginvestasikan 5

GateNews3jam yang lalu

TT Chain Mengintegrasikan Sistem Keamanan AegisAI untuk Perlindungan RWA pada 11 Mei

Menurut pengumuman TT Chain pada 11 Mei, jaringan blockchain Layer-2 mengintegrasikan infrastruktur keamanan berbasis AI milik AegisAI ke dalam ekosistem aset dunia nyata. Kolaborasi ini meningkatkan perlindungan untuk transaksi aset tokenisasi dan operasi lintas-chain melalui kemampuan deteksi ancaman yang canggih serta audit smart contract. Agen AI otonom milik AegisAI mendeteksi serangan phishing, mencegah upaya akses yang tidak sah, dan mengidentifikasi kerentanan pada smart contract secara

GateNews4jam yang lalu

Startup AI Wispr sedang dalam pembicaraan pendanaan pada penilaian $2B pada 12 Mei

Menurut PANews, startup AI Wispr sedang dalam negosiasi penggalangan dana pada 12 Mei, dengan valuasi 2 miliar dolar AS.

GateNews4jam yang lalu

Sam Altman akan Bersaksi Hari Ini dalam Gugatan OpenAI Musk atas $38M

Menurut BlockBeats, Sam Altman dijadwalkan bersaksi hari ini (12 Mei) di pengadilan federal di Oakland, California terkait gugatan Elon Musk terhadap OpenAI. Altman akan naik ke podium setelah ketua dewan OpenAI Bret Taylor menyelesaikan kesaksiannya. Musk mengajukan gugatan tersebut pada 2024 dengan menduga bahwa OpenAI, Altman, dan Presiden Greg Brockman melanggar misi awal perusahaan yang berbentuk nonprofit dan public benefit. Musk mengklaim donasinya senilai sekitar 38 juta dolar AS digunak

GateNews5jam yang lalu

Depthfirst Menemukan Celah Internet Kritis dengan Biaya Sepersepuluh dari Mythos Milik Anthropic

Menurut BlockBeats, pada 12 Mei, startup keamanan siber berbasis AI Depthfirst mengumumkan bahwa model penemuan kerentanan AI buatan sendiri telah menemukan beberapa celah keamanan kritis yang terlewat oleh Mythos milik Anthropic, dengan klaim total biayanya hanya sepersepuluh dari yang diperlukan pihak tersebut. CEO Depthfirst, Qasim Mithani, menyatakan perusahaan dapat "menyelesaikan pekerjaan seharga $1.000 yang Mythos butuhkan $10.000 untuk dikerjakan" dengan mengoptimalkan arsitektur model

GateNews5jam yang lalu
Komentar
0/400
Tidak ada komentar