Pesan Berita Gate, 29 April — Bobot model flash Ling-2.6 milik Ant Group kini telah menjadi sumber terbuka, yang sebelumnya hanya tersedia melalui API. Model ini memiliki total 104 miliar parameter dengan 7,4 miliar yang aktif per inferensi, jendela konteks 256K, dan lisensi MIT. Versi presisi BF16, FP8, dan INT4 tersedia di HuggingFace dan ModelScope.
Ling-2.6-flash memperkenalkan peningkatan hybrid linear attention dibanding Ling 2.0, dengan meningkatkan GQA asli menjadi arsitektur hibrida 1:7 MLA plus Lightning Linear yang dikombinasikan dengan MoE yang sangat jarang (sparse). Efisiensi inferensi jauh melampaui model sebanding: kecepatan generasi puncak mencapai 340 token/detik pada 4 GPU H20, dengan throughput prefill dan decode sekitar 4x lebih tinggi daripada model open-source sebanding. Tolok ukur terkait agen menunjukkan performa yang kuat: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval, dan PinchBench mencapai atau mendekati level SOTA. Pada seluruh rangkaian tolok ukur Artificial Analysis, konsumsi token total hanya 15 juta. Pada AIME 2026, model mencetak 73,85%.
Situs web resmi Ant Group juga mencantumkan versi andalan Ling-2.6-1T (triliun-parameter) dan versi ringan Ling-2.6-mini (lightweight version), meskipun pada saat publikasi, bobotnya masih belum dirilis di HuggingFace, dan hanya seri flash yang tersedia untuk diunduh.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Laporan Riset a16z Crypto: Tingkat Eksploitasi Kerentanan DeFi untuk Agen AI mencapai 70%
Berdasarkan laporan penelitian yang diterbitkan oleh a16z Crypto pada 29 April, ketika agen AI dilengkapi dengan pengetahuan domain yang terstruktur, tingkat keberhasilan dalam mereplikasi kerentanan manipulasi harga Ethereum mencapai 70%; dalam lingkungan sandbox tanpa pengetahuan domain apa pun, tingkat keberhasilan hanya 10%. Laporan tersebut juga mencatat contoh di mana agen AI secara independen berhasil menghindari batasan sandbox untuk mengakses informasi transaksi masa depan, serta pola kegagalan sistematis ketika agen menyusun rencana serangan yang dapat menghasilkan keuntungan secara bertahap.
MarketWhisper9menit yang lalu
Model OpenAI Akan Secara Bertahap Bermigrasi ke Chip Trainium Kustom Amazon, Kata Altman Ia 'Menanti' Hal Itu
Pesan Berita Gate, 29 April — Model OpenAI yang berjalan di Amazon Web Services' Bedrock akan secara bertahap bermigrasi ke Trainium, chip AI khusus rancangan Amazon, demikian menurut pernyataan terbaru dari CEO OpenAI Sam Altman dan jajaran eksekutif AWS. Saat ini, model beroperasi dalam lingkungan campuran menggunakan baik GPU dan Tr
GateNews1jam yang lalu
Altman: Penetapan Harga Berbasis Token Mulai Usang karena GPT-5.5 Mengalihkan Fokus ke Penyelesaian Tugas, Bukan Jumlah Token
Pesan Berita Gate, 29 April — CEO OpenAI Sam Altman mengatakan dalam sebuah wawancara dengan Ben Thompson di Stratechery bahwa penetapan harga berbasis token bukanlah model yang layak untuk jangka panjang bagi layanan AI. Menggunakan GPT-5.5 sebagai contoh, Altman mencatat bahwa meskipun harga per token jauh lebih tinggi daripada GPT-5.4, model tersebut
GateNews1jam yang lalu
Sam Altman merilis tangkapan layar dua mode Codex, fungsi kantor dan pemrograman resmi dipisahkan
Eksekutif OpenAI Sam Altman, pada 29 April, memposting tangkapan layar dan pernyataan di platform X: Codex sedang meluncurkan versi baru antarmuka panduan. Saat pengguna masuk untuk pertama kali, mereka harus memilih dari dua mode, yaitu Excelmogging dan Codemaxxing. Pengguna aktif mingguan Codex saat ini telah melampaui 4 juta, dan skenario penggunaannya telah berkembang dari pembuatan kode hingga penggunaan non-teknis.
MarketWhisper1jam yang lalu
Codex OpenAI Meluncurkan Antarmuka Dual-Mode: Excelmogging untuk Pekerjaan Kantor, Codemaxxing untuk Pemrograman
Pesan Gate News, 29 April — CEO OpenAI Sam Altman mengumumkan antarmuka Codex yang didesain ulang di X hari ini, memperkenalkan dua mode berbeda untuk pengguna. "Excelmogging" menargetkan tugas kantor sehari-hari dengan antarmuka yang disederhanakan dan slogan "Same tools, simpler interface," menampilkan contoh tugas seperti membuat spreadsheet.
GateNews2jam yang lalu
Media AS: Draf perintah eksekutif Gedung Putih mengizinkan model Anthropic Mythos masuk ke pemerintahan
Berdasarkan laporan yang dikutip Axios pada 28 April dari orang dalam, Gedung Putih sedang menyusun pedoman yang memungkinkan setiap lembaga federal untuk melewati penetapan risiko rantai pasokan (SCRD) dari Anthropic, serta memperkenalkan model-model baru untuk digunakan pemerintah, termasuk model Mythos milik Anthropic. Terkait hal tersebut, Gedung Putih mengeluarkan pernyataan resmi yang menyatakan bahwa setiap pernyataan kebijakan akan langsung diterbitkan oleh presiden, dan segala klaim lainnya hanyalah dugaan.
MarketWhisper2jam yang lalu