Pesan Gate News, 24 April — DeepSeek telah merilis seri model open-source V4 di bawah Lisensi MIT, dengan bobot kini tersedia di Hugging Face dan ModelScope. Seri ini mencakup dua model (MoE) mixture-of-experts: V4-Pro dengan total parameter 1,6 triliun dan 49 miliar yang diaktifkan per token, serta V4-Flash dengan total parameter 284 miliar dan 13 miliar yang diaktifkan per token. Keduanya mendukung jendela konteks 1 juta token.
Arsitekturnya menampilkan tiga peningkatan kunci: mekanisme attention hibrida yang menggabungkan compressed sparse attention (CSA) dan heavily compressed attention (HCA) yang secara signifikan mengurangi overhead untuk konteks panjang—FLOPs inferensi V4-Pro untuk konteks 1M hanya 27% dari V3.2, dan KV cache (VRAM untuk menyimpan informasi historis selama inferensi) hanya 10% dari V3.2; manifold-constrained hyperconnections (mHC) menggantikan residual connection tradisional untuk meningkatkan stabilitas propagasi sinyal lintas-lapis; dan optimizer Muon untuk konvergensi pelatihan yang lebih cepat. Pra-pelatihan menggunakan lebih dari 32 triliun token data.
Pascapelatihan menggunakan pendekatan dua tahap: pertama melatih expert khusus domain melalui supervised fine-tuning (SFT) dan reinforcement learning GRPO, lalu menggabungkannya menjadi satu model melalui distilasi online. V4-Pro-Max (highest inference mode) mengklaim sebagai model open-source terkuat dengan benchmark coding kelas atas dan kesenjangan yang secara signifikan dipersempit dibandingkan model frontier closed-source dalam tugas penalaran dan agen. V4-Flash-Max mencapai performa penalaran level Pro dengan anggaran komputasi yang cukup, tetapi dibatasi oleh skala parameter pada pengetahuan murni dan tugas agen yang kompleks. Bobot disimpan dalam presisi campuran FP4+FP8.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Nvidia Meluncurkan Agen AI OpenAI Codex ke Seluruh Tenaga Kerja dengan Infrastruktur Blackwell
Pesan Gate News, 25 April — Nvidia telah meluncurkan Codex dari OpenAI, sebuah agen AI yang didukung oleh GPT-5.5, ke seluruh tenaga kerjanya setelah uji coba yang berhasil dengan sekitar 10.000 karyawan, menurut komunikasi internal dari CEO Jensen Huang dan CEO OpenAI Sam Altman.
Codex dirancang untuk membantu
GateNews6menit yang lalu
Departemen Luar Negeri AS Memberi Peringatan tentang Distilasi Model AI DeepSeek
Departemen Luar Negeri AS mengeluarkan sebuah kabel pada 24 April kepada perwakilan diplomatik dan konsuler di seluruh dunia, memperingatkan pemerintah asing tentang upaya Tiongkok untuk menyalin sistem AI Amerika melalui distilasi, menurut Reuters. Kabel tersebut
CryptoFrontier15menit yang lalu
Startup AI Kesehatan Milik Profesor Stanford Mencari $100M dengan Valuasi $1B
Pesan Berita Gate, 25 April — Profesor Stanford James Zou sedang menggalang sekitar $100 juta untuk Human Intelligence, sebuah startup asal California yang mengembangkan model AI untuk fisiologi manusia, dengan valuasi sekitar $1 miliar.
Perusahaan ini dibangun berdasarkan riset Zou dalam fisiologi dan AI. Algoritme EchoNet milik lab-nya
GateNews26menit yang lalu
Startup Pengkodean AI Cognition dalam Pembicaraan untuk Putaran Pendanaan dengan Valuasi $25B
Gate News, 25 April — Startup pengkodean AI Cognition sedang dalam pembicaraan awal untuk menggalang ratusan juta dolar atau lebih dengan valuasi sekitar $25 miliar, menurut orang-orang yang mengetahui hal tersebut. Minat meningkat setelah akuisisi SpaceX terhadap startup pengkodean AI pesaing.
Co
GateNews26menit yang lalu
Meta Akan Menerapkan Jutaan Chip AWS Graviton untuk Beban Kerja AI
Berita Gerbang, 25 April — Amazon mengumumkan pada 24 April bahwa Meta akan menggunakan jutaan chip AWS Graviton untuk beban kerja AI, menandai kemenangan pelanggan yang signifikan bagi prosesor ARM buatan internal AWS. Chip tersebut akan digunakan untuk inferensi AI dan komputasi umum, bukan
GateNews36menit yang lalu
Pasar Minyak AS Diselidiki atas Dugaan Perdagangan Orang Dalam yang Mencurigakan; Kebijakan Trump Mendominasi Pergerakan Pasar
Gate News pesan, 25 April — Tren makro dan ketegangan geopolitik mendominasi pergerakan pasar minggu ini. Ketegangan AS-Iran terus menekan harga minyak dan aset berisiko global, sementara blokade Selat Hormuz belum terselesaikan dan negosiasi bergeser ke arah "gencatan senjata sepenuhnya". Sentimen risk-off
GateNews40menit yang lalu