Berita Gerbang, 24 April — DeepSeek V4 telah mempublikasikan hasil dari evaluasi penalaran matematis formal, meraih skor sempurna 120/120 pada Putnam-2025, menyamai Axiom untuk posisi pertama.
Dalam rezim praktis yang menggunakan LeanExplore dan constrained sampling, V4-Flash-Max mencetak 81.00 pada tolok ukur Putnam-200 Pass@8, secara signifikan mengungguli Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50), dan Seed-1.5-Prover (26.50). Hasil rezim frontier menunjukkan V4 berada di depan Seed-1.5-Prover (110/120) dan Aristotle (100/120).
V4 menggunakan pendekatan hibrida penalaran formal-informal: penalaran informal menghasilkan solusi bahasa alami kandidat, self-verification menyaring hasil, dan agen formal menyelesaikan pembuktian yang ketat di Lean. Hasil rezim frontier memanfaatkan penskalaan komputasi skala besar, sementara skor rezim praktis lebih mencerminkan kemampuan penerapan standar.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Kimi K3 Milik Moonshot AI Siap Diluncurkan pada Q3 2026 dengan Parameter 2,5T+ dan Konteks 1M Token dalam Pengujian
Pesan Berita Gate, 27 April — Moonshot AI berencana meluncurkan Kimi K3 pada Q3 2026 (Juli-September), menurut laporan. Model ini akan dilengkapi lebih dari 2,5 triliun parameter, dengan pengujian internal yang mengungkap kemampuan jendela konteks melebihi 1 juta token.
Namun, apakah konteks 1M tersebut akan
GateNews32menit yang lalu
OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution
Gate News message, April 27 — Greg Brockman, president and co-founder of OpenAI, says the next wave of artificial intelligence will move users from chatting with AI bots to assigning real-world tasks. This shift requires enterprises to rethink operational workflows and establish new protocols for se
GateNews53menit yang lalu
B.AI Meningkatkan Infrastruktur, Meluncurkan Fitur Keahlian Utama
Pesan Berita Gate, 27 April — B.AI mengumumkan berbagai kemajuan produk dan ekosistem minggu ini. Halaman pendaratan BAIclaw menerima perombakan total dari segi visual dan interaksi, dengan dukungan multibahasa situs web diperluas hingga 10 bahasa, sehingga memperkuat kegunaan globalnya.
Dalam hal infrastruktur
GateNews1jam yang lalu
Beijing menerapkan larangan perdagangan menuntut pencabutan transaksi! Meta menggagalkan rencana akuisisi perusahaan rintisan AI China, Manus, senilai 2 miliar dolar AS
Komisi Pembangunan dan Reformasi Nasional Tiongkok hari ini (27 April) secara resmi merilis pengumuman bahwa kantor mekanisme peninjauan keamanan investasi asing “secara sah dan sesuai peraturan mengambil keputusan melarang investasi terhadap akuisisi proyek Manus oleh modal asing, serta meminta pihak terkait untuk membatalkan transaksi akuisisi tersebut”. Ini adalah salah satu dari sedikit kasus sejak penerapan “Peraturan Peninjauan Keamanan Investasi Asing” Tiongkok yang menggunakan tingkat penanganan tertinggi untuk melakukan tindakan “melarang investasi” dan meminta agar transaksi yang sudah terjadi dibatalkan.
Meta menggelontorkan 2 miliar dolar AS, membeli aplikasi AI termurah
Waktunya kembali ke 29 Desember 2025. Meta mengumumkan akuisisi startup AI agen baru Manus di Tiongkok, dan pasar memperkirakan harga berada di kisaran 2 hingga 3 miliar dolar AS. Manus adalah AI umum yang dikembangkan oleh Beijing Butterfly Effect Technology Development, setelah diluncurkan pada 6 Maret 2025, karena performa yang menonjol dalam benchmark GAIA, dalam semalam
ChainNewsAbmedia1jam yang lalu
Saham IPO Xizhi Technology-P Melonjak Lebih dari 360% di Pasar Gelap, Kenaikan Menyempit hingga 320%
Gate News pesan, 27 April — Xizhi Technology-P (01879.HK), sebuah perusahaan chip AI yang terdaftar di Hong Kong, melihat sahamnya melonjak lebih dari 360% di pasar gelap (dark market) lebih awal hari ini, meskipun kenaikannya sejak itu menyempit menjadi 320%.
Saham tersebut diperdagangkan menjelang pencatatan IPO resmi Hong Kong
GateNews1jam yang lalu