Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya “mencengangkan: biasa saja dan rawan kesalahan” dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.
Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.
Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin “secara sengaja melemahkan bagian ini.”
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Nvidia Meluncurkan Agen AI OpenAI Codex ke Seluruh Tenaga Kerja dengan Infrastruktur Blackwell
Pesan Gate News, 25 April — Nvidia telah meluncurkan Codex dari OpenAI, sebuah agen AI yang didukung oleh GPT-5.5, ke seluruh tenaga kerjanya setelah uji coba yang berhasil dengan sekitar 10.000 karyawan, menurut komunikasi internal dari CEO Jensen Huang dan CEO OpenAI Sam Altman.
Codex dirancang untuk membantu
GateNews19menit yang lalu
Departemen Luar Negeri AS Memberi Peringatan tentang Distilasi Model AI DeepSeek
Departemen Luar Negeri AS mengeluarkan sebuah kabel pada 24 April kepada perwakilan diplomatik dan konsuler di seluruh dunia, memperingatkan pemerintah asing tentang upaya Tiongkok untuk menyalin sistem AI Amerika melalui distilasi, menurut Reuters. Kabel tersebut
CryptoFrontier28menit yang lalu
Startup AI Kesehatan Milik Profesor Stanford Mencari $100M dengan Valuasi $1B
Pesan Berita Gate, 25 April — Profesor Stanford James Zou sedang menggalang sekitar $100 juta untuk Human Intelligence, sebuah startup asal California yang mengembangkan model AI untuk fisiologi manusia, dengan valuasi sekitar $1 miliar.
Perusahaan ini dibangun berdasarkan riset Zou dalam fisiologi dan AI. Algoritme EchoNet milik lab-nya
GateNews39menit yang lalu
Startup Pengkodean AI Cognition dalam Pembicaraan untuk Putaran Pendanaan dengan Valuasi $25B
Gate News, 25 April — Startup pengkodean AI Cognition sedang dalam pembicaraan awal untuk menggalang ratusan juta dolar atau lebih dengan valuasi sekitar $25 miliar, menurut orang-orang yang mengetahui hal tersebut. Minat meningkat setelah akuisisi SpaceX terhadap startup pengkodean AI pesaing.
Co
GateNews39menit yang lalu
Meta Akan Menerapkan Jutaan Chip AWS Graviton untuk Beban Kerja AI
Berita Gerbang, 25 April — Amazon mengumumkan pada 24 April bahwa Meta akan menggunakan jutaan chip AWS Graviton untuk beban kerja AI, menandai kemenangan pelanggan yang signifikan bagi prosesor ARM buatan internal AWS. Chip tersebut akan digunakan untuk inferensi AI dan komputasi umum, bukan
GateNews49menit yang lalu
Pasar Minyak AS Diselidiki atas Dugaan Perdagangan Orang Dalam yang Mencurigakan; Kebijakan Trump Mendominasi Pergerakan Pasar
Gate News pesan, 25 April — Tren makro dan ketegangan geopolitik mendominasi pergerakan pasar minggu ini. Ketegangan AS-Iran terus menekan harga minyak dan aset berisiko global, sementara blokade Selat Hormuz belum terselesaikan dan negosiasi bergeser ke arah "gencatan senjata sepenuhnya". Sentimen risk-off
GateNews53menit yang lalu