Karyawan OpenAI secara terbuka menuduh hasil pengujian Benchmark Grok3 bersifat menyesatkan

GoldenOctober2024
GROK-2,47%
XAI20,52%

Golden Ten Data, 23 Februari, baru-baru ini, seorang karyawan OpenAI secara terbuka menuduh perusahaan xAI Elon Musk, mengatakan bahwa hasil tes Benchmark dari model AI terbaru Grok3 yang dirilis olehnya menyesatkan. Sebagai tanggapan, salah satu pendiri xAI Igor Babushkin bersikeras bahwa perusahaan itu tidak salah. Grafik xAI menunjukkan bahwa dua versi Grok3 – Grok3 Reasoning Beta dan Grok3 mini Reasoning – mengungguli model OpenAI terkuat yang tersedia saat ini, o3-mini-high, di AIME 2025. Namun, karyawan OpenAI dengan cepat menunjukkan pada platform X bahwa bagan xAI tidak menyertakan skor AIME 2025 o3-mini-high dalam kondisi “cons@64”. Babushkin berpendapat pada platform X bahwa OpenAI telah memposting grafik Benchmark menyesatkan serupa di masa lalu. Meskipun grafik ini digunakan untuk membandingkan kinerja model mereka sendiri.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Birakenewekovip
· 2025-02-23 03:48
Bull Run 🐂
Balas0
Renatinho25vip
· 2025-02-23 02:47
Investasi 🚀
Lihat AsliBalas0