OpenClaw Pendiri berbagi peringkat kecocokan model AI, minimax-m2.1 dan kimi-k2.5 buatan dalam negeri menempati posisi 2 dan 3

Gate News berita, 8 Maret, pendiri OpenClaw (kerangka kerja pengembangan proxy AI) Peter Steinberger membagikan hasil pengujian benchmark dari lembaga pihak ketiga PinchBench yang mengevaluasi kinerja model bahasa besar AI dalam tugas proxy OpenClaw. Hasilnya menunjukkan bahwa Gemini 3 Flash dengan tingkat keberhasilan 95,1% menduduki posisi pertama, model domestik minimax-m2.1 dan kimi-k2.5 masing-masing dengan 93,6% dan 93,4% menempati posisi kedua dan ketiga. Claude Sonnet 4.5 memiliki tingkat keberhasilan 92,7%, dan GPT-4o sebesar 85,2%.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar