موظفو OpenAI ينتقدون علنًا نتائج اختبارات XAI الأخيرة لنموذج الذكاء الاصطناعي Grok3 بأنها مضللة

ChainCatcher
XAI20.52%
GROK‎-2.47%

في رسالة ChainCatcher ، وفقًا لتقرير من Jinshi ، اتهم أحد موظفي OpenAI شركة XAI التابعة لماسك علنًا ، مشيرًا إلى أن نتائج اختبار المعيار لنموذج AI Grok3 الجديد الذي أطلقته مضللة. بالنسبة لهذا الأمر ، أكد مؤسس شركة XAI إيغور بابوشكين (Igor Babushkin) أن الشركة ليست غير ملائمة. تشير رسوم بيانية XAI إلى أن أداء نسختي Grok3 - Grok3 Reasoning Beta وGrok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high لدى OpenAI على AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية XAI لم تتضمن درجة o3-mini-high في شرط “cons@64” في AIME 2025. بوبوش جين ادعى على منصة X أن OpenAI قد نشرت في الماضي رسوم بيانية للاختبارات الخادعة المشابهة. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات