Funcionários da OpenAI publicamente acusam os resultados do teste Referência da Grok3 de serem enganosos

GoldenOctober2024
GROK-2,47%
XAI20,52%

Em 23 de fevereiro, um funcionário da OpenAI acusou publicamente a empresa xAI de Elon Musk, dizendo que os resultados do teste Referência do mais recente modelo de IA Grok3 divulgado por ela eram enganosos. Em resposta, o cofundador da xAI, Igor Babushkin, insistiu que a empresa não estava errada. Os gráficos da xAI mostram que duas versões do Grok3 – Grok3 Reasoning Beta e Grok3 mini Reasoning – superaram o modelo atualmente mais forte disponível da OpenAI, o3-mini-high, no AIME 2025. No entanto, os funcionários da OpenAI foram rápidos em apontar na plataforma X que o gráfico da xAI não incluía a pontuação AIME 2025 de o3-mini-high sob condições “cons@64”. Babushkin argumenta na plataforma X que a OpenAI publicou gráficos de teste de referência igualmente enganosos no passado. Embora esses gráficos sejam usados para comparar o desempenho de seus próprios modelos.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Birakenewekovip
· 2025-02-23 03:48
Bull Run 🐂
Responder0
Renatinho25vip
· 2025-02-23 02:47
Invista 🚀
Responder0