Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

ChainCatcher
XAI55,35%
GROK-1,76%

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição ‘cons@64’. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários