OpenClaw fundador partilha classificação de adaptação de modelos de IA, com minimax-m2.1 e kimi-k2.5 nacionais ocupando as posições 2 e 3.

Gate News notícia, 8 de março, Peter Steinberger, fundador do OpenClaw (framework de desenvolvimento de agentes de IA), compartilhou os resultados de um teste de referência realizado por uma terceira parte, PinchBench, que avalia o desempenho de grandes modelos de linguagem de IA em tarefas de agentes OpenClaw. Os resultados mostram que o Gemini 3 Flash alcançou uma taxa de sucesso de 95,1% nas tarefas OpenClaw, ficando em primeiro lugar. Os modelos nacionais minimax-m2.1 e kimi-k2.5 ficaram em segundo e terceiro lugar, com 93,6% e 93,4%, respectivamente. Claude Sonnet 4.5 obteve uma taxa de sucesso de 92,7%, enquanto GPT-4o atingiu 85,2%.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários