Engenheiro da OpenAI Clive Chan questiona recomendações de hardware da V4, citando erros e falta de clareza em relação à V3

Mensagem do Gate News, 24 de abril — o engenheiro da OpenAI, Clive Chan, levantou objeções detalhadas ao capítulo de recomendações de hardware no relatório técnico V4, chamando-o de “surpreendentemente medíocre e propenso a erros” em comparação com a aclamada versão V3. A orientação de hardware da V3, que incluía sessões de Q&A que se tornaram o tópico de discussão mais popular na conferência acadêmica ISCA, ofereceu recomendações específicas alinhadas com padrões de interconexão da indústria. A V4, por outro lado, é muito mais vaga.

Chan contestou sistematicamente três recomendações-chave. Em consumo de energia, o relatório sugere que a otimização de software permite que os chips executem computação, armazenamento e comunicação com capacidade total simultaneamente, e recomenda que os fabricantes de chips reservem margem de energia adicional. Chan argumenta que isso é contraproducente: o poder total do chip é limitado por limitações do processo físico, então reservar mais margem de energia apenas reduz a frequência de operação, diminuindo, por fim, o desempenho computacional. No que diz respeito à transferência de dados de GPU para GPU, o relatório defende um modelo pull—no qual as GPUs buscam ativamente os dados—em vez de um modelo push, citando alto overhead de notificação nas operações push. Chan contesta isso, afirmando que o pull na verdade é mais lento e que capacidades aprimoradas do adaptador de rede seriam preferíveis. No entanto, os dois podem estar discutindo camadas diferentes do problema: o relatório aborda o overhead do mecanismo de notificação, enquanto Chan se refere à própria latência de transmissão.

Quanto às funções de ativação, o relatório recomenda substituir o SwiGLU por funções mais simples para reduzir a carga computacional. Chan não vê mérito nisso, observando que o Sonic MoE já demonstrou desempenho ideal usando SwiGLU. Chan suspeita que o DeepSeek possa ter “enfraquecido deliberadamente esta seção.”

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

DeepSeek V4 é lançado com janela de contexto de 1M; chips Huawei Ascend e Cambricon alcançam compatibilidade total

Mensagem do Gate News, 24 de abril — DeepSeek V4-Pro e DeepSeek V4-Flash foram oficialmente lançados e tiveram seu código aberto em 24 de abril, com o comprimento de processamento de contexto sendo expandido significativamente de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que seus produtos de supernó Ascend

GateNews33m atrás

Fere AI Conclui Rodada de Financiamento de US$ 1,3 Milhão Liderada pela Ethereal Ventures

Mensagem do Gate News, 24 de abril — A Fere AI, uma plataforma de agente de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures. A plataforma oferece suporte a redes cross-chain, incluindo Ethereum,

GateNews54m atrás

Anthropic reverte mudanças no Claude Code após queda de qualidade; todas as correções concluídas

Mensagem do Gate News, 24 de abril — A Anthropic reconheceu uma recente queda na qualidade do Claude Code e confirmou que todos os problemas relacionados foram resolvidos por meio de rollbacks e correções. Os problemas decorreram de três ajustes de produto e prompt feitos entre o início e meados de abril. Em 4 de março, o

GateNews2h atrás

Cofundador da NeoSoul Kaelan: a Indústria de IA deve permitir que brinquedos existam; a inovação muitas vezes começa como produtos experimentais

Mensagem do Gate News, 24 de abril — Em um fórum recente em Hong Kong sobre finanças inteligentes e criptografadas, o cofundador da NeoSoul, Kaelan, compartilhou percepções sobre como avaliar projetos de IA no estágio inicial, em uma indústria de IA que evolui rapidamente. Além de avaliar produtos atuais, as equipes devem demonstrar a capacidade de acompanhar as capacidades dos modelos subjacentes, afirmou ele.

GateNews2h atrás

Meta vai implantar dezenas de milhões de chips AWS Graviton5 em acordo multianual de bilhões de dólares

Mensagem do Gate News, 24 de abril — A Meta assinou um acordo multianual com a Amazon Web Services para implantar dezenas de milhões de processadores Graviton5 para sua infraestrutura de IA, tornando a Meta um dos maiores clientes globais de Graviton da AWS. O acordo, com duração de três a cinco anos, é avaliado em bilhões de d

GateNews3h atrás

DeepSeek V4-Flash entra no Ollama Cloud, servidor nos EUA: Claude Code, OpenClaw conectados em um clique

Ollama Cloud colocou DeepSeek V4-Flash à venda, com inferência em servidores nos EUA, oferecendo três conjuntos de comandos de um clique para conectar ao Claude Code, OpenClaw e Hermes. V4-Flash/V4-Pro adotam uma arquitetura MoE, com suporte nativo a contexto de 1M, e reduzem custos com compressão Token-wise + atenção esparsa DSA; em cenários de 1M, o FLOPs por token cai 27% e o cache KV diminui 10%. A API é compatível com OpenAI ChatCompletions e Anthropic, facilitando a alternância entre diferentes fluxos de trabalho, reduzindo custos e riscos de soberania de dados.

ChainNewsAbmedia4h atrás
Comentário
0/400
Sem comentários