Futuros
Acesse centenas de contratos perpétuos
TradFi
Ouro
Plataforma única para ativos tradicionais globais
Opções
Hot
Negocie opções vanilla no estilo europeu
Conta unificada
Maximize sua eficiência de capital
Negociação demo
Introdução à negociação de futuros
Prepare-se para sua negociação de futuros
Eventos de futuros
Participe de eventos e ganhe recompensas
Negociação demo
Use fundos virtuais para experimentar negociações sem riscos
Lançamento
CandyDrop
Colete candies para ganhar airdrops
Launchpool
Staking rápido, ganhe novos tokens em potencial
HODLer Airdrop
Possua GT em hold e ganhe airdrops massivos de graça
Pre-IPOs
Desbloqueie o acesso completo a IPO de ações globais
Pontos Alpha
Negocie on-chain e receba airdrops
Pontos de futuros
Ganhe pontos de futuros e colete recompensas em airdrop
Investimento
Simple Earn
Ganhe juros com tokens ociosos
Autoinvestimento
Invista automaticamente regularmente
Investimento duplo
Lucre com a volatilidade do mercado
Soft Staking
Ganhe recompensas com stakings flexíveis
Empréstimo de criptomoedas
0 Fees
Penhore uma criptomoeda para pegar outra emprestado
Centro de empréstimos
Centro de empréstimos integrado
Centro de riqueza VIP
Planos premium de crescimento de patrimônio
Gestão privada de patrimônio
Alocação premium de ativos
Fundo Quantitativo
Estratégias quant de alto nível
Apostar
Faça staking de criptomoedas para ganhar em produtos PoS
Alavancagem Inteligente
Alavancagem sem liquidação
Cunhagem de GUSD
Cunhe GUSD para retornos em RWA
Promoções
Centro de atividade
Participe de atividades e ganhe recompensas
Indicação
20 USDT
Convide amigos para recompensas de ind.
Programa de afiliados
Ganhe recomp. de comissão exclusivas
Gate Booster
Aumente a influência e ganhe airdrops
Anúncio
Atualizações na plataforma em tempo real
Blog da Gate
Artigos do setor de criptomoedas
AI
Gate AI
Seu parceiro de IA conversacional para todas as horas
Gate AI Bot
Use o Gate AI diretamente no seu aplicativo social
GateClaw
Gate Blue Lobster, pronto para usar
Gate for AI Agent
Infraestrutura de IA, Gate MCP, Skills e CLI
Gate Skills Hub
10K+ habilidades
Do escritório à negociação: um hub completo de habilidades para turbinar o uso da IA
GateRouter
Escolha inteligentemente entre mais de 30 modelos de IA, com 0% de taxas extras
《NVIDIA份额只剩48%,推理大时代的机会在哪里?》
Este é o nono artigo da série de 100 sobre pesquisa de IA, com 20 mil palavras, recomenda-se primeiro salvar, pois poucos provavelmente conseguirão ler tudo.
Nos artigos anteriores, analisamos Intel, AMD, ARM. Nos últimos anos, suas ações tiveram aumentos consideráveis — AMD dobrou, Intel triplicou, ARM também atingiu máximos históricos. Após esses aumentos, surge uma questão simples: ainda vale a pena segurar essas ações que já subiram? Há oportunidades nas que ainda não subiram?
Para responder a essa questão, não há como escapar de uma palavra-chave — raciocínio. Nos análises anteriores, essas duas palavras sempre aparecem quando se fala dessas empresas que subiram.
Então: qual é o tamanho do mercado de raciocínio? Em que estágio estamos atualmente? Quais empresas se beneficiarão? Quais já estão precificadas pelo mercado, quais ainda não?
Essa é uma compreensão fundamental a ser adquirida primeiro.
Um, qual é o tamanho do mercado
O treinamento de modelos é "escrever programas", o raciocínio é "o processo diário de invocação desse programa". Após o treinamento do GPT, milhões de pessoas o usam diariamente para fazer perguntas, e cada interação consome poder de cálculo de raciocínio. Claude Code executa uma tarefa, um agente roda cem rodadas, cada uma delas é raciocínio.
Diversas pesquisas de setor e mídia apontam na mesma direção: após o modelo entrar em produção, o raciocínio se tornará a maior parte do custo de ciclo de vida, estimativas comuns variam entre 80-90%. Ou seja, no futuro, na era da IA, a conta de poder de cálculo será composta por 80% a 90% de raciocínio, e apenas 10% de treinamento.
Por isso, na futura era da IA, 8 de cada 10 reais de consumo de poder de cálculo serão gastos com raciocínio.
No entanto, nos últimos três anos, quase toda discussão do mercado foi sobre treinamento, pois é uma história mais "sensacional" — quem tem mais H100, quem tem mais parâmetros, quem treinou a próxima geração de modelos primeiro. O raciocínio era visto como uma tarefa secundária após o treinamento.
Essa percepção distorcida está sendo revertida, e essa mudança é a razão fundamental pela qual as empresas de semicondutores dessa última rodada foram reprecificadas.
Mas qual é o tamanho real do mercado de raciocínio? Pode-se estimar de cinco perspectivas diferentes.
Primeiro, número de usuários. ChatGPT tem 900 milhões de usuários semanais, 50 milhões de assinantes pagos. Na China, a comparação é mais direta — o volume diário de chamadas de tokens passou de 100 bilhões no início de 2024 para 140 trilhões em 2026, um aumento de 1.400 vezes. Ainda há muito espaço para crescimento.
Segundo, intensidade de uso. O volume de tokens processados pela OpenAI era de 6 bilhões por minuto em outubro de 2025, atingiu 15 bilhões em abril de 2026 — um aumento de 2,5 vezes em seis meses. A receita de versões empresariais representa mais de 40%, e os usuários corporativos usam dezenas de vezes mais intensamente do que consumidores.
Terceiro, comprimento das conversas. O comprimento do contexto passou de algumas centenas de tokens nos primeiros tempos para 1 milhão de tokens na API DeepSeek V4 Pro / Flash, com saída máxima de 384 mil. Quanto maior o texto, maior o consumo de memória e poder de cálculo por raciocínio.
Quarto, os próprios modelos estão cada vez mais caros em termos de cálculo. Modelos de raciocínio como OpenAI o1, DeepSeek R1, Claude Thinking, antes de responder, "pensam" internamente milhares ou dezenas de milhares de tokens. Jensen Huang, CEO da Nvidia, mencionou que modelos de raciocínio podem precisar de muito mais cálculo, até cem vezes mais.
Antes, você perguntava a uma IA e ela dava a resposta imediatamente; agora, ao fazer uma pergunta difícil, ela pensa por meia minuto antes de responder. Esse "pensar por meia minuto" é um aumento no consumo de poder de cálculo.
Quinto, agentes. Uma tarefa de um agente geralmente requer 10 a 100 chamadas ao modelo. O uso semanal do Codex da OpenAI já ultrapassou 3 milhões — isso é apenas um produto de uma empresa. Um especialista na cadeia de IA estima que o consumo total de poder de cálculo de um agente inteligente pode ser mais de 10 vezes maior do que o de um grande modelo de linguagem com parâmetros semelhantes.
Multiplicando esses cinco fatores, a demanda total por raciocínio pode experimentar uma expansão de várias ordens de magnitude em três a cinco anos, não sendo uma narrativa exagerada, mas uma previsão cada vez mais próxima do mainstream.
Na economia, há um fenômeno antigo chamado Paradoxo de Jevons — quando a eficiência de uso de um recurso melhora, o consumo total pode aumentar, pois fica mais barato e mais cenários se tornam viáveis. Após a melhora na eficiência da máquina a vapor, o consumo de carvão na Inglaterra disparou; após a redução do preço do token de raciocínio, as chamadas de IA aumentaram exponencialmente. É o mesmo roteiro. Segundo a IEA, o consumo de energia dos data centers globais deve passar de 1,5% do total em 2024 para o dobro, 945 TWh, em 2030 — aproximadamente o consumo anual de energia da Alemanha e França juntos.
Além disso, ações concretas na indústria reforçam ainda mais esse ponto:
A ARR da Anthropic passou de 1 bilhão de dólares no final de 2024 para 30 bilhões de dólares no início de 2026 — um crescimento de 30 vezes em 14 meses. Para sustentar essa curva, a empresa garantiu mais de 11 GW de capacidade de cálculo até o final de 2025 e início de 2026, incluindo uma encomenda de 21 bilhões de dólares em TPU da Broadcom. A OpenAI já comprometeu a implantação de 10 GW de chips personalizados. A meta de entrega de TPUs da Google em 2026 foi aumentada em 50%, para 6 milhões de unidades.
Os investimentos de capital dos provedores de nuvem também são mais evidentes. Google planeja gastar entre 175 e 185 bilhões de dólares em capital em 2026, quase o dobro de 2025; Amazon investirá 200 bilhões de dólares; Meta planeja aumentar em 65%, chegando a 118 bilhões de dólares. Os oito maiores provedores de nuvem terão um investimento total de mais de 600 bilhões de dólares em 2026, com crescimento anual de 40%.
Colocando tudo junto, a conclusão é simples — a curva de demanda por raciocínio em IA já ultrapassou a capacidade de fornecimento de qualquer fornecedor de hardware.
Essa é a essência do mercado de raciocínio: na era do treinamento, "criar um deus"; na era do raciocínio, "esse deus é chamado por bilhões de pessoas diariamente, cada agente invoca centenas de vezes, pensando dezenas de milhares de tokens a cada vez". De uma para a outra, o consumo de poder de cálculo não aumenta de forma linear, mas de modo geométrico.
Dois, quais ações se beneficiarão?
O mercado é grande, mas nem todas as empresas se beneficiarão, e a posição de liderança da Nvidia já está se enfraquecendo!
Em 2026, a participação da Nvidia no mercado global de chips de raciocínio de IA será de cerca de 48,2%, AMD cerca de 16,7%, e o setor de ASICs aproximadamente 18,5% (sendo 7,8% Google TPU, 5,2% AWS Inferentia, 5,5% outros ASICs), enquanto os chips de raciocínio nacionais totalizam 16,6%.
A Nvidia ainda mantém mais de 80% de participação no mercado de treinamento, mas no de raciocínio, ela já possui menos da metade, com 48,2%.
Por quê?
Na era do treinamento, a Nvidia se destacou por sua força geral — GPUs de alto desempenho, interconexão NVLink de alta velocidade, ecossistema CUDA. Essa combinação é uma vantagem competitiva na fase de treinamento.
Leia mais: 《NVIDIA份额只剩48%,推理大时代的机会在哪里?》