Previsão: A "Era da Inferência" da IA irá consagrar um Novo Vencedor até ao final de 2026

O mercado de infraestrutura de inteligência artificial (IA) está em rápido crescimento, com cinco dos maiores hyperscalers (donos de enormes centros de dados) previstos gastar impressionantes 700 mil milhões de dólares em 2026. Para colocar isso em perspetiva, esse valor supera o produto interno bruto (PIB) de todos, exceto 24 países.

Atualmente, esses gastos destinam-se a dois principais objetivos. O primeiro é treinar grandes modelos de linguagem (LLMs), como o ChatGPT da OpenAI, o Claude da Anthropic e o Gemini da Alphabet. O outro é apoiar a inferência de IA, que depois implementa os modelos para responder a perguntas.

Fonte da imagem: Getty Images.

Nvidia (NVDA +0,69%) é claramente líder no treino de modelos de IA, tendo criado uma vasta barreira de proteção nesta área através da sua plataforma de software CUDA, onde a maior parte do código fundamental de IA foi escrito e otimizado para as suas unidades de processamento gráfico (GPUs). No entanto, a empresa também lidera na inferência. Os seus chips Blackwell GB300 Ultra foram especificamente concebidos para inferência, enquanto a sua próxima plataforma Vera Rubin deverá oferecer cinco vezes o desempenho de inferência das gerações anteriores. Entretanto, o Nvidia NIM (Nvidia Inference Microservices) fornece microserviços de inferência pré-construídos e otimizados, dando-lhe também uma vantagem em software.

No entanto, a barreira de Nvidia na inferência não é tão ampla quanto na formação. Por isso, a Advanced Micro Devices (AMD +8,73%) conseguiu criar um nicho interessante na área de inferência com as suas GPUs. Além disso, com um investimento da OpenAI e compromissos do criador do ChatGPT de comprar 6 gigawatts de GPUs especificamente para inferência nos próximos anos, a AMD deverá conseguir ganhar alguma quota de mercado nesta área.

No entanto, o maior vencedor no mercado de inferência será provavelmente a Broadcom (AVGO +1,87%).

Expandir

NASDAQ: AVGO

Broadcom

Variação de hoje

(-1,87%) $-6,17

Preço atual

$324,17

Dados principais

Capitalização de mercado

$1,6 biliões

Variação do dia

$314,50 - $328,27

Variação em 52 semanas

$138,10 - $414,61

Volume

756 mil

Volume médio

31 milhões

Margem bruta

64,71%

Rendimento de dividendos

0,73%

A ascensão dos ASICs de IA na era da inferência

A Broadcom é líder em tecnologia ASIC (circuitos integrados específicos de aplicação), fornecendo os blocos de construção e propriedade intelectual para ajudar os clientes a transformar os seus designs de chips de IA em realidade. Também tem acesso a componentes importantes, como memória de alta largura de banda (HBM), e uma relação estabelecida com a foundry Taiwan Semiconductor Manufacturing para produzir esses chips personalizados em grande escala.

Como os ASICs são hardwired para realizar tarefas específicas, eles carecem da flexibilidade e adaptabilidade das GPUs. No entanto, devido à sua natureza especializada, podem superar as GPUs nas tarefas para as quais foram concebidos, além de serem mais eficientes em termos energéticos. Este fator torna-se cada vez mais importante na inferência de IA, pois representa um custo contínuo sempre que um modelo de IA deve responder a uma consulta ou realizar uma tarefa. A inferência de IA também não é tão complexa quanto o treino de IA, pelo que o software da Nvidia não tem uma vantagem tão grande.

Os ASICs já revolucionaram as GPUs no espaço da mineração de criptomoedas, pois conseguiam oferecer taxas de hash melhores e maior eficiência energética. Agora, a mineração de criptomoedas não é tão exigente tecnicamente quanto as cargas de trabalho de IA, embora os modelos de IA evoluam, o precedente está criado, e os ASICs podem oferecer melhores condições económicas para a inferência. Essa é uma grande oportunidade para a Broadcom ganhar quota de mercado.

A Broadcom já ajudou com sucesso a Alphabet a desenvolver as suas altamente conceituadas unidades de processamento tensorial (TPUs), que a empresa tem utilizado há anos para executar cargas de trabalho internas. Com o seu investimento em centros de dados previsto para aumentar este ano, a Broadcom está bem posicionada para lucrar com este crescimento. Ao mesmo tempo, a Alphabet também está a permitir que os clientes usem as suas TPUs na Google Cloud, e a Anthropic fez um pedido massivo de 21 mil milhões de dólares em TPUs à Broadcom, a ser entregue este ano.

Entretanto, outros hyperscalers também recorreram à Broadcom para ajudar a desenvolver os seus próprios chips de IA personalizados. Isto inclui a OpenAI, que comprometeu a implementar 10 gigawatts de chips personalizados. Com base nos preços das GPUs da Nvidia, 10 gigawatts valeriam 350 mil milhões de dólares. Os preços dos ASICs serão mais baixos, mas continua a ser uma oportunidade enorme.

Com a Broadcom a gerar quase 64 mil milhões de dólares em receitas totais no ano fiscal de 2025, a empresa está preparada para um crescimento explosivo nos próximos anos. Dado o seu portefólio de pedidos, a empresa parece estar prestes a tornar-se a nova líder em inferência de IA até ao final de 2026 (mesmo que a Nvidia continue a deter uma quota de mercado maior).

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)