Prédiction : L'« Ère de l'Inférence » de l'IA couronnera un nouveau gagnant d'ici la fin de 2026

2026-02-25 09:22:50

Le marché de l’infrastructure d’intelligence artificielle (IA) connaît une croissance explosive, avec cinq des plus grands hyperscalers (propriétaires de centres de données massifs) qui devraient dépenser à eux seuls la somme astronomique de 700 milliards de dollars en 2026. Pour mettre cela en perspective, cela dépasse le produit intérieur brut (PIB) de tous sauf 24 pays.

Actuellement, ces dépenses sont principalement destinées à deux objectifs. Le premier est la formation de grands modèles linguistiques (LLMs), tels que ChatGPT d’OpenAI, Claude d’Anthropic, et Gemini d’Alphabet. L’autre est le support à l’inférence IA, qui déploie ensuite les modèles pour répondre aux requêtes.

Source de l’image : Getty Images.

Nvidia (NVDA +0,69 %) est le leader évident dans la formation de modèles IA, ayant créé une large barrière grâce à sa plateforme logicielle CUDA, où la majorité du code IA fondamental a été écrit et optimisé pour ses unités de traitement graphique (GPU). Cependant, la société est également en tête dans l’inférence. Ses puces Blackwell GB300 Ultra ont été conçues spécifiquement pour l’inférence, tandis que sa plateforme Vera Rubin à venir devrait offrir une performance d’inférence cinq fois supérieure à celle des générations précédentes. Par ailleurs, Nvidia NIM (Nvidia Inference Microservices) fournit des microservices d’inférence préconstruits et optimisés, lui conférant également un avantage logiciel.

Cependant, la barrière de Nvidia pour l’inférence n’est pas aussi large que pour la formation. En conséquence, Advanced Micro Devices (AMD +8,73 %) a réussi à se faire une place dans le domaine de l’inférence avec ses GPU. Par ailleurs, avec un investissement d’OpenAI et des engagements du fabricant de ChatGPT à acheter 6 gigawatts de ses GPU spécifiquement pour l’inférence dans les années à venir, AMD devrait pouvoir gagner des parts de marché dans ce secteur.

Cependant, le plus grand gagnant du marché de l’inférence sera probablement Broadcom (AVGO +1,87 %).

Développer

NASDAQ : AVGO

Broadcom

Variation d’aujourd’hui

(-1,87 %) -6,17 $

Prix actuel

324,17 $

Points clés

Capitalisation boursière

1,6 trillions $

Fourchette de la journée

314,50 $ - 328,27 $

Fourchette sur 52 semaines

138,10 $ - 414,61 $

Volume

756K

Volume moyen

31M

Marge brute

64,71 %

Rendement du dividende

0,73 %

L’essor des ASIC IA à l’ère de l’inférence

Broadcom est un leader dans la technologie ASIC (circuits intégrés spécifiques à une application), fournissant les composants et la propriété intellectuelle pour aider ses clients à concrétiser leurs designs de puces IA. Elle a également accès à des composants importants, comme la mémoire à haute bande passante (HBM), et entretient une relation établie avec la fonderie Taiwan Semiconductor Manufacturing pour produire ces puces sur mesure à grande échelle.

Les ASIC étant conçus pour effectuer des tâches spécifiques, ils manquent de la flexibilité et de l’adaptabilité des GPU. Cependant, en raison de leur nature spécialisée, ils peuvent surpasser les GPU pour les tâches pour lesquelles ils ont été conçus, tout en étant plus économes en énergie. Cela devient un facteur de plus en plus important avec l’inférence IA, car chaque réponse ou tâche coûte de l’énergie. L’inférence IA n’est pas aussi complexe que la formation IA, donc le logiciel de Nvidia n’a pas un avantage aussi marqué.

Les ASIC ont déjà bouleversé le marché des GPU dans le minage de cryptomonnaies, en offrant de meilleurs taux de hachage tout en étant plus économes en énergie. Aujourd’hui, le minage de cryptomonnaies n’est pas aussi exigeant techniquement que les charges de travail IA, bien que les modèles IA évoluent, le précédent est là, et les ASIC peuvent offrir une meilleure rentabilité pour l’inférence. C’est une grande opportunité pour Broadcom de gagner des parts de marché.

Broadcom a déjà aidé avec succès Alphabet à développer ses unités de traitement tensoriel (TPU), qu’elle utilise depuis des années pour ses charges de travail internes. Avec ses dépenses en centres de données qui devraient exploser cette année, Broadcom est bien positionnée pour profiter de cette croissance. Par ailleurs, Alphabet commence également à permettre à ses clients d’utiliser ses TPU dans Google Cloud, et Anthropic a passé une commande massive de 21 milliards de dollars de TPU auprès de Broadcom pour cette année.

Par ailleurs, d’autres hyperscalers se sont aussi tournés vers Broadcom pour développer leurs propres puces IA sur mesure. Cela inclut OpenAI, qui s’est engagé à déployer 10 gigawatts de puces personnalisées. Sur la base des prix GPU Nvidia, 10 gigawatts représenteraient 350 milliards de dollars. Les ASIC seront moins chers, mais cela reste une opportunité énorme.

Avec près de 64 milliards de dollars de revenus totaux en 2025, Broadcom prévoit une croissance explosive dans les années à venir. Fort de son carnet de commandes, la société semble prête à devenir le nouveau roi de l’inférence IA d’ici la fin 2026 (même si Nvidia conserve techniquement une part de marché plus importante).

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.