Message de Gate News, 25 avril — Une pénurie de GPU refait surface alors que de grands fournisseurs de cloud, dont Microsoft et Amazon, concentrent la capacité de calcul au profit de leurs équipes internes et de leurs principaux clients comme OpenAI et Anthropic, laissant les plus petites start-ups d’IA faire face à des hausses de prix, à des délais d’attente prolongés et à des conditions contractuelles plus strictes. La direction commerciale d’Azure chez Microsoft a informé les équipes que les délais d’attente des GPU pour les clients cloud devraient persister jusqu’à la fin 2026.
La start-up de génération d’images Krea, qui a levé $83 million auprès d’investisseurs dont Andreessen Horowitz et Bain Capital Ventures, louait auparavant des centaines de puces Blackwell à 2,80 $ de l’heure dans le cadre d’un contrat de six mois. Lors du renouvellement, plusieurs fournisseurs de cloud ont cessé de répondre aux demandes ; Krea a finalement obtenu des puces à 3,70 $ de l’heure, soit une hausse de 32 %, avec un contrat prolongé d’un an. Le PDG Victor Perez a noté que certains vendeurs ne répondaient simplement pas, tandis que d’autres exigeaient des engagements pluriannuels avant de négocier. Le PDG du fournisseur de cloud GPU Lightning AI, Will Falcon, a révélé que la société fait tourner 40 000 GPU en ligne, mais qu’environ 40 clients en file d’attente nécessitent un total de 400 000 GPU, les prix de location augmentant de plus de 25 % en l’espace de six mois.
Microsoft a mis en place une gestion de l’accès aux GPU par paliers : environ 1 000 des plus grands clients (Tier 1) reçoivent une allocation prioritaire, tandis que les clients plus modestes qui cherchent des puces Blackwell doivent s’engager sur au moins 1 000 unités pour une durée minimale d’un an, avec des contrats commençant à plusieurs dizaines de millions de dollars. Les clients en paiement à l’usage risquent de perdre l’accès aux GPU si les appareils restent inactifs pendant plusieurs heures. Les start-ups participant au programme free-tier de Microsoft for Startups ont également été prévenues qu’une utilisation insuffisante des GPU pourrait entraîner la révocation de l’accès.
La société de capital-risque General Catalyst interroge ses sociétés en portefeuille sur les goulots d’étranglement liés au calcul et explore des pools de GPU partagés ou des stratégies de négociation collective. Certaines start-ups envisagent l’achat direct de GPU pour contourner les files d’attente : la start-up d’IA pour l’industrie pétrolière Collide prévoit de dépenser environ 500 000 $ en GPU Nvidia, en louant des espaces de data center pour fonctionner de manière indépendante et éviter l’incertitude.
Articles similaires
Rapport quotidien de Gate (27 avril) : les déclarations concernant l’incident de tir visant Trump font grimper le TRUMP Coin ; le Trésor américain intégrera Venmo aux paiements des dons de dette
TSMC défie 2330, menant le marché taïwanais à franchir les 40 000 points, l’effet des flux de capitaux des ETF se développe positivement
Alerte TradFi Baisse : ZHIPU (ZhiPu 02513.HK) Chute sur 4%
L’Iran propose un accord prioritaire sur le détroit d’Ormuz, reporte les pourparlers nucléaires avec les États-Unis
Le DOJ abandonne l’enquête sur Powell, ouvrant la voie à un Kevin Warsh favorable aux cryptos pour diriger la Fed
JPMorgan : La tokenisation va transformer l’industrie des fonds, mais de « bons cas d’usage » sont encore dans des années