Google lance des puces TPU de 8e génération améliorant le ratio performance-prix, sépare l’entraînement et l’inférence

Message Gate News, 22 avril — Google Cloud a annoncé la sortie de ses puces TPU (Tensor Processing Unit) sur mesure de 8e génération, le 22 avril. La nouvelle gamme comprend TPU 8t, conçu spécifiquement pour les tâches d’entraînement à l’IA, et TPU 8i, optimisé pour les charges de travail d’inférence IA. Les deux puces seront disponibles plus tard cette année. Google a également dévoilé de nouveaux outils pour construire des agents d’IA et annoncé un fonds $750 million pour accélérer l’adoption de l’IA en entreprise.

TPU 8t offre 2,8 fois les performances de l’ancienne TPU Ironwood de génération précédente de Google au même niveau de prix. TPU 8i améliore les performances de 80% par rapport à son prédécesseur et intègre une architecture de mémoire vive statique à accès aléatoire (SRAM) pour fournir « un débit à grande échelle rentable et une faible latence, permettant à des millions d’agents de fonctionner simultanément », selon le PDG Sundar Pichai. Par rapport à Ironwood, les TPU 8t et TPU 8i atteignent toutes deux plus du double de l’efficacité performance-par-watt, avec une amélioration de 124% pour TPU 8t et de 117% pour TPU 8i. Google a optimisé l’efficacité énergétique sur l’ensemble de la pile technologique et intégré des systèmes de gestion dynamique de l’alimentation qui ajustent la consommation selon la demande en temps réel.

Les modèles first-party de Google traitent désormais plus de 160 milliards de tokens par minute via des appels directs à l’API client, contre 100 milliards le trimestre dernier. L’IA génère désormais 75% de tout le nouveau code chez Google, contre 50% à l’automne de l’année dernière. Gemini Enterprise, l’offre entreprise de Google, a progressé de 40% d’un trimestre sur l’autre en utilisateurs actifs mensuels payants. L’entreprise s’attend à investir légèrement plus de la moitié de son budget de calcul pour l’apprentissage automatique dans des services cloud d’ici 2026 afin de mieux servir les clients cloud et les partenaires. Google étend aussi sa collaboration avec Broadcom pour développer et fournir des puces TPU sur mesure pour les générations futures, alors que de grandes entreprises technologiques recherchent des alternatives aux GPU coûteux et contraints en approvisionnement de NVIDIA et AMD.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Anthropic met en place des garanties électorales pour Claude avant les élections législatives de mi-mandat de 2026

Anthropic a annoncé vendredi une série de mesures d’intégrité électorale conçues pour empêcher son chatbot d’IA Claude d’être utilisé à des fins de militarisation afin de diffuser de la désinformation ou de manipuler les électeurs avant les élections législatives américaines de mi-mandat de 2026 et d’autres grands scrutins dans le monde cette année. Basée à San Francisco,

CryptoFrontierIl y a 2h

DeepRoute.ai système d’aide à la conduite avancée dépasse 300 000 véhicules déployés : objectif 2026 1 000 000 de flotte de véhicules urbains NOA

DeepRoute.ai annonce avoir déployé plus de 300 000 véhicules de son système avancé d’aide à la conduite en Chine, et avoir permis d’éviter plus de 180 000 incidents potentiels au cours de l’année écoulée. L’objectif pour 2026 est d’atteindre une flotte de 1 million de véhicules pour le NOA en ville, avec un taux d’utilisation supérieur à 50 %, considéré comme un élément clé de la commercialisation à grande échelle des Robotaxi. Cette initiative montre que la conduite autonome en Chine est désormais utilisée de manière courante, tout en traçant une voie distincte de l’approche d’intégration verticale aux États-Unis, ce qui affecte le calendrier des chaînes d’approvisionnement en Asie-Pacifique.

ChainNewsAbmediaIl y a 3h

DeepSeek lance les modèles V4-Pro et V4-Flash à un coût inférieur de 98 % à celui du GPT-5.5 Pro d’OpenAI

Message de Gate News, 25 avril — DeepSeek a publié des versions préliminaires de V4-Pro et V4-Flash le 24 avril, deux modèles open-weight avec des fenêtres de contexte d’un million de tokens. V4-Pro dispose de 1,6 billion de paramètres au total, mais n’active que 49 milliards par passe d’inférence en utilisant une architecture de type Mixture-of-Experts.

GateNewsIl y a 8h

Le juge rejette les allégations de fraude dans la plainte d’Elon Musk contre OpenAI ; l’affaire progresse vers un procès avec deux allégations restantes

Message de Gate News, 24 avril — Un juge fédéral a rejeté les allégations de fraude dans la plainte d’Elon Musk contre OpenAI, Sam Altman, Greg Brockman et Microsoft, ouvrant la voie à la poursuite de l’affaire devant le tribunal sur deux allégations restantes : violation de la confiance à but caritatif et enrichissement injustifié. États-Unis.

GateNewsIl y a 12h

Le PDG d'OpenAI, Sam Altman, s'excuse d'avoir omis de signaler à la police le compte banni du tireur de l'école

Message de Gate News, 25 avril — Le PDG d'OpenAI, Sam Altman, a présenté ses excuses à la communauté de Tamborine, au Canada, pour l'incapacité de l'entreprise à prévenir la police au sujet d'un compte banni lié à Jesse Van Rootselaar, qui a tué huit personnes dans une école en février avant de mettre fin à ses jours. OpenAI

GateNewsIl y a 12h

Les Émirats arabes unis annoncent une transition vers un modèle de gouvernement basé sur l’IA au cours des deux prochaines années

Son Altesse Cheikh Mohammed bin Rashid Al Maktoum a déclaré que l’objectif était que 50% des secteurs gouvernementaux fonctionnent grâce à une IA agentique autonome. La transition comprendra également la formation des employés fédéraux pour « maîtriser l’IA », et sera supervisée par Cheikh Mansour bin Zayed. Points clés :

CoinpediaIl y a 12h
Commentaire
0/400
Aucun commentaire