Google Lanza Chips de IA Separados para Entrenamiento e Inferencia, Aumentando el Rendimiento 2.8x

Mensaje de Gate News, 23 de abril — Google anunció el 22 de abril que lanzará más adelante este año chips TPU de octava generación separados para entrenamiento e inferencia, reemplazando su diseño combinado anterior. La medida se dirige a cargas de trabajo de agentes de IA y ofrece a los clientes de Google Cloud una alternativa al hardware de Nvidia.

El chip de entrenamiento ofrece 2.8 veces el rendimiento del TPU Ironwood de séptima generación de Google al mismo precio, mientras que el chip de inferencia es 80% más rápido y cuenta con 384 MB de SRAM, el triple de la cantidad en Ironwood. La separación de las capacidades de entrenamiento e inferencia refleja un cambio en la forma en que las empresas optimizan para diferentes demandas computacionales.

La iniciativa está respaldada por una asociación a largo plazo con Broadcom y Anthropic. Anthropic planea utilizar aproximadamente 3.5 gigavatios de cómputo de TPU a través de Broadcom a partir de 2027, y Broadcom se encargará de la fabricación de chips y de los componentes de redes hasta 2031. Anthropic, la startup de IA detrás de Claude, ha visto que sus ingresos anualizados superan recientemente $30 mil millones. Mientras tanto, Apple, Microsoft, Meta y Amazon también están ampliando sus esfuerzos de chips de IA personalizados para reducir la dependencia de Nvidia, que sigue siendo el líder del mercado.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Regresa la escasez de GPU mientras Microsoft y Amazon ajustan el suministro; las startups de IA enfrentan un aumento del 32% en precios y colas hasta fin de año

Mensaje de Gate News, 25 de abril — Vuelve a aparecer una escasez de GPU mientras los principales proveedores de nube, incluidos Microsoft y Amazon, concentran capacidad de cómputo en equipos internos y grandes clientes como OpenAI y Anthropic, dejando que las empresas emergentes de IA más pequeñas enfrenten aumentos de precios, tiempos de espera prolongados y términos de contrato más estrictos.

GateNewsHace53m

Nvidia在Blackwell基础设施上将OpenAI Codex AI代理部署至全体员工

消息快报,4月25日——据首席执行官Jensen Huang和OpenAI首席执行官Sam Altman的内部沟通内容,Nvidia已在成功试点后,将OpenAI的Codex这一由GPT-5.5驱动的AI代理面向其全体员工部署,试点约涉及10,000名员工。 Codex旨在用于

GateNewshace1h

El Departamento de Estado de EE. UU. advierte sobre la destilación del modelo de IA DeepSeek

El Departamento de Estado de EE. UU. emitió un cable el 24 de abril a las misiones diplomáticas y consulares de todo el mundo, advirtiendo a gobiernos extranjeros sobre los esfuerzos de China por copiar sistemas de IA estadounidenses mediante destilación, según Reuters. El cable

CryptoFrontierhace1h

La startup de IA para la salud del profesor de Stanford busca $100M con una valoración de $1B

Mensaje de Gate News, 25 de abril — El profesor de Stanford James Zou está recaudando aproximadamente $100 millones para Human Intelligence, una startup de California que desarrolla modelos de IA para la fisiología humana, con una valoración de alrededor de $1 mil millones. La empresa se basa en la investigación de Zou en fisiología e IA. El algoritmo EchoNet de su laboratorio

GateNewshace1h

La startup de codificación con IA Cognition conversa sobre una ronda de financiación con valoración de $25B

Mensaje de Gate News, 25 de abril — La startup de codificación con IA Cognition está en conversaciones iniciales para recaudar cientos de millones de dólares o más, aproximadamente con una valoración de $25 mil millones, según personas familiarizadas con el asunto. El interés ha aumentado tras la adquisición por parte de SpaceX de una startup rival de codificación con IA. Co

GateNewshace1h

Meta implementará millones de chips AWS Graviton para cargas de trabajo de IA

Mensaje de Gate News, 25 de abril — Amazon anunció el 24 de abril que Meta utilizará millones de chips AWS Graviton para cargas de trabajo de IA, lo que supone una victoria importante para AWS con sus procesadores ARM de fabricación propia. Los chips se utilizarán para la inferencia de IA y la computación general, en lugar de

GateNewshace2h
Comentar
0/400
Sin comentarios