Google 推出第八代 TPU 芯片:性能价格比提升,并将训练与推理分离

Gate News 消息,4 月 22 日——Google Cloud 宣布,于 4 月 22 日发布其第八代自研定制 TPU (Tensor Processing Unit) 芯片。新的产品线包括 TPU 8t,专为 AI 训练任务而设计,以及 TPU 8i,针对 AI 推理工作负载进行了优化。两款芯片都将于今年晚些时候上市。Google 还发布了用于构建 AI 代理的新工具,并宣布设立一项 $750 百万美元基金,以推动企业采用 AI。

TPU 8t 在相同价格水平下,性能比 Google 上一代 Ironwood TPU 提升 2.8 倍。TPU 8i 相较其前代产品性能提升 80%,并采用静态随机存取内存 (SRAM) 架构,以实现“具有成本效益的大规模吞吐与低延迟,使数百万个代理能够同时运行”,CEO Sundar Pichai 表示。与 Ironwood 相比,TPU 8t 和 TPU 8i 的每瓦性能效率均实现了超过两倍的提升,其中 TPU 8t 提升 124%,TPU 8i 提升 117%。Google 在整个技术栈中优化了能效,并集成了动态功率管理系统,可根据实时需求调整能耗。

Google 自研模型目前通过直接面向客户的 API 调用,每分钟处理超过 1600 亿个 token,较上季度的 1000 亿有所增长。在 Google 上,AI 现在生成了所有新增代码的 75%,而去年秋季为 50%。Google 的企业产品 Gemini Enterprise 在付费月活用户方面实现了环比增长 40%。公司预计到 2026 年,将其机器学习计算预算中略多于一半投向云服务,以更好地服务云端客户与合作伙伴。Google 也在扩大与博通(Broadcom)的合作,以为未来世代开发并供应定制 TPU 芯片,因为大型科技公司正寻求对来自 NVIDIA 和 AMD 的昂贵且供给受限 GPU 的替代方案。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

ИИ-агент уже может независимо воспроизводить сложные научные статьи: Mollick считает, что ошибки чаще бывают в человеческом исходном тексте, а не в ИИ

Моллик указывает, что открытых методов и данных достаточно, чтобы ИИ-агент мог воссоздать сложные исследования без исходных научных работ и кода; если воспроизведение не соответствует исходной статье, чаще всего причина — ошибка в обработке данных в самой статье или чрезмерное обобщение выводов, а не ошибки ИИ. Claude сначала воспроизводит статью, затем GPT‑5 Pro проводит перекрёстную проверку; в большинстве случаев это удаётся, и лишь при слишком больших данных или проблемах с replication data возникают препятствия. Эта тенденция существенно снижает трудозатраты, делая воспроизведение общеприменимым и реализуемым способом проверки, а также поднимает институциональные вызовы для рецензирования и управления: инструменты государственного управления или станут ключевой темой.

ChainNewsAbmedia2ч назад

OpenAI объединяет Codex с основной моделью, начиная с GPT-5.4, прекращает отдельную линейку для кодинга

Новостное сообщение Gate News, 26 апреля — глава отдела взаимодействия с разработчиками OpenAI Ромен Юэ (Romain Huet) в недавнем заявлении на X сообщил, что Codex, линейка специализированных моделей для кодинга, независимо поддерживаемая компанией, была объединена с основной моделью начиная с GPT-5.4 и больше не будет получать отдельные

GateNews2ч назад

Salesforce нанимет 1 000 выпускников и стажеров для AI-продуктов, а также повышает прогноз выручки на FY2026

Сообщение Gate News, 26 апреля — Salesforce нанять 1 000 выпускников и стажеров для работы над продуктами в области ИИ, включая Agentforce и Headless360, поскольку компания расширяет свой бизнес по разработке ПО на базе ИИ; об этом объявил CEO Марк Бениофф в X. Компания также повысила прогноз по выручке на 2026 финансовый год до диапазона от 41,45 млрд долларов США

GateNews2ч назад

Alibaba Cloud запускает Qwen-Image-2.0-Pro с единым преобразованием текста в изображение и редактированием, поддержкой многоязычного отображения текста

Сообщение Gate News, 26 апреля — платформа Alibaba Cloud Bailian запустила Qwen-Image-2.0-Pro, полнофункциональную версию серии Qwen-Image-2.0, которая объединяет генерацию изображений по тексту и редактирование изображений в одной модели. Пользователи могут изменять объекты, текст и стили напрямую с помощью команд на естественном языке

GateNews4ч назад

DeepSeek V4-Pro API получает скидку 75% до 5 мая, цена на выход снижается до $0.87 за миллион токенов

Сообщение Gate News, 26 апреля — DeepSeek объявила ограниченную по времени скидку 75% на тарифы V4-Pro API, действительную до 5 мая в 15:59 UTC. После скидки цена за миллион токенов составляет: input cache hit $0.03625

GateNews6ч назад

Anthropic внедряет защитные меры для выборов для Claude перед промежуточными выборами 2026 года

Anthropic объявила в пятницу о наборе мер по обеспечению честности выборов, призванных не допустить превращения ее чат-бота Claude на базе ИИ в оружие для распространения дезинформации или манипулирования избирателями перед выборами в середине срока в США 2026 года и другими крупными состязаниями по всему миру в этом году. Базирующаяся в Сан-Франциско

CryptoFrontier11ч назад
комментарий
0/400
Нет комментариев