NVIDIA GTC 2026|Анализ стратегии миллиардного приобретения Groq компанией NVIDIA и того, как LPX изменит процесс вывода моделей

ChainNewsAbmedia

На конференции NVIDIA GTC 2026 внимание привлекло не только Vera Rubin NVL72, но и новая модель вывода, сформированная в сочетании с Groq 3 LPX. Инфраструктура ИИ переходит от однопроцессорных вычислений на GPU к гетерогенной архитектуре с разделением задач.

Groq 3 LPX позиционируется как ускоритель, специально предназначенный для низколатентных выводов, дополняя GPU Rubin. В традиционной архитектуре GPU одновременно отвечает за обработку длинных контекстов и генерацию по токенам. По мере увеличения масштабов моделей и длины контекстов эта интегрированная схема сталкивается с узкими местами в эффективности.

NVIDIA разбила процесс вывода на части, чтобы Rubin GPU сосредоточился на высокой пропускной способности предварительной обработки и вычислении внимания, а LPX отвечал за наиболее чувствительную к задержкам фазу декодирования, особенно для прямых нейронных сетей и MoE-экспертов. В прошлом году NVIDIA приобрела Groq за около 20 миллиардов долларов наличными — именно по этой причине. Groq разрабатывает архитектуру LPU (Language Processing Unit), специально созданную для ИИ-выводов, с очень низкой задержкой, стабильным откликом и высокой энергоэффективностью, что особенно важно для сценариев реального времени, таких как диалоги и голосовые помощники.

(Крупнейшее поглощение в истории NVIDIA: за 640 миллиардов долларов приобретение технологий Groq и основателя TPU от Google)

GPU совместно с LPU разделяют задачи вывода

Эта концепция, называемая «Disaggregated Inference», предполагает, что вывод больше не выполняется одним процессором, а осуществляется через кооперацию GPU и LPU.

На практике модель сначала формирует контекст и KV-кэш на GPU, затем в цикле генерации каждого токена GPU занимается вниманием, а промежуточные результаты передаются LPX для выполнения FFN, после чего GPU объединяет результаты и выводит итог. Такой разделение задач позволяет каждому вычислительному элементу сосредоточиться на своих сильных сторонах, значительно повышая общую эффективность.

NVIDIA приобретает Groq и внедряет его LPU в LPX

Ключевая особенность LPX — архитектура LPU. В отличие от GPU, который полагается на динамическое планирование и внешнюю память с высокой пропускной способностью, LPU использует предсказуемый дизайн, управляемый напрямую компилятором, что снижает задержки и колебания времени отклика. Архитектура SRAM-first обеспечивает, чтобы важные данные максимально долго оставались внутри чипа, уменьшая неопределенность при обращении к памяти и делая генерацию каждого токена более стабильной. Эта характеристика критична для приложений в реальном времени, где задержка напрямую влияет на пользовательский опыт.

LPX — спецификации корпуса, состоящего из 256 LPU

В аппаратном плане один корпус LPX включает 256 LPU, обладающих высокой пропускной способностью внутренней памяти и межчиповой коммуникацией, специально разработанных для низколатентных выводов. В отличие от высокопроизводительных GPU Rubin с большим объемом памяти и высокой FLOPS, LPX больше похож на специализированный движок для «последней мили», преобразующий модельные выходы в мгновенно доступные результаты.

Эта статья NVIDIA GTC 2026|Анализ стратегии крупной покупки Groq и как LPX меняет процесс вывода впервые опубликована в Chain News ABMedia.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев