DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости

Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode полностью поддерживают модели серии DeepSeek V4 благодаря тесному сотрудничеству между технологиями чипа и модели.

Ascend 950 обеспечивает развертывание инференса моделей DeepSeek V4 с высокой пропускной способностью и низкой задержкой за счет методов склеивания ядер и параллелизма в несколько потоков, чтобы снизить накладные расходы на вычисления Attention и обращения к памяти. Для DeepSeek V4-Pro с входом 8K Ascend 950 достигает примерно 20ms TPOT при 4,700 TPS на одно устройство в режиме Decode; для DeepSeek V4-Flash при входе до 8K он достигает примерно 10ms TPOT при пропускной способности 1,600 TPS. Серия Ascend A3 supernode также обеспечивает полную совместимость: предоставлены эталонные реализации для быстрого дообучения. На основе supernode Ascend A3 из 64 карт с большим режимом EP DeepSeek V4-Flash достигает более 2,000 TPS на одну карту в режиме Decode в сценариях вход-выход 8K/1K, используя движок инференса vLLM. Полные линейки продуктов Huawei Ascend A2, A3 и 950 поддерживают как DeepSeek V4-Flash, так и V4-Pro.

Huawei Cloud объявила о совместимости с DeepSeek V4 для самых первых, предоставив разработчикам сервисы API token в один клик через свою платформу MaaS. Huawei Cloud оптимизировала возможности системного уровня, уровня операторов и уровня кластера, чтобы обеспечить быструю адаптацию моделей и высокопроизводительное развертывание. Компании, включая Kingsoft WPS и 360, уже интегрировали новую модель DeepSeek через Huawei Cloud.

Cambricon также объявила о совместимости Day 0 с DeepSeek V4-Flash и V4-Pro на основе фреймворка инференса vLLM, а код адаптации был с открытым исходным кодом опубликован для сообщества GitHub. Ранее Cambricon уже достигла совместимости для самых первых при выпуске DeepSeek V3.2 в прошлом году: она провела глубокую оптимизацию совместной производительности ПО и оборудования на моделях серии DeepSeek.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Исполнительный руководитель Google DeepMind: Каждая компания, создающая продукт на основе ИИ, должна разрабатывать собственные индивидуальные бенчмарки

Сообщение Gate News, 27 апреля — Логан Килпатрик, старший менеджер по продуктам в Google DeepMind и руководитель продуктового направления Google AI Studio, заявил в X, что каждая компания, создающая продукты на основе ИИ, должна разработать свои собственные индивидуальные бенчмарки для измерения эффективности ИИ-моделей. Он описал это как метод, позволяющий тому, чтобы улучшения модели «несоразмерно приносили выгоду вашей компании», и призвал основателей и руководителей бизнеса «начать уже завтра».”

GateNews57м назад

MediaTek заполучила крупный заказ Google на восьмое поколение TPU! ASIC стимулирует рост в трех секторальных акциях, которые получат выгоду

MediaTek вошла в цепочку поставок тренировочных чипов Google 8-го поколения TPU, отвечая за дизайн I/O Die, и использует техпроцесс TSMC N3P и упаковку CoWoS-S, что демонстрирует ее выход на уровень проектирования высококлассных AI ASIC. Ожидается, что в этом году выручка от ASIC превысит 1 миллиард долларов, а объем поставок TPU к 2027 году имеет шанс достичь десятков миллионов штук; тайваньская цепочка поставок, включая King Yuan Electronics, Jingce и Hongjing, также получит выгоду, а рынок постепенно смещается в сторону будущего разделения труда и чиплетов, а также гетерогенной интеграции.

ChainNewsAbmedia1ч назад

RE:AI Singtel сотрудничает с Mistral AI для разработки AI-инфраструктуры в Сингапуре

Сообщение Gate News, 27 апреля — Singtel Group объявила, что RE:AI, ее подразделение цифровой инфраструктуры на базе в Сингапуре, сотрудничает с Mistral AI, чтобы поддерживать AI-возможности для отраслей в Сингапуре. Партнерство будет сосредоточено на совместной разработке AI-инфраструктуры и решений для секторов финансовых

GateNews1ч назад

YZi Labs Хэ И инвестирует в китайскую компанию по большим языковым моделям на базе ИИ

Сообщение Gate News, 27 апреля — Хэ И вместе с семейным офисом Чанпэна Чжао YZi Labs инвестировала в китайскую компанию по большим языковым моделям в сфере искусственного интеллекта, она раскрыла это во время закрытой встречи с KOL в рамках гонконгского Web3 Carnival. Конкретное название инвестированной компании не было раскрыто

GateNews1ч назад

OpenAI сотрудничает с MediaTek и Qualcomm для разработки процессора AI для смартфонов; Foxconn Connector начнет производство в 2028 году

Gate News-сообщение, 27 апреля — OpenAI сотрудничает с MediaTek и Qualcomm для разработки процессоров для смартфонов, согласно анализу цепочки поставок аналитика Tianfeng International Securities Мина-Чи Куо. Foxconn Connector (Luxshare Precision) будет выступать в качестве эксклюзивного партнера по системному проектированию и

GateNews1ч назад

Котируемая в Гонконге MiniMax-W падает более чем на 14%, Zhipu снижается более чем на 6% при запуске модели DeepSeek

Вестник Gate, 27 апреля — котируемая в Гонконге MiniMax-W упала более чем на 14% в ходе торгов в течение дня, а Zhipu снизилась более чем на 6% в ту же сессию. Падение последовало за выпуском DeepSeek новой модели в пятницу и объявлением ограниченных по времени рекламных предложений в

GateNews1ч назад
комментарий
0/400
Нет комментариев