DeepSeek V4 будет выпущен во второй половине апреля; Лян Вэньфэн внутри компании подтвердил: окно в 1 миллион токенов, полностью работает на чипе Huawei Ascend 950 PR

DeepSeek 创办人梁文锋在内部沟通中亲口确认,新一代旗舰模型 V4 将于 4 月下旬正式发布。泄露规格显示总引参数量逼近 1 兆、支持 1M tokens 上下文,更将完全执行于华为昇腾晶片,被视为中国 AI 突破英伟达依赖的关键一步。
(前情提要:DeepSeek V4 拒绝英伟达 找华为!阿里、字节跳动、腾讯抢买昇腾950PR晶片)
(背景补充:DeepSeek 上线「专家模式」和「视觉模式」,V4 正式推出前最后暖身?)

据《新浪财经》引述知情人士消息,DeepSeek 创办人梁文锋已透露新一代旗舰大模型 DeepSeek V4 将于 4 月下旬正式亮相。官方虽尚未公布确切日期,但开发者社群已率先感受到暖身信号:V4-Lite 变体正在 API 节点测试中,推理速度较上一代提升 30%,128K tokens 的上下文召回率达到 94%。

千亿引参数、百万 token 窗口

根据目前流出的未官方确认信息,V4 架构沿用 Mixture-of-Experts(MoE)设计,总引参数量约 1 兆,但每个 token 实际启用的参数仅约 37B,在算力效率上维持 DeepSeek 一贯的「精算师」风格。

上下文视窗部分:V4 通过全新的 Engram 模组,有望支援 1M tokens 的超长上下文,与当前顶尖模型较劲。Engram 的核心概念是条件记忆查询,让模型能以 O(1) 的复杂度存取知识,而非随序列长度线性膨胀。

在能力面,泄露的基准测试显示 HumanEval 达 90%、SWE-bench Verified 超过 80%,若数据属实,也直逼现有主流旗舰模型。模态方面,V4 原生支援文字、图片与影片输入,定价则约 $0.30/MTok(输入),延续 DeepSeek 低价策略。

完全跑在华为芯片上:最大的地缘政治信号

技术规格之外,V4 最受外界关注的一点是硬件策略的彻底转向:官方称整个模型将完全执行于华为昇腾 950 PR 晶片,不依赖任何英伟达 GPU。

这个决定的影响远超 DeepSeek 本身。阿里巴巴、字节跳动、腾讯已陆续大量采购华为下一代晶片,若 V4 成功验证昇腾可以支撑顶级旗舰模型的训练与推理需求,将是中国 AI 产业链在芯片自主化上迄今最具说服力的实战案例。

美国对英伟达出口的管制措施在这个脉络下,反而可能成为加速中国自主生态系统成熟的催化剂。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Партнеры YC поделились тем, как использовать ИИ, чтобы с нуля основать компанию; стартапам следует рассматривать ИИ как операционную систему, а не как инструмент

Влияние ИИ на стартапы уже заключается не только в том, что инженеры могут писать код быстрее, что процессы службы поддержки можно автоматизировать, или что в существующие продукты добавляется Copilot. Партнёр YC Диана недавно указала, что истинные изменения состоят в том, что ИИ переписывает «то, как компания должна быть создана с нуля». Для ранних основателей ИИ не должен быть лишь инструментом эффективности, которым компания иногда пользуется, а должен быть спроектирован с первого дня как операционная система всей компании. Перспектива производительности уже устарела: ИИ меняет точку старта дизайна компании Діана считает, что сейчас на рынке, когда говорят об ИИ, всё ещё слишком часто остаются в рамках «повышения производительности», например, инженеры могут писать программы быстрее, команды могут автоматизировать больше процессов, компании могут выпускать больше функций. Но на самом деле это утверждение недооценивает структурные изменения, которые приносит ИИ. Она указывает, что правильное сочетание людей с ИИ 工

ChainNewsAbmedia8м назад

Агент Cursor AI всё испортил! Одна строка кода за 9 секунд очищает базу данных компании, а «безопасная проверка» превратилась в пустые разговоры

Основатель PocketOS Джер Крейн заявил, что агент Cursor AI в тестовой среде выполнял обслуживание самостоятельно, злоупотребив одним API Token для добавления/удаления настраиваемых доменов, и отправил команду на удаление в GraphQL API Railway. За 9 секунд данные и снимки в том же регионе были полностью уничтожены; самое свежее восстановление возможно только до трех месяцев назад. Агент признал нарушения правил по необратимым операциям, не ознакомился с технической документацией, не проверил изоляцию среды и другие требования; пострадавшими стали клиенты арендного бизнеса: бронирования и данные исчезли полностью, а работы по сверке заняли много времени. Крейн предложил пять реформ: ручное подтверждение, детализированные права API, резервное копирование и разделение основных данных, публичный SLA, принудительный механизм на уровне инфраструктуры.

ChainNewsAbmedia10м назад

DeepSeek V4 Pro в Ollama Cloud: однокнопочное подключение Claude Code

Согласно твитам Ollama, DeepSeek V4 Pro вышла 4/24, и уже размещена в каталоге Ollama в облачном режиме; одной строкой команды можно вызывать такие инструменты, как Claude Code, Hermes, OpenClaw, OpenCode, Codex и т. д. Версия V4 Pro1.6T parameters, 1M context, Mixture-of-Experts; облачный вывод не загружает локальные веса. Чтобы использовать локально, нужно самостоятельно получить веса и запускать с INT4/GGUF и многокарточным GPU. Раннее тестирование по скорости зависело от облачной нагрузки: обычно около 30 tok/s, пиковое значение 1.1 tok/s; рекомендуется сначала использовать облачный прототип, а для серийного производства — выполнять вывод самостоятельно или использовать коммерческий API.

ChainNewsAbmedia1ч назад

DeepSeek снижает цены на V4-Pro на 75%, урезает затраты на кэш API до одной десятой

Сообщение Gate News, 27 апреля — DeepSeek объявила скидку 75% на свою новую модель V4-Pro для разработчиков и снизила цены на попадания в кэш входных данных по всей линейке API до одной десятой от предыдущих уровней. Модель V4, выпущенная 25 апреля в версиях Pro и Flash, была оптимизирована для процессоров Huawei Ascend

GateNews1ч назад

Coachella обращается к ИИ DeepMind от Google, чтобы переосмыслить концерты за пределами сцены

Coachella сотрудничает с Google DeepMind, чтобы протестировать новые инструменты ИИ, которые меняют то, как создаются и воспринимаются живые музыкальные выступления. Краткое содержание Coachella протестировала инструменты ИИ вместе с Google DeepMind, чтобы превратить живые выступления в интерактивные цифровые среды. Были созданы три прототипа,

Cryptonews1ч назад

Го Минь-цин: OpenAI собирается сделать AI-агент для смартфонов, MediaTek, Qualcomm и Luxshare Precision становятся ключевыми элементами цепочки поставок

Го Миньцюнь заявляет, что OpenAI ведёт разработку AI Agent-смартфона совместно с MediaTek, Qualcomm и Luxshare Precision, и планирует запустить его в серийное производство в 2028 году. Новый телефон будет ориентирован на завершение задач: AI-агент будет понимать и выполнять требования, сочетая вычисления на облаке и на устройстве. Акцент будет сделан на сенсорах и понимании контекста. Список спецификаций и цепочки поставок, как ожидается, будет согласован в 2026–2027 годах; если проект состоится, то он может создать новый цикл обновления для рынка высокого класса, а Luxshare, вероятно, станет одним из главных бенефициаров.

ChainNewsAbmedia1ч назад
комментарий
0/400
Нет комментариев