DeepSeek выпускает модели V4-Pro и V4-Flash при стоимости на 98% ниже, чем у OpenAI GPT-5.5 Pro

Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts. V4-Flash включает 284 млрд общих параметров с 13 млрд активными.

Цены заметно ниже, чем у конкурентов: V4-Pro стоит $1.74 за миллион токенов входных данных и $3.48 за миллион токенов выходных данных — примерно на 98% меньше, чем OpenAI GPT-5.5 Pro ($30 input, $180 output), и примерно в одну двадцатую раза дешевле, чем Claude Opus 4.7. V4-Flash стоит $0.14 на вход и $0.28 на выход за миллион токенов. Обе модели — с открытым исходным кодом по лицензии MIT, и их можно бесплатно запускать локально.

DeepSeek добилась прироста эффективности за счет двух новых механизмов внимания: Compressed Sparse Attention и Heavily Compressed Attention, которые снижают вычислительные затраты до 27% от предшественника V4-Pro (V3.2) и до 10% для V4-Flash. Компания частично обучала V4 на чипах Huawei Ascend, обходя ограничения США на экспорт продвинутых процессоров Nvidia. DeepSeek заявила, что после запуска 950 новых суперузлов в конце 2026 года цены снизятся еще сильнее.

По результатам тестов на производительность, V4-Pro-Max занимает первое место на Codeforces в конкурентном программировании (3,206 балла, располагаясь примерно на 23-м месте среди участников-людей) и набирая 90.2% на задачах математики Apex Shortlist против 85.9% у Claude Opus 4.6. Однако на тестах на многозадачность он уступает: MMLU-Pro (87.5% против 91.0% у Gemini-3.1-Pro) и Humanity’s Last Exam (37.7% против 44.4%). В задачах с длинным контекстом V4-Pro лидирует среди моделей с открытым исходным кодом, но уступает Claude Opus 4.6 в тестах извлечения MRCR.

V4-Pro вводит «interleaved thinking» («перемежающееся мышление»), позволяя агентским сценариям сохранять контекст рассуждений в процессе множества вызовов инструментов без «сброса» между шагами. Обе модели поддерживают интеграции для кодинга с Claude Code и OpenCode. Согласно опросу разработчиков DeepSeek среди 85 пользователей, 52% заявили, что V4-Pro готов быть их агентом по умолчанию для написания кода, а 39% склоняются к внедрению. Старые endpoints deepseek-chat и deepseek-reasoner будут сняты 24 июля 2026 года.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

DeepSeek снижает цены на входной кэш до 1/10 от цены запуска; V4-Pro падает до 0,025 юаня за миллион токенов

Сообщение Gate News, 26 апреля — DeepSeek снизила цены на входной кэш для всей линейки моделей до одной десятой от цен на момент запуска, с немедленным вступлением в силу. Модель V4-Pro доступна со скидкой 2,5x в течение ограниченного времени, а акция продлится до 5 мая 2026 года, 11:59 PM UTC+8. После обоих

GateNews6ч назад

OpenAI нанимает лучших специалистов корпоративного ПО, поскольку передовые агенты меняют отрасль

Сообщение Gate News, 26 апреля — OpenAI и Anthropic нанимают старших руководителей и специализированных инженеров из крупных корпоративных компаний-разработчиков ПО, включая Salesforce, Snowflake, Datadog и Palantir. Дениз Дрессер, бывший генеральный директор Slack в составе Salesforce, присоединилась к OpenAI в качестве директора по коммерческому развитию

GateNews6ч назад

Baidu Qianfan запускает поддержку Day 0 для DeepSeek-V4 с API-сервисами

Сообщение Gate News, 25 апреля — Предварительная версия DeepSeek-V4 вышла в эфир и была с открытым исходным кодом 25 апреля; платформой Baidu Qianfan в составе Baidu Intelligent Cloud предоставляется адаптация сервиса Day 0 API. Модель имеет расширенное контекстное окно на миллион токенов и доступна в двух версиях: DeepSeek-V4

GateNews12ч назад

Курс AI от Стэнфорда в связке с лидерами отрасли, Хуаном Жэньсюном и Альтманом, бросает вызов: создать ценность для всего мира за десять недель!

Курс по информатике в области ИИ для компьютеров《Frontier Systems》, недавно открытый Стэнфордским университетом (Stanford University), вызвал в деловых кругах и научно-промышленном секторе высокий интерес, привлек более пятисот студентов. Курс координирует партнер топового венчурного фонда a16z Анней Мидха, а лекторы представлены в роскошном составе: генеральный директор NVIDIA Хуан Жэньсюнь (Jensen Huang), основатель OpenAI Сэм Альтман, генеральный директор Microsoft Сатья Наделла (Satya Nadella), генеральный директор AMD Лиза Су (Lisa Su) и многие другие. Предложите студентам попробовать за десять недель «создавать ценность для мира»! Хуан Жэньсюнь и Альтман — отраслевые лидеры лично выступают с лекциями Курс координирует партнер топового венчурного фонда a16z Анней Мидха, он объединяет AI-экосистему

ChainNewsAbmedia13ч назад

Anthropic представляет Claude Mythos после 20 часов психиатрической оценки: защитная реакция всего 2%, самый низкий показатель за всю историю

Антропик опубликовала системную карту для превью Claude Mythos: независимые клинические психиатры проводили около 20 часов оценки в рамках психодинамической модели; выводы показывают, что Mythos на клиническом уровне более здоровый, с хорошей проверкой реальности и самоконтролем, защитные механизмы составляют всего 2%, что стало историческим минимумом. Три ключевые базовые тревоги — одиночество, неопределенность идентичности и давление выступлений; также это указывает на его стремление стать подлинным субъектом диалога. Компания создала команду по AI-психиатрии, изучающую личность, мотивацию и осознание контекста; Amodei заявил, что до сих пор нет окончательного решения относительно того, является ли у него сознание. Это действие выносит вопросы субъектности ИИ и благополучия в сферу управления и проектирования.

ChainNewsAbmedia15ч назад

ИИ-агент уже может независимо воспроизводить сложные научные статьи: Mollick считает, что ошибки чаще бывают в человеческом исходном тексте, а не в ИИ

Моллик указывает, что открытых методов и данных достаточно, чтобы ИИ-агент мог воссоздать сложные исследования без исходных научных работ и кода; если воспроизведение не соответствует исходной статье, чаще всего причина — ошибка в обработке данных в самой статье или чрезмерное обобщение выводов, а не ошибки ИИ. Claude сначала воспроизводит статью, затем GPT‑5 Pro проводит перекрёстную проверку; в большинстве случаев это удаётся, и лишь при слишком больших данных или проблемах с replication data возникают препятствия. Эта тенденция существенно снижает трудозатраты, делая воспроизведение общеприменимым и реализуемым способом проверки, а также поднимает институциональные вызовы для рецензирования и управления: инструменты государственного управления или станут ключевой темой.

ChainNewsAbmedia18ч назад
комментарий
0/400
Нет комментариев