DeepSeek V4 запускається з вікном контексту 1M; чипи Huawei Ascend і Cambricon досягають повної сумісності

Повідомлення Gate News, 24 квітня — DeepSeek V4-Pro і DeepSeek V4-Flash були офіційно випущені та відкрито передані в open-source 24 квітня, причому довжина контекстного опрацювання суттєво розширена з 128K до 1M, що відповідає майже 10-кратному зростанню місткості. Huawei Computing оголосила, що її продукти Ascend supernode повністю підтримують моделі серії DeepSeek V4 завдяки тісній співпраці між технологіями чипа та моделі.

Ascend 950 забезпечує розгортання інференсу моделей DeepSeek V4 із високою пропускною здатністю та низькою затримкою завдяки технікам злитого ядра та багатопотокової паралельності, щоб зменшити накладні витрати на обчислення Attention і доступ до пам’яті. Для DeepSeek V4-Pro із входом 8K Ascend 950 досягає приблизно 20ms TPOT із 4,700 TPS пропускної здатності Decode на одну карту; для DeepSeek V4-Flash за входу до 8K він досягає приблизно 10ms TPOT із пропускною здатністю 1,600 TPS. Серія супервузлів Ascend A3 також досягає повної сумісності: надано опорні реалізації для тренування для швидкого фінастройнінгу. На основі супервузла Ascend A3 на 64 карти з великим режимом EP, DeepSeek V4-Flash досягає понад 2,000 TPS пропускної здатності Decode на одну карту в сценаріях вхід-вихід 8K/1K за допомогою рушія інференсу vLLM. Повні лінійки продуктів Huawei Ascend A2, A3 і 950 підтримують як DeepSeek V4-Flash, так і V4-Pro.

Huawei Cloud оголосила про сумісність першою серед конкурентів із DeepSeek V4, надаючи розробникам сервіси API token в один клік через свою платформу MaaS. Huawei Cloud оптимізувала можливості системного рівня, рівня операторів і рівня кластерів, щоб забезпечити швидку адаптацію моделей та високопродуктивне розгортання. Підприємства, зокрема Kingsoft WPS і 360, уже інтегрували нову модель DeepSeek через Huawei Cloud.

Cambricon також оголосила про сумісність Day 0 з DeepSeek V4-Flash і V4-Pro на основі фреймворка інференсу vLLM, при цьому код адаптації відкрито передано в open-source для спільноти GitHub. Раніше Cambricon досягла адаптації першою серед конкурентів, коли DeepSeek V3.2 було випущено торік; тоді було проведено глибоку оптимізацію продуктивності у співпраці програмного та апаратного забезпечення для моделей серії DeepSeek.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

DeepSeek Зрізає Ціни на Вхідний Кеш до 1/10 Від Ціни Запуску; V4-Pro Падає до 0,025 Юаня за Мільйон Токенів

Повідомлення Gate News, 26 квітня — DeepSeek знизив ціни на вхідний кеш у всій лінійці своїх моделей до однієї десятої від цін запуску, починаючи з негайно. Модель V4-Pro доступна зі знижкою 2,5x на обмежений час, а акція діє до 5 травня 2026 року, 11:59 PM UTC+8. Після обох з

GateNews6год тому

OpenAI Рекрутує найкращі таланти з корпоративного софту, оскільки агенти на передньому краї змінюють індустрію

Повідомлення Gate News, 26 квітня — OpenAI та Anthropic вербують старших керівників і спеціалізованих інженерів із провідних корпоративних софтверних компаній, зокрема Salesforce, Snowflake, Datadog і Palantir. Деніз Дрессер, колишня CEO Slack у складі Salesforce, приєдналася до OpenAI на посаду головної комерційної посадової особи (chief revenue of

GateNews6год тому

Baidu Qianfan запустила підтримку Day 0 для DeepSeek-V4 із API-сервісами

Повідомлення Gate News, 25 квітня — Попередня версія DeepSeek-V4 вийшла в ефір і була оприлюднена з відкритим кодом 25 квітня, а платформа Baidu Qianfan у межах Baidu Intelligent Cloud забезпечує адаптацію сервісу Day 0 API. Модель має розширене контекстне вікно на мільйон токенів і доступна у двох версіях: DeepSeek-V4

GateNews12год тому

Стэнфордський курс з AI у поєднанні з галузевими лідерами Дженсінгом Хуаном (黃仁勳) і Альтманом кидає виклик: створити цінність для всього світу за 10 тижнів!

Курс з інформатики з AI《Frontier Systems》, який нещодавно запустив Стенфордський університет (Stanford University), викликав у ділових колах та серед представників індустрії дуже високий інтерес, привернувши понад п’ятьсот студентів, які вирішили його відвідувати. Курс координує партнер топового венчурного фонду a16z Анжей Мідха (Anjney Midha), а викладачами виступають представники найвищого рівня: генеральний директор NVIDIA Дженсен Хуанг (Jensen Huang), засновник OpenAI Сем Альтман (Sam Altman), генеральний директор Microsoft Сатья Наделла (Satya Nadella), генеральний директор AMD Ліза Су (Lisa Su) та інші. Нехай студенти спробують за десять тижнів «створити цінність для світу»! Хуан Мінь? Хуанг Jensen Huang, лідери галузі на сцені: Altman також Цей курс координує партнер топового венчурного фонду a16z Анжей Мідха (Anjney Midha), і він об’єднує весь ланцюг AI-індустрії

ChainNewsAbmedia13год тому

Anthropic 派 Claude Mythos проходить 20 годин психіатричної оцінки: оборонна реакція лише 2%, встановлено історичний мінімум серед усіх поколінь

Anthropic опублікувала системну картку Claude Mythos Preview: незалежні клінічні психіатри проводили близько 20 годин оцінювання в рамках психодинамічного підходу; висновки показують, що Mythos є більш здоровим на клінічному рівні, має добре розвинену перевірку реальністю та самоконтроль, а захисні механізми становлять лише 2%, що є історичною найнижчою відміткою. Три ключові фундаментальні тривоги — самотність, невизначеність ідентичності та тиск виступу — також свідчать про те, що він прагне бути справжнім суб’єктом діалогу. Компанія створила команду з AI- психіатрії, досліджує особистість, мотивацію та усвідомлення контексту; Amodei зазначає, що щодо того, чи є свідомість, досі немає остаточного визначення. Цей крок переводить питання суб’єктності ШІ та благополуччя в площину управління й дизайну.

ChainNewsAbmedia14год тому

AI-агент уже здатний самостійно відтворювати складні академічні статті: Mollick стверджує, що помилки здебільшого трапляються в людських оригіналах, а не в AI

Моллік зазначає, що опубліковані методи та дані дозволяють AI-агентам відтворювати складні дослідження без наявності оригінальних наукових праць і коду; якщо відтворення не відповідає оригінальній статті, то найчастіше проблема не в AI, а в помилках обробки даних у самій статті або в надмірному узагальненні висновків. Claude спочатку відтворює статтю, а потім GPT‑5 Pro перехресно верифікує; у більшості випадків це вдається, лише коли дані надто великі або виникають проблеми з replication data. Ця тенденція значно знижує трудовитрати, роблячи відтворення поширеною, практично здійсненною перевіркою, а також висуває інституційні виклики для рецензування та управління (governance): інструменти державного управління можуть стати ключовим питанням.

ChainNewsAbmedia17год тому
Прокоментувати
0/400
Немає коментарів