DeepSeek добавляет режим Vision, поскольку китайские чипы совпадают с поддержкой запуска

CryptoFrontier

DeepSeek — базирующаяся в Ханчжоу компания в сфере искусственного интеллекта — добавила в основного чат-бота возможности распознавания изображений и видео благодаря новой функции «режим распознавания изображений», выведя его в соответствие с другими крупными ИИ-чат-ботами. Запуск совпал со значительной вехой в цепочке поставок чипов в Китае: четыре отечественные полупроводниковые компании — Huawei Ascend, Cambricon, Hygon Information и Moore Threads — подтвердили поддержку новейшей флагманской модели DeepSeek, DeepSeek-V4, в тот же день, что стало сдвигом по сравнению с типичными для прошлых месяцев длительными периодами адаптации, характерными для решений вне экосистемы Nvidia.

Видение DeepSeek и расширение моделей

DeepSeek незаметно запустила режим распознавания изображений вместе с двумя другими режимами, которые были представлены ранее в этом месяце: «expert» и «flash». Как отметил Чэнь Сяокан (Chen Xiaokang), возглавляющий мультимодальную команду DeepSeek, инструмент впервые протестировали на небольшой группе пользователей как на веб-сайте, так и в мобильном приложении. Чэнь Делий (Chen Deli), старший исследователь компании, отпраздновал запуск постом с отсылкой к логотипу компании: «Маленький кит теперь может видеть».

Функция для изображений и видео появилась спустя всего несколько дней после того, как DeepSeek выпустила превью DeepSeek-V4 и сделала веса модели доступными для публичной загрузки и использования. V4 построена как две отдельные модели: DeepSeek-V4-Pro с 1,6 трлн параметров, предназначенная для сложного рассуждения и многошаговых автоматизированных рабочих процессов, и DeepSeek-V4-Flash, оптимизированная для обработки больших объемов запросов с более низкой стоимостью. Обе модели поддерживают контекстное окно на один миллион токенов и используют гибридный дизайн внимания, который, по заявлению компании, снижает требования к вычислительным ресурсам и памяти во время инференса.

Китайские производители чипов обеспечили поддержку запуска в тот же день

То, что привлекло внимание индустрии, было не только самой моделью, но и скоординированной аппаратной поддержкой, продемонстрированной в день релиза V4. Huawei Ascend подтвердила совместимость с ее чипами A2, A3 и 950: Ascend 950 использует слияние вычислительных процессов и параллельные потоки обработки, чтобы ускорить инференс как для V4-Pro, так и для V4-Flash. Cambricon завершила адаптацию, используя открытое исходное окружение vLLM для инференса, и опубликовала код на GitHub. Hygon Information выполнила глубокую оптимизацию модели на своей платформе DCU, чтобы обеспечить плавный переход от релиза модели к развертыванию. Moore Threads объединилась с Пекинской академией искусственного интеллекта, чтобы запустить V4 на своей карте MTT S5000, используя программный стек FlagOS.

Эта поддержка в тот же день по нескольким наборам микросхем представляет собой отход от исторических паттернов. Ранее аппаратное обеспечение вне экосистемы Nvidia обычно требовало месяцев, чтобы поддержать крупные новые модели. Наблюдатели отрасли отмечают, что достижение совместимости с четырьмя разными отечественными наборами чипов в день запуска сигнализирует о реальном сдвиге в зрелости китайской полупроводниковой и ИИ-инфраструктуры.

Стратегические последствия: стоимость и независимость цепочки поставок

Более широкое значение запуска DeepSeek выходит за рамки отдельных технических достижений. Позволяя V4 нативно работать одновременно на нескольких китайских чипах, DeepSeek снижает риск зависимости от экспортных ограничений, которые исторически блокировали китайским компаниям доступ к самым передовым американским процессорам. Эффективность по стоимости остается в центре стратегии DeepSeek — компания делает приоритет на том, чтобы удерживать расходы на работу модели на низком уровне, позволяя бизнесу строить автоматизированные системы без непомерных затрат на вычисления.

Наблюдатели отрасли описывают этот релиз как отражающий созревание всей цепочки поставок, а не одного единственного технологического прорыва. Координация между DeepSeek, производителями чипов и программными фреймворками демонстрирует развитие интегрированной экосистемы. Такая траектория предполагает, что конкурентный ландшафт в ИИ смещается: фокус перестает быть на сложности отдельных моделей и переходит к способности поддерживать полностью, экономически эффективно и независимо работающие системы в долгосрочной перспективе.

FAQ

Какие новые возможности DeepSeek добавила в своего чат-бота? DeepSeek добавила «режим распознавания изображений», который позволяет ее чат-боту понимать фотографии и видео, а не только текст. Эта функция впервые была протестирована на небольшой группе пользователей как на веб-сайте, так и в мобильном приложении, что поставило возможности DeepSeek в один ряд с другими крупными ИИ-чат-ботами, предлагающими аналогичные способности.

Какие китайские компании по производству чипов поддержали DeepSeek-V4 в день запуска? Четыре китайские компании по производству чипов подтвердили поддержку DeepSeek-V4 в тот же день: Huawei Ascend (с чипами A2, A3 и 950), Cambricon, Hygon Information и Moore Threads. Такая совместимость в день запуска для нескольких наборов микросхем ранее была редкостью вне экосистемы Nvidia и обычно требовала месяцев работы по адаптации.

Каковы две версии DeepSeek-V4 и чем они отличаются? DeepSeek-V4-Pro имеет 1,6 трлн параметров и предназначена для сложного рассуждения и многошаговых автоматизированных рабочих процессов, тогда как DeepSeek-V4-Flash оптимизирована для обработки больших объемов запросов с более низкой стоимостью. Обе поддерживают контекстное окно на один миллион токенов и используют гибридный дизайн внимания, чтобы снизить требования к вычислительным ресурсам и памяти.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
AprDaydreamvip
· 10м назад
Обновление DeepSeek получилось классным, наконец-то не завидую GPT-4V
Посмотреть ОригиналОтветить0
RugProofRitavip
· 3ч назад
Только что попробовал распознавание изображений, действительно понимание китайского лучше, чем у одной компании.
Посмотреть ОригиналОтветить0
ybaservip
· 5ч назад
Держитесь крепко HODL💎 Держитесь крепко HODL💎
Посмотреть ОригиналОтветить0
GateUser-0b71fc11vip
· 5ч назад
От чистого текста до мультимодальности — за полгода пройти путь, который у других занимает два года
Посмотреть ОригиналОтветить0
MirrorBallGazingAtTheSkyvip
· 5ч назад
Не хвастайся, решена ли проблема иллюзий RAG?
Посмотреть ОригиналОтветить0
GateUser-ced0257avip
· 6ч назад
Распознавание видео? Хотите проверить стабильность в сложных сценариях
Посмотреть ОригиналОтветить0
GateUser-8f9ccfecvip
· 6ч назад
Это время публикации идеально подобрано, чтобы совпасть с горячей темой чипов.
Посмотреть ОригиналОтветить0
GateUser-cb789e81vip
· 6ч назад
Снижение затрат — это настоящее мастерство, ждите цены API
Посмотреть ОригиналОтветить0
GasFeeAnxietyvip
· 6ч назад
Последний вопрос: когда откроют для бесплатных пользователей?
Посмотреть ОригиналОтветить0
GateUser-f78f1f3evip
· 6ч назад
Мильные камни чипа + обновление функций, двойная радость?
Посмотреть ОригиналОтветить0
Подробнее