Gate News-сообщение, 24 апреля — инженер OpenAI Клайв Чан высказал подробные возражения против главы с рекомендациями по оборудованию в техническом отчёте V4, назвав её «удивительно посредственной и склонной к ошибкам» по сравнению с получившей признание версией V3. Аппаратные рекомендации V3, которые включали сессии Q&A, ставшие самой популярной темой для обсуждений на академической конференции ISCA, предоставили конкретные рекомендации, согласованные с отраслевыми стандартами межсоединений. Напротив, V4 гораздо более расплывчата.
Чан систематически оспорил три ключевые рекомендации. По энергопотреблению отчёт предполагает, что оптимизация программного обеспечения позволяет чипам одновременно работать на полной мощности для вычислений, хранения и связи, и рекомендует производителям чипов закладывать дополнительный запас по мощности. Чан утверждает, что это контрпродуктивно: общая мощность чипа ограничена физическими ограничениями технологического процесса, поэтому резервирование большего запаса по мощности лишь снижает рабочую частоту, в конечном итоге уменьшая вычислительную производительность. Что касается передачи данных GPU-to-GPU, отчёт предлагает модель pull — когда GPU активно запрашивают данные — вместо модели push, ссылаясь на высокие издержки на уведомления при операциях push. Чан с этим не согласен: он утверждает, что pull на самом деле медленнее и что предпочтительнее улучшенные возможности сетевых адаптеров. Однако возможно, что они обсуждают разные уровни проблемы: отчёт говорит об издержках механизма уведомлений, тогда как Чан имеет в виду саму задержку передачи.
По функциям активации отчёт рекомендует заменить SwiGLU более простыми функциями, чтобы снизить вычислительную нагрузку. Чан не видит в этом смысла, отмечая, что Sonic MoE уже продемонстрировал оптимальную производительность, используя SwiGLU. Чан предполагает, что DeepSeek, возможно, «намеренно ослабил этот раздел».
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
DeepSeek V4 запускается с окном контекста 1M; чипы Huawei Ascend и Cambricon достигают полной совместимости
Сообщение Gate News, 24 апреля — DeepSeek V4-Pro и DeepSeek V4-Flash были официально выпущены и с открытым исходным кодом 24 апреля; при этом длина контекстной обработки была существенно расширена с 128K до 1M, что соответствует почти 10-кратному увеличению пропускной способности. Huawei Computing объявила, что ее продукты Ascend supernode
GateNews10м назад
Fere AI завершает раунд финансирования на $1,3 млн под руководством Ethereal Ventures
Сообщение Gate News, 24 апреля — Fere AI, платформа для торговых агентов цифровыми активами с применением ИИ, объявила о завершении раунда финансирования на $1,3 млн, который возглавила Ethereal Ventures; в нем также участвовали Galaxy Vision Hill и Kosmos Ventures.
Платформа поддерживает кроссчейн-сети, включая Ethereum,
GateNews31м назад
Anthropic откатывает изменения Claude Code после снижения качества; все исправления завершены
Сообщение Gate News от 24 апреля — Anthropic признала недавнее снижение качества Claude Code и подтвердила, что все связанные проблемы были устранены с помощью откатов и исправлений. Проблемы возникли из-за трех изменений продукта и подсказок, внесенных в период между началом и серединой апреля.
4 марта,
GateNews2ч назад
Сооснователь NeoSoul Каэлан: Индустрия ИИ должна позволять существовать игрушкам; инновации часто начинаются с экспериментальных продуктов
Сообщение Gate News, 24 апреля — На недавнем форуме в Гонконге по интеллектуальным зашифрованным финансам сооснователь NeoSoul Каэлан поделился соображениями о том, как оценивать проекты в области ИИ на ранней стадии в быстро развивающейся индустрии ИИ. Помимо оценки текущих продуктов, команды должны продемонстрировать способность идти в ногу с возможностями базовой модели, заявил он.
GateNews2ч назад
Meta развернет десятки миллионов чипов AWS Graviton5 в рамках многолетней сделки на миллиарды долларов
Сообщение Gate News, 24 апреля — Meta подписала многолетнее соглашение с Amazon Web Services (AWS) на развертывание десятков миллионов процессоров Graviton5 для своей инфраструктуры ИИ, что делает Meta одним из крупнейших глобальных клиентов AWS по Graviton. Сделка, рассчитанная на три–пять лет, оценивается в миллиарды
GateNews2ч назад
DeepSeek V4-Flash появился в Ollama Cloud, американский сервер: Claude Code, OpenClaw — в один клик подключить
Ollama Cloud 已上架 DeepSeek V4-Flash,推論在美國主機,提供三組一鍵指令接入 Claude Code、OpenClaw、Hermes。V4-Flash/V4-Pro 採 MoE 架構、原生支援1M脈絡,並以 Token-wise 壓縮+DSA 稀疏注意力降低成本,1M情境下單 token FLOPs 降27%、KV 快取降10%。API 相容 OpenAI ChatCompletions 與 Anthropic,方便多工作流切換,降低成本與資料主權風險。
ChainNewsAbmedia4ч назад