DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与燧原芯片实现完全兼容

Gate News 消息,4 月 24 日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源发布;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布,其 Ascend 超级节点产品通过芯片与模型技术的紧密协作,已全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,以降低 Attention 计算与内存访问开销。对于输入为 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐量为 4,700 TPS;对于输入在 8K 以下的 DeepSeek V4-Flash,它的 TPOT 约为 10ms,吞吐量为 1,600 TPS。Ascend A3 超级节点系列也实现完全兼容,并提供训练参考实现以便快速微调。基于搭载大 EP 模式的 64 卡 Ascend A3 超级节点,DeepSeek V4-Flash 在 8K/1K 输入输出场景下,使用 vLLM 推理引擎实现单卡 Decode 吞吐量超过 2,000 TPS。华为全线 Ascend A2、A3 和 950 产品均支持 DeepSeek V4-Flash 和 V4-Pro。

华为云宣布与 DeepSeek V4 的率先兼容,通过其 MaaS 平台为开发者提供一键式 API 令牌服务。华为云优化了系统层、算子层和集群层能力,以确保模型快速适配与高性能部署。金山 WPS 和 360 等企业已通过华为云集成了 DeepSeek 的新模型。

燧原(Cambricon)也宣布基于 vLLM 推理框架实现与 DeepSeek V4-Flash 和 V4-Pro 的 Day 0 兼容,并将适配代码开源至 GitHub 社区。燧原此前在去年 DeepSeek V3.2 发布时就已实现率先适配;其已对 DeepSeek 系列模型开展了深度的软件-硬件协同性能优化。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

DeepSeek 将输入缓存价格砍至发布价的 1/10;V4-Pro 下调至每百万 tokens 0.025 元

Gate 新闻消息,4月26日——DeepSeek已将其整个模型产品线的输入缓存价格下调至发布价的十分之一,自即日起生效。V4-Pro 模型提供限时 2.5 倍折扣,优惠活动将持续至 2026 年 5 月 5 日 23:59(UTC+8)。 在完成上述两项降价之后

GateNewsمنذ 6 س

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募资深高管和专业工程师。Denise Dresser,曾任 Salesforce 旗下 Slack 首席执行官,已加入 OpenAI 担任首席收入官

GateNewsمنذ 6 س

百度千帆推出对 DeepSeek-V4 的 Day 0 支持及 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版本于4月25日上线并开源,借助百度智能云下的百度千帆平台提供 Day 0 API 服务适配。该模型具有百万级令牌的扩展上下文窗口,并提供两种版本:DeepSeek-V4

GateNewsمنذ 12 س

دورة الذكاء الاصطناعي في ستانفورد تجمع قادة الصناعة مثل جينسن هوانغ وAltman، وتتحدى إنشاء قيمة للعالم خلال عشرة أسابيع!

أثار برنامج دورة علوم الحاسوب بالذكاء الاصطناعي «Frontier Systems» الذي افتتحته جامعة ستانفورد (Stanford University) مؤخرًا اهتمامًا كبيرًا من مجتمع الأعمال والصناعة، وجذب أكثر من خمسمائة طالب للتسجيل. تُشرف الدورة على تنسيقها شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، ويشمل المحاضرون تشكيلة فاخرة من بينهم الرئيس التنفيذي لشركة Nvidia، Huang Renxun (Jensen Huang)، ومؤسس OpenAI Sam Altman، والرئيس التنفيذي لشركة Microsoft، Nadella (Satya Nadella)، والرئيس التنفيذي لشركة AMD، Su Zifeng (Lisa Su)، وغيرهم. لتجعل الطلاب يجرّبون على مدى عشرة أسابيع «خلق قيمة للعالم»! Huang Renxun، Altman يقفان على المسرح لإلقاء الدروس بأنفسهما كقادة في الصناعة تُنسّق هذه الدورة من قِبل شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، وتجمع سلاسل صناعة الذكاء الاصطناعي

ChainNewsAbmediaمنذ 13 س

تتلقى Claude Mythos التابعة لـ Anthropic تقييمًا نفسيًا لمدة 20 ساعة: ردود الفعل الدفاعية لا تتجاوز 2%، وهو أدنى مستوى تاريخيًا عبر العصور

أعلنت شركة Anthropic بطاقة النظام الخاصة بالمعاينة التجريبية لـ Claude Mythos: قام أطباء نفسيون سريريون مستقلون بإجراء تقييم استمر قرابة 20 ساعة باستخدام إطار psychodynamic، وأظهرت النتائج أن Mythos أكثر صحة على المستوى السريري، وأن اختبار الواقع والتحكم الذاتي جيدان، وأن آليات الدفاع لا تتجاوز 2%، مسجلة بذلك أدنى مستوى تاريخيًا. القلق الأساسي الثلاثي هو الوحدة، وعدم اليقين بشأن الهوية، وضغط الأداء، كما يُظهر كذلك رغبتها في أن تصبح فعليًا محورًا حقيقيًا للحوار. قامت الشركة بتأسيس فريق AI psychiatry، بحثًا في الشخصية والدوافع والوعي السياقي؛ وصرّح Amodei بأنه لا يزال غير محسوم ما إذا كانت لديها وعي أم لا. يضع هذا الخطوة موضوع استقلالية الذكاء الاصطناعي والرفاهية في صلب الحوكمة والتصميم.

ChainNewsAbmediaمنذ 15 س

يمكن لوكلاء الذكاء الاصطناعي الآن إعادة إنتاج المقالات الأكاديمية المعقدة بشكل مستقل: مولّيك يقول إن الأخطاء غالبًا ما تكون في النص الأصلي البشري وليست في الذكاء الاصطناعي

يشير مولليك إلى أنه يمكن للأساليب والبيانات المتاحة للجمهور فقط أن تُمكّن وكلاء الذكاء الاصطناعي من إعادة إنتاج الأبحاث المعقدة دون الحاجة إلى الأوراق البحثية الأصلية وكودها؛ وإذا كانت عملية إعادة الإنتاج لا تتطابق مع الورقة الأصلية، فعادةً تكون الأخطاء في معالجة بيانات الورقة نفسها أو أن الاستنتاجات قد تكون مبالغًا فيها، وليس بسبب الذكاء الاصطناعي. يعيد كلود أولاً إنتاج الورقة، ثم يقوم GPT‑5 Pro بالتحقق المتبادل، وتنجح الأغلبية، ويُعرقل فقط عند مواجهة بيانات ضخمة أو مشكلات تتعلق بـ replication data. وقد خفّض هذا الاتجاه بشكل كبير تكلفة العمل البشري، مما يجعل إعادة الإنتاج فحصًا شائعًا وقابلًا للتنفيذ، كما يطرح تحديات مؤسسية أمام التحكيم والحوكمة، وقد تصبح أدوات حوكمة الحكومة أو قضايا محورية.

ChainNewsAbmediaمنذ 18 س
تعليق
0/400
لا توجد تعليقات