Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 许可下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个专家混合 (MoE) 模型:V4-Pro 总参数 1.6 万亿,按每个 token 激活 49 亿;以及 V4-Flash 总参数 2840 亿,按每个 token 激活 130 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:一种混合注意力机制,结合压缩稀疏注意力 (CSA) 和高度压缩注意力 (HCA),从而显著降低长上下文开销——V4-Pro 在 1M 上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于在推理过程中存储历史信息的 KV 缓存 (VRAM) 仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及 Muon 优化器以实现更快的训练收敛。预训练使用了超过 32 万亿 tokens 的数据。
后训练采用两阶段方法:首先通过监督微调 (SFT) 和 GRPO 强化学习训练领域特定专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 声称是最强的开源模型,拥有顶级代码基准,并在推理和智能体任务上显著缩小了与闭源前沿模型的差距。V4-Flash-Max 在算力充足的情况下实现了 Pro 级推理性能,但在纯知识和复杂智能体任务上受限于参数规模。权重以混合 FP4+FP8 精度存储。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
Nvidia 在 Blackwell 基础设施上将 OpenAI Codex AI 代理部署到全体员工
Gate News 消息,4 月 25 日——据首席执行官 Jensen Huang 和 OpenAI 首席执行官 Sam Altman 的内部沟通,Nvidia 已将 OpenAI 的 Codex 推送给其全部员工,这是一款由 GPT-5.5 驱动的 AI 代理,且在一次成功试点后进行部署;该试点约有 10,000 名员工参与。
Codex 被设计用于协助
GateNewsمنذ 5 د
تحذّر وزارة الخارجية الأمريكية من عملية تقطير نماذج الذكاء الاصطناعي DeepSeek
ذكرت رويترز أن وزارة الخارجية الأمريكية أصدرت برقية في 24 أبريل إلى البعثات الدبلوماسية والقنصلية في جميع أنحاء العالم، حذرت فيها الحكومات الأجنبية من مساعي الصين لنسخ أنظمة الذكاء الاصطناعي الأمريكية عبر أسلوب التقطير (distillation). البرقية
CryptoFrontierمنذ 14 د
شركة ناشئة في مجال الذكاء الاصطناعي الصحي على يد أستاذ ستانفورد تسعى إلى $100M بمعدل تقييم $1B
بوابة أخبار، 25 أبريل — يرفع أستاذ جامعة ستانفورد جيمس زو ما يقارب $100 مليون دولار لصالح Human Intelligence، وهي شركة ناشئة في كاليفورنيا تطور نماذج ذكاء اصطناعي للفيزيولوجيا البشرية، وذلك بتقييم يقارب $1 مليار دولار.
تستند الشركة إلى أبحاث زو في علم وظائف الأعضاء والذكاء الاصطناعي. خوارزمية EchoNet في مختبره حصلت على تصريح من إدارة الغذاء والدواء (FDA)، وفي هذا العام نشر المختبر ورقة في مجلة Nature حول SleepFM، وهو نموذج أساس تم تدريبه على ما يقرب من 600,000 ساعة من بيانات النوم من 65,000 شخص ويمكنه التنبؤ بخطر الإصابة بالأمراض لأكثر من 100 حالة. تخطط Human Intelligence للتعاون مع Kernel، وهي شركة التقنيات العصبية التابعة لبراين جونسون والتي تُصنّع سماعات لتسجيل النشاط العصبي.
تعكس جولة التمويل اتجاهاً أوسع بين الشركات المنبثقة من جامعة ستانفورد التي تؤمّن استثمارات كبيرة. يناقش Engramme جولة بقيمة مليون دولار، بينما تسعى Periodic Labs إلى مئات الملايين عند تقييم يقارب مليار دولار. يتجه قطاع الذكاء الاصطناعي الصحي بشكل متزايد نحو نماذج أساس متخصصة مبنية على بيانات خاصة، مثل تسجيلات النوم والإشارات العصبية، إذ إن النماذج العامة للذكاء الاصطناعي يمكن أن تُحدث أخطاء كبيرة في المهام العلمية المتخصصة.
GateNewsمنذ 25 د
AI编程初创公司Cognition就$25B 估值融资轮次进行洽谈
Gate News消息,4月25日——根据知情人士称,AI编程初创公司Cognition正在进行早期洽谈,计划筹集数亿美元或更多资金,估值约为$25 十亿美元。据悉,SpaceX收购一家竞争对手AI编程初创公司后,相关兴趣有所增加。
Co
GateNewsمنذ 25 د
Meta ستنشر ملايين رقائق AWS Graviton لأحمال عمل الذكاء الاصطناعي
بوابة الأخبار رسالة، 25 أبريل — أعلنت أمازون في 24 أبريل أن ميتا ستستخدم ملايين رقائق AWS Graviton لأحمال عمل الذكاء الاصطناعي، ما يمثل مكسبًا مهمًا للعملاء لصالح معالجات ARM الداخلية لدى AWS. سيتم استخدام الرقائق لأغراض استدلال الذكاء الاصطناعي والحوسبة العامة بدلًا من
GateNewsمنذ 35 د
التحقيق في سوق النفط الأمريكي بسبب تداول داخلي مشتبه فيه بمعلومات سرية؛ سياسة ترامب تهيمن على تحركات السوق
رسالة أخبار البوابة، 25 أبريل — سيطرت الاتجاهات الكلية والتوترات الجيوسياسية على تحركات السوق هذا الأسبوع. لا تزال توترات الولايات المتحدة وإيران تضغط على أسعار النفط والأصول العالمية عالية المخاطر، مع بقاء حصار مضيق هرمز دون حل وتحول المفاوضات نحو "وقف إطلاق نار شامل". عزوف عن المخاطرة
GateNewsمنذ 39 د