Gate News Nachricht, 24. April — DeepSeek hat die V4-Serie Open-Source-Modelle unter der MIT-Lizenz veröffentlicht; die Gewichte sind nun auf Hugging Face und ModelScope verfügbar. Die Serie umfasst zwei Mixture-of-Experts-(MoE)-Modelle: V4-Pro mit 1,6 Billionen Gesamtparametern und 49 Milliarden aktivierten pro Token sowie V4-Flash mit 284 Milliarden Gesamtparametern und 13 Milliarden aktivierten pro Token. Beide unterstützen ein Kontextfenster von 1 Million Token.
Die Architektur bietet drei zentrale Upgrades: einen hybriden Aufmerksamkeitsmechanismus, der komprimierte spärliche Attention (CSA) und stark komprimierte Attention (HCA) kombiniert, wodurch der Overhead für Long-Context deutlich reduziert wird — die Inferenz-FLOPs von V4-Pro für 1M Kontext betragen lediglich 27% von denen von V3.2, und der KV-Cache (VRAM zum Speichern historischer Informationen während der Inferenz) liegt nur bei 10% von dem von V3.2; manifold-beschränkte Hyperverbindungen (mHC) ersetzen traditionelle Residualverbindungen, um die Stabilität der Signalübertragung zwischen Schichten zu verbessern; und der Muon-Optimizer für schnellere Trainingskonvergenz. Das Pre-Training verwendete über 32 Billionen Token an Daten.
Beim Post-Training wird ein zweistufiger Ansatz genutzt: Zuerst werden domänenspezifische Experten trainiert, über supervised fine-tuning (SFT) und GRPO-Reinforcement-Learning, dann werden sie zu einem einzelnen Modell zusammengeführt, durch Online-Distillation. V4-Pro-Max (highest inference mode) beansprucht, das stärkste Open-Source-Modell mit erstklassigen Coding-Benchmarks zu sein und die Lücken zu Closed-Source-Frontier-Modellen bei Reasoning- und Agent-Tasks deutlich zu verringern. V4-Flash-Max erreicht Pro-Level-Reasoning-Performance mit ausreichend Budget für Rechenleistung, ist jedoch durch die Parametervolumen-Größe bei reinem Wissen und komplexen Agent-Tasks begrenzt. Die Gewichte werden in gemischter FP4+FP8-Präzision gespeichert.
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Google plant, bis zu $40 Milliarden in Anthropic zu investieren, und sagt 5+ Gigawatt Rechenleistung zu
Gate News Nachricht, 24. April — Laut Marktdaten plant Google, bis zu $40 Milliarden in Anthropic zu investieren. Die Investition beginnt mit einem anfänglichen $10 Milliarden-Betrag in bar, gefolgt von bis zu zusätzlichen $30 Milliarden, abhängig vom Erreichen festgelegter Meilensteine.
Google wird außerdem Anthropic mindestens 5 Gigawatt Rechenleistung als Teil der Partnerschaft bereitstellen.
GateNews1Std her
Schweizer Aufseher FINMA warnt, dass das KI-Tool Mythos von Anthropic ein finanzielles Risiko darstellt
Gate-News-Meldung, 24. April – Die Eidgenössische Finanzmarktaufsicht (FINMA) hat erklärt, dass das Zulassen, dass Banken Anthropics KI-Tool Mythos rasch und bequem übernehmen, ernsthafte Risiken für das
GateNews1Std her
DeepSeek V4 startet mit einem 1M-Kontextfenster; Huawei Ascend- und Cambricon-Chips erreichen vollständige Kompatibilität
Gate News Nachricht, 24. April — DeepSeek V4-Pro und DeepSeek V4-Flash wurden am 24. April offiziell veröffentlicht und Open-Source gestellt; die Länge der Kontextverarbeitung wurde deutlich von 128K auf 1M erweitert, was einer nahezu 10-fachen Kapazitätserhöhung entspricht. Huawei Computing kündigte an, dass seine Ascend-Supernode
GateNews2Std her
Fere AI schließt eine 1,3-Millionen-US-Dollar-Finanzierungsrunde ab, angeführt von Ethereal Ventures
Gate News-Meldung, 24. April — Fere AI, eine KI-gestützte Plattform für digitale Asset-Handelsagenten, gab den Abschluss einer Finanzierungsrunde in Höhe von 1,3 Millionen US-Dollar bekannt, die von Ethereal Ventures angeführt wurde, mit Beteiligung von Galaxy Vision Hill und Kosmos Ventures.
Die Plattform unterstützt plattformübergreifende Netzwerke einschließlich Ethereum,
GateNews3Std her
Anthropic rollt Änderungen an Claude Code zurück, nachdem die Qualität nachgelassen hat; alle Fixes abgeschlossen
Gate-News-Meldung, 24. April — Anthropic hat einen jüngsten Rückgang der Claude-Code-Qualität anerkannt und bestätigt, dass alle damit zusammenhängenden Probleme durch Rollbacks und Fixes behoben wurden. Die Probleme rührten von drei Produkt- und Prompt-Anpassungen her, die zwischen Anfang und Mitte April vorgenommen wurden.
Am 4. März hat der
GateNews4Std her
NeoSoul-Mitgründer Kaelan: Die KI-Branche sollte erlauben, dass es „Spielzeuge“ gibt; Innovation beginnt oft als experimentelle Produkte
Gate News-Mitteilung, 24. April — Auf einem kürzlich in Hongkong abgehaltenen Forum für intelligentes verschlüsseltes Finanzwesen teilte Kaelan, Mitgründer von NeoSoul, Einblicke in die Bewertung von KI-Projekten in der Frühphase einer schnelllebigen, sich rasch entwickelnden KI-Branche. Neben der Beurteilung aktueller Produkte müssen Teams die Fähigkeit unter Beweis stellen, mit den zugrunde liegenden Modellfähigkeiten Schritt zu halten, wie er sagte.
GateNews5Std her