DeepSeek V4 est lancé avec une fenêtre de contexte de 1M ; les puces Huawei Ascend et Cambricon atteignent une compatibilité totale

Message de Gate News, 24 avril — DeepSeek V4-Pro et DeepSeek V4-Flash ont été officiellement publiés et open-sourcés le 24 avril, avec une longueur de traitement du contexte considérablement étendue de 128K à 1M, soit une augmentation de capacité d’environ 10 fois. Huawei Computing a annoncé que ses produits de supernœud Ascend prennent entièrement en charge les modèles de la série DeepSeek V4 grâce à une étroite collaboration entre les technologies de puce et de modèle.

Ascend 950 atteint un déploiement d’inférence des modèles DeepSeek V4 à haut débit et faible latence grâce à des techniques de noyaux fusionnés et de parallélisme multi-stream permettant de réduire la surcharge liée aux calculs d’Attention et aux accès mémoire. Pour DeepSeek V4-Pro avec une entrée de 8K, Ascend 950 atteint environ 20ms TPOT avec un débit Decode de 4,700 TPS sur une seule carte ; pour DeepSeek V4-Flash avec une entrée <8K>, il atteint environ 10ms TPOT avec un débit de 1,600 TPS. La série de supernœuds Ascend A3 atteint également une compatibilité totale, avec des implémentations de référence d’entraînement fournies pour un fine-tuning rapide. Sur un supernœud Ascend A3 à 64 cartes avec un grand mode EP, DeepSeek V4-Flash atteint plus de 2,000 TPS en Decode monocarte sur des scénarios entrée/sortie 8K/1K en utilisant le moteur d’inférence vLLM. Les lignes de produits complètes Huawei Ascend A2, A3 et 950 prennent en charge à la fois DeepSeek V4-Flash et V4-Pro.

Huawei Cloud a annoncé une compatibilité en avance avec DeepSeek V4, offrant aux développeurs des services d’API token en un clic via sa plateforme MaaS. Huawei Cloud a optimisé les capacités au niveau système, au niveau opérateur et au niveau cluster pour garantir une adaptation rapide des modèles et un déploiement performant. Des entreprises, dont Kingsoft WPS et 360, ont déjà intégré le nouveau modèle de DeepSeek via Huawei Cloud.

Cambricon a également annoncé une compatibilité Day 0 avec DeepSeek V4-Flash et V4-Pro basée sur le framework d’inférence vLLM, avec un code d’adaptation open-sourcé à la communauté GitHub. Cambricon avait déjà atteint une adaptation en avance lorsque DeepSeek V3.2 a été publié l’an dernier, ayant mené une optimisation approfondie des performances en collaboration logiciel-hardware sur les modèles de la série DeepSeek.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Les cofondateurs de Gentrace, Doug Safreno et Vivek Nair, rejoignent Anthropic après l’arrêt de l’outil d’évaluation de l’IA

Message des Gate News, 27 avril — Doug Safreno, cofondateur et PDG de la plateforme d’évaluation et d’observabilité de l’IA Gentrace, a annoncé sur X qu’il avait rejoint Anthropic. Gentrace, qui a aidé les entreprises à tester et à surveiller la qualité des sorties des LLM, a obtenu $8 million de financement de Série A mené par Matrix

GateNewsIl y a 1m

Un tribunal californien examine le procès intenté par Musk contre OpenAI, le PDG de Microsoft témoignera à l’audience

Elon Musk a déposé, le 27 avril, devant un tribunal californien, une plainte relative au procès intenté concernant OpenAI, accusée d’avoir trahi l’engagement de départ à but non lucratif. Le tribunal a entamé la sélection du jury. La juge présidente est Yvonne Gonzalez Rogers. D’après les documents judiciaires, le PDG de Microsoft, Satya Nadella, est inscrit comme témoin devant comparaître pendant la période du procès, et rendra une décision finale avant la mi-mai.

MarketWhisperIl y a 24m

Samsung SDS obtient les droits de commercialiser ChatGPT Edu d’OpenAI en Corée du Sud

Message de Gate News, 27 avril — Samsung SDS, la branche de services informatiques du groupe Samsung, a annoncé avoir obtenu les droits de commercialisation de ChatGPT Edu d’OpenAI. La société mène un pilote avec l’Université nationale sud-coréenne de diffusion et de communications, couvrant environ 90 000 étudiants,

GateNewsIl y a 28m

L’Inde lance un projet de ville d’IA $650M à Bengaluru, visant 25 000 chercheurs d’ici 2030

Message d’actualités Gate, 27 avril — L’Inde développe une ville d’IA de $650 millions à Bengaluru, avec une installation de 500 000 pieds carrés conçue pour servir de premier laboratoire physique au monde pour l’IA agentique. Le projet offre une connectivité de 400 Gbit/s à quatre grands fournisseurs de cloud IA et prévoit de

GateNewsIl y a 38m

Sam Altman expose les cinq principes de fonctionnement d’OpenAI, signalant d’éventuelles restrictions futures des capacités des modèles pour la sécurité

Message de Gate News, 27 avril — Le PDG d’OpenAI, Sam Altman, a publié cinq principes de fonctionnement pour l’entreprise sous sa signature personnelle, indiquant qu’OpenAI pourrait restreindre l’accès des utilisateurs aux capacités des modèles à certaines périodes afin de donner la priorité à la sécurité. Dans la déclaration, Altman a décrit un scénario futur possible où

GateNewsIl y a 1h

DeepSeek retarde le lancement de V4 pour l’optimiser sur les puces Ascend de Huawei

Message de Gate News, le 27 avril — DeepSeek a reporté la sortie de son modèle V4 afin d’affiner sa pile logicielle pour les puces Ascend de Huawei, reflétant l’initiative plus large de Pékin visant à développer une chaîne d’approvisionnement nationale en IA alors que l’accès aux semi-conducteurs étrangers de pointe devient de plus en plus contraint. DeepSe

GateNewsIl y a 2h
Commentaire
0/400
Aucun commentaire