Kimi K3 de Moonshot AI prévu pour un lancement au T3 2026 avec 2,5T+ de paramètres et un contexte de 1 million de jetons lors des tests

Message de Gate News, 27 avril — Moonshot AI prévoit de lancer Kimi K3 au T3 2026 (juillet-septembre), selon des informations. Le modèle comportera plus de 2.5T de paramètres, et des tests internes révèlent des capacités de fenêtre de contexte dépassant 1 million de jetons.

Cependant, la question de savoir si le contexte de 1M sera disponible dans la version publique reste incertaine. Les principales contraintes limitant le déploiement du contexte de 1M sont les ressources de calcul plutôt que la capacité technique, indiquent des sources. La version publique actuelle de Kimi, K2.6, conserve une fenêtre de contexte de 256K.

Le développement intervient alors que DeepSeek V4 a déjà positionné le contexte de 1M comme une offre publique, relevant ainsi le niveau des capacités de long contexte dans les modèles à poids ouverts. Si Kimi K3 apporte le contexte de 1M à sa version publique, Moonshot se alignerait sur DeepSeek V4 à la fois en termes d’échelle du modèle et de performance en long contexte.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Google DeepMind rejoint le K-Moonshot sud-coréen pour relever des défis scientifiques avec l’IA

Google DeepMind a conclu un partenariat avec la Corée du Sud afin de fournir l’infrastructure technique à l’initiative K-Moonshot du pays, un ambitieux programme national conçu pour résoudre les défis scientifiques les plus complexes du siècle grâce à l’IA. Résumé Google DeepMind s’associe avec Sout

CryptonewsIl y a 1h

Gate organise une table ronde Space sur le trading avec l’IA le 28 avril : explorer l’IA comme moteur du prochain cycle Web3

Message d’actualités Gate, 27 avril — Gate organisera une table ronde en direct sur Space consacrée au Trading avec l’IA le 28 avril à 20h, réunissant des experts du secteur pour explorer si l’intégration approfondie de l’IA dans les flux de travail de trading marque le véritable point de départ du prochain cycle Web3. La discussion examinera A

GateNewsIl y a 1h

Mac Studio : tests en conditions réelles de modèles à grande échelle : attente pour M3 Ultra, solutions en cluster et M5 Ultra

En avril 2026, des modèles de niveau 1 兆 paramètre, tels que DeepSeek V4 Pro, Kimi K2.6, etc., ont été publiés les uns après les autres, rendant l’idée de « faire tourner un LLM open-source de pointe sur sa propre machine » une option viable. Pour les ingénieurs et les petites équipes qui ne veulent pas construire une station de travail H100, mais qui souhaitent disposer de capacités complètes d’inférence locale, \\Mac Studio M3 Ultra 256GB\\ est, à ce stade, la solution mono-machine la plus rentable, avec, en complément, un cluster via Thunderbolt 5 permettant d’aller jusqu’à des domaines de 1T paramètres. Cet article regroupe des données d’expérimentation sur l’exécution de modèles à grande échelle avec le M3 Ultra, des solutions de cluster, les avantages du framework MLX, ainsi que le calendrier prévu pour le M5 Ultra. État actuel des spécifications du M3 Ultra : mémoire unifiée de 256GB, 819

ChainNewsAbmediaIl y a 1h

Musk poursuit OpenAI, Microsoft pour un changement de mission à but non lucratif

La sélection du jury doit commencer dans le cadre du procès de 2024 intenté par Elon Musk contre OpenAI, Sam Altman, Greg Brockman et Microsoft, les accusant d’avoir trahi la mission à but non lucratif d’OpenAI en créant une entité à but lucratif en 2019, selon Reuters. Musk réclame $150 billion de dollars US de dommages et intérêts pour OpenAI's

CryptoFrontierIl y a 1h

L’action d’Intel bondit de 110 % alors que la transition vers l’IA remodèle l’industrie technologique

Message de Gate News, 27 avril — L’action d’Intel a grimpé de 110 % cette année et a atteint un nouveau record historique vendredi, marquant un tournant important pour le fabricant de puces, 25 ans après son précédent sommet. La reprise reflète un basculement plus large du secteur technologique, où la transition vers l’IA est

GateNewsIl y a 1h

Ant Group lance Ling-2.6-1T : modèle à billion de paramètres optimisé pour l’exécution des tâches avec une efficacité élevée en jetons

Message de Gate News, 27 avril — Ant Group's inclusionAI a publié Ling-2.6-1T, un nouveau modèle phare d’instruction de l’ordre du billion de paramètres dans la série Ling. Contrairement aux modèles de raisonnement à longue chaîne, Ling-2.6-1T utilise un mécanisme « Fast-Thinking » conçu pour exécuter les tâches avec précision en consommant un nombre minimal de jetons

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire