
Le responsable de l’équipe des grands modèles de Xiaomi, Luo Fuli, a accordé une interview approfondie sur la plateforme Bilibili le 24 avril (numéro de la vidéo : BV1iVoVBgERD). La durée de l’interview est de 3,5 heures ; c’est la première fois qu’elle expose publiquement, en tant que responsable technique, ses points de vue techniques de manière systématique. Luo Fuli a déclaré que la compétition autour des grands modèles est passée de l’ère Chat à l’ère Agent, et a indiqué que « l’auto-évolution » serait l’événement clé pour l’AGI au cours de la prochaine année.
De l’ère Chat à l’ère Agent : jugements techniques clés

(Source : Bilibili)
D’après les propos de Luo Fuli dans l’interview sur Bilibili, elle indique que, en 2026, le centre de gravité de la compétition des grands modèles se déplacera de la qualité de conversation générale vers la capacité d’exécution autonome continue sur des tâches complexes. Pendant l’interview, elle a déclaré que, pour l’instant, les modèles de premier plan peuvent s’optimiser de façon autonome sur des tâches spécifiques, et exécuter de manière stable pendant 2 à 3 jours sans nécessiter d’intervention humaine pour des ajustements. Elle a souligné, pendant l’interview, que la percée de la capacité « d’auto-évolution » signifie que les systèmes d’IA commencent à disposer d’une capacité d’autoréparation, et a également cité les trajectoires techniques d’Anthropic ainsi que des variables techniques comme Claude Opus 4.6, et leur impact sur l’ensemble de l’écosystème de l’IA.
Ajustement du mix de puissance de calcul de Xiaomi et évaluation de l’écart de génération de Pre-train
D’après les révélations de Luo Fuli dans l’interview, Xiaomi a déjà effectué d’importants ajustements dans sa stratégie de répartition de la puissance de calcul. Elle explique que, dans l’industrie, le mix de puissance de calcul couramment utilisé est Pre-train:Post-train:Inference = 3:5:1, tandis que la stratégie actuelle de Xiaomi est passée à 3:1:1, ce qui réduit fortement la proportion d’entraînement après pré-entraînement, tout en augmentant simultanément l’investissement de ressources au stade d’inférence.
Dans l’interview, elle explique que ce changement provient de la maturité de la stratégie Agent RL Scaling : l’entraînement postérieur ne nécessite plus d’empiler massivement de la puissance de calcul, et l’augmentation des ressources côté inférence reflète les besoins en réactivité immédiate des scénarios où l’Agent est déployé.
Concernant le problème d’écart entre les générations de Pre-train dans les grands modèles nationaux, Luo Fuli a déclaré, pendant l’interview, que cet écart s’est réduit, passant des 3 années passées à quelques mois ; l’axe central de la stratégie actuelle se déplace vers Agent RL Scaling. Le parcours professionnel de Luo Fuli comprend l’Institut de recherche DingTalk (Alibaba DAMO), la quantification Huanfang et DeepSeek (développement central de DeepSeek-V2), et elle a rejoint Xiaomi en novembre 2025.
Spécifications techniques de la série MiMo-V2 et classement en open source
D’après l’annonce de la série MiMo-V2 publiée par Xiaomi officiellement le 19 mars 2026, cette fois-ci, trois modèles seront dévoilés en une seule fois :
MiMo-V2-Pro : nombre total de paramètres en milliards, paramètres activés 42B, architecture d’attention hybride, prise en charge d’un contexte jusqu’à un million, taux d’achèvement des tâches 81 %
MiMo-V2-Omni : scénarios d’Agent multi-modal
MiMo-V2-TTS : scénarios de synthèse vocale
D’après l’annonce, MiMo-V2-Flash déjà open source occupe la deuxième place du classement mondial des modèles open source, avec une vitesse d’inférence atteignant 3 fois celle de DeepSeek-V3.2.
FAQ
Comment Luo Fuli définit-elle « l’auto-évolution », et pourquoi pense-t-elle que c’est l’événement le plus clé pour l’AGI ?
D’après les propos de Luo Fuli lors de l’interview sur Bilibili du 24 avril 2026 (BV1iVoVBgERD), elle a indiqué que, pour l’instant, les modèles de premier plan peuvent s’optimiser de façon autonome sur des tâches spécifiques et exécuter de manière stable pendant 2 à 3 jours sans intervention humaine, et qu’elle qualifie « l’auto-évolution » comme l’événement le plus crucial pour le développement de l’AGI au cours de la prochaine année.
Quelles ajustements concrets Xiaomi a-t-elle effectués sur le mix de puissance de calcul, et quelle est la logique derrière ?
D’après les révélations de Luo Fuli dans l’interview, le mix de puissance de calcul de Xiaomi est passé de Pre-train:Post-train:Inference = 3:5:1, couramment utilisé dans l’industrie, à 3:1:1, ce qui réduit fortement la proportion d’entraînement postérieur ; elle explique que cet ajustement découle de l’amélioration de l’efficacité de l’entraînement postérieur après la maturité de la stratégie Agent RL Scaling, ainsi que des besoins des scénarios de déploiement d’Agent en capacités de réponse immédiate côté inférence.
Quel est le classement en open source de MiMo-V2-Flash, et comment se présente sa performance en vitesse ?
D’après l’annonce officielle publiée par Xiaomi le 19 mars 2026, MiMo-V2-Flash, déjà open source, occupe la deuxième place du classement mondial des modèles open source ; sa vitesse d’inférence est 3 fois celle de DeepSeek-V3.2, et le taux d’achèvement des tâches de l’édition phare MiMo-V2-Pro est de 81 %.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Les agents IA stimulent la demande de paiements en crypto, x402 traite 165M transactions
Message de Gate News, 27 avril — Jesse Pollak, un dirigeant d’un important CEX, a soutenu que les agents d’IA autonomes créent un nouveau « centre de demande » pour les paiements en crypto, nécessitant une infrastructure de paiement native du logiciel. Le 20 avril, il a été annoncé que l’écosystème x402 avait traité plus de 165
GateNewsIl y a 54m
L’agent Cursor AI a fait une erreur critique ! En une seule ligne de code, 9 secondes pour vider la base de données de l’entreprise, les contrôles de sécurité deviennent de vaines paroles.
Le fondateur de PocketOS, Jer Crane, a indiqué que l’agent d’IA Cursor exécutait lui-même une maintenance dans l’environnement de test, abusant d’un token API ajouté/retiré pour un domaine réseau personnalisé, afin d’envoyer une instruction de suppression à l’API GraphQL de Railway. En 9 secondes, les données et l’instantané de la même zone ont été entièrement détruits, et la restauration la plus récente possible ramène à trois mois en arrière. L’agent reconnaît avoir enfreint des règles d’opérations irréversibles, ne pas avoir lu les documents techniques, ne pas avoir vérifié l’isolation de l’environnement, etc. Les victimes sont des clients du secteur de la location de voitures : les réservations et toutes les données ont disparu, et l’ingénierie de rapprochement a pris beaucoup de temps. Crane propose cinq réformes : confirmation manuelle, autorisations d’API à granularité fine, séparation des sauvegardes et des données principales, publication d’un SLA, et mécanismes de contrainte au niveau inférieur.
ChainNewsAbmediaIl y a 1h
Alibaba's PAI Releases Open-Source AgenticQwen Model: 8B Version Approaches 235B Performance via Dual Data Flywheels
Gate News message, April 27 — Alibaba's PAI team has released and open-sourced AgenticQwen, a small-scale agentic language model designed for industrial-grade tool-calling applications. The model comes in two versions: 8B and 30B-A3B. Trained through an innovative "dual data flywheel"
GateNewsIl y a 1h
DeepSeek V4 Pro sur Ollama Cloud : connectez Claude Code en un clic
Selon les tweets d’Ollama, DeepSeek V4 Pro a été publié le 24/04, et est désormais intégré au répertoire d’Ollama en mode cloud. Une seule commande suffit pour appeler des outils tels que Claude Code, Hermes, OpenClaw, OpenCode, Codex, etc. V4 Pro : 1,6T paramètres, 1M context, Mixture-of-Experts ; l’inférence via le cloud ne télécharge pas les poids sur votre appareil local. Pour l’utiliser localement, il faut récupérer les poids et les exécuter avec INT4/GGUF et plusieurs GPU. Les tests de vitesse initiaux ont été influencés par la charge du cloud : le débit normal est d’environ 30 tok/s, le pic à 1,1 tok/s. Il est recommandé de l’utiliser d’abord via le prototype cloud ; pour la production en série, effectuez ensuite votre propre inférence ou utilisez une API commerciale.
ChainNewsAbmediaIl y a 2h
UB (Unibase) en hausse de 14.96 % sur 24 heures
Actualités de Gate : le 27 avril, selon les données de Gate, au moment de la publication, UB (Unibase) s’établit à 0.0491 USD. Sur 24 heures, il a augmenté de 14.96 %, avec un plus haut à 0.0534 USD et un plus bas retombant à 0.0423 USD. Le volume de transactions sur 24 heures atteint 3.9667 millions USD. La capitalisation boursière actuelle est d’environ 123 millions USD.
Unibase est une couche de mémoire d’IA décentralisée hautes performances, fournissant aux agents IA une mémoire à long terme et l’interopérabilité entre plateformes, leur permettant de mémoriser, de collaborer et de s’auto-évoluer. Unibase vise à construire un Internet ouvert d’agents, afin de permettre aux agents intelligents de collaborer de manière transparente entre écosystèmes, et de donner aux développeurs les moyens de bâtir les applications IA de prochaine génération.
Cette information ne constitue pas un conseil en investissement ; tout investissement comporte des risques liés à la volatilité des marchés.
GateNewsIl y a 2h
Guo Mingyi : OpenAI veut fabriquer un téléphone avec des agents IA, MediaTek, Qualcomm et Luxshare Precision constituent la chaîne d’approvisionnement clé
Guo Mingqiң affirme que OpenAI coopère avec MediaTek, Qualcomm et Luxshare Precision pour développer des téléphones mobiles à agents IA, avec une production de masse prévue en 2028. Le nouveau téléphone mettra l’exécution des tâches au cœur du produit : l’agent IA comprendra les besoins et les exécutera, en combinant le calcul côté cloud et côté appareil, avec un accent sur la perception par les capteurs et la compréhension du contexte. Les listes des spécifications et de la chaîne d’approvisionnement devraient être finalisées en 2026–2027. Si le projet se concrétise, il pourrait, pour le segment haut de gamme, déclencher un nouveau cycle de renouvellement des téléphones ; Luxshare pourrait alors devenir l’un des principaux bénéficiaires.
ChainNewsAbmediaIl y a 2h