
Tim Xiaomi 大 model tim baş负责人 罗福莉 於 4 月 24 日在嗶哩嗶哩平台接受深度訪談(影片號:BV1iVoVBgERD),訪談時長 3.5 小時,為其首次以技術負責人身份公開系統性闡述技術觀點。羅福莉稱,大模型競爭賽道已從 Chat 時代轉入 Agent 時代,並指出「自進化」將是未來一年 AGI 關鍵事件。

(Sumber:嗶哩嗶哩)
Berdasarkan pernyataan Luo Fuli dalam wawancara Bilibili, ia menyebutkan bahwa pada tahun 2026, fokus persaingan model besar akan bergeser dari kualitas percakapan umum ke kemampuan eksekusi otonom yang berkelanjutan dalam tugas-tugas yang kompleks. Dalam wawancara tersebut, ia mengatakan bahwa saat ini model-model teratas telah mampu melakukan optimasi secara mandiri dalam tugas tertentu, dan terus menjalankan tugas dengan stabil selama 2 hingga 3 hari tanpa perlu intervensi manusia. Dalam wawancara itu, ia menekankan bahwa terobosan kemampuan “self-evolve” menandakan sistem AI mulai memiliki kemampuan koreksi diri, serta menyebutkan bahwa jalur teknis Anthropic dan variabel teknis seperti Claude Opus 4.6 akan berdampak pada ekosistem AI secara keseluruhan.
Berdasarkan pengungkapan Luo Fuli dalam wawancara, Xiaomi telah melakukan penyesuaian besar pada strategi alokasi daya hitung. Ia menjelaskan bahwa perbandingan daya hitung yang lazim digunakan di industri adalah Pre-train:Post-train:Inference = 3:5:1, sedangkan strategi Xiaomi saat ini telah disesuaikan menjadi 3:1:1, yang secara signifikan memangkas proporsi pelatihan pasca, sekaligus meningkatkan alokasi sumber daya pada tahap inferensi.
Dalam wawancara tersebut, ia menjelaskan bahwa perubahan ini berasal dari kematangan strategi Agent RL Scaling, sehingga post-training tidak lagi memerlukan penumpukan daya hitung yang besar, dan peningkatan sumber daya pada sisi inferensi mencerminkan kebutuhan skenario penerapan Agent terhadap kemampuan respons secara real-time.
Terkait masalah kesenjangan generasi (generation gap) Pre-train untuk model besar di dalam negeri, Luo Fuli dalam wawancara menyatakan bahwa kesenjangan ini telah dipersingkat dari 3 tahun di masa lalu menjadi beberapa bulan; sementara fokus strategi saat ini bergerak ke arah Agent RL Scaling. Riwayat karier Luo Fuli meliputi Akademi DAMO Alibaba, Quant Huanfang, dan DeepSeek (developer inti DeepSeek-V2), dan pada November 2025 ia bergabung dengan Xiaomi.
Berdasarkan pengumuman resmi Xiaomi pada 19 Maret 2026 mengenai seri MiMo-V2, kali ini sekaligus merilis tiga model:
MiMo-V2-Pro:Total parameter sekian, mengaktifkan parameter 42B, arsitektur perhatian campuran, dukungan konteks hingga jutaan, tingkat penyelesaian tugas 81%
MiMo-V2-Omni:Skenario Agent multimodal
MiMo-V2-TTS:Skenario sintesis suara
Berdasarkan pengumuman tersebut, MiMo-V2-Flash yang sudah dibuka sumbernya berada di peringkat kedua dalam daftar model open-source global, dengan kecepatan inferensi mencapai 3 kali DeepSeek-V3.2.
Berdasarkan pernyataan wawancara Luo Fuli pada 24 April 2026 di Bilibili (BV1iVoVBgERD), ia menyebutkan bahwa saat ini model-model teratas sudah mampu melakukan optimasi mandiri dalam tugas tertentu dan menjalankan tugas dengan stabil selama 2 hingga 3 hari tanpa perlu intervensi manusia, serta mengkategorikan “self-evolve” sebagai peristiwa paling kunci dalam perkembangan AGI sepanjang tahun depan.
Berdasarkan pengungkapan Luo Fuli dalam wawancara, rasio daya hitung Xiaomi telah disesuaikan dari Pre-train:Post-train:Inference = 3:5:1 yang lazim digunakan industri menjadi 3:1:1, sehingga proporsi post-training secara besar dipangkas; ia menjelaskan bahwa penyesuaian ini terjadi karena setelah strategi Agent RL Scaling menjadi matang, efisiensi post-training meningkat, serta karena kebutuhan skenario penerapan Agent terhadap kemampuan respons real-time di sisi inferensi.
Berdasarkan pengumuman resmi Xiaomi pada 19 Maret 2026, MiMo-V2-Flash yang sudah dibuka sumbernya berada di peringkat kedua dalam daftar model open-source global, dengan kecepatan inferensi 3 kali DeepSeek-V3.2, dan tingkat penyelesaian tugas versi flagship MiMo-V2-Pro adalah 81%.
Artikel Terkait
OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution
CEX Utama Meluncurkan Smart Money Signal Suite dengan Data 1.000+ Trader
B.AI Meningkatkan Infrastruktur, Meluncurkan Fitur Keahlian Utama
Agen AI Mendorong Permintaan Pembayaran Kripto, x402 Memproses 165 Juta Transaksi
Agen Cursor AI mengalami kegagalan! Satu baris kode menghapus database perusahaan dalam 9 detik, pengamanan yang aman berubah menjadi omong kosong
Alibaba Meluncurkan Model AgenticQwen Open-Source: Versi 8B Mendekati Kinerja 235B melalui Dual Data Flywheels