Model domestik mendominasi OpenRouter lonjakan besar dalam penggunaan token di baliknya, pemrograman dan agen cerdas menjadi titik penentu kemenangan

2026-02-24 02:32:20

Selama liburan Tahun Baru Imlek, penggunaan model besar domestik dapat dikatakan sangat berkembang pesat. Data mingguan terbaru dari OpenRouter menunjukkan bahwa total token dari sepuluh model teratas di platform ini sekitar 8,7 triliun, dengan model-model China mendominasi sebanyak 5,3 triliun, atau 61%.

Tiga model dengan volume token tertinggi minggu ini semuanya adalah model besar domestik, masing-masing Minimax M2.5, Kimi K2.5, GLM-5, dengan volume panggilan berturut-turut meningkat 197%, menurun 20%, dan meningkat 158% dibanding minggu lalu. Di antaranya, MiniMax M2.5 menduduki posisi teratas dengan 2,45 triliun token, diikuti Kimi K2.5 dengan 1,21 triliun, sementara GLM-5 dan DeepSeek V3.2 menempati posisi ketiga dan kelima.

OpenRouter adalah platform agregasi API model besar terbesar di dunia, yang menyediakan antarmuka API terpadu bagi pengembang untuk mengakses ratusan model bahasa besar di seluruh dunia. Fungsinya meliputi pemanggilan multi-model, optimisasi routing cerdas, dan papan peringkat kinerja yang transparan, bertujuan mengatasi kompleksitas integrasi multi-model dan pembatasan dari vendor.

Dari data yang disediakan platform ini, pengkodean (Coding) dan agen cerdas (Agent) kini menjadi dua fokus utama dalam kompetisi model besar.

Jumlah panggilan secara keseluruhan di OpenRouter baru-baru ini meningkat secara signifikan. Pihak resmi mengonfirmasi bahwa M2.5 mendorong kebutuhan panggilan tambahan untuk teks panjang antara 100K hingga 1 juta token, yang merupakan skenario konsumsi khas untuk alur kerja agen cerdas.

Dalam hal volume token panggilan, tiga model besar domestik teratas di platform ini semuanya fokus meningkatkan kemampuan pengkodean dan otomatisasi tugas agen (Agent), yang menjadi terobosan penting dalam aplikasi model besar domestik awal 2026.

稀宇科技（MiniMax） merilis MiniMax M2.5 pada 13 Februari, menyebut model ini sebagai model flagship tingkat produksi pertama di dunia yang dirancang secara asli untuk skenario agen cerdas. Setelah dirilis, dalam tujuh hari volume panggilannya sudah menembus 3,07 triliun token, berkat performa unggul dan biaya sangat rendah dalam alur kerja pengkodean dan agen, menjadikannya pilihan utama pengembang.

月之暗面（Moonshot AI） merilis KimiK2.5 pada 27 Januari, yang menggunakan arsitektur multimodal asli, mampu mengatur hingga 100 “Agent clone” secara paralel, meningkatkan efisiensi tugas kompleks 3 hingga 10 kali lipat. Model ini menempati posisi pertama di berbagai daftar niche (seperti pengkodean, panggilan alat), dengan volume panggilan jauh melampaui Gemini 3 dan Claude. Menurut laporan dari Pengpai News, kurang dari sebulan setelah peluncuran, pendapatan Kimi dalam 20 hari telah melebihi total pendapatan tahun 2025, didorong oleh lonjakan pengguna berbayar global dan volume panggilan API, termasuk pertumbuhan cepat pengguna berbayar luar negeri.

智谱 pada 12 Februari merilis GLM-5, yang parameter skalanya diperluas lagi dan menggunakan mekanisme perhatian jarang (sparse attention), dirancang khusus untuk sistem kompleks dan tugas agen jangka panjang. Dengan keunggulan seperti gratis dan jendela konteks 200K, model ini mengalami pertumbuhan pengguna yang pesat setelah peluncuran. Untuk Coding Plan,智谱 melakukan pembatasan penjualan dan kenaikan harga, serta mengumumkan pencarian “mitra komputasi” secara daring pada hari Tahun Baru Imlek.

Seiring pengembangan skenario aplikasi AI, pengguna beralih dari pertanyaan sederhana ke alur kerja yang kompleks, seperti merekonstruksi kode, mengubah file, menghasilkan dokumen, serta penyebaran mode agen, saat ini konsumsi token menunjukkan tren “inflasi” yang jelas.

Selain peningkatan performa, model domestik tetap unggul dari segi efisiensi biaya. Misalnya, dibanding Claude Opus 4.6, MiniMax M2.5 dan GLM-5 memiliki keunggulan biaya yang signifikan: pada tahap input, harga MiniMax M2.5 dan GLM-5 masing-masing 0,3 dolar AS per juta token, sedangkan Claude Opus 4.6 mencapai 5 dolar AS per juta token, sekitar 16,7 kali lipat lebih mahal; pada tahap output, harga MiniMax M2.5 adalah 1,1 dolar AS, GLM-5 2,55 dolar AS, dan Claude Opus 4.6 mencapai 25 dolar AS, masing-masing sekitar 22,7 kali dan 9,8 kali lipat lebih mahal dari MiniMax M2.5 dan GLM-5.

Model-model domestik tersebut tidak sepenuhnya mencerminkan volume panggilan token dari seluruh produsen model dalam negeri. Menurut Haitong International Securities, data menunjukkan bahwa panggilan token harian dari model besar Volcano Engine telah meningkat dari 20 triliun pada akhir 2024 menjadi 63 triliun pada akhir 2025; pelanggan eksternal Alibaba Cloud juga mendekati 5 triliun token per hari pada 2025, dengan target minimal 15-20 triliun pada 2026, dan panggilan internal diperkirakan meningkat dari 16-17 triliun menjadi 100 triliun per hari. Secara industri, total konsumsi token harian di China awal 2024 sekitar 100 miliar, menembus 30 triliun pada pertengahan 2025, dan pada Februari 2026, total konsumsi token harian dari model besar utama telah mencapai sekitar 180 triliun.

Laporan terbaru dari Dongguan Securities menyatakan bahwa dengan peningkatan kemampuan pengkodean dan agen dari model domestik, volume panggilan secara signifikan meningkat, dan model besar domestik di bidang pengkodean dan agen berpotensi mempercepat penerapan aplikasi dan mempercepat kenaikan konsumsi token.

Sebelumnya, Changjiang Securities menyatakan bahwa seiring kematangan model pengkodean dan multimodal, skenario aplikasi hilir diharapkan benar-benar terbuka, membawa permintaan token berkualitas tinggi dalam jumlah besar. Mengacu pada pola perkembangan industri AI di luar negeri, terdapat jeda sekitar dua tahun dari investasi modal hingga ledakan permintaan token. Siklus pengeluaran modal AI dari perusahaan besar domestik lebih lambat sekitar satu tahun dibandingkan luar negeri, dimulai pada paruh kedua 2024. Oleh karena itu, pendapatan penyedia cloud domestik mulai menunjukkan pertumbuhan, dan ledakan volume token diperkirakan akan terjadi pada 2026.

（Sumber: Caixin）

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.