Mô hình nội địa thống trị bảng xếp hạng, lượng token gọi của OpenRouter tăng vọt, lập trình và trí tuệ nhân tạo trở thành điểm quyết định

Trong dịp Tết Nguyên Đán, việc sử dụng các mô hình lớn nội địa diễn ra vô cùng sôi động. Dữ liệu mới nhất từ OpenRouter hàng tuần cho thấy, tổng số token của top 10 mô hình trên nền tảng khoảng 8,7 nghìn tỷ, trong đó mô hình Trung Quốc chiếm 5,3 nghìn tỷ, tỷ lệ 61%.

Trong top 3 mô hình gọi token nhiều nhất trong tuần đều là các mô hình lớn nội địa, lần lượt là Minimax M2.5, Kimi K2.5, GLM-5, với mức gọi lần lượt tăng 197%, giảm 20%, tăng 158% so với tuần trước. Trong đó, MiniMax M2.5 dẫn đầu với 2,45 nghìn tỷ token, Kimi K2.5 theo sau với 1,21 nghìn tỷ, còn GLM 5 của Zhipu và DeepSeek V3.2 xếp thứ ba và thứ năm.

OpenRouter là nền tảng tổng hợp API mô hình lớn lớn nhất toàn cầu, cung cấp cho các nhà phát triển một API thống nhất để truy cập hàng trăm mô hình ngôn ngữ lớn trên toàn thế giới. Các chức năng chính gồm gọi nhiều mô hình cùng lúc, tối ưu định tuyến thông minh và bảng xếp hạng hiệu suất minh bạch, nhằm giải quyết vấn đề phức tạp trong tích hợp đa mô hình và hạn chế từ các nhà cung cấp.

Theo dữ liệu từ nền tảng này, lập trình (Coding) và trí tuệ nhân tạo (Agent) đang trở thành hai điểm cạnh tranh chính của các mô hình lớn.

Tổng lượng gọi token của OpenRouter gần đây tăng mạnh. Chính thức xác nhận, M2.5 đã thúc đẩy nhu cầu gọi tăng trong khoảng từ 100K đến 1 triệu token dài, đúng là phạm vi tiêu thụ điển hình của quy trình làm việc trí tuệ nhân tạo.

Về số lượng token gọi, trong top 3 mô hình lớn nội địa trên nền tảng này đều tập trung nâng cao khả năng lập trình và tự động hóa nhiệm vụ của trí tuệ nhân tạo (Agent), là bước đột phá quan trọng của các mô hình nội địa vào đầu năm 2026 về mặt ứng dụng.

稀宇科技 (MiniMax) ngày 13 tháng 2 đã ra mắt MiniMax M2.5, gọi đây là mô hình flagship sản xuất cấp độ dành riêng cho các kịch bản trí tuệ nhân tạo. Sau 7 ngày ra mắt, lượng gọi đã vượt 3,07 nghìn tỷ token, nhờ hiệu suất vượt trội trong lập trình và quy trình Agent cùng chi phí cực thấp, trở thành lựa chọn hàng đầu của các nhà phát triển.

Moonshot AI ngày 27 tháng 1 ra mắt KimiK2.5, mô hình này sử dụng kiến trúc đa chế độ nguyên bản, có thể điều phối tới 100 “bản sao Agent” làm việc song song, nâng cao hiệu quả các nhiệm vụ phức tạp từ 3 đến 10 lần. Mô hình này đứng đầu trong nhiều bảng xếp hạng nhỏ (như lập trình, gọi công cụ), lượng gọi vượt xa Gemini 3 và Claude. Theo báo cáo của Pengpai News, chưa đầy một tháng sau khi ra mắt, Kimi đã thu về hơn tổng doanh thu cả năm 2025 trong vòng 20 ngày, chủ yếu do số lượng người dùng trả phí toàn cầu và lượt gọi API tăng mạnh, trong đó số người dùng trả phí quốc tế tăng nhanh.

Zhipu ngày 12 tháng 2 ra mắt GLM-5, mô hình này mở rộng quy mô tham số hơn nữa, sử dụng cơ chế chú ý th sparse, là mô hình flagship dành riêng cho các hệ thống phức tạp và nhiệm vụ Agent dài hạn. Nhờ các ưu điểm như miễn phí, khung cảnh ngữ cảnh 200K, mô hình này sau khi ra mắt đã thu hút tốc độ tăng trưởng người dùng nhanh chóng. Zhipu đã thực hiện các biện pháp như hạn chế bán hàng, tăng giá cho kế hoạch Coding, và ngày cuối năm đã công bố tìm kiếm “đối tác tính toán” trên toàn mạng.

Khi các ứng dụng của mô hình AI ngày càng sâu rộng, người dùng chuyển từ câu hỏi đơn giản sang các quy trình làm việc phức tạp như tái cấu trúc mã, chỉnh sửa tệp, tạo tài liệu, cùng với phổ biến của chế độ trí tuệ nhân tạo, lượng token tiêu thụ hiện rõ xu hướng “lạm phát”.

Song song với việc nâng cao hiệu suất, các mô hình nội địa vẫn nổi bật về mặt chi phí hiệu quả. Ví dụ, so sánh MiniMax M2.5 và Zhipu GLM-5 với Claude Opus 4.6, chi phí của MiniMax M2.5 và GLM-5 đều là 0,3 USD/triệu token, trong khi Claude Opus 4.6 lên tới 5 USD/triệu token, gấp khoảng 16,7 lần; còn về phần xuất ra, MiniMax M2.5 có giá 1,1 USD/triệu token, GLM-5 là 2,55 USD, còn Claude Opus 4.6 là 25 USD, lần lượt gấp khoảng 22,7 và 9,8 lần so với MiniMax M2.5 và GLM-5.

Các mô hình nội địa này chưa thể phản ánh toàn diện lượng token gọi của các nhà cung cấp mô hình trong nước. Theo dữ liệu của Haitong International Securities, lượng token gọi trung bình hàng ngày của các mô hình lớn của Volcano Engine đã tăng từ 20 nghìn tỷ vào cuối 2024 lên 63 nghìn tỷ vào cuối 2025; khách hàng bên ngoài của Alibaba Cloud cũng gần đạt 5 nghìn tỷ token mỗi ngày vào năm 2025, mục tiêu năm 2026 là ít nhất 15-20 nghìn tỷ, còn các hoạt động nội bộ dự kiến tăng từ 16-17 nghìn tỷ lên 100 nghìn tỷ mỗi ngày. Nhìn chung toàn ngành, lượng token tiêu thụ trung bình hàng ngày của Trung Quốc đã từ 100 tỷ vào đầu 2024 vượt qua 30 nghìn tỷ vào giữa năm 2025, đến tháng 2 năm 2026, tổng lượng token tiêu thụ hàng ngày của các mô hình lớn chính đã đạt khoảng 180 nghìn tỷ.

Báo cáo mới nhất của Dongguan Securities cho biết, khi khả năng lập trình và trí tuệ nhân tạo của các mô hình nội địa nâng cao, lượng gọi sẽ tăng mạnh, các mô hình lớn nội địa trong lĩnh vực lập trình và trí tuệ nhân tạo có khả năng cạnh tranh với các mô hình hàng đầu toàn cầu, từ đó thúc đẩy nhanh hơn việc ứng dụng thực tế và tăng tốc tiêu thụ token.

Trước đó, Changjiang Securities đã nhận định rằng, khi các mô hình lập trình và đa chế độ ngày càng trưởng thành, các kịch bản ứng dụng phía dưới sẽ thực sự mở ra, mang lại nhu cầu token chất lượng cao lớn. Theo quy luật phát triển của ngành AI quốc tế, từ đầu tư vốn đến bùng nổ nhu cầu token thường có khoảng hai năm trì hoãn. Các tập đoàn lớn trong nước bắt đầu chu kỳ đầu tư AI muộn hơn khoảng một năm so với quốc tế, bắt đầu từ nửa cuối năm 2024. Do đó, doanh thu của các nhà cung cấp đám mây trong nước đã bắt đầu tăng trưởng, còn sự bùng nổ thực sự về số lượng token dự kiến sẽ diễn ra vào năm 2026.

(Nguồn: Tài Liên Xã)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.36KNgười nắm giữ:2
    0.07%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$2.35KNgười nắm giữ:2
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:1
    0.00%
  • Ghim