Ngày 4/5, Douyin, mô hình ngôn ngữ lớn cốt lõi của ByteDance, đã công bố việc triển khai các gói đăng ký trả phí bên cạnh gói miễn phí, theo đưa tin của 澎湃新闻 (The Paper). Động thái này có thể đánh dấu sự kết thúc của thời kỳ “miễn phí hoàn toàn” đối với các mô hình AI tại Trung Quốc và phản ánh nhu cầu ngày càng tăng đối với các năng lực cao cấp trong các tác vụ phức tạp.
Douyin sẽ cung cấp ba mức đăng ký, có tùy chọn thanh toán theo tháng và theo năm:
Cấu trúc giá được phát hiện trên trang AppStore của Douyin, trong đó có một tuyên bố dịch vụ nêu rõ các gói trả phí.
Nhóm chính thức của Douyin phản hồi The Paper, nêu: “Douyin sẽ tiếp tục cung cấp các dịch vụ miễn phí. Trên nền tảng các ưu đãi miễn phí, Douyin đang khám phá thêm các dịch vụ gia tăng để đáp ứng nhu cầu người dùng khác biệt. Chi tiết kế hoạch liên quan hiện đang trong giai đoạn thử nghiệm và sẽ được phát hành qua các kênh chính thức khi ra mắt chính thức.”
Theo các nguồn tin thân cận với Douyin, các tính năng trả phí sẽ tập trung vào các tác vụ phức tạp và kịch bản năng suất, bao gồm:
Khi năng lực mô hình được nâng cấp, Douyin giờ đây có thể xử lý những tác vụ phức tạp và giá trị cao ngày càng nhiều. Tuy nhiên, các tác vụ này đòi hỏi nhiều tài nguyên tính toán và thời gian suy luận hơn, khiến công ty đưa ra dịch vụ trả phí để đáp ứng nhu cầu, đồng thời vẫn duy trì quyền truy cập miễn phí cho nhu cầu hằng ngày của người dùng.
Tính đến tháng 3/2025, mô hình ngôn ngữ lớn của Douyin đạt 1,2 nghìn tỷ token trong sử dụng hằng ngày, tương đương mức tăng trưởng 1.000 lần kể từ khi ra mắt vào tháng 5/2024 và tăng gấp đôi so với ba tháng trước đó, theo Volcano Engine (đơn vị điện toán đám mây của ByteDance). Trên nền tảng Volcano Engine, số doanh nghiệp có lượng token tích lũy vượt 1 nghìn tỷ đã tăng từ 100 công ty vào cuối năm 2024 lên 140 công ty.
Phó chủ tịch Volcano Engine, Tan Dai, trước đó đã từng đề cập chiến lược định giá cho mô hình lớn, cho biết mức tăng giá phản ánh cải thiện năng lực: “Chênh lệch giá token về bản chất phản ánh chênh lệch về năng lực. Các mô hình thế hệ tiếp theo mạnh hơn; chi phí theo mỗi token sẽ tăng, nhưng giá trị kinh tế tạo ra cũng sẽ tăng tương ứng. Những đợt tăng giá do trí tuệ mô hình được cải thiện cuối cùng sẽ tạo ra giá trị lớn hơn cho khách hàng.”
Mô hình trả phí của Douyin đi theo các kịch bản đã được thiết lập trên cả thị trường quốc tế và trong nước. ChatGPT của OpenAI cung cấp quyền truy cập theo hạng (Free, Go, Plus, Business, Enterprise) với chênh lệch giá theo khu vực. Các đối thủ Anthropic và Grok cũng đã ra mắt phiên bản đăng ký trả phí.
Tại Trung Quốc, các mô hình hàng đầu như Zhipu và DeepSeek đã vận hành mô hình đăng ký trả phí. Tuy nhiên, chiến lược định giá khác nhau: Zhipu đã thực hiện ba lần tăng giá API chỉ trong riêng năm 2025. Vào ngày 12/2, Zhipu nâng giá GLM Coding Plan thêm 30% hoặc hơn, với lý do “nhu cầu thị trường duy trì mạnh mẽ và tăng trưởng nhanh về quy mô người dùng cũng như khối lượng cuộc gọi.” Ngày 16/3, Zhipu phát hành GLM-5-Turbo với mức tăng giá 20%, sau đó tăng thêm 10% vào ngày 8/4 với GLM-5.1.
Ngược lại, DeepSeek công bố cắt giảm giá đáng kể vào ngày 25/4, cung cấp mức giảm 75% trong thời gian giới hạn cho giá API V4-Pro. Ngày 26/4, DeepSeek tiếp tục giảm giá token đầu vào đã lưu trữ (cached) trên toàn bộ danh mục API xuống còn 1/10 so với giá gốc, với các ưu đãi cho model Pro kéo dài đến hết ngày 5/5/2026. Giá sau điều chỉnh: DeepSeek-V4-Flash ở mức 0,02 nhân dân tệ cho mỗi triệu token đầu vào đã lưu trữ và DeepSeek-V4-Pro ở mức 0,025 nhân dân tệ cho mỗi triệu token.
Những chiến lược định giá phân kỳ—Zhipu tăng giá, DeepSeek cắt giảm—phản ánh các đánh giá thị trường độc lập, không phải một xu hướng trên toàn ngành.