Khi mà các doanh nghiệp cố gắng lấy câu “dùng AI để thay thế nhân lực nhằm giảm chi phí” làm bàn tính, thì Anthropic lại thay đổi luật chơi. Gã khổng lồ AI này gần đây đã cập nhật cấu trúc tính phí của phiên bản doanh nghiệp Claude, tách lượng sử dụng Claude, Claude Code và Cowork khỏi khoản phí thuê bao 40 USD/tháng, chuyển sang tính phí riêng theo số lượng Token thực tế tiêu thụ. Giờ đây, có vẻ như chi phí của “nhân viên AI” không hề rẻ như những gì người ta vẫn nói.

(Dùng văn ngôn và hội thoại AI có tiết kiệm Token không? Một ảnh chụp màn hình đã khơi nổ tranh luận; kỹ sư: thực ra dùng tiếng Anh mới là thượng sách)

Chấm dứt thời đại giá cố định, phiên bản doanh nghiệp Claude đổi cách tính phí: dùng bao nhiêu trả bấy nhiêu

Báo The Information cho biết, trong tài liệu giới thiệu doanh nghiệp mà Anthropic cập nhật có viết: “Phí chỗ ngồi hàng tháng (seats) chỉ bao gồm quyền truy cập nền tảng, không bao gồm bất kỳ lượng sử dụng nào; mọi mức sử dụng đều được tính phí riêng theo mức giá API tiêu chuẩn.” Trước đây doanh nghiệp mua “thả sức dùng”, thì nay chuyển sang “theo lượt tính”.

Theo phương án cũ, chi phí thuê bao hàng tháng cho mỗi tài khoản doanh nghiệp khoảng 40 đến 200 USD, kèm theo chiết khấu API từ 10% đến 15%. Dù phương án mới hạ mức phí thuê bao xuống 20 USD/tháng, nhưng đồng thời loại bỏ mọi chiết khấu API và yêu cầu doanh nghiệp cam kết trước cũng như thanh toán trước lượng Token dự ước sử dụng mỗi tháng. Dù dùng nhiều hay ít thực tế, số tiền cam kết vẫn phải trả nguyên, và cam kết càng cao cũng không được đổi lấy đơn giá thấp hơn.

Cấu trúc này đối với Anthropic là doanh thu thường xuyên có thể dự đoán hằng năm; còn đối với doanh nghiệp thì là sự chuyển giao chi phí theo mức sử dụng và rủi ro.

“Thiếu hụt tài nguyên tính toán” mới là ngòi nổ thật sự cho việc điều chỉnh giá

Anthropic gọi lần điều chỉnh này là “tối ưu hóa sản phẩm”, nhưng động lực đằng sau là chi phí tính toán cao ngất. Dù doanh thu năm hóa của Anthropic chỉ trong vỏn vẹn bốn tháng đã tăng từ 9 tỷ USD lên 30 tỷ USD, thì thứ mà người dùng nhận được không phải là giảm giá, mà là sự tái cấu trúc mô hình doanh thu.

Điểm cốt lõi nằm ở cách tiêu hao của đại lý AI (AI Agent). Việc chat thông thường tiêu thụ theo kiểu “uống từng ngụm nhỏ”, nhưng các tác vụ có nhiều bước, ghép nối lặp lại, thậm chí các luồng công việc phối hợp giữa nhiều đại lý, lại là kiểu “uống ừng ực thả ga”.

Ở phía cung cũng đang căng thẳng. Giá thuê GPU Blackwell tăng 48% trong vòng hai tháng; CoreWeave tăng giá hơn 20% từ cuối năm trước; và một dự báo của ngân hàng Mỹ cho rằng nhu cầu năng lực tính toán sẽ tiếp tục co hẹp cho đến năm 2029. Khoản doanh thu do giá cố định mang lại đối với Anthropic đã sớm không còn chịu nổi gánh nặng.

Dịch vụ không ổn định mới là “đèn cảnh báo” thật sự đối với khách hàng doanh nghiệp

Ngoài ra, tính ổn định của dịch vụ cũng là một vấn đề lớn. Sáng lập viên Retool, David Hsu, cho biết trên báo The Wall Street Journal rằng dù Claude Opus 4.6 hoạt động tốt hơn OpenAI, cuối cùng ông vẫn chuyển quy trình làm việc sang bên sau. Lý do là dịch vụ Claude thường xuyên bị gián đoạn khiến ông nhiều lần không thể bàn giao mã đúng tiến độ.

Trong 90 ngày tính đến ngày 8 tháng 4 năm nay, thời gian hoạt động bình thường của Anthropic API chỉ đạt 98,95%, thấp xa so với chuẩn 99,99% của ngành. Hành động của Hsu cho thấy một điều: khi lựa chọn giữa độ tin cậy dịch vụ và năng lực mô hình, doanh nghiệp cần AI có độ ổn định cao.

Chi phí thật của “nhân viên AI” phức tạp hơn nhiều so với con số trên hóa đơn

Hiện nay, mô hình định giá AI dựa trên “phí thuê bao hằng tháng” của truyền thống đã qua đi; tổng chi phí sẽ được tính lại dựa trên mức Token sử dụng thực tế. Việc giành chiết khấu theo mức sử dụng hoặc điều khoản điều chỉnh linh hoạt trong hợp đồng, hoặc chủ động kiểm soát chi tiêu bằng cách tối ưu Prompt, xử lý theo lô và chiến lược bộ nhớ đệm (cache), đã trở thành bài toán mới đối với các doanh nghiệp đi theo hướng áp dụng và chuyển đổi sang AI.

Vài ngày trước, OpenAI cũng công bố chuyển Codex sang tính phí theo Token; GitHub ngày 10 tháng 4 đã siết lại giới hạn sử dụng Copilot; và Windsurf dùng hạn ngạch theo ngày thay cho cơ chế theo điểm. Toàn bộ ngành công nghiệp AI đồng loạt đang tuyên bố chấm dứt thời đại giá cố định.

Trước khi doanh nghiệp đánh giá “triển khai AI có thể tiết kiệm được bao nhiêu nhân lực”, có lẽ vẫn cần kiểm nghiệm liệu người dùng có thể tạo ra các tác phẩm ổn định và chất lượng cao trong một ngân sách bị giới hạn hay không.

Bài viết này về việc phiên bản doanh nghiệp Anthropic Claude tiên phong chuyển sang tính phí theo mức sử dụng, liệu nhân viên AI có thực sự tiết kiệm tiền hơn không? Xuất hiện sớm nhất trên 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI 推 GPT-5.5: 12M ngữ cảnh, chỉ số AA vươn lên dẫn đầu, Terminal-Bench 82,7% viết lại chuẩn mực cho đại lý

Tác nhân AI Tin tức ngành AI

OpenAI công bố GPT-5.5, tập trung vào công việc theo mô hình tác nhân (agent) và xử lý tri thức doanh nghiệp, đồng thời cũng được ra mắt trên ChatGPT và Codex. Các điểm chính bao gồm cửa sổ ngữ cảnh 1200 vạn token, AA Intelligence Index 60, dẫn đầu Claude Opus 4.7, Gemini 3.1 Pro; giá là 5 USD cho mỗi 1 triệu token đầu vào và 30 USD cho mỗi 1 triệu token đầu ra, token đầu ra giảm khoảng 40%, chi phí thực tế tăng khoảng 20%.

ChainNewsAbmedia6phút trước

Cluster Protocol huy động $5M để đẩy nhanh CodeXero, IDE AI chạy ngay trên trình duyệt bản địa cho EVM

Tin tức ngành AI Công cụ và ứng dụng AI

Tin tức của Gate, ngày 23 tháng 4 — Cluster Protocol, một công ty deeptech AI và hạ tầng Web3, đã công bố rằng họ đã huy động được $5 triệu trong một vòng gọi vốn mới do DAO5 dẫn dắt, với sự tham gia của Paper Ventures, JPEG Trading và Mapleblock Capital, nâng tổng số vốn lên 7,75 triệu USD. Vốn sẽ

GateNews19phút trước

Nvidia Mở Rộng Quan Hệ Đối Tác AI Tại Vương Quốc Anh, Trung Quốc và Lĩnh Vực Ô Tô Trong Bối Cảnh Thách Thức Chuỗi Cung Ứng

Cổ phiếu Tin tức ngành AI

Bản tin Cổng, ngày 23 tháng 4 — Bất chấp sự cạnh tranh từ Google và những gián đoạn chuỗi cung ứng, Nvidia vẫn là gã chơi chủ đạo trong phần cứng AI. TD Cowen đã tái khẳng định khuyến nghị mua đối với Nvidia vào hôm thứ Năm, nêu lý do về sự dẫn đầu của công ty trong hiệu năng và độ rộng hệ sinh thái phần mềm. Sự tán đồng

GateNews20phút trước

Anthropic 自揭 Claude Code 三 Bug chồng chéo: Giảm cấp độ suy luận, quên bộ nhớ đệm, tác dụng ngược của lệnh 25 chữ

Tin tức ngành AI

Anthropic công bố Claude Code gặp ba sự cố chồng lặp: từ 3/4–4/7 sẽ hạ mức suy luận xuống medium, dẫn đến độ trễ phản hồi và cảm giác xử lý kém hơn; từ 3/26–4/10 lỗi dọn bộ nhớ đệm khiến các hội thoại dài bị quên; từ 4/16–4/20 thêm lệnh gọi công cụ “trong vòng 25 chữ”, sau đó được hoàn tác vào 4/20. Các thành phần bị ảnh hưởng gồm Claude Code, Agent SDK, Cowork; mô hình là Sonnet 4.6 và Opus 4.6/4.7; API không bị ảnh hưởng. Ngày 4/23 đặt lại hạn mức sử dụng và tăng cường đánh giá và kiểm tra hồi quy.

ChainNewsAbmedia1giờ trước

Nhà Trắng cáo buộc Trung Quốc đánh cắp mô hình AI “quy mô công nghiệp”

Tin tức ngành AI

Nhà Trắng đã cảnh báo vào ngày 23 tháng 4 năm 2026 rằng các thực thể nước ngoài, chủ yếu ở Trung Quốc, đang tiến hành các chiến dịch “quy mô công nghiệp” để sao chép các mô hình trí tuệ nhân tạo của Mỹ, theo một bản ghi nhớ của Michael Kratsios, Trợ lý cho

CryptoFrontier4giờ trước

OpenClaw 2026.4.22 Hợp nhất vòng đời plugin trên Codex và Pi Harness, giảm thời gian tải plugin lên đến 90%

pi network news Tác nhân AI Tin tức ngành AI

Tin tức Cổng, ngày 23 tháng 4 — OpenClaw, một nền tảng Tác nhân AI mã nguồn mở, đã phát hành phiên bản 2026.4.22 vào ngày 22 tháng 4, với thay đổi lớn nhất là việc đồng bộ vòng đời của bộ harness Codex và bộ harness Pi. Trước đây, các plugin hoạt động không nhất quán giữa hai luồng harness, với một số hook bị thiếu trong một số môi trường

GateNews5giờ trước

Bình luận

0/400

Không có bình luận