Claude Haiku 3 chính thức ngừng hoạt động vào ngày 19/4: Anthropic buộc phải chuyển sang Haiku 4.5, nhà phát triển phải thay đổi ID mô hình và cấu hình tham số

ChainNewsAbmedia

Theo tài liệu chính thức về việc ngừng phát hành mô hình của Anthropic, Claude Haiku 3 (model ID: claude-3-haiku-20240307) đã chính thức ngừng cung cấp dịch vụ vào ngày 19/4/2026. Sau ngày này, mọi yêu cầu API tới mô hình đó sẽ trả về lỗi trực tiếp; Anthropic sẽ không tự động chuyển hướng lưu lượng sang phiên bản mới, và các nhà phát triển phải chủ động cập nhật model ID trong mã nguồn lên Haiku 4.5. Đây là sự kiện chấm dứt vòng đời đầu tiên của một mô hình Claude quy mô lớn trong năm nay.

Phạm vi ảnh hưởng chủ yếu nhắm vào các ứng dụng nhẹ

Claude Haiku 3 được ra mắt vào tháng 3/2024, là mô hình rẻ nhất và nhanh nhất của Anthropic thời điểm đó, được sử dụng rộng rãi cho các tác vụ tần suất cao nhưng nhẹ như bot chăm sóc khách hàng, tóm tắt, phân loại, kiểm duyệt nội dung. Đến hôm nay, sau hai năm, nhiều SaaS cỡ vừa và nhỏ và các công cụ nội bộ vẫn đang dùng mô hình này, vì prompt và chi phí đã được tinh chỉnh sâu; việc thay thế cần phải chạy lại QA. Thời gian thông báo ngừng dịch của đợt này đã bắt đầu từ tháng 2; Anthropic đã gửi ít nhất 60 ngày thông báo trước cho tất cả khách hàng theo hợp đồng doanh nghiệp thông qua thông báo chính thức, email và cảnh báo trên dashboard.

Hai thay đổi mang tính phá vỡ khi chuyển sang Haiku 4.5

Phương án thay thế mà phía chính thức khuyến nghị là Claude Haiku 4.5, nhưng việc di chuyển không chỉ là sửa một chuỗi ký tự. Nhà phát triển cần lưu ý hai thay đổi mang tính phá vỡ: một là hai tham số lấy mẫu temperature và top_p hiện chỉ cho phép chọn một trong hai; nếu mã nguồn hiện có đã đặt rõ ràng cả hai giá trị, API của Anthropic sẽ trả về lỗi; hai là Haiku 4.5 bổ sung refusal stop reason, khi mô hình từ chối phản hồi sẽ trả về dấu ấn này, thay vì như Haiku 3 trực tiếp báo error hoặc trả về placeholder — mã sản phẩm phải xử lý refusal như một nhánh đường đi bình thường.

Ngoài ra, tranh cãi về việc hóa đơn tăng ngầm do thay đổi tokenizer của Opus 4.7 tuần trước cũng có thể áp dụng cho Haiku 4.5 — dù rate card hiển thị giá per-token thấp hơn, mức tiêu thụ token cho các tác vụ nghiệp vụ thực tế có thể khác đi do tokenizer không giống nhau; khuyến nghị mọi kế hoạch di chuyển nên đo thực nghiệm đối chiếu chi phí vào đúng ngày chuyển đổi.

Quản lý vòng đời mô hình AI trở thành bài học bắt buộc đối với doanh nghiệp

Lời nhắc ngừng dịch lần này phản ánh một thay đổi mang tính cấu trúc trong hạ tầng AI doanh nghiệp: LLM đã chuyển từ giai đoạn “mua một lần” sang “quản lý phiên bản liên tục”, tương tự như dịch vụ đám mây và hệ điều hành. Trang deprecation chính thức của Anthropic cũng dự báo rằng Claude Opus 4 và Sonnet 4 sẽ ngừng vào ngày 15/6/2026, do đó tiến độ dày đặc. Các điều khoản mua AI của doanh nghiệp nên bổ sung các mục hợp đồng như “thời gian hỗ trợ tối thiểu”, “mô hình thay thế có sẵn tự động”, “hỗ trợ chi phí cho thử nghiệm di chuyển”, v.v.; nếu không, dịch vụ sản xuất có thể bị gián đoạn do mô hình bị loại bỏ.

Khuyến nghị hành động cho nhà phát triển Đài Loan và đội ngũ SaaS

Ba hành động ngay lập tức: thứ nhất, tìm kiếm tất cả kho mã và tệp cấu hình, thay claude-3-haiku-20240307 bằng claude-haiku-4-5; thứ hai, kiểm tra xem trong lệnh gọi API có đặt đồng thời temperature và top_p hay không, giữ lại chỉ một; thứ ba, trong handler bổ sung nhánh xử lý cho refusal stop reason, tránh lỗi ngoài ý muốn hiển thị cho người dùng (user-facing). Đối với các tổ chức có hợp đồng doanh nghiệp tính phí theo mức sử dụng, việc theo dõi biến động tiêu thụ token trong tuần chuyển đổi cũng là cần thiết, để tránh chi phí vượt dự kiến do khác biệt tokenizer.

Bài viết này: Claude Haiku 3 chính thức ngừng vào 4/19 — Anthropic buộc phải di chuyển sang Haiku 4.5, nhà phát triển cần thay model ID và thiết lập tham số. Xuất hiện sớm nhất tại 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

SoftBank Lên Kế Hoạch Nhà Máy Pin Trung Tâm Dữ Liệu AI Tại Osaka, Nhắm Mục Tiêu Sản Xuất Trong Năm Năm

Tin tức từ Gate News, ngày 24 tháng 4 — SoftBank Corp, đơn vị di động của Tập đoàn SoftBank Nhật Bản, dự kiến sẽ chuyển đổi một phần nhà máy tại Sakai, Osaka thành dây chuyền sản xuất pin quy mô lớn cho các trung tâm dữ liệu AI. CEO Junichi Miyakawa được kỳ vọng sẽ công bố dự án vào tháng 5 như một phần của kế hoạch 5 năm mới,

GateNews13phút trước

Dự án Prometheus của Jeff Bezos huy động $10B tại định giá $38B

Tin tức từ Gate News, ngày 24 tháng 4 — Dự án Prometheus, một phòng thí nghiệm AI do người sáng lập Amazon Jeff Bezos và cựu giám đốc điều hành Google Vik Bajaj thành lập, đã đóng một vòng gọi vốn $10 tỷ USD với định giá $38 tỷ USD. JPMorgan Chase và BlackRock là

GateNews43phút trước

Cổ phiếu liên quan đến AI hiện chiếm 45% vốn hóa thị trường S&P 500, thị trường tín dụng chịu áp lực

Tin tức Gate, 24 tháng 4 — Theo The Kobeissi Letter, cổ phiếu liên quan đến AI hiện chiếm 45% tổng vốn hóa thị trường của chỉ số vốn chủ sở hữu chuẩn của S&P 500 (chỉ số vốn chủ sở hữu chuẩn của Mỹ), đạt mức cao kỷ lục và tăng 20 điểm phần trăm kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022. Đồng thời, nợ đầu tư liên quan đến AI ở hạng đầu tư đã tăng lên 15,4% của thị trường tín dụng Mỹ, trở thành lĩnh vực lớn nhất. Điều này tương ứng với mức tăng 3,5 điểm phần trăm so với năm 2020, với tổng dư nợ liên quan gần như tăng gấp đôi lên 1,4 nghìn tỷ USD, mức cao nhất mọi thời đại.

GateNews43phút trước

OpenAI Ra Mắt GPT-5.5, Được Thiết Kế Cho Nhiệm Vụ Agent và Quy Trình Phức Tạp

Tin tức từ Gate, ngày 24 tháng 4 — OpenAI đã chính thức phát hành GPT-5.5, một mô hình AI thế hệ tiếp theo được thiết kế để xử lý các mục tiêu phức tạp, tích hợp công cụ, tự kiểm chứng và hoàn thành các tác vụ theo nhiều bước. Mô hình nổi bật trong việc viết mã và gỡ lỗi, nghiên cứu trực tuyến, phân tích dữ liệu, tạo tài liệu

GateNews58phút trước

Kết quả tài chính của Intel vượt kỳ vọng, nhu cầu AI thúc đẩy CPU đảo chiều, sau khi Chen Liwu tiếp quản, INTC đã tăng gấp 3 lần

Doanh thu theo quý của Intel đạt 13,6 tỷ USD, EPS 0,29; trong dự báo quý hai, giá trị trung bình là 14,3 tỷ USD, vượt xa kỳ vọng, biên lợi nhuận gộp 41%. Nhu cầu trung tâm dữ liệu AI thúc đẩy sự phục hồi của CPU, các máy chủ như Xeon được săn đón. Trần Lập Vũ dẫn dắt quá trình chuyển đổi, IFS quý đầu đạt 5,4 tỷ USD, tăng 16%, các khách hàng bên ngoài như Tesla quan tâm Terafab sử dụng công nghệ của Intel. Sau giờ giao dịch, giá cổ phiếu tăng khoảng 20%, lập kỷ lục cao nhất lịch sử, kể từ năm ngoái đã tăng gần 3 lần.

ChainNewsAbmedia1giờ trước

Cognition AI Huy động vốn với mức định giá $25B trong các cuộc đàm phán giai đoạn đầu

Tin tức từ Gate, ngày 24 tháng 4 — Cognition AI, một startup lập trình dựa trên AI, đang trong giai đoạn đàm phán ban đầu cho một vòng gọi vốn mới, dự kiến sẽ nâng định giá của công ty lên hơn gấp đôi lên $25 tỷ USD, theo các nguồn tin nắm được vấn đề. Công ty nhắm tới việc huy động hàng trăm triệu đô la hoặc hơn nữa khi nhu cầu đối với công nghệ AI tạo sinh trong phát triển phần mềm tiếp tục tăng.

GateNews2giờ trước
Bình luận
0/400
Không có bình luận