Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须更改模型 ID 和参数设置

鏈新聞abmedia

根据 Anthropic 官方模型退役文件,Claude Haiku 3(模型 ID:claude-3-haiku-20240307)已于 2026 年 4 月 19 日正式停止服务。此日期之后,所有对该模型的 API 请求将直接回报错误,Anthropic 不会自动将流量导向新版本,开发者必须主动更新程序代码中的模型 ID 至 Haiku 4.5。这是本年度第一个大型 Claude 模型的生命周期终止事件。

影响范围以轻量应用为主

Claude Haiku 3 于 2024 年 3 月推出,是 Anthropic 当时最便宜、最快的模型,广泛用于客服 bot、摘要、分类、内容审核等高频但轻量的任务。两年后的今日,不少中小型 SaaS 与内部工具仍在使用此模型,理由是 prompt 与成本已深度调教、替换需重跑 QA。本次退役预告期自 2 月起已开始,Anthropic 通过官方通知、email、dashboard 警告对所有企业合约客户发出至少 60 天事前通知。

迁移至 Haiku 4.5 的两项破坏性变更

官方建议的替代方案为 Claude Haiku 4.5,但迁移并非仅修改字符串即可。开发者需留意两项破坏性变更:一是 temperature 与 top_p 两个采样参数现在仅允许择一设置,若既有代码两者都有明确数值,Anthropic 的 API 将回报错误;二是 Haiku 4.5 新增 refusal stop reason,当模型拒绝回应时会回传此标记,而非像 Haiku 3 一样直接 error 或回复 placeholder — 产品代码必须将 refusal 当成正常路径处理。

此外,上周 Opus 4.7 tokenizer 变更造成账单暗涨的争议,同样可能套用在 Haiku 4.5 上 — 即使 rate card 标示更低的 per-token 价格,实际业务任务的 token 消耗可能因 tokenizer 不同而异,建议所有迁移计划在切换当日实测对比成本。

AI 模型生命周期管理成为企业必修课

本次退役提醒企业 AI 基础设施的一个结构性变化:LLM 已从“一次性采购”进入“持续版本管理”的阶段,类似云端服务与作业系统。Anthropic 官方 deprecation 页面同时预告 Claude Opus 4、Sonnet 4 将于 2026 年 6 月 15 日退役,时程密集。企业 AI 采购条款应加入“最低支援期”、“替代模型自动可用”、“迁移测试补贴”等合约项目,否则生产服务可能因模型下架而中断。

对台湾开发者与 SaaS 团队的行动建议

三个立即动作:第一,搜索所有代码仓库与设定文件,把 claude-3-haiku-20240307 改成 claude-haiku-4-5;第二,检查 API 调用中是否同时设置 temperature 与 top_p,择一保留;第三,在 handler 中新增 refusal stop reason 的处理分支,避免意外的 user-facing error。对 使用按量计费企业合约的组织而言,切换当周监控 token 消耗变化也是必要动作,避免 tokenizer 差异带来意外超支。

这篇文章 Claude Haiku 3 于 4/19 正式退役:Anthropic 强制迁移至 Haiku 4.5,开发者须改模型 ID 与参数设置 最早出现于 鏈新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Google DeepMind 高管:每家 AI 产品公司都应构建定制基准

Gate News 消息,4月27日——Google DeepMind 的资深产品经理、Google AI Studio 的产品负责人 Logan Kilpatrick 在 X 上表示,所有构建基于 AI 的产品的公司都应当建立各自的定制基准,用于衡量 AI 模型的性能。他将其描述为一种方法:让模型改进“对贵公司产生不成比例的收益”,并敦促创始人和商业领袖“从明天开始。”

GateNews34 分钟前

联发科拿下 Google 第八代 TPU 大单!ASIC 发酵带动三档概念股受惠

联发科已切入 Google 第8代 TPU 训练晶片供应链,负责 I/O Die 设计,并采用台积电 N3P 与 CoWoS-S 封装,显示其已攀升至高阶 AI ASIC 设计水准。预计今年 ASIC 营收突破 10 亿美元,TPU 出货量至 2027 年有望达千万颗;京元电子、精测、鸿劲等台湾供应链也将受惠,市场逐步转向分工合作与 chiplet、异质整合的未来。

鏈新聞abmedia50 分钟前

Singtel 的 RE:AI 与 Mistral AI 合作开发新加坡的 AI 基础设施

Gate News 消息,4 月 27 日——新加坡电信集团(Singtel Group)宣布,其总部位于新加坡的数字基础设施业务部门 RE:AI 与 Mistral AI 建立合作伙伴关系,以支持新加坡各行业的 AI 能力。 该合作将重点放在共同开发 AI 基础设施和解决方案,为金融服务、医疗保健和政府部门服务,结合 RE:AI 的云能力与 Mistral AI 的开源模型。两家公司计划设立应用型 AI 卓越中心(Applied AI Centre of Excellence),以开发并测试企业用例,包括客户服务和网络运营方面的应用。 RE:AI 作为主权 AI 云平台运作,旨在将数据留在新加坡本地,依托 NVIDIA GB200 NVL72 芯片。Singtel 已经部署了一款名为 Shirley 的 AI 客户服务助理,能够理解包括 Singlish 在内的本地表达。Shirley 在投入运营的前六周内,处理了超过 70,000 个客户案例。

GateNews1小时前

何怡的 YZi Labs 投资中国 AI 大型语言模型公司

Gate News 消息,4 月 27 日——何怡与币安创始人赵长鹏(Changpeng Zhao)的家族办公室 YZi Labs 一起,投资了一家中国人工智能大型语言模型公司,她在香港 Web3 嘉年华的一场私密 KOL 聚会上披露了这一消息。她未披露被投资公司的具体名称。

GateNews1小时前

OpenAI 与联发科和高通合作开发 AI 手机处理器,富士康连接器将于 2028 年开始量产

Gate News 信息,4 月 27 日——据天风国际证券分析师 明-志·郭(Ming-Chi Kuo)的供应链分析,OpenAI 正与联发科和高通合作,开发手机处理器。富士康连接器 (立讯精密) 将担任独家系统设计与

GateNews1小时前

香港上市的 MiniMax-W 跌超 14%,Zhipu 在 DeepSeek 模型发布时跌超 6%

Gate News 消息,4 月 27 日——香港上市的 MiniMax-W 日内下跌超 14%,而 Zhipu 在同一时段内下跌超 6%。 跌势缘于 DeepSeek 于周五发布新模型,并宣布在周六推出限时促销活动

GateNews1小时前
评论
0/400
暂无评论