Anthropic 经济指数最新报告分析 2026 年 2 月 Claude 的使用情况,发现 Claude.ai 的使用场景持续多元化,平均任务薪资水平略有下降。本文源自 Anthropic 发布的研究报告,由动区动趋翻译、编辑。
(前情提要:Anthropic 上线 AI 冲击仪表板:输入职业,秒查你的工作被 AI 吃掉多少?)
(背景补充:CZ:美国加密交易费用太高了,迈向加密之都路上仍缺乏竞争)
本文目录
Toggle
Anthropic 经济指数运用我们的隐私保护资料分析系统,追踪 Claude 在整体经济中的使用情况。这是我们尽早理解 AI 经济冲击的努力之一,以便研究人员与政策制定者有充裕时间做好准备。
本期最新报告研究 2026 年 2 月的 Claude 使用情况,以我们前一份报告(采用 2025 年 11 月资料)所建立的经济基本框架为基础加以延伸。我们的样本涵盖 2 月 5 日至 2 月 12 日,距 Claude Opus 4.5 发布三个月后,并与 Claude Opus 4.6 的发布时间重叠。
我们首先记录使用情况较前份报告的变化:扩增型互动(即 AI 辅助用户能力的协作互动)的比例在 Claude.ai 和 API 流量中均略有上升。在 Claude.ai 方面,使用场景趋于多元,前 10 大任务占整体使用量的比例,低于 2025 年 11 月时的水平。由于这种多元化,Claude.ai 上平均对话所对应的任务薪资水平略低于前份报告。
接下来,我们聚焦于影响 Claude 对劳动市场及更广泛经济影响的一项重要因素:Claude 采用过程中的学习曲线。我们提供证据,显示高资历用户已发展出得以更有效运用 Claude 能力的使用习惯与策略。确实,我们的资料显示,更有经验的用户不仅会尝试更高价值的任务,在对话中也更可能获得成功的回应。
在第一章中,我们重新审视 2026 年 1 月发布的前一份经济指数报告的研究发现。我们得出以下结论:
经济指数的一项核心发现是:Claude 的早期采用极不均衡——在高收入国家使用更为密集,在美国境内则集中于知识工作者较多的地区,且仅涉及相对少数的专业任务与职业。
一个重要问题是,采用的不平等可能如何决定 AI 的收益流向何处、惠及何人。举例而言,若有效使用 AI 需要互补性技能与专业知识(这是我们在前份报告中所主张的论点),且此类技能可透过使用与实验加以习得,那么早期采用的收益可能会形成自我强化的循环。
在第二章中,我们探讨使用者如何塑造自身从 Claude 获取的价值:他们如何将模型能力与当前任务相匹配,以及使用模式与成效如何随平台使用经验的累积而改变。
我们通过将每次对话对应至美国劳工统计局职业信息网(O*NET)中的任务,来研究 Claude 所执行的任务类型。这一对应采用隐私保护方法论,使我们能够描述整体行为,而无需暴露个别对话记录。
我们从两个平台各抽取一百万次对话样本:Claude.ai(我们的消费者界面)以及第一方 API(我们的开发者平台)。
程序码撰写仍是我们平台上最常见的使用场景,与电脑及数学职业相关的任务占 Claude.ai 对话的 35%。
在 2025 年 11 月至 2026 年 2 月之间,Claude.ai 的任务集中度有所下降:前 10 大 O*NET 任务在 2 月份占对话的 19%,低于 11 月份的 24%。这一下降部分源于程序码撰写任务向第一方 API 迁移,Claude Code 的代理式设计将程序码撰写工作拆分为许多独立的 API 调用。尽管程序码撰写在 API 中的比重有所增加,但各任务类别的整体分布仍相对稳定。
这一迁移仅能解释集中度下降的部分原因。使用场景的组成也发生了变化:课业相关的对话比例从 19% 降至 12%,而个人使用则从 35% 攀升至 42%。课业比例的部分下降可归因于某些地区的冬季学术假期。此外,2 月份也出现新用户注册加速的情况,带来了更多休闲型用户。
Claude 职场任务的多元化建立在既有模式之上。我们的早期报告指出,49% 的职业已将 Claude 采用于至少四分之一的任务量;这一指标自前份报告以来几乎没有变动。新 O*NET 任务的出现速度也比早期明显放缓。
自我们的第一份报告以来,我们将对话分类为五种互动类型——指令型、反馈循环型、任务迭代型、验证型及学习型——并将这些类型归入自动化和扩增两大类。Claude.ai 的扩增型使用略有增加,主要受验证及学习模式小幅增长驱动。在第一方 API 资料中,自動化型使用则大幅下降。
API 平台的电脑及数学任务集中度有所提升。自 2025 年 8 月以来,该类别在 API 中增加了 14%,同时在 Claude.ai 中减少了 18%。我们并行的劳动市场分析显示,API 中的这一迁移可能预示着更直接的职业性冲击。Claude.ai 中管理职业的任务比例从 3% 升至 5%,涵盖分析型任务(如准备投资备忘录)和客户回应型任务。
我们以相关职业的美国工人平均时薪衡量任务的价值。Claude.ai 中的平均任务价值略有下降,从每小时 49.30 美元降至 47.90 美元,主要受简单事实性查询(体育、天气)增加及程序码撰写任务迁移影响。我们的早期分析指出,Claude 的任务通常需要高于平均水平的教育程度,这些任务也对应着高于平均水平的薪资。
在两份报告之间,几项基本指标的变化反映了 Claude.ai 平均任务复杂度的下降。典型人工输入所需的平均教育程度从 12.2 年降至 11.9 年;用户也赋予 Claude 更多自主权;独立完成任务的预估时长缩短了约 2 分钟。与此同时,任务在没有 AI 辅助的情况下完成的难度略有提升。
图1:Claude.ai 与 API 平台前 10 大任务集中度的变化情况,显示 Claude.ai 使用场景多元化而 API 集中度上升的趋势
图2:以相关职业美国劳工时薪衡量的 Claude 任务价值分布,显示 Claude.ai 平均任务薪资从 49.30 美元略降至 47.90 美元
图3:Claude.ai 与第一方 API 的任务类别分布比较,显示程序码撰写任务从 Claude.ai 向 API 迁移的趋势
随着越来越多的任务迁移至 API,暴露于自动化的程度也随之增加。API 工作流程主要采用指令型形式,人工介入极少。我们此前曾强调客服应用的普遍性——包括自动化付款和账单支持——显示客服代表面临较高的暴露程度,可能加速职业变化。
两种 API 工作流程在各样本期间之间的频率约增加了一倍:
我们在早期报告中指出,Anthropic AI 使用指数(已针对人口进行调整)在美国各州之间迅速收敛,初始采用率较低的州正在加速追赶。
当前资料确认收敛趋势持续,但速度比我们此前观察到的更慢。从 2025 年 8 月至 2026 年 2 月,前五名州的人均使用量占比从 30% 降至 24%。自 2025 年 8 月以来,吉尼系数(Gini coefficient)有所下降,但收敛速度已放缓。我们更新后的预测估计,所有州达到同等人均使用量需约 5 至 9 年,而早期估计为 2 至 5 年。
在国际层面,情况恰恰相反:集中度有所提升,吉尼系数相应上升。人均使用量最高的国家如今占整体使用量的比重更大,前 20 个国家的人均调整使用量已从 45% 上升至 48%。
图4:美国各州 Claude 人均使用量的收敛趋势,显示前五名州占比从 30% 降至 24%,收敛速度较前期放缓
图5:各国 Claude 使用量的国际吉尼系数走势,显示全球不平等程度与前一报告相比有所加剧
本章探讨两个反映用户如何部署和学习 AI 的使用特征:模型选择,以及更有经验的用户的使用模式。
第一项是模型选择,揭示了对智慧需求的洞察。目前几乎没有关于多模型环境下用户行为的既有研究,在这种环境中,用户可以在速度、效能和成本之间进行取舍。Opus 在适当任务上的集中选择,应能反映将更难、更高价值的任务分配给此一模型的行为。
第二项调查是按资历划分的使用情况,探讨与用户加入 Claude.ai 时间相关的差异,旨在揭示学习曲线。用户在使用 Claude 的过程中会变得更加擅长吗?使用模式会如何改变?我们发现了与「从做中学」一致的证据:更有经验的用户在对话中有更好的成效,与 Claude 的协作更加深入,尝试更有难度的任务,并将 Claude 更多地应用于多元化工作场景。
Claude 的模型系列——Haiku、Sonnet 和 Opus——在成本、速度和效能之间各有取舍。Opus 拥有最高的上下文限制,在复杂任务上表现卓越,但在 API 中每个 token 的成本也最高。一个具有成本意识且接近使用上限的用户,会希望将 Opus 用于困难、高价值的任务,并为较简单的工作选择其他替代方案。这大致上与我们在资料中观察到的情况吻合。
在使用所有模型系列的付费 Claude.ai 用户中,55% 的电脑与数学任务(如软件代码撰写)使用 Opus,相较之下教育类任务仅有 45%。
技术用户可能认识到效能优势,主动从预设的 Sonnet 切换。具有效率意识的用户则可能将 Sonnet 用于例行工作,以避免耗尽使用配额。这些差异也可能反映出教育任务相对简单,或学生群体对成本的敏感度较高。
更细致的分析揭示了较高薪资职业任务与更多 Opus 选择之间的相关性。以 Claude.ai 为例,软件开发人员任务的 Opus 使用率为 34%,而家教任务仅为 12%。在控制其他因素后,平均时薪每增加 10 美元,Claude.ai 对话中 Opus 的占比就增加 1.5 个百分点。第一方 API 流量对任务复杂度的敏感度约为前者的两倍,任务价值每增加 10 美元,Opus 占比增加 2.8 个百分点。实施程式化工作流程的用户,相较于网页界面用户,可能有更多理由切换模型。
图6:各任务类型的 Opus 模型选择比例,显示用户倾向为薪资较高的技术性任务(如软件开发)选用 Opus,而教育类任务的 Opus 使用率相对较低
图7:职业薪资水平与 Opus 模型选择率的相关性分析,显示在 Claude.ai 中每增加 10 美元时薪,Opus 使用率提升约 1.5 个百分点,API 中的效应则约为两倍
Claude 的第一个模型于 2023 年 3 月发布。此后的快速成长形成了多元化的用户资历分布——从自第一个模型发布就开始使用的用户,到在测量期间前不久才注册的用户,皆涵盖其中。Claude 资历如何影响用户体验,是值得深入了解的课题。
高资历用户(在样本期至少 6 个月前即已加入的用户)展现出更多迭代式使用 Claude 的方式,而委派型使用则大幅减少。他们将 Claude 用于工作的比例高出约 7 个百分点,偏好所需教育程度较高的任务,任务分布也较不集中。前 10 大 O*NET 任务在其对话中占 20.7%,相比之下,对照组为 22.2%。
高资历用户的任务分布,对应至每增加一年使用年资约需多一年教育程度的任务。同时,他们较少将 Claude 用于个人应用:在平台使用一年的用户,其 38% 的对话属于个人性使用,而最新用户则为 44%。
这些模式可以有多种解读。高资历用户代表一个自我筛选的群体,可能反映出固有特质——例如作为早期采用者的程序设计师,即为一个潜在的混淆因素。此外也存在存活者偏差:一年前注册的用户很可能认为 Claude 对他们有用,而那些没有继续使用的人则未被观察到。
早期的分析记录了低收入、教育程度较低的国家往往有较高的使用复杂度。这很可能由早期采用模式所解释:任何国家或用户群体中 Claude 的第一批使用者,很可能是在高价值技术应用中使用 Claude 的早期采用者;随着采用率增长,越来越多的人加入,用户基础扩充到包含更多休闲型使用场景。
请求簇分析揭示了最高资历用户中薪资均值最高的任务:AI 研究、git 操作、手稿修订和创业融资。而最低资历用户中,则是:俳句创作、运动比分查询、派对食物建议。
图8:用户资历与任务分布的关系,显示高资历用户(6 个月以上)偏向薪资较高、教育程度要求较高的工作任务,而新用户则集中于个人休闲类查询
为了在控制变量的情况下进一步探索这些关系,我们使用带有对话特定特征的日志层级资料进行分析。以对话成功率为结果变量、长资历指标为预测变量的简单双变量回归显示,长资历用户成功完成对话的概率约高出 5 个百分点。
成功或许只是良好提示技巧的反映,而这种技巧是可以被模仿的。然而,若高资历用户从事的是本质上不同、基准成功率就更高的任务,那么任务分配可能才是解释这些发现的真正原因。
加入 O*NET 任务和请求簇固定效应的规格,比较了执行相同类型任务的高资历与低资历用户——例如,比对在「执行企业财务分析、估值和建模」簇中的高资历与低资历用户。固定效应吸收了簇内高资历用户的平均优势,产生了 3 个百分点的效应值。
最终规格进一步加入模型、使用场景和地理固定效应,探讨高资历用户是否选择了不同的模型、以不同语言沟通、维护着不同的应用程序,或从不同地区注册。结果显示高资历用户的效应略有提升,表明在控制所有这些因素后,成功率提升了 4 个百分点。
这些结果显示,高资历用户在 Claude 对话中更为成功,且这一现象并非源于语言或所执行任务等简单因素。
高资历用户与 Claude 的对话更为成功,这无法以他们使用的语言或所执行的任务等简单因素来解释。一个有力的解释涉及在平台上学习能力的提升——这可能是随着经验积累而扩充套件的关键成功决定因素。
图9:高资历用户对话成功率的回归分析结果,显示在控制任务类型、模型选择、使用语言及地理因素后,长资历用户的成功率仍高出 3 至 4 个百分点
本报告重新审视了 Claude 使用的主要指标,并首次分析了模型选择与对话成功率。自 2025 年 8 月以来,第一方 API 使用日趋集中:前 10 大 O*NET 任务从占流量的 28% 增至 33%。Claude.ai 的任务自 2025 年 11 月资料以来趋于多元化。美国地理收敛持续,但速度低于早期报告所示。采用率较低的国家面临相对轻微的劣势。
经济基本框架使我们能够追踪 Claude 使用方式的纵向变化。课业相关的使用占比有所下降,个人性对话则有所增加。Claude.ai 输入的平均复杂度略有下降,对话显示出较不复杂的输入和较低的独立完成时间估计。
Claude 整体上处理的是复杂、高价值的任务,这些任务在美国整体经济活动中并不具代表性。随着用户群的扩大,薪资较低的任务类别占流量的比例略有增加。以职业薪资为代理指标衡量的任务价值估计,在 Claude.ai 中自我们第一份报告以来有所下降,而在 API 中则有所上升。两个平台都将复杂任务集中于最强大的 Opus 模型系列,这一转变在 API 中更为显著。
有经验的用户对 Claude 的使用更具协作性,更多地将其用于工作,尝试更有难度的任务,并取得更好的成效。这与自动化使用在最先进、最成熟的用户中占主导地位的预期相反;相反地,有经验的用户表现出对迭代型使用的偏好。这些结果与「从做中学」的论点一致:更多接触 AI 能带来更强的能力提取效果。
另一种解释是,群组效应或存活者偏差可能是推动这些结果的因素。早期采用者可能具有高于平均水平的技术能力;持续使用 Claude 的用户可能代表那些认为任务最适合使用 Claude 的人。经过严格控制的回归分析解释了简单的混淆因素(高资历用户带来不同类型的任务);随着时间推移,我们预计将能更好地区分群组效应和存活者偏差与「从做中学」之间的差异。
成功率的差异可能加剧劳动市场不平等。经济学家长期以来认识到技能偏向型技术变革的潜在影响:这类创新会提高高技能工作者的薪资,同时压抑其他人的薪资水平。本分析识别出这一现象可能正在发生的一个途径:倾向于高技能工作者的早期采用者,与后来、技术能力较低的采用者相比,与 Claude 的互动更为成功。尽管两个群体都面临 AI 驱动的冲击,但早期采用者在扩增阶段是最大的受益者。
图10:报告综合分析的最终图表,呈现 Claude 使用不平等、学习曲线效应与劳动市场影响之间的整体关联