Anthropic研究发现用户会与AI反复迭代但在编程时较少质疑输出结果

robot
摘要生成中

Investing.com - Anthropic周一发布的研究显示,与其Claude AI助手进行反复迭代的用户表现出的熟练行为是接受初始回复用户的两倍多,但当该工具生成代码或文档时,用户的批判性会降低。

这家人工智能公司使用其4D AI熟练度框架分析了2026年1月为期七天内Claude.ai上的9,830次匿名对话,该框架追踪11种可观察行为,包括迭代、事实核查和质疑推理。研究发现,85.7%的对话表现出迭代和完善行为,这些交流平均显示出2.67种额外的熟练行为,而非迭代对话中仅为1.33种。

涉及代码、文档或交互式工具等产物的对话占样本的12.3%,并显示出更高的指令性行为率。在这些交流中,用户更倾向于明确目标、指定格式和提供示例,分别增加了14.7、14.5和13.4个百分点。

同样这些生成产物的对话显示出较低的批判性评估率。与非产物对话相比,用户识别缺失背景信息的可能性降低了5.2个百分点,核查事实的可能性降低了3.7个百分点,质疑Claude推理的可能性降低了3.1个百分点。

Anthropic表示,该研究为追踪AI熟练度随时间的发展建立了基线。该公司计划进行队列分析,比较新用户和经验丰富的用户,并使用定性方法评估聊天界面之外发生的行为。

本文由人工智能协助翻译。更多信息,请参见我们的使用条款。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)