Anthropic研究發現用戶會與AI反覆迭代但在編程時較少質疑輸出結果

robot
摘要生成中

Investing.com - Anthropic周一發布的研究顯示,與其Claude AI助手進行反覆迭代的用戶表現出的熟練行為是接受初始回覆用戶的兩倍多,但當該工具生成程式碼或文件時,用戶的批判性會降低。

這家人工智慧公司使用其4D AI熟練度框架分析了2026年1月為期七天內Claude.ai上的9,830次匿名對話,該框架追蹤11種可觀察行為,包括迭代、事實核查和質疑推理。研究發現,85.7%的對話表現出迭代和完善行為,這些交流平均顯示出2.67種額外的熟練行為,而非迭代對話中僅為1.33種。

涉及程式碼、文件或互動式工具等產物的對話佔樣本的12.3%,並顯示出更高的指令性行為率。在這些交流中,用戶更傾向於明確目標、指定格式和提供範例,分別增加了14.7、14.5和13.4個百分點。

同樣這些生成產物的對話顯示出較低的批判性評估率。與非產物對話相比,用戶識別缺失背景資訊的可能性降低了5.2個百分點,核查事實的可能性降低了3.7個百分點,質疑Claude推理的可能性降低了3.1個百分點。

Anthropic表示,該研究為追蹤AI熟練度隨時間的發展建立了基線。該公司計畫進行隊列分析,比較新用戶和經驗豐富的用戶,並使用定性方法評估聊天界面之外發生的行為。

本文由人工智慧協助翻譯。更多資訊,請參見我們的使用條款。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)