賓州華頓商學院教授 Ethan Mollick 於 4/25 的 X 平台貼文提出一個對學術界具強烈衝擊的觀察:當前的 AI agent 已經能在沒有原始論文與沒有原始碼的情況下,僅憑公開的方法描述與資料,獨立重現複雜的學術研究結果。Mollick 進一步指出,這些 AI 重現的版本與原論文有出入時,「錯誤往往出在人類論文本身,而非 AI」。這是科研可重現性危機在生成式 AI 時代的一個實質轉折—過去需要昂貴人力才能進行的同行驗證,正在被 AI 大規模、低成本完成。
Claude 重現多篇論文,再以 GPT-5 Pro 雙重驗證
Mollick 在他的 OneUsefulThing 部落格與本次推文中,描述了他對 Claude 的具體實驗:把一篇學術論文交給 Claude,讓它打開存檔、整理檔案、把統計用的 STATA 程式碼自動轉換為 Python,再逐一執行論文中的所有發現。Claude 完成後,他再用 GPT-5 Pro 對同一份重現結果做第二輪檢查。多篇論文被以同樣的方式測試,結果普遍成功,僅在資料檔案過大或原始 replication data 本身有問題時受阻。
對學術界而言,這個流程過去通常需要研究助理花費數週甚至數月。Mollick 描述的時間規模是一個下午到一天,且運行成本只有商用 LLM API 的 token 費用。
錯誤多在人類原文,不是 AI
更具爭議性的是 Mollick 對「誰錯了」的判斷。他在推文中明言,當 AI 重現結果與原論文不一致時,多數情況不是 AI 弄錯,而是原論文有資料處理錯誤、模型誤用、或結論超出資料支撐的範圍。心理學、行為經濟學、管理學等社會科學近十年內已出現多次重大可重現性危機事件,最有名的是 2015 年 Open Science Collaboration 的大型重現研究,僅約 36% 的心理學論文結果能被獨立重現。AI agent 把這個檢驗過程從「需要人力配比」推到「可被普遍執行」的邊界。
學會仍禁 AI 入審稿,制度落後技術
Mollick 在另一則 4/25 推文中具體點名其所屬領域最大的學會 Academy of Management 仍明文禁止 AI 進入論文審稿流程。他引用既有研究指出,AI 審稿在準確度、一致性與偏見控制上已優於部分傳統人類審稿人,因此「禁止」這個立場可能反向加重既有審稿系統的失靈。這種制度與技術之間的落差,是接下來 1–2 年學術出版界、學會與資助機構都必須面對的政策議題。
對讀者而言,這場辯論並非局限於學界。當 AI agent 能即時驗證研究發現,產業界的研究引用、政策報告、財務決策中的學術根據,將進入一個「結論是否承受得住獨立 AI 重現」的新檢驗門檻。對應 Mollick 在另一則推文的補充,他認為政府是唯一能在工具強度持續上升時為這個檢驗機制定錨的單位—而政策設計的複雜度,將同步成為 AI 治理討論中相對被忽視的一條主軸。
這篇文章 AI Agent 已可獨立重現複雜學術論文:Mollick 稱錯誤多在人類原文而非 AI 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Worxphere 以 AI 驅動的招聘工具重新品牌化 JobKorea
Gate News 訊息,4 月 26 日——南韓人力資源平台 Worxphere 已將 JobKorea 更名,因其正從傳統線上求職看板轉向以 AI 驅動的招聘解決方案。該公司正整合包含 JobKorea 與 Albamon 在內的服務,打造一個涵蓋長期就業、零工工作與外國勞工招募的統一平台。
GateNews4小時前
阿聯酋宣布:未來兩年將轉向 AI 政府模式
他的陛下謝赫·穆罕默德·本·拉希德·阿爾·馬克圖姆表示,目標是讓 50% 的政府部門透過自主型代理式 AI 運作。轉型也將包括培訓聯邦公務員以「精通 AI」,並將由謝赫·曼蘇爾·本·扎耶德監督。
重點整理:
Coinpedia04-25 08:39
AI 交易平台 Fere AI 融資 130 萬美元,由 Ethereal Ventures 領投
Gate News 消息,4月25日——Fere AI 是一個由人工智能驅動的數位資產交易平台,據 Globenewswire 報導,該平台宣布已完成一輪由 Ethereal Ventures 領投、融資金額為 130 萬美元的融資,參與方包括 Galaxy Vision Hill 與 Kosmos Ventures。
平台支援跨鏈
GateNews04-25 07:46
Nvidia 在 Blackwell 基礎設施上於整個員工隊伍部署 OpenAI Codex AI 代理
Gate News 訊息,4 月 25 日——根據 CEO Jensen Huang 與 OpenAI CEO Sam Altman 的內部通訊,Nvidia 已在成功試點後,將由 GPT-5.5 驅動的 OpenAI Codex(AI 代理)推送到其整個員工隊伍,試點規模約為 10,000 名員工。
Codex 旨在協助
GateNews04-25 03:11
AI 編碼新創 Cognition 洽談 $25B 估值以進行融資回合
Gate 新聞訊息,4 月 25 日——根據熟悉此事的人士表示,AI 編碼新創 Cognition 正處於初步洽談階段,計劃籌集數億美元或以上資金,估值約為 $25 billion。自 SpaceX 收購一家競爭型 AI 編碼新創之後,市場興趣有所上升。
Co
GateNews04-25 02:51
AI 交易代理平台 Fere AI 融資 130 萬美元,Ethereal Ventures 領投
Gate News 訊息,4 月 25 日——AI 驅動的數位資產交易代理平台 Fere AI 宣布完成一輪 130 萬美元的融資,由 Ethereal Ventures 領投,Galaxy Vision Hill 和 Kosmos Ventures 參與。本平台支援跨鏈網路,包括以太坊,
GateNews04-25 01:27