Claude Code 自動化研究拿下黑客松冠軍!得主:我根本不知的怎麼贏的

在 Paradigm 主辦的 Autoresearch Hackathon 中,一名幾乎「沒有親自設計策略」的參賽者,卻最終拿下冠軍。冠軍得主 Ryan Li 同時也是 SurfAI 執行長表示,整個解題過程幾乎完全交由 AI 完成,自己甚至「不知道怎麼贏的」,最終仍在 Prediction Market Challenge 中奪下第一名。

這場競賽要求參賽者在模擬的二元預測市場中設計做市策略,透過限價單在訂單簿中提供流動性,並在「套利者」與「散戶流量」之間取得利潤平衡。最終排名依據策略在 200 次隨機模擬中的平均 edge(利潤優勢)計算。Ryan 的最終成績為 42.32 美元 mean edge(以三組隨機種子中位數計算),在重新評分後登上榜首。

Claude Code + Codex 自動研究,產出 1039 個策略

不同於傳統量化交易或市場做市策略依賴人類專家調參與建模,Ryan 採取的是近年由 Rich Sutton 提出的「Bitter Lesson」思路,讓計算力與搜尋規模擊敗人類經驗。他將整個問題轉化為「自動化研究」(autoresearch)流程,透過多個 AI agent 平行探索解法空間,而非手動優化。

整個過程中,他動用了 8 至 20 個並行運行的 AI agent(主要基於 Claude Code,並輔以 Codex),每個 agent 各自負責不同假設與參數空間,持續生成策略、執行模擬、回報結果。最終累積產出 1,039 個策略變體,進行超過 2,000 次評估,並自動生成 47 個參數掃描腳本。整體搜尋規模,相當於將數週人工實驗壓縮至數小時完成。

AI 產出的 900 行 Python 做市演算法拿下黑客松冠軍

在策略層面,最終勝出方案是一套約 900 行 Python 的做市演算法,核心邏輯並非來自單一設計,而是多個「被驗證有效」的模組疊加。包括避開套利者必勝的極窄價差區間、透過資訊理論估計真實價格、依據套利風險動態調整報價規模,以及在對手訂單簿被吃空時主動進場搶佔高利潤區間等。

其中最關鍵的突破,來自一次「完全拋棄既有策略、從零開始」的 AI agent。當整體優化停滯在約 +25 edge 時,該 agent 獨立發現一套以「套利風險機率」為核心的 sizing 模型,將策略表現一舉推升至 +44,成為整場比賽的轉折點。這一結果也直接印證 Ryan 的方法論:當搜尋陷入局部最優時,重啟比微調更有效。

AI 研究的絕對優勢:自動化試錯

Ryan 在總結中指出,這場比賽的關鍵不在於設計一個「聰明的策略」,而是建立一個可以大規模搜尋、驗證並淘汰想法的系統。與其依賴人類直覺,不如讓 AI 在龐大的解空間中試錯,並透過並行化與自動化放大效率。

這一案例也進一步強化了「Agentic AI」在工程與研究流程中的角色轉變,AI 不再只是輔助工具,而是可以直接承擔探索與決策的核心執行單位。在某些高度結構化、可模擬的問題中,人類甚至可以完全退出「解題者」的位置,轉而設計搜尋框架與評估機制本身。

這篇文章 Claude Code 自動化研究拿下黑客松冠軍!得主:我根本不知的怎麼贏的 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

巴西禁止 Polymarket、Kalshi 以及其他 26 個預測平台

根據當地媒體與政府文件,巴西已針對預測市場與博彩平台頒布全面禁令。兩個領先的預測市場 Polymarket 與 Kalshi 被確認,國內研究人員無法存取;而巴西中央銀行 Banco Central do Brasil 則發布了

Crypto Frontier1小時前

Polymarket 對 MegaETH 上線並以超過 $1B 估值:88% 的概率進行押注

Gate News 消息,4 月 26 日 — 根據 Polymarket 預測市場數據,有 88% 的概率顯示 MegaETH 在上線後一天的完全稀釋估值 (FDV) 將超過 $1 十億。此前的報導指出,該代幣的 TGE 預計在 4 月 30 日。 市場參與者是

GateNews10小時前

Polymarket 顯示:Trump 在 2027 年前離任的機率為 17%

Gate News 訊息,4 月 26 日——根據 Polymarket,在是否會在 2027 年前離開總統職務這一問題上,預測市場目前給出的機率為 17%。 這是在美國總統 Trump 於白宮記者晚宴上發表最新言論之後。當被問及可能對其人身安全構成威脅時,他將總統職務形容為「一份危險的工作」。Trump 表示他不想活在恐懼之中,並開玩笑說,如果在此前美國國務卿 Rubio 曾提前告訴他暴力風險,他可能就不會參選總統。

GateNews17小時前

巴西禁止 Polymarket、Kalshi 進行預測市場打擊

根據當地媒體與政府申報文件,巴西已頒布全面禁止預測市場與博彩平台的禁令。Banco Central do Brasil(巴西央行)發布一項決議,禁止兩家領先的預測市場 Polymarket 與 Kalshi 在該國運營,理由是未遵守 w

Crypto Frontier19小時前

高勝率帳戶下注 $310K 灰熊隊在 NBA 西部半決賽第 4 場擊敗掘金

Gate 新聞訊息,4 月 25 日——一個勝率高的帳戶 (地址:0x9495425feeb0c250accb89275c97587011b19a27),成功率 63%,在 Polymarket 上押注灰熊隊將在 NBA 西部聯盟首輪第 4 場擊敗掘金隊,購買了價值 310,000 美元的部位;據 Odaily Seer 的監測稱,

GateNews22小時前
留言
0/400
暫無留言