Claude Code tự động hóa nghiên cứu giành được ngôi quán quân hackathon! Người chiến thắng: Tôi thật sự chẳng biết mình đã thắng bằng cách nào

Tại Autoresearch Hackathon do Paradigm tổ chức, một thí sinh gần như “không tự tay thiết kế chiến lược”, nhưng cuối cùng lại giành chức vô địch. Nhà vô địch Ryan Li đồng thời cũng là Giám đốc điều hành của SurfAI cho biết toàn bộ quá trình giải bài gần như hoàn toàn do AI thực hiện; anh thậm chí “không biết mình đã thắng bằng cách nào”, nhưng cuối cùng vẫn giành vị trí số 1 trong Prediction Market Challenge.

Cuộc thi yêu cầu người tham gia thiết kế chiến lược tạo lập thị trường trong một thị trường dự đoán nhị phân mô phỏng. Thông qua lệnh giới hạn để cung cấp thanh khoản trên sổ lệnh, và đạt được sự cân bằng lợi nhuận giữa “nhà kinh doanh chênh lệch giá” và “dòng tiền của nhà đầu tư lẻ”. Xếp hạng cuối cùng dựa trên edge trung bình (lợi thế về lợi nhuận) trong 200 lần mô phỏng ngẫu nhiên. Kết quả cuối cùng của Ryan là 42.32 đô la mean edge (tính theo trung vị của ba bộ seed ngẫu nhiên), và sau khi chấm lại đã vươn lên dẫn đầu bảng.

Claude Code + Codex tự động nghiên cứu, tạo ra 1.039 chiến lược

Khác với các chiến lược giao dịch định lượng hay tạo lập thị trường truyền thống vốn phụ thuộc vào việc con người tinh chỉnh tham số và mô hình hóa, Ryan áp dụng hướng tiếp cận “Bitter Lesson” do Rich Sutton đề xuất trong những năm gần đây: sức mạnh tính toán và quy mô tìm kiếm đánh bại kinh nghiệm của con người. Anh chuyển toàn bộ bài toán thành quy trình “tự động hóa nghiên cứu” (autoresearch), sử dụng nhiều agent AI song song để khám phá không gian lời giải, thay vì tối ưu thủ công.

Trong suốt quá trình, anh sử dụng từ 8 đến 20 agent AI chạy song song (chủ yếu dựa trên Claude Code, đồng thời có bổ sung Codex). Mỗi agent chịu trách nhiệm cho những giả định và không gian tham số khác nhau, liên tục tạo chiến lược, chạy mô phỏng và báo cáo kết quả. Cuối cùng, anh tích lũy đầu ra 1.039 biến thể chiến lược, thực hiện hơn 2.000 lần đánh giá, đồng thời tự động tạo ra 47 tập lệnh quét tham số. Quy mô tìm kiếm tổng thể tương đương với việc nén vài tuần thí nghiệm thủ công thành vài giờ hoàn thành.

900 dòng Python thuật toán tạo lập thị trường do AI tạo ra giành quán quân hackathon

Ở cấp độ chiến lược, phương án chiến thắng cuối cùng là một thuật toán tạo lập thị trường khoảng 900 dòng Python. Logic cốt lõi không đến từ một thiết kế đơn lẻ, mà từ việc chồng ghép nhiều mô-đun “đã được xác thực hiệu quả”. Bao gồm việc né vùng chênh lệch giá cực hẹp nơi nhà kinh doanh chênh lệch giá luôn thắng; ước tính giá thực dựa trên lý thuyết thông tin; điều chỉnh động quy mô báo giá theo rủi ro kinh doanh chênh lệch giá; và chủ động vào cuộc khi sổ lệnh của đối thủ bị “ăn sạch” để giành các khoảng lợi nhuận cao.

Trong đó, bước đột phá quan trọng nhất đến từ một agent AI “hoàn toàn từ bỏ chiến lược sẵn có, bắt đầu từ số không”. Khi quá trình tối ưu bị kẹt quanh mức +25 edge, agent này độc lập phát hiện một mô hình sizing lấy “xác suất rủi ro kinh doanh chênh lệch giá” làm lõi, từ đó đưa hiệu suất chiến lược tăng vọt lên +44, trở thành điểm ngoặt của toàn bộ cuộc thi. Kết quả này cũng trực tiếp xác nhận phương pháp luận của Ryan: khi tìm kiếm rơi vào tối ưu cục bộ, việc khởi động lại còn hiệu quả hơn so với tinh chỉnh.

Lợi thế tuyệt đối của nghiên cứu AI: tự động hóa thử-sai

Trong phần tổng kết, Ryan cho biết điểm mấu chốt của cuộc thi không nằm ở việc thiết kế một “chiến lược thông minh”, mà là xây dựng một hệ thống có thể tìm kiếm, xác thực và loại bỏ ý tưởng ở quy mô lớn. Thay vì dựa vào trực giác của con người, hãy để AI thử-sai trong không gian lời giải khổng lồ, và khuếch đại hiệu suất thông qua song song hóa và tự động hóa.

Trường hợp này cũng củng cố thêm sự chuyển dịch vai trò của “Agentic AI” trong quy trình kỹ thuật và nghiên cứu: AI không còn chỉ là công cụ hỗ trợ, mà có thể trực tiếp đảm nhiệm đơn vị thực thi cốt lõi cho khám phá và ra quyết định. Trong một số bài toán có cấu trúc cao và có thể mô phỏng, con người thậm chí có thể hoàn toàn rời khỏi vị trí “người giải”, chuyển sang thiết kế chính chính khung tìm kiếm và cơ chế đánh giá.

Bài viết Claude Code tự động hóa nghiên cứu giành quán quân hackathon! Nhà vô địch: Tôi căn bản không biết mình đã thắng thế nào! Xuất hiện sớm nhất tại 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Polymarket Đặt Cược Rằng MegaETH Ra Mắt Với Mức Định Giá Hơn $1B : Xác Suất 88%

Tin Gate News, ngày 26 tháng 4 — Theo dữ liệu thị trường dự đoán của Polymarket, có xác suất 88% rằng MegaETH sẽ có mức định giá trên cơ sở fully diluted (FDV) vượt $1 tỷ vào một ngày sau khi ra mắt. Các báo cáo trước đó cho biết TGE của token được dự kiến vào ngày 30 tháng 4. Các bên tham gia thị trường đang

GateNews3giờ trước

Polymarket Cho Thấy Xác Suất 17% Trump Rời Khỏi Chức Vụ Trước Năm 2027

Tin cổng, ngày 26 tháng 4 — Theo Polymarket, thị trường dự đoán về việc liệu Trump có rời nhiệm sở trước năm 2027 hiện đang ở mức xác suất 17%. Điều này diễn ra sau những phát biểu gần đây của Tổng thống Trump tại một bữa tiệc báo chí tại Nhà Trắng, nơi ông mô tả nhiệm kỳ tổng thống là "một công việc nguy hiểm" khi được hỏi về các mối đe dọa tiềm tàng đối với sự an toàn của ông. Trump cho biết ông không muốn sống trong nỗi sợ, và đùa rằng có lẽ ông đã không tranh cử tổng thống nếu Bộ trưởng Ngoại giao Rubio trước đó đã cho ông biết về các rủi ro bạo lực.

GateNews10giờ trước

Brazil Cấm Polymarket, Kalshi trong Đợt Trấn Áp Thị Trường Dự Đoán

Brazil đã ban hành một lệnh cấm toàn diện đối với các thị trường dự đoán và nền tảng cá cược, theo các phương tiện truyền thông địa phương và hồ sơ của chính phủ. Ngân hàng Trung ương Brazil (Banco Central do Brasil) đã ban hành một nghị quyết cấm hai thị trường dự đoán hàng đầu, Polymarket và Kalshi, hoạt động tại quốc gia này do không tuân thủ với w

CryptoFrontier12giờ trước

Tài khoản Tỷ lệ Thắng Cao Đặt Cược $310K vào Timberwolves để Thắng Nuggets ở Game 4 Bán Kết NBA Miền Tây

Tin tức Gate, ngày 25 tháng 4 — Một tài khoản có tỷ lệ thắng cao với địa chỉ (address: 0x9495425feeb0c250accb89275c97587011b19a27), tỷ lệ thành công 63%, đã mua số vị thế trị giá 310.000 USD, đặt cược rằng Timberwolves sẽ đánh bại Nuggets ở Game 4 của vòng đầu tiên NBA miền Tây trên Polymarket, theo nguồn theo dõi của "

GateNews15giờ trước

CFTC Khởi kiện New York khi 38 AG ủng hộ vụ kiện thị trường dự đoán Kalshi

Vào thứ Sáu, Tổng chưởng lý bang New York Letitia James đã tham gia một liên minh song đảng gồm 37 tổng chưởng lý khác, kêu gọi tòa án cấp cao của Massachusetts duy trì lệnh cấm tạm thời chống lại Kalshi, trong khi Ủy ban Chứng khoán và Giao dịch Hàng hóa Hoa Kỳ (CFTC) đồng thời nộp một vụ kiện chống lại New York để ngăn việc bang thực thi các quy định đối với CFTC-reg

CryptoFrontier15giờ trước
Bình luận
0/400
Không có bình luận