Claude Code tự động hóa nghiên cứu giành được ngôi quán quân hackathon! Người chiến thắng: Tôi thật sự chẳng biết mình đã thắng bằng cách nào

Tại Autoresearch Hackathon do Paradigm tổ chức, một thí sinh gần như “không tự tay thiết kế chiến lược”, nhưng cuối cùng lại giành chức vô địch. Nhà vô địch Ryan Li đồng thời cũng là Giám đốc điều hành của SurfAI cho biết toàn bộ quá trình giải bài gần như hoàn toàn do AI thực hiện; anh thậm chí “không biết mình đã thắng bằng cách nào”, nhưng cuối cùng vẫn giành vị trí số 1 trong Prediction Market Challenge.

Cuộc thi yêu cầu người tham gia thiết kế chiến lược tạo lập thị trường trong một thị trường dự đoán nhị phân mô phỏng. Thông qua lệnh giới hạn để cung cấp thanh khoản trên sổ lệnh, và đạt được sự cân bằng lợi nhuận giữa “nhà kinh doanh chênh lệch giá” và “dòng tiền của nhà đầu tư lẻ”. Xếp hạng cuối cùng dựa trên edge trung bình (lợi thế về lợi nhuận) trong 200 lần mô phỏng ngẫu nhiên. Kết quả cuối cùng của Ryan là 42.32 đô la mean edge (tính theo trung vị của ba bộ seed ngẫu nhiên), và sau khi chấm lại đã vươn lên dẫn đầu bảng.

Claude Code + Codex tự động nghiên cứu, tạo ra 1.039 chiến lược

Khác với các chiến lược giao dịch định lượng hay tạo lập thị trường truyền thống vốn phụ thuộc vào việc con người tinh chỉnh tham số và mô hình hóa, Ryan áp dụng hướng tiếp cận “Bitter Lesson” do Rich Sutton đề xuất trong những năm gần đây: sức mạnh tính toán và quy mô tìm kiếm đánh bại kinh nghiệm của con người. Anh chuyển toàn bộ bài toán thành quy trình “tự động hóa nghiên cứu” (autoresearch), sử dụng nhiều agent AI song song để khám phá không gian lời giải, thay vì tối ưu thủ công.

Trong suốt quá trình, anh sử dụng từ 8 đến 20 agent AI chạy song song (chủ yếu dựa trên Claude Code, đồng thời có bổ sung Codex). Mỗi agent chịu trách nhiệm cho những giả định và không gian tham số khác nhau, liên tục tạo chiến lược, chạy mô phỏng và báo cáo kết quả. Cuối cùng, anh tích lũy đầu ra 1.039 biến thể chiến lược, thực hiện hơn 2.000 lần đánh giá, đồng thời tự động tạo ra 47 tập lệnh quét tham số. Quy mô tìm kiếm tổng thể tương đương với việc nén vài tuần thí nghiệm thủ công thành vài giờ hoàn thành.

900 dòng Python thuật toán tạo lập thị trường do AI tạo ra giành quán quân hackathon

Ở cấp độ chiến lược, phương án chiến thắng cuối cùng là một thuật toán tạo lập thị trường khoảng 900 dòng Python. Logic cốt lõi không đến từ một thiết kế đơn lẻ, mà từ việc chồng ghép nhiều mô-đun “đã được xác thực hiệu quả”. Bao gồm việc né vùng chênh lệch giá cực hẹp nơi nhà kinh doanh chênh lệch giá luôn thắng; ước tính giá thực dựa trên lý thuyết thông tin; điều chỉnh động quy mô báo giá theo rủi ro kinh doanh chênh lệch giá; và chủ động vào cuộc khi sổ lệnh của đối thủ bị “ăn sạch” để giành các khoảng lợi nhuận cao.

Trong đó, bước đột phá quan trọng nhất đến từ một agent AI “hoàn toàn từ bỏ chiến lược sẵn có, bắt đầu từ số không”. Khi quá trình tối ưu bị kẹt quanh mức +25 edge, agent này độc lập phát hiện một mô hình sizing lấy “xác suất rủi ro kinh doanh chênh lệch giá” làm lõi, từ đó đưa hiệu suất chiến lược tăng vọt lên +44, trở thành điểm ngoặt của toàn bộ cuộc thi. Kết quả này cũng trực tiếp xác nhận phương pháp luận của Ryan: khi tìm kiếm rơi vào tối ưu cục bộ, việc khởi động lại còn hiệu quả hơn so với tinh chỉnh.

Lợi thế tuyệt đối của nghiên cứu AI: tự động hóa thử-sai

Trong phần tổng kết, Ryan cho biết điểm mấu chốt của cuộc thi không nằm ở việc thiết kế một “chiến lược thông minh”, mà là xây dựng một hệ thống có thể tìm kiếm, xác thực và loại bỏ ý tưởng ở quy mô lớn. Thay vì dựa vào trực giác của con người, hãy để AI thử-sai trong không gian lời giải khổng lồ, và khuếch đại hiệu suất thông qua song song hóa và tự động hóa.

Trường hợp này cũng củng cố thêm sự chuyển dịch vai trò của “Agentic AI” trong quy trình kỹ thuật và nghiên cứu: AI không còn chỉ là công cụ hỗ trợ, mà có thể trực tiếp đảm nhiệm đơn vị thực thi cốt lõi cho khám phá và ra quyết định. Trong một số bài toán có cấu trúc cao và có thể mô phỏng, con người thậm chí có thể hoàn toàn rời khỏi vị trí “người giải”, chuyển sang thiết kế chính chính khung tìm kiếm và cơ chế đánh giá.

Bài viết Claude Code tự động hóa nghiên cứu giành quán quân hackathon! Nhà vô địch: Tôi căn bản không biết mình đã thắng thế nào! Xuất hiện sớm nhất tại 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Wisconsin kiện Coinbase, Polymarket, Kalshi về các thị trường dự đoán

Wisconsin đã nộp đơn kiện chống lại năm nền tảng dự đoán thị trường lớn—Coinbase, Polymarket, Kalshi, Robinhood và Crypto.com—cho rằng các “hợp đồng sự kiện” của họ vi phạm luật cờ bạc của bang và cấu thành cá cược thể thao trái pháp luật. Tổng chưởng lý bang Wisconsin Josh Kaul lập luận rằng việc gắn nhãn các này

CryptoFrontier2giờ trước

Quan tài bị bắt: sĩ quan trưởng lực lượng đặc biệt quân đội Mỹ bị bắt vì sử dụng thông tin mật để đặt cược trên Polymarket rằng Maduro bị bắt, thu lợi 400.000 USD

Bộ Tư pháp Mỹ ở Khu Nam của New York đã truy tố viên sĩ quan chỉ huy của lực lượng đặc nhiệm Mỹ, Gannon Ken Van Dyke, với cáo buộc rằng y đã sử dụng thông tin mật để đặt cược trên Polymarket về kết quả Maduro bị bắt, thu lợi khoảng 409,881 USD (13 giao dịch, từ 2025-12-27 đến 2026-1-26). Các cáo buộc bao gồm việc sử dụng trái phép thông tin mật, đánh cắp thông tin không công khai, gian lận giao dịch hàng hóa, lừa đảo chuyển khoản và giao dịch tiền trái phép, v.v.; đây là vụ truy tố liên bang đầu tiên lấy nội gián và giao dịch chênh lệch dựa trên thị trường dự đoán làm trọng tâm, hoặc có thể ảnh hưởng đến hướng đi quản lý trong tương lai.

ChainNewsAbmedia2giờ trước

Tòa án bang Wisconsin truy tố nền tảng thị trường dự đoán Kalshi, cáo buộc nền tảng này có thể vi phạm việc cờ bạc không có giấy phép

Theo thông cáo báo chí chính thức được Bộ trưởng Tư pháp bang Wisconsin Josh Kaul (Josh Kaul) công bố vào ngày 23 tháng 4, bang Wisconsin đã kiện Kalshi tại Quận Dane (Dane County), cáo buộc hoạt động kinh doanh thị trường dự đoán của nền tảng này, vận hành dưới hình thức “hợp đồng sự kiện” (event contracts), phù hợp với định nghĩa pháp lý của luật bang Wisconsin về cờ bạc và là hoạt động cờ bạc không có giấy phép.

MarketWhisper3giờ trước

Binh sĩ Lục quân Mỹ bị bắt vì sử dụng tình báo mật để cá cược việc Maduro bị bắt trên Polymarket

Tin tức Cổng, ngày 24 tháng 4 — Bộ Tư pháp Hoa Kỳ đã bắt giữ một hạ sĩ quân nhân đang tại ngũ của Lục quân Mỹ là Gannon Ken Van Dyke, 38 tuổi, với cáo buộc sử dụng thông tin mật để đặt cược trên Polymarket, một thị trường dự đoán, liên quan đến việc cựu Tổng thống Venezuela Nicolás Maduro bị bắt. Van Dyke đã tham gia

GateNews4giờ trước

Tài khoản thua lỗ $4M+ Đặt $100K vào Denver Nuggets ở Trận 3 vòng loại NBA trên Polymarket

Tin tức từ Gate, ngày 24 tháng 4 — Theo Odaily Seer, một tài khoản đã chịu lỗ vượt quá $4 triệu đã đặt cược 100.000 USD vào Denver Nuggets để thắng Minnesota Timberwolves với mức chấp 1,5 điểm, với giá vào lệnh trung bình là 46 cent trên Polymarket, khoảng 10 phút trước

GateNews7giờ trước
Bình luận
0/400
Không có bình luận