Tác giả: Đội ngũ nội dung Changan I Biteye
Thời tiết không giống như bầu cử, không có lập trường; không giống như NBA, không có đội chủ nhà. Nhưng chính thị trường này lại khiến người dùng trong nước đổ xô vào. Nguyên nhân rất đơn giản, ai cũng có cảm nhận, ai cũng nghĩ mình hiểu thời tiết ở Thượng Hải.
Nhưng “cảm thấy hiểu” và “có thể kiếm tiền” là hai chuyện hoàn toàn khác nhau.
Hôm nay Biteye sẽ chia sẻ ba việc:
Nhiều người lần đầu tham gia thường mắc sai lầm: so sánh nhiệt độ cao nhất theo ứng dụng thời tiết trên điện thoại rồi đặt cược, nhưng ứng dụng hiển thị nhiệt độ trung tâm thành phố Thượng Hải, còn Polymarket (PM) thanh toán dựa trên dữ liệu đo thực tế tại sân bay Phù Đông (đài khí tượng ZSPD), dữ liệu này được công khai qua nền tảng thời tiết Mỹ Wunderground, PM trực tiếp đọc dữ liệu của WU làm căn cứ thanh toán.
Hai nơi, hai con số. Sân bay Phù Đông nằm ở phía đông thành phố, gần cửa sông Dương Tử, chịu ảnh hưởng của gió biển, nhiệt độ thường thấp hơn trung tâm thành phố. Khoảng cách này bình thường không cảm nhận rõ, nhưng khi đến giới hạn của các mức cược, có thể là khác biệt giữa thắng và thua.
Vì vậy, trong phần bình luận của thị trường thời tiết, bạn có thể thấy những câu như: “Rõ ràng hôm nay cảm giác ấm hơn hôm qua, sao nhiệt độ cao nhất hiển thị lại thấp hơn?”
Dữ liệu của WU lấy trực tiếp từ các báo METAR hàng giờ của sân bay (định dạng khí tượng phổ biến toàn cầu cho hàng không dân dụng).
Có một chi tiết nằm ở đây: METAR ghi bằng số Fahrenheit nguyên, WU hiển thị trực tiếp mà không đổi đơn vị hay hiệu chỉnh.
Trong khi hầu hết các hệ thống dự báo thời tiết, mô hình khí tượng đều xuất ra nhiệt độ có phần thập phân. Mô hình của bạn càng tinh vi, càng dễ bỏ qua điểm sơ khai này.
Sau khi phân tích gần 1900 ngày dữ liệu của trạm ZSPD, thời điểm xuất hiện nhiệt độ cao nhất ở Thượng Hải tập trung hơn bạn nghĩ:
Biết quy luật là bước đầu, nhưng quy luật không tự theo dõi thị trường. Mỗi ngày, nhiệt độ cao nhất xuất hiện khi nào, có làm mới không, còn cách mức cược bao xa.
Vì vậy, tôi đã xây dựng hệ thống này: Trước khi kết thúc ngày, cố gắng dự đoán chính xác nhiệt độ cao nhất của ngày đó rơi vào mức độ nào của độ Celsius.

Sau khi rõ quy tắc thị trường, câu hỏi tiếp theo là: làm thế nào dự đoán nhiệt độ cao nhất trong ngày?
Là một người mới về khí tượng, bước đầu tôi hỏi ChatGPT: ngành khí tượng tính nhiệt độ cao nhất trong ngày như thế nào, có phương pháp nào đã thành công chưa. ChatGPT đưa ra một khung lý thuyết, Claude biến khung đó thành mã. Hai AI phối hợp, cuối tuần đã xây dựng xong hệ thống.
Thử tổng cộng năm phương pháp, cuối cùng chỉ thành công ba phương pháp.
1️⃣ Dự báo tích hợp WC + ECMWF
Dự đoán nhiệt độ cao nhất, trước tiên cần dữ liệu. Tôi dùng hai nguồn:
Hai nguồn này có ưu nhược điểm riêng, nên tôi cho chúng bầu chọn theo trọng số. Trọng số điều chỉnh theo loại thời tiết của ngày đó: trời quang thì tin WC hơn, mây nhiều, gió mạnh thì tin ECMWF hơn.
2️⃣ Hiệu chỉnh theo thời gian thực: dùng dữ liệu tăng nhiệt để tính đỉnh
Dự báo là do đêm hôm trước tính, nhưng thời tiết hôm nay liên tục thay đổi. Nên module này làm gì: dùng dữ liệu đo thực tế sáng nay, dự đoán nhiệt độ cao nhất có thể đạt bao nhiêu.
Logic không phức tạp, tôi nhận thấy sáng sớm 8-9 giờ ở Thượng Hải nhiệt độ tăng nhanh nhất. Hệ thống lấy dữ liệu đo thực tế thời điểm này, tra dữ liệu lịch sử: cùng mùa, cùng giờ, trung bình trong quá khứ còn thể tăng thêm bao nhiêu độ.
Sau đó cộng thêm hai điều chỉnh:
Áp suất, điểm sương, độ ẩm cũng tính trong, nhưng sau thử nghiệm phát hiện các yếu tố này ảnh hưởng nhỏ, độ tương quan thấp, nên bỏ đi.
Nhưng chỉ dựa vào ngoại suy chưa đủ ổn định, tôi dùng khái niệm hệ số Kalman gain, nói đơn giản là lấy trung bình có trọng số giữa “kết quả ngoại suy” và “dự báo gốc”, và trọng số này tự động điều chỉnh theo thời gian.
Càng về chiều, những gì xảy ra trước mắt càng quan trọng; càng sớm, dữ liệu lịch sử càng có giá trị tham khảo.
Sau 2 giờ chiều, hệ thống xác định khả năng cao là đỉnh đã qua, trực tiếp lấy dữ liệu cao nhất của ngày để cố định kết quả, không tính toán nữa.
3️⃣ Hôm nay có phải ngày tăng nhiệt không?
Đây là module làm tôi hài lòng nhất trong toàn bộ hệ thống, mỗi sáng sớm đều có một dự đoán: hôm nay nhiệt độ cao hơn hôm qua không?
Mỗi sáng 2-4 giờ, hệ thống thu thập một loạt dữ liệu khí tượng, đưa vào mô hình:
Mô hình cho ra năm mức: ngày tăng nhiệt, ngày hơi tăng, ngày giữ ổn định, ngày giảm nhẹ, ngày giảm rõ, đồng thời đưa ra độ tin cậy.
Tuy nhiên, phương pháp này độ chính xác khác nhau theo mùa:
Ban đầu thử dùng phân tích Fourier để phù hợp chu kỳ nhiệt độ lịch sử, xem có thể dự đoán trực tiếp nhiệt độ cao nhất trong ngày không. Kết quả là nó chỉ cho biết “trung bình nhiệt độ của mùa này trong quá khứ là bao nhiêu”, tính ngẫu nhiên của thời tiết Thượng Hải quá cao, Fourier chỉ tạo ra một đường cong mượt trung bình, không phản ánh biến động hàng ngày. Sai số trung bình 3.6°C, hệ thống luôn đánh giá thấp 100%, nên bỏ.
ERA5 là dữ liệu phân tích lịch sử toàn cầu của Trung tâm khí hậu châu Âu, dùng để dự đoán thời điểm nhiệt độ cao nhất trong ngày.
Thử nghiệm:
Nghe có vẻ ổn, nhưng vấn đề là PM có độ chính xác cao hơn, thời gian để trader quyết định rất ngắn, nếu không dự đoán đỉnh trong vòng nửa giờ, thì còn thua cả xem dữ liệu Polymarket. Nên phương pháp này bị loại.
Thị trường thời tiết của Polymarket mở giao dịch trước 4 ngày, các mức cược phổ biến thường đã được định giá đủ từ sớm. Mua vào các mức có xác suất cao thì tỷ lệ thắng thua không tốt.
Vì vậy, tôi chọn chiến lược: chờ tín hiệu, chờ thời điểm tăng nhiệt rồi mới vào.
Dựa trên hệ thống thời tiết tự xây, tôi đã làm hai việc:
Đêm ngày 16, kênh Telegram gửi báo cáo chế độ ban đêm: ngày mai sẽ giảm nhiệt. Lý do là đêm đó mây dày, đặc điểm mùa và ngày trong năm đều hướng về giảm nhiệt.
Lúc này tôi chưa đặt cược ngay. Tín hiệu ban đêm chỉ là tham khảo bước một. 
Đến 11 giờ sáng, hệ thống gửi báo cáo thời gian thực về giai đoạn tăng nhiệt. Lúc đó nhiệt độ cao nhất đo được đã là 12°C, điểm cộng 1°C có xác suất 42%, nghĩa là khả năng tăng thêm 1°C không cao, không nhiều khả năng nhiệt độ sẽ tăng nữa.
Kết hợp tín hiệu giảm nhiệt của hồi quy logic ban đêm, hai module cùng hướng, tín hiệu rõ ràng hơn nhiều so với ban đêm. Vậy nên tôi cược mức cao nhất ngày 16 không quá 13°C.
Kết quả ngày đó: 12°C. Ngày trước đó, ngày 15, là 15°C, giảm 3 độ. 
Ví dụ khác là thời tiết Thượng Hải ngày 17, hệ thống dự báo còn có thể cảnh báo: sáng 7 giờ nhận được cảnh báo bất thường về đỉnh điểm lúc 22:00.
Thông thường, nhiệt cao nhất ban ngày xuất hiện vào 13-15 giờ, nhưng hôm nay đỉnh điểm lại là 22 giờ, cho thấy không phải do nắng làm nóng ban ngày, mà do luồng khí ẩm ấm vận chuyển về đêm. Trời mưa suốt ngày, mây dày 97-100%, gần như không có ánh sáng mặt trời.
Lúc này mở Polymarket, thấy giá 12°C vẫn còn 53%. Có người trong cộng đồng thắc mắc: đã chiều rồi, nhiệt mới 11°C, đỉnh điểm bình thường đã qua rồi, sao còn mua 12°C?
Sau sự thắc mắc này là do mọi người vẫn dùng logic trời quang để đánh giá thị trường mưa.
Hệ thống không bị lúng túng. Nó đã nhận diện rõ ràng loại thời tiết hôm nay từ sáng, đỉnh điểm bất thường, nhiệt độ hiện tại và dự đoán thị trường có chênh lệch rõ ràng. Đây là một khoảng cách thông tin, và khoảng cách này chính là cơ hội giao dịch.
Đây chính là ý nghĩa của hệ thống này: trong cơ hội, dễ nhận biết hơn; trong rủi ro, cảnh báo nhanh hơn.

Sau một tuần vận hành, hệ thống vẫn còn nhiều điểm chưa hoàn hảo:
Một hệ thống mới chạy chỉ một tuần, đã phát hiện ra những vấn đề này, coi như đã có thu hoạch. Tiếp tục chạy và chỉnh sửa.
Khí tượng đã phát triển hàng trăm năm, dùng vệ tinh, siêu máy tính, mô hình toàn cầu, dự báo thời tiết vẫn không thể đảm bảo chính xác 100% ngày mai. Không phải các nhà khoa học thiếu cố gắng, mà chính hệ thống khí quyển vốn hỗn loạn, chỉ sai một độ ban đầu, kết quả có thể hoàn toàn khác biệt.
Hệ thống này chỉ mới chạy một tuần, tất nhiên sẽ còn sai sót. Mùa thu, độ chính xác gần như đánh cược ngẫu nhiên, luồng khí lạnh đến sớm, hệ thống chưa phản ứng kịp, hiệu ứng gió biển vẫn chưa hoàn toàn bắt kịp.
Nhưng điều đó không quan trọng. Trong thị trường dự đoán, không cần đúng mỗi lần, chỉ cần khi tỷ lệ cược có lợi, nhìn thấy nhiều hơn một lớp thông tin so với thị trường.
Thị trường thời tiết ở Thượng Hải còn rất sơ khai, tôi sẽ tiếp tục theo dõi, chạy và chỉnh sửa hệ thống này. Nếu bạn cũng đang làm thị trường thời tiết của Polymarket, hãy bình luận chia sẻ: bạn dùng phương pháp nào để xác định thời điểm vào lệnh? Gặp phải kết quả thanh toán bất ngờ nào không?