Thời tiết không như bầu cử, không có lập trường; không như NBA, không có đội chủ nhà. Nhưng chính thị trường này lại khiến người dùng trong nước đổ xô vào. Lý do rất đơn giản: ai cũng có cảm nhận, ai cũng nghĩ mình hiểu thời tiết Thượng Hải.
Nhưng "cảm thấy hiểu" và "có thể kiếm tiền" là hai chuyện hoàn toàn khác nhau.
Hôm nay Biteye chia sẻ ba điều:
1. Hiểu rõ quy tắc thanh toán
2. Thiết lập phương pháp dự báo thời tiết
3. Dùng hệ thống để tìm cơ hội giao dịch mà người khác không thấy
1. Trước tiên phải hiểu rõ: Thị trường thời tiết này thanh toán như thế nào?
1. Nhiệt độ thanh toán không phải là con số bạn tưởng
Nhiều người lần đầu tham gia có một sai lầm: lấy ứng dụng thời tiết trên điện thoại để đối chiếu và đặt cược vào nhiệt độ cao nhất, nhưng App hiển thị nhiệt độ ở trung tâm thành phố Thượng Hải, trong khi Polymarket thanh toán dùng dữ liệu đo thực tế tại sân bay Phố Đông Thượng Hải (trạm khí tượng ZSPD). Dữ liệu này được công khai thông qua nền tảng khí tượng Mỹ Wunderground, PM trực tiếp đọc bản ghi trên WU làm cơ sở thanh toán.
Hai địa điểm, hai con số. Sân bay Phố Đông nằm ở phía đông thành phố, sát cửa sông Trường Giang đổ ra biển, chịu ảnh hưởng của gió biển nên nhiệt độ thường thấp hơn trung tâm thành phố. Sự chênh lệch này bình thường khó cảm nhận, nhưng ở ranh giới các mức, nó có thể là sự khác biệt giữa đặt đúng và đặt sai.
Vì vậy, trong phần bình luận của thị trường thời tiết, bạn có thể thấy sự bối rối kiểu: "Rõ ràng hôm nay cảm thấy ấm hơn hôm qua, tại sao nhiệt độ cao nhất hiển thị lại thấp hơn?"
2. Số đúng, nhưng đơn vị không phải là đơn vị bạn nghĩ
Dữ liệu từ WU trực tiếp đến từ bản tin METAR (định dạng điện báo khí tượng dùng chung cho hàng không toàn cầu) được báo cáo hàng giờ của sân bay.
Có một chi tiết ẩn ở đây: METAR ghi lại số nguyên độ Fahrenheit, WU trực tiếp hiển thị con số này, không quy đổi, không hiệu chỉnh.
Trong khi hầu hết các hệ thống dự báo thời tiết, mô hình khí tượng xuất ra nhiệt độ đều có số thập phân. Mô hình của bạn càng tính toán tinh vi, bạn càng dễ bỏ qua nơi thô sơ nhất này.
3. Quy luật nhiệt độ Thượng Hải
Lục lại dữ liệu gần 1900 ngày của trạm ZSPD, thời điểm xuất hiện nhiệt độ cao nhất ở Thượng Hải tập trung hơn tưởng tượng:
· Cả bốn mùa đều tập trung cao độ vào khoảng 11:00-13:00,
· Mùa hè tập trung cao nhất vào lúc 12:00, chiếm 27.6% toàn mùa.
· Thời điểm đỉnh mùa thu hơi sớm hơn, 10:00 cũng là một trong những khung giờ cao tần.
Biết quy luật là bước đầu, nhưng quy luật không tự theo dõi thị trường. Mỗi ngày nhiệt độ cao nhất xuất hiện lúc nào, có làm mới không, còn cách mức bao xa.
Vì vậy, biên tập viên đã xây dựng hệ thống này: Trước khi thanh toán mỗi ngày, cố gắng dự đoán chính xác nhất nhiệt độ cao nhất trong ngày sẽ rơi vào mức độ C nào.
2. Năm phương pháp, ba phương pháp chạy thông
Sau khi nắm rõ quy tắc thị trường, câu hỏi tiếp theo là: Làm thế nào để dự đoán nhiệt độ cao nhất trong ngày?
Là một người mới tìm hiểu khí tượng, bước đầu tiên là hỏi ChatGPT: Ngành khí tượng tính toán nhiệt độ cao nhất trong ngày như thế nào, có những phương pháp chín muồi nào. ChatGPT đưa ra một khung lý thuyết, Claude biến khung thành code. Hai AI phối hợp sử dụng, một cuối tuần đã dựng lên hệ thống.
Tổng cộng thử năm phương pháp, cuối cùng chỉ chạy thông ba.
Chạy thông:
1. Dự báo tích hợp WC + ECMWF
Dự báo nhiệt độ cao nhất, trước tiên cần dữ liệu. Sử dụng hai nguồn:
· Weather Company (WC) là một API khí tượng thương mại, cung cấp dữ liệu dự báo từng giờ, độ chính xác cao;
· ECMWF là mô hình khí tượng toàn cầu của Trung tâm Dự báo Thời tiết Tầm trung Châu Âu, nhạy cảm hơn với hệ thống thời tiết quy mô lớn.
Hai nguồn có ưu nhược điểm riêng, nên để chúng bỏ phiếu có trọng số. Trọng số được điều chỉnh động theo loại thời tiết trong ngày: trời nắng tin WC hơn, thời tiết nhiều mây, gió mạnh tin ECMWF hơn.
2. Hiệu chỉnh thời gian thực: Dùng dữ liệu tăng nhiệt để suy ra đỉnh
Dự báo được tính từ tối hôm trước, nhưng thời tiết hôm nay luôn thay đổi. Vì vậy, module này làm việc: dùng dữ liệu đo thực tế đã xảy ra vào sáng nay, suy ra hôm nay cao nhất có thể đạt bao nhiêu.
Logic không phức tạp, biên tập viên phát hiện khoảng 8-9 giờ sáng ở Thượng Hải là thời gian nhiệt độ tăng nhanh nhất. Hệ thống nhận được nhiệt độ đo thực tế tại thời điểm này sau đó, tra dữ liệu lịch sử: cùng mùa, cùng thời điểm, quá khứ trung bình còn có thể tăng thêm bao nhiêu độ.
Sau đó thêm hai hiệu chỉnh:
· Nhiều mây thì nhân một hệ số giảm, mây càng dày càng cản trở việc tăng nhiệt.
· Gió mạnh cũng nhân một hệ số giảm, gió mạnh sẽ đẩy nhanh sự tản nhiệt. Tính ra một "ước tính ngoại suy".
Áp suất, điểm sương, độ ẩm cũng được tính toán, nhưng sau khi backtest thấy các yếu tố này ảnh hưởng nhỏ, tương quan thấp, nên đã xóa bỏ.
Nhưng chỉ dựa vào ngoại suy chưa đủ ổn, ở đây sử dụng khái niệm Kalman gain, nói thẳng ra là lấy trung bình gia quyền giữa "kết quả ngoại suy" và "dự báo gốc", và trọng số này sẽ tự thay đổi theo thời gian.
· 6 giờ sáng, ngoại suy chỉ chiếm 20%, phần lớn vẫn tin dự báo
· Đến 12 giờ trưa, ngoại suy chiếm 72%
· Sau 1 giờ chiều, gần như hoàn toàn tin vào số đo thực, chiếm 85%
Càng muộn, sự việc trước mắt càng quan trọng; càng sớm, giá trị tham khảo của dự báo lịch sử càng lớn.
Sau 2 giờ chiều, hệ thống đán đoán đỉnh nhiều khả năng đã qua, trực tiếp lấy nhiệt độ cao nhất trong ngày từ bản ghi lịch sử để khóa kết quả, không suy tính nữa.
3. Hôm nay có phải là ngày tăng nhiệt không?
Đây là module hài lòng nhất trong toàn bộ hệ thống, mỗi sáng sớm đưa ra một phán đoán: Nhiệt độ cao nhất hôm nay có cao hơn hôm qua không?
Mỗi ngày từ 2-4 giờ sáng, hệ thống sẽ thu thập một loạt dữ liệu khí tượng, đưa vào mô hình này:
· Sự thay đổi của áp suất trong 3 giờ, 12 giờ qua
· Hướng gió và tốc độ gió lúc sáng sớm, tình hình mây
· Biên độ tăng giảm nhiệt ngày hôm qua, xu hướng nhiệt độ 3 ngày gần đây, nhiệt độ hôm qua là cao hay thấp hơn bình thường
· Cộng thêm tháng, mùa, ngày thứ bao nhiêu trong năm, hôm qua có mưa không
Đầu ra mô hình chia thành năm mức: Ngày tăng nhiệt, thiên tăng nhiệt, ngang bằng, thiên giảm nhiệt, ngày giảm nhiệt, đồng thời đưa ra độ tin cậy.
Tuy nhiên, phương pháp này có độ chính xác khác nhau rất lớn theo mùa.
Mùa đông chính xác nhất: Không khí lạnh tràn về, áp suất tăng nhanh, gió bắc mạnh lên, tín hiệu cực kỳ rõ ràng, mô hình nhìn một cái là biết.
Mùa thu kém nhất: Khối khí lạnh ấm giằng co lặp đi lặp lại, hôm nay vừa tăng nhiệt ngày mai đã giảm xuống, quy luật lịch sử ở mùa này mất tác dụng nhanh nhất.
Phương pháp bị loại:
1. Dự báo số trị Fourier
Lúc đầu thử dùng phân tích Fourier để khớp quy luật chu kỳ nhiệt độ lịch sử, xem có thể trực tiếp dự báo nhiệt độ cao nhất trong ngày không.
Kết quả phát hiện nó chỉ có thể nói cho bạn biết "lịch sử mùa này trung bình là bao nhiêu độ". Thời tiết Thượng Hải tính ngẫu nhiên quá cao, đường cong khớp Fourier ra là một đường cong trung bình mượt mà, không phải là dao động thực tế hàng ngày. Sai số 3.6°C, và 100% đánh giá thấp có hệ thống, nên trực tiếp xóa bỏ.
2. Dự báo thời điểm đỉnh ERA5
ERA5 là bộ dữ liệu tái phân tích lịch sử toàn cầu của Trung tâm Khí hậu Châu Âu, dùng để dự báo nhiệt độ cao nhất trong ngày xuất hiện lúc mấy giờ.
Backtest lại
· Độ chính xác ≤1 giờ là 59.6%
· Độ chính xác ≤2 giờ là 81.3%
Nghe có vẻ được, nhưng vấn đề là độ chính xác của PM cao hơn, thời gian cửa sổ để nhà giao dịch phán đoán rất ngắn, nếu không thể phán đoán đỉnh trong vòng nửa giờ thì không bằng xem dữ liệu của Polymarket, nên phương pháp này bị loại.
3. Hệ thống thực chiến: Hai case study và suy ngẫm về điểm thiếu sót
Thị trường thời tiết của Polymarket sẽ mở giao dịch trước 4 ngày, các mức nhiệt độ hot thường được định giá đầy đủ vào giai đoạn đầu mở thị trường. Mua trực tiếp ở mức xác suất cao, tỷ lệ lợi nhuận/rủi ro khá kém.
Vì vậy, chiến lược biên tập viên sử dụng là: Chờ tín hiệu, chờ cửa sổ thời gian sau khi nhiệt độ tăng rồi mới vào thị trường.
Vì vậy, dựa trên hệ thống thời tiết tự xây dựng, đã thực hiện hai thao tác sau:
Case study 1:
Đêm ngày 16, kênh Telegram đã push báo cáo chế độ ban đêm: Ngày mai là ngày giảm nhiệt. Lý do là đêm đó tình hình mây khá dày, hai đặc trưng mùa và thứ tự ngày trong năm đều hướng về chiều giảm nhiệt.
Lúc này biên tập viên không lập tức đặt cược. Tín hiệu đêm chỉ là tham khảo lớp đầu tiên.
Đến 11 giờ sáng, hệ thống push báo cáo thời gian thực giai đoạn tăng nhiệt. Lúc đó nhiệt độ cao nhất đo được đã đạt 12°C, điểm đánh giá xác suất +1°C đưa ra kết quả: Xác suất hôm nay tăng thêm 1°C là 42%, nghiêng về sẽ không tăng nhiệt nữa.
Kết hợp tín hiệu giảm nhiệt thiên hướng từ hồi quy logistic lúc sáng sớm, hai module cùng hướng, lúc này tín hiệu rõ ràng hơn nhiều so với sáng sớm. Vì vậy đã đặt cược nhiệt độ cao nhất ngày 16 không vượt quá 13°C.
Thanh toán trong ngày: 12°C. Ngày hôm trước 15 là 15°C, giảm tới 3 độ.
Case study 2:
Lại ví dụ như thời tiết Thượng Hải ngày 17 hôm nay, hệ thống thời tiết còn có thể đóng vai trò cảnh báo: Lúc 7 giờ sáng nhận được push hiển thị, thời điểm đỉnh bất thường: 22:00
Trời nắng bình thường nhiệt độ cao nhất xuất hiện vào lúc 1-3 giờ chiều, nhưng hôm nay đỉnh vào lúc 22 giờ tối, điều này cho thấy đây không phải là tăng nhiệt do nắng, mà là do dòng khí ẩm nóng vận chuyển vào ban đêm. Cả ngày đều mưa, mây che phủ 97-100%, hầu như không có nắng.
Lúc này mở Polymarket, thấy định giá 12°C vẫn còn 53%. Trong cộng đồng có người bối rối: Bây giờ đã chiều rồi, nhiệt độ mới 11°C, thời điểm đỉnh bình thường đã qua lâu rồi, tại sao mọi người vẫn mua 12°C?
Đằng sau sự bối rối này là mọi người vẫn đang dùng logic trời nắng để phán đoán thị trường ngày mưa.
Hệ thống sẽ không bối rối. Nó đã nhận dạng rõ loại thời tiết hôm nay từ sáng, thời điểm đỉnh bất thường, tồn tại chênh lệch rõ ràng giữa nhiệt độ hiện tại và kỳ vọng thị trường. Đây là một chênh lệch thông tin, và chênh lệch thông tin chính là cơ hội giao dịch.
Đây chính là ý nghĩa của việc xây dựng hệ thống này: Trước cơ hội, dễ dàng nhận biết hơn; trước rủi ro, cảnh báo nhanh hơn.
Hệ thống còn những thiếu sót nào?
Một hệ thống làm trong một cuối tuần, không thể không có lỗ hổng:
· Độ chính xác mùa thu chỉ có 63.7%, gần như tung đồng xu.
· Khối khí lạnh ấm ở mùa này giằng co lặp đi lặp lại, hôm nay tăng nhiệt ngày mai giảm xuống, quy luật lịch sử ở mùa thu mất tác dụng nhanh nhất.
· Đặc trưng áp suất trong thực chiến không lấy được. Khi huấn luyện mô hình có dùng sự thay đổi áp suất làm đặc trưng, hiệu quả backtest khá tốt.
· Tín hiệu không khí lạnh tràn qua rất rõ ràng. Nhưng khi chạy thực tế, interface hiện tại không lấy được dữ liệu áp suất thời gian thực.
· Hiệu chỉnh ven biển vẫn đang chờ dữ liệu kích hoạt. Hiệu ứng gió biển của sân bay Phố Đông là có thật, hệ thống cũng đã xây module hiệu chỉnh tương ứng, nhưng mẫu backtest còn chưa đủ nhiều.
Một hệ thống vừa chạy được một cuối tuần, có thể phát hiện những vấn đề này đã coi như có thu hoạch. Tiếp theo vừa chạy vừa sửa.
4. Kết luận
Khí tượng học phát triển mấy trăm năm, dùng đến vệ tinh, siêu máy tính, mô hình toàn cầu, dự báo thời tiết vẫn không dám đảm bảo 100% chính xác ngày mai. Không phải nhà khoa học không đủ nỗ lực, mà là bản thân hệ thống khí quyển là hỗn độn, chênh lệch một độ điều kiện ban đầu, kết quả có thể hoàn toàn khác.
Hệ thống chạy được một cuối tuần này, tất nhiên cũng sẽ sai. Độ chính xác mùa thu gần như tung đồng xu, không khí lạnh đến sớm hệ thống có thể chưa phản ứng kịp, hiệu ứng gió biển đến giờ vẫn chưa hoàn toàn nắm bắt được.
Nhưng điều đó không quan trọng. Làm thị trường dự đoán không cần mỗi lần đều đúng, chỉ cần khi tỷ lệ cược có lợi thế, nhìn thông tin nhiều hơn thị trường một tầng.










