Trước khi World Cup 2026 khởi tranh, hai hệ thống uy tín đã đưa ra "xác suất vô địch" của riêng họ — và đội đứng đầu của họ không giống nhau.
Thị trường dự đoán (tổng hợp giá từ Polymarket, Kalshi) xếp Pháp là ứng cử viên số một, khoảng 17%. Siêu máy tính Opta xếp Tây Ban Nha, nhà vô địch Euro, là ứng cử viên số một, 16.1%.
Hai con số này trông đều là "xác suất". Nhưng cách chúng được tạo ra hoàn toàn khác nhau — một là mức giá được hình thành từ khối lượng giao dịch hàng trăm triệu đô la trên thị trường, một là tần suất được đếm ra từ việc siêu máy tính mô phỏng cả giải đấu mười nghìn lần.
Bài viết này không dự đoán ai sẽ thắng, không đánh giá bên nào chính xác hơn, chỉ trả lời một câu hỏi: Khi bạn thấy con số "Pháp 17%" này, rốt cuộc nó đến từ đâu, và mức độ đáng tin cậy của nó đến đâu.
Đây là tầng tiếp theo của EP06 — bài trước nói về sự khác biệt trong cấu trúc thị trường giữa thị trường dự đoán và cá cược truyền thống, bài này nói về xác suất ẩn trong giá cả được tính như thế nào. Dữ liệu tính đến ngày 31 tháng 5 năm 2026.
Cảnh 1 · Xác suất trong giá cả: Thị trường sản xuất xác suất như thế nào
Cơ chế của thị trường dự đoán rất rõ ràng: Giá của mỗi hợp đồng kết quả nằm trong khoảng từ 0 đến 100 cent, giá cả được đọc trực tiếp như xác suất ngầm định. Hợp đồng Pháp được chào giá 17 cent, nghĩa là thị trường cho rằng Pháp có khoảng 17% xác suất vô địch — người đoán đúng được trả 1 USD cho mỗi hợp đồng, người đoán sai nhận 0.
Nhưng giá cả trên một nền tảng đơn lẻ có thể có nhiễu. Các công cụ tổng hợp (như DeFi Rate) sử dụng giá trung bình gia quyền theo khối lượng (VWAP) để tổng hợp theo giờ các báo giá từ nhiều sàn giao dịch như Kalshi, Polymarket, Polymarket US, Gemini, từ đó thu được một xác suất ngầm định xuyên nền tảng. Tính đến ngày 30 tháng 5 năm 2026, hợp đồng vô địch World Cup đã tích lũy giao dịch khoảng 523 triệu USD, ngày thanh toán định vào ngày 20 tháng 7 năm 2026 — ngày sau trận chung kết (19 tháng 7).
Giá cả này không tự nhiên mà có. Nó là kết quả của việc các nhà tạo lập thị trường liên tục chào giá hai chiều mua/bán + người giao dịch liên tục thực hiện giao dịch. Và điều đáng chú ý là, những người cung cấp thanh khoản cho thị trường dự đoán, toàn bộ đều là các công ty giao dịch tổ chức nguyên bản tiền mã hóa: Wintermute (khối lượng giao dịch hàng năm trên 3,5 nghìn tỷ USD, phủ sóng hơn 70 sàn giao dịch) đã bắt đầu cung cấp báo giá hai chiều cho Polymarket và Kalshi từ năm 2026; Jump Trading, Susquehanna cũng đã tích cực tạo lập thị trường.
Jake Ostrovskis, Giám đốc giao dịch OTC của Wintermute, đã chỉ ra thực trạng của thị trường này trong một câu nói:
"Thị trường dự đoán có quy mô nhu cầu của một loại tài sản lớn nhưng lại có độ sâu thanh khoản của một giai đoạn đầu."
Nói cách khác — mức độ đáng tin cậy của "xác suất" trong giá cả phụ thuộc vào việc có bao nhiêu thanh khoản thực tế đang hỗ trợ nó. Chúng ta sẽ quay lại điểm này ở Cảnh thứ ba.
Cảnh 2 · Xác suất trong mô phỏng: Mô hình sản xuất xác suất như thế nào
Siêu máy tính Opta đi theo một con đường khác. Nó sử dụng dữ liệu đội bóng — phong độ, thành tích lịch sử, bảng xếp hạng thế giới, thành tích gần đây trong các trận đấu quốc tế — thông qua Power Rankings (một thuật toán xếp hạng phát triển từ Elo) để ước tính xác suất thắng, hòa, thua của mỗi trận đấu, sau đó mô phỏng toàn bộ World Cup 10.000 lần, đếm số lần mỗi đội vô địch trong các lần mô phỏng đó, tần suất đó chính là "xác suất vô địch" của họ.
Kết quả cho năm 2026 (chỉ trình bày sự kiện, không dự đoán kết quả): Tây Ban Nha 16,1% (cũng là đội duy nhất có xác suất vào tứ kết trên 50%, 52,1%), Pháp 13,0%, Anh trên 10%, nhà đương kim vô địch Argentina xếp thứ tư cũng trên 10%, Bồ Đào Nha 7,0%, Brazil 6,6%.
Có một chi tiết phương pháp luận trái với trực giác đáng được chỉ ra ở đây: Một trong các đầu vào của mô hình Opta, chính là tỷ lệ cược từ thị trường cá cược. Nghĩa là, sự so sánh "thị trường vs mô hình" này không phải là hai hệ thống hoàn toàn độc lập — mô hình đã "hấp thụ" một phần thông tin từ thị trường. Khi bạn so sánh giá thị trường với xác suất của Opta, sự khác biệt bạn thấy nhỏ hơn so với "sự phân kỳ giữa hai nguồn độc lập".
Cần làm rõ một vấn đề về tính thời sự: Mô hình bóng đá FiveThirtyEight (SPI) uy tín trong ký ức của nhiều người, đã ngừng cập nhật sau khi nhà sáng lập Nate Silver rời đi vào năm 2023; trang web nguyên bản đóng cửa vào tháng 9 năm 2023, toàn bộ 538 bị ABC đóng cửa vào tháng 3 năm 2025. Bài viết này chỉ coi nó như một tư liệu lịch sử về phương pháp luận và để so sánh với hai kỳ World Cup 2018 và 2022, chứ không phải là nguồn dự đoán hiện hành cho năm 2026.
Cảnh 3 · Cái nào chính xác hơn? Một khoảng trống trung thực
Thị trường và mô hình, cái nào chính xác hơn?
Câu trả lời trung thực là: Không có một nghiên cứu học thuật nghiêm ngặt nào xuyên các kỳ trực tiếp so sánh điểm số Brier (thước đo tiêu chuẩn về độ chính xác dự đoán) giữa thị trường dự đoán và Opta/538 ở hai kỳ World Cup 2018 và 2022. Những con số như "độ chính xác 90%" do chính các nền tảng tuyên truyền, phần lớn đến từ bản thân nền tảng hoặc các blog không được đánh giá ngang hàng, không thể được coi là kết luận độc lập. Bài viết này nêu rõ khoảng trống này, không bịa đáp án.
Nhưng có một trường hợp thường bị hiểu sai đáng được sửa chữa. Nhiều người nói "Argentina vô địch năm 2022 là một bất ngờ lớn" — Điều này không chính xác. Trước giải, Argentina là ứng cử viên số hai hoặc số ba: Opta cho 13,1% (thứ hai), thị trường cá cược đưa ra tỷ lệ +500 (khoảng 16,7%, thứ hai). Câu chuyện thực sự không phải là "vô địch bất ngờ", mà là — Hầu như tất cả các mô hình và thị trường chủ lưu đều đặt cược vào Brazil, kết quả ứng cử viên số hai Argentina vô địch; và kẻ ngoại lệ duy nhất hạ xác suất Argentina xuống khoảng 8%, chính là FiveThirtyEight. Điều này chính xác hơn, và cũng nói lên vấn đề hơn "vô địch bất ngờ": Cái gọi là "xác suất uy tín", giữa các nguồn khác nhau có thể chênh lệch gấp đôi.
Bản thân giá cả cũng không phải là xác suất hoàn hảo. Một hiện tượng đã được kiểm chứng lặp đi lặp lại gần trăm năm gọi là longshot bias (thiên lệch cửa trên - cửa dưới): Trong thị trường cá cược đua ngựa kinh điển, người đặt cược có xu hướng đánh giá quá cao cửa dưới, đánh giá thấp cửa trên một cách có hệ thống — tỷ lệ thắng thực tế của ngựa cửa dưới thấp hơn so với tỷ lệ cược hiển thị, nên về lâu dài đặt cược vào cửa dưới thua lỗ nhiều hơn (nghiên cứu của Snowberg và Wolfers).
Điều thực sự trái với trực giác là: Thiên lệch này trong thị trường dự đoán bằng tiền mã hóa, vốn được cho là hợp lý hơn, hiệu quả hơn, vẫn không biến mất. Nhiều nghiên cứu dựa trên dữ liệu khổng lồ từ Polymarket, Kalshi đều phát hiện ra thiên lệch theo cùng một hướng — Đại học College Dublin phân tích hơn 300.000 hợp đồng Kalshi, phát hiện tỷ lệ thực hiện thực tế của hợp đồng giá thấp thấp hơn xác suất ngầm định trong giá của chúng, trong khi hợp đồng giá cao lại cao hơn (tức cửa dưới vẫn bị đánh giá quá cao); một nghiên cứu hiệu chỉnh dựa trên 292 triệu giao dịch (bản in trước arXiv 2602.19520) cũng phát hiện, giá của hợp đồng chu kỳ dài bị nén một cách có hệ thống về phía 50%, đánh giá thấp lợi thế thực sự của cửa trên. Một bản in trước về vi cấu trúc dựa trên 30 tỷ sự kiện sổ lệnh, dữ liệu 52 ngày (arXiv 2604.24366) đã định lượng được cái giá ở phía cửa dưới: Chênh lệch giá chào của các hợp đồng có xác suất thấp nhất lên tới 1.300 đến 1.800 điểm cơ bản, gấp một bậc độ lớn so với thị trường truyền thống — gốc rễ là việc các nhà tạo lập thị trường định giá rủi ro tồn kho với đặc điểm "tăng có giới hạn, giảm không đối xứng".
Nói cách khác: Một thiên lệch được ghi nhận từ một trăm năm trước tại trường đua ngựa, vẫn đúng trong thị trường trên chuỗi ngày nay với khối lượng giao dịch hàng chục tỷ đô la — cái "xác suất" trong giá cả đó, càng gần phía cửa dưới, càng không đáng tin cậy.
Sổ cái là công khai
Có một điều mà cá cược truyền thống không làm được: Polymarket được xây dựng trên hợp đồng thông minh Ethereum, mọi giao dịch đều ở trên chuỗi, ai cũng có thể kiểm toán. Hai nghiên cứu trên có thể thực hiện được chính vì các nhà nghiên cứu có thể trực tiếp khôi phục hướng của mỗi giao dịch từ hồ sơ giao dịch trên chuỗi — điều này là không thể trong cá cược truyền thống với sổ cái khép kín. Thanh toán cũng diễn ra trên chuỗi: sử dụng USDC làm tài sản thế chấp, hợp đồng thông minh tự động thanh toán, không cần tin tưởng một nhà cái tập trung giữ tiền cho bạn.
Nhưng minh bạch không có nghĩa là không thể thao túng. Sổ lệnh nông đồng nghĩa với việc thị trường nhỏ dễ bị đẩy giá bởi một lượng vốn nhỏ. Trong thời gian diễn ra giải đấu (từ 11 tháng 6 đến 19 tháng 7), giá của hợp đồng cho từng trận đấu sẽ trôi dạt theo tỷ số thời gian thực — đó sẽ là ví dụ sinh động sống động nhất về "giá cả hình thành như thế nào".
Cảnh 4 · Biến số ngoài giá cả: Quy định
Giá cả còn chịu ảnh hưởng của một biến số phi thị trường: Sự không chắc chắn về quy định.
Ngày 18 tháng 5 năm 2026, Thống đốc bang Minnesota ký ban hành dự luật SF4760, trở thành bang đầu tiên của Mỹ quy định việc vận hành và quảng cáo thị trường dự đoán là trọng tội (có hiệu lực từ ngày 1 tháng 8 năm 2026). CFTC (Ủy ban Giao dịch Hàng hóa Tương lai Mỹ) đã khởi kiện trong vòng 24 giờ, Kalshi khởi kiện vào ngày 28 tháng 5. Tuyên bố của Chủ tịch CFTC Michael Selig là:
"Luật Minnesota này biến những nhà điều hành và người tham gia hợp pháp vào thị trường dự đoán thành trọng tội chỉ sau một đêm."
Đằng sau đó là một cuộc tranh chấp thẩm quyền chưa được giải quyết: Tòa phúc thẩm Vòng thứ ba phán Kalshi thắng kiện vào ngày 7 tháng 4 (hợp đồng sự kiện thuộc phái sinh, thuộc quyền quản lý của CFTC), Tòa phúc thẩm Vòng thứ chín xét xử kháng cáo của Nevada vào ngày 16 tháng 4, có xu hướng nghiêng về Nevada — sự phân kỳ giữa hai tòa phúc thẩm cuối cùng có thể được đưa lên Tòa án Tối cao. Tính đến thời điểm hiện tại, 17 bang đang thách thức các nhà điều hành thị trường dự đoán, 14 bang có luật liên quan; Tây Ban Nha vào năm 2026 đã ra lệnh cho các nhà cung cấp dịch vụ Internet chặn Polymarket và Kalshi.
Cần phân biệt nghiêm ngặt hai việc ở đây: Thị trường dự đoán đi theo con đường quy định liên bang của CFTC về hợp đồng sự kiện, trong khi cá cược thể thao đi theo con đường cấp phép của từng bang — cùng một hợp đồng World Cup, tính hợp pháp ở các khu vực pháp lý khác nhau hoàn toàn khác biệt. Bản thân sự không chắc chắn về quy định, chính là một biến số đằng sau giá cả.
Kết luận · Trở lại với hai con số đó
Trở lại với mở đầu — "Pháp 17%" và "Tây Ban Nha 16,1%".
Giờ bạn đã biết hai con số này đến từ đâu: một là mức giá được hình thành từ khối lượng giao dịch hàng trăm triệu đô la trên thị trường, chịu ảnh hưởng của thiên lệch longshot và độ sâu thanh khoản; một là tần suất được đếm ra từ việc siêu máy tính mô phỏng cả giải đấu mười nghìn lần, chịu ảnh hưởng của độ trễ mô hình, và đã hấp thụ một phần thông tin từ thị trường.
Cái nào chính xác hơn? Không có một so sánh nghiêm ngặt xuyên các kỳ nào có thể trả lời câu hỏi này. Sau khi World Cup kết thúc và hợp đồng được thanh toán vào ngày 20 tháng 7, sẽ có một bài phân tích hậu kỳ — xem thị trường và mô hình đã nói đúng điều gì, nói sai điều gì.
Trước thời điểm đó, khi bạn lại thấy bất kỳ một "xác suất vô địch" nào, đáng để hỏi thêm một câu: Con số này được sản xuất ra như thế nào?






