Phân Phối Poisson và Mô Hình Bàn Thắng Trong Bóng Đá
Nếu bạn từng xem một chương trình giới thiệu trận đấu mà người dẫn nói "trận này có dòng bàn thắng kỳ vọng 2.3, ngụ ý xác suất 61% Tài 2.5", bạn đang xem số học Poisson hoạt động. Nếu bạn từng thấy một bộ ba xác suất (chủ thắng 58%, hòa 25%, khách thắng 17%) tưởng như xuất hiện từ hư không, phép tính tạo ra nó gần như chắc chắn là một mô phỏng Poisson.
Poisson là động cơ thống kê dưới hầu hết các mô hình bàn thắng bóng đá. Nó đã ở đó suốt 50 năm, lặng lẽ tạo ra những con số xác suất sau đó được mô tả bằng từ vựng thời thượng hơn. Hiểu cách nó hoạt động làm sáng tỏ rất nhiều thứ mà "phân tích bóng đá AI" thực sự đang làm dưới mui xe.
Bài viết này hướng dẫn Poisson bằng ngôn ngữ rõ ràng, chỉ cách áp dụng cụ thể vào bóng đá, nơi nó hoạt động, nơi không, và những cải tiến hiện đại bổ sung trên đó.
Poisson thực sự là gì
Phân phối Poisson mô tả xác suất một số sự kiện xảy ra trong một cửa sổ thời gian cố định, với một tỷ lệ trung bình cho trước.
Chính thức: nếu các sự kiện xảy ra với tỷ lệ trung bình hằng định λ (lambda) mỗi đơn vị thời gian, và xảy ra độc lập với nhau, thì xác suất chính xác k sự kiện xảy ra trong cửa sổ đó là:
P(k) = (λ^k × e^(-λ)) / k!
Bạn không cần yêu thích toán học. Ý nghĩa thực tế:
- λ = 1 nghĩa là sự kiện trung bình một lần mỗi cửa sổ. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 nghĩa là hai lần mỗi cửa sổ. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 nghĩa là ba lần mỗi cửa sổ. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Phân phối nắm bắt rằng giá trị trung bình là một thứ, nhưng các kết quả cụ thể tụ lại quanh trung bình đó với xác suất đã biết.
Vì sao Poisson phù hợp với việc ghi bàn trong bóng đá
Ba lý do giả định gần đúng cho bóng đá.
Bàn thắng hiếm. Hầu hết các trận thấy 0-5 bàn. Poisson xử lý phạm vi 0-5 sạch sẽ; nó thất bại ở số lượng rất cao, nhưng bóng đá hiếm khi kiểm tra điều đó.
Bàn thắng xảy ra ở thời điểm gần như độc lập. Khi bạn loại bỏ hiệu ứng trạng thái trận (sẽ thảo luận), bàn thắng trong một trận xảy ra ở tỷ lệ gần như hằng định. Một bàn ở phút thứ 10 không thay đổi xác suất bàn ở phút thứ 40 mạnh như bạn có thể nghĩ.
Tỷ lệ có thể được rút ra từ chất lượng đội. Nếu tỷ lệ ghi bàn trung bình của Đội A là 1.5 bàn/trận và tỷ lệ phòng ngự Đội B nhường 1.2 bàn/trận, bàn thắng kỳ vọng cho Đội A trong trận này là một sự pha trộn có trọng số (1.5 × 1.2 / trung bình giải, có quy mô lợi thế sân nhà). Poisson lấy λ đó và tạo ra phân phối đầy đủ.
Kết hợp những điều này và bạn có một mô hình hoạt động: với mỗi trận, rút tỷ lệ kỳ vọng cho cả hai bên, áp dụng Poisson cho mỗi để tạo phân phối số bàn, kết hợp thành ma trận kết quả (chủ thắng / hòa / khách thắng / Tài 2.5 / BTTS / v.v.).
Cách Poisson xây dựng bộ ba xác suất
Với một trận giữa Đội A (bàn thắng kỳ vọng 1.8) và Đội B (bàn thắng kỳ vọng 1.2), mô phỏng:
- Sử dụng Poisson với λ=1.8 cho Đội A, tính P(Đội A ghi 0), P(1), P(2), P(3), P(4), P(5+).
- Sử dụng Poisson với λ=1.2 cho Đội B, tính tương tự.
- Giả định độc lập (giả định Poisson thứ nhất), nhân: P(Đội A ghi N và Đội B ghi M) = P(A=N) × P(B=M).
- Cộng trên N > M cho chủ thắng, N = M cho hòa, N < M cho khách thắng.
- Chuẩn hóa nếu cần.
Kết quả: bộ ba xác suất cho trận đấu, được rút ra hoàn toàn từ hai con số bàn thắng kỳ vọng. Một sự khớp khá tốt cho hầu hết các trận.
Nơi Poisson thất bại
Bốn chế độ thất bại thực sự mà mô hình hóa hiện đại cố gắng sửa.
Phụ thuộc trạng thái trận. Một đội đang đuổi theo thâm hụt 0-1 trong 20 phút cuối chơi khác. Tỷ lệ ghi bàn của họ tăng vượt kỳ vọng trước trận; tỷ lệ của đối phương giữ tương tự nhưng sai lầm phòng ngự kích hoạt cơ hội bị thủng lưới.
Lạm phát hòa. Trong các trận điểm thấp (λ dưới 1.5 mỗi đội), Poisson dự đoán quá mức 1-1 và 0-0 đồng thời, dự đoán dưới mức tổng số trận hòa. Dixon và Coles đã đề xuất một hiệu chỉnh năm 1997.
Tương quan giữa các đội. Bàn của một đội không hoàn toàn độc lập với đội kia. Một đội thủng lưới sớm thường giảm chất lượng khi trận tiếp diễn. Mô hình Bivariate Poisson thêm một tham số tương quan nhỏ.
Tỷ số cực đoan. Phần đuôi phải của phân phối Poisson (5-0, 6-0, 7-0) mỏng trong Poisson thô nhưng được quan sát thường xuyên hơn trong thực tế ở các trận chênh lệch.
Quy tắc sử dụng: Poisson thô là cơ sở hữu ích nhưng các mô hình sản xuất luôn thêm cải tiến.
Poisson vượt ra ngoài xác suất kết quả
Toán Poisson cho phép một số chỉ số xuôi dòng:
Điểm kỳ vọng (xPts). Với mỗi trận, mô phỏng phân phối kết quả qua Poisson, tính điểm kỳ vọng cho mỗi đội.
Bàn thắng/bàn thua kỳ vọng trên một cửa sổ. Lịch sử xG của một đội kết hợp với Poisson tạo ra phân phối xác suất tổng số bàn cả mùa.
Đường kèo châu Á công bằng. Chuyển xG sang đường kèo châu Á sử dụng mô phỏng Poisson cho phân phối hiệu số bàn thắng.
Xác suất Tài/Xỉu và BTTS. Tất cả có thể rút ra từ ma trận kết quả mà mô phỏng Poisson xây dựng.
Cách Tactiq xử lý mô hình bàn thắng kiểu Poisson
Tactiq là phân tích thống kê độc lập, không liên quan đến thị trường bên ngoài. Phân tích sử dụng ước lượng xác suất dựa trên mô phỏng như một phần của quy trình tạo ra bộ ba xác suất hiển thị trên thẻ trận đấu. Cách tiếp cận cụ thể, các cải tiến áp dụng trên Poisson cơ bản, và cách mô phỏng xử lý tương tác trạng thái trận và chất lượng đối phương được giữ trong sản phẩm.
Với người dùng, hiệu ứng là ba xác suất trên thẻ trận đấu phản ánh phân phối kết quả mô phỏng dựa trên ước lượng bàn thắng kỳ vọng và tín hiệu sức mạnh đội, thay vì heuristic lập trình tay. Chỉ báo độ tin cậy phản ánh mức độ nhạy cảm của phân phối với những thay đổi nhỏ trong tín hiệu đầu vào cho trận đấu cụ thể đó.
Người dùng thấy gì trên thẻ trận đấu:
- Bộ ba xác suất cho kết quả, được tạo qua mô phỏng.
- Bàn thắng kỳ vọng cho mỗi đội với xu hướng gần đây.
- Một bài phân tích bằng chữ đặt tên kết quả bằng ngôn ngữ rõ ràng: "Đội chủ nhà bước vào với lợi thế khiêm tốn về bàn thắng kỳ vọng, dịch sang phân chia xác suất khoảng 52-25-23."
- Không có dữ liệu thị trường bên ngoài ở bất cứ đâu. Không chuyển hướng đến nền tảng bên thứ ba. Không tiền ảo. Chỉ phân tích thống kê.
Điểm rút ra
Poisson là con ngựa thồ thống kê dưới hầu hết các mô hình bàn thắng bóng đá. Nó đủ đơn giản để tính nhanh, đủ tốt để khớp với hầu hết trận, và là nền tảng mà các cải tiến tinh vi hơn (Dixon-Coles, bivariate, negative binomial) xây dựng trên.
Hiểu Poisson làm sáng tỏ các bộ ba xác suất bạn thấy trên mọi bảng điều khiển phân tích. Chúng không phải phép thuật; chúng là mô phỏng từ đầu vào bàn thắng kỳ vọng. Cái phân biệt mô hình tốt với mô hình tệ là các cải tiến sửa cho điểm yếu đã biết của Poisson.
Tactiq sử dụng ước lượng xác suất dựa trên mô phỏng với các cải tiến áp dụng để xử lý sự phức tạp trận đấu thực. Phân tích hiển thị bộ ba xác suất đã hiệu chuẩn trên mỗi thẻ trận đấu. Hơn 1,200 giải đấu, bản địa hóa 32 ngôn ngữ, gói miễn phí tám phân tích mỗi ngày, không cần thẻ tín dụng.
Nếu bạn đã theo loạt bài, từ vựng chỉ số giờ trải dài cách AI phân tích các trận bóng đá, xG, xA, npxG, PPDA, Field Tilt, hành động tiến công, SCA/GCA, xPts, Elo ratings và hiệu chuẩn Brier score. Poisson là động cơ xác suất kết nối hầu hết các chỉ số trước đó khi cần tạo ra một phân tích.