Taburan Poisson dan Pemodelan Gol dalam Bola Sepak
Jika anda pernah menonton rancangan pratonton perlawanan di mana hos berkata "perlawanan ini mempunyai garisan jangkaan gol 2.3, yang membayangkan peluang 61% untuk Lebih 2.5," anda menyaksikan aritmetik Poisson dalam tindakan. Jika anda pernah melihat tiga kebarangkalian (kemenangan tuan rumah 58%, seri 25%, kemenangan pelawat 17%) yang seolah-olah keluar dari mana-mana, pengiraan yang menghasilkannya hampir pasti simulasi Poisson.
Poisson ialah enjin statistik di bawah kebanyakan model gol bola sepak. Ia telah berada di sana selama 50 tahun, secara senyap menjana nombor kebarangkalian yang kemudian digambarkan dengan perbendaharaan kata yang lebih bergaya. Memahami cara ia berfungsi mendemistifikasi banyak perkara yang sebenarnya dilakukan oleh "analisis bola sepak AI" di sebalik tabir.
Artikel ini meneliti Poisson dalam bahasa biasa, menunjukkan bagaimana ia digunakan untuk bola sepak secara khusus, di mana ia berfungsi, di mana ia tidak, dan apa yang ditambah oleh penambahbaikan moden di atasnya.
Apa sebenarnya Poisson
Taburan Poisson menggambarkan kebarangkalian beberapa bilangan peristiwa berlaku dalam tetingkap masa tetap, diberikan kadar purata.
Secara formal: jika peristiwa berlaku pada kadar purata malar λ (lambda) setiap unit masa, dan ia berlaku secara bebas antara satu sama lain, maka kebarangkalian tepat k peristiwa berlaku dalam tetingkap itu ialah:
P(k) = (λ^k × e^(-λ)) / k!
Anda tidak perlu menyukai matematik. Makna praktikal:
- λ = 1 bermakna peristiwa berpurata sekali setiap tetingkap. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
- λ = 2 bermakna dua kali setiap tetingkap. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
- λ = 3 bermakna tiga kali setiap tetingkap. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.
Taburan menangkap bahawa purata adalah satu perkara, tetapi hasil khusus berkelompok di sekitar purata itu dengan kebarangkalian yang diketahui. Apabila λ = 2, anda menjangkakan 2, tetapi 0 dan 3 dan 4 semua berlaku dengan peratusan yang bermakna.
Mengapa Poisson sesuai dengan pemarkahan gol bola sepak
Tiga sebab andaian itu kasarnya berlaku untuk bola sepak.
Gol jarang berlaku. Kebanyakan perlawanan menyaksikan 0-5 gol. Poisson mengendalikan julat 0-5 dengan bersih; ia berpecah pada kiraan sangat tinggi, tetapi bola sepak jarang menguji itu.
Gol berlaku pada masa yang agak bebas. Setelah anda membuang kesan keadaan permainan (yang akan kita bincangkan), gol dalam perlawanan berlaku pada kadar yang agak malar. Gol pada minit ke-10 tidak mengubah kebarangkalian gol pada minit ke-40 setajam yang anda mungkin fikirkan.
Kadar boleh diperoleh daripada kualiti pasukan. Jika kadar pemarkahan purata Pasukan A ialah 1.5 gol/perlawanan dan kadar pertahanan Pasukan B kebobolan 1.2 gol/perlawanan, jangkaan gol untuk Pasukan A dalam perlawanan ini ialah beberapa campuran berwajaran (1.5 × 1.2 / purata-liga, dengan penskalaan kelebihan tuan rumah). Poisson mengambil λ itu dan menghasilkan taburan penuh.
Gabungkan ini dan anda dapat model yang boleh dilaksanakan: untuk setiap perlawanan, perolehi kadar jangkaan untuk kedua-dua pihak, gunakan Poisson pada setiap satu untuk menghasilkan taburan kiraan gol, gabungkan ke dalam matriks hasil (kemenangan tuan rumah / seri / kemenangan pelawat / Lebih 2.5 / BTTS / dll.).
Bagaimana Poisson membina tiga kebarangkalian
Untuk perlawanan antara Pasukan A (jangkaan gol 1.8) dan Pasukan B (jangkaan gol 1.2), simulasi:
- Menggunakan Poisson dengan λ=1.8 untuk Pasukan A, kira P(Pasukan A skor 0), P(1), P(2), P(3), P(4), P(5+).
- Menggunakan Poisson dengan λ=1.2 untuk Pasukan B, kira yang sama untuk Pasukan B.
- Mengandaikan kebebasan (andaian Poisson pertama), darab: P(Pasukan A skor N dan Pasukan B skor M) = P(A=N) × P(B=M).
- Jumlahkan ke atas N > M untuk kemenangan tuan rumah, N = M untuk seri, N < M untuk kemenangan pelawat.
- Normalkan jika perlu.
Hasilnya: tiga kebarangkalian untuk perlawanan, diperoleh sepenuhnya daripada dua nombor jangkaan gol. Padanan yang sesuai untuk kebanyakan perlawanan.
Ini adalah apa yang biasanya menjadi "model analisis berasaskan xG" pada bentuk paling mudahnya: dua nombor masuk, satu taburan kebarangkalian keluar, Poisson sebagai enjin.
Di mana Poisson berpecah
Empat mod kegagalan sebenar yang pemodelan moden cuba betulkan.
Kebergantungan keadaan permainan. Pasukan yang mengejar defisit 0-1 dalam 20 minit terakhir bermain berbeza. Kadar gol mereka meningkat melebihi jangkaan pra-perlawanan; kadar lawan mereka kekal serupa tetapi kesilapan pertahanan mencetuskan peluang dikebobolan. Poisson bebas dengan kadar malar kurang menganalisis kekerapan kebangkitan dan terlalu menganalisis penguasaan keadaan tetap.
Inflasi seri. Dalam perlawanan pemarkahan rendah (λ di bawah 1.5 setiap pihak), Poisson terlalu menganalisis 1-1 dan 0-0 secara serentak, kurang menganalisis seri secara keseluruhan. Dixon dan Coles mencadangkan pembetulan pada 1997 yang melaraskan sel skor rendah matriks hasil. Kebanyakan model pengeluaran menggunakan Dixon-Coles atau yang serupa.
Korelasi antara pasukan. Gol satu pasukan tidak sepenuhnya bebas daripada yang lain. Pihak yang kebobolan awal selalunya menurun kualitinya semasa perlawanan berterusan. Model Poisson bivariate menambah parameter korelasi kecil. Tanpa itu, hasil bersama dianggap terlalu bebas.
Skor ekstrem. Ekor kanan taburan Poisson (5-0, 6-0, 7-0) nipis dalam Poisson mentah tetapi diperhatikan lebih kerap dalam amalan dalam pertandingan tidak sepadan. Model moden menggunakan pembetulan ekor atau menggunakan taburan binomial negatif, yang mempunyai purata sama dengan Poisson tetapi membenarkan lebih banyak varians.
Peraturan boleh guna: Poisson mentah ialah asas berguna tetapi model pengeluaran sentiasa menambah penambahbaikan. Penambahbaikan tidak mengubah tafsiran (tiga kebarangkalian, Lebih/Kurang, BTTS) tetapi ia mengetatkan nombor terhadap realiti.
Poisson melebihi kebarangkalian hasil
Matematik Poisson membolehkan beberapa metrik hiliran:
Jangkaan mata (xPts). Untuk setiap perlawanan, simulasikan taburan hasil melalui Poisson, kira jangkaan mata untuk setiap pihak. Jumlahkan merentas musim, anda dapat xPts.
Jangkaan gol untuk/menentang sepanjang tetingkap. Sejarah xG pasukan digabungkan dengan Poisson menghasilkan taburan kebarangkalian jumlah gol musim mereka.
Garisan adil handicap Asia. Menterjemah xG ke dalam odds handicap Asia menggunakan simulasi Poisson untuk taburan perbezaan gol.
Kebarangkalian Lebih/Kurang dan BTTS. Semua boleh diperoleh daripada matriks hasil yang dibina simulasi Poisson.
Dengan berkesan, sebaik sahaja anda mempunyai xG setiap pasukan (atau kadar pemarkahan jangkaan), Poisson memberi anda seluruh permukaan kebarangkalian perlawanan, bukan hanya tiga menang/seri/kalah.
Bagaimana Tactiq mengendalikan pemodelan gol gaya Poisson
Analisis Tactiq menggunakan anggaran kebarangkalian berasaskan simulasi sebagai sebahagian daripada saluran paipnya untuk menghasilkan tiga kebarangkalian yang dipaparkan pada kad perlawanan. Pendekatan khusus, penambahbaikan yang digunakan ke atas Poisson asas, dan cara simulasi mengendalikan interaksi keadaan permainan dan kualiti lawan kekal dalam produk.
Untuk pengguna, kesannya ialah tiga kebarangkalian pada kad perlawanan mencerminkan taburan hasil yang disimulasikan berasaskan anggaran jangkaan gol dan isyarat kekuatan pasukan, bukan heuristik berkod tangan. Penunjuk keyakinan mencerminkan sejauh mana taburan itu sensitif kepada perubahan kecil dalam isyarat input untuk perlawanan khusus itu.
Apa yang pengguna lihat pada kad perlawanan:
- Tiga kebarangkalian untuk hasil, dihasilkan melalui simulasi.
- Jangkaan gol untuk setiap pihak dengan trend baru-baru ini.
- Analisis bertulis yang menamakan hasil dalam bahasa biasa: "Pihak tuan rumah masuk dengan kelebihan sederhana dalam jangkaan gol, yang diterjemahkan kepada pembahagian kebarangkalian kira-kira 52-25-23."
- Tiada data pasaran luar di mana-mana. Tiada pengalihan ke platform pihak ketiga. Tiada mata wang maya. Analisis statistik sahaja.
Pengajaran utama
Poisson ialah kuda kerja statistik di sebalik kebanyakan pemodelan gol bola sepak. Ia cukup mudah untuk dikira dengan cepat, cukup baik untuk muat kebanyakan perlawanan, dan asas di mana penambahbaikan yang lebih canggih (Dixon-Coles, bivariate, binomial negatif) dibina.
Memahami Poisson mendemistifikasi tiga kebarangkalian yang anda lihat pada setiap papan pemuka analitikal. Ia bukan sihir; ia simulasi daripada input jangkaan gol. Apa yang memisahkan model baik daripada buruk ialah penambahbaikan yang membetulkan kelemahan diketahui Poisson.
Tactiq menggunakan anggaran kebarangkalian berasaskan simulasi dengan penambahbaikan digunakan untuk mengendalikan kerumitan perlawanan sebenar. Analisis menonjolkan tiga kebarangkalian yang dikalibrasi pada setiap kad perlawanan. 1,200 lebih pertandingan, penyetempatan 32 bahasa, peringkat percuma lapan analisis sehari, tiada kad kredit diperlukan.
Jika anda telah mengikuti siri ini, perbendaharaan kata metrik kini meliputi bagaimana AI menganalisis perlawanan bola sepak, xG, xA, npxG, PPDA, Field Tilt, aksi progresif, SCA/GCA, xPts, penarafan Elo dan kalibrasi Brier score. Poisson ialah enjin kebarangkalian yang mengikat kebanyakan metrik sebelumnya bersama-sama apabila analisis perlu dihasilkan.