Taburan Poisson dan Pemodelan Gol dalam Bola Sepak

Oleh Tactiq AI · 2026-05-07 · Baca 9 minit · AI & Bola Sepak

Jika anda pernah menonton rancangan pratonton perlawanan di mana hos berkata "perlawanan ini mempunyai garisan jangkaan gol 2.3, yang membayangkan peluang 61% untuk Lebih 2.5," anda menyaksikan aritmetik Poisson dalam tindakan. Jika anda pernah melihat tiga kebarangkalian (kemenangan tuan rumah 58%, seri 25%, kemenangan pelawat 17%) yang seolah-olah keluar dari mana-mana, pengiraan yang menghasilkannya hampir pasti simulasi Poisson.

Poisson ialah enjin statistik di bawah kebanyakan model gol bola sepak. Ia telah berada di sana selama 50 tahun, secara senyap menjana nombor kebarangkalian yang kemudian digambarkan dengan perbendaharaan kata yang lebih bergaya. Memahami cara ia berfungsi mendemistifikasi banyak perkara yang sebenarnya dilakukan oleh "analisis bola sepak AI" di sebalik tabir.

Artikel ini meneliti Poisson dalam bahasa biasa, menunjukkan bagaimana ia digunakan untuk bola sepak secara khusus, di mana ia berfungsi, di mana ia tidak, dan apa yang ditambah oleh penambahbaikan moden di atasnya.

Apa sebenarnya Poisson

Taburan Poisson menggambarkan kebarangkalian beberapa bilangan peristiwa berlaku dalam tetingkap masa tetap, diberikan kadar purata.

Secara formal: jika peristiwa berlaku pada kadar purata malar λ (lambda) setiap unit masa, dan ia berlaku secara bebas antara satu sama lain, maka kebarangkalian tepat k peristiwa berlaku dalam tetingkap itu ialah:

P(k) = (λ^k × e^(-λ)) / k!

Anda tidak perlu menyukai matematik. Makna praktikal:

  • λ = 1 bermakna peristiwa berpurata sekali setiap tetingkap. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 bermakna dua kali setiap tetingkap. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 bermakna tiga kali setiap tetingkap. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Taburan menangkap bahawa purata adalah satu perkara, tetapi hasil khusus berkelompok di sekitar purata itu dengan kebarangkalian yang diketahui. Apabila λ = 2, anda menjangkakan 2, tetapi 0 dan 3 dan 4 semua berlaku dengan peratusan yang bermakna.

Mengapa Poisson sesuai dengan pemarkahan gol bola sepak

Tiga sebab andaian itu kasarnya berlaku untuk bola sepak.

Gol jarang berlaku. Kebanyakan perlawanan menyaksikan 0-5 gol. Poisson mengendalikan julat 0-5 dengan bersih; ia berpecah pada kiraan sangat tinggi, tetapi bola sepak jarang menguji itu.

Gol berlaku pada masa yang agak bebas. Setelah anda membuang kesan keadaan permainan (yang akan kita bincangkan), gol dalam perlawanan berlaku pada kadar yang agak malar. Gol pada minit ke-10 tidak mengubah kebarangkalian gol pada minit ke-40 setajam yang anda mungkin fikirkan.

Kadar boleh diperoleh daripada kualiti pasukan. Jika kadar pemarkahan purata Pasukan A ialah 1.5 gol/perlawanan dan kadar pertahanan Pasukan B kebobolan 1.2 gol/perlawanan, jangkaan gol untuk Pasukan A dalam perlawanan ini ialah beberapa campuran berwajaran (1.5 × 1.2 / purata-liga, dengan penskalaan kelebihan tuan rumah). Poisson mengambil λ itu dan menghasilkan taburan penuh.

Gabungkan ini dan anda dapat model yang boleh dilaksanakan: untuk setiap perlawanan, perolehi kadar jangkaan untuk kedua-dua pihak, gunakan Poisson pada setiap satu untuk menghasilkan taburan kiraan gol, gabungkan ke dalam matriks hasil (kemenangan tuan rumah / seri / kemenangan pelawat / Lebih 2.5 / BTTS / dll.).

Bagaimana Poisson membina tiga kebarangkalian

Untuk perlawanan antara Pasukan A (jangkaan gol 1.8) dan Pasukan B (jangkaan gol 1.2), simulasi:

  1. Menggunakan Poisson dengan λ=1.8 untuk Pasukan A, kira P(Pasukan A skor 0), P(1), P(2), P(3), P(4), P(5+).
  2. Menggunakan Poisson dengan λ=1.2 untuk Pasukan B, kira yang sama untuk Pasukan B.
  3. Mengandaikan kebebasan (andaian Poisson pertama), darab: P(Pasukan A skor N dan Pasukan B skor M) = P(A=N) × P(B=M).
  4. Jumlahkan ke atas N > M untuk kemenangan tuan rumah, N = M untuk seri, N < M untuk kemenangan pelawat.
  5. Normalkan jika perlu.

Hasilnya: tiga kebarangkalian untuk perlawanan, diperoleh sepenuhnya daripada dua nombor jangkaan gol. Padanan yang sesuai untuk kebanyakan perlawanan.

Ini adalah apa yang biasanya menjadi "model analisis berasaskan xG" pada bentuk paling mudahnya: dua nombor masuk, satu taburan kebarangkalian keluar, Poisson sebagai enjin.

Di mana Poisson berpecah

Empat mod kegagalan sebenar yang pemodelan moden cuba betulkan.

Kebergantungan keadaan permainan. Pasukan yang mengejar defisit 0-1 dalam 20 minit terakhir bermain berbeza. Kadar gol mereka meningkat melebihi jangkaan pra-perlawanan; kadar lawan mereka kekal serupa tetapi kesilapan pertahanan mencetuskan peluang dikebobolan. Poisson bebas dengan kadar malar kurang menganalisis kekerapan kebangkitan dan terlalu menganalisis penguasaan keadaan tetap.

Inflasi seri. Dalam perlawanan pemarkahan rendah (λ di bawah 1.5 setiap pihak), Poisson terlalu menganalisis 1-1 dan 0-0 secara serentak, kurang menganalisis seri secara keseluruhan. Dixon dan Coles mencadangkan pembetulan pada 1997 yang melaraskan sel skor rendah matriks hasil. Kebanyakan model pengeluaran menggunakan Dixon-Coles atau yang serupa.

Korelasi antara pasukan. Gol satu pasukan tidak sepenuhnya bebas daripada yang lain. Pihak yang kebobolan awal selalunya menurun kualitinya semasa perlawanan berterusan. Model Poisson bivariate menambah parameter korelasi kecil. Tanpa itu, hasil bersama dianggap terlalu bebas.

Skor ekstrem. Ekor kanan taburan Poisson (5-0, 6-0, 7-0) nipis dalam Poisson mentah tetapi diperhatikan lebih kerap dalam amalan dalam pertandingan tidak sepadan. Model moden menggunakan pembetulan ekor atau menggunakan taburan binomial negatif, yang mempunyai purata sama dengan Poisson tetapi membenarkan lebih banyak varians.

Peraturan boleh guna: Poisson mentah ialah asas berguna tetapi model pengeluaran sentiasa menambah penambahbaikan. Penambahbaikan tidak mengubah tafsiran (tiga kebarangkalian, Lebih/Kurang, BTTS) tetapi ia mengetatkan nombor terhadap realiti.

Poisson melebihi kebarangkalian hasil

Matematik Poisson membolehkan beberapa metrik hiliran:

Jangkaan mata (xPts). Untuk setiap perlawanan, simulasikan taburan hasil melalui Poisson, kira jangkaan mata untuk setiap pihak. Jumlahkan merentas musim, anda dapat xPts.

Jangkaan gol untuk/menentang sepanjang tetingkap. Sejarah xG pasukan digabungkan dengan Poisson menghasilkan taburan kebarangkalian jumlah gol musim mereka.

Garisan adil handicap Asia. Menterjemah xG ke dalam odds handicap Asia menggunakan simulasi Poisson untuk taburan perbezaan gol.

Kebarangkalian Lebih/Kurang dan BTTS. Semua boleh diperoleh daripada matriks hasil yang dibina simulasi Poisson.

Dengan berkesan, sebaik sahaja anda mempunyai xG setiap pasukan (atau kadar pemarkahan jangkaan), Poisson memberi anda seluruh permukaan kebarangkalian perlawanan, bukan hanya tiga menang/seri/kalah.

Bagaimana Tactiq mengendalikan pemodelan gol gaya Poisson

Analisis Tactiq menggunakan anggaran kebarangkalian berasaskan simulasi sebagai sebahagian daripada saluran paipnya untuk menghasilkan tiga kebarangkalian yang dipaparkan pada kad perlawanan. Pendekatan khusus, penambahbaikan yang digunakan ke atas Poisson asas, dan cara simulasi mengendalikan interaksi keadaan permainan dan kualiti lawan kekal dalam produk.

Untuk pengguna, kesannya ialah tiga kebarangkalian pada kad perlawanan mencerminkan taburan hasil yang disimulasikan berasaskan anggaran jangkaan gol dan isyarat kekuatan pasukan, bukan heuristik berkod tangan. Penunjuk keyakinan mencerminkan sejauh mana taburan itu sensitif kepada perubahan kecil dalam isyarat input untuk perlawanan khusus itu.

Apa yang pengguna lihat pada kad perlawanan:

  • Tiga kebarangkalian untuk hasil, dihasilkan melalui simulasi.
  • Jangkaan gol untuk setiap pihak dengan trend baru-baru ini.
  • Analisis bertulis yang menamakan hasil dalam bahasa biasa: "Pihak tuan rumah masuk dengan kelebihan sederhana dalam jangkaan gol, yang diterjemahkan kepada pembahagian kebarangkalian kira-kira 52-25-23."
  • Tiada data pasaran luar di mana-mana. Tiada pengalihan ke platform pihak ketiga. Tiada mata wang maya. Analisis statistik sahaja.

Pengajaran utama

Poisson ialah kuda kerja statistik di sebalik kebanyakan pemodelan gol bola sepak. Ia cukup mudah untuk dikira dengan cepat, cukup baik untuk muat kebanyakan perlawanan, dan asas di mana penambahbaikan yang lebih canggih (Dixon-Coles, bivariate, binomial negatif) dibina.

Memahami Poisson mendemistifikasi tiga kebarangkalian yang anda lihat pada setiap papan pemuka analitikal. Ia bukan sihir; ia simulasi daripada input jangkaan gol. Apa yang memisahkan model baik daripada buruk ialah penambahbaikan yang membetulkan kelemahan diketahui Poisson.

Tactiq menggunakan anggaran kebarangkalian berasaskan simulasi dengan penambahbaikan digunakan untuk mengendalikan kerumitan perlawanan sebenar. Analisis menonjolkan tiga kebarangkalian yang dikalibrasi pada setiap kad perlawanan. 1,200 lebih pertandingan, penyetempatan 32 bahasa, peringkat percuma lapan analisis sehari, tiada kad kredit diperlukan.

Jika anda telah mengikuti siri ini, perbendaharaan kata metrik kini meliputi bagaimana AI menganalisis perlawanan bola sepak, xG, xA, npxG, PPDA, Field Tilt, aksi progresif, SCA/GCA, xPts, penarafan Elo dan kalibrasi Brier score. Poisson ialah enjin kebarangkalian yang mengikat kebanyakan metrik sebelumnya bersama-sama apabila analisis perlu dihasilkan.

Soalan lazim

Apakah taburan Poisson dalam satu ayat?
Poisson menggambarkan kekerapan peristiwa jarang berlaku dalam tempoh tetap, diberikan kadar purata. Dalam bola sepak, 'peristiwa jarang' ialah gol, 'tempoh tetap' ialah 90 minit, dan 'kadar' diperoleh daripada kualiti pasukan, xG, atau konteks perlawanan. Taburan memberitahu anda kebarangkalian 0 gol, 1 gol, 2 gol, dan seterusnya.
Mengapa Poisson menjadi lalai untuk gol bola sepak?
Tiga sebab. Gol agak jarang (purata sekitar 2.5 setiap perlawanan dalam liga teratas). Ia berlaku pada masa yang agak rawak dalam perlawanan dengan sedikit pengelompokan setelah anda membetulkan keadaan permainan. Dan matematik Poisson cukup mudah untuk dikira dengan cepat, menjadikannya praktikal untuk mensimulasi beribu-ribu kemungkinan hasil perlawanan. Gabungan ini menjadikannya kuda kerja untuk pemodelan bola sepak.
Apakah input untuk model gol Poisson?
Dua kadar: satu untuk setiap pasukan. Pendekatan paling biasa memperoleh kadar daripada kekuatan pasukan (kadar serangan tolak kadar pertahanan lawan, dengan kelebihan tuan rumah dimasukkan). Varian moden memberikan nilai xG-setiap-perlawanan dan bukan kadar berasaskan menang, menghasilkan taburan yang lebih responsif dan tepat.
Di mana Poisson berpecah?
Tiga mod kegagalan utama. Keadaan akhir permainan: pasukan yang mengejar defisit bermain berbeza daripada yang mempertahankan pendahuluan, jadi kadar gol tidak malar sepanjang 90 minit. Korelasi antara pasukan: jika satu pihak kebobolan gol lewat, mereka selalunya kebobolan lagi dalam fasa sama, yang Poisson anggap bebas. Perlawanan pemarkahan sangat rendah atau sangat tinggi: ekor Poisson kurang mewakili hasil ekstrem.
Adakah Tactiq menggunakan Poisson secara langsung dalam analisis?
Anggaran kebarangkalian berasaskan simulasi ialah salah satu daripada beberapa teknik yang menyumbang kepada tiga kebarangkalian yang dipaparkan pada kad perlawanan. Pendekatan simulasi khusus, cara kadar diperoleh, dan cara model mengendalikan kelemahan diketahui Poisson kekal dalam produk. Untuk pengguna, kesannya ialah tiga kebarangkalian pada skrin mencerminkan taburan hasil yang disimulasikan, bukan peraturan berkod tangan.
Adakah terdapat alternatif yang lebih baik daripada Poisson?
Binomial negatif, Poisson bivariate, Dixon-Coles (yang menambah korelasi untuk perlawanan pemarkahan rendah), dan taburan Skellam semua telah dicadangkan sebagai penambahbaikan. Setiap satu menangkap kelemahan khusus Poisson asas dengan kos kerumitan tambahan. Kebanyakan model bola sepak pengeluaran menggunakan salah satu daripada penambahbaikan ini dan bukan Poisson mentah.