Distribusi Poisson dan Pemodelan Gol dalam Sepak Bola

Oleh Tactiq AI · 2026-05-07 · Baca 9 menit · AI & Sepak Bola

Jika Anda pernah menonton acara pratinjau pertandingan di mana pembawa acara mengatakan "fixture ini memiliki garis expected goals 2.3, yang menyiratkan peluang 61% untuk Over 2.5," Anda sedang menyaksikan aritmatika Poisson dalam aksinya. Jika Anda pernah melihat triplet probabilitas (kemenangan tuan rumah 58%, hasil imbang 25%, kemenangan tandang 17%) yang seakan muncul begitu saja, perhitungan yang menghasilkannya hampir pasti adalah simulasi Poisson.

Poisson adalah mesin statistik di balik sebagian besar model gol sepak bola. Ia sudah ada selama 50 tahun, diam-diam menghasilkan angka probabilitas yang kemudian dijelaskan dengan kosakata yang lebih modis. Memahami cara kerjanya menghilangkan banyak misteri dari apa yang sebenarnya dilakukan "analisis sepak bola AI" di balik layar.

Artikel ini membahas Poisson dengan bahasa sederhana, menunjukkan bagaimana ia diterapkan secara khusus pada sepak bola, di mana ia bekerja, di mana tidak, dan apa yang ditambahkan penyempurnaan modern di atasnya.

Apa sebenarnya Poisson itu

Distribusi Poisson menggambarkan probabilitas terjadinya sejumlah peristiwa dalam jendela waktu tetap, mengingat tingkat rata-rata.

Secara formal: jika peristiwa terjadi pada tingkat rata-rata konstan λ (lambda) per unit waktu, dan terjadi secara independen satu sama lain, maka probabilitas tepat k peristiwa terjadi dalam jendela tersebut adalah:

P(k) = (λ^k × e^(-λ)) / k!

Anda tidak perlu menyukai matematikanya. Arti praktisnya:

  • λ = 1 berarti peristiwa rata-rata terjadi sekali per jendela. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 berarti dua kali per jendela. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 berarti tiga kali per jendela. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Distribusi menangkap bahwa rata-rata adalah satu hal, tetapi hasil spesifik berkumpul di sekitar rata-rata itu dengan probabilitas yang diketahui. Saat λ = 2, Anda mengharapkan 2, tetapi 0 dan 3 dan 4 semuanya terjadi pada persentase waktu yang berarti.

Mengapa Poisson cocok dengan pencetakan gol sepak bola

Tiga alasan asumsi tersebut secara kasar berlaku untuk sepak bola.

Gol itu langka. Sebagian besar pertandingan menghasilkan 0-5 gol. Poisson menangani rentang 0-5 dengan baik; ia gagal pada hitungan yang sangat tinggi, tetapi sepak bola jarang menguji itu.

Gol terjadi pada waktu yang kurang lebih independen. Setelah Anda menghapus efek keadaan permainan (yang akan kita bahas), gol dalam pertandingan terjadi pada tingkat yang kurang lebih konstan. Gol di menit ke-10 tidak mengubah probabilitas gol di menit ke-40 setajam yang Anda kira.

Tingkat dapat diturunkan dari kualitas tim. Jika tingkat pencetakan gol rata-rata Tim A adalah 1.5 gol/pertandingan dan tingkat pertahanan Tim B kebobolan 1.2 gol/pertandingan, expected goals untuk Tim A dalam fixture ini adalah perpaduan tertimbang (1.5 × 1.2 / rata-rata-liga, dengan penskalaan keuntungan-tuan-rumah). Poisson mengambil λ tersebut dan menghasilkan distribusi penuh.

Gabungkan ini dan Anda mendapatkan model yang dapat diterapkan: untuk setiap pertandingan, turunkan tingkat yang diharapkan untuk kedua sisi, terapkan Poisson pada masing-masing untuk menghasilkan distribusi jumlah gol, gabungkan menjadi matriks hasil (kemenangan tuan rumah / imbang / kemenangan tandang / Over 2.5 / BTTS / dll.).

Bagaimana Poisson membangun triplet probabilitas

Untuk fixture antara Tim A (expected goals 1.8) dan Tim B (expected goals 1.2), simulasinya:

  1. Menggunakan Poisson dengan λ=1.8 untuk Tim A, hitung P(Tim A mencetak 0), P(1), P(2), P(3), P(4), P(5+).
  2. Menggunakan Poisson dengan λ=1.2 untuk Tim B, hitung hal yang sama untuk Tim B.
  3. Mengasumsikan independensi (asumsi Poisson pertama), kalikan: P(Tim A mencetak N dan Tim B mencetak M) = P(A=N) × P(B=M).
  4. Jumlahkan untuk N > M untuk kemenangan tuan rumah, N = M untuk imbang, N < M untuk kemenangan tandang.
  5. Normalisasi jika diperlukan.

Hasilnya: triplet probabilitas untuk pertandingan, sepenuhnya diturunkan dari dua angka expected-goal. Cocok cukup baik untuk sebagian besar pertandingan.

Inilah yang biasanya dimaksud dengan "model prediksi berbasis xG" pada bentuk paling sederhananya: dua angka masuk, distribusi probabilitas keluar, Poisson sebagai mesinnya.

Di mana Poisson gagal

Empat mode kegagalan nyata yang coba dikoreksi oleh pemodelan modern.

Ketergantungan pada keadaan permainan. Tim yang mengejar defisit 0-1 di 20 menit terakhir bermain berbeda. Tingkat gol mereka naik di atas ekspektasi pra-pertandingan; tingkat lawan tetap serupa tetapi kesalahan defensif memicu peluang yang dikebobolkan. Poisson independen dengan tingkat konstan kurang memprediksi frekuensi comeback dan terlalu memprediksi dominasi keadaan stabil.

Inflasi imbang. Dalam pertandingan dengan skor rendah (λ di bawah 1.5 per sisi), Poisson terlalu memprediksi 1-1 dan 0-0 secara bersamaan, kurang memprediksi imbang secara keseluruhan. Dixon dan Coles mengusulkan koreksi pada tahun 1997 yang menyesuaikan sel skor rendah dari matriks hasil. Sebagian besar model produksi menggunakan Dixon-Coles atau serupa.

Korelasi antar tim. Gol satu tim tidak sepenuhnya independen dari gol tim lain. Tim yang kebobolan lebih awal sering menurun kualitasnya seiring berjalannya pertandingan. Model bivariate Poisson menambahkan parameter korelasi kecil. Tanpa itu, hasil gabungan diperlakukan terlalu independen.

Skor ekstrem. Ekor kanan distribusi Poisson (5-0, 6-0, 7-0) tipis dalam Poisson mentah tetapi diamati lebih sering dalam praktik pada pertandingan tidak seimbang. Model modern menerapkan koreksi ekor atau menggunakan distribusi negative binomial, yang memiliki rata-rata yang sama dengan Poisson tetapi memungkinkan lebih banyak varians.

Aturan yang dapat digunakan: Poisson mentah adalah baseline yang berguna tetapi model produksi selalu menambahkan penyempurnaan. Penyempurnaan tidak mengubah interpretasi (triplet probabilitas, Over/Under, BTTS) tetapi memperketat angka terhadap kenyataan.

Poisson di luar probabilitas hasil

Matematika Poisson memungkinkan beberapa metrik turunan:

Expected points (xPts). Untuk setiap pertandingan, simulasikan distribusi hasil melalui Poisson, hitung expected points untuk setiap sisi. Jumlahkan sepanjang musim, Anda memiliki xPts.

Expected goals untuk/melawan dalam jendela. Riwayat xG tim yang dikombinasikan dengan Poisson menghasilkan distribusi probabilitas total gol musim mereka.

Garis adil Asian handicap. Menerjemahkan xG menjadi peluang Asian handicap menggunakan simulasi Poisson untuk distribusi selisih gol.

Probabilitas Over/Under dan BTTS. Semua dapat diturunkan dari matriks hasil yang dibangun simulasi Poisson.

Akibatnya, setelah Anda memiliki xG per tim (atau tingkat pencetakan gol yang diharapkan), Poisson memberi Anda seluruh permukaan probabilitas pertandingan, bukan hanya triplet menang/imbang/kalah.

Bagaimana Tactiq menangani pemodelan gol bergaya Poisson

Analisis Tactiq menggunakan estimasi probabilitas berbasis simulasi sebagai bagian dari pipelinenya untuk menghasilkan triplet probabilitas yang ditampilkan pada kartu pertandingan. Pendekatan spesifik, penyempurnaan yang diterapkan di atas Poisson dasar, dan bagaimana simulasi menangani interaksi keadaan-permainan dan kualitas-lawan tetap berada di dalam produk.

Bagi pengguna, efeknya adalah tiga probabilitas pada kartu pertandingan mencerminkan distribusi hasil yang disimulasikan berdasarkan estimasi expected-goal dan sinyal kekuatan tim, bukan heuristik yang dikodekan secara manual. Indikator kepercayaan mencerminkan seberapa sensitif distribusi terhadap perubahan kecil pada sinyal input untuk fixture spesifik tersebut.

Apa yang dilihat pengguna pada kartu pertandingan:

  • Triplet probabilitas untuk hasil, dihasilkan melalui simulasi.
  • Expected goals untuk setiap sisi dengan tren terbaru.
  • Analisis tertulis yang menyebutkan hasil dalam bahasa sederhana: "Sisi tuan rumah masuk dengan keunggulan moderat dalam expected goals, yang diterjemahkan menjadi pembagian probabilitas sekitar 52-25-23."
  • Tidak ada data pasar eksternal di mana pun. Tidak ada pengalihan ke platform pihak ketiga. Tidak ada mata uang virtual. Hanya analisis statistik.

Kesimpulan

Poisson adalah andalan statistik di balik sebagian besar pemodelan gol sepak bola. Ia cukup sederhana untuk dihitung dengan cepat, cukup baik untuk menyesuaikan sebagian besar pertandingan, dan fondasi tempat penyempurnaan yang lebih canggih (Dixon-Coles, bivariate, negative binomial) dibangun.

Memahami Poisson menghilangkan misteri dari triplet probabilitas yang Anda lihat di setiap dasbor analitik. Mereka bukan sihir; mereka adalah simulasi dari input expected-goal. Yang membedakan model bagus dari yang buruk adalah penyempurnaan yang mengoreksi kelemahan Poisson yang diketahui.

Tactiq menggunakan estimasi probabilitas berbasis simulasi dengan penyempurnaan yang diterapkan untuk menangani kompleksitas pertandingan nyata. Analisis menampilkan triplet probabilitas yang terkalibrasi pada setiap kartu pertandingan. Lebih dari 1.200 kompetisi, lokalisasi 32 bahasa, tier gratis delapan analisis per hari, tidak memerlukan kartu kredit.

Jika Anda telah mengikuti seri ini, kosakata metrik kini mencakup bagaimana AI menganalisis pertandingan sepak bola, xG, xA, npxG, PPDA, Field Tilt, aksi progresif, SCA/GCA, xPts, rating Elo dan kalibrasi Brier score. Poisson adalah mesin probabilitas yang mengikat sebagian besar metrik sebelumnya bersama-sama ketika sebuah analisis harus dihasilkan.

Pertanyaan yang Sering Diajukan

Apa itu distribusi Poisson dalam satu kalimat?
Poisson menggambarkan seberapa sering peristiwa langka terjadi dalam periode tetap, mengingat tingkat rata-rata. Dalam sepak bola, 'peristiwa langka' adalah gol, 'periode tetap' adalah 90 menit, dan 'tingkat' diturunkan dari kualitas tim, xG, atau konteks pertandingan. Distribusi memberi tahu Anda probabilitas 0 gol, 1 gol, 2 gol, dan seterusnya.
Mengapa Poisson menjadi default untuk gol sepak bola?
Tiga alasan. Gol relatif langka (rata-rata sekitar 2.5 per pertandingan di liga teratas). Mereka terjadi pada waktu yang kurang lebih acak dalam pertandingan dengan sedikit pengelompokan setelah Anda mengoreksi keadaan permainan. Dan matematika Poisson cukup sederhana untuk dihitung dengan cepat, sehingga praktis untuk mensimulasikan ribuan kemungkinan hasil pertandingan. Kombinasi ini menjadikannya andalan pemodelan sepak bola.
Apa input untuk model gol Poisson?
Dua tingkat: satu untuk setiap tim. Pendekatan paling umum menurunkan tingkat dari kekuatan tim (tingkat serangan dikurangi tingkat pertahanan lawan, dengan keuntungan tuan rumah disertakan). Varian modern memasukkan nilai xG-per-pertandingan alih-alih tingkat berbasis kemenangan, menghasilkan distribusi yang lebih responsif dan akurat.
Di mana Poisson gagal?
Tiga mode kegagalan utama. Keadaan akhir pertandingan: tim yang mengejar defisit bermain berbeda dari tim yang mempertahankan keunggulan, sehingga tingkat gol tidak konstan sepanjang 90 menit. Korelasi antar tim: jika satu tim kebobolan gol di akhir, mereka sering kebobolan lagi di fase yang sama, yang dianggap independen oleh Poisson. Pertandingan dengan gol sangat rendah atau sangat tinggi: ekor Poisson kurang merepresentasikan hasil ekstrem.
Apakah Tactiq menggunakan Poisson langsung dalam analisis?
Tactiq adalah analisis statistik independen, tidak terkait dengan pasar eksternal. Estimasi probabilitas berbasis simulasi adalah salah satu dari beberapa teknik yang berkontribusi pada triplet probabilitas yang ditampilkan pada kartu pertandingan. Pendekatan simulasi spesifik, bagaimana tingkat diturunkan, dan bagaimana model menangani kelemahan Poisson tetap berada di dalam produk. Bagi pengguna, efeknya adalah tiga probabilitas di layar mencerminkan distribusi hasil yang disimulasikan, bukan aturan yang dikodekan secara manual.
Apakah ada alternatif yang lebih baik dari Poisson?
Negative binomial, bivariate Poisson, Dixon-Coles (yang menambahkan korelasi untuk pertandingan dengan skor rendah), dan distribusi Skellam semuanya telah diusulkan sebagai penyempurnaan. Masing-masing menangkap kelemahan spesifik Poisson dasar dengan biaya kompleksitas tambahan. Sebagian besar model sepak bola produksi menggunakan salah satu penyempurnaan ini daripada Poisson mentah.