Poisson Dağılımı ve Futbolda Gol Modellemesi
Bir maç önizleme programında sunucunun "bu fikstürün 2,3 beklenen gol çizgisi var, bu da %61 olasılığa karşılık geliyor" dediğini duyduysanız, gerçekte iş başındaki şey Poisson aritmetiğiydi. Birden bire ortaya çıkmış gibi görünen bir olasılık üçlüsü gördüyseniz (ev galibiyeti %58, beraberlik %25, deplasman galibiyeti %17), bunu üreten hesap büyük ihtimalle bir Poisson simülasyonuydu.
Poisson, futbol gol modellerinin çoğunun altındaki istatistiksel motordur. 50 yıldır oradadır; sessizce daha sonra daha modaya uygun bir kelime dağarcığıyla anlatılan olasılık sayılarını üretir. Nasıl çalıştığını anlamak, "yapay zekanın futbol analizi" dediği şeyin kaputun altında ne yaptığını büyük ölçüde aydınlatır.
Bu yazı Poisson'u sade bir dille açar; futbola özel olarak nasıl uygulandığını, nerede çalıştığını, nerede çalışmadığını ve modern iyileştirmelerin üzerine ne eklediğini gösterir.
Poisson aslında nedir
Bir Poisson dağılımı, ortalama bir oran verildiğinde sabit bir zaman penceresinde belirli sayıda olayın gerçekleşme olasılığını tanımlar.
Resmi olarak: olaylar birim zaman başına sabit bir ortalama oranı λ (lambda) ile ve birbirinden bağımsız meydana geliyorsa, o pencerede tam olarak k olay olma olasılığı şudur:
P(k) = (λ^k × e^(-λ)) / k!
Matematiği sevmek zorunda değilsiniz. Pratik anlamı:
- λ = 1 olay pencere başına ortalama bir kez olur. P(0) ≈ %37, P(1) ≈ %37, P(2) ≈ %18, P(3) ≈ %6, P(4+) ≈ %2.
- λ = 2 pencere başına iki kez. P(0) ≈ %14, P(1) ≈ %27, P(2) ≈ %27, P(3) ≈ %18, P(4) ≈ %9, P(5+) ≈ %5.
- λ = 3 pencere başına üç kez. P(0) ≈ %5, P(1) ≈ %15, P(2) ≈ %22, P(3) ≈ %22, P(4) ≈ %17, P(5+) ≈ %19.
Dağılım şunu yakalar: ortalama bir şeydir; ama belirli sonuçlar bilinen olasılıklarla bu ortalama etrafında kümelenir. λ = 2 olduğunda 2 beklersiniz; ama 0, 3 ve 4 da anlamlı yüzdelerle gerçekleşir.
Poisson neden futbol gol üretimine oturuyor
Varsayımın futbolda kabaca tutmasının üç sebebi var.
Goller nadirdir. Maçların çoğu 0-5 gol görür. Poisson 0-5 aralığını temiz işler; çok yüksek sayılarda kırılır, ama futbol bunu nadiren sınar.
Goller kabaca bağımsız zamanlarda olur. Oyun-durumu etkilerini soyduğunuzda (bunu konuşacağız) bir maçtaki goller aşağı yukarı sabit oranla gerçekleşir. 10. dakikadaki gol, 40. dakikadaki gol olasılığını sandığınızdan daha az değiştirir.
Oran takım kalitesinden türetilebilir. Takım A'nın ortalama gol atma oranı maç başına 1,5 ve Takım B'nin savunma oranı maç başına 1,2 gol yiyorsa, bu fikstürdeki Takım A için beklenen gol bir tür ağırlıklı karışımdır (1,5 × 1,2 / lig ortalaması, ev sahibi avantajı ölçeklemesiyle). Poisson o λ'yı alır ve tam dağılım üretir.
Bunları birleştirin, çalışır bir model elde edersiniz: her maç için iki taraf için beklenen oranları türetin, her birine Poisson uygulayın, gol-sayısı dağılımları üretin, bunları bir sonuç matrisine birleştirin (ev galibiyetleri / beraberlik / deplasman / 2,5 üst / KG VAR / vs.).
Poisson olasılık üçlüsünü nasıl kurar
Takım A (beklenen gol 1,8) ile Takım B (beklenen gol 1,2) arasındaki bir fikstür için simülasyon:
- Takım A için λ=1,8 ile Poisson kullanarak P(Takım A 0 gol atar), P(1), P(2), P(3), P(4), P(5+) hesaplayın.
- Takım B için λ=1,2 ile aynısını hesaplayın.
- Bağımsızlık varsayarak (ilk Poisson varsayımı) çarpın: P(A=N ve B=M) = P(A=N) × P(B=M).
- Ev galibiyetleri için N > M, beraberlik için N = M, deplasman için N < M üzerinden toplayın.
- Gerekirse normalleştirin.
Sonuç: maç için olasılık üçlüsü, tamamen iki beklenen-gol sayısından türetilmiş. Maçların çoğuna iyi oturur.
"xG odaklı tahmin modelleri" en yalın halinde genellikle budur: iki sayı içeri, bir olasılık dağılımı dışarı, motor olarak Poisson.
Poisson nerede kırılır
Modern modellemenin düzeltmeye çalıştığı dört gerçek kırılma biçimi.
Oyun-durumu bağımlılığı. Son 20 dakikada 0-1 gerideki bir takım farklı oynar. Gol oranları maç öncesi beklentinin üzerine çıkar; rakibin oranı benzer kalır ama savunma hataları yenilen şansları tetikler. Bağımsız, sabit oranlı Poisson geri dönüş sıklığını eksik tahmin eder; istikrarlı üstünlüğü fazla tahmin eder.
Beraberlik şişmesi. Düşük skorlu maçlarda (taraf başına λ 1,5'in altında) Poisson 1-1 ve 0-0'ı eşzamanlı fazla tahmin eder; toplamda beraberlikleri eksik tahmin eder. Dixon ve Coles 1997'de sonuç matrisinin düşük-skor hücrelerini ayarlayan bir düzeltme önerdi. Üretimdeki modellerin çoğu Dixon-Coles veya benzerini kullanır.
Takımlar arası korelasyon. Bir takımın golleri diğerinin gollerinden tamamen bağımsız değildir. Erken gol yiyen taraf maç ilerledikçe çoğu zaman kalitede düşer. İki değişkenli Poisson modelleri küçük bir korelasyon parametresi ekler. Onsuz ortak sonuçlar fazla bağımsız işlenir.
Aşırı skorlar. Poisson dağılımının sağ kuyruğu (5-0, 6-0, 7-0) ham Poisson'da incedir; ama eşitsiz eşleşmelerde pratikte daha sık görülür. Modern modeller kuyruk düzeltmeleri uygular veya negatif binom dağılımları kullanır; aynı ortalamaya sahip ama daha fazla varyansa izin veren biçimde.
İşe yarar kural: ham Poisson faydalı bir taban çizgisidir; ama üretim modelleri her zaman iyileştirme ekler. İyileştirmeler yorumu (olasılık üçlüleri, üst/alt, KG) değiştirmez; sayıları gerçekliğe karşı sıkar.
Sonuç olasılıklarının ötesinde Poisson
Poisson matematiği birkaç türev metriği mümkün kılar:
Beklenen puan (xPts). Her maç için Poisson ile sonuç dağılımını simüle edin, her tarafa beklenen puanları hesaplayın. Sezon boyu toplayın, xPts elde edersiniz.
Bir pencere üzerinde lehe/aleyhe beklenen gol. Bir takımın xG geçmişi Poisson ile birleştiğinde sezonluk gol toplamlarının olasılık dağılımı çıkar.
Asya handikap adil çizgileri. xG'yi Asya handikap çizgilerine çevirmek, gol farkı dağılımı için Poisson simülasyonu kullanır.
Üst/Alt ve KG olasılıkları. Poisson simülasyonunun kurduğu sonuç matrisinden hepsi türetilebilir.
Sonuç olarak, takım başına xG (veya beklenen gol oranı) elde ettiğinizde Poisson size sadece galibiyet/beraberlik/yenilgi üçlüsünü değil, maçın tüm olasılık yüzeyini verir.
Tactiq Poisson tarzı gol modellemesini nasıl ele alır
Tactiq'in analizi, maç kartında görünen olasılık üçlülerini üreten boru hattının parçası olarak simülasyona dayalı olasılık tahmini kullanır. Belirli yaklaşım, temel Poisson'a uygulanan iyileştirmeler ve simülasyonun oyun durumu ile rakip kalite etkileşimlerini nasıl ele aldığı ürünün içinde kalır.
Kullanıcı için sonuç şudur: maç kartındaki üç olasılık, elle yazılmış kurallar yerine beklenen-gol tahminlerine ve takım gücü sinyallerine dayanan simüle edilmiş bir sonuç dağılımını yansıtır. Güven göstergesi, dağılımın o belirli fikstür için girdi sinyallerindeki küçük değişikliklere ne kadar duyarlı olduğunu gösterir.
Kullanıcının maç kartında gördüğü:
- Simülasyon yoluyla üretilen sonuç olasılık üçlüleri.
- Her taraf için son eğilim okuyla birlikte beklenen gol.
- Sayıların ne anlattığını sade dilde adlandıran yazılı analiz: "Ev sahibi beklenen golde mütevazı bir üstünlükle giriyor; bu da kabaca 52-25-23 olasılık dağılımına çeviriyor."
- Hiçbir yerde dış pazar verisi yok. Üçüncü taraf platformlara yönlendirme yok. Sanal para yok. Sadece istatistiksel analiz.
Çıkarım
Poisson, futbol gol modellemesinin altındaki istatistiksel iş atıdır. Hızlı hesaplanacak kadar basit, çoğu maça oturacak kadar iyi ve daha gelişmiş iyileştirmelerin (Dixon-Coles, iki değişkenli, negatif binom) üzerine inşa edildiği temeldir.
Poisson'u anlamak, her analitik panoda gördüğünüz olasılık üçlülerini sıradanlaştırır. Sihir değiller; beklenen-gol girdilerinden yapılan simülasyonlar. İyi modeli kötüden ayıran şey, Poisson'ın bilinen zayıflıklarını düzelten iyileştirmelerdir.
Tactiq, gerçek maç karmaşıklığını ele almak için iyileştirmeler uygulanmış simülasyona dayalı olasılık tahmini kullanır. Analiz, her maç kartında kalibre edilmiş olasılık üçlüleri sunar. 1.200'ü aşkın yarışma, 32 dil yerelleştirmesi, günde sekiz analizlik ücretsiz katman, kart bilgisi gerekmez.
Seriyi takip ettiyseniz, metrik kelime dağarcığı şimdi şunu kapsıyor: yapay zeka futbol maçlarını nasıl analiz eder, xG, xA, npxG, PPDA, Saha Eğimi, ilerletici aksiyonlar, SCA/GCA, xPts, Elo derecelendirmeleri ve Brier skoru kalibrasyonu. Poisson, bir analiz çıktısı üretilmek zorunda olduğunda önceki metriklerin çoğunu birbirine bağlayan olasılık motorudur.