Κατανομή Poisson και Μοντελοποίηση Γκολ στο Ποδόσφαιρο

Από την Tactiq AI · 2026-05-07 · 9 λεπτά ανάγνωσης · AI και Ποδόσφαιρο

Αν έχετε παρακολουθήσει ποτέ μια εκπομπή προεπισκόπησης αγώνων όπου ο παρουσιαστής λέει "αυτή η αναμέτρηση έχει γραμμή 2,3 αναμενόμενων γκολ, που υπονοεί 61% πιθανότητα Πάνω από 2,5", παρακολουθούσατε αριθμητική Poisson σε δράση. Αν έχετε δει μια τριάδα πιθανοτήτων (γηπεδούχος 58%, ισοπαλία 25%, εκτός 17%) που έμοιαζε να βγαίνει από το πουθενά, ο υπολογισμός που την παρήγαγε ήταν σχεδόν σίγουρα μια προσομοίωση Poisson.

Η Poisson είναι ο στατιστικός κινητήρας πίσω από τα περισσότερα ποδοσφαιρικά μοντέλα γκολ. Είναι εκεί εδώ και 50 χρόνια, παράγοντας σιωπηλά τους αριθμούς πιθανότητας που αργότερα περιγράφονται με πιο της μόδας λεξιλόγιο. Η κατανόηση του πώς λειτουργεί απομυθοποιεί πολλά από όσα κάνει στην πραγματικότητα η "πρόβλεψη ποδοσφαίρου με Τεχνητή Νοημοσύνη" στο παρασκήνιο.

Αυτό το άρθρο διατρέχει την Poisson σε απλή γλώσσα, δείχνει πώς εφαρμόζεται συγκεκριμένα στο ποδόσφαιρο, πού λειτουργεί, πού όχι, και τι προσθέτουν οι σύγχρονες βελτιώσεις πάνω της.

Τι είναι πραγματικά η Poisson

Μια κατανομή Poisson περιγράφει την πιθανότητα κάποιου αριθμού συμβάντων να συμβούν σε ένα καθορισμένο χρονικό παράθυρο, δεδομένου ενός μέσου ρυθμού.

Επίσημα: αν τα συμβάντα συμβαίνουν με σταθερό μέσο ρυθμό λ (λάμδα) ανά μονάδα χρόνου, και συμβαίνουν ανεξάρτητα μεταξύ τους, τότε η πιθανότητα να συμβούν ακριβώς k συμβάντα σε αυτό το παράθυρο είναι:

P(k) = (λ^k × e^(-λ)) / k!

Δεν χρειάζεται να αγαπάτε τα μαθηματικά. Η πρακτική σημασία:

  • λ = 1 σημαίνει ότι το συμβάν εμφανίζεται κατά μέσο όρο μία φορά ανά παράθυρο. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2 σημαίνει δύο φορές ανά παράθυρο. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3 σημαίνει τρεις φορές ανά παράθυρο. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

Η κατανομή αποτυπώνει ότι ο μέσος όρος είναι ένα πράγμα, αλλά οι συγκεκριμένες εκβάσεις ομαδοποιούνται γύρω από αυτόν τον μέσο όρο με γνωστή πιθανότητα. Όταν λ = 2, περιμένετε 2, αλλά τα 0 και 3 και 4 όλα συμβαίνουν σε σημαντικά ποσοστά του χρόνου.

Γιατί η Poisson ταιριάζει στο σκοράρισμα γκολ ποδοσφαίρου

Τρεις λόγοι για τους οποίους η υπόθεση ισχύει χονδρικά για το ποδόσφαιρο.

Τα γκολ είναι σπάνια. Οι περισσότεροι αγώνες βλέπουν 0-5 γκολ. Η Poisson χειρίζεται το εύρος 0-5 καθαρά, καταρρέει σε πολύ υψηλούς αριθμούς, αλλά το ποδόσφαιρο σπάνια το δοκιμάζει αυτό.

Τα γκολ συμβαίνουν σε σχετικά ανεξάρτητους χρόνους. Μόλις αφαιρέσετε τα αποτελέσματα κατάστασης παιχνιδιού (που θα συζητήσουμε), τα γκολ εντός ενός αγώνα συμβαίνουν με σχεδόν σταθερό ρυθμό. Ένα γκολ στο 10ο λεπτό δεν αλλάζει την πιθανότητα ενός γκολ στο 40ό λεπτό τόσο έντονα όσο ίσως νομίζετε.

Ο ρυθμός μπορεί να εξαχθεί από την ποιότητα ομάδας. Αν ο μέσος ρυθμός σκοραρίσματος της Ομάδας Α είναι 1,5 γκολ/αγώνα και ο αμυντικός ρυθμός της Ομάδας Β δέχεται 1,2 γκολ/αγώνα, τα αναμενόμενα γκολ της Ομάδας Α σε αυτή την αναμέτρηση είναι κάποιο σταθμισμένο μείγμα (1,5 × 1,2 / μέσος όρος διοργάνωσης, με κλιμάκωση πλεονεκτήματος έδρας). Η Poisson παίρνει αυτό το λ και παράγει μια πλήρη κατανομή.

Συνδυάστε αυτά και έχετε ένα λειτουργικό μοντέλο: για κάθε αγώνα, εξάγετε αναμενόμενους ρυθμούς και για τις δύο πλευρές, εφαρμόζετε Poisson σε κάθε μία για να παραγάγετε κατανομές αριθμού γκολ, συνδυάζετε αυτές σε έναν πίνακα εκβάσεων (νίκες γηπεδούχου / ισοπαλία / νίκες εκτός / Πάνω από 2,5 / BTTS / κλπ.).

Πώς η Poisson χτίζει μια τριάδα πιθανοτήτων

Για μια αναμέτρηση μεταξύ Ομάδας Α (αναμενόμενα γκολ 1,8) και Ομάδας Β (αναμενόμενα γκολ 1,2), η προσομοίωση:

  1. Χρησιμοποιώντας Poisson με λ=1,8 για Ομάδα Α, υπολογίζει P(η Ομάδα Α σκοράρει 0), P(1), P(2), P(3), P(4), P(5+).
  2. Χρησιμοποιώντας Poisson με λ=1,2 για Ομάδα Β, υπολογίζει το ίδιο για την Ομάδα Β.
  3. Υποθέτοντας ανεξαρτησία (η πρώτη υπόθεση Poisson), πολλαπλασιάζει: P(η Ομάδα Α σκοράρει N και η Ομάδα Β σκοράρει M) = P(A=N) × P(B=M).
  4. Αθροίζει για N > M για νίκες γηπεδούχου, N = M για ισοπαλίες, N < M για νίκες εκτός.
  5. Κανονικοποιεί αν χρειαστεί.

Το αποτέλεσμα: τριάδα πιθανοτήτων για τον αγώνα, που προέρχεται εξ ολοκλήρου από δύο αριθμούς αναμενόμενων γκολ. Μια αξιοπρεπής εφαρμογή για τους περισσότερους αγώνες.

Αυτό είναι αυτό που είναι συνήθως τα "μοντέλα πρόβλεψης βασισμένα σε xG" στην απλούστερη μορφή τους: δύο αριθμοί μέσα, μια κατανομή πιθανότητας έξω, η Poisson ως κινητήρας.

Πού καταρρέει η Poisson

Τέσσερις πραγματικοί τρόποι αποτυχίας που η σύγχρονη μοντελοποίηση προσπαθεί να διορθώσει.

Εξάρτηση από κατάσταση παιχνιδιού. Μια ομάδα που κυνηγά έλλειμμα 0-1 στα τελευταία 20 λεπτά παίζει διαφορετικά. Ο ρυθμός γκολ της ανεβαίνει πάνω από την προ-αγωνιστική προσδοκία, ο ρυθμός του αντιπάλου της παραμένει παρόμοιος αλλά αμυντικά λάθη πυροδοτούν δεχόμενες ευκαιρίες. Η ανεξάρτητη Poisson σταθερού ρυθμού υπο-προβλέπει τη συχνότητα ανατροπών και υπερ-προβλέπει σταθερή κυριαρχία.

Πληθωρισμός ισοπαλίας. Σε χαμηλούς αγώνες σκοραρίσματος (λ κάτω από 1,5 ανά πλευρά), η Poisson υπερ-προβλέπει 1-1 και 0-0 ταυτόχρονα, υπο-προβλέποντας τις ισοπαλίες συνολικά. Οι Dixon και Coles πρότειναν μια διόρθωση το 1997 που προσαρμόζει τα κελιά χαμηλού σκορ του πίνακα εκβάσεων. Τα περισσότερα παραγωγικά μοντέλα χρησιμοποιούν Dixon-Coles ή παρόμοιο.

Συσχέτιση μεταξύ ομάδων. Τα γκολ μιας ομάδας δεν είναι πλήρως ανεξάρτητα από αυτά της άλλης. Μια πλευρά που δέχεται νωρίς συχνά πέφτει σε ποιότητα καθώς ο αγώνας συνεχίζεται. Τα μοντέλα διπαραμετρικής Poisson προσθέτουν μια μικρή παράμετρο συσχέτισης. Χωρίς αυτό, οι κοινές εκβάσεις αντιμετωπίζονται ως υπερβολικά ανεξάρτητες.

Ακραία σκορ. Η δεξιά ουρά των κατανομών Poisson (5-0, 6-0, 7-0) είναι λεπτή στην ακατέργαστη Poisson αλλά παρατηρείται πιο συχνά στην πράξη σε ασύμμετρες αναμετρήσεις. Τα σύγχρονα μοντέλα εφαρμόζουν διορθώσεις ουράς ή χρησιμοποιούν αρνητικές διωνυμικές κατανομές, που έχουν τον ίδιο μέσο όρο με την Poisson αλλά επιτρέπουν περισσότερη διακύμανση.

Ο χρήσιμος κανόνας: η ακατέργαστη Poisson είναι μια χρήσιμη βάση αλλά τα παραγωγικά μοντέλα προσθέτουν πάντα βελτιώσεις. Οι βελτιώσεις δεν αλλάζουν την ερμηνεία (τριάδες πιθανοτήτων, Πάνω/Κάτω, BTTS) αλλά σφίγγουν τους αριθμούς έναντι της πραγματικότητας.

Η Poisson πέρα από τις πιθανότητες έκβασης

Τα μαθηματικά Poisson επιτρέπουν αρκετές μετέπειτα μετρικές:

Αναμενόμενοι βαθμοί (xPts). Για κάθε αγώνα, προσομοιώνετε την κατανομή έκβασης μέσω Poisson, υπολογίζετε τους αναμενόμενους βαθμούς για κάθε πλευρά. Άθροισμα σε όλη τη σεζόν, έχετε xPts.

Αναμενόμενα γκολ υπέρ/κατά σε ένα παράθυρο. Το ιστορικό xG μιας ομάδας συνδυασμένο με Poisson παράγει μια κατανομή πιθανότητας των συνολικών γκολ της σεζόν τους.

Δίκαιες γραμμές ασιατικού χάντικαπ. Η μετάφραση xG σε αποδόσεις ασιατικού χάντικαπ χρησιμοποιεί προσομοίωση Poisson για την κατανομή διαφοράς γκολ.

Πιθανότητες Πάνω/Κάτω και BTTS. Όλες παράγωγες από τον πίνακα εκβάσεων που χτίζει η προσομοίωση Poisson.

Στην ουσία, μόλις έχετε xG ανά ομάδα (ή αναμενόμενο ρυθμό σκοραρίσματος), η Poisson σας δίνει ολόκληρη την επιφάνεια πιθανότητας του αγώνα, όχι μόνο την τριάδα νίκης/ισοπαλίας/ήττας.

Πώς το Tactiq χειρίζεται τη μοντελοποίηση γκολ τύπου Poisson

Η ανάλυση του Tactiq χρησιμοποιεί εκτίμηση πιθανότητας βασισμένη σε προσομοίωση ως μέρος του pipeline του για την παραγωγή των τριάδων πιθανοτήτων που εμφανίζονται στην κάρτα αγώνα. Η συγκεκριμένη προσέγγιση, οι βελτιώσεις που εφαρμόζονται πάνω στη βασική Poisson, και ο τρόπος που η προσομοίωση χειρίζεται τις αλληλεπιδράσεις κατάστασης παιχνιδιού και ποιότητας αντιπάλου παραμένουν εντός του προϊόντος.

Για τον χρήστη, το αποτέλεσμα είναι ότι οι τρεις πιθανότητες στην κάρτα αγώνα αντικατοπτρίζουν μια προσομοιωμένη κατανομή έκβασης βασισμένη σε εκτιμήσεις αναμενόμενων γκολ και σήματα ισχύος ομάδας, αντί για χειροκίνητα κωδικοποιημένες ευρετικές. Ο δείκτης βεβαιότητας αντικατοπτρίζει πόσο ευαίσθητη είναι η κατανομή σε μικρές αλλαγές στα σήματα εισόδου για αυτή τη συγκεκριμένη αναμέτρηση.

Τι βλέπει ο χρήστης στην κάρτα αγώνα:

  • Τριάδες πιθανοτήτων για την έκβαση, που παράγονται μέσω προσομοίωσης.
  • Αναμενόμενα γκολ για κάθε πλευρά με πρόσφατη τάση.
  • Μια γραπτή ανάλυση που ονομάζει την έκβαση σε απλή γλώσσα: "Η γηπεδούχος μπαίνει με μέτρια ευνοϊκή θέση σε αναμενόμενα γκολ, που μεταφράζεται σε περίπου κατανομή πιθανοτήτων 52-25-23."
  • Καμία εξωτερική δεδομένα αγοράς πουθενά. Καμία ανακατεύθυνση σε πλατφόρμες τρίτων. Κανένα εικονικό νόμισμα. Μόνο στατιστική ανάλυση.

Το συμπέρασμα

Η Poisson είναι ο στατιστικός εργάτης κάτω από τα περισσότερα ποδοσφαιρικά μοντέλα γκολ. Είναι αρκετά απλή για γρήγορο υπολογισμό, αρκετά καλή για να ταιριάζει στους περισσότερους αγώνες, και η βάση πάνω στην οποία χτίζονται πιο εξελιγμένες βελτιώσεις (Dixon-Coles, διπαραμετρική, αρνητική διωνυμική).

Η κατανόηση της Poisson απομυθοποιεί τις τριάδες πιθανοτήτων που βλέπετε σε κάθε αναλυτικό πάνελ. Δεν είναι μαγεία, είναι προσομοιώσεις από εισόδους αναμενόμενων γκολ. Αυτό που χωρίζει τα καλά μοντέλα από τα κακά είναι οι βελτιώσεις που διορθώνουν τις γνωστές αδυναμίες της Poisson.

Το Tactiq χρησιμοποιεί εκτίμηση πιθανότητας βασισμένη σε προσομοίωση με βελτιώσεις που εφαρμόζονται για να χειριστούν την πολυπλοκότητα του πραγματικού αγώνα. Η ανάλυση εμφανίζει βαθμονομημένες τριάδες πιθανοτήτων σε κάθε κάρτα αγώνα. Πάνω από 1.200 διοργανώσεις, μετάφραση σε 32 γλώσσες, δωρεάν επίπεδο οχτώ αναλύσεων ανά ημέρα, χωρίς κάρτα.

Αν παρακολουθείτε τη σειρά, το λεξιλόγιο μετρικών εκτείνεται τώρα σε πώς η Τεχνητή Νοημοσύνη προβλέπει ποδοσφαιρικούς αγώνες, xG, xA, npxG, PPDA, Field Tilt, προοδευτικές ενέργειες, SCA/GCA, xPts, βαθμολογίες Elo και βαθμονόμηση Brier score. Η Poisson είναι ο κινητήρας πιθανότητας που δένει τις περισσότερες από τις προηγούμενες μετρικές μαζί όταν πρέπει να παραχθεί μια πρόβλεψη.

Συχνές ερωτήσεις

Τι είναι η κατανομή Poisson σε μία πρόταση;
Η Poisson περιγράφει πόσο συχνά συμβαίνει ένα σπάνιο συμβάν σε μια καθορισμένη περίοδο, δεδομένου ενός μέσου ρυθμού. Στο ποδόσφαιρο, το σπάνιο συμβάν είναι ένα γκολ, η καθορισμένη περίοδος είναι 90 λεπτά, και ο ρυθμός προέρχεται από την ποιότητα ομάδας, το xG ή το πλαίσιο αγώνα. Η κατανομή σας λέει την πιθανότητα 0 γκολ, 1 γκολ, 2 γκολ και ούτω καθεξής.
Γιατί η Poisson είναι προεπιλογή για τα γκολ ποδοσφαίρου;
Τρεις λόγοι. Τα γκολ είναι σχετικά σπάνια (μέσος όρος γύρω στα 2,5 ανά αγώνα στις κορυφαίες διοργανώσεις). Συμβαίνουν σε σχετικά τυχαίους χρόνους εντός ενός αγώνα με μικρή ομαδοποίηση μόλις διορθώσετε για την κατάσταση του παιχνιδιού. Και τα μαθηματικά της Poisson είναι αρκετά απλά για γρήγορο υπολογισμό, καθιστώντας πρακτική την προσομοίωση χιλιάδων πιθανών εκβάσεων αγώνα. Ο συνδυασμός την κάνει εργάτη της ποδοσφαιρικής μοντελοποίησης.
Ποιες είναι οι είσοδοι σε ένα μοντέλο γκολ Poisson;
Δύο ρυθμοί: ένας για κάθε ομάδα. Η πιο κοινή προσέγγιση παράγει τους ρυθμούς από την ισχύ της ομάδας (ρυθμός επίθεσης μείον ρυθμός άμυνας του αντιπάλου, με ενσωματωμένο το πλεονέκτημα έδρας). Σύγχρονες παραλλαγές τροφοδοτούν τιμές xG ανά αγώνα αντί για ρυθμούς βασισμένους σε νίκες, παράγοντας πιο αντιδραστικές και ακριβείς κατανομές.
Πού καταρρέει η Poisson;
Τρεις κύριοι τρόποι αποτυχίας. Κατάσταση τέλους αγώνα: μια ομάδα που κυνηγά έλλειμμα παίζει διαφορετικά από μία που υπερασπίζεται προβάδισμα, οπότε ο ρυθμός γκολ δεν είναι σταθερός σε όλα τα 90 λεπτά. Συσχέτιση μεταξύ ομάδων: αν μια πλευρά δεχτεί ένα ύστερο γκολ, συχνά δέχεται άλλο στην ίδια φάση, κάτι που η Poisson αντιμετωπίζει ως ανεξάρτητο. Πολύ χαμηλά ή πολύ υψηλά παιχνίδια γκολ: οι ουρές της Poisson υπο-αντιπροσωπεύουν τις ακραίες εκβάσεις.
Χρησιμοποιεί το Tactiq Poisson απευθείας στην ανάλυση;
Η εκτίμηση πιθανότητας βασισμένη σε προσομοίωση είναι μία από αρκετές τεχνικές που συνεισφέρουν στις τριάδες πιθανοτήτων που εμφανίζονται στην κάρτα αγώνα. Η συγκεκριμένη προσέγγιση προσομοίωσης, ο τρόπος εξαγωγής των ρυθμών και ο τρόπος που το μοντέλο χειρίζεται τις γνωστές αδυναμίες της Poisson παραμένει εντός του προϊόντος. Για τον χρήστη, το αποτέλεσμα είναι ότι οι τρεις πιθανότητες στην οθόνη αντικατοπτρίζουν μια προσομοιωμένη κατανομή εκβάσεων, όχι έναν χειροκίνητα κωδικοποιημένο κανόνα.
Υπάρχουν καλύτερες εναλλακτικές από την Poisson;
Η αρνητική διωνυμική, η διπαραμετρική Poisson, η Dixon-Coles (που προσθέτει συσχέτιση για χαμηλά σκορ), και οι κατανομές Skellam έχουν προταθεί ως βελτιώσεις. Κάθε μία αποτυπώνει μια συγκεκριμένη αδυναμία της βασικής Poisson με κόστος επιπλέον πολυπλοκότητας. Τα περισσότερα παραγωγικά ποδοσφαιρικά μοντέλα χρησιμοποιούν μία από αυτές τις βελτιώσεις αντί για ακατέργαστη Poisson.