توزيع بواسون ونمذجة الأهداف في كرة القدم
إذا شاهدت يوماً برنامج معاينة مباراة قال فيه المضيف "هذه المباراة لها خط 2.3 أهداف متوقعة، ما يعني فرصة 61% لأكثر من 2.5"، فقد كنت تشاهد حساب بواسون أثناء العمل. وإذا رأيت ثلاثية احتمالية (فوز المضيف 58%، تعادل 25%، فوز الضيف 17%) بدت كأنها جاءت من العدم، فالحساب الذي أنتجها كان شبه مؤكد محاكاة بواسون.
بواسون هو المحرك الإحصائي تحت معظم نماذج أهداف كرة القدم. كان موجوداً منذ 50 سنة، يولّد بهدوء أرقام الاحتمالات التي تُوصف لاحقاً بمفردات أكثر عصرية. فهم كيف يعمل يكشف الكثير مما يقوم به "تحليل كرة القدم بالذكاء الاصطناعي" فعلياً تحت السطح.
تستعرض هذه المقالة بواسون بلغة بسيطة، تُظهر كيف يُطبَّق على كرة القدم تحديداً، أين يعمل، أين يفشل، وما تضيفه التحسينات الحديثة فوقه.
ما هو بواسون فعلياً
توزيع بواسون يصف احتمال حدوث عدد معين من الأحداث في نافذة زمنية محددة، بمعدل وسطي معطى.
شكلياً: إذا حدثت الأحداث بمعدل وسطي ثابت λ (لامبدا) لكل وحدة زمنية، وحدثت بشكل مستقل عن بعضها، فإن احتمال حدوث k حدثاً بالضبط في تلك النافذة هو:
P(k) = (λ^k × e^(-λ)) / k!
لا يلزمك أن تحب الرياضيات. المعنى العملي:
- λ = 1 يعني أن الحدث يقع وسطياً مرة واحدة لكل نافذة. P(0) ≈ 37%، P(1) ≈ 37%، P(2) ≈ 18%، P(3) ≈ 6%، P(4+) ≈ 2%.
- λ = 2 يعني مرتين لكل نافذة. P(0) ≈ 14%، P(1) ≈ 27%، P(2) ≈ 27%، P(3) ≈ 18%، P(4) ≈ 9%، P(5+) ≈ 5%.
- λ = 3 يعني ثلاث مرات لكل نافذة. P(0) ≈ 5%، P(1) ≈ 15%، P(2) ≈ 22%، P(3) ≈ 22%، P(4) ≈ 17%، P(5+) ≈ 19%.
التوزيع يلتقط أن الوسط شيء واحد، لكن النتائج المحددة تتجمع حول ذلك الوسط باحتمال معروف. عند λ = 2 تتوقع 2، لكن 0 و3 و4 تحدث جميعها بنسب ذات معنى من الوقت.
لماذا يلائم بواسون تسجيل الأهداف في كرة القدم
ثلاثة أسباب لصمود الافتراض تقريباً مع كرة القدم.
الأهداف نادرة. معظم المباريات تشهد 0 إلى 5 أهداف. بواسون يتعامل مع نطاق 0-5 بنظافة؛ ينهار عند الأعداد الكبيرة جداً، لكن كرة القدم نادراً ما تختبر ذلك.
الأهداف تحدث في أوقات مستقلة تقريباً. بمجرد إزالة آثار حالة المباراة (التي سنناقشها)، تحدث الأهداف داخل المباراة بمعدل ثابت تقريباً. هدف في الدقيقة 10 لا يغير احتمال هدف في الدقيقة 40 بالحدة التي قد تظنها.
يمكن اشتقاق المعدل من جودة الفريق. إذا كان متوسط معدل تهديف الفريق A هو 1.5 هدف/مباراة، ومعدل دفاع الفريق B يستقبل 1.2 هدف/مباراة، فالأهداف المتوقعة للفريق A في هذه المواجهة هي مزيج موزون (1.5 × 1.2 / متوسط الدوري، مع تحجيم ميزة الأرض). بواسون يأخذ ذلك λ ويولد توزيعاً كاملاً.
اجمع هذه فتحصل على نموذج عملي: لكل مباراة، اشتق المعدلات المتوقعة لكلا الجانبين، طبّق بواسون على كل منهما لإنتاج توزيعات عدد الأهداف، اجمعهما في مصفوفة نتائج (فوز المضيف / تعادل / فوز الضيف / أكثر من 2.5 / كلا الفريقين يسجلان / إلخ).
كيف يبني بواسون ثلاثية احتمالية
لمواجهة بين الفريق A (أهداف متوقعة 1.8) والفريق B (أهداف متوقعة 1.2)، تكون المحاكاة:
- باستخدام بواسون مع λ=1.8 للفريق A، احسب P(الفريق A يسجل 0)، P(1)، P(2)، P(3)، P(4)، P(5+).
- باستخدام بواسون مع λ=1.2 للفريق B، احسب نفس الشيء للفريق B.
- بافتراض الاستقلال (افتراض بواسون الأول)، اضرب: P(A يسجل N وB يسجل M) = P(A=N) × P(B=M).
- اجمع على N > M لفوز المضيف، N = M للتعادلات، N < M لفوز الضيف.
- سَوِّ إذا لزم الأمر.
النتيجة: ثلاثية احتمالية للمباراة، مستمدة بالكامل من رقمين متوقعين للأهداف. ملاءمة جيدة لمعظم المباريات.
هذا هو ما تكونه عادةً "نماذج التحليل المعتمدة على xG" في أبسط صورها: رقمان داخل، توزيع احتمالي خارج، بواسون كمحرك.
أين ينهار بواسون
أربعة أنماط فشل حقيقية تحاول النمذجة الحديثة تصحيحها.
اعتماد حالة المباراة. فريق يلاحق تأخراً 0-1 في آخر 20 دقيقة يلعب بشكل مختلف. معدل تهديفه يرتفع فوق التوقع قبل المباراة؛ معدل خصمه يبقى مشابهاً لكن الأخطاء الدفاعية تطلق فرصاً مرتدة. بواسون المستقل ثابت المعدل يقلل من توقع تكرار العودات ويبالغ في توقع الهيمنة المستقرة.
تضخم التعادلات. في المباريات منخفضة التهديف (λ أقل من 1.5 لكل جانب)، يبالغ بواسون في توقع 1-1 و0-0 معاً، ويقلل من إجمالي التعادلات. اقترح ديكسون وكولز تصحيحاً عام 1997 يعدّل خلايا النتيجة المنخفضة في المصفوفة. معظم نماذج الإنتاج تستخدم ديكسون-كولز أو ما شابه.
الترابط بين الفريقين. أهداف فريق ليست مستقلة تماماً عن أهداف الآخر. الفريق الذي يستقبل هدفاً مبكراً غالباً ما تنخفض جودته مع تقدم المباراة. نماذج بواسون الثنائية تضيف معامل ترابط صغير. بدونه، تُعالَج النتائج المشتركة باستقلالية مفرطة.
النتائج المتطرفة. الذيل الأيمن لتوزيعات بواسون (5-0، 6-0، 7-0) رفيع في بواسون الخام لكن يُرصد أكثر في الواقع في المباريات غير المتكافئة. النماذج الحديثة تطبق تصحيحات للذيل أو تستخدم توزيعات ذو الحدين السلبي، التي لها نفس المتوسط لكنها تسمح بمزيد من التباين.
القاعدة العملية: بواسون الخام خط أساس مفيد، لكن نماذج الإنتاج تضيف تحسينات دائماً. التحسينات لا تغير التفسير (الثلاثيات الاحتمالية، أكثر/أقل، كلا الفريقين يسجلان) لكنها تشدّ الأرقام مقابل الواقع.
بواسون فيما يتجاوز احتمالات النتيجة
رياضيات بواسون تتيح عدة مقاييس لاحقة:
النقاط المتوقعة (xPts). لكل مباراة، حاكِ توزيع النتائج عبر بواسون، احسب النقاط المتوقعة لكل جانب. اجمع على موسم، تحصل على xPts.
الأهداف المتوقعة لصالح/ضد عبر نافذة. تاريخ xG لفريق مدمج مع بواسون ينتج توزيعاً احتمالياً لإجمالي أهدافه الموسمية.
خطوط الهانديكاب الآسيوي العادلة. ترجمة xG إلى احتمالات هانديكاب آسيوي تستخدم محاكاة بواسون لتوزيع فارق الأهداف.
احتمالات أكثر/أقل وكلا الفريقين يسجلان. كلها مشتقة من مصفوفة النتائج التي تبنيها محاكاة بواسون.
في الواقع، بمجرد امتلاكك xG لكل فريق (أو معدل التهديف المتوقع)، يمنحك بواسون كامل سطح الاحتمالات للمباراة، وليس فقط ثلاثية فوز/تعادل/خسارة.
كيف تتعامل Tactiq مع نمذجة الأهداف بأسلوب بواسون
تستخدم Tactiq تقدير الاحتمال القائم على المحاكاة كجزء من خط إنتاجها لإنتاج الثلاثيات الاحتمالية المعروضة على بطاقة المباراة. النهج المحدد، التحسينات المطبقة فوق بواسون الأساسي، وكيف تعالج المحاكاة تفاعلات حالة المباراة وجودة الخصم، يبقى داخل المنتج.
بالنسبة للمستخدم، الأثر هو أن الاحتمالات الثلاثة على بطاقة المباراة تعكس توزيع نتائج محاكى، مبني على تقديرات الأهداف المتوقعة وإشارات قوة الفريق، بدلاً من القواعد المكتوبة يدوياً. مؤشر الثقة يعكس حساسية التوزيع للتغيرات الصغيرة في إشارات الإدخال لتلك المباراة المحددة.
ما يراه المستخدم على بطاقة المباراة:
- ثلاثيات احتمالية للنتيجة، منتجة عبر المحاكاة.
- الأهداف المتوقعة لكل جانب مع اتجاه حديث.
- تحليل مكتوب يصف النتيجة بلغة واضحة: "يدخل الفريق المضيف بأفضلية متواضعة في الأهداف المتوقعة، ما يُترجَم إلى توزيع احتمالي 52-25-23 تقريباً."
- لا توجد بيانات سوق خارجية في أي مكان. لا توجد تحويلات إلى منصات خارجية. لا توجد عملة افتراضية. تحليل إحصائي فقط.
الخلاصة
بواسون هو الأداة الإحصائية الشغّالة تحت معظم نمذجة أهداف كرة القدم. بسيط بما يكفي لحسابه بسرعة، جيد بما يكفي لملاءمة معظم المباريات، والأساس الذي تُبنى عليه التحسينات الأكثر تطوراً (ديكسون-كولز، الثنائي، ذو الحدين السلبي).
فهم بواسون يفك غموض الثلاثيات الاحتمالية التي تراها على كل لوحة تحليلات. ليست سحراً؛ بل محاكاة من مدخلات الأهداف المتوقعة. ما يفصل النماذج الجيدة عن السيئة هو التحسينات التي تصحح نقاط ضعف بواسون المعروفة.
تستخدم Tactiq تقدير الاحتمال القائم على المحاكاة مع تحسينات مطبقة لمعالجة تعقيد المباراة الحقيقية. التحليل يعرض ثلاثيات احتمالية معايرة على كل بطاقة مباراة. أكثر من 1,200 مسابقة، توطين بـ32 لغة، طبقة مجانية بثمانية تحاليل في اليوم، دون الحاجة إلى بطاقة ائتمان.
إذا كنت تتابع السلسلة، فإن مفردات المقاييس الآن تشمل كيف يحلل الذكاء الاصطناعي مباريات كرة القدم، xG، xA، npxG، PPDA، إمالة الملعب، الأفعال التقدمية، SCA/GCA، xPts، تصنيفات Elo ومعايرة درجة Brier. بواسون هو محرك الاحتمالات الذي يربط معظم المقاييس السابقة معاً عندما يلزم إنتاج تحليل.