포아송 분포와 축구의 득점 모델링

Tactiq AI · 2026-05-07 · 9분 읽기 · AI와 축구

진행자가 "이 경기는 2.3 기대 득점 라인을 가지고 있으며, 이는 오버 2.5의 61% 확률을 의미합니다"라고 말하는 경기 미리보기 쇼를 본 적이 있다면, 포아송 산수가 작동하는 것을 보고 있었던 것입니다. 어디에서 나온 것 같지 않은 확률 삼중항(홈 승 58%, 무 25%, 원정 승 17%)을 본 적이 있다면, 그것을 생성한 계산은 거의 확실히 포아송 시뮬레이션이었습니다.

포아송은 대부분의 축구 골 모델 아래의 통계 엔진입니다. 50년 동안 거기 있었으며, 나중에 더 유행하는 어휘로 설명되는 확률 숫자를 조용히 생성합니다. 어떻게 작동하는지 이해하면 "AI 축구 예측"이 실제로 내부에서 무엇을 하고 있는지 많이 알 수 있습니다.

이 기사는 평이한 영어로 포아송을 살펴보고, 축구에 어떻게 적용되는지, 어디서 작동하고 어디서 작동하지 않는지, 그리고 현대적인 개선이 그 위에 무엇을 더하는지 보여줍니다.

포아송이 실제로 무엇인가

포아송 분포는 평균 발생률이 주어졌을 때 어떤 수의 사건이 고정 시간 창에서 일어날 확률을 설명합니다.

공식적으로: 사건이 단위 시간당 일정한 평균 발생률 λ(람다)로 일어나고 서로 독립적으로 일어난다면, 그 창에서 정확히 k개의 사건이 일어날 확률은:

P(k) = (λ^k × e^(-λ)) / k!

수학을 사랑할 필요는 없습니다. 실용적 의미:

  • λ = 1은 사건이 평균 창당 한 번 일어남을 의미합니다. P(0) ≈ 37%, P(1) ≈ 37%, P(2) ≈ 18%, P(3) ≈ 6%, P(4+) ≈ 2%.
  • λ = 2는 창당 두 번을 의미합니다. P(0) ≈ 14%, P(1) ≈ 27%, P(2) ≈ 27%, P(3) ≈ 18%, P(4) ≈ 9%, P(5+) ≈ 5%.
  • λ = 3은 창당 세 번을 의미합니다. P(0) ≈ 5%, P(1) ≈ 15%, P(2) ≈ 22%, P(3) ≈ 22%, P(4) ≈ 17%, P(5+) ≈ 19%.

분포는 평균이 한 가지이지만 특정 결과는 알려진 확률로 그 평균 주변에 클러스터링됨을 포착합니다. λ = 2일 때 2를 예상하지만, 0, 3, 4도 모두 의미 있는 비율로 발생합니다.

왜 포아송이 축구 득점에 맞는가

포아송 가정이 축구에 대략 적용되는 세 가지 이유.

골은 드뭅니다. 대부분의 경기는 0-5골을 봅니다. 포아송은 0-5 범위를 깨끗하게 처리합니다. 매우 높은 카운트에서 무너지지만, 축구는 그것을 거의 테스트하지 않습니다.

골은 거의 독립적인 시간에 일어납니다. 경기 상태 효과(논의할 것)를 제거하면, 경기 내 골은 거의 일정한 비율로 일어납니다. 10분에 들어간 골은 생각만큼 40분의 골 확률을 급격히 변화시키지 않습니다.

발생률은 팀 품질에서 도출될 수 있습니다. A팀의 평균 득점률이 경기당 1.5골이고 B팀의 수비율이 경기당 1.2골을 내준다면, 이 경기에서 A팀의 기대 득점은 가중 혼합(1.5 × 1.2 / 리그 평균, 홈 어드밴티지 스케일링)입니다. 포아송은 그 λ를 받아 전체 분포를 생성합니다.

이를 결합하면 실행 가능한 모델을 얻습니다: 각 경기에 대해 양 팀의 기대 발생률을 도출하고, 각각에 포아송을 적용하여 골 카운트 분포를 생성하고, 이를 결과 매트릭스(홈 승 / 무 / 원정 승 / 오버 2.5 / BTTS 등)로 결합합니다.

포아송이 확률 삼중항을 만드는 방법

A팀(기대 득점 1.8)과 B팀(기대 득점 1.2) 간의 경기에 대해, 시뮬레이션:

  1. A팀에 대해 λ=1.8인 포아송을 사용하여 P(A팀 0득점), P(1), P(2), P(3), P(4), P(5+)를 계산합니다.
  2. B팀에 대해 λ=1.2인 포아송을 사용하여 B팀에 대해 동일한 것을 계산합니다.
  3. 독립성을 가정하면(첫 번째 포아송 가정), 곱합니다: P(A팀 N득점, B팀 M득점) = P(A=N) × P(B=M).
  4. N > M에 대해 합산하여 홈 승, N = M에 대해 무, N < M에 대해 원정 승.
  5. 필요한 경우 정규화.

결과: 두 기대 골 숫자에서 완전히 도출된 경기 확률 삼중항. 대부분의 경기에 대해 괜찮은 적합.

이것이 가장 단순한 형태에서 "xG 기반 예측 모델"이 보통 그것입니다: 두 숫자가 들어가고, 확률 분포가 나오고, 포아송이 엔진입니다.

포아송이 어디서 무너지는가

현대 모델링이 보정하려고 하는 네 가지 실제 실패 모드.

경기 상태 의존성. 마지막 20분에 0-1 적자를 추격하는 팀은 다르게 플레이합니다. 그들의 골 발생률은 경기 전 기대치 위로 올라갑니다. 상대의 발생률은 비슷하게 유지되지만 수비 실수가 허용된 기회를 유발합니다. 독립적이고 일정한 발생률 포아송은 역전 빈도를 과소 예측하고 정상 상태 우세를 과대 예측합니다.

무승부 인플레이션. 저득점 경기(팀당 λ가 1.5 미만)에서, 포아송은 1-1과 0-0을 동시에 과대 예측하지만, 전체적으로 무승부를 과소 예측합니다. 딕슨과 콜스는 1997년에 결과 매트릭스의 저점수 셀을 조정하는 보정을 제안했습니다. 대부분의 프로덕션 모델은 딕슨-콜스 또는 유사한 것을 사용합니다.

팀 간 상관관계. 한 팀의 골은 다른 팀의 골과 완전히 독립적이지 않습니다. 일찍 실점한 팀은 경기가 진행됨에 따라 품질이 떨어지는 경우가 많습니다. 이변량 포아송 모델은 작은 상관관계 매개변수를 추가합니다. 그것 없이는 공동 결과가 너무 독립적으로 취급됩니다.

극단적인 스코어라인. 포아송 분포의 오른쪽 꼬리(5-0, 6-0, 7-0)는 원시 포아송에서는 얇지만 미스매치에서는 실제로 더 자주 관찰됩니다. 현대 모델은 꼬리 보정을 적용하거나 포아송과 동일한 평균을 가지지만 더 많은 분산을 허용하는 음이항 분포를 사용합니다.

사용 가능한 규칙: 원시 포아송은 유용한 기준선이지만, 프로덕션 모델은 항상 개선을 추가합니다. 개선은 해석(확률 삼중항, 오버/언더, BTTS)을 변경하지 않지만 현실에 대한 숫자를 조입니다.

결과 확률 너머의 포아송

포아송 수학은 여러 다운스트림 지표를 가능하게 합니다:

기대 승점(xPts). 각 경기에 대해 포아송을 통해 결과 분포를 시뮬레이션하고, 양 팀의 기대 승점을 계산합니다. 시즌 전체에 합산하면 xPts가 됩니다.

창에 대한 기대 골 득점/실점. 팀의 xG 이력과 포아송을 결합하면 시즌 골 합계의 확률 분포가 생성됩니다.

아시안 핸디캡 공정 라인. xG를 아시안 핸디캡 배당률로 변환하는 데 골 차이 분포를 위한 포아송 시뮬레이션을 사용합니다.

오버/언더 및 BTTS 확률. 모두 포아송 시뮬레이션이 만드는 결과 매트릭스에서 도출 가능합니다.

사실상, 팀별 xG(또는 기대 득점률)가 있으면, 포아송은 승/무/패 삼중항만이 아니라 경기의 전체 확률 표면을 제공합니다.

Tactiq가 포아송 스타일 골 모델링을 처리하는 방법

Tactiq의 분석은 경기 카드에 표시되는 확률 삼중항을 생성하기 위한 파이프라인의 일부로 시뮬레이션 기반 확률 추정을 사용합니다. 구체적인 접근 방식, 기본 포아송 위에 적용된 개선, 그리고 시뮬레이션이 경기 상태와 상대 품질 상호 작용을 처리하는 방법은 제품 내부에 머무릅니다.

사용자에게는 경기 카드의 세 확률이 손으로 코딩한 휴리스틱이 아니라 기대 골 추정치와 팀 강도 신호에 기반한 시뮬레이션된 결과 분포를 반영한다는 효과가 있습니다. 신뢰도 표시기는 그 특정 경기에 대한 입력 신호의 작은 변화에 분포가 얼마나 민감한지를 반영합니다.

사용자가 경기 카드에서 보는 것:

  • 시뮬레이션을 통해 생성된 결과에 대한 확률 삼중항.
  • 최근 추세와 함께 양 팀의 기대 득점.
  • 결과를 평이한 언어로 명명하는 서면 분석: "홈 팀이 기대 득점에서 약간의 우위로 입장하며, 이는 대략 52-25-23 확률 분할로 변환됩니다."
  • 외부 시장 데이터 없음. 제3자 플랫폼으로의 리디렉션 없음. 가상 화폐 없음. 통계 분석만.

핵심 정리

포아송은 대부분의 축구 골 모델링 아래 있는 통계 일꾼입니다. 빠르게 계산할 수 있을 만큼 간단하고, 대부분의 경기에 맞을 만큼 좋으며, 더 정교한 개선(딕슨-콜스, 이변량, 음이항)이 구축되는 기반입니다.

포아송을 이해하면 모든 분석 대시보드에서 보는 확률 삼중항이 신비롭지 않게 됩니다. 마법이 아니라 기대 골 입력으로부터의 시뮬레이션입니다. 좋은 모델과 나쁜 모델을 분리하는 것은 포아송의 알려진 약점을 보정하는 개선입니다.

Tactiq는 실제 경기 복잡성을 처리하기 위해 적용된 개선과 함께 시뮬레이션 기반 확률 추정을 사용합니다. 분석은 모든 경기 카드에 보정된 확률 삼중항을 표시합니다. 1,200개 이상의 대회, 32개 언어 현지화, 하루 8회 분석의 무료 등급, 신용카드 불필요.

이 시리즈를 따라왔다면, 지표 어휘는 이제 AI가 축구 경기를 예측하는 방법, xG, xA, npxG, PPDA, Field Tilt, 점진적 액션, SCA/GCA, xPts, Elo 등급Brier 점수 보정을 망라합니다. 포아송은 예측이 생성되어야 할 때 이전 지표 대부분을 함께 묶는 확률 엔진입니다.

자주 묻는 질문

포아송 분포가 한 문장으로 무엇인가요?
포아송은 평균 발생률이 주어졌을 때 드문 사건이 고정 기간에 얼마나 자주 일어나는지를 설명합니다. 축구에서 '드문 사건'은 골이고, '고정 기간'은 90분이며, '발생률'은 팀 품질, xG 또는 경기 컨텍스트에서 도출됩니다. 분포는 0골, 1골, 2골 등의 확률을 알려줍니다.
왜 포아송이 축구 골에 대한 기본값인가요?
세 가지 이유. 골은 상대적으로 드물습니다(상위 리그에서 경기당 평균 약 2.5골). 경기 상태를 보정하면 경기 내에서 거의 무작위 시간에 클러스터링이 거의 없이 발생합니다. 그리고 포아송 수학은 빠르게 계산할 수 있을 만큼 간단해서 수천 가지 가능한 경기 결과를 시뮬레이션하는 데 실용적입니다. 이 조합이 그것을 축구 모델링의 일꾼으로 만듭니다.
포아송 골 모델의 입력은 무엇인가요?
두 발생률: 각 팀에 하나씩. 가장 일반적인 접근 방식은 팀 강도(공격률에서 상대 수비률을 뺀 것, 홈 어드밴티지가 포함됨)에서 발생률을 도출합니다. 현대 변형은 승리 기반 발생률 대신 경기당 xG 값을 입력하여 더 반응적이고 정확한 분포를 생성합니다.
포아송이 어디서 무너지나요?
세 가지 주요 실패 모드. 후반전 상태: 적자를 추격하는 팀은 리드를 지키는 팀과 다르게 플레이하므로, 골 발생률은 90분에 걸쳐 일정하지 않습니다. 팀 간 상관관계: 한 팀이 늦은 골을 내주면, 같은 단계에서 다른 골을 내주는 경우가 많은데, 포아송은 이를 독립적으로 취급합니다. 매우 낮거나 매우 높은 득점 경기: 포아송 꼬리는 극단적인 결과를 과소 표현합니다.
Tactiq는 분석에서 포아송을 직접 사용하나요?
시뮬레이션 기반 확률 추정은 경기 카드에 표시되는 확률 삼중항에 기여하는 여러 기술 중 하나입니다. 구체적인 시뮬레이션 접근 방식, 발생률이 어떻게 도출되는지, 그리고 모델이 포아송의 알려진 약점을 어떻게 처리하는지는 제품 내부에 머무릅니다. 사용자에게는 화면의 세 확률이 손으로 코딩한 규칙이 아니라 시뮬레이션된 결과 분포를 반영한다는 효과가 있습니다.
포아송에 더 나은 대안이 있나요?
음이항 분포, 이변량 포아송, 딕슨-콜스(저득점 경기에 상관관계를 추가), Skellam 분포가 모두 개선안으로 제안되었습니다. 각각은 추가적인 복잡성의 비용으로 기본 포아송의 특정 약점을 포착합니다. 대부분의 프로덕션 축구 모델은 원시 포아송이 아니라 이러한 개선 중 하나를 사용합니다.