포아송 분포와 축구의 득점 모델링

자주 묻는 질문

포아송 분포가 한 문장으로 무엇인가요?
포아송은 평균 발생률이 주어졌을 때 드문 사건이 고정 기간에 얼마나 자주 일어나는지를 설명합니다. 축구에서 '드문 사건'은 골이고, '고정 기간'은 90분이며, '발생률'은 팀 품질, xG 또는 경기 컨텍스트에서 도출됩니다. 분포는 0골, 1골, 2골 등의 확률을 알려줍니다.
왜 포아송이 축구 골에 대한 기본값인가요?
세 가지 이유. 골은 상대적으로 드물습니다(상위 리그에서 경기당 평균 약 2.5골). 경기 상태를 보정하면 경기 내에서 거의 무작위 시간에 클러스터링이 거의 없이 발생합니다. 그리고 포아송 수학은 빠르게 계산할 수 있을 만큼 간단해서 수천 가지 가능한 경기 결과를 시뮬레이션하는 데 실용적입니다. 이 조합이 그것을 축구 모델링의 일꾼으로 만듭니다.
포아송 골 모델의 입력은 무엇인가요?
두 발생률: 각 팀에 하나씩. 가장 일반적인 접근 방식은 팀 강도(공격률에서 상대 수비률을 뺀 것, 홈 어드밴티지가 포함됨)에서 발생률을 도출합니다. 현대 변형은 승리 기반 발생률 대신 경기당 xG 값을 입력하여 더 반응적이고 정확한 분포를 생성합니다.
포아송이 어디서 무너지나요?
세 가지 주요 실패 모드. 후반전 상태: 적자를 추격하는 팀은 리드를 지키는 팀과 다르게 플레이하므로, 골 발생률은 90분에 걸쳐 일정하지 않습니다. 팀 간 상관관계: 한 팀이 늦은 골을 내주면, 같은 단계에서 다른 골을 내주는 경우가 많은데, 포아송은 이를 독립적으로 취급합니다. 매우 낮거나 매우 높은 득점 경기: 포아송 꼬리는 극단적인 결과를 과소 표현합니다.
Tactiq는 분석에서 포아송을 직접 사용하나요?
시뮬레이션 기반 확률 추정은 경기 카드에 표시되는 확률 삼중항에 기여하는 여러 기술 중 하나입니다. 구체적인 시뮬레이션 접근 방식, 발생률이 어떻게 도출되는지, 그리고 모델이 포아송의 알려진 약점을 어떻게 처리하는지는 제품 내부에 머무릅니다. 사용자에게는 화면의 세 확률이 손으로 코딩한 규칙이 아니라 시뮬레이션된 결과 분포를 반영한다는 효과가 있습니다.
포아송에 더 나은 대안이 있나요?
음이항 분포, 이변량 포아송, 딕슨-콜스(저득점 경기에 상관관계를 추가), Skellam 분포가 모두 개선안으로 제안되었습니다. 각각은 추가적인 복잡성의 비용으로 기본 포아송의 특정 약점을 포착합니다. 대부분의 프로덕션 축구 모델은 원시 포아송이 아니라 이러한 개선 중 하나를 사용합니다.