xG là gì? Phân tích bàn thắng kỳ vọng cho người hâm mộ bóng đá
Mỗi cuộc trò chuyện bóng đá trong năm năm qua đều nhặt lên cùng ba chữ cái đó. Bình luận viên nhắc xG một cách tình cờ giữa các pha quay chậm. Các dòng thời gian Twitter đăng bảng tỷ số xG bên cạnh tỷ số thật. Các nhà phân tích nhắc đến bàn thắng kỳ vọng theo cách các thế hệ trước nhắc đến phần trăm kiểm soát bóng, như thể ai cũng đã biết con số đó có nghĩa gì.
Hầu hết người hâm mộ thì không, và đó là một vấn đề đáng giải quyết. xG là một trong những cách hữu ích nhất chúng ta có để nói về bóng đá ngoài tỷ số cuối cùng, nhưng nó cũng là một trong những cách bị dùng sai nhất. Được coi như lời sấm, nó làm thất vọng. Được coi như đúng những gì nó thực sự là, một điểm xác suất cho chất lượng cơ hội, nó làm sắc bén cách bạn xem trận đấu.
Bài này làm hai việc. Nó giải thích xG đo gì bằng ngôn ngữ đơn giản, không cần bằng thống kê. Và nó trung thực về chỗ xG gây hiểu lầm, vì đó là nửa mà hầu hết nội dung trên mạng bỏ qua. Đến cuối, lần tiếp theo bạn thấy "xG: 1.4 so với 2.8" dưới một kết quả 2-1, bạn sẽ biết nó nói cho bạn cái gì và cố ý bỏ lại cái gì.
xG thực sự là gì
Bàn thắng kỳ vọng, viết là xG, là một điểm xác suất gắn vào một cú sút đơn lẻ. Nó trả lời một câu hỏi: cơ hội chính xác này, tại vị trí chính xác này, sau kiểu xây dựng này, khả năng kết thúc trong lưới là bao nhiêu? Câu trả lời là một số thập phân giữa 0 và 1.
Một cú sút ở khoảng 5,5 mét với khoảng trống và một đường tạt mời gọi có thể đạt xG 0.65. Khoảng hai trong mỗi ba cơ hội như vậy, qua toàn bộ mẫu lịch sử, thành bàn. Một cú sút cầu may từ 27 mét với hai hậu vệ chặn góc có thể đạt xG 0.03. Ba trong mỗi một trăm. Con số là trung bình qua hàng ngàn lần thử tương tự, không phải một phân tích cho người sút cụ thể này vào ngày cụ thể này.
Cộng mỗi cú sút trong một trận cho một đội, và bạn có tổng xG của đội đó cho trận. Một tỷ số xG: 0.9 so với 2.4 trước bàn thắng 2-1 nói cho bạn rằng bên ghi 1 bàn là bên tốt hơn về tạo cơ hội, và bên ghi 2 bàn kết thúc cao hơn nhiều so với tỷ lệ cơ bản của họ. Một tỷ số xG: 2.7 so với 0.4 với bàn thắng 0-0 nói cho bạn rằng ai đó đáng thắng nhưng không thắng, đó là mô hình mà mọi người hâm mộ nhận ra từ những trận cảm thấy bất công.
Chỉ số này được sử dụng thương mại lần đầu vào đầu những năm 2010, nổi bật nhất là bởi Opta, và kể từ đó đã trở thành cách mặc định để mô tả chất lượng cơ hội ở mọi cấp độ bóng đá chuyên nghiệp. Tính hữu ích của nó không gây tranh cãi. Việc dùng sai của nó thì có.
Cách tính xG, sơ lược
Các mô hình xG không dùng bất kỳ đầu vào thần kỳ đơn lẻ nào. Chúng được huấn luyện trên các thư viện cú sút lịch sử khổng lồ, thường hàng trăm nghìn, mỗi cú sút được gắn thẻ với kết quả cuối cùng (bàn hay không) và một danh sách các đặc trưng bối cảnh. Mô hình học đặc trưng nào đẩy tỷ lệ chuyển đổi lên và cái nào đẩy xuống.
Các đặc trưng mà hầu hết các mô hình xG dựa vào đại thể tương tự trên toàn ngành:
- Vị trí cú sút. Cú sút được thực hiện ở đâu trên sân, đo bằng khoảng cách và góc đến khung thành. Đây là động lực mạnh nhất đơn lẻ.
- Bộ phận cơ thể. Chân phải, chân trái, đầu, hay khác. Pha đánh đầu từ cùng vị trí với cú sút bằng chân chuyển đổi ở tỷ lệ rất khác.
- Loại kiến tạo. Đó là đường chọc khe, một quả tạt, một pha cắt ngược, một tình huống cố định, một pha đá bồi. Mỗi mẫu chuyền tạo ra chuyển đổi đặc trưng riêng.
- Áp lực phòng ngự. Có bao nhiêu hậu vệ giữa cú sút và khung thành, và người gần nhất cách bao xa. Cú sút thoáng chuyển đổi thường xuyên hơn nhiều so với cú sút bị che.
- Trạng thái và giai đoạn trận đấu. Chơi bóng sống, phản công nhanh, tình huống cố định, phạt đền. Phạt đền cụ thể được xem là gần như một hằng số 0.76 đến 0.78 xG trên hầu hết các mô hình công khai.
Các nhà cung cấp khác nhau dùng những bộ đặc trưng cụ thể khác nhau. Một số bao gồm các đặc trưng dữ liệu theo dõi như vị trí hậu vệ. Một số gộp vào vị trí khởi đầu của thủ môn. Một số ít bao gồm các đặc trưng xây dựng trước cú sút như số đường chuyền mỗi lần kiểm soát. Cái mà tất cả chia sẻ là ý tưởng nền tảng: thu mỗi cú sút về một tập nhỏ các nhãn mô tả, tra xem tổ hợp nhãn đó trong lịch sử thường trở thành bàn bao nhiêu lần, và trả tỷ lệ đó ra dưới dạng xG.
Tactiq sử dụng dữ liệu trận đấu cấp sự kiện từ các nguồn cấp thể thao được cấp phép trên hơn 1.200 giải đấu để lấy bối cảnh theo cú sút cho phân tích. Cách cụ thể các tín hiệu xG kết hợp với phần còn lại mà sản phẩm xem ở lại trong ứng dụng. Kết luận hữu ích cho người đọc là: xG tự nó là tiêu chuẩn ngành. Những gì một công cụ làm với xG sau đó là nơi các sản phẩm khác nhau.
Tại sao xG quan trọng
Bảng xếp hạng giải đấu xếp các đội theo kết quả. Cột bàn thắng ghi được xếp họ theo dứt điểm, vốn có nhiễu. xG cho bạn một lăng kính thứ ba: ai đã tạo ra chất lượng nhiều nhất, độc lập với việc bóng có vào lưới hay không.
Điều đó quan trọng vì nhiều lý do mà một người hâm mộ bóng đá thực sự quan tâm.
Nó tách may mắn khỏi phong độ. Một tiền đạo ghi năm bàn trong ba trận từ 1.8 xG tích lũy đang kết thúc trên tỷ lệ của mình, và tỷ lệ đó thường sẽ hồi quy. Một tiền đạo ghi không bàn từ 4.1 xG tích lũy là không may, và bàn thắng của anh ta thường sẽ đến. Qua đủ cú sút, xG và bàn thắng hội tụ. Khi chúng phân kỳ, điều gì đó tạm thời đang xảy ra, hoặc là dứt điểm anh hùng, hoặc là những pha bỏ lỡ bực bội, hoặc là một thủ môn có tháng thi đấu đỉnh cao trong sự nghiệp.
Nó thưởng cho quá trình chứ không phải kết quả. Một bên tạo ra 2.5 xG cơ hội và thua 0-1 bởi một bàn từ tình huống cố định thường là bên tốt hơn trong 90 phút. xG bắt lấy khoảng cách đó theo cách mà tỷ số cuối cùng không thể. Các huấn luyện viên đã dùng phiên bản nội bộ của ý tưởng này trong nhiều thập kỷ. xG làm nó trở nên công khai.
Nó đưa phong độ nền tảng nổi lên trước kết quả. Một đội giữa bảng mà chênh lệch xG đã được cải thiện âm thầm qua sáu trận thường sắp leo bảng, ngay cả khi điểm số của họ chưa bắt kịp. Một bên nửa trên mà xG đang trượt trong khi họ tiếp tục thắng các trận sít sao đang vay mượn trước một sự hồi quy thường đến. Qua một cửa sổ trượt bốn đến tám trận, phong độ xG là chỉ báo trung thực hơn so với kết quả thô.
Nó cho bạn một cách để nói về chất lượng cú sút. Trước xG, "cơ hội tốt" và "cơ hội tệ" là chủ quan. Hai người có thể xem cùng một pha bỏ lỡ và bất đồng về việc nó có nên thành bàn hay không. xG đặt một con số lên đó. Con số không hoàn hảo, nhưng nó nhất quán giữa các trận, giải đấu và mùa giải.
Nó đi được qua các giải đấu. Một cú sút xG 0.30 ở Eredivisie Hà Lan được nhận ra như một cú sút xG 0.30 ở Serie A Ý. Chất lượng cơ hội nền tảng là cùng một chỉ số, ngay cả khi bối cảnh chiến thuật xung quanh khác nhau. Tính di động đó là một phần lý do xG đã trở thành ngôn ngữ chung của phân tích bóng đá hiện đại.
xG gây hiểu lầm ở đâu
Phần này là phần mà hầu hết các bài giải thích xG bỏ qua, và nó là lý do xG bị coi là ma thuật bởi những người lẽ ra phải biết rõ hơn. Trung thực về điểm yếu của chỉ số là khác biệt giữa việc dùng xG tốt và bị nó lừa.
Mẫu nhỏ nói dối. Một trận gần như không bao giờ đủ dữ liệu xG để đánh giá bất cứ điều gì. Một tiền đạo có thể đạt 1.4 xG trước một khối phòng ngự sâu cho anh ta vào vòng cấm cả tối và đạt 0.05 xG trước một hàng pressing cao không bao giờ cho anh ta xoay. Cả hai đều là thông tin về cuộc đối đầu cụ thể đó, không phải về khả năng của tiền đạo. Cuộn tối thiểu bốn đến sáu trận trước khi rút kết luận là mức cơ sở. Ít hơn là giai thoại có gắn con số.
Các chân sút đỉnh cao một cách hệ thống vượt qua xG. Một số cầu thủ, qua suốt sự nghiệp, ghi nhiều bàn hơn xG của họ gợi ý. Messi, Salah, Haaland và một nhóm nhỏ khác có đủ khối lượng cú sút để sự vượt kỳ vọng của họ không chỉ là nhiễu. Một mô hình xG trung bình không biết ai đang sút, chỉ biết cú sút đến từ đâu. Đó là một tính năng, không phải lỗi, nhưng có nghĩa là xG thô đánh giá thấp giá trị của các tiền đạo đỉnh cao và đánh giá cao giá trị của các tay sút khối lượng không dứt điểm.
Các chân sút yếu một cách hệ thống bỏ lỡ xG. Ngược lại cũng đúng như vậy. Các tiền đạo liên tục thấp hơn xG trong suốt một mùa giải thường không phải là không may. Họ đang dứt điểm kém. Xem hiệu suất kém của họ như sự hồi quy sắp đến, khi mô hình sự nghiệp nói khác, là một cái bẫy thường gặp.
Sai lầm phòng ngự làm phồng xG. Một pha đấm hụt của thủ môn lăn đến một tiền đạo không người kèm ở cự ly 5,5 mét ghi điểm xG cao, vì cú sút xảy ra từ một vị trí chất lượng cao. Mô hình xG không thấy sai lầm phòng ngự đã tạo ra cơ hội. Trong một trận, một đội có thể ghi một dòng xG ấn tượng chủ yếu nhờ sai lầm của đối thủ, và đó không phải là kỹ năng có thể lặp lại.
Tình huống cố định và phạt đền làm lệch con số tiêu đề. Một quả phạt đền đáng khoảng 0.76 xG mỗi lần. Một đội kiếm được hai quả phạt đền trong một trận đã có 1.5 xG được nấu sẵn trước khi họ chơi bóng. Các nhà phân tích quan tâm đến hiệu suất bóng sống đôi khi tách phạt đền và đá phạt ra khỏi tổng. Bảng tỷ số công khai thường không làm vậy.
Chung kết cúp, derby và các trận quyết định xuống hạng phá mô hình. xG được hiệu chuẩn dựa trên nền lịch sử khổng lồ của các trận mùa giải thường kỳ. Chung kết, derby địa phương và các trận sống còn ngày cuối cùng có tâm lý khác, hình thái chiến thuật khác, quyết định trọng tài khác, và các mẫu so sánh được nhỏ hơn nhiều. Dùng xG đọc các trận này theo cùng cách bạn đọc một trận giải đấu giữa mùa là sai lầm. Con số vẫn được tính. Độ tin cậy xung quanh nó nên thấp hơn, và hầu hết các bảng điều khiển công khai không làm điều đó thấy được.
Các hiệu ứng trạng thái cuối trận làm méo tổng. Một đội đuổi theo một bàn trong hai mươi phút cuối tạo ra những cơ hội tuyệt vọng không đại diện cho chất lượng thực sự của họ. Một đội bảo vệ lợi thế 1-0 rơi vào một hình dạng cố ý nhường kiểm soát và khối lượng cú sút. xG toàn trận thô trộn các giai đoạn này lại với nhau. xG điều chỉnh theo trạng thái trận đấu có tồn tại, nhưng đó không phải là thứ bảng tỷ số tiêu đề hiển thị.
Đây là tín hiệu cấp đội bị đọc nhầm là tín hiệu cấp cầu thủ. "Cầu thủ X có 0.8 xG trận này" có thể có nghĩa là anh ta có một cơ hội tốt và bỏ lỡ hoặc sáu cơ hội một nửa và bỏ lỡ tất cả. Hình dạng phân bố cú sút nền tảng quan trọng, không chỉ tổng. Xem xG tích lũy như một bảng điểm cầu thủ mà không nhìn tần suất cú sút và mức trải chất lượng, là cách người hâm mộ rốt cuộc tranh cãi về những con số mô tả những thứ khác nhau.
Quy tắc rút ra từ tất cả điều này: xG hữu ích nhất như một đầu vào cho một sự đọc rộng hơn, so sánh qua một cửa sổ vài trận, với chất lượng chân sút và bối cảnh trận đấu giữ trong đầu bạn. Nó ít hữu ích nhất như một phán quyết độc lập cho một trận duy nhất.
Tactiq dùng xG trong phân tích thế nào
Tactiq đối xử với xG theo đúng cách bài viết này vừa mô tả: như một mảnh dữ liệu phong độ nền tảng, không phải một phân tích tự thân.
Bên trong một phân tích trận đấu, các tín hiệu xG đóng góp vào bức tranh ai đã chơi ở mức nào qua các trận gần đây, cầu thủ và đội nào đang chơi trên hoặc dưới chất lượng của họ, và hình dạng nền tảng của một cuộc đối đầu sít sao hay một chiều ra sao. Phong độ xG ngồi bên cạnh vài đầu vào khác. Không đầu vào nào được xem như câu trả lời.
Cách cụ thể mà phân tích của Tactiq pha trộn xG với những gì còn lại nó thấy ở lại trong sản phẩm. Đó là một lựa chọn thiết kế có chủ ý, không phải giấu giếm. Phương pháp luận được công bố bị sao chép và hiệu chuẩn sai trong vòng vài tuần; cái đến tay người dùng là một phân tích đã đủ điều kiện về tin cậy với lý do được giải thích bằng ngôn ngữ đơn giản, không phải sách giáo khoa.
Cái người dùng thấy trên thẻ trận đấu:
- Một con số bàn thắng kỳ vọng cho mỗi bên, kèm chỉ báo xu hướng gần đây để bạn biết con số đang di chuyển theo hướng nào.
- Bộ ba xác suất cho kết quả, được đủ điều kiện bởi một chỉ báo tin cậy thấy được phản ánh các tín hiệu nền tảng ổn định đến đâu cho trận cụ thể này.
- Một phân tích viết nêu bối cảnh xG bằng ngôn ngữ đơn giản: "Xu hướng xG gần đây của đội chủ nhà đã nâng lên qua năm trận gần nhất của họ, chủ yếu từ chất lượng tình huống cố định," chứ không phải "mô hình của chúng tôi gán trọng số cho vector đặc trưng ba."
- Tactiq là phân tích thống kê độc lập. Không có nguồn cấp dữ liệu thị trường bên ngoài. Không có chuyển hướng đến nền tảng bên thứ ba. Không có tiền ảo. Khung là phân tích thống kê, và vẫn như vậy.
Ý định là một người hâm mộ đọc thẻ Tactiq rời đi với một sự đọc sắc bén hơn về trận đấu, không phải một con số để sao chép đi nơi khác.
Cách đọc xG như một chuyên gia
Sáu thói quen tách những người dùng xG tốt khỏi những người trích dẫn nó.
- Luôn nhìn cửa sổ trượt, không phải một trận. Bốn đến tám trận mỗi đội là mức cơ sở. Một trận là một câu chuyện, không phải một mẫu hình.
- So sánh chênh lệch xG, không phải xG thô. "Đội này đã tạo ra nhiều chất lượng hơn những gì họ nhường bao nhiêu" thường mang nhiều thông tin hơn tổng của bên nào đứng một mình.
- Tách phạt đền và đá phạt khi bạn quan tâm đến bóng sống. Tiêu đề công khai thường không làm vậy. Trừ 0.76 cho mỗi quả phạt đền để xem hình dạng bóng sống trông thế nào.
- Kiểm tra ai đang sút. Một chân sút đỉnh cao vượt xG không phải tin tức. Một tiền đạo luân phiên vượt xG là một cờ nói "kích cỡ mẫu."
- Đọc xG cùng với lịch sử dứt điểm. Vượt kỳ vọng vài trận có thể là nhiễu. Vượt kỳ vọng ba mùa là thông tin.
- Đối xử với các trận derby, cúp và chung kết thận trọng. Hạ thấp độ tin cậy của bạn trong đọc xG ở các trận mà mô hình có ít trận so sánh được hơn. Con số vẫn được tính. Dải xung quanh nó rộng hơn những gì bảng điều khiển cho bạn biết.
Áp dụng cùng nhau, những thói quen này biến xG từ một con số vặt vãnh thành một lăng kính. Lăng kính trung thực về những gì nó có thể thấy. Đó là toàn bộ điểm.
Kết luận
xG là một phân tích có căn cứ về chất lượng cơ hội, không phải một phán quyết về trận đấu. Dùng bên trong một cửa sổ vài trận, đọc cùng với chất lượng chân sút và bối cảnh trận đấu, và bóc tách sự phồng của phạt đền và tình huống cố định khi bóng sống là câu hỏi, nó là một trong những công cụ sắc bén nhất người hâm mộ có để nói về bóng đá ngoài tỷ số cuối cùng.
Dùng như một lời sấm một trận, hoặc như một con số bảng xếp hạng không có bối cảnh, hoặc như một sự thay thế cho việc xem trận, nó gây hiểu lầm. Chỉ số không đổi. Sự đọc đổi.
Tactiq được xây quanh sự đọc đó. Ứng dụng đưa xG lên trong bối cảnh, đủ điều kiện nó bằng tin cậy, giải thích con số có nghĩa gì bằng ngôn ngữ một người hâm mộ thực sự có thể dùng, và không bao giờ pha nó với nguồn cấp dữ liệu thị trường bên ngoài hoặc chuyển hướng đến nền tảng bên thứ ba. Hơn 1.200 giải đấu, bản địa hóa 32 ngôn ngữ trên giao diện và văn bản phân tích, mức miễn phí tám phân tích mỗi ngày, không cần thẻ tín dụng.
Nếu bạn thấy bài này hữu ích, bài đồng hành tự nhiên là hướng dẫn trước đó về AI phân tích trận đấu bóng đá thế nào. xG là một trong bốn họ dữ liệu mà bài đó đi qua chi tiết, và hai bài cùng nhau là nền tảng mà chúng tôi tiếp tục xây phần còn lại của blog lên trên.