Elo Ratings ในฟุตบอล: ความแข็งแกร่งของทีมถูกวัดอย่างไร
หากคุณเคยคลิกเข้าไปในตัวอย่างแมตช์ฟุตบอลและเห็นบางอย่างเช่น "ทีม A เรตติ้ง 1720, ทีม B เรตติ้ง 1548" คุณกำลังดู Elo rating หากคุณเคยเห็นกราฟความแข็งแกร่งของสโมสรตลอดทศวรรษ ที่มีเส้นขึ้นและลงผ่านวิกฤตและยุคทอง นั่นเกือบแน่นอนเป็น Elo
Elo คือสิ่งที่ใกล้ที่สุดที่ฟุตบอลมีกับตัวชี้วัดความแข็งแกร่งของทีมที่เป็นสากล ออกแบบเดิมเพื่อให้คะแนนผู้เล่นหมากรุก ถูกปรับใช้สำหรับฟุตบอล บาสเก็ตบอล เทนนิส eSports และอีกมากมาย เวอร์ชันในฟุตบอลง่ายกว่าของหมากรุก แต่หลักการเหมือนกัน และเช่นเดียวกับตัวชี้วัดตัวเลขเดี่ยวใดๆ มันมักถูกอ่านผิด พอที่ความเข้าใจวิธีที่มันทำงานจริงๆ เป็นสิ่งที่ควรทำ
บทความนี้พาคุณไปสำรวจว่า Elo จับภาพอะไรเกี่ยวกับความแข็งแกร่งของทีม คำนวณอย่างไร ทำไมจึงกลายเป็นเริ่มต้นข้ามแดชบอร์ดวิเคราะห์ และกับดักที่ทำให้แฟนบอลที่ปฏิบัติต่อเรตติ้งเป็นออราเคิลแทนที่จะเป็นบทสรุปตกหลุม
Elo ratings คืออะไรในย่อหน้าเดียว
ทุกทีมมีเรตติ้ง โดยทั่วไปอยู่ในช่วง 1200 ถึง 2100 ในการปรับใช้สโมสรของฟุตบอล หลังแต่ละแมตช์ เรตติ้งของทั้งสองทีมอัปเดตโดยอิงจากผลงานเทียบกับความคาดหวัง หากทีม rated-1700 เอาชนะทีม rated-1500 ฝั่งที่แข็งแกร่งกว่าคาดว่าจะชนะ ดังนั้นเรตติ้งของพวกเขาเปลี่ยนไปเล็กน้อย หากฝั่ง rated-1500 ชนะแทน เรตติ้งของพวกเขากระโดดขึ้นและของฝั่ง rated-1700 ลดลง เพราะผลลัพธ์ขัดแย้งกับความคาดหวัง เสมอกับความคาดหวัง? ความแตกต่างของเรตติ้งดูดซับความประหลาดใจตามสัดส่วน
ตลอดหลายร้อยแมตช์ เรตติ้งเสถียรรอบความแข็งแกร่งจริงของแต่ละทีม ปีนเรตติ้งโดยเอาชนะฝ่ายแข็งแกร่ง เลื่อนลงโดยแพ้ฝ่ายอ่อน ตัวเลขหมายถึงอะไรเป็นรูปธรรม: ช่องว่างเรตติ้ง 100 จุดสอดคล้องกับเต็งประมาณ 64-36 ช่องว่าง 200 จุดประมาณ 76-24 ช่องว่าง 400 จุดประมาณ 91-9
คำนวณ Elo จริงๆ อย่างไร
คณิตศาสตร์ ปอกเปลือกความซับซ้อน:
- ผลคาดหวังสำหรับทีม A เทียบกับทีม B:
E_A = 1 / (1 + 10^((R_B - R_A) / 400))
ซึ่ง R_A และ R_B คือเรตติ้งปัจจุบันของทีม ตัวหารด้วย 400 คือธรรมเนียมจากหมากรุก ตัวแปร Elo ของฟุตบอลบางครั้งใช้ scalar ต่างกันแต่ 400 เป็นมาตรฐาน
- อัปเดตหลังแมตช์:
R_A ใหม่ = R_A เก่า + K × (ผลจริง - E_A)
"ผลจริง" คือ 1 สำหรับชนะ, 0.5 สำหรับเสมอ, 0 สำหรับแพ้จากมุมมองของ A K คือค่าคงที่ หมากรุกใช้ K=16 ถึง 32 ขึ้นอยู่กับระดับประสบการณ์ Elo ฟุตบอลมักใช้ K=20 ถึง 50 โดยค่าที่สูงกว่าให้เรตติ้งที่ตอบสนองมากกว่า
ดังนั้นหลังแมตช์:
- เต็งชนะ: การเปลี่ยนแปลงบวกเล็กน้อยสำหรับเต็ง ลบเล็กน้อยสำหรับรอง
- เต็งเสมอ (พลิก): ลบเล็กน้อยสำหรับเต็ง บวกเล็กน้อยสำหรับรอง
- เต็งแพ้ (พลิกใหญ่): ลบสำคัญสำหรับเต็ง บวกสำคัญสำหรับรอง
- รองชนะ: เหมือนข้างบนจากทิศทางอื่น
การปรับแต่งเฉพาะฟุตบอลสองอย่างที่ระบบ Elo สาธารณะส่วนใหญ่เพิ่ม:
การถ่วงน้ำหนักผลต่างประตู ชนะ 3-0 นับมากกว่าชนะ 1-0 ตัวแปร Elo สาธารณะส่วนใหญ่คูณ K ด้วยปัจจัยตามขอบประตู (K × √GoalDiff หรือคล้ายกัน) ไม่มีสิ่งนี้ ระบบปฏิบัติต่อทุกผลลัพธ์เป็นไบนารี เสียข้อมูล
ความได้เปรียบเหย้า ทีมเหย้าได้โบนัสเรตติ้งเล็กน้อย (หรือทีมเยือนได้โทษ) ก่อนคำนวณความคาดหวัง ClubElo ใช้ประมาณ 100 จุด
การปรับแต่งเหล่านี้สร้าง Elo ที่ปรับใช้สำหรับฟุตบอลที่ติดตามความแข็งแกร่งของทีมอย่างมีความหมายตลอดฤดูกาล
ทำไม Elo จึงกลายเป็นเริ่มต้น
Elo ติดในฟุตบอลด้วยเหตุผลปฏิบัติและทางแทคติกผสมกัน
อินพุตมีให้สากล ผลแมตช์และเรตติ้งฝ่ายตรงข้ามคือทั้งหมดที่คุณต้องการ คุณไม่ต้องการข้อมูลเหตุการณ์ ข้อมูล tracking หรือ xG เพื่อคำนวณ Elo เรตติ้งประวัติศาสตร์สามารถสร้างจากยุคใดๆ ที่มีผลแมตช์อยู่
จับภาพความแข็งแกร่งของฝ่ายตรงข้าม ทีมที่มี 22 ชัยอาจดูระดับท็อป ทีมที่มี 22 ชัยกับทีมล่างตารางและไม่มีชัยกับท็อปซิกซ์ไม่ใช่ระดับท็อป Elo ให้รางวัลรูปแบบแรกน้อยกว่าตารางคะแนนที่ไร้เดียงสาเพราะชัยเป็นกับเรตติ้งที่อ่อนกว่า
คณิตศาสตร์ง่ายพอที่จะตรวจสอบ ไม่มีกล่องดำ คุณสามารถคำนวณเรตติ้งของทีมใดๆ ใหม่ด้วยตัวเองด้วยประวัติแมตช์ ความสามารถในการตรวจสอบนั้นสำคัญในการวิเคราะห์ เพราะให้คุณทดสอบและปรับค่า K, การถ่วงน้ำหนักผลต่างประตู และโบนัสเหย้าโดยไม่ต้องมีทีม data-science
ผลิตตัวเลขเดี่ยว สำหรับข้อบกพร่องทั้งหมดของบทสรุปตัวเลขเดี่ยว พวกมันสื่อสารได้ดี "ทีม A เรตติ้ง 1720 เทียบ ทีม B 1548" เข้าใจได้ในแบบที่ "ทีม A npxG differential +15.2 ตลอด 28 แมตช์" ไม่ใช่สำหรับแฟนบอลทั่วไป
การเปรียบเทียบข้ามลีก (พร้อมการสอบเทียบ) Club Elo สามารถปรับสำหรับความแข็งแกร่งของลีกโดยใช้ "ลีก Elo" คู่ขนานที่ให้คะแนนการแข่งขันกัน สิ่งนี้อนุญาตให้เปรียบเทียบข้ามลีก ซึ่งการเปรียบเทียบเปอร์เซ็นต์ชัยที่ไร้เดียงสาทำไม่ได้
ที่ที่ Elo ทำให้เข้าใจผิด
ข้อจำกัดที่แท้จริงสี่อย่างที่ต้องเข้าใจก่อนเชื่อคอลัมน์เรตติ้ง
ฟอร์มล่าช้า Elo อัปเดตทีละน้อย ทีมที่อยู่ในสตรีคชัยห้าครั้งไม่กระโดดขึ้นเรตติ้ง มันปีนอย่างมั่นคง ทีมในวิกฤตไม่ตกฮวบ มันลอยลง ฟอร์มระยะสั้นถูกถ่วงน้ำหนักน้อยเกินไปโดยการออกแบบ นักวิเคราะห์บางคนใช้ "ฟอร์มเลื่อน" ควบคู่กับ Elo เพื่อรวมความไวต่อฟอร์มล่าสุดกับความเสถียรของยอดรวมฤดูกาล
คุณภาพฝ่ายตรงข้ามถือว่าคงที่ภายในแมตช์ Elo ถือว่าทีม rated-1700 เล่นที่ความแข็งแกร่ง rated-1700 ตลอดแมตช์เต็ม ในความเป็นจริง การหมุนเวียนผู้เล่น ความเหนื่อย การบาดเจ็บกลางแมตช์ และการตัดสินใจทางแทคติกหมายถึงความแข็งแกร่งผันแปร Elo ปฏิบัติต่อแต่ละแมตช์เป็นการประลองสะอาด "เรตติ้งเทียบเรตติ้ง" ซึ่งเป็นการลดทอนที่แมตช์จริงไม่เคยเป็น
การโอนเรตติ้งสโมสรไปทีมชาติ เรตติ้ง Elo ที่อิงสโมสรไม่โอนไปสู่ผลงานทัวร์นาเมนต์ทีมชาติได้สะอาด AFCON, Euro, World Cup, สิ่งเหล่านี้คือแมตช์ที่เรตติ้ง Elo ของผู้เล่นในสโมสรไม่เกี่ยวข้องเป็นส่วนใหญ่เพราะทีมชาติผสมผู้เล่นข้ามบริบทสโมสร การใช้ Elo สโมสรเพื่อทำนายแมตช์ทัวร์นาเมนต์ระหว่างประเทศคือการผิดประเภท
การถดถอยก่อนฤดูกาล เรตติ้งของทีมที่เลื่อนชั้นจากลีกระดับล่างของฤดูกาลที่แล้วประเมินความแข็งแกร่งปัจจุบันของพวกเขาที่ระดับสูงกว่ามากเกินไป ระบบ Elo หลายอันใช้ "การถดถอย" ระหว่างฤดูกาล ลดเรตติ้งของทุกทีมไปยังค่าเฉลี่ยเพื่อคำนึงถึงการเปลี่ยนแปลงของผู้เล่น จำนวนการถดถอยที่แน่นอนคือการตัดสินใจ และผู้ให้บริการต่างกันใช้ค่าต่างกัน
ความไวของค่า K ความตอบสนองของ Elo ขึ้นอยู่กับ K มาก ระบบที่มี K เล็กเกินไปกลายเป็นไม่ตอบสนองต่อการเปลี่ยนแปลงความแข็งแกร่งจริง ระบบที่มี K ใหญ่เกินไปแกว่งเป็นบ้าด้วยความแปรปรวนแมตช์เดียว K ที่ "ถูกต้อง" สำหรับฟุตบอลปรับด้วยประสบการณ์ และผู้ให้บริการต่างกันผลิตค่า K ต่างกัน
กฎที่มีประโยชน์: Elo คือบทสรุปความแข็งแกร่งของทีมพื้นฐานที่ดี ไม่ใช่การจัดอันดับที่แม่นยำ มันมีประโยชน์มากที่สุดในฐานะจุดเริ่มต้นที่สัญญาณอื่นๆ (ฟอร์มล่าสุด ความแตกต่าง xG บริบทผู้เล่น) ปรับแต่ง
Tactiq ใช้สัญญาณความแข็งแกร่งของทีมในการวิเคราะห์อย่างไร
การวิเคราะห์ของ Tactiq รวมสัญญาณความแข็งแกร่งของทีมที่ได้จากประวัติแมตช์เป็นหนึ่งในอินพุตหลายตัว สัญญาณมีส่วนร่วมในความน่าจะเป็นพื้นฐานของแต่ละผลลัพธ์แมตช์ ควบคู่กับฟอร์มล่าสุด ความแตกต่าง xG ประวัติการเจอกันโดยตรง และบริบทผู้เล่น วิธีเฉพาะที่สัญญาณความแข็งแกร่งของทีมผสมกับสิ่งที่การวิเคราะห์อ่านเก็บไว้ภายในผลิตภัณฑ์
สิ่งที่ผู้ใช้เห็นบนการ์ดแมตช์:
- ความน่าจะเป็นสามค่าสำหรับผลลัพธ์ กำหนดโดยตัวบ่งชี้ความเชื่อมั่นที่สะท้อนว่าสัญญาณพื้นฐานเสถียรแค่ไหนสำหรับแมตช์เฉพาะนี้
- Expected goals สำหรับแต่ละฝ่ายพร้อมแนวโน้มล่าสุด
- การวิเคราะห์ที่เขียนซึ่งเรียกชื่อรูปแบบการปะทะเป็นภาษาธรรมดา: "ฝั่งเหย้าเข้าเป็นฝั่งที่แข็งแกร่งกว่าในฟอร์มล่าสุดและประวัติแมตช์ แต่การสร้างโอกาสล่าสุดล้าหลังของฝั่งเยือน"
- ไม่มีข้อมูลตลาดภายนอกที่ใดเลย ไม่มีการเปลี่ยนเส้นทางไปยังแพลตฟอร์มของบุคคลที่สาม ไม่มีสกุลเงินเสมือน การวิเคราะห์ทางสถิติเท่านั้น
การวิเคราะห์ไม่แสดงตัวเลข Elo ดิบ มันแสดงการอ่านทางแทคติกที่ภาพความแข็งแกร่งของทีมพื้นฐานบอกใบ้
บทสรุป
Elo ratings บีบความแข็งแกร่งของทีมเป็นตัวเลขเดี่ยวที่อัปเดตหลังทุกแมตช์โดยอิงจากผลลัพธ์และคุณภาพฝ่ายตรงข้าม คณิตศาสตร์ง่าย ผลลัพธ์ตีความได้ ตัวชี้วัดเดินทางข้ามยุคและลีก
มันไม่ใช่การคาดการณ์ มันคือบทสรุป ฟอร์มล่าสุด การบาดเจ็บ การเปลี่ยนแปลงทางแทคติก การหมุนเวียนผู้เล่น สิ่งเหล่านี้ไม่ปรากฏใน Elo โดยตรง การใช้ Elo เป็นส่วนเสริมของการวิเคราะห์ที่หลากหลายทำงานได้ดี การใช้เป็นอินพุตเดียวพลาดเนื้อสัมผัสที่ตัดสินแมตช์สมัยใหม่ส่วนใหญ่
Tactiq ถูกสร้างเพื่ออ่านสัญญาณความแข็งแกร่งของทีมควบคู่กับบริบทที่หลากหลาย การวิเคราะห์แสดงการอ่านที่กำหนดความเชื่อมั่นของการปะทะเป็นภาษาธรรมดาและไม่ผสมสัญญาณทางสถิติกับข้อมูลตลาดภายนอก การแข่งขันกว่า 1,200 รายการ การแปลเป็น 32 ภาษา ระดับฟรีแปดการวิเคราะห์ต่อวัน ไม่ต้องใช้บัตรเครดิต
หากคุณติดตามซีรีส์นี้ คำศัพท์ตัวชี้วัดตอนนี้ครอบคลุม วิธีที่ AI วิเคราะห์แมตช์ฟุตบอล, xG, xA, npxG, PPDA, Field Tilt, progressive actions, SCA/GCA และ xPts Elo เข้าร่วมคอลเลกชันเป็น baseline ความแข็งแกร่งของทีมที่ตัวชี้วัดอื่นวางทับ
Tactiq เป็นการวิเคราะห์ทางสถิติอิสระ ไม่เกี่ยวข้องกับตลาดภายนอก