June 25, 2018 Articles No Comments

ช่วงนี้หลายคนคงเข้าสู่โหมดนอนดึก ไม่ก็ต้องตื่นกลางดึกเพื่อมาดูฟุตบอลโลก ที่ 4 ปีจะจัดขึ้นเพียงครั้งเดียวเท่านั้น แน่นอนว่าผู้เข้าแข่งขันของแต่ละทีมต่างก็เตรียมความพร้อมมาเป็นอย่างดี เพื่อชิงถ้วยรางวัลในศึกการแข่งขันนี้ ทั้งการฟิตซ้อมร่างกาย ฝึกซ้อมทักษะและทีมเวิร์ค รวมไปถึงการวางแผนรูปแบบการเล่นในแต่ละนัด โดยศึกษาจากข้อมูลสถิติต่างๆ ยกตัวอย่างประเทศชั้นนำในด้านฟุตบอล เช่น เยอรมัน และอังกฤษ ก็ได้มีการนำข้อมูลทั้งที่เป็นวิดีโอและสถิติของนักเตะแต่ละคน รวมถึงรูปแบบการเล่นของทีมต่างๆ มาใช้ในการวิเคราะห์ เพื่อวางแผนกลยุทธ์ในการตอบโต้คู่ต่อสู้

ข้อมูลสถิติการแข่งขันและคุณลักษณะของทีมผู้เล่นไม่เพียงนำมาวางกลยุทธ์ในการแข่งขันได้เท่านั้น แต่ยังสามารถนำมาใช้ในการทำนายผลฟุตบอลโลกได้อีกด้วย วันนี้ผมจึงขอหยิบยกงานวิจัย 2 ชิ้นที่นำข้อมูลมาใช้วิเคราะห์และคาดการณ์ผลฟุตบอลโลกในปี 2018 นี้ ซึ่งผมว่าเป็นเรื่องที่น่าสนุกและน่าลุ้น เพราะท้ายที่สุดเราจะได้เห็นกันว่างานวิจัยชิ้นไหนทำนายได้แม่นยำมากกว่ากันในวันสิ้นสุดการแข่งขัน 15 ก.ค. นี้

1. Goldman Sachs’s Prediction

นักวิจัยจากสถาบันการเงินชื่อดัง Goldman Sachs ใช้ข้อมูลจากผลการแข่งขันฟุตบอลชิงแชมป์แห่งชาติยุโรป และ การแข่งขันฟุตบอลโลกรอบคัดเลือกที่ผ่านมาตั้งแต่ปี ค.ศ. 2005 มาป้อนเข้า โมเดลประมาณ 4 รูปแบบ จำนวน 200,000 โมเดล เพื่อหาตัวแปรสำคัญที่ช่วยทำนายจำนวนประตูที่ยิงกันในแต่ละแมตช์ แล้วคัดกรองตัวแปรมาได้ประมาณ 53 ตัวแปร แบ่งเป็น 3 กลุ่มได้แก่

1) กลุ่มตัวแปรที่เกี่ยวข้องกับทีม เช่น คุณลักษณะของทีม Elo ranking (บ่งบอก Performance ของทีม)

2) กลุ่มตัวแปรที่เกี่ยวกับอัตราส่วนของแมตช์ที่ชนะต่อแมตช์ที่แพ้ใน 10 แมตช์ที่ผ่านมา จำนวนประตูที่ยิงเข้าในเกมส์ล่าสุด และจำนวนประตูที่โดนคู่ต่อสู้ยิงในเกมส์ล่าสุด

3) กลุ่มตัวแปรที่เกี่ยวข้องกับผู้เล่น เช่น คุณลักษณะของผู้เล่น (ความสามารถในการเล่นบุกหรือเล่นรับ)

ยกตัวอย่าง ถ้าทีมเยอรมันต้องแข่งขันกับทีมอังกฤษ จากข้อมูลที่เกี่ยวข้องตามที่กล่าวมาข้างต้นจะทำนายว่าเยอรมันจะเป็นผู้ชนะ โดยดูจากโมเดลที่ทำนายจำนวนประตูที่ยิงของแต่ละทีม ซึ่งเยอรมันจะทำประตูได้ประมาณ 1.47 ประตู ส่วนอังกฤษจะทำประตูได้ประมาณ 1.28 ประตู

และเมื่อเรานำข้อมูลของทุกทีมที่เข้าร่วมกว่า 1,000,000 สถานการณ์ มาลองสร้างแบบจำลอง (Simulation) เพื่อทำนายหาสถานการณ์ของทีมที่จะเข้ารอบถัดไป ก็จะได้ผลการทำนายออกมาดังนี้ โดยโมเดลได้ทำนายไว้ว่าทีมบราซิลจะสามารถคว้าแชมป์ฟุตบอลโลกในครั้งนี้ โดยเอาชนะทีมเยอรมันได้ในรอบชิงชนะเลิศ

Source: Stehn, S.J. et al., Goldman Sachs 2018 the world cup and economics

2. Groll et al

อีกหนึ่งงานวิจัยที่น่าสนใจเกิดจากความร่วมมือของนักวิจัยเยอรมันและเบลเยี่ยม (Groll et al.) ได้ทำการวิเคราะห์ผลบอลจากการนำข้อมูลจากการแข่งขันฟุตบอลโลก 4 ครั้งที่ผ่านมาจากปี 2002-2014 และข้อมูลตัวแปรอื่น ๆ อีก 16 ตัวแปรที่หลากหลาย เช่น

1) กลุ่มเศรษฐศาสตร์ (GDP per capita, จำนวนประชากรของประเทศ)

2) กลุ่มองค์ประกอบทางกีฬา (ODDSET Probability โอกาสที่จะชนะฟุตบอลโลกในปีนั้นๆคำนวณโดยบ่อนทางการในประเทศเยอรมันนี, FIFA Rank การจัดลำดับของ FIFA)

3) กลุ่มความเป็นเจ้าบ้าน (เป็นเจ้าบ้านหรือไม่ ทวีปที่อยู่ กลุ่มสมาพันธ์)

4) กลุ่มองค์ประกอบทางโครงสร้างของทีม (จำนวนผู้เล่นที่มาจากสโมสรเดียวกัน อายุเฉลี่ยของผู้เล่น จำนวนผู้เล่นที่อยู่ในทีมที่เคยได้แชมป์ จำนวนผู้เล่นที่เล่นนอกประเทศ)

5) กลุ่มองค์ประกอบของโค้ช (อายุของโค้ช อายุงาน ประสบการณ์ มีสัญชาติเดียวกันกับทีมที่คุมอยู่หรือไม่)

รวมถึงมีการนำตัวแปรต่างๆเหล่านี้มาสร้างเป็นตัวแปรใหม่เพื่อบ่งบอกความสามารถของทีม แล้วเอามาประกอบในการสร้างโมเดลเพื่อทำนายจำนวนประตูที่แต่ละทีมจะยิงได้ในแต่ละแมตช์ และสร้างแบบจำลอง(Simulation) ของสถานการณ์ต่างๆ ของทีมที่จะเข้ารอบถัดไปเป็น 100,000 สถานการณ์ และนี่คือผลที่น่าจะเกิดได้ โดยมีทีมเยอรมันชนะบราซิลในรอบชิงชนะเลิศด้วยโอกาส 64%

Source: Groll A. et al., Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters

สิ่งที่สังเกตได้จากงานวิจัย 2 ชิ้นนี้คือ ความแตกต่างและความหลากหลายของข้อมูลที่นำมาใช้เป็นตัวแปรในการวิเคราะห์ ซึ่งงานของ Groll จะมีความหลากมิติมากกว่า ทั้งการใช้ตัวแปรที่ถูกสร้างจากโมเดลย่อยรวมถึงการใช้ข้อมูลทางเศรษฐศาสตร์ด้วย

อย่างไรก็ตาม ผลการทำนายนี้เป็นเพียงตัวอย่างที่แสดงให้เห็นถึงศักยภาพของการนำข้อมูลมาใช้ประโยชน์ในการศึกษาด้านวงการกีฬา ซึ่งจะว่าไปแล้วการทำนายผลในลักษณะนี้ก็มีการนำมาใช้กันแล้วพักหนึ่งในวงการพนันและเว็ปไซต์พนันที่ถูกกฎหมายในต่างประเทศ เช่น FiveThirtyEight ทุกท่านอาจลองเข้าไปดูว่ามีการใช้ข้อมูลกับตัวแปรอะไรบ้างในการทำนาย แต่ขอบอกไว้ก่อนว่าอย่าไปซีเรียสกับคำทำนายมาก เพราะยังมีอีกหลายตัวแปรที่ไม่สามารถเก็บข้อมูลได้ เช่น นักกีฬาบาดเจ็บ นักเตะติดโทษแบนในนัดนั้นๆ และ ความเข้ากันของคนในทีม (Chemistry) เป็นต้น

สุดท้ายผมขอบอกไว้ว่าไม่ได้มีความตั้งใจที่จะชักจูงให้นำผลการทำนายไปเกี่ยวข้องกับการพนัน เพียงแค่ต้องการจะศึกษากระบวนการนำข้อมูลมาใช้ประโยชน์ในงานวิจัยซึ่งอาจนำไปใช้ในงานอื่นๆที่มีลักษณะใกล้เคียงกันได้ ที่สำคัญขอให้ทุกท่านสนุกสนานกับการเชียร์ฟุตบอลและการนำข้อมูลมาใช้ครับ

References:

http://www.goldmansachs.com/our-thinking/pages/world-cup-2018/multimedia/report.pdf

Groll et al., Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters

https://arxiv.org/pdf/1806.03208.pdf

Written by Sertis Team