TU Dortmund forscht mit Partnern zu Favoriten der Frauen-Fußball-Weltmeisterschaft
Wenn ab morgen, 7. Juni, die besten Frauen-Fußballmannschaften der Welt in Frankreich aufeinandertreffen, geht Titelverteidiger USA statistisch als klarer Favorit ins Rennen. Das hat ein internationales Forscher-Team –bestehend aus Andreas Groll (TU Dortmund), Gunther Schauberger (TU München), Christophe Ley und Hans Van Eetvelde (beide Universität Gent) und Achim Zeileis (Universität Innsbruck) – mit Hilfe von maschinellem Lernen herausgefunden.
Der Algorithmus der Forscherinnen und Forscher kombiniert dabei selbstständig mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Durchschnittsalter oder Anzahl der Champions-League-Spielerinnen) sowie sozio-ökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt). Mit dem Verfahren haben die Forscher bereits bei der Fußball-WM der Männer 2018 die Prognosegüte der Wettanbieter übertroffen.
Das Modell ist dabei ein sogenannter „Random Forest“, der den Einfluss vieler Variablen automatisch kombiniert, indem er eine Vielzahl von Entscheidungsbäumen auf Basis zufällig leicht variierter Datensätzen generiert; daher stammt auch der Name „Zufallswald“. Die letztendliche Prognose erfolgt dann durch einen Mehrheitsentscheid der einzelnen Bäume des Random Forests und liefert für jedes mögliche Spiel im Turnier eine Wahrscheinlichkeit für Sieg, Unentschieden oder Niederlage. Die Datengrundlage dafür sind drei Informationsquellen:
• Ein statistisches Modell für die Spielstärke jedes Teams auf Basis von 3418 Länderspielen von 167 Nationalmannschaften der vergangenen acht Jahre.
• Ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 18 internationalen Buchmachern.
• Weitere Informationen über die Teams – etwa Durchschnittsalter, oder ihre Herkunftsländer – etwa Bevölkerung.
Mit den vorhergesagten Wahrscheinlichkeiten aus diesem Modell wurde die gesamte WM 100.000 mal durchsimuliert – Spiel für Spiel, der Turnierauslosung und allen FIFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den WM-Sieg. Die USA sind der Topfavorit mit einer Wahrscheinlichkeit von 28,1%, gefolgt von Gastgeber Frankreich mit 14,3%, England mit 13,3% und Deutschland mit 12,9%.
Wissenschaftlicher Ansprechpartner:
JProf. Andreas Groll
Fakultät für Statistik
Tel.: 0231-755 4229
E-Mail: groll@statistik.tu-dortmund.de
Originalpublikation:
Die statistische Prognose mit interaktiven Grafiken gibt es hier:
http://bit.ly/fifa-women-2019