Spanien wird Weltmeister – prognostizierten die meisten KI-Modelle zu Beginn der WM. Andere sahen Frankreich und England vorne. Das aktuelle Turnier ist nicht nur ein Wettstreit der Mannschaften. Sondern auch ein Wettstreit der Künstlichen Intelligenzen. Und genau das interessiert zwei bayerische Forschungsgruppen.
Wer wird Chatbot-Weltmeister?
Welcher Chatbot ist der beste? Dass alle großen KI-Tools den Sieg von Deutschland gegen Curaçao voraussagen konnten – geschenkt. Doch der Bot Grok von xAI lag bei den ersten drei Spielen zu 100 Prozent richtig – mit dem exakten Ergebnis. War das Glück oder Können? Das wollen Forschende der Münchner LMU Munich School of Management herausfinden.
Der Doktorand Jonas Schweisthal hat zusammen mit Kollegen aus Köln und Paderborn eine KI-Weltmeisterschaft programmiert. Bei der treten die wichtigsten Chatbots gegeneinander an. Jeder Bot gibt Spiel- und Turnierprognosen ab. Und kann dabei Punkte sammeln. Fünf Punkte bringt das exakte Ergebnis, zwei die richtige Tordifferenz, einen gibt es für die richtige Tendenz. Den aktuellen Stand der KI-Weltmeisterschaft gibt es live in der LLM SoccerArena [externer Link] zu sehen.
Wie arbeiten die Chatbots?
Am KI-Wettkampf beteiligt sind OpenAI, Claude, X, Anthropic, Qwen, Google, Deep Seek und Mistral. Sie berechnen die Wahrscheinlichkeit für Sieg, Unentschieden oder Niederlage mit allen Berichten und Statistiken, die sie im World Wide Web finden. Allen steht derselbe Datensatz zur Verfügung. Dennoch kommen die Bots zu unterschiedlichen Ergebnissen. Jedes Modell würde die zugrundeliegenden Daten unterschiedlich gewichten, meint Jonas Schweisthal; das eine Modell bewerte beispielsweise Verletzungen höher ein als das andere.
Die Forschenden interessieren sich genau für diese kleinen Unterschiede, da sie Rückschlüsse zulassen auf das „Denken“ der Systeme. Und die Erkenntnisse ließen sich übertragen auf die Entscheidungsfindung der KI in anderen Bereichen wie etwa im Management, so Jonas Schweisthal.
TU München berechnet die Stärke des Kaders
„Weniger ist mehr“ könnte das Motto des zweiten Forschungsprojektes sein, das der Münchner Sportwissenschaftler Martin Lames zusammen mit Forschenden aus Wien und Hangzhou bearbeitet. Die Analyse der „Squad League Networks“ [externer Link] verzichtet auf die Datenflut, mit der die Chatbots arbeiten, und fokussiert sich auf die Kader der Nationalmannschaften.
Einfach gesagt: Wer den besten Kader hat, gewinnt. Je mehr Spieler ein Team bei „großen“ Vereinen wie Paris, Bayern München oder Liverpool hat, desto höher die Gewinnwahrscheinlichkeit. Martin Lames setzt darauf, dass sein KI-Tool objektiver urteilt als die Chatbots. Das Halbfinale erreichen nach dieser Voraussage Frankreich, Deutschland, England und die Niederlande.
Wie gut ist die beste KI?
Im KI-Angebot sind auch spezielle Sport-KI-Tools wie Opta oder Footbot. Sie rechnen das Turnier zehntausende Male durch, berücksichtigen historische Daten, FIFA-Weltranglistenplätze, Markt- und Kaderwerten, Formkurven und Torstatistiken. Oft machen kommerzielle KI-Anbieter große Werbeversprechen. Aber die Trefferquote der KI-Tools, egal ob Chatbot oder auf Fußball spezialisiertes Modell, liegt im Schnitt nur bei rund 60 Prozent.
Mensch gegen KI – wer hat die bessere Trefferquote?
Dieser Frage gehen aktuell die Badischen Neuen Nachrichten nach. Und lassen in einem Experiment [externer Link] ChatGPT gegen knapp 300 menschliche Tippgeber antreten. Nach der ersten WM-Woche liegt der Chatbot immerhin auf Platz 22. Ein Hinweis darauf, dass Künstliche Intelligenz zumindest ein gutes Werkzeug sein kann, um Fußballspiele zu prognostizieren.
Zufall macht die Voraussage schwer
Warum liegt die Trefferquote der KI nur bei 60 Prozent? Weil Fußball allen Berechnungen zum Trotz unberechenbar ist. Mal springt der Ball vom Pfosten ins Tor, mal ins Feld zurück. Knapp die Hälfte der Tore ist Zufall. Das hat der Sportwissenschaftler Martin Lames in einer älteren Studie [externer Link] errechnet.
Fußball bleibt spannend
Fazit: Die KI kann Wahrscheinlichkeiten berechnen. Weissagen kann sie nicht. Auch der Chatbot Grok lag nach seinen ersten Treffern schön daneben. Allen Wahrscheinlichkeiten zum Trotz können die deutschen Fans also weiter vom WM-Titel träumen.

