Grenzen mathematischer statistischer Spielauswertungen

Ich hätte mal eine Frage an die Taktik Experten und Statistikauskenner. Mir ist da heute beim hören der aktuellen Folge des Spodcast was aufgefallen, da wurde drauf eingegangen, wie weit der Expected Goals Wert und die tatsächliche Leistung des SC auseinandergehen. Woher kommt das? Haben wir hier einen Fall, in dem das mathematische Modell der Expected Goals vielleicht Vorannahmen trifft, die nicht akkurat sind?
Das sind ja alles nur Modelle aus meiner Sicht, auch Goalimpact und was es da noch alles gibt.
Wird sich da aktuell vielleicht zu sehr drauf versteift in der Betrachtung des Fußball, sich alles mit diesen schönen Zahlen erklären zu wollen? Fällt da nicht auch viel, was so ein Spiel ausmacht, unter den Tisch?

Fast ausnahmslos stellen für mich alle Statistiken und bekannten Daten, die bei einem Spiel erhoben werden, lediglich eine Grundlage dar. Darauf fußen dann Erklärungen, die bestenfalls Interpretationen sind und das tatsächlich Gesehene untermauern. Statistiken können ja gar nicht das gesamte Spiel abbilden.

2 „Gefällt mir“

Naja, expected goals erklären mit Sicherheit nicht das ganze Spiel, aber geben Hinweise auf Teilaspekte. Der VfB beispielsweise wäre nach xG wahrscheinlich souveräner Tabellenführer und wie haben auch ne Menge gute Chancen liegen lassen. Gleichzeitig ist das Offensivspiel aber auch zu behäbig, so dass man von der Leistung nicht sagen kann, dass wir underperformen.

Ich finde, solche Statistiken geben einem ein Gefühl für Einzelaspekte, die man vorher nur aus dem Bauch heraus bewertet hat. Den Fußball erklären sie aber nicht.

Die präziseste Statistik ist die Torstatistik. Denn wer in einem Spiel mehr Tore schießt, gewinnt :wink:
Manchmal spiegelt das Ergebnis aber nicht das Spiel wieder. Da verraten die xG vielleicht mehr über das Spiel als die Tore.
Und in diesen Fällen ist es dann natürlich so, dass die xG nicht das Ergebnis erklären können.

Mein Gedanke ist eben der, dassjedes modell seine Grenzen hat, was die Abbildung der Realität angeht, weil man gewisse mathematische Annahmen trifft. Wenn ich jetzt zum Beispiel mal in die Physik greife beim freien Fall. Natürlich kann man da das Modell des Massepunktes ohne Luftreibung verwenden, wenn man z.B. den Fall einer schweren Kugel betrachten will. Wird das fallende Objekt aber ausgedehnter und Leichter, sagen wir ein Blatt Papier, muss man das und die Luftreibung mit in dem Modell berücksichtigen, um Dinge daran berechnen zu können.
Und das meine ich mit nicht ganz akkuraten oder vereinfachten Vorannahmen. Für die Mehrzahl der Spiele reicht dieses Modell ja wohl auch aus und Ergebnis und ExpG fallen von der Tendenz zusammen, aber die Frage ist für mich: Welche Parameter lässt dieses Modell aus, dass es eben in manchen Fällen ungenaue Ergebnisse liefert?

XG ist doch am Ende auch ganz einfach nur ein stochastisches Modell.
Und wie immer in der Stochastik kannst du dann den Zufall (sprich Glück/Pech) nie komplett ausschließen, sondern dich nur annähern.

Bei Klopp in seiner letzten BVB-Saison war es doch dasselbe, nur in negativ.

Ansonsten gab es vor Jahren in der 11 Freunde glaub ich mal einen Artikel, dass Favre-Teams das xG-Modell gern outperformen. Glaube das hing mit der Anzahl der Spieler zwischen Ball und Tor (-> störende Beine) zusammen, während sich das Modell vor allem auf die Positon des Schusses bezog.

Meinem Verständnis nach setzt xGoals einfach eine Wahrscheinlichkeit dafür an, von wo aus Torschüsse abgegeben wurden. Dafür nehmen sie halt alle möglichen Daten, einfachstes Beispiel wenn von 10.000 Strafstößen 8.500 verwandelt werden gibt es dafür halt 0.85 Tore bei xGoals. Das machen sie halt für jeden möglichen Punkt bzw. für ausreichend viele Bereiche.

Meines erachtens werden dabei z.B. folge Aspekte nicht berücksichtigt:

  • xGoals einzelner Spieler, d.h. wenn es 0.2 Tore für Schüsse mittig aus 16 Metern gibt, wird dabei nicht berücksichtigt, dass Spieler X mit seinen 20 Schüssen aus dieser Position vielleicht bei 0.1 oder 0.3 liegt, weil er einfach besserer / schlechterer Schütze als der Mittelwert ist
  • das o.g. Beispiel finde ich auch einleuchtend, bei Schüssen aus der Distanz ist entscheidend wie viele Spieler der verteidigenden Mannschaft noch dazwischen stehen
  • erweiternd zu dem zweiten Punkt so etwas wie „Wie viel Platz ein Spieler beim Abschluss hat“
  • dann so etwas wie die Qualität der Vorbereitung, meiner Einschätzung nach wird da nicht berücksichtigt, d.h. Beispiel ein Abschluss aus 5 Metern: Wenn der Pass gut ist, ist es ein fast sicheres Tor, aber wenn der Pass schlecht ist und der Stürmer den Ball gerade so irgendwie aufs Tor bekommt eben nicht, zählt aber vermutlich bei xGoals gleich

Das wären so ein paar Anhaltspunkte, die ich da sehen würde. Es gibt einfach - wie du es mit der Physik vergleichst - noch mehr Parameter für die Chance ein Tor zu erzielen stark beeinflussen als nur die Position aus welcher geschossen wird. Gerade auch in Kombination dieser dann miteinander. Kann auch sein, dass teilweise davon etwas schon berücksichtigt wird, aber auch dann immer nur mit irgendwelchen diskreten Einschätzungen (z.B. die Qualität der Vorbereitung ist kaum wirklich messbar). Falls jemand mehr weiß und mich korrigieren kann, würde mich dass auch interessieren.

This might interest you (regarding parameters used and not used and the effect thereof in xG calculations):

Für alle Interessierten sind vielleicht diese beiden Artikel von StatsBomb interessant:

Neuer Artikel bei Total Football Analysis über die Bundesliga. Mit Daten von Impect, der Firma hinter dem berühmt-berüchtigten „Packing“ :grin:

@Eric habe mich in den letzten Wochen intensiv wissenschaftlich mit statistischen Analysen im Fußball auseinandergesetzt, bei Bedarf kann ich Dir einige Artikel schicken. Cortex hat viele der Hauptschwächen gut dargestellt.

Für einen Torerfolg ist es auch sehr wichtig, wie bereits von Cortex beschrieben, wieviele Gegenspieler zwischen dem Schützen und dem gegnerischen Tor sind. Des Weiteren wie groß der Abstand zwischen dem Schützen und dem nächsten Gegnerspieler sind.
Der direkte Torschuss führt statistisch häufiger zu einem Tor, das erklärt zu Teilen auch die Klasse einzelner Stürmer. Die guten Stürmer können den Ball direkt auf das Tor schiessen und benötigen keine vorherige Ballanahme und haben damit weniger Gegnerdruck. Lehre für das Fussballtraining in der Box wird der Ball nicht angenommen, sondern direkt der Abschluss gesucht.

Ein weiterer Nachteil von Expected Goals, dass die Chancen nicht miteinberechnet wurde, bei denen kein Torschuss abgegeben wurde.
Bsp: Stürmer rennt mit dem Ball ohne Gegnerspieler auf das Tor, der Ball wird aber zu weit vorgelegt und der Torwart fängt den Ball ab oder der Abwehrspieler kann den Ball noch weggrätschen.

Gibt noch ein paar weitere Kleinigkeiten, dennoch halte ich die expectes goals für ein gutes Modell, um zu ermitteln, welches Team eher überlegen war.

Diesen medialen Packing Hype gab es in der Szene gar nicht, weil Packing zu eindimensional ist und viele Schwächen besitzt. Es gibt andere, ähnliche Methoden, die aber weitaus besser und aussagekräftiger sind. Jeder lange Ball ist zum Beispiel im Packing super. Das direkte Spiel wurde bereits von Hughes et al. als das Beste empfohlen. Daraufhin hat England jahrelang Kick and Rush gespielt. Die Statistik hat nur eine grobe Sache nicht mitbedacht. Die Engländer haben vor Jahren ihr Jugendkonzept geändert und werden in den nächsten Jahren sehr starke Spieler bekommen. Ich gehe davon, dass in den nächsten Jahren England wieder einmal Weltmeister wird.

Es gibt expected goals Modelle die auch Situationen die nicht mit einem Torschuss beendet wurden werten. Das ganze nennt sich „non-shot xG“. FiveThirtyEight macht das beispielsweise.

Mich würde noch interessieren wen du mit „die Szene“ meinst, wenn du von Packing und der fehlenden Relevanz sprichst. Dass jeder lange Ball von „Packing“ belohnt wird, ist schlicht nicht richtig. Spielverlagerung hat dazu einen ausführlichen Artikel geschrieben (https://spielverlagerung.de/2016/08/03/packing-besser-als-der-ruf/). Der Gegnerdruck spielt dabei zum Beispiel eine sehr große Rolle. Auch wissenschaftliche Studien weisen Packing als einen guten Indikator für gute Teams aus (https://link.springer.com/chapter/10.1007/978-3-030-35048-2_5)
Letztendlich würde ich Packing aber auch nicht als Alternative zu xG sehen, sondern als Ergänzende Informationsquelle.

Dass England mittlerweile eine Top-Jugend hat, Stimme ich dir vollkommen zu. Viele herausragende Talente.

Hallo Auba14, ja non-shot xG gibt es, aber meistens werden die normalen expected goals verwendet und dort gibt es die schwäche. Packing von Reinartz und co war und ist keine Erfindung, wurde aber von der Ard als die Methode gehypt. Die „Szene“ sind die sportwissenschaftlichen Abhandlungen. Die Anzahl überspielter Spieler ist sogar sehr wichtig, aber entscheidend ist meistens wo im Feld und was danach passiert und das ist in dem packing Modell von Reinartz und co nicht drin.
Bei Interess kann ich einige „paper“ schicken

1 „Gefällt mir“

Ja das muss bei allen hier verwendeten Modellen natürlich immer beachtet werden, worüber man damit Aussagen treffen kann und worüber nicht. Es gibt nicht DAS Modell. Das trifft selbstverständlich auch auf das Packing zu.
Allerdings kann ich deine negativen Eindrücke aus sportwissenschaftlichen Studien nicht bestätigen. Oben hab ich ja bereits auch schon eine verlinkt, in der Packing mit die besten Werte erzielt hat.
Würde aber trotzdem sehr gerne alles zugeschickt bekommen, was das Thema betrifft :slight_smile: also immer her damit :+1:t4:

@auba: ja das stimmt,alle suchen noch das Modell. Wahrscheinlich wurde ich mißverstanden. Das Bestimmen der Anzahl der überspielten Spieler as Perfomance indicator ist super, aber was die ARD mit dem Packing von Reinartz gemacht hat, wurde kritisch gesehen, nicht der Ansatz an sich. Der ist sehr gut und auch statistisch erwiesen.
Anbei ein paar Studien:

Reep hat mit seiner Studie begründet, warum England „kick and rush“ gespielt hat.
Hughes et al. haben das widerlegt: https://www.ncbi.nlm.nih.gov/pubmed/16194998

Hier Rein et al. die ebenfalls die Anzahl der überspielten Spieler untersuchen, aber dies noch auf den gewonnenen Raum ausdehnen

So nochmal ganz klar, ich bin voll ganz deiner Meiung mit „peneprating passes“

1 „Gefällt mir“

Ja da stimme ich dir voll und ganz zu. Tut mir leid wenn ich dich da falsch verstanden habe. Die ARD hat es sehr fragwürdig aufbereitet. Auch scholls Erklärungen waren damals suboptimal. Eine liegengelassene Chance.
Ja die Studie kenne ich auch, super Inhalt! Sehr spannend, das ganze mit Voronoi-Diagrammen zu kombinieren. Leider finden solche Ansätze meistens nicht ihren Weg in die Öffentlichkeit.