Data is Beautiful - Statistiken und Grafiken zum Fußball

So guten Abend zusammen. Martin Rafelt hat inzwischen ja häufiger die Varianz bei der Chancenverwertung angesprochen und ich wollte mal fragen, ob mir jemand ne Seite sagen kann, wo man Stürmer mit Schussquote usw. verglichen einsehen kann? Ich hab in meiner 5 minütigen Google-Suche nichts Richtiges gefunden und dachte, ich frag mal hier nach und hoffe dass ich mir selber so Arbeit erspare :laughing: .

2 „Gefällt mir“

Ich weiß nicht genau was du suchst und habe auch selber keine Profi-Analyse Tools. Aber bei vielen Daten ist FBREF eine richtige Adresse.
Hier kannst du zum Beispiel die Daten von Stürmern bei der EM vergleichen, da sind auch viele Daten zu Schusschancen und erwarteten Toren bei kleiner Datenmenge dabei.

Danke, ich schaus mir morgen mal an ob ich finde was ich gesucht habe.

Ich habe ein etwas abseitiges Daten-Thema, das durch die Änderung der Sicherheitsrichtlinie des Landesverbandes Brandenburg inspiriert ist: Die Spielabbruchstatistik und der mediale bzw. sportpolitische Umgang damit. Denn die neue Regelung scheint wohl vor diesem Hintergrund erlassen worden zu sein und stellt die Vereine in Brandenburg vor einige (organisatorische und finanzielle) Probleme. Tatsächlich hatte ich vor einiger Zeit schon einmal (keine Ahnung mehr warum ich das gemacht habe) nachgeguckt, was so dran ist an immer „Mehr Gewaltdelikte im Amateurfußball“ und habe mal beim DFB nachgeguckt:
Vielleicht nicht so viel, wie daraus gemacht wird - jedenfalls wenn man für 22/23, 21/22 und 18/19 nachschaut (sorry, ich habe keine schöne Grafik, wer will kann in die aktuelle Grafik beim DFB schauen):
0. Anzahl der erfassten Spiele
18/19: 1.305.136
21/22: 1.219.397
22/23: 1.234.154
1. Spielabbrüche (Abbruchquote)
18/19: 685 (0,052%)*
21/22: 911 (0,075%)
22/23: 961 (0,078%,)*
2. Vorfälle insgesamt (Quote)
18/19: 6291 (0,48%)
21/22: 5582/5847 (0,46%/0,49%)**
22/23: 6224 (0,50%)
3. Gewalthandlungen (Quote)
18/19: 3978 (0,31%)
21/22: 3544 (0,29%)
22/23: 3907 (0,32%)
4. Vorfälle, die sich gegen den Schiri richten (Quote)
18/19: 2906 (0,22%)
21/22: 2399 (0,20%)
22/23: 2680 (0,22%)

*= Der DFB rundet 21/22 anders als in den beiden Jahren; ich habe die beiden Quoten (18/19 und 22/23) an das Jahr angepasst, weil es 21/22 eine Kommastelle mehr gab.
**= Der ZDF-Bericht und die DFB-Quelle nennen unterschiedliche Zahlen für 21/22. Deshalb sind beide abgebildet.

Zumindest auf den ersten Blick bekomme ich da meine Schwierigkeiten mit der herrschenden Deutung, die eine Gewaltzunahme sieht. Denn die Quoten unterscheiden sich immer nur im Promillewert voneinander und scheinen mir doch Recht stabil zu sein. Nur die Spielabbrüche haben einen Sprung gemacht (auch wenn das immer noch kein Massenphänomen ist und die Quote selbst sich auch nur im Promillebereich geändert hat). Das ist in meinen Augen allerdings nur ein mittelmäßig valides Indiz für die tatsächliche Gewalt auf deutschen Amateurplätzen: Die Schwere der Gewalttaten/Vorfälle erfasst die Statistik überhaupt nicht (soweit ich das sehen konnte). Gleichzeitig könnte das Mehr an Spielabbrüchen auch an gestiegener Sensibilisierung bzw. besserer Rückendeckung durch die höheren Ebenen (sodass die Schiris eher bereit sind abzubrechen) oder daran liegen, dass die Referees heute eher einen Abbruchbericht abgeben als gar keinen abzugeben (keine Ahnung wie wahrscheinlich das ist).
Anhand dieser Zahlen kann ich jedenfalls über die Qualität gar nichts sagen und über die Quantität sehr wenig (wenn ich nicht nur bei den absoluten Zahlen bleibe).

Wie seht ihr das? Habe ich irgendwo einen Gedankenfehler drin? Ist das überhaupt was für diesen Thread?

5 „Gefällt mir“

Ich find die Statistik super interessant, ich weiß aber nicht inwieweit die Quantität die Berichterstattung und Diskussionen beeinflusst. Soweit ich es mitbekomme, hat die „Schwere“ der Gewalthandlungen zugenommen, bzw, darüber wird mehr geredet.
Jetzt weiß ich halt nicht was in der Statistik unter „Gewalthandlungen“ abgebildet ist. Aber es kann, denke ich, durchaus sein dass es halt „kleinere“ Vergehen waren (18/19) die inzwischen halt „schlimmer“ geworden sind.

Als Beispiel: 18/19 wurde der Schiedsrichter mehrmals umgestoßen, 22/23 wurde der Schiedsrichter mehrmals geschlagen.

Das wäre für mich ein Erklärungsansatz, es kann natürlich aber genauso gut sein, dass es halt schlichtweg keine signifikanten Änderungen gibt und heute anders drüber berichtet und gesprochen wird…

1 „Gefällt mir“

Es könnte natürlich sein, dass die „schlimmer“ geworden sind, aber es ist nicht klar, woran das festgemacht wird. Tatsächlich sind mir aber häufiger Formulierungen untergekommen, die von immer mehr Gewalt sprechen - der ZDF-Beitrag oben als Beispiel, aber auch diese Doku hier oder z.B. bei der Sachstandsanalyse des Wissenschaftlichen Dienstes des Bundestages (ich will die PDF nicht verlinken, deshalb: „WD 10-025/23 Gewalt im Amateurfußball“ auf deren Seite suchen).
Technisch ist es natürlich korrekt von „mehr Gewalttaten“ zu sprechen, wenn man die absoluten Zahlen von 21/22 mit denen von 22/23 vergleicht, aber anhand der Quote kann man den Schluss so nicht einfach ziehen. Wirklich festgemacht wird das aber zumeist an den Spielabbrüchen und die Kriminologin Thaya Vester, die in der Doku auch vorkommt und für den DFB forscht (!), qualifiziert die Abbrüche als die besonders heftigen Gewalttaten. Der Sachstand des WD nimmt auch die Abbrüche als Indikator, beruft sich aber auch nur auf die DFB-Zahlen. Ich konnte aber bei denen bisher nichts zur Qualität aller Gewalttaten in den einzelnen Jahren und im Vergleich finden, d.h. der Schluss, dass Spielabbrüche ein Indikator für eine schwere Gewalttat sind, funktioniert mit den Zahlen eigentlich nicht. Ob ein Abbruch 22/23 unter den gleichen Bedingungen vollzogen wird wie 18/19 lässt sich nirgendwo ablesen, sodass der Schluss, dass die gestiegene Abbrüche auf mehr schwere Gewalttaten hinweisen, ein Zirkelschluss ist, der davon ausgeht das alle anderen Variabeln gleichgeblieben sind (Sensibilität, Präventionskonzept, etc.). Das wird aber anscheinend nirgendwo untersucht.

Alles, was ich zur Qualität finden konnte, ist die Studie von Frau Vester 2018-20, die am Ende der Pressemitteilung selbst erstmal härteres Durchgreifen fordert. Leider kann ich die Studie selbst (und nicht nur die Titbits in Pressemitteilungen) nirgendwo finden, obwohl sie angeblich seit Sommer 2022 veröffentlicht sein sollte. Ich konnte nur ihre Stellungnahme von 2024 vor dem Sportausschuss des Bundestages finden (wieder PDF, beim Bundestag als „Stellungnahme Dr. Thaya Vester, M.A., Universität Tübingen zu TOP1“ zu finden), in der sie aus ihrer Studie (und den Lageberichten) zititert. Da kann man dann den Längsschnitt über die Daten seit 2014/15 finden (S.3) und sehen, dass es weniger Spiele mit Störungen und weniger Gewaltvorkommnisse in absoluten Zahlen und in der Quote als 2014/15 gibt, aber dafür die Spielabbrüche hochgegangen sind (wobei das trotzdem keine riesigen Sprünge sind). Auf Seite 6 sind dann Aussagen zu den Gründen der Spielabbrüche zu finden: Knapp 2/3 sind deshalb abgebrochen worden, weil der Referee sich oder andere in Gefahr sah, 1/3 aus ungeklärten oder anderen Gründen. Im Weiteren wird dann ausgeführt (S.9), dass es in 17,9% der Abbrüche zu Verletzungen/Personenschaden kam - sie nennt allerdings alle Abbrüche regelmäßig „gewaltbedingt“. Danach geht sie dann auf ihre eigenen Dunkelfeldbefragungen ein, die das ‚Sicherheitsgefühl‘ der Referees erfasst. Gefühlte Sicherheit ist in meinen Augen kein sinnvoller Indikator, aber dankenswerterweise hat sie auch zwei richtige Items abgefragt: Ob die Schiedsrichter schon bedroht wurden und ob sie schon selbst Gewalt erfahren haben. Während der Anteil der Bedrohten seit 16/17 tatsächlich um 2,8% zugelegt hat (S.10), ist der Anteil der Angegriffenen quasi gleich geblieben (0,1% mehr 22/23 als 17/18, S.11). In den Fragen zur gefühlten Sicherheit ist dann eine gestiegene gefühlte Unsicherheit festzustellen, was aber zumindest die Frage aufwirft, warum das nicht mit den tatsächlichen Übergriffen korrespondiert. In ihrer Bewertung (S.15f.) konstatiert sie dann eine Verschlechterung der Situation und stellt Respektlosigkeit und Angriffe auf eine Stufe - wobei sie ja zuvor bereits Drohungen/Beleidigungen auf eine Stufe mit körperlichen Angriffen stellt.

Das sind die einzigen halbwegs empirischen Aussagen, die ich jetzt zur Qualität der Gewalt finden konnte und sie bringen mich ehrlich gesagt nicht weiter bzw. bestärken sogar den Verdacht, dass Berichterstattung und Realität auseinanderfallen. Denn es gibt an keiner Stelle einen qualitativen Vergleich und die Daten der Studie (wenn es sie denn gibt) sind für 21/22 bzw. 22/23 nicht aussagekräftigt, solange ich die Aussagekraft nicht plausibel mache (was ich nirgendwo finden konnte). Alle quantitativen Daten zeigen keinen Sprung und ich habe nochmal nachgeguckt: Zwischen 18-20 und 21/22 bzw. 22/23 hat sich eine weitere Variable geändert. Der DFB hat den Schiedsrichtern den Drei-Stufen-Plan bei Vorfällen an die Hand gegeben.

Oder kurz: Ein Mehr an Gewalt kann ich quantitativ nicht feststellen. Qualitativ auch nicht und DFB, Verantwortliche etc. wären gut beraten einmal zu untersuchen, ob das Mehr an Abbrüchen nicht der Regeländerung entspringt und welche Folgen das konkret hat. Kann man immer noch 17,9% Verletzte nach Abbrüchen feststellen (was ja ein wirkliches quantitatives Mehr wäre) oder ist die Quote runtergegangen, die Gesamtzahl aber gleich geblieben? Ist die Gesamtzahl runtergegangen? Die Vermengung von Diskriminierung und Gewalt wäre sinnvollerweise auch aufzulösen. Immerhin ergibt das unterschiedliche Ansätze, die es für die Prävention braucht.

4 „Gefällt mir“

Auf dieser Seite kann man sich richtig verlieren: The European Club Talent and Competition Landscape

Der Landscape-Report der Uefa zum europäischen Fußball. Es boomt an allen Ecken (was nicht heißt, dass es keine Probleme gibt).

3 „Gefällt mir“

Mal ne andere Frage. Mir ist aufgefallen, un die ganzen Statistiken im Fußball zu verstehen, müsste ich eigentlich ein Online-Seminar belegen.

Da ich dafür wahrscheinlich keine Zeit habe, könnt Ihr dazu gute YouTube-Videos und/oder Bücher empfehlen?

1 „Gefällt mir“

Ich habe mir die xG bzw xGA (expected Goals against = xG vom Gegner) Werte abhängig vom Spielstand von letzter Saison in quasi allen Ligen die im rasenfunk regelmäßig besprochen werden angeguckt. Dass der Spielstand größeren Einfluss auf ein Spielgeschehen hat ist offensichtlich, Fußball ist ein low scoring game und wenn eine Mannschaft führt kann sie defensiver bzw destruktiver agieren und die Mannschaft die führt muss offensiver bzw. risikoreicher agieren. Die Frage ist ob man das in den expected Goals sehen kann, dass zB eine Mannschaft Probleme bekommt wenn sie gegen einen defensiveren Gegner agieren muss oder besonders gut wird wenn sie führt. Ich habe nur Spielstände berücksichtigt mit einer Tordifferenz von ±1 und 0, weil ich mir dachte dass bei einer Tordifferenz von >1 einige Spiel dabei sind die quasi nur noch runtergespielt werden aber beide Teams sich mit dem Ergebnis abgefunden haben. Die Daten habe ich von fbref.

In den Diagrammen bedeutet -1, dass die Mannschaft mit einem Tor hinten liegt, 0 dass Gleichstand ist und +1, dass die Mannschaft mit einem Tor führt. Die Mannschaften sind nach dem Tabellenplatz sortiert. Die genaue Nachspielzeit wird auf fbref nicht angegeben ich habe das versucht so zu approximieren, dass ich die letzte Aktion auf fbref (Schuss, Karte, Tor, Eigentor, Wechsel, aber kein Pass, Zweikampf, Freistoß oä) in jeweils einer Hälfte genommen habe und da dann geguckt hab in welcher Minute das war. Kann sein, dass ich so ab und zu mal 1-2 Minuten verliere aber größtenteils sollte der Ansatz gut genug sein. Bei 1./2. Bundesliga gab es wegen Investorenprotest teilweise sehr lange Nachspielzeiten und insbesondere lange Spielabschnitte in denen der Ball nicht gerollt ist aber die Uhr weitergelaufen ist. Das kann bei den zwei Ligen etwas Einfluss auf die xG/90Minuten Statistiken haben, und sollte man da im Hinterkopf behalten.
Die Idee bei der Statistik xG/xGA war, dass es einen Unterschied zwischen einem Team mit xG-xGA von 1-2 und einem Team mit xG-xGA von 10-11 gibt obwohl die xG-Differenz dieselbe ist. Die Idee war, das umso höher der Wert ist desto dominanter ein Team ist, wobei >1 bedeutet man hat mehr xG als der Gegner. Bin mir im Nachhinein aber nicht sicher wie sinnvoll die Statistik tatsächlich ist, glaub die Konvertierung /90min ist da deutlich effektiver (mit dem Hintergedanken, dass Spielunterbrechungen eventuell Einfluss da nehmen).
Ansonsten ist vielleicht noch wichtig zu sagen, dass das die Summe aller Spiele ist. Es kann also sein, dass es Teams gibt, die extrem schwankend da sind und in manchen individuellen Spielen sehr viel xG haben und in manchen sehr wenig. Konsistenz müsste man also noch mal ein anderes mal genauer betrachten. Hoffe habe keinen Fehler beim Erstellen gemacht.

1. Bundesliga
xG/90

xGA/90

xGdiff/90

xGdiff

xG/xGA

Minuten

Man sieht Union ist weiterhin recht gut darin wenn sie 1 Tor führen. Bei Leverkusen und Stuttgart sieht man relativ wenig Änderungen bei anderem Spielstand. was man so interpretieren kann dass die ihrem Spielstil treu bleiben, was ja bei Leverkusen ja auch immer ausdrücklich gelobt wurde. Leipzig schaltet bei Rückstand offenbar einen Gang hoch, was für mich vielleicht auf ungenutztes Potenzial hindeutet. Man könnte natürlich auch argumentieren dass es sehr anstrengend ist gegen Leipzig in Führung zu kommen und deswegen am Ende Kräfte fehlen und Leipzig zu mehr Chancen dann kommt.

2. Bundesliga
xG/90

xGA/90

xGdiff/90

xGdiff

xG/xGA

Minuten

St. Pauli und Kiel gar nicht mal so überragend bei Rückstand, aber bei 1 Tor Vorsprung reicht dann auch wenn man statistisch danach genau so oft wie der Gegner trifft. und falls der Gegner trifft man auch wieder einen Gang hochschalten kann. Düsseldorf ist ja in der expected Points Tabelle erster gewesen, hier sieht man aber, dass da aber wohl auch einfach mit reinspielt dass man bei Rückstand immer sehr viel xG holt. Vielleicht kann man da ähnlich wie bei Leipzig argumentieren, dass man die Leisung schon bei 0-0 bringen könnte.

Bundesliga Frauen
xG/90

xGA/90

xGdiff/90

Bayern München hat übrigens genau 0.02 xGA bei einem 1 Tor Rückstand, also de facto nie eine Chance zugelassen. Der Schuss kam vom MSV Duisburg. Wolfsubrg performt quasi unverändert.

Premier League
xG/90

xGA/90

xGdiff/90

War etwas überrascht, dass der xGA/90 bei Torvorsprung bei City recht hoch ist, hätte gedacht die würden da das Spiel nochmal mehr killen können.

La Liga
xG/90

xGA/90

xGdiff/90

Serie A
xG/90

xGA/90

xGdiff/90

Ligue 1
xG/90

xGA/90

xGdiff/90

5 „Gefällt mir“