Methodik · 7 min
Datenqualität im Fußballscouting: Minuten, Wettbewerb und Kontext richtig lesen
Warum Scouting-Daten erst mit Minutenbasis, Liga-Kontext und Teamrolle wirklich belastbar werden.
FI-SO 360° Redaktion ·
Gute Daten sind nicht automatisch gute Evidenz
Mehr Daten lösen kein schlechtes Urteil.
Sie machen es nur schneller.
Eine Kennzahl ohne Minutenbasis ist ein Gerücht mit Komma.
Eine Kennzahl ohne Wettbewerbskontext ist ein Vergleich ohne Maßstab.
Eine Kennzahl ohne Teamrolle ist eine Zahl, die so tut, als wäre Fußball ein Labor.
Ist er nicht.
Scouting-Daten sind stark, wenn sie ihre Grenzen zeigen.
Schwache Daten verstecken Unsicherheit.
Gute Daten markieren sie.
Das wirkt weniger glänzend.
Aber es spart Fehler.

Minutenbasis: Sample Size entscheidet
Die unbequeme Wahrheit: Nicht jede Zahl verdient Vertrauen.
Manche Zahlen verdienen nur eine Rückfrage.
Ein Spieler mit 400 Minuten kann extreme Werte produzieren, die nach 2.000 Minuten nicht mehr halten.
Kurze Einsatzzeiten sind nicht wertlos, aber sie brauchen ein anderes Vertrauen als stabile Saisonprofile.
Für Shortlists ist deshalb wichtig, Minuten nicht nur als Filter zu nutzen, sondern als Evidenzgewicht.
Ein Spieler mit schwächerem Wert, aber hoher Minutenbasis kann belastbarer sein als ein Spieler mit Top-Wert in sehr kleinem Sample.

Wettbewerb: gleiche Zahl, anderes Niveau
Eine Kennzahl aus der 2.
Bundesliga ist nicht automatisch schlechter als dieselbe Kennzahl aus einer kleineren ersten Liga.
Aber sie ist anders einzuordnen.
Tempo, Gegnerqualität, Pressingintensität, physische Anforderungen und taktische Struktur unterscheiden sich deutlich.
Deshalb sollte jede Bewertung die Vergleichsgruppe sichtbar machen.
Wer wurde mit wem verglichen?
Innerhalb derselben Liga?
Innerhalb derselben Position?
Innerhalb ähnlicher Rollenprofile?
Ohne diese Antwort bleibt die Zahl zu lose.
Teamrolle: Werte entstehen nicht im luftleeren Raum
Ein Innenverteidiger in einem tiefen Block hat andere Defensivaktionen als ein Innenverteidiger in einer hohen Linie.
Ein Flügelspieler in einem dominanten Ballbesitzteam kommt zu anderen Abschluss- und Passsituationen als ein Flügelspieler in einem Umschaltteam.
Datenqualität heißt deshalb auch: den Teamauftrag mitzudenken.
Sonst verwechselt man Gelegenheit mit Fähigkeit.
Praktische Daumenregeln
Für datenbewusstes Scouting helfen einfache Qualitätsstufen:
- hohe Belastbarkeit: klare Minutenbasis, passende Vergleichsgruppe, stabile Rolle
- mittlere Belastbarkeit: gute Signale, aber begrenzter Kontext oder wechselnde Rolle
- niedrige Belastbarkeit: kleines Sample, unklare Position oder starke Teamkontext-Verzerrung
Solche Stufen müssen nicht perfekt sein.
Sie sorgen aber dafür, dass eine Shortlist ehrlicher wird.
Scouts sehen schneller, welche Kandidaten direkt vertieft werden können und wo erst Video- oder Kontextarbeit nötig ist.
Fazit
Datenqualität ist kein technisches Randthema.
Sie entscheidet, ob ein Scouting-Signal belastbar ist.
Wer Minutenbasis, Wettbewerb und Teamrolle sauber berücksichtigt, baut bessere Shortlists und schützt Entscheidungen vor Scheingenauigkeit.
Der Unterschied zwischen Verfügbarkeit und Belastbarkeit
In vielen Datenbanken ist ein Wert verfügbar, sobald er technisch berechnet werden kann.
Für Scoutingentscheidungen reicht das nicht.
Ein Wert kann verfügbar sein und trotzdem wenig belastbar.
Das passiert zum Beispiel, wenn ein Spieler nur wenige Minuten hatte, häufig die Rolle gewechselt hat oder in einem extremen Teamkontext spielt.
Belastbarkeit fragt nicht: Gibt es eine Zahl?
Belastbarkeit fragt: Wie viel Vertrauen dürfen wir dieser Zahl im konkreten Entscheidungsfall geben?
Diese Unterscheidung klingt klein, verändert aber die gesamte Shortlist-Arbeit.
Ein Kandidat mit auffälligen Daten ist nicht automatisch ein Kandidat mit hoher Evidenz.
Minutenbasis als Vertrauenssignal
Minuten sind mehr als ein Filter.
Sie sind ein Vertrauenssignal.
Ein Spieler mit 350 Minuten kann einen außergewöhnlichen Wert haben, aber seine Rolle, Gegnerauswahl und Einsatzsituation können stark verzerren.
Ein Spieler mit 2.200 Minuten zeigt meist stabilere Muster, auch wenn seine Top-Werte weniger spektakulär wirken.
Das heißt nicht, dass kleine Samples ignoriert werden sollen.
Gerade junge Spieler oder Rotationsspieler können früh interessante Signale senden.
Aber sie sollten anders markiert werden.
Ein kleineres Sample ist eher ein Hinweis für weitere Prüfung als eine fertige Entscheidung.
Eine praktische Lösung ist, Datenpunkte mit Evidenzstufen zu versehen.
Hohe Minutenbasis und stabile Rolle ergeben hohe Belastbarkeit.
Mittlere Minutenbasis mit klarer Rolle ergibt mittlere Belastbarkeit.
Wenige Minuten, wechselnde Positionen oder Sonderrollen ergeben niedrige Belastbarkeit.
Dadurch bleibt der Kandidat sichtbar, aber die Aussage wird ehrlicher.
Wettbewerbskontext sauber lesen
Liga- und Wettbewerbskontext sind keine einfachen Qualitätsstempel.
Es wäre zu grob zu sagen, dass eine erste Liga immer belastbarer ist als eine zweite Liga oder dass ein kleinerer Markt automatisch weniger relevant ist.
Trotzdem muss der Wettbewerb mitgedacht werden.
Ein Wert entsteht gegen konkrete Gegner, in einem konkreten Tempo und unter bestimmten physischen sowie taktischen Anforderungen.
Ein Außenverteidiger kann in einer Liga sehr viel Zeit für Flanken haben und in einer anderen Liga sofort unter Druck geraten.
Ein Innenverteidiger kann in einem tiefen Team viele Klärungen sammeln, während ein Innenverteidiger in einem dominanten Team seltener verteidigen muss, aber schwierigere offene Räume absichert.
Deshalb sollte jedes Scoutingprofil beantworten: Gegen welche Vergleichsgruppe wirkt dieser Wert stark?
Ist der Spieler innerhalb seiner Liga auffällig?
Innerhalb seiner Altersgruppe?
Innerhalb ähnlicher Rollen?
Oder nur im Gesamtdatensatz, der eigentlich zu viele unterschiedliche Kontexte mischt?
Teamrolle und taktischer Auftrag
Teamrolle ist oft der unterschätzte Teil der Datenqualität.
Zwei Spieler auf derselben Position können völlig verschiedene Aufgaben haben.
Der eine Flügelspieler bleibt breit, hält die Linie und liefert Flanken.
Der andere rückt ein, verbindet im Halbraum und öffnet den Laufweg für den Außenverteidiger.
Ihre Werte sind nicht direkt vergleichbar, obwohl sie im Datenmodell dieselbe Position tragen.
Für belastbare Scoutingarbeit muss deshalb geprüft werden, ob der statistische Output zur beobachteten Rolle passt.
Wenn ein Spieler wenig progressive Pässe spielt, kann das an fehlender Qualität liegen.
Es kann aber auch daran liegen, dass sein Team ihn bewusst als Absicherung nutzt.
Wenn ein Spieler viele Dribblings hat, kann er ein starker Eins-gegen-eins-Spieler sein.
Es kann aber auch daran liegen, dass sein Team kaum andere Progressionswege besitzt.
Diese Fragen lösen sich nicht allein im Datensatz.
Sie brauchen Video, Matchkontext und manchmal auch Gespräche mit Scouts, die den Spieler live gesehen haben.
Per-90-Werte richtig einordnen
Per-90-Werte sind nützlich, weil sie Spielzeit normalisieren.
Aber sie können gefährlich werden, wenn die Spielzeit selbst instabil ist.
Ein Joker, der oft gegen müde Gegner kommt, kann starke Offensivwerte pro 90 Minuten produzieren.
Ein Stammspieler, der regelmäßig gegen starke Gegner startet, trägt eine andere Belastung.
Darum sollten Per-90-Werte immer zusammen mit Minuten, Starts, Rollenstabilität und Gegnerkontext gelesen werden.
Sie sind ein Vergleichswerkzeug, kein automatisches Ranking.
Besonders bei defensiven Werten ist Vorsicht geboten, weil hohe Aktionszahlen auch bedeuten können, dass das Team schlecht kontrolliert.

Datenqualität sichtbar machen
Der wichtigste operative Schritt ist Sichtbarkeit.
Wenn ein System nur Werte zeigt, aber nicht deren Belastbarkeit, müssen Entscheider die Unsicherheit im Kopf behalten.
Das funktioniert im Alltag schlecht.
Besser ist es, die Datenqualität direkt neben dem Signal auszuweisen.
Ein einfacher Hinweis wie „stabile Minutenbasis“, „kleines Sample“, „Rollenwechsel“ oder „Teamkontext prüfen“ kann eine Diskussion deutlich verbessern.
Scouts sehen sofort, welche Kandidaten datenbasiert stark abgesichert sind und wo die Bewertung noch fragil ist.
Diese Transparenz schützt vor Scheingenauigkeit.
Sie macht ein System nicht schwächer, sondern glaubwürdiger.
Wer Unsicherheit offen zeigt, kann bessere Entscheidungen treffen.

Fazit
Datenqualität ist die Grundlage guter Scoutingarbeit.
Nicht weil Zahlen perfekt sein müssen, sondern weil ihre Grenzen bekannt sein müssen.
Minutenbasis, Wettbewerb, Teamrolle und taktischer Auftrag entscheiden darüber, wie belastbar ein Signal ist.
Wer diese Faktoren sauber integriert, baut Shortlists, die nicht nur statistisch spannend wirken, sondern fachlich tragfähig sind.
Genau dort entsteht der Unterschied zwischen Daten als Dekoration und Daten als Entscheidungshilfe.
Datenqualität ist auch ein Kommunikationsproblem
Selbst wenn Analysten Unsicherheit intern verstehen, kommt sie im Entscheidungsraum oft nicht an.
Eine Tabelle mit vielen Zahlen wirkt automatisch objektiv.
Wer nicht täglich mit Daten arbeitet, sieht selten sofort, welche Werte stabil sind und welche nur erste Hinweise liefern.
Deshalb muss Datenqualität in der Oberfläche und im Report kommuniziert werden.
Das kann über einfache Labels passieren: „hohe Evidenz“, „prüfen“, „kleines Sample“, „Rollenwechsel“, „Kontext stark“.
Solche Labels sind nicht nur technische Metadaten.
Sie sind Übersetzungshilfe für Trainer, Sportdirektoren und Geschäftsführung.
Sie machen sichtbar, wann eine Zahl als starkes Argument taugt und wann sie nur eine Spur für weitere Analyse ist.
Warum fehlende Daten nicht versteckt werden dürfen
Fehlende Daten sind kein peinlicher Systemfehler, sondern Teil der Realität.
Nicht jede Liga liefert dieselbe Tiefe.
Nicht jeder Spieler hat genügend Minuten.
Nicht jede Metrik ist für jede Rolle verfügbar oder sinnvoll.
Problematisch wird es erst, wenn diese Lücken unsichtbar bleiben.
Ein guter Scoutingprozess zeigt fehlende Daten offen.
Dann kann der Verein entscheiden, wie er damit umgeht: Videoarbeit nachziehen, Live-Scouting priorisieren, alternative Metriken nutzen oder den Kandidaten vorerst niedriger gewichten.
Versteckte Lücken führen dagegen zu Scheingenauigkeit.
Offene Lücken führen zu besseren Fragen.
Eine saubere Ampel reicht oft aus
Für die Praxis muss Datenqualität nicht kompliziert wirken.
Eine einfache Ampel kann reichen, wenn sie konsequent angewendet wird.
Grün bedeutet: Die Aussage ist auf stabiler Minutenbasis und passender Vergleichsgruppe belastbar.
Gelb bedeutet: Das Signal ist interessant, braucht aber Kontextprüfung.
Rot bedeutet: Der Wert ist nur ein Hinweis und darf nicht als Entscheidungsargument allein stehen.
Diese Ampel hilft besonders in schnellen Meetings.
Niemand muss lange Methodiktexte lesen, aber alle sehen sofort, wie vorsichtig eine Aussage genutzt werden sollte.