Der NFL Super Bowl in Daten

American Football erlebt seit einigen Jahren einen großen Zuwachs in der hiesigen Fan-Gemeinde. Der krönende Abschluss der Saison ist eines der größten Sportereignisse der Welt: der Super Bowl – das Finale zwischen den beiden besten Teams der Conferences AFL und NFL.

Und seit einigen Jahren ist insbesondere die Halbzeit-Show mit ihren Show Acts ein Highlight im Highlight. Mein persönlicher Favorit ist im übrigen die Show von Katy Perry aus dem Jahr 2015:
(Insider: Die Choreographie des linken Hais, der nun als #LeftShark bekannt ist)

Half Time Show mit Katy Perry im Super Bowl XLIX (2015)

Daten?

Ja, nun, aber was hat das mit Daten zu tun? – Oh, eine ganze Menge. Zum einen erheben die Analysten von der NFL Unmengen an Informationen über jeden Spieler und jeden Spielzug. Das fängt bei den zurückgelegten Strecken mit dem Ball in der Hand an und hört bei der Anzahl von umgestoßenen Spielern („Tackles“) nach Zeit und Ort auf. Zudem gibt es von der NFL sogar ein Quarterback-Rating: aus festgelegten Faktoren ermittelt sich, wie gut der Spieler ist. Im Vergleich dazu bestimmt im deutschen Fußball die Redaktion, beispielsweise die Kicker-Note, ein Spielmacher-Rating gibt es jedoch nicht. Immerhin erfassen Statistiker im Fußball-Station die Laufleistung oder Ereignisse wie Anzahl der Torschüsse, Ecken oder Abseits.

American Football ist insgesamt wesentlich technischer als Fußball. Das kann man nicht werten, beide Sportarten unterscheiden sich sehr.

Datenquelle

Wenn man die Daten der vergangenen Super Bowls analysieren möchte, dann ist die englische Wikipedia eine wahre Fundgrube. Dort sind alle Super Bowl-Ergebnisse seit der Saison 1966 erfasst und strukturiert in einer Tabelle abgelegt. Das gleiche gilt auch für die Halbzeit-Shows und die Einschaltquoten im Fernsehen. Das sind doch gute Zutaten für einen Daten-Eintopf!

Abzapfen

Während das Abzapfen des Stroms vom Nachbarn nicht erlaubt ist, können wir uns an der Wikipedia bedienen und die Daten herausziehen. Es ist zwar nicht ganz einfach, da die Daten zwar in Tabellenform angezeigt werden, so wie hier:

Schaut man sich den Quelltext der Seite an, dann sieht der betreffende Bereich aber so aus. Und das ist leider auch das, was ein kleines Programm zum Erfassen der Daten sehen wird:

Man kann schön erkennen, dass sich in der Zeile 127-142 die Festlegung des Tabellenkopfs befindet. Darunter befindet sich dann der Tabelleninhalt. Schön ist das so nicht, glücklicherweise helfen Bibliotheken bei der Übernahme des Textes. Diese Technik, Daten aus dem Internet zu ziehen und dann strukturiert abzulegen nennt man Web Scraping oder auch Web Mining. Und so könnte ein Zwischenergebnis aussehen:

Hier kann man noch gut erkennen, dass die Fußnoten und Verweise aus der Wikipedia noch nicht entfernt wurden. Mit Pauschalaussagen wie „alles was in eckigen und runden Klammern ist, löschen wir“ sollte man vorsichtig sein. Es ist möglich, dass damit interessante Informationen ebenfalls gelöscht werden. Verbindet man diese Tabelle mit den einzelnen Seiten der Super Bowls, erhält man solche Datensätze:

Die letzten 5 Super Bowls mit Ort, Zuschauerzahlen, Gewinner, Verlierer, Punkte, Trainer, etc.
Die letzten 5 Super Bowls mit Fernsehzuschauer, Zuschauergruppen und Werbekosten
Die letzten 5 Musiker bei der Super Bowl Halbzeit-Show

Ergebnisse

Wer schon immer wissen wollte, was das Spiel mit den meisten und geringsten Punkten war, welcher Super Bowl am knappsten war oder wer buchstäblich aus dem Station geworfen wurde, sollte jetzt aufpassen.

Fangen wir mal mit den Punkte-Unterschieden an. Gab es mehr knappe Spiele oder eher hohe Siege?

Punkte-Differenzen und deren Häufigkeiten im Super Bowl

OK, das war zu erwarten. Die meisten Spiele sind doch relativ knapp ausgegangen, wenn man bedenkt, dass ein Touchdown 7 Punkte bringen kann. Nun, was waren die knappsten und eindeutigsten Spiele?

1991 betrug der Abstand zwischen den beiden Finalisten nur 1 Punkt
Im Jahr 2014 besiegten die Seattle Seahawks die Denver Broncos mit einem 35-Punkte-Abstand. Gleiches gelang den Dallas Cowboy im Jahr 1993 gegen die Buffalo Bills.

Das sind ganz herbe Niederlagen. 35 Punkte sind beeindruckend, dazu benötigt man 5 Touchdowns.

Einschaltquoten

Was passiert wohl vor den heimischen Fernsehern, wenn ein Spiel so eindeutig verläuft wie beim heroischen Sieg der Dallas Cowboys? Schalten die Zuschauer eher ab oder sind es sogar mehr, die sich diese historischen Momente ansehen wollen?

Die Grafik stellt die prozentualen Einschaltquoten den Punktedifferenzen gegenüber.

Der Trendgraph zeigt an, dass die Anzahl der Zuschauer sinkt, wenn die Punktedifferenz hoch ist. Allerdings muss man das Ergebnis mit Vorsicht genießen: zum einen sieht man eine kräftige Streuung, zum anderen ist der Datensatz mit knapp über 50 Super Bowls auch zu klein. Trotzdem lassen sich auch noch ganz andere interessante Entwicklungen feststellen:

Eine Grafik mit den US-Zuschauerzahlen, dem Haushalts-Rating und den Kosten für einen Werbespot von 30 Sekunden während der Halbzeit aller bisherigen Super Bowls

Während die Zahl der Zuschauer in der Anfangszeit noch unter 50 Millionen lag, sind wir momentan bei knapp über 100 Millionen US-Zuschauer.
Die Kennzahlen „Shares Households“ und „Rating Households“ erklären sich wie folgt: Die Shares sind die Anteile aller US-Haushalte, die ein Empfangsgerät (ob an oder aus) haben. Das Rating ist der Anteil der Haushalte, deren Fernseher auch tatsächlich an ist.

Dabei sind die Quoten für den jährlichen Super Bowl in etwa mit den deutschen Einschaltquoten vergleichbar, als Deutschland 2014 das Finale der Fußball-Weltmeisterschaft gewann.

Das schlägt sich auch in einem stetig gestiegenen Werbe-Preis nieder: die Experten von ran.de schätzen, dass 2020 ein 30-Sekunden-Werbespot 5.600.000 US-Dollar in der Halbzeitpause kostet. Das sind knapp $187 pro Millisekunde!

Halbzeit-Künstler

Apropos Halbzeitpause: In den letzten Jahren konnte die NFL jeweils richtige Superstars für den Auftritt gewinnen. Das war aber nicht immer so: mitunter setzte man Blaskapellen oder Gospel-Chöre ein.

Super Bowl-Künstler um 1990 herum

Da sind doch recht unbekannte Künstler dabei. Einige Künstler wurden sogar mehrfach zum Super Bowl geladen: wer trat mehr als nur einmal auf?

Künstler (ohne Blaskapellen), die mehr als einmal für den Super Bowl gebucht wurden

Und wer hat die meisten Songs gesungen? Auch hier lassen wir mal die Blaskapellen außen vor:

Fazit

NFL-Spiele sind eine wahre Fundgrube für Daten und Statistiken. Es ist relativ leicht, strukturierte Daten aus dem Internet zu beziehen, indem Webseiten analysiert werden. Da das Interesse in den USA an Football-Spielen sehr hoch ist, sind auch die Informationen auf der Wikipedia sehr gut.
Wir können gespannt sein, wenn am 03.02.2020 um 0:30 Uhr (MEZ) im Miami Stadium die Überraschungsteams der San Francisco 49er auf die Kansas City Chiefs treffen.

Fun Fact: Immer, wenn das Team der Raiders (zuvor in Los Angeles und Oakland) umgezogen sind, gewannen die San Francisco 49ers den Super Bowl. Nun ziehen die Raiders nach Las Vegas um…

Verwendete Ressourcen:

  • pandas
  • matplotlib
  • seaborn
  • BeautifulSoup

Credits: DataCamp

Mehr Artikel entdecken:

Backups

Festplattendefekt, Löschung durch Mitarbeitende, Synchronisationen in die falsche Richtung, Hacker-Angriffe, Diebstahl, Feuer- oder Wasserschäden, Dateisystemfehler, Verlust, Ransomware… die Ursachen für Datenverlust sind vielfältig. Generell kann

Weiterlesen »