Datenromantik in Magenta – Fakten zu «10 Fakten zum Breitbandausbau»

Grafiken sind nicht für mobile Displays optimiert!

Als Vollzeit-IT’ler und leidenschaftlicher Internetbewohner ist der Breitbandausbau für mich selbstverständlich ein wiederkehrendes Thema in Diskussionen mit Kollegen und Freunden. Außerdem ist den meisten nicht entgangen, dass die Telekom in Bonn sitzt und ich somit auch einen örtlichen Bezug zur Farbe Magenta habe. Aber auch wenn ich eine dezidierte Meinung zu diesem Thema habe, so geht es in diesem Artikel nicht um Pro und Kontra von Vectoring und Glasfaserausbau, um wirtschaftliche und infrastrukturelle Positionen zwischen Telekom, Kunden und (Netz-) Politik, sondern um Fakten. Konkret um einen Teil der Fakten, welche die Telekom am 23. August 2017 in ihrem Corporate-Blog1 veröffentlicht hat. Eine grafische Darstellung2 hat mein besonderes Interesse geweckt, weshalb ich sie hier genauer besprechen möchte.

Schnelles Internet in Europa: Deutschland in führender Position (Quelle: Telekom-Blog, Stand 05.10.2017)

Diese Abbildung ist die erste von sechs (und somit unmittelbar sichtbar) in einer Bildergalerie unter dem Originalartikel, die mit «Fakten im Überblick: Charts zum Breitbandausbau» überschrieben ist. Wir sehen eine Karte von Europa, in der die einzelnen Länder entsprechend ihrer Breitbandabdeckung eingefärbt und zusätzlich 16 Nationen mit Kundenzahlen ausgewiesen sind. Darüber der Claim «Deutschland in führender Position» und eine Infobox, die darauf hinweist, dass Deutschland selbst bei Aufsummierung der anderen Länderwerte die meisten NGA-Nutzer hat. Die angegebenen Werte beziehen sich laut Darstellung auf Daten der Europäischen Kommission und Analysys Mason.

Ich werde in diesem Artikel schrittweise darlegen, um welche konkreten Datenquellen es geht und wie diese Darstellung zustande gekommen ist. Ich werde erläutern, an welchen Stellen ich die Grafik für stark suggestiv halte und an welchen sie faktisch falsch ist.

Datenquellen

Die Telekom hat zwei Quellen aus 2016 bzw. Mitte 2016 angegeben: «Europäische Kommission» und «Analysys Mason». Es ist zwar üblich, Quellen auf diese Art verkürzt anzugeben, aber im Prinzip kann man die Angabe dann auch fast weglassen.

Quelle «Europäische Kommission»

Allerdings konnte ich die erste Quelle tatsächlich zu Fuß ausfindig machen. Es handelt sich um die «Study on broadband coverage in Europe 2016»3 der Europäischen Kommission.

[The study] covers thirty-one countries across Europe – the EU 28, plus Norway, Iceland and Switzerland - and analyses the availability of nine broadband technologies (DSL, VDSL, cable modem, DOCSIS 3, FTTP, WiMAX, HSPA, LTE and satellite) across each market, at national and rural levels.

Auf der Seite findet man einen Link auf eine Exceldatei4, die im Abschnitt «Household penetration» Spalte «Overall NGA coverage**» die dargestellten Werte zu enthalten scheint:

Auszug aus: Study on broadband coverage in Europe 2016

In der zweiten Abbildung des Telekom-Blogeintrags5 sind leicht gerundete Werte aus derselben Quelle angegeben. Die nationalen Werte für Deutschland, Schweden, Estland und Frankreich passen zu denen aus der Tabelle. Die in der Legende angegebene Technologieauswahl ebenfalls. In den Rohdaten steht außerdem zur weiteren Verifikation:

Broadband coverage data at the end of June 2016; the 2012-2014 editions of the BCE study depict end-of-year data

Quelle «Analysys Mason»

Auf Nachfrage im Forum des Artikels6 und bei Twitter7 teilte mir die Telekom mit, dass es sich bei der zweiten Quelle um die Studie «Western Europe telecoms market: trends and forecasts 2017–2022» von August 2017 handelt8. Wer­muts­trop­fen ist leider, dass sich die Originaldaten hinter einer 7999$ schweren Paywall befinden. Von daher konnte ich nur mit den unvollständigen und gerundeten Werten aus der Grafik und den allgemein beschreibenden Informationen der Datenquelle9 arbeiten – nehme aber Datenspenden gerne an. Der relevante Auszug10 mit den übertragenen Werten ist in der folgenden Abbildung dargestellt:

Auszug aus: Western Europe telecoms market: trends and forecasts 2017–2022

Die Werte für Österreich, Finnland, Griechenland und Irland sind laut Telekom kleiner als 1.5 Millionen. Laut Quelle beschreibt der in der Grafik mit «NGA-Kunden» bezeichnete Wert:

we [use the] term ‘connections’. [A] connection is one from which a billed event has occured in the past three months. Note that we count connections, not users. Some users will have multiple connections.

Generell ist fraglich, wozu überhaupt eine zweite Quelle herangezogen wurde. Denn die erste enthält sowohl die prozentualen Abdeckungswerte (Länderfarben), als auch die absolute Anzahl der Haushalte, die über einen technischen NGA-Anschluss verfügen (würde den grünen Kreisen entsprechen). Warum also zwei Quellen mit unterschiedlicher Methodik vermischen? Ich habe für die grünen Kreise vorerst die dargestellten Werte beibehalten. Aus den Zahlen ergeben sich aber weitere Fragen, die ich im folgenden herausarbeiten werde.

Next Generation Access (NGA)

Zuvor jedoch ein kleiner Einschub, um zu klären, über welche Technologien überhaupt geredet wird. Next Generation Access (NGA) ist recht unterschiedlich definiert. Als Teil von Europe 2020 und der Digital Agenda definiert die Europäische Kommission im Jahr 2010:

wired access networks which consist wholly or in part of optical elements and which are capable of delivering broadband access services with enhanced characteristics (such as higher throughput) as compared to those provided over already existing copper networks.11

Also eher keine Kupfertechnologien. In der 2016’er Studie «Connectivity for a Competitive Digital Single Market», ebenfalls von der Europäischen Kommission, dann aber:

[NGA] including the following technologies: FTTH, FTTB, Cable DOCSIS 3.0, VDSL and other superfast broadband allowing at least 30Mbps download12

Hier sind neben den reinen Glasfasertechnologien FTTH und FTTB auch moderne, kupferbasierte Technologien eingeschlossen und es ist eine Mindestbandbreite angegeben. In den Weiten des Internets existieren weitere Definitionen, die bei den konkreten Technologien und Bandbreiten variieren, also halte ich fest: Jede NGA-Definition ist pro Studie zu prüfen. Die Quelle «Europäische Kommission» definiert:

[…] nine broadband technologies (DSL, VDSL, cable modem, DOCSIS 3, FTTP, WiMAX, HSPA, LTE and satellite) […] and next-generation access (NGA) availability3

wobei NGA aus VDSL, DOCSIS 3.0 und FTTP besteht. FTTP ist hier nicht Fiber-To-The-Premise, sondern FTT-Property, was im Falle der Studie FTT-Home und FTT-Building zusammenfasst. In der Quelle «Analysys Mason» wurde DOCSIS 3.0 nicht berücksichtigt:

Next Generation Accesses: high-speed fixed broadband accesses, delivered on cable-modem, vDSL or FTTB/FTTH.9

Schritt 1: Reproduktion der Karte auf Basis der Datenquellen

Aus der Datenquelle4 habe ich zunächst eine eigene Version der Darstellung erzeugt, wobei die Grafik nun direkt aus den Daten berechnet wird. Detaillierte Informationen für die einzelnen Länder kann man sich anzeigen lassen, wenn man mit der Maus über das jeweilige Land fährt.

Ein paar Dinge fallen direkt auf. Die Färbungen der Länder stimmen nicht mit der Originalgrafik überein. Beispielsweise ist Skandinavien in der ursprünglichen Darstellung gleich gefärbt, aber nun dreistufig. Ein Blick auf die Originaldaten ergibt: Norwegen 81.0%, Schweden 79.4%, Finnland 74.6%. Irland liegt auch bei 81.6%, also in der obersten Gruppe. 13 Länder haben laut Originaldiagramm eine 80+ Abdeckung, 19 Länder laut Datenquelle. Median und Mittelwert liegen dicht beieinander bei 81.38% bzw. 81.30% – Deutschland liegt auf Platz 13 von 31. Außerdem verwundert in diesem Licht die Auswahl der vier Gruppen, die so eine 19-2-6-4 Aufteilung ergibt. Also 19 Länder in der Gruppe über 80%, 2 in der Gruppe über 75% usw. Es liegt nahe, dass die Grenzwerte so gewählt sind, dass Deutschland in der obersten Gruppe ist.

Die Infobox hebt hervor, dass Deutschland mehr NGA Nutzer habe, als mehrere Länder zusammen. Vorab halte ich absolute Angaben ohnehin für das falsche Mittel, wenn man Länder mit derartigen unterschiedlichen Einwohnerzahlen vergleicht. Dazu später mehr. In Deutschland wären das laut Originaldaten der Europäischen Kommission 32.894.543 Haushalte (vgl. Abschnitt «Absolute Uptake», Spalte «Overall NGA coverage**»4), der Rest zusammen 42.893.553. Stimmt also auf Haushalte bezogen nicht und das obwohl hier mit Frankreich und Italien sehr große Länder mit verhältnismäßig schlechter Breitbandabdeckung (Platz 26 bzw. 30 von 31) dabei sind. Unter der Annahme, dass der Ursprungswert für Finnland aus der «Analysys Mason» Quelle kleiner als 1.3 Millionen ist, würde das für die Summe der Zahlen in den grünen Kreisen stimmen (15.1 DE versus 4.8 FR + 2.6 IT + 2.8 SE + 3.6 BE + ? FI).

An den grünen Kreisen an sich ist in der Originalgrafik nichts auszusetzen. Die Größenverhältnissen zueinander stimmen, die oben genannte Datenquelle vorausgesetzt. Das visuelle Ergebnis sieht praktisch gleich aus. Aber es bleibt das Problem, dass absolute Zahlen angegeben sind. Die Länder in der EU sind aber nicht gleich groß. Weder flächenmäßig, noch auf die Anzahl der Haushalte bezogen.

Fünf Änderungen also für die nächste Version der Grafik:

  • Der Titel wird an die Fakten der Datenquelle angepasst
  • Wir tauschen die gestuften Länderfarben gegen eine lineare Darstellung
  • Die Werte der grünen Kreise werden in Relation zur Anzahl der Haushalte gestellt
  • Die Infobox lassen wir besser ganz weg
  • Island kommt mit 95.7% NGA-Abdeckung auch mit auf die Karte

Schritt 2: Bessere Skalen, weniger Marketing

Mit den Erkenntnissen aus Schritt 1 würde ich die Grafik also wie folgt aktualisieren:

Die Skalierung der Farben anhand der NGA Abdeckung von 40% bis 100% führt dazu, dass man einfacher sehen kann, welche Länder bei der Breitbandabdeckung tatsächlich führen (u.a. Malta, Schweiz, Belgien) bzw. zurückhängen (u.a. Griechenland, Frankreich, Ungarn). Am Beispiel von Malta sieht man, dass die Landesgröße ebenfalls Einfluss auf die Sichtbarkeit in einer derartigen Karte hat. Dieses Problem wurde u.a. in Damian Paderta’s Blog diskutiert13.

Die grünen Kreise zeigen jetzt die NGA Kunden bezogen auf die Gesamtzahl der Haushalte des jeweiligen Landes an. In Deutschland hat zum Beispiel dann jeder 2.7-te Haushalt einen NGA Anschluss (15.1 Mio. bei 40.2 Mio. Haushalten, vgl. Originalgrafik und Abschnitt «Absolute uptake», Spalte «Households»4). Die Entscheidung, für die Originalgrafik absolute Kundenzahlen zu verwenden, ist damit leider nicht mehr als die praktische Anwendung visueller Wahrnehmungspsychologie. Deutschland großer grüner Kreis, also Deuschland führend. Tatsächlich liegt Deutschland auf Haushalte umgelegt wieder im Mittelfeld. Außerdem denke ich, dass die Information ohnehin redundant ist. Wenn wir schon die prozentuale Abdeckung mit NGA-Anschlüssen über die Länderfarben sehen, wozu nochmal absolute Kundenzahlen darstellen? Die Anzahl von NGA-Kunden ist nicht allein vom Breitbandausbau, sondern am Ende auch von Faktoren wie Marketing, Preisstruktur und Alternativen wie Mobilfunkangeboten abhängig.

Daher meine Vorschläge für eine nächste Version der Grafik:

  • Die grünen Kreise werden entfernt oder für einen Aspekt der Daten wiederverwendet, der sich unmittelbar auf den Breitbandausbau bezieht
  • Die “Analysys Mason” Quelle wird nicht mehr verwendet

Schritt 3: Auswahl der darzustellenden Kennzahlen

Bevor wir zur Grafik kommen, möchte ich hier noch auf die zweite Abbildung im Telekom-Blogeintrag zu sprechen kommen:

Deutschland: Höhere Abdeckung mit schnellem Breitband als... (Quelle: Telekom-Blog, Stand 05.10.2017)

Ich beziehe mich nur auf die linke Abbildung, da diese auf derselben Datenquelle basiert (die «Akamai»-Quelle habe ich nicht untersucht). Hier wird die NGA-Abdeckung für das jeweilige Land insgesamt mit der Abdeckung in ländlichen Räumen verglichen. Hier rufen wir uns nochmal die Studiendefinition von NGA ins Gedächtnis. Wir reden von klassischen Kupfertechnologien wie (V)DSL und Docsis, dazu FTTP. Das sind selbstverständlich alles Festnetztechnologien. Hier kann man nun aber nicht so ohne weiteres ignorieren, dass EU-Länder auch unterschiedliche Standortbedingungen haben. Man vergleiche einfach mal Deutschland mit der dünn besiedelte, Alpen-durchzogene Schweiz, wo es wenig zielführend ist, jedes 100-Seelen-Dorf mit kilometerlangen, unterirdischen (Glasfaser-) Festnetzen anzubinden. Die Schweizer haben alternativ im ländlichen Raum eine 3G-Abdeckung von 98.7% und eine LTE-Abdeckung von 93.8% (Deutschland: 61.6% 3G, 87.8% LTE). Dasselbe gilt auch für Schweden (3G: 99.2%, LTE: 100%). Eine weitere Auffälligkeit: In den Rohdaten ist Schweden mit 21.5% NGA-Abdeckung im ländlichen Raum aufgeführt. Hier wurde wieder falsch abgeschrieben. Auch hier bleibt festzuhalten, dass die Darstellung sehr suggestiv ist – mal abgesehen von der eher willkürlichen Auswahl der Vergleichsländer. Schweden setzt zwar auf FTTH/B beim Festnetzausbau, hat aber bereits ein landesweites LTE-Mobilfunknetz. Für den Endkundensektor ist am Ende maßgeblich, dass eine NGA-artige Breitbandanbindung vorhanden ist, egal ob mit Kupfer, Glasfaser oder Mobilfunk – ein Argument, das die Telekom selbst im Diskurs immer wieder anführt. Daher habe ich mich entschieden, die 3G/LTE Abdeckung mit in die Darstellung aufzunehmen. Abschließend ist noch festzustellen, dass Deutschland auch im ländlichen Raum im Gesamtergebnis nicht wie hier suggeriert führend ist, sondern auf Platz 15 von 31 mit einem Wert knapp über Durchschnitt (Mittelwert: 49.95%, Median: 46.94%).

Schritt 4: Finale Karte auf Basis der EK-Quelle

Alles zusammen ergibt letztendlich die folgende Grafik:

Da ich nicht zu viele Werte mischen wollte, nun also eine Doppelgrafik die oben die nationalen Gesamtergebnisse und unten die Ergebnisse für ländliche Gebiete vergleichend darstellt. Zusätzlich habe ich eine Farbskala für die 3G/LTE-Werte eingeführt, um die Unterschiede besser sichtbar zu machen. Der fragliche Wert ist der arithmetische Mittelwert aus der jeweiligen 3G/LTE-Abdeckung (vgl. Abschnitt «Household penetration», Spalte «HSPA» usw.4). In der Detailbox (mit der Maus über die Länder fahren) stehen aber auch die Einzelwerte. Achtung: Die Wertebereiche sind unterschiedlich, z.B. der 3G/LTE-Bereich umfasst national 85-100%, aber 50-100% für ländliche Gebiete, um Minimal-/Maximalwerte besser zu erkennen. Es zeigt sich, dass alle deutschen Nachbarländer bis auf Frankreich im ländlichen Raum im Schnitt eine bessere 3G/LTE Abdeckung haben. Damit relativieren sich die Werte der zweite Originalgrafik. Generell ergibt sich daraus für mich: Allgemeine Aussagen zum Stand des Breitbandausbaus sollten stets den gesamten Technologiemix ab einer Grenzbandbreite berücksichtigen oder auf alternative Kennzahlen setzen, etwa die durchschnittliche Upload-/Downloadbandbreite.

Fazit

Ich habe versucht zu zeigen, dass die Telekom in ihrer Kommunikation leider auch auf stark suggestive und z.T. faktisch falsche Darstellungen an prominenter Stelle setzt. Visualisierungen wie diese sollen einen schnellen, unmittelbaren Überblick über einen Sachverhalt ermöglichen. Umso entscheidender ist, dass Informationen über zugrundeliegende Daten und Methodik verfügbar sind, um die Nachvollziehbarkeit zu gewährleisten. Hier hätte ich mir gewünscht, dass die Telekom – und jeder andere, der verdichtete Daten zur Visualisierung einsetzt – genaue Quellenangaben macht. Die Transparenz (vermeintlicher) Fakten ist essenziell für einen neutralen, sachlichen Diskurs zwischen den beteiligten Parteien. Die Verwendung und Verbreitung von offenen Daten und Quellcode halte ich dabei für den Königsweg, aber wenn aus unternehmenspolitischen Gründen andere Strategien verfolgt werden, so hoffe ich zumindest, dass die Telekom nach innen entsprechend aufgestellt ist. Interessant wäre, ob die «Analysys Mason» Quelle für Mitarbeiter der Telekom einsehbar ist. Der Diskurs um den Breitbandausbau ist technologisch hochkomplex und – in jedem Fall aus Kundensicht – sehr emotional. Umso wünschenswerter ist eine nüchterne Betrachtung der faktischen Sachlage, bei der Deutschland mitnichten führend bei der Breitbandabdeckung ist. Und das betrifft in diesem Fall Breitband im Allgemeinen, nicht den Ausbau von Zukunftstechnologien, bei dem Deutschland unter den OECD-Staaten – Stand heute – einen der letzten Ränge belegt14.

Referenzen

Wie immer sind Quellcode und Datenquellen unter einer Open-Source Lizenz frei verfügbar. Feedback oder Fragen beantworte ich gerne via Twitter oder per Mail.

Wer sich tiefer mit der Materie beschäftigen möchte, sollte neben den gelisteten Referenzen den «Europe’s Digital Progress Report» für Deutschland15, der mit dem «Digital Economy and Society Index (DESI)»16 zusammenhängt, und die Studie der Bertelsmann-Stiftung «Ausbaustrategien für Breitbandnetze in Europa»17 anschauen. Letztere legt den Fokus vor allem auf den Glasfaserausbau und wurde vom Fraunhofer-Institut für System- und Innovationsforschung (ISI) verfasst. Außerdem sind viele interessante statistische Datensätze im «OECD Broadband Portal»18 zu finden. Dort findet man auch die Daten zum Stand des Glasfaserausbaus innerhalb der OECD14, der kürzlich nochmal doch die Medien ging19.

Hinweis: Der Artikel wurde nach Feedback der Telekom7 zu einer der Quellen überarbeitet. Die ursprüngliche Version ist hier archiviert.