Was verrät das Facebook Datenleck über Österreich?
Am Ostersonntag gab es diesmal nicht nur Ostereier zu finden, sondern auch 533 Millionen Telefonnummern aus einem Facebook Datenleck, nachzulesen zum Beispiel beim Standard oder hier die ursprüngliche Bekanntmachung.
Das weckt natürlich die Neugierde eines Datenspielers und ich habe mir die Frage gestellt, welche Erkenntnisse man aus den Daten für Österreich ziehen kann. Selbstverständlich nicht auf individueller Ebene, sprich welche Telefonnummer hat zum Beispiel Sebastian Kurz, sondern auf aggregierter Ebene für Österreich gesamthaft. So zeige ich zum Beispiel die beliebtesten Handyprovider und finde die Top 10 der Vor- und Nachnamen.
Dazu kurz ein paar Worte zu den Daten, die in dem Facebook Datenleck enthalten sind. Für Österreich gibt es rund 1.2 Millionen Datensätze. Jeder Datensatz enthält neben einer Facebook-ID, eine Telefonnummer, Vor- und Nachname sowie Geschlecht. Diese Daten sind bei fast allen Datensätzen enthalten. Es gibt dann noch ein paar weitere Datenfelder - Wohnort, Heimatort, Beziehungsstatus, Arbeitgeber, E-Mailadresse, eine Jahreszahl und ein Datum. Diese Daten sind aber bei den meisten Datensätzen leer, so gibt es z.B. bei weniger als 1 Prozent der Datensätze eine E-Mailadresse. Daher habe ich mich bei meiner Analyse auf die eingangs erwähnten Datenfelder beschränkt.
Bei den Analysen ist zu beachten, dass diese nicht notwendigerweise repräsentativ für gesamt Österreich sind, sondern nur für Facebook-Nutzer im Jahr 2019, die ihre Telefonnummer hinterlegt hatten.
Welche Handyvorwahl, und somit welcher Betreiber, ist am beliebtesten?
In Zeiten der Rufnummernmitnahme ist das natürlich mit Vorsicht zu genießen, aber man sieht, dass 0664 führt, vor 0676, 0660 und 0650 - also wenig Überraschungen mit A1, Magenta, 3 und Ex-tele.ring (sprich jetzt nochmal Magenta).
Gibt es mehr Frauen oder Männer (mit Telefonnummer) auf Facebook?
Die Männer sind mit rund 56% in der Mehrheit, “nur” 44% Frauen.
Wie heißen Frau und Herr Österreicher?
Bei den Nachnamen ist Gruber der Spitzenreiter, mit etwas mehr als 0.3 Prozent - knapp vor Huber, mit auch noch mehr als 0.3 Prozent.
Wenn man die Vornamen betrachtet, ist bei den Frauen Andrea der Favorit mit rund 1.4 Prozent aller Frauen, vor Maria und Sabine.
Bei den Männern ist Michael der Favorit rund 2.2 Prozent aller Männer, vor Thomas und Christian.
Wenn man die Top 10 bei Frauen und Männern vergleicht, sieht man, dass die Kreativität bei Männernamen etwas geringer ist - die Top 10 Namen bei Männern decken bereits rund 17 Prozent der Männer ab, bei den Frauen sind es nur rund 12 Prozent.
Und wie sieht es in Deutschland aus?
Zum Vergleich auch noch die analogen Analysen von unserem großen Bruder im Norden. Die Handyvorwahlen sind natürlich anders, die Geschlechterverteilung recht ähnlich. Bei den Nachnamen gibt es mit Müller und Schmidt nicht nur zwei andere Favoriten, sondern auch deutlich konzentriertere, mit mehr als 0.7 und mehr als 0.5 Prozent - versus etwas mehr als 0.3 Prozent in Österreich. Bei den Männervornamen gibt es eine deutliche Übereinstimmung zwischen Deutschland und Österreich - Top 2 sind z.B. mit Michael und Thomas genau gleich, in den Top 4 sind die selben 4 Namen. Die Frauennamen sind wieder “kreativer”, da gibt es größere Unterschiede bei den Top 10.