Die meisten Politiker kennen diesen Unterschied nicht und reden ganz oft von anonymen Daten. In fast allen Fällen reden sie von pseudonymisierten Daten. Aber anonym klingt besser und wiegt die Bevölkerung in Sicherheit.
Anonym bedeutet, die Daten werden soweit verändert, dass es unmöglich ist einen Rückschluss auf den Menschen zu finden. Oder der Aufwand ist so unverhältnismässig gross, dass es sich nicht lohnt. Das kann mit den aktuellen Technologien möglicherweise der Fall sein. Aber was passiert, wenn die Rechner weiter schneller werden, wenn es einen Quantencomputer gibt? Dann ist der Aufwand vielleicht klein.
Pseudonym bedeutet, dass eines oder sehr wenige Merkmale leicht verändert werden. Wir kennen das von Buchautoren, die unter einem Pseudonym schreiben. Aber ihr Schreibstil wird nicht verändert und auch andere Merkmale bleiben gleich. Die Bezüge von den Daten zueinander bleibt hier erhalten. Also die Beziehung von Adresse zu Telefonnummer beispielsweise oder von Haarfarbe zu Schuhgrösse.
Oftmals geschieht die Pseudonymisierung durch einen Code oder einen Schlüssel, der die Daten durch einen Algorithmus verändert. Dadurch bleibt aber die Zuordnung von Person und Daten noch möglich. Ich habe in einer Grossbank mit nicht-europäischen Partnern in der Software-Entwicklung gearbeitet und der Datenschutz, dem die Grossbank unterlag, erlaubte es nicht, produktive Daten zu Testzwecken in das Ausland zu senden. Die Vorstände initiierten ein Projekt, dass die Daten anonymisierten sollte und dann Europa verlassen konnte. Nach mehreren Millionen Investitionen und vielen Monaten Zeit haben die Manager das Projekt eingestellt. Es wäre viel zu teuer gewesen und die Tests mit anonymisierten Daten nicht aussagekräftig genug.
Es reichen wenige Datenpunkte, auch wenn diese anonymisiert sind, einen Nutzer zu identifizieren. „Zwei Apps mit Ortsdaten reichen, um einen Nutzer zu identifizieren“. Noch weiter gingen Wissenschaftler, die die Kreditkartendaten von 1,1 Millionen Menschen auswerteten. Alle personenbezogenen Daten wurden entfernt. Also Name, Kontonummer und Kartennummer. Jeder Nutzer bekam eine kryptische Identifikationsnummer. Das ist nicht Anonymisierung sondern Pseudonymisierung. Denn diese Nummer konnte immer noch in Verbindung zu den Zahlungen der Karte gebracht werden. Die Forscher wählten 10.000 Geschäfte aus. Sie benötigen lediglich den Zeitstempel der Transaktion (ohne Sekunden, Minuten oder Stunden, lediglich der Tag war relevant), das Ladengeschäft und den Betrag um mit 90%iger Wahrscheinlichkeit herauszufinden wer das gekauft hat. Und zwar allein an zwei Datenpunkten. Heute für 50,29€ beim Mediamarkt in Castrop-Rauxel eingekauft und morgen beim Bäcker den bestellten Kuchen für 23,89€ und es ist klar, welche Idenditifikationsnummer Sie haben und welche anderen Zahlungen zu Ihnen gehören. Zwei Datenpunkte mit genau drei Informationen reichten aus. Ähnliche Untersuchungen gibt es mit Mobiltelefondaten, ohne GPS, nur über die Masten und wann Sie sich wo eingeloggt haben.
Halten wir hier einen Moment inne und denken an die Aussagen einiger Politiker, als es in der Corona-Pandemie um die Bewegungsdaten der Bürger ging und das diese ja alle anonym seien.
Übrigens haben staatliche Behörden über derartige Methoden auch Kriminelle ermittelt, die ausschliesslich Bitcoin verwendeten. Die Kauf- und Verkaufshistorie, die Zeiten zu denen die Transaktionen getätigt wurden usw. gaben den Ermittlern so viel Anhaltspunkte, dass sie zuschlagen konnten.
Wenn Sie das nächste Mal hören, dass ein Politiker sagt, die Daten werden anonymisiert, seien Sie bitte kritisch und hinterfragen Sie, ob das wirklich so ist.