Have I been trained

Wie ich immer wieder sage, alles was wir im Internet tun, geht nie wieder weg und wird irgendwann öffentlich. Die grossen Generative AI Systeme wie ChatGPT, LLAMA, Dall-e, Stable Diffusion etc. verwenden alles, was sie im Internet finden können, um ihre Modelle zu trainieren. Das heisst, jedes Bild von Ihnen, Ihren Kindern, Ihrem Hund oder Ihrem Haus, jeder öffentliche Text, jede Tondatei, alles wird verwendet.

Das kann dazu führen, dass das Bild Ihres Kindes oder Ihres Partners auf einmal in den Antworten der KI Systeme auftaucht. Je nach Modell, Training und Anfrage kann das mit einem Hund, einem Terroristen oder einem Kinderschänder passieren. Oder Ihre Frau im Bikini als Mona Lisa gemalt. Oder Ihr unsportlicher Mann im Rugby Outfit oder bei einer Party auf einem Boot in Nizza. Alles ist möglich, mit Ihren Daten. Es sieht glaubwürdig aus und kann missbraucht werden.

Nur wenige der Modelle trainieren auf öffentlichen Trainingsdaten, das heißt, Sie wissen nicht, ob Sie dabei sind oder nicht. Aber gehen Sie davon aus, dass Sie es sind.

Laion hat eine öffentliche Datenbank mit 5,8 Milliarden Einträgen. Wenn Sie wissen wollen, mit welchen Bildern Laion arbeitet, können Sie HaveIbeenTrained verwenden. Das Schöne ist, Sie können nicht nur Ihren Namen eingeben, sondern jeden.

Wollen Sie die Daten nach DSGVO löschen lassen, beten Sie, denn die Firmen haben nicht so ein riesiges Interesse daran.

Ich empfehle zu dem Thema den Podcast von 11km.