Die häufigste Frage, die uns vor einem KI-Projekt gestellt wird, lautet nicht "Was kostet das?" oder "Wie gut funktioniert das?" — sondern: "Dürfen unsere Daten das KI-Modell überhaupt sehen?" Eine berechtigte Sorge. Wer Kundenanfragen, Rechnungen oder Personaldaten durch ein KI-System schickt, verarbeitet personenbezogene Daten im Sinne der DSGVO — und haftet dafür.
Die gute Nachricht: DSGVO-konforme KI ist möglich. Die schlechte: nicht jedes Setup ist es. In diesem Artikel erfahren Sie, wo Ihre Daten bei einem KI-System tatsächlich landen, welche drei Architektur-Optionen es gibt und welche vier Maßnahmen aus Datenschutzsicht Pflicht sind, bevor Sie ein KI-Projekt produktiv schalten.
Die Kernfrage: Wo gehen Ihre Daten eigentlich hin?
Jedes KI-System, das Text versteht oder generiert, basiert auf einem Sprachmodell (LLM). Die entscheidende Frage ist nicht, ob ein Modell Ihre Daten "sieht" — um eine Anfrage zu beantworten, muss es den Inhalt verarbeiten —, sondern wo diese Verarbeitung physisch stattfindet und was danach mit den Daten passiert.
Hier liegt der eigentliche Knackpunkt. Wenn Sie eine Kundenanfrage an einen klassischen Chatbot-Dienst schicken, der über die USA läuft, verlassen die enthaltenen personenbezogenen Daten den europäischen Rechtsraum. Genau das ist der Punkt, an dem viele Setups DSGVO-rechtlich kippen. Es geht also weniger um die KI selbst als um die Architektur drumherum — den Serverstandort, die Vertragslage und die Frage, ob Ihre Eingaben zum Training weiterverwendet werden.
Wer das versteht, erkennt schnell: Datenschutz ist bei KI keine reine Compliance-Pflicht, die man am Ende dranklebt. Er ist eine Frage der technischen Entscheidung, die Sie ganz am Anfang treffen. Falsch entschieden, lässt sich das später kaum noch sauber reparieren.
Drei Architektur-Optionen im Vergleich
In der Praxis stehen Ihnen drei Wege offen. Sie unterscheiden sich erheblich in Datenschutzniveau, Aufwand und Kosten.
1. US-Cloud (Standard-Dienste)
Viele bekannte KI-Dienste werden in den USA betrieben. Die Einrichtung ist einfach und günstig, die Modelle sind oft technisch führend. Der Haken: Personenbezogene Daten werden in ein Drittland übermittelt. Nach DSGVO ist das nur mit geeigneten Garantien zulässig — und je nach Konfiguration bestehen Restrisiken, etwa wenn Eingaben zu Trainingszwecken weiterverarbeitet werden.
- Vorteil: günstig, schnell startklar, modernste Modelle
- Nachteil: Drittland-Übermittlung, rechtlich aufwendig abzusichern, für sensible Daten oft nicht empfehlenswert
2. EU-Cloud (europäisches Hosting)
Die für die meisten Mittelständler pragmatischste Lösung. Anbieter wie Azure OpenAI mit EU Data Zones betreiben die KI-Infrastruktur in europäischen Rechenzentren. Die Daten bleiben damit im EU-Raum, die Verträge sind auf die DSGVO ausgelegt, und die Modellqualität entspricht dem aktuellen Stand. Das europäische Hosting der KI-Infrastruktur ist eine der wesentlichen Maßnahmen für DSGVO-konforme KI.
- Vorteil: Daten bleiben in der EU, vertraglich sauber, sehr gute Modellqualität
- Nachteil: etwas teurer als US-Standarddienste, Auswahl der Modelle leicht eingeschränkt
3. On-Premise / Self-Hosting
Die datenschutzfreundlichste Variante: Das KI-System läuft auf Ihrer eigenen Infrastruktur, etwa über n8n in Kombination mit lokalen LLMs via Ollama. Dabei verlassen keine Daten Ihr eigenes Netzwerk. Für hochsensible Branchen — Gesundheit, Recht, Finanzen — ist das häufig die einzig vertretbare Option.
- Vorteil: volle Datenhoheit, keine externe Übermittlung, ideal für sensible Daten
- Nachteil: höherer Setup- und Wartungsaufwand, eigene Hardware nötig, lokale Modelle sind nicht immer so leistungsstark wie die großen Cloud-Modelle
Seien wir ehrlich: Es gibt keine pauschal "beste" Option. Ein Handwerksbetrieb mit harmlosen Terminanfragen hat einen anderen Schutzbedarf als eine Arztpraxis. Die Architektur sollte zum Datentyp passen — nicht umgekehrt.
Die vier Pflicht-Maßnahmen für DSGVO-konforme KI
Unabhängig von der gewählten Architektur gibt es vier Maßnahmen, die kein KI-Projekt auslassen sollte:
- 1. Europäisches Hosting der KI-Infrastruktur. Die Verarbeitung sollte in einer EU-Cloud oder auf eigener Infrastruktur stattfinden. So bleibt der Datenfluss im europäischen Rechtsraum.
- 2. Auftragsverarbeitungsvertrag (AVV) mit allen Dienstleistern. Sobald ein externer Anbieter personenbezogene Daten in Ihrem Auftrag verarbeitet, schreibt Art. 28 DSGVO einen AVV vor. Das gilt für die KI-Cloud genauso wie für Ihre Agentur.
- 3. Keine Übermittlung personenbezogener Daten an US-Cloud-Dienste ohne geeignete Garantien. Wenn US-Dienste unvermeidbar sind, müssen geeignete Garantien vorliegen. Im Zweifel: personenbezogene Daten gar nicht erst übermitteln.
- 4. Transparenz gegenüber Betroffenen nach Art. 13/14 DSGVO. Betroffene müssen wissen, dass ihre Daten durch ein KI-System verarbeitet werden. Das gehört in Ihre Datenschutzerklärung — und überschneidet sich mit den Transparenz- und Kennzeichnungspflichten des EU AI Act, der verlangt, dass eine KI sich als solche zu erkennen gibt.
Hinweis: Dieser Artikel ersetzt keine individuelle Datenschutzberatung. Die konkrete Bewertung Ihres Anwendungsfalls — insbesondere bei sensiblen Daten oder Drittland-Übermittlungen — gehört in die Hände Ihres Datenschutzbeauftragten oder einer fachkundigen Beratung.
Worauf Sie bei der Anbieterwahl achten sollten
Wenn Sie einen Dienstleister oder ein KI-Produkt auswählen, lohnt sich ein nüchterner Blick hinter die Marketing-Versprechen. "DSGVO-konform" steht schnell auf einer Website — entscheidend ist, ob es sich belegen lässt. Stellen Sie folgende Fragen:
- Wo stehen die Server? Lassen Sie sich den konkreten Verarbeitungsstandort nennen, nicht nur "europäisch klingende" Formulierungen.
- Bekomme ich einen AVV? Ein seriöser Anbieter legt den Auftragsverarbeitungsvertrag von sich aus vor — nicht erst auf hartnäckiges Nachfragen.
- Werden meine Eingaben zum Training verwendet? Das muss vertraglich ausgeschlossen sein. Andernfalls fließen Ihre Daten unkontrolliert weiter.
- Welche Subunternehmer sind beteiligt? Auch die Kette dahinter muss DSGVO-konform sein.
- Gibt es einen Datenschutznachweis? Das ist nicht nur intern wichtig — Förderprogramme verlangen häufig genau solche Nachweise, bevor sie ein KI-Projekt bezuschussen.
Bei Coreflow AI schließen wir mit jedem Kunden einen AVV ab und legen den Datenfluss offen, bevor ein Projekt startet. Für unsere KI-Chatbots setzen wir je nach Schutzbedarf auf EU-Cloud-Hosting oder On-Premise-Lösungen — abhängig davon, wie sensibel Ihre Daten sind. Ein DFY-Starter beginnt bei ab 1.490 € Setup und ab 199 €/Monat (Richtwert); Growth- und Premium-Pakete liegen höher. Welche Architektur für Ihren Fall die richtige ist, klären wir vorab gemeinsam.
Fazit
DSGVO-konforme KI ist kein Widerspruch — aber sie entsteht nicht von allein. Sie ist das Ergebnis bewusster Architektur-Entscheidungen: europäisches Hosting, ein sauberer AVV, der Verzicht auf ungesicherte US-Transfers und Transparenz gegenüber den Betroffenen. Wer diese vier Maßnahmen ernst nimmt, kann KI produktiv einsetzen, ohne den Datenschutz zu riskieren.
Wer hingegen den günstigsten Standarddienst nimmt und hofft, dass schon nichts passiert, baut auf Sand. Der Aufwand für ein sauberes Setup ist überschaubar — der Schaden durch ein nicht-konformes ist es nicht. Wenn Sie unsicher sind, welche Option zu Ihren Daten passt, sprechen Sie uns an: Über unser Kontaktformular klären wir Ihren Anwendungsfall, bevor auch nur ein Datensatz das Haus verlässt.
Häufige Fragen
Dürfen die Daten unseres Unternehmens das KI-Modell überhaupt sehen?
Ja, technisch muss das Modell den Inhalt einer Anfrage verarbeiten, um sie zu beantworten. Entscheidend ist nicht das "Sehen", sondern wo diese Verarbeitung stattfindet und was danach mit den Daten passiert. Bei europäischem Hosting bleiben die Daten im EU-Raum, und ein guter Vertrag schließt die Weiterverwendung zum Training aus.
Ist ChatGPT oder ein US-Dienst automatisch DSGVO-widrig?
Nicht automatisch, aber risikobehaftet. Bei US-Diensten werden personenbezogene Daten in ein Drittland übermittelt, was nach DSGVO nur mit geeigneten Garantien zulässig ist. Für sensible Daten ist eine EU-Cloud oder eine On-Premise-Lösung in der Regel die sicherere Wahl.
Was ist ein AVV und brauchen wir den wirklich?
Ein Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO regelt, wie ein Dienstleister personenbezogene Daten in Ihrem Auftrag verarbeitet. Sobald ein externer Anbieter solche Daten für Sie verarbeitet, ist er Pflicht. Bei Coreflow AI schließen wir mit jedem Kunden einen AVV ab.
Können wir KI komplett ohne Cloud betreiben?
Ja. Über On-Premise- oder Self-Hosting-Lösungen, etwa n8n mit lokalen Modellen via Ollama, läuft die KI auf Ihrer eigenen Infrastruktur, und keine Daten verlassen Ihr Netzwerk. Das ist die datenschutzfreundlichste Variante, erfordert aber mehr Aufwand bei Einrichtung und Wartung.
Matthias Amann · Mitgründer & Tech, Coreflow AI
Schreibt über praxistaugliche KI-Automatisierung für den deutschen Mittelstand — bodenständig, mit Blick auf das, was wirklich funktioniert.