Consent und Opt-Out bei KI-Training beschreiben die Mechanismen, durch die Urheber, Rechteinhaber oder betroffene Personen kontrollieren können, ob ihre Werke, Daten oder persönlichen Informationen zur Entwicklung und zum Training von KI-Modellen verwendet werden dürfen.
Rubrik: GenAI & Content Creation · Unterrubrik: KI-Ethik · Niveau: Fortgeschritten Synonyme / Auch bekannt als: AI Training Data Consent, Training Data Opt-Out, Do Not Train, KI-Training-Widerspruch
Was ist Consent und Opt-Out bei KI-Training?
Wenn Unternehmen wie OpenAI, Google, Stability AI oder Meta KI-Modelle trainieren, nutzen sie riesige Datenmengen aus dem Internet – Texte, Bilder, Musik, Videos. Die Frage, ob die Urheber dieser Inhalte diesem Prozess zustimmen müssen (Consent-Pflicht, Opt-In) oder ihn aktiv ablehnen können (Opt-Out), ist eines der zentralen rechtlichen und ethischen Konflikte der KI-Industrie. Die Antwort variiert je nach Rechtsrahmen, Art des Inhalts und betroffenem Personenkreis erheblich.
Erklärung
Rechtslage in der EU: Die EU-Urheberrechtsrichtlinie (DSM-Richtlinie, 2019) und ihre deutsche Umsetzung im UrhG schaffen mit der TDM-Schranke (§ 44b UrhG) eine gesetzliche Erlaubnis für Text und Data Mining – aber mit einem expliziten Opt-Out-Recht für Rechteinhaber. Urheber und Verleger können der Nutzung ihrer Werke für kommerziales KI-Training widersprechen, wenn sie diesen Widerspruch „in geeigneter Weise" kommunizieren. Die technische Umsetzung erfolgt üblicherweise über robots.txt-Einträge oder spezialisierte Metadaten wie das X-Robots-Tag: noai-Protokoll.
Rechtslage in den USA: In den USA fehlt eine explizite Opt-Out-Regelung für KI-Training. KI-Unternehmen berufen sich auf die Fair-Use-Doktrin (17 U.S.C. § 107), die transformative Nutzung urheberrechtlich geschützter Werke unter bestimmten Umständen erlaubt. Die Gerichte haben diese Frage bisher nicht abschließend entschieden; mehrere Klagen (u. a. Getty vs. Stability AI, Authors Guild vs. OpenAI) sind anhängig.
Personenbezogene Daten: Neben Urheberrecht gilt für personenbezogene Daten die DSGVO (EU) bzw. der CCPA (Kalifornien). KI-Training mit personenbezogenen Daten erfordert nach DSGVO eine Rechtsgrundlage (Einwilligung, berechtigtes Interesse etc.) und ist Gegenstand zahlreicher Aufsichtsbehörden-Entscheidungen. Die italienische Datenschutzbehörde Garante untersagte 2023 vorübergehend ChatGPT, die irische DPC prüft laufend OpenAI-Praktiken.
Branchenpraxis und Opt-Out-Tools: Als Reaktion auf Druck von Kreativen haben mehrere Plattformen und Unternehmen Opt-Out-Mechanismen eingeführt: Adobe Firefly trainiert ausschließlich auf lizenzierten oder eigenen Inhalten; Getty Images hat für lizenzierte Kunden explizit zugesichert, ihre Inhalte nicht für KI-Training zu verwenden; DeviantArt, ArtStation und andere Kreativplattformen bieten Account-Einstellungen zum Widersprechen von KI-Training an. OpenAI bietet seit 2024 ein Opt-Out-Tool für das Web Crawling seines GPTBot-Crawlers. Meta ermöglicht Nutzern in der EU (unter DSGVO) den Widerspruch gegen die Nutzung ihrer Daten für KI-Training.
Auf technischer Seite gibt es Initiativen wie „Nightshade" und „Glaze" (University of Chicago), Tools, die Bilder mit subtilen Störungen versehen, die KI-Training-Prozesse korrumpieren sollen – ein unilateraler Selbstschutz für Künstler außerhalb rechtlicher Kanäle.
EU AI Act: Ab 2026 verpflichtet der EU AI Act Anbieter von GPAI-Modellen (General Purpose AI, wie GPT oder Gemini), eine Zusammenfassung der genutzten Trainingsdaten zu veröffentlichen und dabei zu dokumentieren, dass Opt-Out-Anfragen nach der TDM-Schranke respektiert wurden. Dies ist eine bedeutende Neuerung, die Transparenz über Trainingsdaten erstmals regulatorisch erzwingen will.
Beispiele
- robots.txt und `X-Robots-Tag: noai`: Der New York Times, der Guardian und viele andere Verlage haben seit 2023 ihre robots.txt aktualisiert, um GPTBot, Common Crawl und andere KI-Crawler auszusperren. OpenAI respektiert nach eigenen Angaben diese robots.txt-Direktiven.
- Adobe Firefly (Opt-In-Modell): Adobe hat Firefly ausschließlich auf Adobe Stock (mit lizenzierten Werken) und Public-Domain-Material trainiert und zahlt Stock-Fotografen nachträgliche Boni auf Basis der Nutzung ihrer Werke im Training – ein Modell, das als Branchenstandard propagiert wird.
- Spawning.ai und „Have I Been Trained?": Das Startup Spawning.ai bietet einen Dienst, mit dem Künstler prüfen können, ob ihre Bilder in LAION-Datensätzen enthalten sind, und Opt-Out-Anfragen stellen können; Stability AI, Midjourney und andere haben sich dieser Initiative angeschlossen.
- Meta KI-Training Opt-Out (EU, 2024): Als die irische DPC einschritt, bot Meta EU-Nutzern die Möglichkeit, der Nutzung ihrer Facebook- und Instagram-Posts für KI-Training zu widersprechen. Dieses Recht steht EU-Nutzern explizit zu; in anderen Regionen ist es nicht garantiert.
- Class-Action-Klagen von Autoren (USA, 2023/2024): Gruppen von Buchautoren (u. a. George R.R. Martin, John Grisham) haben OpenAI und Meta wegen Training auf ihren Werken ohne Einwilligung verklagt und argumentieren, dass Fair Use hier nicht greift.
In der Praxis
Für Content-Ersteller und Fotografen ist es aktuell empfehlenswert, aktiv Opt-Out-Optionen zu nutzen: robots.txt auf der eigenen Website entsprechend konfigurieren, Kreativplattformen nutzen, die Opt-Out ermöglichen, und ggf. das Spawning.ai-Tool zu prüfen. Verträge mit Stockagenturen sollten KI-Training-Klauseln explizit adressieren.
Für Unternehmen, die eigene KI-Modelle entwickeln oder trainieren lassen, gilt in der EU: Wird kommerzielles TDM-Training auf urheberrechtlich geschützten Inhalten durchgeführt, müssen Opt-Out-Anfragen respektiert werden. Die technische Implementierung (Crawler-Blocking, Metadaten) sollte als Compliance-Standard verankert werden.
Für Mediaagenturen und Verlage: Die eigene Daten-Policy sollte klar definieren, unter welchen Bedingungen KI-Unternehmen Crawler-Zugang erhalten, und Lizenzverhandlungen mit KI-Anbietern proaktiv geführt werden – mehrere große Verlage (Axel Springer, Le Monde, Financial Times) haben 2023/2024 Lizenzabkommen mit OpenAI geschlossen.
Vergleich & Abgrenzung
Opt-Out vs. Opt-In: Das EU-Recht geht derzeit vom Opt-Out-Prinzip aus (kommerzielles TDM ist erlaubt, sofern kein Widerspruch). Viele Kreative fordern ein Opt-In-System, bei dem KI-Training auf urheberrechtlich geschützten Werken nur mit expliziter Erlaubnis zulässig wäre. Ein Opt-In-System würde die aktuelle Balance stark zugunsten der Rechteinhaber verschieben.
Consent für Personendaten vs. Urheberrechts-Opt-Out: Bei personenbezogenen Daten ist die DSGVO eindeutiger: Es braucht eine Rechtsgrundlage, und Widerspruchsrechte sind umfassend. Beim Urheberrecht ist die Lage komplexer, da die TDM-Schranke eine gesetzliche Erlaubnis ist, kein vertragliches Recht.
Häufige Fragen (FAQ)
Was muss ich als Kreativer bei Consent und Opt-Out bei KI-Training beachten? Sie können Ihre Website durch robots.txt-Einträge vor KI-Crawlern schützen. Prüfen Sie auf Kreativplattformen wie Behance, DeviantArt oder ArtStation die Datenschutz-Einstellungen zu KI-Training. In der EU haben Sie nach DSGVO das Recht, der Verarbeitung Ihrer personenbezogenen Daten für KI-Training zu widersprechen. Für Ihre urheberrechtlich geschützten Werke gilt das Opt-Out-Recht nach § 44b Abs. 3 UrhG.
Wie entwickelt sich die Rechtslage weiter? Die laufenden Gerichtsverfahren in den USA werden die Fair-Use-Frage für KI-Training klären. In der EU wird der EU AI Act ab 2026 Transparenzpflichten für GPAI-Anbieter verschärfen. Eine internationale Harmonisierung ist unwahrscheinlich – es ist davon auszugehen, dass EU-Recht und US-Recht weiter divergieren.
Weiterführend
- Bundesministerium der Justiz: Erläuterungen zu § 44b UrhG (TDM-Schranke), 2021
- European Parliamentary Research Service: „Artificial Intelligence Act", 2024
- Spawning.ai: „Have I Been Trained?", haveibeentrained.com, 2023
- Henderson, P. et al.: „Foundation Models and Fair Use", Stanford CRFM, 2023
- Authors Guild v. OpenAI, Klageschrift, SDNY, 2023
