Consent und Opt-Out bei KI-Training

Consent und Opt-Out bei KI-Training bezeichnet das Recht von Urheber:innen, Rechteinhaber:innen und Plattformnutzer:innen, der Verwendung ihrer Werke und Daten zum Training generativer KI-Modelle ausdrücklich zuzustimmen (Consent) oder zu widersprechen (Opt-Out).

Rubrik: GenAI & Content Creation · Unterrubrik: KI-Ethik & Gesellschaft · Niveau: Fortgeschritten Synonyme / Auch bekannt als: TDM-Vorbehalt, Opt-Out vom KI-Training, Training Data Consent, Nutzungsvorbehalt

Was ist Consent und Opt-Out bei KI-Training?

Consent und Opt-Out beim KI-Training regeln, ob und unter welchen Bedingungen Texte, Bilder, Audio- oder Videodaten in die Trainingsdatensätze generativer KI-Modelle einfließen dürfen. Während Consent eine aktive Zustimmung erfordert (Opt-In), funktioniert Opt-Out umgekehrt: Inhalte sind grundsätzlich nutzbar, bis Rechteinhaber:innen widersprechen.

Erklärung

Der rechtliche Rahmen für Consent und Opt-Out bei KI-Training in Europa stützt sich vor allem auf die EU-Urheberrechtsrichtlinie (DSM-Richtlinie 2019/790, Artikel 4), die in Deutschland mit § 44b UrhG umgesetzt wurde. Demnach ist Text- und Data-Mining (TDM), also auch das maschinelle Auswerten von Werken zum KI-Training, grundsätzlich erlaubt, sofern die Rechteinhaber:innen keinen ausdrücklichen Nutzungsvorbehalt (TDM-Vorbehalt) in maschinenlesbarer Form erklärt haben.

Für wissenschaftliche Forschungseinrichtungen gilt eine weitergehende Ausnahme, gegen die Urheber:innen sich nicht wehren können. Der kommerzielle KI-Training-Use Case der großen Foundation Models (OpenAI, Stability AI, Midjourney, Anthropic, Meta) fällt jedoch unter die Opt-Out-Regel.

Der EU AI Act ergänzt seit 2024 diese Lage: Anbieter generativer KI müssen die TDM-Vorbehalte respektieren und transparent dokumentieren, welche urheberrechtlich geschützten Werke ins Training eingeflossen sind (Art. 53 AI Act).

In den USA gibt es keinen vergleichbaren Opt-Out-Mechanismus; dort wird Training meist über die Doktrin „Fair Use" gerechtfertigt, was Gegenstand laufender Klagen ist (Getty vs. Stability AI, NYT vs. OpenAI, Authors Guild vs. OpenAI).

Praktisch bedeutet das: Wer als Fotograf:in, Illustrator:in oder Texter:in nicht möchte, dass eigene Werke in KI-Trainingsdaten landen, muss aktiv werden, durch maschinenlesbare Hinweise auf der eigenen Website, durch Plattform-Einstellungen oder durch Eintrag in spezialisierte Opt-Out-Register.

Beispiele

Beispiel 1: Eine Fotografin trägt ihre Bildersammlung auf Have I Been Trained? (haveibeentrained.com, Spawning AI) ein und erhält einen Hinweis, ob Werke im LAION-5B-Datensatz auftauchen. Über das gleiche Portal kann sie ihre Werke zum Opt-Out für teilnehmende Modelle (Stability AI) anmelden.
Beispiel 2: Ein Verlag setzt in der robots.txt der Website Direktiven wie User-agent: GPTBot Disallow: /, User-agent: CCBot Disallow: / und User-agent: Google-Extended Disallow: /, um Web-Crawler von OpenAI, Common Crawl und Google Gemini auszuschließen.
Beispiel 3: Ein Designstudio fügt seinen Bildern IPTC-/XMP-Metadaten mit dem TDM Reservation Protocol hinzu (<tdmrep:tdm-reservation>1</tdmrep:tdm-reservation>), einem W3C-Standard für maschinenlesbare Nutzungsvorbehalte.
Beispiel 4: Adobe bietet in Creative Cloud die Option „Content Analysis Opt-Out", mit der eigene Cloud-Dokumente vom Training für Adobe Firefly ausgeschlossen werden.
Beispiel 5: DeviantArt führte 2022 nach Protesten der Community ein Opt-Out-Flag für DreamUp ein, mit dem Nutzer:innen ihre Galerien vor KI-Training schützen.
Beispiel 6: Meta erlaubt seit 2024 in der EU, nach Druck der Datenschutzbehörden, ein Opt-Out für die Nutzung von Facebook- und Instagram-Posts zum KI-Training (über ein eigenes Formular im Privacy Center).

In der Praxis

Wer als Kreative:r oder Unternehmen Opt-Out umsetzen will, kombiniert mehrere Ebenen: technisch (robots.txt, ai.txt, TDM-Metadaten in EXIF/XMP, Content Credentials nach C2PA), vertraglich (Stockfoto-Verträge, AGB, Lizenzhinweise) und organisatorisch (Eintrag in Spawning AI, Glaze/Nightshade-Tools zur Bildverfälschung). Wichtig: Opt-Out wirkt nur prospektiv, einmal trainierte Modelle „vergessen" Werke nicht. Wer Werke schon vor 2022 ins Netz gestellt hat, muss damit rechnen, dass sie in LAION-Datensätzen, Common Crawl oder ähnlichen Korpora gelandet sind.

Tools wie Glaze (University of Chicago) und Nightshade verändern Bilder so, dass KI-Modelle sie schwerer oder fehlerhaft lernen, eine technische Notwehr, wenn klassisches Opt-Out nicht greift.

Vergleich & Abgrenzung

Merkmal	Consent (Opt-In)	Opt-Out
Default	Nutzung erst nach Zustimmung	Nutzung erlaubt bis Widerspruch
Beweislast	Bei KI-Anbieter	Bei Rechteinhaber:in
Rechtsraum	DSGVO bei personenbezogenen Daten	DSM-Richtlinie/§ 44b UrhG bei Werken
Aufwand	Hoch für Anbieter	Hoch für Urheber:innen

Wichtig: Bei personenbezogenen Daten (z.B. Gesichter, Stimmen) gilt zusätzlich die DSGVO, die in der Regel Consent verlangt, nicht nur Opt-Out.

Häufige Fragen (FAQ)

Reicht ein Hinweis in den AGB für ein wirksames Opt-Out? Nein, der Vorbehalt muss laut § 44b UrhG maschinenlesbar sein, also für Crawler erkennbar. Reiner Fließtext in AGB oder Footer genügt rechtlich nicht. Üblich sind robots.txt-Direktiven, TDM Reservation Protocol in Metadaten oder C2PA-Manifeste.

Was ist der Unterschied zwischen Opt-Out und Löschung aus dem Modell? Opt-Out wirkt nur für künftige Trainingsläufe. Bereits trainierte Modelle „verlernen" Werke nicht automatisch, das sogenannte Machine Unlearning ist technisch aufwendig und in der Praxis bei Foundation Models bisher nicht zuverlässig umgesetzt. Manche Anbieter (z.B. Adobe Firefly) bieten Lizenz-Garantien, die das Restrisiko abfedern.

Gilt der Opt-Out auch für US-Anbieter? Indirekt ja: Anbieter, die ihre Modelle in der EU vermarkten, fallen unter den EU AI Act und müssen TDM-Vorbehalte respektieren, auch wenn das Training in den USA stattfindet. Die Durchsetzung ist allerdings noch unklar und Gegenstand mehrerer Gerichtsverfahren.

Weiterführend

Dornis, Tim W. (2024): Generative KI und Urheberrecht, Trainingsdaten und Output. NJW 2024
European Union (2024): Regulation (EU) 2024/1689, AI Act, Artikel 53. eur-lex.europa.eu
Spawning AI (2024): Have I Been Trained?, Documentation. haveibeentrained.com
W3C Community Group (2023): TDM Reservation Protocol Specification. w3.org/community/tdmrep

Was ist Consent und Opt-Out bei KI-Training?

Erklärung

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Consent und Opt-Out bei KI-Training

Was ist Consent und Opt-Out bei KI-Training?

Erklärung

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.