← Zurück zu GenAI & Content Creation
Consent und Opt-Out bei KI-Training bezeichnet das Recht von Urheber:innen, Rechteinhaber:innen und Plattformnutzer:innen, der Verwendung ihrer Werke und Daten zum Training generativer KI-Modelle ausdrücklich zuzustimmen (Consent) oder zu widersprechen (Opt-Out).

Rubrik: GenAI & Content Creation · Unterrubrik: KI-Ethik · Niveau: Fortgeschritten Synonyme / Auch bekannt als: TDM-Vorbehalt, Opt-Out vom KI-Training, Training Data Consent, Nutzungsvorbehalt

Was ist Consent und Opt-Out bei KI-Training?

Consent und Opt-Out beim KI-Training regeln, ob und unter welchen Bedingungen Texte, Bilder, Audio- oder Videodaten in die Trainingsdatensätze generativer KI-Modelle einfließen dürfen. Während Consent eine aktive Zustimmung erfordert (Opt-In), funktioniert Opt-Out umgekehrt: Inhalte sind grundsätzlich nutzbar, bis Rechteinhaber:innen widersprechen.

Erklärung

Der rechtliche Rahmen für Consent und Opt-Out bei KI-Training in Europa stützt sich vor allem auf die EU-Urheberrechtsrichtlinie (DSM-Richtlinie 2019/790, Artikel 4), die in Deutschland mit § 44b UrhG umgesetzt wurde. Demnach ist Text- und Data-Mining (TDM) – also auch das maschinelle Auswerten von Werken zum KI-Training – grundsätzlich erlaubt, sofern die Rechteinhaber:innen keinen ausdrücklichen Nutzungsvorbehalt (TDM-Vorbehalt) in maschinenlesbarer Form erklärt haben.

Für wissenschaftliche Forschungseinrichtungen gilt eine weitergehende Ausnahme, gegen die Urheber:innen sich nicht wehren können. Der kommerzielle KI-Training-Use Case der großen Foundation Models (OpenAI, Stability AI, Midjourney, Anthropic, Meta) fällt jedoch unter die Opt-Out-Regel.

Der EU AI Act ergänzt seit 2024 diese Lage: Anbieter generativer KI müssen die TDM-Vorbehalte respektieren und transparent dokumentieren, welche urheberrechtlich geschützten Werke ins Training eingeflossen sind (Art. 53 AI Act).

In den USA gibt es keinen vergleichbaren Opt-Out-Mechanismus; dort wird Training meist über die Doktrin „Fair Use" gerechtfertigt, was Gegenstand laufender Klagen ist (Getty vs. Stability AI, NYT vs. OpenAI, Authors Guild vs. OpenAI).

Praktisch bedeutet das: Wer als Fotograf:in, Illustrator:in oder Texter:in nicht möchte, dass eigene Werke in KI-Trainingsdaten landen, muss aktiv werden – durch maschinenlesbare Hinweise auf der eigenen Website, durch Plattform-Einstellungen oder durch Eintrag in spezialisierte Opt-Out-Register.

Beispiele

  • Beispiel 1: Eine Fotografin trägt ihre Bildersammlung auf Have I Been Trained? (haveibeentrained.com, Spawning AI) ein und erhält einen Hinweis, ob Werke im LAION-5B-Datensatz auftauchen. Über das gleiche Portal kann sie ihre Werke zum Opt-Out für teilnehmende Modelle (Stability AI) anmelden.
  • Beispiel 2: Ein Verlag setzt in der robots.txt der Website Direktiven wie User-agent: GPTBot Disallow: /, User-agent: CCBot Disallow: / und User-agent: Google-Extended Disallow: /, um Web-Crawler von OpenAI, Common Crawl und Google Gemini auszuschließen.
  • Beispiel 3: Ein Designstudio fügt seinen Bildern IPTC-/XMP-Metadaten mit dem TDM Reservation Protocol hinzu (<tdmrep:tdm-reservation>1</tdmrep:tdm-reservation>), einem W3C-Standard für maschinenlesbare Nutzungsvorbehalte.
  • Beispiel 4: Adobe bietet in Creative Cloud die Option „Content Analysis Opt-Out", mit der eigene Cloud-Dokumente vom Training für Adobe Firefly ausgeschlossen werden.
  • Beispiel 5: DeviantArt führte 2022 nach Protesten der Community ein Opt-Out-Flag für DreamUp ein, mit dem Nutzer:innen ihre Galerien vor KI-Training schützen.
  • Beispiel 6: Meta erlaubt seit 2024 in der EU – nach Druck der Datenschutzbehörden – ein Opt-Out für die Nutzung von Facebook- und Instagram-Posts zum KI-Training (über ein eigenes Formular im Privacy Center).

In der Praxis

Wer als Kreative:r oder Unternehmen Opt-Out umsetzen will, kombiniert mehrere Ebenen: technisch (robots.txt, ai.txt, TDM-Metadaten in EXIF/XMP, Content Credentials nach C2PA), vertraglich (Stockfoto-Verträge, AGB, Lizenzhinweise) und organisatorisch (Eintrag in Spawning AI, Glaze/Nightshade-Tools zur Bildverfälschung). Wichtig: Opt-Out wirkt nur prospektiv – einmal trainierte Modelle „vergessen" Werke nicht. Wer Werke schon vor 2022 ins Netz gestellt hat, muss damit rechnen, dass sie in LAION-Datensätzen, Common Crawl oder ähnlichen Korpora gelandet sind.

Tools wie Glaze (University of Chicago) und Nightshade verändern Bilder so, dass KI-Modelle sie schwerer oder fehlerhaft lernen – eine technische Notwehr, wenn klassisches Opt-Out nicht greift.

Vergleich & Abgrenzung

MerkmalConsent (Opt-In)Opt-Out
DefaultNutzung erst nach ZustimmungNutzung erlaubt bis Widerspruch
BeweislastBei KI-AnbieterBei Rechteinhaber:in
RechtsraumDSGVO bei personenbezogenen DatenDSM-Richtlinie/§ 44b UrhG bei Werken
AufwandHoch für AnbieterHoch für Urheber:innen

Wichtig: Bei personenbezogenen Daten (z.B. Gesichter, Stimmen) gilt zusätzlich die DSGVO, die in der Regel Consent verlangt – nicht nur Opt-Out.

Häufige Fragen (FAQ)

Reicht ein Hinweis in den AGB für ein wirksames Opt-Out? Nein, der Vorbehalt muss laut § 44b UrhG maschinenlesbar sein – also für Crawler erkennbar. Reiner Fließtext in AGB oder Footer genügt rechtlich nicht. Üblich sind robots.txt-Direktiven, TDM Reservation Protocol in Metadaten oder C2PA-Manifeste.

Was ist der Unterschied zwischen Opt-Out und Löschung aus dem Modell? Opt-Out wirkt nur für künftige Trainingsläufe. Bereits trainierte Modelle „verlernen" Werke nicht automatisch – das sogenannte Machine Unlearning ist technisch aufwendig und in der Praxis bei Foundation Models bisher nicht zuverlässig umgesetzt. Manche Anbieter (z.B. Adobe Firefly) bieten Lizenz-Garantien, die das Restrisiko abfedern.

Gilt der Opt-Out auch für US-Anbieter? Indirekt ja: Anbieter, die ihre Modelle in der EU vermarkten, fallen unter den EU AI Act und müssen TDM-Vorbehalte respektieren – auch wenn das Training in den USA stattfindet. Die Durchsetzung ist allerdings noch unklar und Gegenstand mehrerer Gerichtsverfahren.

Weiterführend

  • Dornis, Tim W. (2024): Generative KI und Urheberrecht – Trainingsdaten und Output. NJW 2024
  • European Union (2024): Regulation (EU) 2024/1689 – AI Act, Artikel 53. eur-lex.europa.eu
  • Spawning AI (2024): Have I Been Trained? – Documentation. haveibeentrained.com
  • W3C Community Group (2023): TDM Reservation Protocol Specification. w3.org/community/tdmrep
← Zurück zu GenAI & Content Creation
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar
Consent und Opt-Out bei KI-Training — Wiki | Lazi Akademie Esslingen