Die TDM-Schranke (§ 44b UrhG) ist eine Urheberrechtsschranke im deutschen Recht, die die automatisierte Analyse und das maschinelle Lernen auf urheberrechtlich geschützten Texten und Daten erlaubt, solange Rechteinhaber nicht durch einen maschinenlesbaren Vorbehalt widersprochen haben.
Rubrik: GenAI & Content Creation · Unterrubrik: KI-Ethik · Niveau: Fortgeschritten Synonyme / Auch bekannt als: TDM-Schranke, Text and Data Mining Exception, DSM-Richtlinie Art. 4, KI-Trainingsrechte
Was ist die TDM-Schranke?
§ 44b UrhG ist die deutsche Umsetzung von Artikel 4 der EU-Urheberrechtsrichtlinie für den digitalen Binnenmarkt (DSM-Richtlinie, 2019). Die Norm schafft eine gesetzliche Erlaubnis für kommerzielle Unternehmen (nicht nur Wissenschaft), urheberrechtlich geschützte Werke – Texte, Bilder, Datenbanken – für Text und Data Mining (TDM) zu nutzen. Das schließt KI-Training ausdrücklich ein. Die Schranke gilt für alle Werke, auf die ein legaler Zugang besteht (z. B. öffentlich im Web zugängliche Inhalte oder lizenzierte Inhalte), sofern der Rechteinhaber nicht explizit widersprochen hat.
Erklärung
Rechtlicher Rahmen und Entstehungsgeschichte:
Die DSM-Richtlinie (2019) schuf erstmals eine EU-weit harmonisierte Regelung für Text und Data Mining. Sie enthält zwei TDM-Schranken: Art. 3 für wissenschaftliche Forschung (mit engeren Voraussetzungen) und Art. 4 für allgemeines TDM (breitere Anwendung, aber mit Opt-Out-Recht). Deutschland hat Art. 4 in § 44b UrhG (in Kraft seit August 2021) umgesetzt.
Kerninhalt § 44b UrhG:
Absatz 1 erlaubt die Vervielfältigung von Werken für Text und Data Mining zu beliebigen Zwecken (wissenschaftlich und kommerziell), wenn ein rechtmäßiger Zugang zum Werk besteht (legales Scraping, Kauf, Lizenz).
Absatz 3 ist das entscheidende Gegengewicht: Rechteinhaber können dem TDM ihrer Werke widersprechen – und zwar durch einen maschinenlesbaren Vorbehalt. Wenn ein solcher Vorbehalt vorliegt, darf das Werk nicht für kommerzielles TDM genutzt werden. Die Norm nennt ausdrücklich technische Mittel, insbesondere Maschinenlesbarkeit als Anforderung an den Vorbehalt.
Praxis des Opt-Out-Vorbehalts:
Die wichtigste praktische Umsetzung des Vorbehalts erfolgt über die robots.txt-Datei auf Websites. Das Protokoll erlaubt es, bestimmten Web-Crawlern den Zugang zu verweigern. OpenAI respektiert nach eigenen Angaben den GPTBot-Eintrag; Common Crawl (Basisquelle vieler LLM-Trainings-Datensätze) respektiert den allgemeinen User-agent: * Disallow-Eintrag.
Darüber hinaus hat die Initiative Robots.txt.legal.standard (TDM Reservation Protocol, TDMREP) ein maschinenlesbares Metadaten-Protokoll entwickelt, das explizit die TDM-Erlaubnis oder -Ablehnung kommuniziert und damit über das generische robots.txt hinausgeht.
Was ist TDM im Sinne des § 44b?
Das Gesetz definiert TDM als automatisierte Analysetechnik zur Erschließung von Information aus Text und Daten. KI-Training fällt in diese Definition: Das Trainieren eines LLMs auf Textdaten ist ein automatisierter Analyseprozess zur Erschließung von Sprachmustern. Allerdings ist es rechtswissenschaftlich noch nicht abschließend judiziert, ob § 44b speziell auf KI-Training im heutigen Sinn zugeschnitten ist oder ob es analoge Anwendung des ursprünglichen TDM-Konzepts ist.
Grenzen der Schranke:
Die TDM-Schranke gilt nur für den Trainingsprozess, nicht für die Ausgaben des Modells. Wenn ein trainiertes KI-Modell Original-Passagen reproduziert, ist das eine eigenständige Urheberrechtsverletzung (Reproduktion) und nicht durch § 44b gedeckt. Die Schranke gilt auch nicht für Werke, auf die kein rechtmäßiger Zugang besteht – z. B. hinter Paywalls befindliche Inhalte, die ohne Lizenz gescrapt werden.
EU AI Act-Verknüpfung: Der EU AI Act (2024) verpflichtet GPAI-Modell-Anbieter, eine Zusammenfassung der Trainings-Copyrightpolitik zu veröffentlichen und nachzuweisen, dass sie § 44b-Opt-Outs respektiert haben. Dies ist eine direkte regulatorische Brücke zwischen Urheberrecht und KI-Governance.
Internationale Vergleich: In den USA fehlt eine explizite TDM-Schranke; die Branche beruft sich auf Fair Use. In Japan existiert seit 2018 eine sehr weitreichende TDM-Schranke ohne Opt-Out-Recht, was Japan zum attraktiven Standort für KI-Training ohne urheberrechtliche Komplikationen macht. Die Divergenz zwischen EU-Opt-Out-System und US-Fair-Use und Japan-Erlaubnis ohne Opt-Out ist ein zentrales Spannungsfeld der globalen KI-Regulierung.
Beispiele
- OpenAI und robots.txt: OpenAI hat für seinen Web-Crawler GPTBot eine robots.txt-Direktive definiert. Wer
User-agent: GPTBot / Disallow: /in seine robots.txt einträgt, kann Training auf seiner Website ausschließen. Tausende Websites – darunter der NYT, Guardian und viele Fachverlage – haben dies implementiert. - Common Crawl und LAION: Der LAION-5B-Datensatz, auf dem Stable Diffusion trainiert wurde, basiert auf Common Crawl. Da Common Crawl vor der DSM-Richtlinie zusammengestellt wurde, enthielt er keine Opt-Out-Respektierung nach § 44b-Standard – was Kernargument in der Getty Images vs. Stability AI-Klage ist.
- VG Wort und KI-Training: Die VG Wort, die Verwertungsgesellschaft für Textautoren in Deutschland, fordert seit 2023 eine kollektive Lizenzvergabe für KI-Training und prüft, ob die Wahrnehmung von Opt-Out-Rechten im Namen ihrer Mitglieder möglich ist.
- TDMREP (TDM Reservation Protocol): Das W3C-Projekt TDMREP entwickelt einen Standard für maschinenlesbare TDM-Vorbehalte in HTTP-Headern und HTML-Meta-Tags, der präziser als robots.txt ist. Seit 2023 im Einsatz bei mehreren europäischen Verlagen.
- § 87b UrhG (Datenbankschutz): Ergänzend zur TDM-Schranke für Werke schützt § 87b UrhG Datenbanken. Strukturierte Datensätze (z. B. Zeitungs-Archive, Bild-Datenbanken) können über Datenbankrechte zusätzlich geschützt sein, unabhängig vom Urheberrecht der einzelnen Werke.
In der Praxis
Für Verlage und Content-Plattformen: Implementieren Sie maschinenlesbare Opt-Out-Vorbehalte in Ihrer robots.txt und prüfen Sie das TDMREP-Protokoll. Evaluieren Sie, ob aktive Lizenzverhandlungen mit KI-Unternehmen wirtschaftlich attraktiver sind als reine Opt-Out-Strategie (mehrere Verlage, u. a. Axel Springer mit OpenAI, haben Lizenzabkommen geschlossen).
Für KI-Unternehmen: Systematisches Respektieren von robots.txt-Direktiven und TDMREP-Signalen ist nicht nur ethisch geboten, sondern rechtlich nach § 44b UrhG Abs. 3 verpflichtend für kommerzielles TDM in der EU. Dokumentieren Sie Ihre Compliance, da der EU AI Act ab 2026 Nachweis verlangt.
Für Kreative und Fotografen: Prüfen Sie, ob Ihre Inhalte über Plattformen oder Agenturen zugänglich sind, die Opt-Out-Rechte durchsetzen (oder nicht). Erwägen Sie, Ihre eigene Website mit entsprechenden Metadaten zu versehen.
Vergleich & Abgrenzung
§ 44b UrhG (kommerzielles TDM) vs. § 44a UrhG (wissenschaftliches TDM): § 44a schränkt TDM auf nicht kommerzielle wissenschaftliche Forschung ein und erlaubt keine Opt-Outs. § 44b gilt für jeden Zweck, ist aber durch das Opt-Out-Recht eingeschränkter in der praktischen Durchsetzung.
TDM-Schranke vs. Fair Use (USA): Fair Use ist eine offene Abwägungsklausel; die TDM-Schranke ist eine spezifische gesetzliche Erlaubnis mit definiertem Opt-Out-Mechanismus. Fair Use bietet KI-Unternehmen in den USA mehr Flexibilität, aber auch weniger Rechtssicherheit.
TDM für Training vs. TDM für Output: § 44b deckt nur den Trainingsprozess. Was das trainierte Modell ausgibt, ist eine separate urheberrechtliche Frage – und kann Verletzungen darstellen, wenn Originalpassagen reproduziert werden.
Häufige Fragen (FAQ)
Was muss ich als Kreativer bei der TDM-Schranke beachten? Wenn Sie möchten, dass Ihre Werke nicht für kommerzielles KI-Training genutzt werden, müssen Sie einen maschinenlesbaren Vorbehalt erklären. Die einfachste Methode: robots.txt-Einträge für bekannte KI-Crawler (GPTBot, CCBot, Google-Extended etc.). Im professionellen Kontext sollten Sie prüfen, ob Ihre Plattformen und Agenturen entsprechende Opt-Outs durchsetzen.
Wie entwickelt sich die TDM-Schranke rechtlich weiter? Der EU AI Act verschärft ab 2026 die Dokumentationspflichten für KI-Trainer bezüglich Opt-Out-Compliance. Eine Revision der DSM-Richtlinie speziell für generative KI wird diskutiert, ist aber kurzfristig nicht wahrscheinlich. Gerichtsurteile in den laufenden Klagen (Getty, Autoren-Klagen) werden die Auslegung von § 44b weiter konkretisieren. Die VG Wort-Initiative zur kollektiven Wahrnehmung von Opt-Out-Rechten könnte zu einer kollektiven Lizenzierungslösung führen.
Weiterführend
- Bundesministerium der Justiz: § 44b UrhG in der aktuellen Gesetzesfassung, gesetze-im-internet.de
- Dreier, T. & Schulze, G.: „Urheberrechtsgesetz: Kommentar", 7. Auflage, C.H. Beck, 2022
- Europäische Kommission: Richtlinie (EU) 2019/790 (DSM-Richtlinie), Artikel 4, Amtsblatt EU 2019
- Leistner, M.: „Die Schrankenregelung für Text und Data Mining", GRUR, 2021
- W3C TDMREP Community Group: TDM Reservation Protocol Specification, w3.org, 2023/2024
