← Zurück zu Mediendesign & Digitale Medien
Untertitel (Captions) sind Textalternativen zu gesprochenen Inhalten und Umgebungsgeräuschen in Videos, die gehörlosen und schwerhörigen Menschen den vollständigen Zugang zu audiovisuellen Medien ermöglichen – unterschieden nach offenen/geschlossenen Formaten und dem Umfang der Beschreibung (SDH, CC).

Rubrik: Mediendesign & Digitale Medien · Unterrubrik: Accessibility · Niveau: Fortgeschritten


Was sind Untertitel im Accessibility-Kontext?

Im deutschen Sprachraum wird häufig nicht zwischen Untertiteln (für Übersetzungen in andere Sprachen) und Untertiteln für Hörgeschädigte unterschieden. In der internationalen Fachsprache ist die Unterscheidung klarer:

  • Subtitles: Textübersetzung für Zuschauer, die die Audiosprache nicht sprechen. Gesprochener Dialog wird übersetzt; Geräusche werden nicht beschrieben.
  • Captions / SDH: Vollständige Textversion aller auditiven Informationen für Menschen, die die Audiosprache sprechen, aber den Ton nicht (vollständig) wahrnehmen können.

Im Accessibility-Kontext sind immer Captions / SDH gemeint, wenn von „Untertiteln" gesprochen wird.


Erklärung

Arten von Untertiteln

SDH (Subtitles for the Deaf and Hard of Hearing): SDH sind die umfassendste Form der barrierefreien Untertitelung. Sie enthalten:

  • Den vollständigen gesprochenen Dialog
  • Identifikation der sprechenden Person (wenn nicht aus dem Kontext klar)
  • Relevante Umgebungsgeräusche in eckigen Klammern: [Telefon klingelt], [Tür schlägt zu]
  • Musikalische Informationen: [spannungsvolle Musik], [♪ Lied: Titel ♪]
  • Ton-Qualitäten und Betonungen: [flüstert], [ruft]

SDH sind der Standard für Streaming-Plattformen (Netflix, Amazon Prime), Blu-rays und öffentlich-rechtliche Mediatheken.

CC (Closed Captions): Closed Captions sind technisch die deaktivierbaren (geschlossenen) Untertitel, die im nordamerikanischen Raum weit verbreitet sind. Das Kürzel CC ist auf Videoplattformen wie YouTube und LinkedIn als Symbol etabliert. In Europa und Deutschland wird häufig die Bezeichnung „Untertitel für Gehörlose" oder SDH verwendet.

Open Captions (Offene Untertitel): Offene Untertitel sind fest in das Videobild eingebrannd und können vom Zuschauer nicht deaktiviert werden. Anwendungsfall: Stummfilme in sozialen Medien (Facebook, Instagram), Kiosk-Displays in öffentlichen Räumen, Videos, die in einer Umgebung ohne Player-Steuerung laufen.

Closed Captions (Geschlossene Untertitel): Geschlossene Untertitel sind separat als Datei oder Datenstrom hinterlegt und können vom Zuschauer ein- und ausgeschaltet werden. Format-Typen: SRT, VTT (WebVTT), TTML/DFXP, SCC, EBU-STL.

Anforderungen der WCAG

Die WCAG – Web Content Accessibility Guidelines im Überblick 2.2 enthalten folgende Kriterien zu Untertiteln:

  • 1.2.2 Captions (Prerecorded) – Stufe A: Aufgezeichnete Videoinhalte mit Synchronton benötigen Captions.
  • 1.2.4 Captions (Live) – Stufe AA: Live-Videos (Webinare, Streams) benötigen Live-Untertitel.
  • 1.2.3 Audio Description or Media Alternative – Stufe A: Alternative für aufgezeichnete Videos mit visuellen Inhalten (→ Audiodeskription für Videos).

Das bedeutet: Aufgezeichnete Lehrvideos, Produktvideos, Unternehmensvorstellungen etc. benötigen mindestens Captions auf Stufe A.

Qualitätskriterien für Untertitel

Nicht jeder Untertitel erfüllt Accessibility-Anforderungen. Qualitätsmerkmale:

Genauigkeit: Automatisch generierte Untertitel (z. B. via YouTube Auto-Captions oder KI-Tools) haben Fehlerquoten von 15–30 % und sind allein meist nicht WCAG-konform. Sie benötigen manuelle Korrektur.

Synchronisation: Untertitel müssen zeitlich mit dem Audioinhalt synchron sein (Toleranz: max. ±2 Sekunden laut EBU R 37).

Lesegeschwindigkeit: Empfohlene maximale Lesegeschwindigkeit: 17 Zeichen pro Sekunde (CPS) für einsprachige Untertitel laut EBU Tech 3264. Schnellere Untertitel überfordern viele Zuschauer.

Zeilenlänge und Darstellung: Maximal 2 Zeilen, ca. 37 Zeichen pro Zeile (EBU). Untertitel sollten am unteren Bildrand positioniert sein, bei Bedarf nach oben verschiebbar.

Sprecherkennzeichnung: Bei mehreren Sprechern die Person identifizieren, z. B. durch Farbe, Name in Klammern oder Zeilenposition.

Live-Untertitelung

Live-Untertitel für Webinare und Konferenzen werden durch mehrere Methoden erstellt:

  • CART (Communication Access Realtime Translation): Menschliche Stenotypistinnen und -typisten schreiben in Echtzeit mit, Fehlerquote unter 1 %. Goldstandard.
  • ASR (Automatic Speech Recognition): KI-basierte Echtzeit-Transkription. Dienste wie Microsoft Azure Speech, Google Cloud Speech, Rev.ai. Qualität variiert stark je nach Akzent, Fachvokabular und Audioqualität.
  • Hybridverfahren: ASR + manuelle Nachkorrektur mit minimalem Verzug.

Plattformen wie Zoom, Teams und YouTube Live bieten integrierte ASR-Untertitelung, die jedoch für formelle Zugänglichkeitsanforderungen eine Nachbearbeitung erfordert.

Untertitel-Formate

SRT (SubRip Text): Einfachstes Textformat. Enthält Nummern, Zeitstempel und Text. Keine Formatierungsoptionen. Weitverbreitet und von fast allen Playern unterstützt.

WebVTT (Web Video Text Tracks): HTML5-Standard für Web-Videos. Unterstützt Positionierung, Farbe, Karaoke-Effekte und Region-Tags. Empfohlen für Webinhalte.

TTML/DFXP (Timed Text Markup Language): XML-basiertes Format, das von Broadcastern und Streaming-Diensten (Netflix, BBC) genutzt wird. Umfangreiche Formatierungsoptionen.

EBU-STL: Europäisches Broadcast-Format, von ARD, ZDF und anderen öffentlich-rechtlichen Sendern genutzt.


Beispiele

SRT-Dateibeispiel:

``` 1 00:00:10,500 --> 00:00:14,000 Willkommen zum Webinar über Barrierefreiheit.

2 00:00:14,500 --> 00:00:18,000 [Applaus im Publikum]

3 00:00:18,500 --> 00:00:22,000 MODERATORIN: Heute sprechen wir über WCAG 2.2. ```


In der Praxis

Für Medienproduzierende bedeutet Untertitel-Pflicht einen festen Schritt in der Post-Production-Kette:

  1. Rohtranskript aus Drehbuch oder ASR-Tool (z. B. Descript, Rev.com)
  2. Manuelle Qualitätskontrolle: Genauigkeit, Timing, Sprecherzuweisung
  3. Export als WebVTT für Web-Inhalte, SRT als universelles Format
  4. Einbindung in den Video-Player mit <track>-Tag in HTML:

``html <video> <source src="video.mp4" type="video/mp4"> <track kind="captions" src="untertitel-de.vtt" srclang="de" label="Deutsch" default> </video> ``


Vergleich & Abgrenzung

Untertitel vs. [Audiodeskription für Videos](/wiki/mediendesign-digitale-medien/accessibility/audiodeskription/): Untertitel machen gesprochenes und gehörtes zugänglich. Audiodeskription für Videos macht Visuelles zugänglich (für Blinde). Beides zusammen ist für vollständige Video-Accessibility notwendig.

Captions vs. Transkript: Ein Transkript ist ein zeitunabhängiger Volltext des Audioinhalts. Captions sind zeitgestempelt und synchon. Für reine Audio-Inhalte (Podcasts) ist ein Transkript die wichtigste Accessibility-Maßnahme.


Häufige Fragen (FAQ)

Sind YouTube-Auto-Captions WCAG-konform? Nein. Automatisch generierte Untertitel gelten nicht als WCAG-konform, da sie keine ausreichende Genauigkeit gewährleisten. Sie müssen manuell korrigiert werden.

Brauche ich Untertitel für kurze Social-Media-Videos? WCAG gilt für Webinhalte formal ab Stufe A auch für kurze Videos. Für Social-Media-Plattformen empfehlen alle Plattformen (Meta, TikTok, LinkedIn) Untertitel auch aus Reichweiten-Gründen: 85 % der Facebook-Videos werden ohne Ton konsumiert (Facebook IQ, 2016).


Verwandte Einträge


Weiterführend

  • W3C WAI: Captions/Subtitles. 2023.
  • European Broadcasting Union (EBU): EBU Tech 3264: Subtitling Quality. EBU, 2019.
  • Ofcom: Guidance on Standards for Subtitling. Ofcom, 2023.
  • Díaz Cintas, Jorge / Remael, Aline: Audiovisual Translation: Subtitling. Routledge, 2007.
  • Facebook IQ: Lights On for Mobile Video. Facebook IQ Study, 2016.
← Zurück zu Mediendesign & Digitale Medien
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar
Untertitel & Captions – SDH, CC und offene vs. geschlossene Untertitel — Wiki | Lazi Akademie | Lazi Akademie Esslingen