Speech to Text ist eine KI-gestützte Funktion in Adobe Premiere Pro, die Sprache in Videos automatisch transkribiert und als editierbare Caption-Clips auf der Timeline platziert, die anschließend als SRT, VTT oder eingebrannte Untertitel exportiert werden können.
Was ist Speech to Text in Premiere Pro?
Adobe integrierte eine umfassende Speech-to-Text-Transkriptionsfunktion in Premiere Pro mit der Version 15.4 (2021). Sie nutzt Adobes Sensei-KI und – wahlweise – Sprachmodelle von Drittanbietern, um gesprochene Sprache in Textform umzuwandeln. Das Ergebnis ist eine vollständig editierbare Transkription, aus der automatisch Caption-Clips auf der Timeline erstellt werden.
Untertitel sind heute ein zentrales Element professioneller Videoproduktion: Sie verbessern die Zugänglichkeit für Gehörlose und Schwerhörige, erhöhen die Reichweite auf Plattformen, auf denen Videos oft stumm konsumiert werden (Social Media), und sind eine SEO-relevante Textform für Videoplattformen.
Erklärung
Transkription erstellen
Im Menü „Fenster" → „Text" (oder über das Caption-Arbeitsbereich-Layout) öffnet sich das Text-Panel. Unter dem Reiter Transkription klickt man auf „Sequenz transkribieren". Ein Dialog erscheint mit folgenden Optionen:
- Sprache: Wahl der gesprochenen Sprache (über 20 Sprachen unterstützt, darunter Deutsch, Englisch, Spanisch, Französisch, Japanisch u. v. m.)
- Spur: Welche Audiospur(en) sollen transkribiert werden?
- Stummgeschaltete Spuren ignorieren: Clips auf deaktivierten Spuren werden ausgelassen.
- Offline-Transkription: Seit Premiere Pro 2023 ist eine lokale Offline-Transkription ohne Cloud-Verbindung möglich, was Datenschutzanforderungen erfüllt.
Transkription bearbeiten
Nach der Analyse erscheint die Transkription im Text-Panel als editierbarer Fließtext mit Zeitstempeln. Fehler (besonders bei Namen, Fachbegriffen oder Dialekten) können direkt im Panel korrigiert werden. Die Korrekturen werden automatisch mit den Zeitstempeln synchronisiert.
Captions erstellen
Mit dem Button „Captions erstellen" werden aus der Transkription automatisch Caption-Clips auf der Timeline erzeugt. Im Dialog kann eingestellt werden:
- Stil: Captions, Untertitel oder andere Formate
- Maximale Länge (Zeichen pro Caption-Block)
- Mindest-/Maximaldauer pro Caption-Block
- Lücken zwischen Blöcken
Caption-Stile und Gestaltung
Captions auf der Timeline können über das Essential Graphics Panel (siehe Essential Graphics & MOGRT in Premiere Pro) gestaltet werden: Schriftart, Schriftgröße, Farbe, Hintergrund und Position sind anpassbar. Die Stile können als Caption-Style gespeichert und auf alle anderen Caption-Clips angewendet werden.
Captions als Untertitelspur-Standard
Premiere Pro unterstützt verschiedene Caption-Formate:
- Subtitle (SRT/VTT): Standard für Online-Plattformen. Exportiert als separates Textfile.
- CEA-708: US-amerikanischer Broadcast-Standard für Closed Captions.
- Teletext: Europäischer Broadcast-Standard.
- Open Captions (Eingebrannte Untertitel): Captions werden direkt ins Bild gerendert – nicht ausblendbar vom Zuschauer.
Export
Beim Export können Captions wahlweise:
- Als eingebrannte Captions (Burn In) direkt ins Videobild gerendert werden
- Als Sidecar-Datei (SRT, VTT, XML) exportiert werden
- Als Embedded Captions in das Video-Containerformat eingebettet werden (bei MP4/H.264 und MOV)
Beispiele
Podcast-Videoschnitt: Ein 45-minütiges Interview wird transkribiert. Im Text-Panel sucht der Editor nach dem Satz, an dem ein Thema beginnt, und klickt auf den Zeitstempel – Premiere Pro springt sofort zu dieser Stelle. Dies ermöglicht einen textbasierten Schnitt ohne wiederholtes Anhören.
Social-Media-Clip mit Untertiteln: Ein 60-Sekunden-Reel soll mit eingebrannten Untertiteln für Instagram produziert werden. Nach der Transkription werden Captions erstellt, der Caption-Stil auf weiße Schrift mit schwarzem Hintergrund gesetzt, und der Export erfolgt als MP4 mit Burn-In.
In der Praxis
- Genauigkeit: Die Transkriptionsgenauigkeit ist bei klarer Aussprache und Standardsprache sehr hoch (ca. 90–95 %). Dialekte, starke Akzente, sehr schnelles Sprechen oder schlechte Audioqualität reduzieren die Genauigkeit.
- Fachterminologie: Eigennamen und Fachbegriffe werden oft falsch erkannt. Eine Nachkorrektur im Text-Panel ist in solchen Fällen erforderlich.
- Textbasiertes Schneiden: Die Transkription ermöglicht eine neue Schnittweise: Statt auf der Timeline nach dem richtigen Moment zu suchen, kann man im Textfenster suchen und Passagen direkt dort markieren und löschen.
- Mehrsprachige Produktionen: Für Videos mit mehreren Sprachen muss die Transkription abschnittsweise mit unterschiedlichen Spracheinstellungen vorgenommen werden.
- Verbindung mit Essential Sound: Für bessere Transkriptionsergebnisse empfiehlt sich eine Audioverbesserung mit dem Essential Sound Panel (siehe Essential Sound Panel in Premiere Pro) vor der Transkription.
Vergleich & Abgrenzung
| Tool | Plattform | Offline | Genauigkeit | Integration |
|---|---|---|---|---|
| Premiere Pro Speech to Text | Nativ | Ja (ab 2023) | Sehr gut | Nahtlos |
| Rev.com | Online-Service | Nein | Sehr hoch (human) | Manueller Import |
| Otter.ai | Online-Service | Nein | Gut | Manueller Import |
| Descript | Separate App | Nein | Sehr gut | Export/Import |
| YouTube Auto-Captions | YouTube-intern | Nein | Gut | Plattformspezifisch |
Premiere Pros native Lösung bietet den Vorteil der vollständigen Workflow-Integration – kein Export/Import in externe Tools erforderlich.
Häufige Fragen (FAQ)
Welche Sprachen werden unterstützt? Aktuell über 20 Sprachen, darunter Deutsch, Englisch (US/UK/AU), Spanisch, Französisch, Portugiesisch, Chinesisch (Mandarin), Japanisch, Koreanisch und weitere.
Ist die Transkription DSGVO-konform? Seit Premiere Pro 2023 gibt es eine Offline-Option, die keine Daten an Adobes Server sendet. Diese Option erfüllt datenschutzrechtliche Anforderungen nach DSGVO.
Kann ich die Captions nachträglich auf der Timeline verschieben? Ja. Caption-Clips sind wie normale Clips auf der Timeline behandelbar – sie können verschoben, gekürzt und dupliziert werden.
Wie exportiere ich eine SRT-Datei? Beim Export über Datei → Exportieren → Medien (oder Media Encoder) unter „Captions" die Option „Als Sidecar-Datei exportieren" und das Format „SubRip Subtitle (.srt)" wählen.
Verwandte Einträge
- Essential Sound Panel in Premiere Pro – Essential Sound Panel
- Essential Graphics & MOGRT in Premiere Pro – Essential Graphics & MOGRT
- Export-Einstellungen & Media Encoder in Premiere Pro – Export-Einstellungen & Media Encoder
Weiterführend
- Adobe Help Center: „Speech to Text – Transkription und Captions in Premiere Pro" (Adobe Systems, 2024) – helpx.adobe.com/premiere-pro/using/speech-to-text.html
- Web Content Accessibility Guidelines (WCAG) 2.1: Anforderungen an Videountertitel – w3.org/WAI/WCAG21
- Geduld, Patrick: Adobe Premiere Pro CC – Das umfassende Handbuch. Rheinwerk Verlag, 2022, S. 623–645.
- Hogan, Heather: „Using AI-Powered Captions in Video Production". Streaming Media Magazine, 2023.
