← Zurück zu Software & Tools
Speech to Text ist eine KI-gestützte Funktion in Adobe Premiere Pro, die Sprache in Videos automatisch transkribiert und als editierbare Caption-Clips auf der Timeline platziert, die anschließend als SRT, VTT oder eingebrannte Untertitel exportiert werden können.

Was ist Speech to Text in Premiere Pro?

Adobe integrierte eine umfassende Speech-to-Text-Transkriptionsfunktion in Premiere Pro mit der Version 15.4 (2021). Sie nutzt Adobes Sensei-KI und – wahlweise – Sprachmodelle von Drittanbietern, um gesprochene Sprache in Textform umzuwandeln. Das Ergebnis ist eine vollständig editierbare Transkription, aus der automatisch Caption-Clips auf der Timeline erstellt werden.

Untertitel sind heute ein zentrales Element professioneller Videoproduktion: Sie verbessern die Zugänglichkeit für Gehörlose und Schwerhörige, erhöhen die Reichweite auf Plattformen, auf denen Videos oft stumm konsumiert werden (Social Media), und sind eine SEO-relevante Textform für Videoplattformen.

Erklärung

Transkription erstellen

Im Menü „Fenster" → „Text" (oder über das Caption-Arbeitsbereich-Layout) öffnet sich das Text-Panel. Unter dem Reiter Transkription klickt man auf „Sequenz transkribieren". Ein Dialog erscheint mit folgenden Optionen:

  • Sprache: Wahl der gesprochenen Sprache (über 20 Sprachen unterstützt, darunter Deutsch, Englisch, Spanisch, Französisch, Japanisch u. v. m.)
  • Spur: Welche Audiospur(en) sollen transkribiert werden?
  • Stummgeschaltete Spuren ignorieren: Clips auf deaktivierten Spuren werden ausgelassen.
  • Offline-Transkription: Seit Premiere Pro 2023 ist eine lokale Offline-Transkription ohne Cloud-Verbindung möglich, was Datenschutzanforderungen erfüllt.

Transkription bearbeiten

Nach der Analyse erscheint die Transkription im Text-Panel als editierbarer Fließtext mit Zeitstempeln. Fehler (besonders bei Namen, Fachbegriffen oder Dialekten) können direkt im Panel korrigiert werden. Die Korrekturen werden automatisch mit den Zeitstempeln synchronisiert.

Captions erstellen

Mit dem Button „Captions erstellen" werden aus der Transkription automatisch Caption-Clips auf der Timeline erzeugt. Im Dialog kann eingestellt werden:

  • Stil: Captions, Untertitel oder andere Formate
  • Maximale Länge (Zeichen pro Caption-Block)
  • Mindest-/Maximaldauer pro Caption-Block
  • Lücken zwischen Blöcken

Caption-Stile und Gestaltung

Captions auf der Timeline können über das Essential Graphics Panel (siehe Essential Graphics & MOGRT in Premiere Pro) gestaltet werden: Schriftart, Schriftgröße, Farbe, Hintergrund und Position sind anpassbar. Die Stile können als Caption-Style gespeichert und auf alle anderen Caption-Clips angewendet werden.

Captions als Untertitelspur-Standard

Premiere Pro unterstützt verschiedene Caption-Formate:

  • Subtitle (SRT/VTT): Standard für Online-Plattformen. Exportiert als separates Textfile.
  • CEA-708: US-amerikanischer Broadcast-Standard für Closed Captions.
  • Teletext: Europäischer Broadcast-Standard.
  • Open Captions (Eingebrannte Untertitel): Captions werden direkt ins Bild gerendert – nicht ausblendbar vom Zuschauer.

Export

Beim Export können Captions wahlweise:

  • Als eingebrannte Captions (Burn In) direkt ins Videobild gerendert werden
  • Als Sidecar-Datei (SRT, VTT, XML) exportiert werden
  • Als Embedded Captions in das Video-Containerformat eingebettet werden (bei MP4/H.264 und MOV)

Beispiele

Podcast-Videoschnitt: Ein 45-minütiges Interview wird transkribiert. Im Text-Panel sucht der Editor nach dem Satz, an dem ein Thema beginnt, und klickt auf den Zeitstempel – Premiere Pro springt sofort zu dieser Stelle. Dies ermöglicht einen textbasierten Schnitt ohne wiederholtes Anhören.

Social-Media-Clip mit Untertiteln: Ein 60-Sekunden-Reel soll mit eingebrannten Untertiteln für Instagram produziert werden. Nach der Transkription werden Captions erstellt, der Caption-Stil auf weiße Schrift mit schwarzem Hintergrund gesetzt, und der Export erfolgt als MP4 mit Burn-In.

In der Praxis

  • Genauigkeit: Die Transkriptionsgenauigkeit ist bei klarer Aussprache und Standardsprache sehr hoch (ca. 90–95 %). Dialekte, starke Akzente, sehr schnelles Sprechen oder schlechte Audioqualität reduzieren die Genauigkeit.
  • Fachterminologie: Eigennamen und Fachbegriffe werden oft falsch erkannt. Eine Nachkorrektur im Text-Panel ist in solchen Fällen erforderlich.
  • Textbasiertes Schneiden: Die Transkription ermöglicht eine neue Schnittweise: Statt auf der Timeline nach dem richtigen Moment zu suchen, kann man im Textfenster suchen und Passagen direkt dort markieren und löschen.
  • Mehrsprachige Produktionen: Für Videos mit mehreren Sprachen muss die Transkription abschnittsweise mit unterschiedlichen Spracheinstellungen vorgenommen werden.
  • Verbindung mit Essential Sound: Für bessere Transkriptionsergebnisse empfiehlt sich eine Audioverbesserung mit dem Essential Sound Panel (siehe Essential Sound Panel in Premiere Pro) vor der Transkription.

Vergleich & Abgrenzung

ToolPlattformOfflineGenauigkeitIntegration
Premiere Pro Speech to TextNativJa (ab 2023)Sehr gutNahtlos
Rev.comOnline-ServiceNeinSehr hoch (human)Manueller Import
Otter.aiOnline-ServiceNeinGutManueller Import
DescriptSeparate AppNeinSehr gutExport/Import
YouTube Auto-CaptionsYouTube-internNeinGutPlattformspezifisch

Premiere Pros native Lösung bietet den Vorteil der vollständigen Workflow-Integration – kein Export/Import in externe Tools erforderlich.

Häufige Fragen (FAQ)

Welche Sprachen werden unterstützt? Aktuell über 20 Sprachen, darunter Deutsch, Englisch (US/UK/AU), Spanisch, Französisch, Portugiesisch, Chinesisch (Mandarin), Japanisch, Koreanisch und weitere.

Ist die Transkription DSGVO-konform? Seit Premiere Pro 2023 gibt es eine Offline-Option, die keine Daten an Adobes Server sendet. Diese Option erfüllt datenschutzrechtliche Anforderungen nach DSGVO.

Kann ich die Captions nachträglich auf der Timeline verschieben? Ja. Caption-Clips sind wie normale Clips auf der Timeline behandelbar – sie können verschoben, gekürzt und dupliziert werden.

Wie exportiere ich eine SRT-Datei? Beim Export über Datei → Exportieren → Medien (oder Media Encoder) unter „Captions" die Option „Als Sidecar-Datei exportieren" und das Format „SubRip Subtitle (.srt)" wählen.

Verwandte Einträge

Weiterführend

  • Adobe Help Center: „Speech to Text – Transkription und Captions in Premiere Pro" (Adobe Systems, 2024) – helpx.adobe.com/premiere-pro/using/speech-to-text.html
  • Web Content Accessibility Guidelines (WCAG) 2.1: Anforderungen an Videountertitel – w3.org/WAI/WCAG21
  • Geduld, Patrick: Adobe Premiere Pro CC – Das umfassende Handbuch. Rheinwerk Verlag, 2022, S. 623–645.
  • Hogan, Heather: „Using AI-Powered Captions in Video Production". Streaming Media Magazine, 2023.
← Zurück zu Software & Tools
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar