← Zurück zu Software & Tools
Speech-to-Text in Premiere Pro transkribiert Audiospuren automatisch mit KI, erstellt daraus editierbare Captions in der Timeline und ermöglicht den Export als SRT, VTT oder eingebrannte Untertitel.

Rubrik: Software & Tools Deep-Dive · Unterrubrik: Adobe Premiere Pro · Niveau: Fortgeschritten


Was ist Speech-to-Text in Premiere Pro?

Seit Premiere Pro 22.0 (Ende 2021) ist Speech-to-Text direkt in die Anwendung integriert. Die KI-Transkription basiert auf Adobes Sensei-Sprachmodellen und unterstützt mehrere Sprachen, darunter Deutsch, Englisch, Französisch, Spanisch, Japanisch und weitere. Die Transkription erzeugt automatisch ein Transcript im Text Panel und daraus wahlweise Captions in der Timeline.

Captions sind in Premiere keine normalen Textclips, sondern ein eigener Clip-Typ mit speziellem Standard (CEA-608/708 für Broadcast, SRT/Subtitle für Web, Custom für freie Gestaltung).


Transcript vs. Captions

Transcript

Das Transcript (Text Panel → Transcript-Tab) ist die reine Textdarstellung der erkannten Sprache – ohne Timing-Synchronisation zur Timeline. Hier kann der Redakteur:

  • Wörter, Sätze und Absätze korrigieren.
  • Über die Suchfunktion bestimmte Stellen im Material finden und direkt anspringen.
  • Sequenz aus dem Transcript heraus schneiden (seit Premiere 23.x): Text markieren → Rechtsklick → In Sequence → Nur markierte Passagen bleiben in der Timeline.

Captions

Captions entstehen aus dem Transcript (oder werden manuell erstellt) und sind in der Timeline als separate Spur sichtbar. Sie enthalten präzises Timing (In/Out-Punkt pro Untertitelblock) und sind direkt im Program Monitor und Text Panel editierbar.


Transkription durchführen

  1. Text Panel öffnen: Window → Text (oder Shift+9).
  2. Sequence oder Clip auswählen: Die Transkription kann für die gesamte Sequenz oder für einzelne Clips gestartet werden.
  3. Transcript → Transcribe Sequence (oder Transcribe Clip): Dialog öffnet sich.
  4. Sprache wählen: Z. B. „German" für deutschsprachiges Material.
  5. Audio-Spur wählen: Welche Spur(en) transkribiert werden sollen (wichtig bei mehrspurigem Audiomaterial).
  6. Offline-Transkription aktivieren (optional): Setzt ein heruntergeladenes Sprachmodell voraus; funktioniert ohne Internetverbindung.
  7. Transcribe klicken: Analyse läuft im Hintergrund (ca. 1–3× schneller als Echtzeit).
  8. Ergebnis im Transcript-Tab prüfen und korrigieren.

Captions aus Transcript erstellen

  1. Im Text Panel → Transcript-Tab → Create Captions Button.
  2. Optionen:

- Caption Preset: CEA-608 (Broadcast), CEA-708 (digitales Broadcast), Subtitle (Web), SRT-kompatibel, Custom. - Maximum Length: Zeichen pro Caption-Block (Standard: 32). - Minimum Duration: Wie lange ein Caption-Block mindestens angezeigt wird. - Lines per Caption: 1 oder 2 Zeilen. - Gaps between Captions: Pause zwischen zwei Blöcken (verhindert springende Untertitel).

  1. Premiere erstellt eine neue Captions-Spur in der Timeline.

Caption-Styles anpassen

Im Captions-Tab des Essential Graphics Panels (oder direkt im Text Panel) lassen sich Caption-Styles definieren:

  • Schrift: Familie, Gewicht, Größe.
  • Farbe und Hintergrund: Weiße Schrift auf schwarzem Halbschatten ist Standard.
  • Position: Vertikal (oben/unten) und horizontal (Mitte, links, rechts).
  • Animation (Burns-in Captions): Dynamische Einblendungen sind nur bei Custom Captions möglich.

Caption Styles speichern: Über das Hamburger-Menü als Preset sichern und für alle Projekte eines Kanals oder Senders wiederverwenden.


SRT / VTT Export

Für den Export von Untertiteln als separate Datei (nicht eingebrannt):

File → Export → Media:

  • Im Export-Dialog: Captions-Tab → Export Options → Create Sidecar File
  • Format: SRT (SubRip, plattformübergreifend) oder VTT (WebVTT, web-nativ).
  • Die SRT-Datei wird parallel zur Videodatei exportiert und kann auf YouTube, Vimeo, Netflix, ARD Mediathek etc. hochgeladen werden.

Alternativ: File → Export → Captions exportiert nur die Untertitel-Datei ohne das Video.

Eingebrannte Untertitel (Burned-in): Im Export-Dialog → Video-Tab → Captions: „Burn Captions into Video" aktivieren. Die Untertitel werden fest in das Videobild gerendert – nicht mehr trennbar, aber universell kompatibel.


Schritt-für-Schritt: Vollautomatische Untertitel für YouTube

  1. Fertiggestellte Sequenz öffnen.
  2. Text Panel → Transcript → Transcribe Sequence → Sprache: „German".
  3. Transcript korrigieren (typische KI-Fehler: Eigennamen, Fachbegriffe, Satzzeichen).
  4. Create Captions → Subtitle-Preset, 2 Zeilen, max. 42 Zeichen.
  5. Caption-Style anpassen: Schrift, Größe, Position.
  6. Im Text Panel Caption-Track Zeile für Zeile kontrollieren.
  7. Export: Media Encoder → YouTube 1080p HD → Captions: Create Sidecar SRT.
  8. Beim YouTube-Upload: SRT-Datei als Untertitel hochladen.

Anwendungsbeispiele

  1. Bildungsvideos: Vollständige Transkription für barrierefreie Kurs-Inhalte; SRT für LMS-Plattformen (Moodle, Coursera).
  2. Nachrichtenproduktion: Automatische Captions für Web-Artikel; Korrektur auf Nachrichtensprache (korrekte Eigennamen, Zahlen).
  3. Social-Media-Reels: Eingebrannte Captions für Stummwiedergabe auf Instagram und TikTok.
  4. Dokumentation: Transkript-basiertes Schneiden (Paper Cut) – Redakteur markiert relevante Textpassagen, Timeline wird automatisch gebaut.
  5. Podcastvideo: Volltranskription als Grundlage für Blog-Artikel (Transcript aus Premiere exportieren als TXT).

In der Praxis

Shortcuts und Tipps:

Shortcut / AktionFunktion
Shift+9Text Panel öffnen
Strg+F / Cmd+FIm Transcript suchen
Klick auf Wort im TranscriptPlayhead springt zur Stelle im Video
Transcript markierenTextblöcke für Paperschnitt auswählen
Caption-Block doppelklickenInhalt in Timeline direkt editieren

Deutsch-spezifische Tipps: Die Erkennungsrate für Deutsch ist gut, leidet aber bei starken Dialekten, schnellem Sprechtempo und Fachterminologie. Für Interviews empfiehlt sich: deutliches Sprechen, Mikrofon nahe am Mund, minimales Hintergrundrauschen. Eigennamen, Produktnamen und Markennamen müssen fast immer manuell korrigiert werden.

Typische Fehler:

  • Captions zu früh finalisieren: KI-Fehler im Transcript übersehen → fehlerhafte Untertitel im fertigen Video.
  • CEA-608 für Web: Broadcast-Standards sind nicht auf allen Web-Plattformen kompatibel; für YouTube und Vimeo SRT verwenden.
  • Caption-Timing nach Schnitt nicht neu ausrichten: Wenn nach der Caption-Erstellung noch Schnitte in der Timeline verändert werden, verschieben sich Caption-Timecodes. Captions dann neu generieren oder manuell nachjustieren.

Vergleich mit anderen NLEs

FunktionPremiere ProFinal Cut ProDaVinci Resolve
Integriertes Speech-to-TextJa (Adobe Sensei)Ja (Apple Intelligence, sehr stark)Nein (Drittanbieter: Simon Says)
Transcript-basierter SchnittJaJaNein
Caption-StylesVollständig anpassbarBegrenztBegrenzt
SRT-ExportJaJaJa (Deliver-Page)
Offline-TranskriptionJa (Download-Modelle)Ja (On-device)Nein

Apple Final Cut Pros Speech-to-Text gilt als präziser und schneller, da es auf den Neural Engine-Chips des Apple Silicon optimiert ist und direkt auf dem Gerät läuft. Premiere erfordert für manche Sprachmodelle eine Cloud-Verbindung.


Häufige Fragen (FAQ)

Wie genau ist die Deutsch-Transkription? In kontrollierten Bedingungen (gutes Mikrofon, ruhige Umgebung, klare Aussprache) erreicht Premiere eine Erkennungsrate von 85–95 % bei Deutsch. Bei Dialekten, Akzenten oder schlechter Audioqualität sinkt sie auf 60–70 %. Für kritische Produktionen (Nachrichten, Lehrvideos) immer manuell nachkorrigieren.

Kann ich Captions in anderen Sprachen hinzufügen (mehrsprachige Untertitel)? Ja. Mehrere Caption-Spuren können übereinandergelegt werden, jede in einer eigenen Sprache. Beim Export werden die gewünschten Spuren als separate SRT-Dateien ausgegeben. Auf YouTube können diese als separate Untertitel-Spuren hochgeladen werden.


Verwandte Einträge


Weiterführend

  • Adobe Help: Transcription in Premiere Pro
  • Premiere Bro: Auto Captions and Subtitles Guide
  • Javier Mercedes: Automatic Subtitles in Premiere Pro (YouTube)
← Zurück zu Software & Tools
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar
Premiere Pro: Speech-to-Text & Captions — Wiki | Lazi Akademie | Lazi Akademie Esslingen