← Zurück zu Film & Mediendesign
Stem Mixing bezeichnet die Technik, den Filmmix in thematisch zusammengehörige Gruppen (Stems) aufzuteilen – typischerweise Dialog, Musik und Effekte – die getrennt voneinander gespeichert und weiterverarbeitet werden können.

Rubrik: Film & Mediendesign · Unterrubrik: Sound Design & Film-Ton · Niveau: Fortgeschritten Synonyme / Auch bekannt als: Subgroup Mixing, Bus Mixing, M&E (Music & Effects), Composite Stems


Was ist Stem Mixing?

Ein fertig gemischter Film besteht aus Hunderten von Einzelspuren – Dialoge, ADR, Foley, Soundeffekte, Atmo, Musik. Für die praktische Handhabung in der Postproduktion, bei der Internationalisierung und für spätere Anpassungen werden diese Spuren zu Stems zusammengefasst.

Stems sind pre-mixed Gruppen: Die Mixer-Entscheidungen (EQ, Kompression, Panning) sind in den Stems eingebettet, aber die Stems selbst können noch relativ zueinander angepasst werden. So kann beispielsweise für einen TV-Sender der Dialogpegel angehoben werden, ohne die gesamte Mischung neu aufmachen zu müssen.


Erklärung

Grundlegende Stem-Struktur

Die klassische Filmton-Dreiteilung:

D (Dialogue / Dialog): Alle gesprochenen Texte – Originalton-Dialog, ADR, Voiceover, Loop-Group-Material. Der Dialog-Stem hat höchste Priorität: Er darf nie durch andere Elemente verdeckt werden.

M (Music / Musik): Score und lizenzierte Songs. Der Musik-Stem enthält keine Dialog-Elemente – er ist so gemischt, als wäre kein Dialog vorhanden. Dies ermöglicht spätere Lautstärkeanpassungen relativ zum Dialog.

E (Effects / Effekte): Alle Soundeffekte, Foley und Atmo. Der Effekte-Stem enthält ebenfalls keinen Dialog.

Diese Dreiteilung ergibt das M&E (Music & Effects) – den Mix ohne Dialog, der für internationale Synchronfassungen benötigt wird: Synchronstudios im Ausland ersetzen den lokalen Dialog durch eine neue Sprachaufnahme und legen diese über den M&E-Mix.

Erweiterte Stem-Strukturen

Für komplexe Produktionen können Stems weiter unterteilt werden:

Dialog-Ebene:

  • D1: Originalton (Production Sound)
  • D2: ADR
  • D3: Voiceover

Effekte-Ebene:

  • FX1: Hard Effects (Explosionen, Fahrzeuge, etc.)
  • FX2: Foley (Schritte, Bewegungen, Alltagsgeräusche)
  • FX3: Background / Atmo (Umgebungsklänge)
  • FX4: Designed Sounds (spezielle kreierte Klänge)

Musik-Ebene:

  • MUS1: Score (Originalkomposition)
  • MUS2: Source Music (diegetische Musik)

Stems in der Praxis

Lieferformat: Professionelle Filmproduktionen liefern mehrere Ausgabeformate:

  • 5.1 Full Mix: Vollständiger Mix in 5.1 Surround
  • 5.1 M&E: Musik und Effekte ohne Dialog in 5.1
  • Stereo Full Mix: Downmix für TV, Streaming, DVD
  • Stereo M&E: Musik und Effekte in Stereo
  • Dolby Atmos Master: Für Kino und Atmos-fähige Plattformen
  • Einzelne Stems (D, M, E): Für maximale Flexibilität

Versionierung: Verschiedene Versionen des Films für verschiedene Plattformen erfordern unterschiedliche Mixes:

  • Theatrical Version: Volle Kinodynamik
  • Broadcast Version: EBU R128 normiert, reduzierte Dynamik
  • Airline Version: Bereinigt (ohne Profanität), angepasste Lautheit
  • Kids Version: Bestimmte Szenen akustisch entschärft

Mit gut erstellten Stems können diese Versionen effizient aus dem Ursprungsmaterial erstellt werden, ohne das gesamte Material neu aufmachen zu müssen.

Technische Anforderungen

Stem-Qualität: Stems werden typischerweise als 24-Bit/48 kHz Broadcast-WAV oder als AES31-konforme Dateien geliefert. Für Dolby Atmos Stems gelten spezifische Formatanforderungen.

Stem-Alignment: Alle Stems müssen absolut sample-genau synchron sein, damit sie ohne Drift übereinandergelegt werden können.

Checksum-Verification: Bei der Lieferung werden Hash-Werte (z. B. MD5-Checksums) mitgeliefert, um die Integrität der Dateien bei der Übertragung zu prüfen.

Stem Mixing für Musik

Im Musik-Bereich werden Stems ebenfalls genutzt, haben aber eine andere Bedeutung:

  • Stem-Mixe bestehen aus Gruppenspuren (Drums, Bass, Synths, Vocals etc.)
  • Sie werden für Remix-Projekte, Sample-Packs oder für den Live-Einsatz auf Bühnen genutzt
  • Plattformen wie Splice bieten Stem-Downloads für Produzenten

Beispiele

Internationale Synchronisation: Ein deutschsprachiger Kinofilm für den Export in die USA erhält einen M&E-Mix. Das amerikanische Studio nimmt englische Synchronstimmen auf und legt sie über den M&E. Kein Element des deutschen Originals bleibt im fertigen amerikanischen Cut – außer dem M&E-Tonbett.

Netflix-Lieferstandards: Netflix schreibt detaillierte Spezifikationen für Stem-Lieferungen vor. Produzenten müssen Dialog-, Musik- und Effekt-Stems in definierter Qualität und in Atmos-Format liefern, damit Netflix globale Versionen erstellen kann.


In der Praxis

Pro Tools Session-Aufbau für Stem-Mixing:

In Pro Tools (Standard-DAW für Filmpostproduktion) werden typischerweise separate Busse für D, M und E eingerichtet. Alle Dialog-Spuren routen auf den Dialog-Bus, Musik auf den Musik-Bus etc. Die Stem-Ausgabe erfolgt parallel zum Full Mix.

Stem-Bounce: Beim Finalisieren werden alle Stems simultan aus derselben Session gebounced (ausgespielt), um sicherzustellen, dass Full Mix und Stems zueinander kompatibel sind.


Vergleich & Abgrenzung

BegriffInhaltVerwendung
Full MixAlle Elemente zusammenPrimäre Ausgabe
M&EMusik + Effekte, kein DialogInternationale Synchronfassung
Dialog StemNur DialogSprachversionen, EBU-Anpassung
Musik StemNur MusikMusikrechte, Versionen
Effekte StemNur SFX, Foley, AtmoVertonung von Stummversionen

Häufige Fragen (FAQ)

Warum ist ein sauber gemischter M&E so wichtig? Beim M&E müssen alle Elemente, die normalerweise hinter dem Dialog liegen, in der richtigen Lautstärke präsent sein. Wenn Atmo-Geräusche oder Musik-Elemente im Full Mix vom Dialog maskiert wurden und im M&E nicht korrekt angepasst wurden, entstehen im internationalen Mix akustische Lücken.

Wie viele Stems sind Standard? Für einfache TV-Produktionen: D, M, E (3 Stems). Für Kinoproduktionen: 6–12 Stems in verschiedenen Formaten plus Full Mix plus M&E. Für Atmos-Produktionen kommen weitere Ausgaben hinzu.


Verwandte Einträge


Weiterführend

  • Yewdall, David Lewis (2011): Practical Art of Motion Picture Sound. 4. Aufl., Focal Press.
  • Sonnenschein, David (2001): Sound Design: The Expressive Power of Music, Voice, and Sound Effects in Cinema. Michael Wiese Productions.
  • Netflix (2023): Netflix Sound Mix Specifications. [technische Dokumentation, online].
  • EBU Tech 3285 (2011): Specification of the Broadcast Wave Format (BWF). European Broadcasting Union.
← Zurück zu Film & Mediendesign
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar