Ambisonics ist ein sphärisches Audiokodierungsverfahren, das Klänge aus allen Richtungen des dreidimensionalen Raums in einem mathematisch definierten Kanalformat (B-Format) erfasst, entwickelt von Michael Gerzon und der National Research Development Corporation ab 1970, eingesetzt für 360°-Video, VR-Audio, Rundfunk und immersive Installationen.
Was ist Ambisonics?
Ambisonics unterscheidet sich fundamental von anderen Mehrkanal-Formaten wie Dolby Surround oder DTS: Während diese Formate Lautsprecher-Kanäle für bestimmte Positionen kodieren (Front-Links, Center, Surround usw.), kodiert Ambisonics das gesamte Schallfeld mathematisch – als sphärische Harmonische. Das ermöglicht, dasselbe B-Format-Signal auf beliebige Lautsprecherkonfigurationen zu rendern: 2-Kanal-Stereo, 5.1, 7.1, 22.2 oder binaural für Kopfhörer.
Das Grundprinzip: Ein Ambisonics-Signal der ersten Ordnung (FOA) besteht aus vier Kanälen:
- W (omnidirektional): Enthält den Gesamtpegel des Schallfeldes
- X (Vorne-Hinten): Druckgradient der Längsachse
- Y (Links-Rechts): Druckgradient der Querachse
- Z (Oben-Unten): Druckgradient der Hochachse
Aus diesen vier Kanälen lässt sich jede Schallquellenrichtung im 3D-Raum berechnen und auf Lautsprecher oder Kopfhörer rendern.
Höhere Ordnungen (HOA – Higher Order Ambisonics):
- 1. Ordnung (FOA): 4 Kanäle – grundlegende Richtungsauflösung
- 2. Ordnung: 9 Kanäle – bessere Richtungsauflösung
- 3. Ordnung: 16 Kanäle – hohe Präzision
- N-te Ordnung: (N+1)² Kanäle
YouTube und Facebook (Meta) nutzen FOA (4 Kanäle) für 360°-Video; Profianwendungen nutzen oft 3. Ordnung (16 Kanäle) für Kino und VR.
Technische Details
| Merkmal | 1. Ordnung (FOA) | 3. Ordnung (3OA) |
|---|---|---|
| Kanäle | 4 | 16 |
| Richtungsauflösung | ±20° | ±7° |
| Kanalbezeichnungen | W, X, Y, Z | ACN-Nummerierung (0–15) |
| Normierung | FuMa (legacy), AmbiX/SN3D | AmbiX/SN3D |
| Dateiformat | WAV (4-Kanal) | WAV (16-Kanal) |
| Samplingrate | 48.000 Hz (typisch) | 48.000 Hz |
| Bittiefe | 24 Bit (empfohlen) | 24 Bit |
| Container | Mehrkanaliges WAV | Mehrkanaliges WAV |
Wichtige Normierungen:
- FuMa (Furse-Malham): Älteres britisches Format (W, X, Y, Z); noch in vielen Legacy-Mikrofonen
- AmbiX / SN3D: Modernes Google/YouTube-Format; Standard für neue Produktionen
- ACN-Kanalreihenfolge: Moderne Nummerierung 0, 1, 2... statt W, X, Y, Z
B-Format-Mikrofone:
- Sennheiser Ambeo (Soundfield-Mikrofon für YouTube/VR)
- Zoom H3-VR (Consumer-Budget)
- Rode NT-SF1 (Prosumer)
- SoundField SPS200 (Profi)
Diese Mikrofone enthalten 4 Kapsel-Arrays (Tetrahedral-Konfiguration) und liefern das A-Format, das softwaregestützt in B-Format (AmbiX) konvertiert wird.
Beispiele (5 Anwendungsfälle)
- YouTube-360°-Videos: YouTube unterstützt nativ Ambisonics FOA als Spatial Audio für 360°-Videos. Produzenten nehmen mit einem B-Format-Mikrofon auf, konvertieren das Signal in AmbiX und betten es als 4-Kanal-WAV in die 360°-Video-Datei ein. YouTube rendert es dann für Kopfhörer (binaural) oder externe Lautsprecher.
- VR-Spiele und Applikationen: Unity und Unreal Engine unterstützen Ambisonics-Streams für VR-Anwendungen. Umgebungsgeräusche werden als Ambisonics-Streams kodiert, die in Echtzeit auf die Kopfausrichtung des VR-Nutzers (gemessen via Headset) angepasst werden – für vollständige Immersion.
- BBC Sound Effects Library (HOA): Die BBC erfasst Originalatmosphären und Umgebungsgeräusche für ihre Archivbibliothek zunehmend in höherer Ambisonics-Ordnung. Das ermöglicht spätere Verwendung in Surround, Stereo und zukünftigen räumlichen Formaten aus einem einzigen Aufnahmequelle.
- Kunstinstallationen und Klangkunst: Ambisonics ermöglicht Klangkünstlern, vollständig dreidimensionale Klangrauminstallationen zu schaffen. Mit Lautsprecherkugeln (z. B. 8 Lautsprecher in einem Würfel) wird das Schallfeld reproduziert; Klang scheint aus beliebiger Richtung zu kommen.
- Rundfunk (Radio): Der IRT (Institut für Rundfunktechnik) und die EBU experimentieren mit Ambisonics für Next-Generation-Radio-Produktionen. Kopfhörer-Nutzer können das räumliche Audio erleben; Stereo-Hörer erhalten automatisch einen kompatiblen Downmix.
In der Praxis
Wann Ambisonics einsetzen:
- Für 360°-Video-Produktionen (YouTube, Facebook, Oculus)
- Bei VR-Entwicklung mit räumlichem Audio
- Für Klangkunstinstallationen mit flexibler Lautsprecherausgabe
- Wenn das Schallfeld ohne Vorentscheidung über Ausgabe-Konfiguration aufgezeichnet werden soll
Wann Ambisonics nicht einsetzen:
- Für traditionelle Stereo- oder 5.1-Produktion (direktere Methoden)
- Wenn spezifische Lautsprecher-Kanäle exakt kontrolliert werden müssen
- Für einfache Stereo-Podcasts oder Hörspiele
Software-Unterstützung:
- Reaper mit IEM Plug-in Suite (kostenlos, IEM Graz): Vollständige HOA-Produktion, Encoding, Binaural-Rendering
- Ambix-Plugin-Suite (kostenlos): B-Format-Konvertierung, Encoder/Decoder
- Pro Tools mit SPAT Revolution (Flux::): Professionelle Ambisonics-Mischung
- Spatial Audio Designer (Nokia): Ambisonics-Monitoring und Rendering
- DearVR Spatial Connect: VR-Ambisonics-Integration für DAWs
- Google Spatial Media: Metadaten-Tool für YouTube-360°-Audio-Einbettung
Vergleich & Abgrenzung
| System | Ansatz | Skalierbarkeit | Objekte | VR-eignung |
|---|---|---|---|---|
| Ambisonics B-Format | Sphärisches Schallfeld | Sehr hoch | Unbegrenzt | Ideal |
| Dolby Atmos | Objekte + Bed | Hoch | 128 (Kino) | Gut |
| 5.1 / 7.1 | Kanal-basiert | Gering | — | Begrenzt |
| Binaural Stereo | Kopfhörer-optimiert | Keine | — | Gut |
Ambisonics vs. Dolby Atmos: Beide sind räumlich, aber konzeptionell verschieden. Atmos ist objektorientiert (einzelne Klangelemente mit Koordinaten), Ambisonics ist schallfeld-basiert (das gesamte akustische Umfeld). Ambisonics eignet sich besser für natürliche Atmosphären und Umgebungen; Atmos für präzise positionierte Einzelquellen in gemischten Produktionen.
Häufige Fragen (FAQ)
Was ist der Unterschied zwischen A-Format und B-Format? A-Format ist das rohe Ausgangssignal eines Tetrahedral-Mikrofons mit vier Kapseln (FLU, FRD, BLD, BRU: Front-Left-Up, Front-Right-Down, Back-Left-Down, Back-Right-Up). B-Format ist das mathematisch verarbeitete Ergebnis nach der "Matrizierung" dieser vier Rohsignale zu W, X, Y, Z (AmbiX: 0, 1, 2, 3). Für die Weitergabe und Bearbeitung wird immer B-Format verwendet; A-Format ist nur das Mikrofon-Ausgangssignal.
Kann ich ein gewöhnliches Stereosignal in Ambisonics umwandeln? Nein – echte Ambisonics-Aufnahmen entstehen aus speziellen Mikrofonen (oder Lautsprecher-basierten Synthesen). Eine Stereo-zu-Ambisonics-Konvertierung erzeugt kein echtes räumliches Schallfeld, sondern "Pseudo-Ambisonics" – der Klang sitzt dann in der horizontalen Ebene vor dem Hörer, ohne echte Raumtiefe. Für authentisches Ambisonics wird eine echte Sphären- oder Tetrahedral-Aufnahme benötigt.
Verwandte Einträge
- Dolby Atmos Format – Objektbasiertes 3D-Audio
- WAV-Format – Container für Ambisonics-Dateien
- Broadcast WAV (BWF) – Profi-Container mit Metadaten
Weiterführend
- Zotter, Franz & Frank, Matthias (2019): Ambisonics – A Practical 3D Audio Theory for Recording, Studio Production, Sound Reinforcement, and Virtual Reality. Springer Open Access.
- IEM Plug-in Suite (kostenlos): plugins.iem.at
- Google Spatial Media Tools: github.com/google/spatial-media
- EBU Tech 3393: Spatial Audio for Broadcasting.
