Sample-Rate und Bit-Depth sind die zwei fundamentalen Parameter der digitalen Audioaufzeichnung: Die Sample-Rate bestimmt, wie oft pro Sekunde gemessen wird; die Bit-Depth bestimmt, wie präzise jede Messung ist.
Rubrik: Audio & Podcast · Unterrubrik: Audio-Grundlagen · Niveau: Einsteiger Synonyme / Auch bekannt als: Abtastrate, Sampling-Frequenz, Auflösung, Wortbreite, Bittiefe
Was ist Sample-Rate und Bit-Depth?
Wenn ein analoges Audiosignal – z. B. die Schwingungen eines Mikrofons – in digitale Daten umgewandelt wird, muss dieser kontinuierliche Klang in eine Reihe diskreter Messwerte (Samples) zerlegt werden. Wie oft diese Messung stattfindet, legt die Sample-Rate fest. Wie präzise jede einzelne Messung kodiert wird, bestimmt die Bit-Depth. Beide Parameter zusammen definieren die klangliche Qualität und den Datenbedarf einer digitalen Audioaufnahme.
Erklärung
Sample-Rate (Abtastrate)
Die Sample-Rate gibt an, wie viele Messwerte (Samples) pro Sekunde erfasst werden. Die Einheit ist kHz (Kilohertz).
Das Nyquist-Shannon-Abtasttheorem ist der mathematische Grundsatz dahinter: Um eine Frequenz korrekt zu digitalisieren, muss die Abtastrate mindestens doppelt so hoch sein wie die höchste aufzuzeichnende Frequenz.
- Menschlicher Hörbereich: bis ca. 20 kHz
- Notwendige Sample-Rate: mindestens 40 kHz
- Deshalb wurde die CD-Norm auf 44,1 kHz festgelegt (etwas Puffer)
Gängige Sample-Rates:
| Sample-Rate | Nyquist-Frequenz | Typischer Einsatz |
|---|---|---|
| 44,1 kHz | 22,05 kHz | CD, Musik-Release, Streaming |
| 48 kHz | 24 kHz | Video/Film, Broadcast, Podcast |
| 96 kHz | 48 kHz | Hochauflösende Musik, Filmton |
| 192 kHz | 96 kHz | Archivierung, forensische Zwecke |
Warum 48 kHz statt 44,1 kHz für Video? Die Videowelt hat sich historisch auf 48 kHz als Standard geeinigt (DV, HDMI, Broadcast). Wenn Audio für ein Videoprojekt aufgenommen wird, sollte bereits bei 48 kHz aufgenommen werden – eine nachträgliche Konvertierung (Sample-Rate-Conversion) kann minimalste Qualitätsverluste erzeugen.
Höhere Sample-Rates: Wann sinnvoll? 96 kHz oder 192 kHz bieten vor allem einen Vorteil: mehr Spielraum bei der digitalen Bearbeitung. Pitch-Shifting und Time-Stretching arbeiten bei höheren Sample-Rates mit weniger Artefakten. Für die menschliche Wahrnehmung im Endprodukt sind Frequenzen über 20 kHz jedoch irrelevant – und Studien zeigen keinen nachweisbaren Hörunterschied bei unkomprimiertem 48 kHz vs. 96 kHz Material (Reiss, 2016).
Bit-Depth (Bittiefe)
Die Bit-Depth bestimmt, wie viele verschiedene Pegelwerte jedes Sample annehmen kann. Je mehr Bits, desto mehr Abstufungen stehen zur Verfügung.
Mathematischer Hintergrund:
- 16 Bit: 2^16 = 65.536 mögliche Pegelwerte → ca. 96 dB dynamischer Umfang
- 24 Bit: 2^24 = 16.777.216 mögliche Pegelwerte → ca. 144 dB dynamischer Umfang
- 32 Bit Float: Gleitkomma-Format, theoretisch ca. 1.528 dB – in DAWs für die interne Verarbeitung genutzt
Dynamischer Umfang ist der Unterschied zwischen dem leisesten und lautesten möglichen Signal. Mit 16 Bit lassen sich 96 dB Dynamik darstellen – das reicht für Musik-CDs. Mit 24 Bit stehen 144 dB zur Verfügung, was deutlich mehr Spielraum für leise Passagen und Peaks lässt.
Quantisierungsrauschen: Wenn ein Signal zu wenig Bits hat, entsteht Quantisierungsrauschen – ein leises, charakteristisches Rauschen bei sehr leisen Signalen. Mit 24 Bit ist dieses Rauschen bei -144 dBFS so leise, dass es in der Praxis keine Rolle spielt (Hintergrundgeräusche liegen typischerweise über -60 dBFS).
Dithering
Dithering ist ein Verfahren, das beim Konvertieren von 24 Bit auf 16 Bit (z. B. beim Erstellen einer Audio-CD) angewendet wird. Anstatt die unteren 8 Bits schlicht abzuschneiden, wird gezieltes Rauschen hinzugefügt, das das Quantisierungsrauschen gleichmäßiger verteilt und dadurch weniger störend klingt.
- Dithering ist nur beim finalen Export auf 16 Bit nötig
- In der DAW selbst sollte nie mit 16 Bit gearbeitet werden
- Gängige Dithering-Algorithmen: TPDF (Triangular Probability Density Function), POW-r, UV22HR
Beispiele
- Podcast-Aufnahme: Aufnahme in 48 kHz / 24 Bit, da das Projekt für YouTube und Video-Plattformen bestimmt ist. Finaler Export als MP3 in 128 kbps nach Abschluss der Bearbeitung.
- Musik-Produktion: Eine Band nimmt in Logic Pro bei 48 kHz / 24 Bit auf. Für das CD-Master wird auf 44,1 kHz / 16 Bit mit Dithering konvertiert.
- Film-Ton: Der Tontechniker am Set arbeitet mit einem Zoom F6 Field-Recorder bei 96 kHz / 32 Bit Float. Die hohe Bit-Depth verhindert, dass unvorhergesehene Pegelspitzen clipping erzeugen.
- Archivierung: Ein Radiostudio digitalisiert alte Bandaufnahmen in 96 kHz / 24 Bit für die Langzeitarchivierung, um zukünftige Formate flexibel unterstützen zu können.
- Fehler in der Praxis: Ein Einsteiger nimmt einen Podcast in 8 kHz / 8 Bit auf (Standard auf alten Smartphones) – das Ergebnis klingt deutlich dumpfer und rauschender als eine 48 kHz / 24 Bit Aufnahme.
In der Praxis
Empfehlung für unterschiedliche Anwendungen:
- Podcast (nur Audio): 44,1 kHz oder 48 kHz / 24 Bit für die Aufnahme; Export als MP3 in 128 kbps (Mono) oder 192 kbps (Stereo)
- Video-Content: 48 kHz / 24 Bit (entspricht Broadcast-Standard)
- Musik-Produktion: 48 kHz / 24 Bit als guten Kompromiss; 96 kHz nur wenn Pitch-Shifting/Time-Stretching geplant
- Archivierung: FLAC mit 96 kHz / 24 Bit für maximale Zukunftssicherheit
Typischer Fehler: Zu viel Speicher sparen, indem 16 Bit bereits in der Aufnahme gewählt wird. Bei 16 Bit ist der Dynamikspielraum so gering, dass laute Passagen schnell clippen oder leise Passagen im Rauschen verschwinden.
Vergleich & Abgrenzung
Sample-Rate beeinflusst: Übertragbarer Frequenzbereich (Nyquist), Dateigröße, CPU-Last in der DAW
Bit-Depth beeinflusst: Dynamischer Umfang, Qualität bei leisen Signalen, Quantisierungsrauschen
Was ist wichtiger? Für Sprachaufnahmen (Podcast, Voice-Over) ist die Bit-Depth meist wichtiger als eine höhere Sample-Rate über 48 kHz, da Sprache selten Frequenzen über 16 kHz enthält, aber dynamische Variationen häufig auftreten.
Häufige Fragen (FAQ)
Muss ich in 96 kHz aufnehmen, wenn ich hochwertige Musik produzieren will? Nein, das ist ein weit verbreiteter Mythos. Eine Studie von Joshua Reiss am Queen Mary Institute (2016) analysierte 80 wissenschaftliche Studien und fand keinen konsistenten, reproduzierbaren Hörunterschied zwischen 44,1 kHz und 96 kHz für Musik. 48 kHz / 24 Bit ist der praxisbewährte Standard für professionelle Musikproduktion.
Kann ich in 44,1 kHz und der Kollege in 48 kHz aufnehmen und dann zusammenschneiden? Technisch geht es, aber es erfordert eine Sample-Rate-Conversion (SRC) für eine der Dateien. Moderne DAWs können das automatisch, es entstehen jedoch minimal hörbare Unterschiede. Besser: vorher auf eine gemeinsame Sample-Rate einigen.
Was ist 32 Bit Float? 32 Bit Float ist ein Gleitkomma-Datenformat, das intern in vielen DAWs genutzt wird. Es hat den Vorteil, dass selbst übersteuertes Signal (Clipping) keine dauerhaften Verluste erzeugt – ein nachträgliches Absenken des Pegels stellt die Information wieder her. Für Aufnahmen auf modernen Field-Recordern (Zoom F6, Sony PCM-D100) ermöglicht es sogenannte „clipping-freie" Aufnahmen.
Verwandte Einträge
- Audio-Formate – Welche Dateiformate welche Sample-Rates unterstützen
- Schall-Grundlagen – Physikalische Basis des Hörbereichs (20 Hz – 20 kHz)
- DAW-Überblick – Wie Sample-Rate und Bit-Depth in der DAW eingestellt werden
Weiterführend
- Reiss, Joshua D. (2016): „A Meta-Analysis of High Resolution Audio Perceptual Evaluation". In: Journal of the Audio Engineering Society, 64(6), S. 364–379.
- Pohlmann, Ken C. (2010): Principles of Digital Audio. 6. Aufl., McGraw-Hill.
- Watkinson, John (2001): The Art of Digital Audio. 3. Aufl., Focal Press.
