Sample-Rate und Bit-Depth

Sample-Rate und Bit-Depth sind die zwei fundamentalen Parameter der digitalen Audioaufzeichnung: Die Sample-Rate bestimmt, wie oft pro Sekunde gemessen wird; die Bit-Depth bestimmt, wie präzise jede Messung ist.

Rubrik: Audio & Podcast · Unterrubrik: Audio-Grundlagen · Niveau: Einsteiger Synonyme / Auch bekannt als: Abtastrate, Sampling-Frequenz, Auflösung, Wortbreite, Bittiefe

Was ist Sample-Rate und Bit-Depth?

Wenn ein analoges Audiosignal – z. B. die Schwingungen eines Mikrofons – in digitale Daten umgewandelt wird, muss dieser kontinuierliche Klang in eine Reihe diskreter Messwerte (Samples) zerlegt werden. Wie oft diese Messung stattfindet, legt die Sample-Rate fest. Wie präzise jede einzelne Messung kodiert wird, bestimmt die Bit-Depth. Beide Parameter zusammen definieren die klangliche Qualität und den Datenbedarf einer digitalen Audioaufnahme.

Erklärung

Sample-Rate (Abtastrate)

Die Sample-Rate gibt an, wie viele Messwerte (Samples) pro Sekunde erfasst werden. Die Einheit ist kHz (Kilohertz).

Das Nyquist-Shannon-Abtasttheorem ist der mathematische Grundsatz dahinter: Um eine Frequenz korrekt zu digitalisieren, muss die Abtastrate mindestens doppelt so hoch sein wie die höchste aufzuzeichnende Frequenz.

Menschlicher Hörbereich: bis ca. 20 kHz
Notwendige Sample-Rate: mindestens 40 kHz
Deshalb wurde die CD-Norm auf 44,1 kHz festgelegt (etwas Puffer)

Gängige Sample-Rates:

Sample-Rate	Nyquist-Frequenz	Typischer Einsatz
44,1 kHz	22,05 kHz	CD, Musik-Release, Streaming
48 kHz	24 kHz	Video/Film, Broadcast, Podcast
96 kHz	48 kHz	Hochauflösende Musik, Filmton
192 kHz	96 kHz	Archivierung, forensische Zwecke

Warum 48 kHz statt 44,1 kHz für Video? Die Videowelt hat sich historisch auf 48 kHz als Standard geeinigt (DV, HDMI, Broadcast). Wenn Audio für ein Videoprojekt aufgenommen wird, sollte bereits bei 48 kHz aufgenommen werden – eine nachträgliche Konvertierung (Sample-Rate-Conversion) kann minimalste Qualitätsverluste erzeugen.

Höhere Sample-Rates: Wann sinnvoll? 96 kHz oder 192 kHz bieten vor allem einen Vorteil: mehr Spielraum bei der digitalen Bearbeitung. Pitch-Shifting und Time-Stretching arbeiten bei höheren Sample-Rates mit weniger Artefakten. Für die menschliche Wahrnehmung im Endprodukt sind Frequenzen über 20 kHz jedoch irrelevant – und Studien zeigen keinen nachweisbaren Hörunterschied bei unkomprimiertem 48 kHz vs. 96 kHz Material (Reiss, 2016).

Bit-Depth (Bittiefe)

Die Bit-Depth bestimmt, wie viele verschiedene Pegelwerte jedes Sample annehmen kann. Je mehr Bits, desto mehr Abstufungen stehen zur Verfügung.

Mathematischer Hintergrund:

16 Bit: 2^16 = 65.536 mögliche Pegelwerte → ca. 96 dB dynamischer Umfang
24 Bit: 2^24 = 16.777.216 mögliche Pegelwerte → ca. 144 dB dynamischer Umfang
32 Bit Float: Gleitkomma-Format, theoretisch ca. 1.528 dB – in DAWs für die interne Verarbeitung genutzt

Dynamischer Umfang ist der Unterschied zwischen dem leisesten und lautesten möglichen Signal. Mit 16 Bit lassen sich 96 dB Dynamik darstellen – das reicht für Musik-CDs. Mit 24 Bit stehen 144 dB zur Verfügung, was deutlich mehr Spielraum für leise Passagen und Peaks lässt.

Quantisierungsrauschen: Wenn ein Signal zu wenig Bits hat, entsteht Quantisierungsrauschen – ein leises, charakteristisches Rauschen bei sehr leisen Signalen. Mit 24 Bit ist dieses Rauschen bei -144 dBFS so leise, dass es in der Praxis keine Rolle spielt (Hintergrundgeräusche liegen typischerweise über -60 dBFS).

Dithering

Dithering ist ein Verfahren, das beim Konvertieren von 24 Bit auf 16 Bit (z. B. beim Erstellen einer Audio-CD) angewendet wird. Anstatt die unteren 8 Bits schlicht abzuschneiden, wird gezieltes Rauschen hinzugefügt, das das Quantisierungsrauschen gleichmäßiger verteilt und dadurch weniger störend klingt.

Dithering ist nur beim finalen Export auf 16 Bit nötig
In der DAW selbst sollte nie mit 16 Bit gearbeitet werden
Gängige Dithering-Algorithmen: TPDF (Triangular Probability Density Function), POW-r, UV22HR

Beispiele

Podcast-Aufnahme: Aufnahme in 48 kHz / 24 Bit, da das Projekt für YouTube und Video-Plattformen bestimmt ist. Finaler Export als MP3 in 128 kbps nach Abschluss der Bearbeitung.
Musik-Produktion: Eine Band nimmt in Logic Pro bei 48 kHz / 24 Bit auf. Für das CD-Master wird auf 44,1 kHz / 16 Bit mit Dithering konvertiert.
Film-Ton: Der Tontechniker am Set arbeitet mit einem Zoom F6 Field-Recorder bei 96 kHz / 32 Bit Float. Die hohe Bit-Depth verhindert, dass unvorhergesehene Pegelspitzen clipping erzeugen.
Archivierung: Ein Radiostudio digitalisiert alte Bandaufnahmen in 96 kHz / 24 Bit für die Langzeitarchivierung, um zukünftige Formate flexibel unterstützen zu können.
Fehler in der Praxis: Ein Einsteiger nimmt einen Podcast in 8 kHz / 8 Bit auf (Standard auf alten Smartphones) – das Ergebnis klingt deutlich dumpfer und rauschender als eine 48 kHz / 24 Bit Aufnahme.

In der Praxis

Empfehlung für unterschiedliche Anwendungen:

Podcast (nur Audio): 44,1 kHz oder 48 kHz / 24 Bit für die Aufnahme; Export als MP3 in 128 kbps (Mono) oder 192 kbps (Stereo)
Video-Content: 48 kHz / 24 Bit (entspricht Broadcast-Standard)
Musik-Produktion: 48 kHz / 24 Bit als guten Kompromiss; 96 kHz nur wenn Pitch-Shifting/Time-Stretching geplant
Archivierung: FLAC mit 96 kHz / 24 Bit für maximale Zukunftssicherheit

Typischer Fehler: Zu viel Speicher sparen, indem 16 Bit bereits in der Aufnahme gewählt wird. Bei 16 Bit ist der Dynamikspielraum so gering, dass laute Passagen schnell clippen oder leise Passagen im Rauschen verschwinden.

Vergleich & Abgrenzung

Sample-Rate beeinflusst: Übertragbarer Frequenzbereich (Nyquist), Dateigröße, CPU-Last in der DAW

Bit-Depth beeinflusst: Dynamischer Umfang, Qualität bei leisen Signalen, Quantisierungsrauschen

Was ist wichtiger? Für Sprachaufnahmen (Podcast, Voice-Over) ist die Bit-Depth meist wichtiger als eine höhere Sample-Rate über 48 kHz, da Sprache selten Frequenzen über 16 kHz enthält, aber dynamische Variationen häufig auftreten.

Häufige Fragen (FAQ)

Muss ich in 96 kHz aufnehmen, wenn ich hochwertige Musik produzieren will? Nein, das ist ein weit verbreiteter Mythos. Eine Studie von Joshua Reiss am Queen Mary Institute (2016) analysierte 80 wissenschaftliche Studien und fand keinen konsistenten, reproduzierbaren Hörunterschied zwischen 44,1 kHz und 96 kHz für Musik. 48 kHz / 24 Bit ist der praxisbewährte Standard für professionelle Musikproduktion.

Kann ich in 44,1 kHz und der Kollege in 48 kHz aufnehmen und dann zusammenschneiden? Technisch geht es, aber es erfordert eine Sample-Rate-Conversion (SRC) für eine der Dateien. Moderne DAWs können das automatisch, es entstehen jedoch minimal hörbare Unterschiede. Besser: vorher auf eine gemeinsame Sample-Rate einigen.

Was ist 32 Bit Float? 32 Bit Float ist ein Gleitkomma-Datenformat, das intern in vielen DAWs genutzt wird. Es hat den Vorteil, dass selbst übersteuertes Signal (Clipping) keine dauerhaften Verluste erzeugt – ein nachträgliches Absenken des Pegels stellt die Information wieder her. Für Aufnahmen auf modernen Field-Recordern (Zoom F6, Sony PCM-D100) ermöglicht es sogenannte „clipping-freie" Aufnahmen.

Weiterführend

Reiss, Joshua D. (2016): „A Meta-Analysis of High Resolution Audio Perceptual Evaluation". In: Journal of the Audio Engineering Society, 64(6), S. 364–379.
Pohlmann, Ken C. (2010): Principles of Digital Audio. 6. Aufl., McGraw-Hill.
Watkinson, John (2001): The Art of Digital Audio. 3. Aufl., Focal Press.

Was ist Sample-Rate und Bit-Depth?

Erklärung

Sample-Rate (Abtastrate)

Bit-Depth (Bittiefe)

Dithering

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sample-Rate und Bit-Depth

Was ist Sample-Rate und Bit-Depth?

Erklärung

Sample-Rate (Abtastrate)

Bit-Depth (Bittiefe)

Dithering

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.