Direct Stream Digital

DSD-Logo
Vergleich von PCM und DSD

DSD (Direct Stream Digital) ist eine Methode der digitalen Audiosignalspeicherung, die auf dem Prinzip der Pulsdichtemodulation beruht. DSD ist zudem eine eingetragene Marke der Sony Corporation.[1]

Angewendet wird das DSD-Verfahren hauptsächlich bei der Super-Audio-CD (SACD). Gespeichert wird dabei der direkte Datenstrom eines Delta-Sigma-Modulators (genauer das Ausgangssignal der Rückkopplungsschleife des Modulators), der mit 2,8224 MHz arbeitet; das entspricht dem 64-fachen (DSD64) der Abtastrate von 44,1 kHz, die auch bei der Audio-CD (Red-Book-CDDA) verwendet wird, welche mit linearer 16-bit-Puls-Code-Modulation (PCM) arbeitet. Höher auflösende DSD-Versionen verwenden eine bis zu 512-fache Abtastung (DSD128, DSD256, DSD512).

Grundsätzlich lässt sich ein DSD-Datenstrom auf jedem beliebigen digitalen Speichermedium ausreichender Größe speichern. Entsprechende Dateien können von Musik-Download-Portalen bezogen werden.[2]

Funktion

Der durch die Delta-Sigma-Modulation gewonnene Ein-Bit-Datenstrom wird direkt aufgezeichnet, statt ihn – wie in klassischen Analog-Digital-Umsetzern üblich – intern zu dezimieren und mit geringerer Rate als Datenwort mit 16, oder 24 Bit Breite als PCM auszugeben. Durch die Überabtastung sind die gespeicherten Audioinformationen technisch präziser als nach PCM aufgezeichnete Daten, da noch keine Quantisierung auf die Abtastrate erfolgt. Bei der Digital-Analog-Wandlung werden keine steilflankigen Interpolations- und Anti-Aliasing-Filter benötigt, die bei PCM dazu verwendet werden, Frequenzen oberhalb 20 kHz abzutrennen.

Stattdessen kann das DSD-Format direkt ausgegeben werden, weil das entstehende Oberwellenspektrum weit im unhörbaren Bereich liegt. Durch die grundsätzlich geringe Dynamik eines Sigma-Delta-Analog-Digital-Wandlers mit nur einem Bit als Quantisierungsstufe entsteht zwar ein enormes Wandlungsrauschen, das aber durch den Effekt des Noise Shaping in den hochfrequenten Bereich verschoben ist. Bildlich lässt sich das Signal so begreifen, dass durch rasches Wechseln von Plus und Minus an einem Lautsprecher mit unterschiedlich langen Vorwärts-Rückwärtsphasen letztlich der Verlauf des Tonsignals nachgebildet wird. Durch das real aber immer vorhandene Tiefpassverhalten des Wiedergabesystems und besonders das der Lautsprechermembranen erfolgt eine Bandbegrenzung. Weiter spielen auch die Trägheit der Luft und des Gehörs eine Rolle, welche die Wellen zunehmen stark dämpfen, sodass letztlich nur das gewünschte Audiospektrum wahrnehmbar ist.

Kritik

Vor- und Nachteile von DSD wurden in der Fachwelt zu Beginn des Jahrtausends kontrovers diskutiert. Einige Wissenschaftler kritisierten es als "ungeeignet für Hochqualitätsanwendungen"[3] oder "völlig unpassend für hochauflösendes Audio"[4], andere hingegen[5] verteidigten die Technologie. Ein Konsens hat sich in der Wissenschaft bisher nicht gebildet.

Es ist umstritten, ob die von Entwicklern und Anwendern behauptete Klangverbesserung von DSD gegenüber PCM tatsächlich existiert. In einer Studie der Hochschule für Musik Detmold konnten die Teilnehmer bei entsprechenden Blindtests keine statistisch relevanten Unterschiede zwischen den Datenformaten hören. Die Autoren der Studie ziehen das Fazit, „dass selbst mit hochwertigstem Equipment unter optimalen Abhörbedingungen und unterschiedlichsten Hörfokussierungen bzw. Hörerfahrungen der Probanden in der Regel keine signifikanten Unterschiede zwischen DSD und High Resolution PCM (24 Bit/176,4 kHz) hörbar sind, sich demzufolge die These aufstellen ließe, dass sich keines der getesteten Systeme durch klangliche Eigenschaften hervorhebt“, und verweisen auf „das hohe Maß an Frustration, das viele Probanden, die in der Mehrzahl professionelles und kritisch-analytisches Hören gewohnt waren, während der Durchführung der Tests empfanden und das sie auf für sie nicht annähernd zu erkennende klangliche Unterschiede zurückführten“.[6]

In einer Blindstudie der Tokyo University of the Arts gemeinsam mit TEAC 2014 zeigten sich hingegen hörbare Unterschiede.[7] Der Testaufbau und die Neutralität der Autoren wurden jedoch nachträglich kritisiert, da der verwendete DA-Wandler von TEAC selbst stammte und einseitig auf DSD optimiert sei.[8]

Eine durchgängige DSD-Verarbeitung von der Aufnahme bis zur fertigen Abmischung ist praktisch nicht existent. Zurzeit der Entwicklung der SACD in den 1990er-Jahren wurden in der Aufnahmetechnik Delta-Sigma-Wandler eingesetzt; von diesen konnte das DSD-Signal noch direkt abgegriffen werden. Doch bereits kurz danach begann man, die Original-Aufnahmen per Multibit-Oversampling in PCM zu speichern, Delta-Sigma-Wandler kommen praktisch nicht mehr zum Einsatz. Im Tonstudio werden zur Abmischung zudem fast ausschließlich Digital Audio Workstations benutzt. Auf diesen können 1-Bit-Dateien prinzipbedingt nicht verarbeitet werden. Daher müssten auch native DSD-Aufnahmen immer erst in PCM und später wieder in DSD konvertiert werden. Das Wandeln von DSD in PCM ist verlustfrei möglich, beim Wandeln von PCM in DSD entsteht jedoch verstärktes Quantisierungsrauschen.[9]

Im DSD64-Format ist der Frequenzgang auf etwa 100 kHz ausgeweitet. Der Frequenzbereich oberhalb 20 kHz enthält jedoch kein Nutzsignal, sondern nur das durch Noise Shaping in diesen Bereich verschobene Rauschen, welches bereits bei Frequenzen ab 15 kHz beginnt.[9] Dadurch kann auch der theoretisch mögliche Rauschabstand von 150 dB in der Praxis nicht erreicht werden. Faktisch sind mit modernen Wandlern zwischen 20 und 20.000 Hz nur ca. 120 dB möglich und damit weniger als bei 24-Bit-PCM (144 dB).[9] DSD benötigt daher für einen vergleichbaren Rauschabstand und Frequenzbereich deutlich größere Datenmengen als PCM und ein Vielfaches der Daten, die bei PCM durch verlustfreie Komprimierung z. B. in FLAC möglich sind.[9]

Literatur

  • Thomas Görne: Tontechnik. 1. Auflage, Carl Hanser Verlag, Leipzig 2006, ISBN 3-446-40198-9
  • Hubert Henle: Das Tonstudio-Handbuch. 5. Auflage, GC Carstensen Verlag, München 2001, ISBN 3-910098-19-3

Einzelnachweise

  1. DSD Trademark of Sony Corporation - Registration Number 2229253 - Serial Number 75017088. In: Justia Trademarks. Abgerufen am 3. Juni 2021 (englisch).
  2. Christian Wenger: Direct Stream Digital aus dem Netz - DSD reloaded. In: avguide.ch. 10. Oktober 2013, abgerufen am 3. Juni 2021 (Schweizer Hochdeutsch).
  3. Stanley P. Lipshitz, John Vanderkooy (Audio Research Group, University of Waterloo): Why 1-Bit Sigma-Delta Conversion is Unsuitable for High-Quality Applications. In: Audio Engineering Society Convention Paper. Nr. 5395. Waterloo, Ontario 12. Mai 2001 (sjeng.org [PDF; abgerufen am 3. Juni 2021]).
  4. J. Robert Stuart: Coding for High-Resolution Audio Systems. In: J. Audio Eng. Soc. Band 52, Nr. 3, März 2004, S. 139–142 (rochester.edu [PDF; abgerufen am 3. Juni 2021]).
  5. James Angus: The Effect of Idle Tone Structure on Effective Dither in Delta-Sigma Modulation Systems. Audio Engineering Society, 1. April 2002 (aes.org [abgerufen am 3. Juni 2021]).
  6. Dominik Blech, Min-Chi Yang: Hörvergleich DSD gegen High-Resolution-PCM. Diplomarbeit. Erich-Thienhaus-Institut der Hochschule für Musik Detmold, Detmold 27. Januar 2004 (yumpu.com [abgerufen am 3. Juni 2021]).
  7. Atsushi Marui, Toru Kamekawa, Kazuhiko Endo, Erisa Sato: Subjective Evaluation of High Resolution Recordings in PCM and DSD Audio Formats. Presented at the 136th Convention 2014 April 26–29 Berlin, Germany. In: Convention Paper. Nr. 9019. Audio Engineering Society, Berlin 26. April 2014 (researchgate.net [abgerufen am 3. Juni 2021]).
  8. AES Paper Digest: Subjective Evaluation of High Resolution Recordings in PCM and DSD. Abgerufen am 3. Juni 2021 (amerikanisches Englisch).
  9. a b c d Alexej C. Ogorek: PCM im Vergleich zu DSD. In: Digital Audio Systems. Abgerufen am 3. Juni 2021.

Auf dieser Seite verwendete Medien

PCM-vs-DSD.svg
Autor/Urheber: Paweł Zdziarski, Lizenz: CC BY 2.5
PCM and DSD sound representation. Note that sample resolution is for demonstration purposes only.
DSDlogo.svg
Direct Stream Digital product logo