Grenzen der digitalen Audiotechnik (Ralf Koschnicke)

Funky
Aktiver Hörer
Beiträge: 598
Registriert: 30.01.2012, 19:26

Beitrag von Funky »

DSD versus PCM

Gibt es Unterschiede und wenn ja wie machen sich diese ggf. bemerkbar.

Eine interessante Diplomarbeit von der HFM Detmold bringt Licht ins Dunkel

http://www.google.de/url?sa=t&rct=j&q=& ... 0519,d.d2s

Es sind auch noch andere sehr interessante psychoakustische Veröffentlichungen zu finden.

Für die, die es schnell wissen wollen: Anbei die zentrale Aussage:

Insgesamt wurden 145 Tests von 110 Probanden durchgeführt. Ungefähr ein Drittel entschied sich für Stereo, der Rest für Surround-Material. Lediglich vier der 145 Tests lagen im Rahmen der kritischen Wahrscheinlichkeit von fünf Prozent. Das entspricht nicht mal drei Prozent der Gesamttests. Damit ist statistisch klar, dass es unter den gegebenen Testbedingungen den Probanden nicht möglich war, zwischen PCM oder DSD zu unterscheiden, bzw. klangliche Unterschiede auszumachen.
Die vollständige Diplomarbeit können Interessierte übrigens in Kürze im Internet einsehen: http://played.by/dsdpcm

Denke mal das hilft bei der Überlegung ob es DSD fähige Gerätschaften sein müssen.

Schönen Gruss

funky
Bild
Thomas K.
Aktiver Hörer
Beiträge: 1604
Registriert: 12.03.2009, 13:46
Wohnort: Konstanz

Beitrag von Thomas K. »

Hallo Funky,

herzlichen Dank für den Link. Den Testaufbau finde ich auf Grund der Tatsache, daß jeder Tester eine Zeit zum einhören bekommt und dann auch noch beliebig oft und lange vergleichen kann, zielführender als viele andere Vergleichstests, über die ich schon gelesen habe.

Viele Grüße
Thomas
Bild
never
Aktiver Hörer
Beiträge: 322
Registriert: 30.12.2012, 11:00

Beitrag von never »

Hallo zusammen,

falls ihr die folgende Diplomarbeit aus dem Jahre 2004 meint:

Dominik Blech und Min-Chi Yang, "Untersuchung zur auditiven Differenzierbarkeit digitaler Aufzeichnungsverfahren (Hörvergleich DSD/PCM)" – 2004“

dann findet ihr die unter den Links

http://www.eti.hfm-detmold.de/lehraktiv ... d.pdf/view

http://www.eti.hfm-detmold.de/lehraktiv ... vs-dsd.pdf

http://old.hfm-detmold.de/eti/projekte/ ... lindex.htm

Freundliche Grüße,
never (Udo)
Bild
Hans-Martin
Aktiver Hörer
Beiträge: 9152
Registriert: 14.06.2009, 15:45

Beitrag von Hans-Martin »

Huch, ich interpretiere das Ergebnis ganz anders!
Es waren 45 Beispiele Stereo (und 100 fruchtlose Surroundbeispiele, die ich sogleich ignoriere, die auf S. 57 beschriebene Testphase hätte den Probanden schon eine Warnung sein können, weil die korrekten Eingaben wie auch die Fehlschläge angezeigt wurden).

15 über Lautsprecher und 30 über Kopfhörer (S.71): Mit Lautsprechern gelang hier keinem Probanden eine überzeugende Differenzierung.
4 Probanden konnten Unterschiede über Kopfhörer statistisch hinreichend nachweisen:
1 Person hatte bei Gesang eine Trefferquote von 100%
1 Person hatte bei Gitarre eine Trefferquote von 90%
1 Person hatte bei Sprache eine Trefferquote von 85%
1 Person hatte bei Oboe eine Trefferquote von 75%

4 Probanden bei 30 Tests mit Kopfhörer, das ist 13%, so wie eine 1 in der Klassenarbeit, die haben nur die besten. 13% ist doch schon mal mehr als wenn man die 4 Probanden auf die Gesamtmenge bezieht, wo 2/3 sich blödsinnigerweise auf eine Geräteanordnung verlassen haben, die ihnen wenig vertraut ist (nur 7 hatten zuhause ein Mehrkanalsystem).

Zum Vergleich wurde DSD gegen PCM 24/176 benutzt, nicht jedoch das Medium SACD oder DVD-Audio. Also keine Kette mit Pressung, optischer Abtastung, usw. Und doch wurde vielfach daraus abgeleitet, dass zwischen SACD und DVD-A kein Unterschied hörbar sei, die Internetforen sind voll davon.

SACD ist tot, und nun keimt im PC-Bereich DSD wieder auf...
Grüße Hans-Martin
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

Hallo zusammen,
ehrlich gesagt schiebe ich schon länger vor mir her, meinen Thread hier mal auf den aktuellen Stand zu bringen. Ich bin etwa müde immer wieder die gleichen Diskussionen zu führen... Auf der anderen Seite gibt es in der Branche nach wie vor – oder auch wieder verstärkt (siehe DSD Hype oder "Wiederentdeckung des 16Bit/44,1kHz als das Nonplusultra der Audiotechnik" per LaRosita, NOS o.ä.) – sagen wir mal, skurrile Entwicklungen. Weil ich aber nun inzwischen geneigt bin, die ganze Diskussion ganz knapp auf einen Satz zu reduzieren, und dabei dann auch nichts mehr wegzudiskutieren ist, nochmal ein Beitrag meinerseits:

http://www.artistic-fidelity.com/Docs/A ... wenden.pdf

Eigentlich sollte der Text nach Seite 1 enden, um es wirklich mal kurz zu machen. Aber weil hier aktuell eine Diskussion zu DSD gelandet ist, habe ich einen schon vor längerer Zeit mal verfassten Text zum Thema DSD mit angehängt. Diese Hype lässt mich nur kopfschüttelnd bis fassungslos zurück… Kein Ergebnis ist noch ein schmeichelndes Ergebnis bei oben zitiertem Test. Ich würde eine klare negative Signifikanz für DSD erwarten. Wobei nicht vergessen, der Test ist mehr als 10 Jahre alt!!! Wandler vor zehn Jahren und heute... Welten...

Viele Grüße
Ralf
wgh52
Aktiver Hörer
Beiträge: 5650
Registriert: 25.01.2008, 15:17
Wohnort: Schweitenkirchen
Kontaktdaten:

Beitrag von wgh52 »

Hallo Ralf,

danke für den gut verständlich und nachvollziehbar geschriebenen Grundsatzartikel!

Gruß,
Winfried

3341
Bild
Buschel
Aktiver Hörer
Beiträge: 989
Registriert: 12.12.2013, 20:12
Wohnort: Raum Karlsruhe

Beitrag von Buschel »

Hallo Ralf,

eine sehr interessante Stellungnahme. Du sprichst das Ringing und dadurch entstehende neue spektrale Komponenten an. Ich habe mich mit diesem Thema auch vor einer Weile beschäftigt und habe dazu wenig Material gefunden, das auf die Art und die Wahrnehmbarkeit solcher Artefakte eingeht.

Die damals für mich nachvollziehbaren Informationen zusammengefasst sind, dass es bei dem typischen Anwendungsfall von steilflankigen linearphasigen FIR-Tiefpassfiltern zu solchen neuen Komponenten/Tönen im Bereich der steilsten Flanke kommt. Die Stärke und Frequenzausdehnung der Komponenten hängt dabei direkt mir der Steilheit der Flanke zusammen. Bei 44.1 Khz Abtastrate und dem üblichen Oversamplingfilter ist also der Bereich um und oberhalb von 20 kHz betroffen -- also im Audioband, aber zumindest außerhalb des Hörbereichs der meisten Menschen. Wahrnehmbares pre-ringing habe ich nur in einer AES-Studie gesehen, bei dem steilflankige FIR-Filter bei viel niedrigeren Frequenzen eingesetzt wurden -- die ringing-Komponenten liegen dann vollständig im hörbaren Bereich. Aus Interesse hatte ich dazu eine Simulation eines digitalen Filters in scilab gemacht (Klick mich).

Hast du evtl. weiteres Material, das eine Sichtung lohnt?

Viele Grüße,
Andree
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

Hallo Andree,
entweder ganz oben im Thread das PDF und Seite 9/10, wobei S.10 unten das entscheidende ist. Oder gleich den Originalartikel von Mike Story (DCS): http://audiofast.pl/pdfs/aes97ny.pdf
Geht in die Richtung Deiner Diagramme. Wobei ich "Figure 6" für das eigentlich überraschende halte. Im Amplitudenverlauf sehen die Überschwinger stets sehr harmlos aus.Akustisch entscheidend ist jedoch tatsächlich der Energieinhalt. Und aufgrund der Breite der einzelnen Schwinger spreitzt sich der Einergieinhalt viel stärker als es das Amplitudendiagramm spontan vermuten lässt. Das war m.E. schon ein cleverer Gedankengang von Mike Story. :wink:

Auch wird sich hier sehr eingehende mit den Auswirkungen der Filter beschäftigt, ohne das im Einzelnen näher bewerten zu wollen: http://www.audio-optimum.com/#!nos-dac/
Nur macht der Autor m.E. in der ganzen Argumentation den zentralen Denkfehler, dass, wenn alles beschriebene stimmt, die Mechanismen bzgl. Filter beim AD-Wandlungsprozess natürlich auch auftreten und dort sind die Spielräume für trickreiche Lösungen viel kleiner. Denn wenn ich dort bei 44,1kHz mit 22,05kHz Bandbreite eben so weit unterhalb des der tatsächlichen Bandbreite des Nutzsignals liege, muss tatsächlich noch recht heftig gefiltert werden, um deutliches Aliasing zu verhindern. Was dort aber passiert, ist für immer mit dem Nutzsignal untrennbar verbunden. Da nutzt das beste DAC-Konzept nichts. Das hilft dann allenfalls, das eben nicht besser vorliegende Material ohne weitere Fehler zu Gehör zu bringen. Aber daraus abzuleiten, bei 44,1kHz wäre alles toll... Die einzige Lösung heißt eben: Abtasttheorem richtig anwenden :wink:

Grüße
Ralf
wgh52
Aktiver Hörer
Beiträge: 5650
Registriert: 25.01.2008, 15:17
Wohnort: Schweitenkirchen
Kontaktdaten:

Beitrag von wgh52 »

Hallo Ralf,
Ralf Koschnicke hat geschrieben:Mike Story (DCS): http://audiofast.pl/pdfs/aes97ny.pdf ... "Figure 6" ...
Wenn ich das Diagramm so ansehe, korreliert es in gewissem Maße (also nicht Klangveränderung in der Größenordnung wie im Diagramm!) mit dem was ich bei Wiedergabevergleichen in CD vs. HD Auflösung der selben Aufnahme empfinde:
- Mehr Ruhe im Klangbild
- Mehr Durchzeichnung
- Mehr Raumtiefe
- Bessere Ortung der Schallereignisse
- "Einfach (etwas) angenehmer"

Gruß,
Winfried

3342
Bild
Daihedz
Aktiver Hörer
Beiträge: 793
Registriert: 25.06.2010, 15:09

Beitrag von Daihedz »

Hallo Ralf

Danke für Deine einleuchtenden Gedanken zu den in DAC's eingebauten digitalen Filtern.

Dazu hätte ich noch konkrete Fragen: Ich befasse mich mit meinen etwas angealterten M-Audio 1010's u.a. auch mit den darin verbauten AKM-DAC's der Serie AK4393/95/96.

Dabei ist mir in bei dieser Reihe aufgefallen, dass die Filter des
- AK4393 mit 24Bit 8x mit 0.005dB Ripple und 75dB Dämpfung (28 1/fs group delay)
- AK4395 mit 24Bit 8x mit 0.0002dB Ripple und 110dB Dämpfung (43.5 1/fs group delay)
- AK4396 mit 24Bit 8x mit 0.005dB Ripple und 75dB Dämpfung (28 1/fs group delay)
spezifiziert sind.

http://www.akm.com/akm/en/file/datasheet/AK4395VF.pdf
http://www.akm.com/akm/en/file/datasheet/AK4396VF.pdf

Der AK4395 war der Nachfolger des AK4393, und der AK4396 war der Nachfolger des AK4395. Der DAC mit dem Filter mit den besten Werten aus dieser Serie scheint der AK4395 zu sein, bei einer höheren Gruppenlaufzeit als bei den beiden anderen. Unverständlich ist für mich, dass der neueste AK4396, der als Ersatz des AK4395 gedacht war, wieder schlechtere Brutto-Zahlenwerte für die Dämpfung aufweist als dessen Vorgänger AK4395.

Hast Du eine einleuchtende Erklärung dafür, warum wohl die Ingenieure von AKM mit der letzten Iteration dieser Reihe wieder zu einem Filter mit einer niedrigeren Dämpfung gegriffen habe? Ich habe mir als Naivling folgende Logik "zusammengebastelt": Der steilere Filter des AK4395 wurde wegen der etwas höheren Gruppenlaufzeit wieder aufgegeben? Vielleicht für die Clientel der Live- und Realtime-Musiker? Oder war das Silizium zu dieser Zeit auf einem Jahreshoch?

Wegen der effizienteren Filter habe ich jedenfalls bei meinem Modifikationen den AK4395 verbaut, und nicht den AK4396. Die Gruppenlaufzeit ist für mich sekundär. Vielleicht wäre der AK4396 auch eine gute Wahl gewesen? Weiss nicht so recht ...

Ich hoffe, Du kannst mich etwas erhellen.

Beste Grüsse
Simon
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

@Winfried:
Deine Beschreibung kommt mir sehr bekannt vor. Da stimme ich voll und ganz zu.

@Simon:
Da wäre nun ein Klangvergleich spannend. Wenn ich mir die Tabellen genau anschaue, so riecht es nach: sie haben gemerkt, dass die vermeintliche Verbesserung beim 4395 ein Fehlgriff war. Denn da sind wir dann direkt beim Thema. Wobei, viel eindrucksvoller sind ja noch die Unterschiede zwischen Slow und Sharp Filter. Zeitfehler erscheinen mir in musikalischer Hinsicht weitaus kritischer als Aliasing. Wobei ich mich mit der allzu weichen Auslegung auch nicht immer gänzlich anfreunden kann. Das hat AKM vielleicht auch gemerkt und dem Sharp Filter ein besseres Zeitverhalten spendiert. Beim Slow haben sie wohl wieder etwas ganz anderes gemacht. Die Auslegung beim 4395 war ja schon sehr extrem. Also ich würde den 4396 verwenden. Aber man muss es hören...
An der ganzen Jongliererei sieht man aber eben das Kernproblem. Was da passiert ist klanglich relevant, jenseits der Frage, ob man die weggeschnittenen Frequenzen hören kann oder nicht. Je nach Filterauslegung klingt der Chip anders. Bei höheren Abtastraten entschärft sich das Problem.

Viele Grüße
Ralf
Buschel
Aktiver Hörer
Beiträge: 989
Registriert: 12.12.2013, 20:12
Wohnort: Raum Karlsruhe

Beitrag von Buschel »

Hallo Ralf,

Danke nochmal für den Link. Die darin beschriebenen Gedankenspiele sind mir bekannt, die zeitliche Dispersion wurde in mehreren Dokumenten besprochen (initial meine ich Mitte der 80er). Wonach ich wirklich schon intensiv gesucht, aber bisher nicht gefunden habe, sind gezielte Untersuchungen der Wahrnehmbarkeit von Pre-Echoes. Die einzigen (AES-)Dokumente, die ich kenne, vergleichen nur unterschiedliche Samplingraten ohne direkten Bezug auf die angewendeten Filter.

Viele Grüße,
Andree
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

Hallo Andree,
also ich glaube es gibt keine, weil es keinen wirklichen Bedarf daran gibt, weil das eigentlich niemand ernsthaft bezweifelt; siehe exemplarisch o.g. Jonglieren mit den Filterparametern bei AKM. Nimm doch einfach mal einen Resampler mit einstellbarer Charakteristik, z.B. Wavelab, Cplay (kann man glaube ich sogar gezielt den Aliasingfilter abschalten) oder Audirvana. Ist dann zwar alles nur der Digital-Analog-Weg, aber man bekommt ein Gefühl dafür.
Welches prinzipiell der bessere Weg ist, da dürfen sich die Geister dann dran entzünden. Die Überschwinger gehören genauso wenig ins Signal wie Aliasingkomponenten. Kommt man wegn der verbogenen Auslegung des Abtasttheorems nicht gänzlich daran vorbei, ist es immer ein Kompromiss mit gewissem Gestaltungsspielraum. Burr Brown bietet bei seinen Chips i.d.R. bei 192kHz auch gar keinen zwischen slow und sharp umschaltbaren Filter mehr an, warum wohl...

Wenn es Dir aber darum geht, ein Papier zu finden, wo - wie oben am Beispiel DSD mal wieder gezeigt - am Ende aus einer fehlenden signifikanten Präferenz für eine Variante der Beweis für eine Unhörbarkeit abgeleitet wird, so lässt sich ein solcher Versuchsaufbau sicher leicht konstruieren :wink: Ich denke, die Dir anscheinend schon bekannten Dokumente mit theoretischen Überlegungen sollten genügen. Es passieren definitiv Veränderungen am Signal, die nicht passieren sollten und auch leicht vermeidbar sind. Mit Untersuchungen, was hörbar und was nicht, tut sich Audio schon immer schwer. Oder Kannst Du mir eine Untersuchung nennen, ab welchem Klirrfaktor sich etwas wie grauselig anhört...

Viele Grüße
Ralf
Buschel
Aktiver Hörer
Beiträge: 989
Registriert: 12.12.2013, 20:12
Wohnort: Raum Karlsruhe

Beitrag von Buschel »

Hallo Ralf,

zum Klirr genügt mir ein Zwicker, aus dem ich erkennen kann ab welchem Pegel Töne maskiert werden. Genau so etwas suche ich auch für die Pre-echos, die sich aus dem ringing der Filter ergeben. Schade, dass es so eine Untersuchung mit Quantifizierung offenbar nicht gibt.

Viele Grüße,
Andree
Bild
cay-uwe
Aktiver Hersteller
Beiträge: 1175
Registriert: 25.02.2009, 09:15
Kontaktdaten:

Beitrag von cay-uwe »

Ralf,

ich hatte ja schon vor einiger Zeit das Vergnügen Deine kurze Abhandlung zu lesen und bitte folgende Kommentare so zu betrachten, dass dies eigentlich nicht mein Metier ist und somit meine Kommentare eventuell etwas naiv erscheinen können.

Im Prinzip müsste man sagen, da beim digitalisieren sowieso mehr oder weniger Verluste auftreten, sollte natürlich die Auflösung ( Sample Rate + Bittiefe ) so hoch wie möglich sein um bestmögliche Detailtreue zu erreichen.

Ich teile Deine Sichtweise, dass man die Anforderungen dessen was man digitalisieren möchte, als Basis für die gewählte Auflösung sehen kann oder sollte. Du sprichst von der Bandweite und so könnte zum Beispiel bei der Aufnahme bereits das gewählte Mikro die Auflösung festlegen. Aber auch gewählte Vorstufen oder andere Geräte können das beeinflussen.

Bei der Wiedergabe sehe ich das sehr pragmatisch, denn letztendlich hören wir meistens über Lautsprecher ( muss ich als LS-Entwickler sagen :wink: ) und diese werden die Wiedergabebandweite viel stärker beeinflussen als viele der Komponenten die zuvor bei der Aufnahme benutzt wurden. Und somit wäre wir wieder beim Thema oberste Grenze ca. 20kHz, denn im Großen und Ganzen liegt bei den allermeisten Lautsprechern auf den Markt dort die oberste Grenzfrequenz ( von ein paar Ausnahmen abgesehen, wie AMT, Bändchen, Ionen-HT ). Alles darüber wird durch das natürliche Roll-Off Verhalten der Chassis begrenzt und somit könnte man sagen, 44.1kHz wäre so gesehen auch ausreichend, oder ?
Bild
Antworten