Grenzen der digitalen Audiotechnik (Ralf Koschnicke)

O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Hörbarkeit u.a. Tiefpassflter für Anti Aliasing

Beitrag von O.Mertineit »

Aus:

http://www.aktives-hoeren.de/downloads/ ... 300708.pdf

Zitat (S.15):
"Wenn es zum Beispiel um Richtungswahrnehmung geht, sind Winkelabweichungen von nur 3-5 Grad
exakt wahrnehmbar. Das entspricht einer Laufzeitdifferenz zwischen beiden Ohren von etwa 10μs."


Hallo zusammen ...

1) Ohne die Zahlen im Einzelnen zu kommentieren, möchte ich hierzu ganz knapp folgendes anmerken:

Die Richtungswahrnehmung beim natürlichen Hören beruht bei höheren (Hör-) Frequenzen hauptsächlich auf ILD Spuren, d.H. auf "Interaural Level Difference", welche sowohl winkel- als auch frequenzabhängig ist und mit der kopfbezogenen Übertragungsfunktion (engl. Head Related Transfer Function, HRTF) zusammenhängt:

Das der Schallquelle jeweils abgewandte Ohr wird quasi für hohe Hörfrequenzen z.B. >2Khz (nicht 2Mhz :wink: ) "abgeschattet", woraus sich u.a. an beiden Ohren in unterschiedliche Hüllkurven ergeben.

Eine jeweils aus diesem (oder auch nur "unter Beteiligung" dieses ...) Lateralisationsmechanismus ermittelte Lateralisationsunschärfe in eine "Zeitauflösung" (s.o.) umzurechnen, wäre also unangemessen und dürfte solche Leser mit Grundkenntnissen in den Bereichen Hörpsychologie, räumliches Hören, Gehörphysiologie, ... eher deutlich davor abschrecken, der Argumentation im Referat zu folgen, als das es dazu dienlich wäre.


2) Experimente mit Tonimpulsen (Gauß-Tönen) über lieferten u.a. folgende Lateralsationsunschärfen für 10,3 Khz:

Lautsprechersignale mit reiner Pegeldifferenz
----------------------------------------------------------
00dB...+/- 8 Grad
06dB...+/- 6 Grad
30dB...+/- 2 Grad

Lautsprechersignale mit reiner Laufzeitdifferenz
--------------------------------------------------------------
0,0ms...+/- 7,5 Grad
0,3ms...+/- 5,5 Grad
1,0ms...+/- 4,5 Grad

(Zahlen entnommen aus: Jens Blauert "Räumliches Hören", Hirzel Verlag, Stuttgart 1974, Tabelle 1, S. 167)

Anmerkung hierzu:
Die Lateralisationsunschärfe ist also ganz ohne Laufzeitdifferenz und nur auf Pegeldifferenzen beruhend bei hohen Hörfrequenzen sogar deutlich geringer, was die Problematik der o.g. Argumentation verdeutlichen sollte.


3) Bezüglich des menschlichen Hörumfangs ein paar statistische Mittelwerte:

http://patentimages.storage.googleapis. ... gf0001.png

Hier nur exemplarisch, es können gerne noch weitere Daten nachgeliefert werden ...

Wenn man also auf der einen Seite vom Nyquist-Shannon Theorem kommt, was zunächst legitim ist, und auf der anderen Seite - wenn auch implizit - über "Hörvermögen z.B. bei Männern (oft) über 40" sprechen möchte, dann lohnt es sich m.E. tatsächlich, ganz dicht "mit den Füßen auf dem Teppich" zu bleiben, solange man über Effekte, Parameter, Verzerrungsarten usw. sprechen möchte, die relevant für eine empfundene "Klangqualität" sind.

_________________

Daß die notwendige steilflankige Filterung (Anti Aliasing Tiefpass-Filter) bei Abtastraten um z.B. 44Khz bereits Signalveränderungen im nominellen Hörfrequenzbereich bis 20Khz bewirkt, ist hingegen unbestritten.

Wenn es jedoch an Fragen der "Hörbarkeit" im Sinne einer allgemeinen Relevanz für Normalhörende geht, sollte man die Argumente nicht willkürlich oder gar nach "erwünschtem Ergebnis" auswählen.

Es gibt erhebliche Signalmanipulationen innerhalb des nominellen Hörfrequenzbandes, die unter normalen Bedingungen nicht hörbar sind:

Wenn man mögliche Effekte u.a. durch Tiefpassfilter am oberen Ende des nominellen Audiofrequenzbandes in Erwägung zieht oder seriös untersuchen möchte - daß messbare Effekte grundsätzlich auftreten ist unbestreitbar - sollte man sehr sauber und auf dem Stand der Erkenntnis argumentieren, gerade wenn man Daten aus dem Bereich des räumlichen Hörens heranzieht.

U.a. die o.g. Daten von Blauert stehen ja seit gut 45 Jahren zur Vefügung ...

Wahrnehmbarkeitsschwellen für Gruppenlaufzeitverzerrungen - wie sie u.a. durch Tiefpassfilter hervorgerufen werden können - und auch die Tonnkennzeit steigen für höhere Hörfrequenzen sogar wieder deutlich an.

Hier finden sich bei Interesse Wahrnehmungsschwellen für Gruppenlaufzeitverzerrungen und einige Referenzen dazu:

http://www.dipol-audio.de/wahrnehmung-g ... fzeit.html

Zur Tonkennzeit:
https://books.google.de/books?id=VCWhBg ... it&f=false
Bild
O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Beitrag von O.Mertineit »

O.Mertneit hat geschrieben: U.a. die o.g. Daten von Blauert stehen ja seit gut 45 Jahren zur Vefügung ...
Ich wollte hier nicht übertreiben (Zeit für Änderung abgelaufen):

Die o.g. Blauert-Ausgabe ist von 1974, die Tabelle auf S.167 beruht aber auf Daten von Wendt 1963, mithin sind sogar 50 Jahre vergangen.
Bild
lpj23
Aktiver Hörer
Beiträge: 128
Registriert: 07.04.2010, 10:31

Beitrag von lpj23 »

Ralf Koschnicke hat geschrieben:
lpj23 hat geschrieben:[...] Nun könnte man natürlich dahergehen und sagen, dass diese Gerätschaften allesamt Fehlkonstruktionen sind. [...]
Tja, hmm, bis auf den Lautsprecher, drängt sich der Verdacht durchaus auf. Ich würde mit so etwas nicht hören wollen... :wink:
Hallo Ralf et al.,

welche DACs wären denn bspw. auf dem Markt empfehlenswert, bei denen keine Umwandlung der gelieferten Signale stattfindet und die Signale stattdessen in "Reinkultur" gewandelt werden?

Gruß,
Lars
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Wenn man J River http://www.jriver.com/de/ auf dem Rechner installiert hat kann man einen ganzen spannenden Versuch machen. Man nehme eine High Res Aufnahme und setzte in J River im DSP-Studio einen Hochpassfiler bei 20 kHz Flankensteilheit 48 dB Octave und spiele die High Res Musik ab und höre sich mal an was man dann hört....

Einstellung DSP Studio J River dazu:
https://drive.google.com/file/d/0B8Alsk ... sp=sharing
Die Option mit dem Haken ist die Option die aktiv angewählt ist.

Grüße Truesound
Bild
O.Mertineit
inaktiv
Beiträge: 755
Registriert: 07.05.2012, 11:42
Wohnort: Reinheim bei Darmstadt
Kontaktdaten:

Beitrag von O.Mertineit »

@Truesound:

https://drive.google.com/file/d/0B8Alsk ... view?pli=1

Was bedeuten die 14Bits für den ausgewählten Filter ?


Grüße Oliver
Bild
Matty
Aktiver Hörer
Beiträge: 712
Registriert: 22.11.2012, 21:47
Wohnort: Neuss

Beitrag von Matty »

lpj23 hat geschrieben: Hallo Ralf et al.,

welche DACs wären denn bspw. auf dem Markt empfehlenswert, bei denen keine Umwandlung der gelieferten Signale stattfindet und die Signale stattdessen in "Reinkultur" gewandelt werden?

Gruß,
Lars
Hallo Lars,

die Umwandlung macht wohl absolut Sinn. Mein Violectric DAC800 arbeitet ähnlich. Über einen Sample Rate Converter (Burr Brown SRC4192) wird das Signal im 'Best'-Modus auf ca. 96kHz resampled, da hier der Sweet Spot des Wandler-Chips liegt und deswegen das potentiell beste Ergebnis bei der DA-Wandlung zu erwarten ist.

Nach dieser doch sehr interessanten Diskussion werde ich aber nochmal unterschiedliche Modi ausprobieren und schauen, ob ich den Unterschied bei verschiedenen Sample Rates wirklich höre.

Viele Grüße
Matthias
Bild
lpj23
Aktiver Hörer
Beiträge: 128
Registriert: 07.04.2010, 10:31

Beitrag von lpj23 »

Matty hat geschrieben:Hallo Lars,

die Umwandlung macht wohl absolut Sinn. Mein Violectric DAC800 arbeitet ähnlich. Über einen Sample Rate Converter (Burr Brown SRC4192) wird das Signal im 'Best'-Modus auf ca. 96kHz resampled, da hier der Sweet Spot des Wandler-Chips liegt und deswegen das potentiell beste Ergebnis bei der DA-Wandlung zu erwarten ist.

Nach dieser doch sehr interessanten Diskussion werde ich aber nochmal unterschiedliche Modi ausprobieren und schauen, ob ich den Unterschied bei verschiedenen Sample Rates wirklich höre.

Viele Grüße
Matthias
Hallo Matthias,

das wäre in der Tat interessant. Zumal ich bisher auch davon ausgegangen bin, dass die Fa. Lyngdorf ihre Gerätschaften (in meinem Fall der DPA-1) technisch sauber produziert.

Gruß,
Lars
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

O.Mertineit hat geschrieben:@Truesound:

https://drive.google.com/file/d/0B8Alsk ... view?pli=1

Was bedeuten die 14Bits für den ausgewählten Filter ?


Grüße Oliver

Hallo Oliver!

Mit J River kann man auch eine sogenannte Bittiefensimulation machen wenn man die Option per Haken angewählt hat.....


Grüße Truesound
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Matty hat geschrieben:
lpj23 hat geschrieben: Hallo Ralf et al.,

welche DACs wären denn bspw. auf dem Markt empfehlenswert, bei denen keine Umwandlung der gelieferten Signale stattfindet und die Signale stattdessen in "Reinkultur" gewandelt werden?

Gruß,
Lars
Hallo Lars,

die Umwandlung macht wohl absolut Sinn. Mein Violectric DAC800 arbeitet ähnlich. Über einen Sample Rate Converter (Burr Brown SRC4192) wird das Signal im 'Best'-Modus auf ca. 96kHz resampled, da hier der Sweet Spot des Wandler-Chips liegt und deswegen das potentiell beste Ergebnis bei der DA-Wandlung zu erwarten ist.

Nach dieser doch sehr interessanten Diskussion werde ich aber nochmal unterschiedliche Modi ausprobieren und schauen, ob ich den Unterschied bei verschiedenen Sample Rates wirklich höre.

Viele Grüße
Matthias

Hallo Matthias!

An dieser Stelle wo es um SRC geht stehen ganz interessante Dinge warum eine gute SRC sich auch mal positiv je nach verwendeten Equipment auswirken könnte:

https://www.xivero.com/de/xisrc/

Grüße Truesound
Bild
Ralf Koschnicke
Aktiver Hersteller
Beiträge: 374
Registriert: 22.07.2008, 11:24
Wohnort: Wöllstein
Kontaktdaten:

Beitrag von Ralf Koschnicke »

@: O.Mertineit:
Dieser Thread läuft nun seit 2008 und mit 230 Beiträgen. Wenn Du jetzt ganz zurück an den Anfang springst – ich weiß, ist leider nahezu unlösbar – müsstest Du eigentlich auch die folgenden Seiten durchforsten. Denn was Du jetzt diskutieren möchtest, ist weiter oben vor vielen Jahren schon sehr ausführlich geschehen.

Nur so viel: Man kann übers Hörvermögen viel diskutieren, kommt aber letztlich zu keinem vernünftigen Ergebnis. Wie ich aber bereits mehrfach gesagt habe, ist die Hörobergrenze für mich gar nicht mehr das relevante Thema. Folglich ist es mir auch ein Rätsel, warum gerade darauf wieder so umfassend abgehoben wird. Lukivision hat es eigentlich ziemlich gut getroffen. Es geht darum, die Übertragung möglichst gut zu machen. Es sind viele Dinge wichtig, das ganze Forum hier beschäftigt sich mit tausenden dieser Details. Wie weit man es treiben will, muss jeder mit sich selber ausmachen. Wenn man es aber weit treiben möchte mit den Qualitätsansprüchen, kommt man an grundsätzlichen Dingen nicht vorbei. An der Stelle wieder mein beliebtes Beispiel: Natürlich wird Anne Sophie Mutter auf einer "China-Schrabbel" für 200,- EUR besser spielen als ein Geigenschüler im ersten Jahr. Dennoch wird sie für Höchstleistungen eben auch ein entsprechendes Instrument haben müssen, beispielsweise eine Stradivari für viele Millionen. Deshalb bitte ich auf dieses ewige Rechtfertigen mit anderen Dingen in diesem Thread zu verzichten. Das geht am Thema vorbei.
Um nochmal auf Lukivision zurückzukommen: Es geht darum, die Übertragung möglichst gut zu machen. Wenn ich aber einen Filter einsetze, um ein Musiksignal mit einer höheren Bandbreite als meine gewünschte Übertragungsbandbreite künstlich zu begrenzen, verliere ich zwangsläufig immer Signalqualität, hauptsächlich auf zwei Arten:

1. Die abgeschnittenen Signalanteile fehlen, was die Präzision des Signals mildert. Hier kann man vielleicht damit argumentieren, dass man das ohnehin nicht hören würde – Thema Hörgrenze. Aber selbst das wäre nur dann zutreffend, wenn wir ausschließlich über den letzten Schritt in der Übertragungskette sprechen würden, den Tonträger zum Konsumenten. Wann immer noch eine Bearbeitung stattfindet, wäre das präzisere Ausgangssignal sicher eine bessere Basis für ein besseres Endprodukt. Beispiel: Ich habe gerade ein paar Klavierproduktionen mit Künstlern quer über die Welt verteilt in Arbeit. Um die Abstimmung schneller zu machen, komme ich nicht an MP3 vorbei. Dass ich dieses Format nicht mag und es mir dabei das Hirn verknotet, habe ich oft genug geschrieben. Nun war ich gerade gestern doch über das Ergebnis überrascht, wenn ich den Konverter direkt aus 24/192 ein 48kHz 320kB MP3 machen lassen und nicht erst aus dem CD-Master. Wie der Prozess genau abläuft wissen nur die Programmierer, aber die Ausgangslage ist sicherlich so eine bessere als wenn ich mit Konvertierung auf CD-Format schon die erste Reduktionsstufe drin hatte bevor die Konvertierung startet. Also der miserable datenreduzierte Fernsehton wäre sicher viel besser, wenn nicht schon alle Aufnahmegeräte und Mischpulte davor in der Produktionskette – das Abtasttheorem verletzend – mit einer zu niedrigen Abtastrate von 48kHz arbeiten würden. Deshalb klingen alte Konzertmitschnitte aus Analogzeiten wohl stets auch so deutlich viel besser. Damit wären wir dann auch schon bei...

2. Das Abschneiden der Signalanteile generiert Artefakte im Nutzband, Stichwort Ringing. Wer es genau wissen will, der findet in dem ersten Artikel ganz am Anfang des Threads einige schöne Diagramme. Diese Verfälschungen sind dann eben im Nutzsignal drin und die kann jeder Lautsprecher auch wiedergeben. Und die Frage ob hörbar und nicht hörbar hat überhaupt gar nichts mit der Hörgrenze zu tun, allenfalls mit Hörgewohnheit und Sensibilität. Deshalb bin ich beispielsweise auch froh, über einen FIIO X2 auch im Auto 24/192 hören zu können und auch hier keine CD mehr zu brauchen. Die Wiedergabe ist hier sicher nicht gut. Aber wenn bei 24/192 eben die üblichen CD-Artefakte fehlen, ist die Hörbarkeit nicht von der Bandbreite der Autolautsprecher oder des immensen Grundgeräuschs abhängig. Das was tönt enthält einfach weniger Dinge die da nicht reingehören als wenn ich vorher eine CD draus mache.

Also vergesst endlich mal die Sache mit dem Hörbereich. Es ist vielleicht nicht ganz unwichtig. Aber mittlerweile plädiere ich dafür, das als völlig unwichtig einzustufen. Das Problem von das Abtasttheorem verletzenden Abtastraten ist schlicht und ergreifend, dass dadurch das Signal nicht unverfälscht übertragen werden kann; selbst wenn alles perfekt arbeiten würde. Das hat nichts mit der oberen Gerenze des menschlichen Hörbereichs zu tun!!!

Grüße,
Ralf
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Bei einer SRC auf dem Rechner spielt die Qualität der SRC Rechnung eine Rolle als auch die in Pro-Programmen häufig vorhandenen weiteren Einstellungsmöglichkeiten wie Pow 1,2,3 Algorithmus. ..letztere werden bewusst zur Klangveränderung eingesetzt...

Wenn man in Zweifel ist sollte man die SRC mit Testsignalen mal testen....

Grüße Truesound
Bild
Matty
Aktiver Hörer
Beiträge: 712
Registriert: 22.11.2012, 21:47
Wohnort: Neuss

Beitrag von Matty »

Truesound hat geschrieben: Hallo Matthias!

An dieser Stelle wo es um SRC geht stehen ganz interessante Dinge warum eine gute SRC sich auch mal positiv je nach verwendeten Equipment auswirken könnte:

https://www.xivero.com/de/xisrc/

Grüße Truesound
Hallo Truesound,

danke für den Tipp!

Stephan von XiVero ist ein guter Freund von mir. Ich bin also bestens über das Erscheinen dieser Software informiert. :cheers:
Ebenso über AudioRepair, eine Software mit der man verschiedene Fehler, speziell von CD-Material, kompensieren kann.

Im Verlaufe dieser Diskussion ist mir auch bereits der Gedanke gekommen, ob ein SRC vielleicht sogar eine Möglichkeit sein kann, ganz individuell, dass Beste aus einer Verarbeitungskette herauszuholen.

Ich will auch erklären warum:

Grundsätzlich kann ich mich mit dem Ansatz von Ralf absolut identifizieren. Seine Vorgehensweise zielt ja darauf ab, in allen Arbeitsschritten Störungen bei der Signal-Verarbeitung zu verhindern (Stichworte: Anwendung des Abtasttheorems, Anwendung von Filtern).
Daraus ergibt sich eine für das Musikmaterial geeignete (Mindest-)Sample-Frequenz, die bei 192kHz liegt.
Ob die aus Aliasing oder Preringing entstehenden Signalfehler tatsächlich hörbar sind, steht da für mich auch erstmal nicht zur Debatte. Wenn ich Störungen verhindern kann, tue ich das. Viele von uns arbeiten ja nach ähnlichen Prinzipien beim Aufbau ihrer Wiedergabekette.

Jetzt hat die ganze Sache aber leider noch ein vielleicht entscheidendes "Aber":
Gängige DA-Wandler haben heute oft einen optimalen Arbeitsbereich bei um die 96kHz.
Das heißt, dass in diesem Frequenzbereich die zu erwartende Qualität des analogen Ausgangssignals prinzipiell am Höchsten ist.

Und schon haben wir einen Zielkonflikt.

Ist es jetzt relevanter für das Ergebnis, dass das Musikmaterial die für die digitale Verarbeitung optimale Sample-Frequenz hat?
Oder ist es vielleicht wichtiger, dass der DAC mit der für ihn optimalen Sample-Rate arbeiten kann?
Welche Abweichung von der optimalen Vorgehensweise wirkt sich also eher negativ aus?
Oder ist dies von Mal zu Mal unterschiedlich?
Oder finde ich einen bestmöglichen Kompromiss, indem an geeigneter Stelle eine Sample Rate Conversion stattfindet? Genau hier käme dann eine SRC-Software oder wie bei manchen DACs auch die SRC-Hardware ins Spiel.
Oder sind die Unterschiede doch so gering, dass hier beide Wege zu einem qualitativ gleichwertigen Ergebnis führen?

Ich bin gespannt, ob sich diese Frage zufriedenstellend beantworten lässt.

Viele Grüße
Matthias
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Hallo Matthias!

Habe neulich einmal wieder folgenden Versuch gemacht. 192/24 Klassik Download mit Samplitude auf 44/16 umgerechnet.Via RME ADI-2 beides verglichen...nichts gehört an Unterschied.

Als weiteres in Samplitude mittels Wellenformgenerator einmal weißes und einmal rosa Rauschen in 192/24 erzeugt.Via RME ADI-2 die 192 /24 Dateien abgespielt und Funk MTX Monitor und Rec Out auf einen RTW Districon der mit 44/24 digitalisiert gegeben...Auch bei diesen Signalen war nichts an Unterschied zu erhören....
Beim weißen Rauschen sind inbesondere die Pegel bis 81 kHz deutlich höher als man sie bei der Tonaufnahme selbst mit Sennheiser MKH Mikrofonen beobachten kann...

Es waren keine Unterschiede zu erhören auch nicht über Beyerdynamik T1..Habe auch als KHV die sehr breitbandigen Produkte der Firma Funk im Einsatz.

Breitbandigkeit bei gleichzeitig sehr guter Linearität sind natürlich messtechnisch ein Vorteil...keine Frage, aber praktisch gehörakustisch scheint es nichts zu bringen wenn das verwendete Equipment wirklich sehr hoch entwickelt arbeitet wie es soll.


Stephans Audio Repair sorgt u.a.dafür das die Pegel im Filterbereich einer CD nach deren eigentlicher Spezifikation abgeschwächt werden eben damit Aliasingverzerrungen minimiert werden.
Das ist übrigens bei einem Downsampling von einem wirklich guten Algorithmus auch zu beachten.
Die tatsächliche gehörakustische Wirksamkeit von Preringing bei sinnvoller Filtergestaltung wird m.e. total überschätzt.

Grüße Truesound
Bild
Hans-Martin
Aktiver Hörer
Beiträge: 9142
Registriert: 14.06.2009, 15:45

Beitrag von Hans-Martin »

Ich frage mich, ob man mit weißen (oder rosa) Rauschen etwas anderes ebenfalls wichtiges als Frequenzgangänderungen hören könnte, also z. B. Jitter, Phasendrehungen, Gruppenlaufzeiten, u.v.a., da prinzipbedingt die Randomisierung im Signal dominiert, das Signal sich nicht kongruent wiederholt.
Grüße Hans-Martin
Bild
Truesound
inaktiv
Beiträge: 1095
Registriert: 22.10.2011, 17:18
Wohnort: Everglades National Park

Beitrag von Truesound »

Hans-Martin hat geschrieben:Ich frage mich, ob man mit weißen (oder rosa) Rauschen etwas anderes ebenfalls wichtiges als Frequenzgangänderungen hören könnte, also z. B. Jitter, Phasendrehungen, Gruppenlaufzeiten, u.v.a., da prinzipbedingt die Randomisierung im Signal dominiert, das Signal sich nicht kongruent wiederholt.
Grüße Hans-Martin
Wie gesagt mit Musik passierte nichts....man hört ja gewöhnlich Musik über DA-Wandler und mit weißem als auch rosa Rauschen auch nichts....

Grüße Truesound
Bild
Antworten