Hörbarkeit von Gruppenlaufzeitverzerrungen
Verfasst: 20.03.2009, 12:26
Liebe Mitjäger nach höchster Wiedergabetreue,
an verschiedenen Stellen kam hier im Forum die Diskussion über die Hörbarkeit von Gruppenlaufzeitverzerrungen in Gang. Es stellte sich die Frage, ab welcher zeitlichen Verschiebung unterschiedlicher Frequenzanteile diese Laufzeitverzerrungen hörbar werden.
Nun möchte ich mich bzgl. meiner Kenntnisse in Sachen Hörphysiologie als blutigen Anfänger bezeichnen, was die Experten auf diesem Gebiet wohl schon daran gemerkt haben dürften, dass ich an anderer Stelle einen stehenden Begriff dieser Fachrichtung, nämlich Nachhörschwelle, als Nachhörbarkeitsschwelle bezeichnet habe. So hoffe ich auf rege Unterstützung von seiten der mitlesenden und -schreibenden Experten wie z. B. Toningenieure, aber auch sonst jedem, der irgendwie sinnvoll etwas dazu beitragen kann.
Die Klärung dieser Frage ist für mich deshalb von Bedeutung, weil sie für die Erreichung einer möglichst hohen Wiedergabetreue, die wohl die meisten hier wie auch ich anstreben, die Notwendigkeit einer digitalen Laufzeitentzerrung unserer Aktivlautsprecher zwingend macht oder eben auch nicht. Wie schon berichtet, kann man mit entsprechend aufwändiger Analogtechnik, wie sie sich z. B. in Aktivboxen von Silbersand findet, die nahezu perfekte Phasengleichheit der einzelnen Lautsprecherwege zueinander herstellen. Eine Frequenzabhängigkeit der Laufzeit des Signals am Hörplatz aber bleibt. Um welche Größenordnung es geht, kann man in meiner Subtraktionsweichen-Vorstellung sehen. In meinem speziellen Fall geht es um eine Gruppenlaufzeit, die unter 150Hz mit knapp 4ms beginnt und bis zu 20kHz auf im Vergleich dazu vernachlässigbare Werte stetig absinkt.
Ich möchte diese Frage explizit losgelöst von der Diskussion über die meist raumakustisch notwendige Korrektur des Amplitudenfrequenzgangs betrachten. Dank Joes Linkliste stieß ich auf die Veröffentlichung von Sebastian Goossens vom IRT München, und begann davon ausgehend mich durch die Literatur zu graben. Mein bescheidener Wissensstand im Augenblick lässt sich so zusammenfassen:
Es gibt zwei verschiedene Aspekte in dieser Angelegenheit,
1. die Betrachtung des spektralen Auseinanderfallens der Flanke einer impuls- oder sprungartigen Anregung durch unterschiedliche Laufzeiten der Spektralanteile, und
2. die Betrachtung von periodischen Signalen, die zueinander eine Phasenverschiebung erfahren.
zu 1. Goossens versucht als Erklärungsansatz für die teilweise stark differierenden Hörbarkeitsschwellen in der Literatur folgenden Ansatz: Den zeitlichen Maskierungseffekt.
Den spektralen Maskierungseffekt kennen wir ja alle von der Datenkomprimiererei à la MP3. Störschall verdeckt Testschall, wenn im gleichen Frequenzbereich. Beim zeitlichen Maskierungseffekt, auch Vor- bzw. Nachverdeckung genannt, geht's um Folgendes:
Man sendet ein zeitlich begrenztes Störsignal aus, z. B. ein 200ms lang andauerndes Rauschsignal mit einem Spektrum von z. B. 100Hz bis 5kHz. Dies ist der Störschall. Der Testschall, also das Signal, das man hören will, aber evtl. durch die Verdeckung nicht hören kann, ist z. B. ein 10ms andauerndes Sinussignal bei 1 oder 2kHz. Der Nachverdeckungseffekt bewirkt nun, dass man, wenn der Testschall kurz nach dem Ende des Störschalls ausgesendet wird, dem Testschall einen höheren Pegel geben muss als ohne Störschall, damit er noch zu hören ist. Umso mehr, je kürzer der Startzeitpunkt des Testschalls nach dem Ende des Störschalls liegt. Was die Sache nicht einfacher macht, ist die Tatsache, dass das Verhältnis von Test- zu Störschall bei einer betrachteten Zeitdifferenz pegelabhängig ist.
Goossens betrachtet nun die Aufspaltung eines Impulses in zwei verschiedene Spektralanteile, die eine unterschiedliche Laufzeit erfahren. Am Ohr kommen diese beiden Anteile nun also zeitlich nacheinander an, und wenn der zweite Anteil noch in dem Zeitfenster liegt, das durch den Nachverdeckungseffekt maskiert ist, ist keine gehörmäßige Auswirkung auszumachen. Er filtert bei dieser Betrachtung übrigens das Spektrum der Impulsartigen Anregung mit einem Tiefpass, der die Zeitkonstante des zeitlichen Gehör-Auflösungsvermögens hat.
Hat jemand ein Gefühl dafür, ob dieser Effekt hier relevant wird? Außerdem: Die Untersuchungen der Nachhörschwellen benutzen ja immer einen Testschall, der spektral innerhalb des Störschalls angesiedelt ist. Also im Beispiel oben liegt der Testsinus innerhalb des Frequenzbandes des Störrauschens (100Hz-5kHz). Bei der Gruppenlaufzeitverzerrung ist das gerade nicht der Fall, der Testschall ist ja gerade das durch die Laufzeitverzerrung vom Spektrum Abgespaltene. Wenn nämlich der Testschall innerhalb des Zeitfensters des Störschalls stattfindet, greift ja im oben genannten Beispiel der spektrale Verdeckungseffekt, der bei "Testschall nach Störschall" in die Nachverdeckung übergeht. Da es sich aber bei uns um explizit zwei verschiedene Spektralanteile handelt, sind die Nachverdeckungseffekte hier so gar nicht anwendbar? Oder doch?
Und dann betrachten die Untersuchungen zur Hörbarkeit von Gruppenlaufzeitverzerrungen ja immer eine konstante Gruppenlaufzeit, die schlagartig innerhalb eines Testfrequenzbandes erhöht wird. Im Fall einer Subtraktionsweiche ist das aber ein stetig fallender, weicher Verlauf. Das müsste den Effekt mildern.
zu 2. Da habe ich noch nichts begriffen. Da geht's um drei verschiedene Sinustöne unterschiedlicher Frequenz, sog. Dreitonkomplexe, die sich unterschiedlich anhören können (Klangfarbe, Rauhigkeit), wenn sie zueinander phasenverschoben werden. Da gibt's dann sowas wie einen effektiven Phasenwinkel, das ist wohl der Mittelwert der Phasenverschiebung zweier dieser drei Sinustöne zum dritten.
Damit ich den Effekt aber abschätzen kann, müsste ich wissen, welchen Frequenz- und Amplitudenbezug diese drei Teiltöne zueinander haben müssen und welche effektive Phase dann noch hörbar ist. Dann könnte ich versuchen, anhand des Frequenzgangs meiner Gruppenlaufzeit die effektive Phasenverschiebung bei unterschiedlichen Frequenzabweichungen zu berechnen und zu schauen, ob das im Hörbarkeitsbereich liegt oder nicht.
Weiß jemand dazu was? Ist das Unfug, was ich mir da laienhaft zusammenreime?
Viele Grüße
Gert
an verschiedenen Stellen kam hier im Forum die Diskussion über die Hörbarkeit von Gruppenlaufzeitverzerrungen in Gang. Es stellte sich die Frage, ab welcher zeitlichen Verschiebung unterschiedlicher Frequenzanteile diese Laufzeitverzerrungen hörbar werden.
Nun möchte ich mich bzgl. meiner Kenntnisse in Sachen Hörphysiologie als blutigen Anfänger bezeichnen, was die Experten auf diesem Gebiet wohl schon daran gemerkt haben dürften, dass ich an anderer Stelle einen stehenden Begriff dieser Fachrichtung, nämlich Nachhörschwelle, als Nachhörbarkeitsschwelle bezeichnet habe. So hoffe ich auf rege Unterstützung von seiten der mitlesenden und -schreibenden Experten wie z. B. Toningenieure, aber auch sonst jedem, der irgendwie sinnvoll etwas dazu beitragen kann.
Die Klärung dieser Frage ist für mich deshalb von Bedeutung, weil sie für die Erreichung einer möglichst hohen Wiedergabetreue, die wohl die meisten hier wie auch ich anstreben, die Notwendigkeit einer digitalen Laufzeitentzerrung unserer Aktivlautsprecher zwingend macht oder eben auch nicht. Wie schon berichtet, kann man mit entsprechend aufwändiger Analogtechnik, wie sie sich z. B. in Aktivboxen von Silbersand findet, die nahezu perfekte Phasengleichheit der einzelnen Lautsprecherwege zueinander herstellen. Eine Frequenzabhängigkeit der Laufzeit des Signals am Hörplatz aber bleibt. Um welche Größenordnung es geht, kann man in meiner Subtraktionsweichen-Vorstellung sehen. In meinem speziellen Fall geht es um eine Gruppenlaufzeit, die unter 150Hz mit knapp 4ms beginnt und bis zu 20kHz auf im Vergleich dazu vernachlässigbare Werte stetig absinkt.
Ich möchte diese Frage explizit losgelöst von der Diskussion über die meist raumakustisch notwendige Korrektur des Amplitudenfrequenzgangs betrachten. Dank Joes Linkliste stieß ich auf die Veröffentlichung von Sebastian Goossens vom IRT München, und begann davon ausgehend mich durch die Literatur zu graben. Mein bescheidener Wissensstand im Augenblick lässt sich so zusammenfassen:
Es gibt zwei verschiedene Aspekte in dieser Angelegenheit,
1. die Betrachtung des spektralen Auseinanderfallens der Flanke einer impuls- oder sprungartigen Anregung durch unterschiedliche Laufzeiten der Spektralanteile, und
2. die Betrachtung von periodischen Signalen, die zueinander eine Phasenverschiebung erfahren.
zu 1. Goossens versucht als Erklärungsansatz für die teilweise stark differierenden Hörbarkeitsschwellen in der Literatur folgenden Ansatz: Den zeitlichen Maskierungseffekt.
Den spektralen Maskierungseffekt kennen wir ja alle von der Datenkomprimiererei à la MP3. Störschall verdeckt Testschall, wenn im gleichen Frequenzbereich. Beim zeitlichen Maskierungseffekt, auch Vor- bzw. Nachverdeckung genannt, geht's um Folgendes:
Man sendet ein zeitlich begrenztes Störsignal aus, z. B. ein 200ms lang andauerndes Rauschsignal mit einem Spektrum von z. B. 100Hz bis 5kHz. Dies ist der Störschall. Der Testschall, also das Signal, das man hören will, aber evtl. durch die Verdeckung nicht hören kann, ist z. B. ein 10ms andauerndes Sinussignal bei 1 oder 2kHz. Der Nachverdeckungseffekt bewirkt nun, dass man, wenn der Testschall kurz nach dem Ende des Störschalls ausgesendet wird, dem Testschall einen höheren Pegel geben muss als ohne Störschall, damit er noch zu hören ist. Umso mehr, je kürzer der Startzeitpunkt des Testschalls nach dem Ende des Störschalls liegt. Was die Sache nicht einfacher macht, ist die Tatsache, dass das Verhältnis von Test- zu Störschall bei einer betrachteten Zeitdifferenz pegelabhängig ist.
Goossens betrachtet nun die Aufspaltung eines Impulses in zwei verschiedene Spektralanteile, die eine unterschiedliche Laufzeit erfahren. Am Ohr kommen diese beiden Anteile nun also zeitlich nacheinander an, und wenn der zweite Anteil noch in dem Zeitfenster liegt, das durch den Nachverdeckungseffekt maskiert ist, ist keine gehörmäßige Auswirkung auszumachen. Er filtert bei dieser Betrachtung übrigens das Spektrum der Impulsartigen Anregung mit einem Tiefpass, der die Zeitkonstante des zeitlichen Gehör-Auflösungsvermögens hat.
Hat jemand ein Gefühl dafür, ob dieser Effekt hier relevant wird? Außerdem: Die Untersuchungen der Nachhörschwellen benutzen ja immer einen Testschall, der spektral innerhalb des Störschalls angesiedelt ist. Also im Beispiel oben liegt der Testsinus innerhalb des Frequenzbandes des Störrauschens (100Hz-5kHz). Bei der Gruppenlaufzeitverzerrung ist das gerade nicht der Fall, der Testschall ist ja gerade das durch die Laufzeitverzerrung vom Spektrum Abgespaltene. Wenn nämlich der Testschall innerhalb des Zeitfensters des Störschalls stattfindet, greift ja im oben genannten Beispiel der spektrale Verdeckungseffekt, der bei "Testschall nach Störschall" in die Nachverdeckung übergeht. Da es sich aber bei uns um explizit zwei verschiedene Spektralanteile handelt, sind die Nachverdeckungseffekte hier so gar nicht anwendbar? Oder doch?
Und dann betrachten die Untersuchungen zur Hörbarkeit von Gruppenlaufzeitverzerrungen ja immer eine konstante Gruppenlaufzeit, die schlagartig innerhalb eines Testfrequenzbandes erhöht wird. Im Fall einer Subtraktionsweiche ist das aber ein stetig fallender, weicher Verlauf. Das müsste den Effekt mildern.
zu 2. Da habe ich noch nichts begriffen. Da geht's um drei verschiedene Sinustöne unterschiedlicher Frequenz, sog. Dreitonkomplexe, die sich unterschiedlich anhören können (Klangfarbe, Rauhigkeit), wenn sie zueinander phasenverschoben werden. Da gibt's dann sowas wie einen effektiven Phasenwinkel, das ist wohl der Mittelwert der Phasenverschiebung zweier dieser drei Sinustöne zum dritten.
Damit ich den Effekt aber abschätzen kann, müsste ich wissen, welchen Frequenz- und Amplitudenbezug diese drei Teiltöne zueinander haben müssen und welche effektive Phase dann noch hörbar ist. Dann könnte ich versuchen, anhand des Frequenzgangs meiner Gruppenlaufzeit die effektive Phasenverschiebung bei unterschiedlichen Frequenzabweichungen zu berechnen und zu schauen, ob das im Hörbarkeitsbereich liegt oder nicht.
Weiß jemand dazu was? Ist das Unfug, was ich mir da laienhaft zusammenreime?
Viele Grüße
Gert