Work in Progress
Die Vermeidung von IKL beim Kopfhörer-Hören hat es in sich. Ich will mal meine Überlegungen und Tests hier kurz darstellen. Ich bin wieder ein paar Schrittchen weiter, aber im Augenblick stecke ich mal wieder fest. Ideen / Tipps sind also sehr willkommen.
Ausgehend von den Hinweisen von Fujak und Uli in diesem Thread habe ich eine Aufnahme erstellt, so wie Uli sie vorgeschlagen hatte.
uli.brueggemann hat geschrieben:
Harald,
ich denke, dass es zuerst nötig wäre, mit zwei Ohrmikros gleichzeitig aufzuzeichnen. So dass man nicht nur zwei voneinander unabhängige Messungen vorliegen hat, sondern auch den zeitlichen Bezug genau kennt.
Das bedeutet also eine Stereo-Aufnahme (der Acourate-Logsweep-Recorder tut dies leider zur Zeit nicht, weil nicht dafür vorgesehen). Bei dieser Aufnahme erhält man dann eben bei Wiedergabe vom linken LS die jeweiligen Signale, wie sie beim jeweiligen Ohr ankommen. Um Mikro-Unterschiede zu erkennen/eliminieren müsste man eine zweite Aufnahme durchführen und dabei die Mikros vertauschen.
Hierzu habe ich mir ein
Soundman OKM II Classic Studio beschafft, den Logsweep (LogSweep48.wav die (((acourate))) unter eigene Dateien ablegt) mit foobar abgespielt und die Aufnahmen mit
Audacity aufgezeichnet.
Uli hat mir dann Filter gerechnet und mir die einzelnen Schritte mühsam erläutert. Ich bin jetzt etwas besser eingearbeitet in (((acourate))) und das Filterrechnen ist eine nette abendliche Beschäftigung geworden.
Ich will Euch hier nicht mit allen Schritten langweilen, sondern bleibe mal bei den grundsätzlichen Überlegungen. Hierzu nochmals das Bildchen mit der Stereo-Abhörsituation, die ich gerne mit dem Köpfhörer simulieren will.
Ich sehe im Wesentlichen drei Einflussfaktoren, die sich voneinander trennen lassen.
1. Die Laufzeitunterschiede zwischen den direkten und indirekten Pfaden
Ein Signal von L ist schneller beim linken Ohr O_L als beim rechten Ohr O_R. Also ist L--> O_R zeitversetzt nach L --> O_L. Mit dem von Uli vorgeschlagenen Verfahren lassen sich diese Laufzeitunterschiede (bei meinem Kopf ca. 0,19 ms) messen. Man kann sie in die Filter einbauen (z.B. mit der Funktion Sub-sampleshift), aber ich baue sie erst einmal nur in das VST Convolver Script (in Zeile 2 in meinem Beispiel oben) ein. Dann kann ich unabhängig von den Filtern mit diesem Parameter spielen.
Es zeigt sich, dass der räumliche Eindruck sehr empfindlich von diesem Laufzeitunterschied abhängt. Ist das Laufzeitdelta zu klein, dann entsteht IKL, ist es zu groß, wird der Raumeindruck diffus, manchmal ist die Lokalisation sogar hinter dem Kopf.
2. Lautstärkeunterschiede zwischen den direkten und indirekten Pfaden
Das indirekte Signal L --> O_R ist leiser als das direkte Signal L --> O_L. Der Weg ist etwas weiter, der Kopf ist „dazwischen“ und dämpft. Das lässt sich ebenfalls messen. Ich isoliere diesen Effekt, indem ich im Kanalmixer …
… den „Rear Volume“ Regler nach links ziehe und damit die indirekten Pfade leiser mache.
Ist die Lautstärke der indirekten Pfade 0 (Regler ganz links), dann kommen nur die direkten Pfade durch und mein Höreindruck ist wie sonst bei Kopfhörern, links von rechts getrennt, als wäre die Welt in zwei getrennte Halbwelten gespalten durch eine schallundurchlässige Platte, die quer durch meinen Kopf geht.
Ist der Regler wie im Bild bei 1.00 dann ist das natürlich auch nicht gut: direkte und indirekte Pfade sind gleich laut und der Höreindruck ist vernebelt-unräumlich. Bei einer Zwischenstellung von z.B. 0.75 ist der Höreindruck räumlich klarer. Die richtige Einstellung ist – bei meinen Experimenten – auch abhängig von der jeweiligen Aufnahme. Wenn die Durchmischung von direkten und indirekten Pfaden stimmt, rastet der räumliche Höreindruck ein. Die Musik ist dann in sich räumlich richtig, was nicht heißt, dass sie außerhalb des Kopfes lokalisiert ist. Dazu benötigt man die anderen Einflussfaktoren.
3. Modifikation des Frequenzganges und der Phaseninformationen durch die Kopf-Ohr-Struktur
Wenn ein „über eines der Pfade laufendes“ Signal* mit der Kopf-Ohr-Situation interagiert, haben wir den dritten Effekt. Der Frequenzgang dieses Pfad-Signales verändert sich und auch sein Phasenspektrum. Dabei fasse ich die Pfad-Signale so auf, wie ich sie messe: entscheidend ist dabei, was am jeweiligen Ohr ankommt.
*Der am Ohr resultierende Schalldruck ist damit ein Produkt des Raumgeschehens, von isolierten Pfaden spreche ich nur, um die Bezeichnungen zu vereinfachen.
Ich habe mich nun gefragt, wie man diesen Effekt wohl isolieren kann, ohne gleich wieder an den Einflussfaktoren 1 und 2 herumspielen zu müssen. Dabei ist mir das Hören einer Mono-Quelle frontal vor dem Hörplatz eingefallen. In einem solchen Fall orten wir die Quelle C (für Center) doch auch außerhalb unseres Kopfes. (Wohingegen das Abspielen von Mono-Aufnahmen mit Stereokopfhörer ohne Korrektur besonders schrecklich ist für mich: Das Orchester schrumpft auf einem Punkt in meinem Kopf zusammen
)
Wenn es also gelingt, eine Mono-Abspielsituation über Stereo-Kopfhörer zu simulieren (= Augen zu und es hört sich so an, als wäre der Mono-LS vor mir im Raum), sind wir am Ziel. Denn für die Stereo-Abspielsituation brauchen wir diesen Effekt eben zweimal für die zwei LS und dazu die wie oben beschriebene Kombination mit den Einflussfaktoren 1 und 2.
Wenn man sich das anschaut, wird klar, dass es keinen Sinn macht, zwischen direktem und indirektem Pfad zu unterscheiden. C --> O_L und C --> O_R sind symmetrisch. Wenn wir den Mono-LS dann verschieben bekommen wir die einzelnen Kanäle der Stereo-Situation oder beliebige andere Surround-Konfigurationen.
Mit meinen Soundman Mikrofonen habe ich solche Mono-Konfigurationen gemessen. Mit und ohne meinen Kopf (also einmal als Ohrmikrofone und einmal auf Mikrofonstative montiert). Die resultierenden Pulse habe teils direkt zu FIR verarbeitet, teils habe ich vorher versucht, die Rauminformationen aus den Pulsantworten vorher zu eliminieren (z.B. durch Ohrsignal minus Raumsignal). Letzteres bewährt sich bei meinen Experimenten nicht. Offenbar macht es Sinn das durch den Raum verdrehte Signal erst einmal mitzuschleppen. In einem späteren Schritt würde ich dann gerne mal mit verschiedenen Raum-LS-Situationen experimentieren. Vielleicht auch mal mit einem (sog.) schalltoten Raum.
Ich habe nun mit verschiedenen Fensterungen experimentiert und auch den Frequenzbereich eingeschränkt. Besonders wichtig für die Ortung sind die Frequenzen im Bereich oberhalb 400 Hz und unterhalb 3000 Hz. (Ich fenstere daher mit TD-Functions > Frequency dependend window z.B. mit 1 / 100, 1 / 100. D.h. niedrigere Frequenzen werden mit schmalerer Fensterbreite, höhere mit breiterer Fensterbreite gefenstert.)
Das wundert mich eigentlich, denn bei 3000 Hz haben wir Wellenlängen von 11,4 cm und man ist eigentlich da erst in der Nähe des Ohrabstandes 12+cm. Daher hätte ich vermutet, dass die Frequenzen oberhalb von 3000 Hz auch sehr wichtig sind.
Jedenfalls „sehen“ solche Filter „aus“, wie folgt:
Bei der Abspielsituation mit solchen Filtern muss darauf geachtet werden, dass man Mono-Filter hat und dass das verarbeitete Audio-Signal auch wirklich mono ist (ich verwende wieder den VST-Convolver und nutze für den Input lediglich einen Kanal einer Stereo-Quelle; Output ist dann natürlich Stereo für die beiden Ohren).
Nun zum Höreindruck. Bei Filtern unterhalb 400 Hz tut sich sehr wenig, außer dass störende Rauminformationen hinzukommen. Im Frequenzbereich zwischen 400 und 3000 Hz entsteht tatsächlich ein räumlicher Eindruck. Wenn ich die Augen schließe und ehrlich bin, ist der Lautsprecher vor mir, allerdings näher als in der realen Logsweepsituation und auch wesentlich verkleinert. Er sitzt mir aber auch nicht mehr direkt auf der Nase. Es hört sich sehr danach an, als käme alles aus einer Holzkiste vor mir in etwa 60 cm Abstand.
Wenn ich die drei Einflussfaktoren kombiniere, erhalte ich – gegenüber der Situation Ende November – einen wesentlich verbesserten räumlichen Höreindruck. Das Klanggeschehen ist jetzt nicht mehr räumlich verschränkt, was ich auf meinen naiven Umgang mit (((acourate))) zurückführe. Es klingt, als säßen die Musiker vor mir und auch nicht mehr direkt auf meiner Nase sondern etwas weiter von mir entfernt. Allerdings ist der Qualitätsverlust sehr hoch und alles ist zwar räumlich richtig aber klein-klein.
Nächste Schritte:
In den nächsten Wochen will ich noch ein paar Experimente machen, mit anderen Ohrmikros und anderen Frequenzbereichen. Mittelfristig würde mich auch die Variation der Rauminfo interessieren, sprich Experimente mit anderen Abhörsituationen.
Ich sehe aber auch, dass ich durch reines Herumprobieren nicht mehr weiterkomme. Daher werde ich mich jetzt mehr mit der einschlägigen Theorie zum Thema beschäftigen müssen.
Andererseits wäre es schön, wenn von Euch der eine oder andere Hinweis käme. Das hat immer sehr viel weitergeholfen.
Viele Grüße
Harald