[0001] Die Erfindung bezieht sich auf ein 3D-Stereopaltmikrofon gemäß Anspruch 1.
[0002] Zur Aufzeichnung und Wiedergabe von Geräusche und Tönen sind seit über einem Jahrhundert
elektromechanische Wandler bekannt, die als Mikrofon Bewegungen von Luftmolekülen
in elektrische Signale umsetzen, die aufbereitet und gespeichert werden. Zu einem
wählbaren Zeitpunkt können die gespeicherten Signale abgerufen und über andere - als
Lautsprecher bezeichnete - elektromechanische Wandler wieder zurück in Schall - also
in Bewegungen von Luftmolekülen - umgewandelt werden.
[0003] Seit März 2006 existiert von der DEUTSCHEN GESELLSCHAFT FÜR AKUSTIK e.V., Voltastr.5,
Geb. 10-6, 13355 Berlin die DEGA-Empfehlung 101: Akustische Wellen und Felder. Darin
ist auf S. A10 über die Hörakustik zu lesen: "Wenn jedoch
komplexe Wahrnehmungen auszuwerten sind, z.B. bei der Qualitätsbeurteilung von Lautsprecherboxen,
kann auf
subjektive Tests nach wie vor nicht verzichtet werden." Auf die menschliche Wahrnehmung bezogen,
sind die zahlreichen, derzeit üblichen Fachbegriffe zur Darstellung in den physikalischen,
elektrischen und mechanischen Fachbereichsebenen eher verwirrend. Deshalb wird in
diesem Patentantrag als Oberbegriff für die Hörakustik-Darstellung das Wort "Information"
bevorzugt, das gemäß seinem lateinischen Ursprung in Transkription die "In-Form-Machung"
von Schallereignissen ist. Die darin enthaltene, vierfache Komplexität der menschlichen
Wahrnehmung von "Ort und Form und Klang und Umgebung" ersetzt die in den meisten Fachbereichen
verwendeten Begriffe wie Signal, Nachricht, Muster, Gestalt, Knall, Geräusche, Töne,
Klänge und räumlichlbinaurales Hören.
[0004] Das ursprüngliche Ziel ist, bei der Wiedergabe am Ohr des hörenden Menschen so exakt
wie möglich die gleichen Formbewegungen der Luftbestandteile zu erzeugen, die dann
am Ohr angekommen wären, wenn der Hörende persönlich und direkt das jeweilige Geräusch
vernommen hätte. Dafür müssen die Informationen über alle einzelnen Bewegungen in
der Luft idealerweise vollständig und formgenau gespeichert und wiedergegeben werden.
[0005] Auf aktuellem Stand der Technik gelangt in der Praxis jedoch stets auf dem Weg von
der ersten Umwandlung im Mikrofon über die Bearbeitung und Speicherung der elektrischen
Schall-Information und der zweiten Umwandlung im Lautsprecher nur ein mehr oder weniger
großer Anteil der Bewegungsinformationen ohne Verfälschung zurück in tatsächliche
Luftbewegungen. Interessant ist, dass das gehörangepasste Audiokodierverfahren als
"
nicht Kurvenform - erhaltend" in der Literatur beschrieben wird (
Thomas Sporer, Tech. Fakultät Universität Erlangen-Nürnberg-Ilmenau, Dissertation
1998, S.8).
[0006] Um zu zeigen, dass konventionelle Lautsprechersysteme und die bisher bekannten Mikrofone
nur einfache Kurvenformen übertragen können, ist eine vergleichsweise sehr ausführliche
Beschreibung der physikalischen Grundlagen und des bisher erreichten Standes der Technik
erforderlich. Erst auf dieser Grundlage wird das Ziel dieser Erfindung erkennbar und
nachvollziehbar, bei dem auch die vektoriellen Informationen in richtungsbezogener
Formbewegung garantiert werden, so dass der Zuhörer zu den Klängen und Tönen auch
deren Schallort und deren Formidentität formgenau, und damit lebensecht in 3D erfahren
kann.
[0007] Auf aktuellem Stand der Technik wird es fast ausschließlich als die Aufgabe von Schallwandlern
angesehen, periodische Schwingungen umzuwandeln, und zwar sowohl bei der Umwandlung
von Schall in elektrische Spannungen - also einem Mikrofon - als auch bei der Umwandlung
von elektrischen Spannungen in Schall - also bei einem Lautsprecher. Alle Kurvenform-Details
im Schall werden deshalb fast immer als eine Überlagerung aus Wellen oder Schwingungen
mit verschiedenen Amplituden und Frequenzen dargestellt.
[0008] Dabei wird jedoch vernachlässigt, dass Schall bereits bei der geringsten Bewegung
eines Luftmoleküls entsteht. Dem entsprechend zeigen neueste Erkenntnisse, dass diese
nur auf Wellen, Schwingungen und andere periodische Bewegungsformen fokussierte Betrachtungsweise
zu eng ist, denn genau genommen ist schon die Bewegung eines einzigen Luftmoleküls
bereits Schall.
[0009] Es ist also eine ganz wesentliche Erkenntnis, die die Basis der bisherigen Hörakustik
grundlegend erweitert, dass auch eine nicht periodische Bewegungsform der Luftmoleküle
Information im Schall ist und bei der Auslegung von elektromechanischen Wandlern unbedingt
mit beachtet werden muss. Deshalb ist es für höchste Ansprüche an Schallwandler sinnvoll,
ihre Eigenschaften und Fähigkeiten in Bezug auf nichtperiodische und periodische Bewegungsformen
zu prüfen und zu optimieren.
[0010] Zur Charakterisierung von Schall muss der jeweilige Umkreis der folgenden drei Begriffen
näher untersucht werden, nämlich "Ruhe" und "Impuls" und "Schwingung oder Welle".
Bisher wurde beim Thema Schall vorrangig nur die Schwingung als eine stationäre, körperhafte
und periodische Bewegungsform betrachtet.
[0011] Dieser Horizont ist eindeutig zu eng und muss auf nichtperiodische Bewegungsformen
sowie den Gegensatz zu diesen Bewegungsformen ergänzt werden, nämlich die "Ruhe".
Dabei ist die "Ruhe" zunächst einmal durch den quasi statischen Druck der Umgebungsluft
definiert, also 1413 Hektopascal.
[0012] Die darin stattfindende "Braun'sche Bewegung" der Luftmoleküle ist genau genommen
bereits eine Form von Schall, die auch als "Grundrauschen" bezeichnet wird. Es ist
bekannt, dass zum "Wohlbefinden", also zum Normalzustand des Gehörs die Wahrnehmung
dieses Grundrauschens zählt. Versuche haben gezeigt, dass Personen, die längere Zeit
von dem Grundrauschen ferngehalten wurden, das als Belastung empfinden. Das menschliche
Gehör nimmt das Grundrauschen also deutlich wahr, stuft es aber bei der Auswertung
im Gehirn als geradliniges Bewegungsform-Rauschen einer unauffälligen Umgebung und
damit nicht als Schall ein.
[0013] Erst wenn sich ein Schall impuls als Kurvenformabweichung aus diesem Grundrauschen
heraushebt, wird die Kurvenform als momentan neue Schall-Information bewertet. Daraus
entsteht ein Erkennungs"Ansatz" für die vierfache Schall-Information aus Ort, Form,
Klang und Umgebung in gesamtheitlicher Hörwahrnehmung. Diese, im Englischen auch "Onset"
genannte mechanische Impulsänderung im Schall überschreitet das Grundrauschen, das
also auch eine Grundhörschwelle, oder eine Überwachungs-Nulllinie ist. Dieser Zusammenhang
ist ein eindeutiger Nachweis für die bisher deutlich unterschätzten Fähigkeiten des
menschlichen Hörorgans und insbesondere von deren Auswertung im Gehirn in seiner zeitlich
vierschichtigen komplexen Auswertung in zeitlicher Folge, wie auch Figur 1 zeigt.
[0014] Das vorgenannte Beispiel zeigt, dass bereits erstaunlich geringe Luftbewegungen vom
menschlichen Gehör aufgenommen und ausgewertet werden. Deshalb muss für die Definition
einer Schallwandlung von höchstmöglicher Güte, also einer Schallwandlung, die im Idealfall
überhaupt nicht mehr als solche vom menschlichen Gehör wahrnehmbar ist, nochmals auf
die primäre physikalische Ursache der menschlichen Wahrnehmung von Schall eingegangen
werden.
[0015] Das führt zwangsläufig zu den Newton'schen Gesetzen als dem Grundgesetz der klassischen
Mechanik: Der Begriff der "Ruhe" steht in Beziehung zum Newton'schen Trägheitsgesetz.
Es sagt: "Alle Körper verharren bei Nichteinwirkung von Kräften im Zustand der Ruhe
oder im Zustand der gleichförmigen
gradlinigen Bewegung." Interessant ist, dass das Trägheitsgesetz bereits für die Schallinformation
und für die Konstruktion von Schallwandlern von allergrößter Bedeutung ist. Denn in
der Gehörschnecke im Innenohr des Menschen befindet sich eine
gradlinige Messstrecke, die durch die bipolaren inneren Haarzellen, die 1HZ, gebildet werden,
an denen sich alle Form
abweichungen in Richtung und Amplitude als Vektor-Größen abbilden.
[0016] Die Bewegung der Masse, die ein Körper enthält, wird im deutschen Sprachgebrauch
als "Impuls" bezeichnet, in anderen Sprachen auch als "Momentum". So wie die Geschwindigkeit
dieser Bewegung ist der Impuls eine Vektorgröße, hat also neben einem Betrag auch
eine Richtung.
[0017] In Newtons Mechanik ist der Impuls
p eines Teilchens das Produkt aus seiner Masse
m und seiner Geschwindigkeit
v :
Definition: Impulszustand p = m·v
[0018] Impuls und Geschwindigkeit sind dabei jeweils Vektoren mit einem bestimmten Betrag
und einer bestimmtem Richtung.
[0019] Im Gegensatz zum Impuls
zustand ist jedoch die Impuls
änderung von entscheidender Bedeutung bei der Entstehung einer Schallbewegung, denn erst dadurch
wird der schallgebende Körper in seinem Massevolumen ver
formt und/oder
beschleunigt, weil Kräfte auf zweierlei Weise ihre Wirkung auf Körper ausüben.
[0020] Wichtig für die Schallbewegungs-
Änderung ist das dynamische Kraftgesetz oder Aktionsgesetz von Newton. Es wird auch das "Grundgesetz
der Dynamit" genannt und bildet die Grundlage beim Aufstellen der Bewegungsgleichungen
für zahlreiche Systeme der Mechanik, also auch für Schallbewegungen in der Luft: "Die
Änderung der Bewegung einer Masse ist der Einwirkung der bewegenden Kraft proportional
und geschieht nach der Richtung derjenigen geraden Linie, nach welcher jene Kraft
wirkt."
[0021] Oder in einer
F̅ormel ausgedrückt: Die eine Bewegungsänderung bewirkende Kraft
F ist der Impuls
änderung über Zeitänderung bei Massenkonstanz
m proportional:
mit der Definition der Krafteinheit F = m · a
oder Kraft = Masse · Beschleunigung
Durch einen Kraftstoß von 1 N· s wird an einem Körper eine Impuls-änderung von 1 kg · m/s hervorgerufen.
[0022] In der Newtonschen Formel kommt klar zum Ausdruck, dass gekennzeichnete Größen Vektoren
sind, also im Raum gerichtete Größen. Das gilt auch für Schallbewegungen.
[0023] Um die Verluste an Informationen bei konventionellen Schallwandlern bewerten zu können,
muss auch grundlegend abgeklärt werden, welche Informationen das menschliche Ohr beim
"Hören" überhaupt erhält und wie es sie auswertet. Es ist Teil des Allgemeinwissens,
dass das menschliche Gehör unterschiedliche Töne aus einem Gemisch von sinusförmigen
Schallwellen mit unterschiedlichen Frequenzen und Amplituden voneinander unterscheidet,
wie sie z.B. von Musikinstrumenten erzeugt werden. Auf diese Weise wird beim Hören
das Klangbild einer Oboe von dem einer Geige differenziert.
[0024] Es setzt sich immer mehr die Erkenntnis durch, dass das menschliche Gehör keineswegs
ausschließlich auf das Erfassen von stationären, periodischen Schwingungen der Luft
beschränkt ist. Eine nicht minder bedeutungsvolle Aufgabe des Gehörs ist vielmehr
auch das Erkennen von kurzzeitigen, dynamischen Luftdruckänderungen, sog. Transienten.
Sie entstehen bei Geräuschen wie dem Knacken eines Zweiges oder dem Abschuss einer
Gewehrkugel.
[0025] Es ist heute allgemein anerkannt, dass der Mensch auch über einen Erkennungsmechanismus
für derartige Geräusche verfügt. Bemerkenswert ist, dass diese Erkennung sehr viel
schneller anspricht und viel früher zu der Wahrnehmung einer "gehörten Information"
führt, als dies bei Sinusschwingungen der Fall ist.
[0026] Bereits winzige Änderungen in der statischen Luftdruckverteilung, die z.B. durch
die Kraftwirkung eines brechenden Zweiges oder eines aufprallenden Gegenstandes entstehen,
werden vom Menschen nicht nur sofort erkannt, sondern können auch nach einer - ansonsten
nicht wahrnehmbar kurzen Zeit - zeitgenau nach ihrer Richtung beurteilt werden.
[0027] Die Erklärung dafür ist ein über viele Entwicklungsstufen des Gehörs und des Gehirns
hinweg ausgebildeter Alarmmechanismus. Die Ursprünge menschlicher Hörleistungen sind
Alarmmeldungen, die dazu dienen, eine Gefahr zu orten und in ihren Charakter zu bestimmen.
In der Evolution der Primaten haben sich diejenigen Individuen durchgesetzt, die ihren
"Freßfeind" so frühzeitig bemerkten und so rechtzeitig lokalisieren konnten, dass
sie ihm erfolgreich entkamen.
[0028] Deshalb beherrscht das Gehirn des modernen Menschen als einen "Kunstgriff" zur Identifikation
der Richtung des Initialgeräusches, dass der Pegel des primären Geräuschimpulses auf
seinem Weg zum Gehirn von darauf spezialisierten Nervenzellen bis auf das dreißigfache
verstärkt wird. Der Impuls hebt sich während dieser Zeit überdeutlich vom Normalpegel
ab und kehrt wenige Millisekunden danach wieder in den Normalzustand zurück, in dem
sich das Gehör vorrangig auf die Wahrnehmung periodischer Signale wie z.B. Tönen fokussiert
ist.
[0029] Währendessen können im Gehirn die Signale des linken und des rechten Ohres miteinander
verglichen und ausgewertet werden, so dass die Richtung des Geräuschimpulses lokalisiert
werden kann. Diese Fähigkeit ist auch als binaurales Hören bekannt.
[0030] Bei allen Schallsignalen, die nicht frontal von vorne auf den menschlichen Kopf auftreffen,
sondern aus anderen Richtungen kommen, entstehen sog. interaurale Laufzeitdifferenzen
(ITD) und sog. interaurale Pegeldifferenzen (ILD).
[0031] Laufzeitdifferenzen können durch das menschliche Gehör bereits ab einer Größe von
10µs zur Richtungslokalisation ausgewertet werden, was einer Lokalisationsschärfe
von etwa einem Grad entspricht. Bis zu einer Laufzeitdifferenz von 630µs erhöht sich
die Lokalisation in etwa proportional zum Laufzeitunterschied. Eine Laufzeitdifferenz
von 630µs entspricht einer Wegstreckendifferenz des Schalls von 21,5cm. Diese Größe
wird auch "Hornbostel-Wertheimer Konstante" genannt und entspricht dem durchschnittlichen
Abstand der beiden Ohren am menschlichen Kopf.
[0032] Bei relativ langsam ansteigenden Impulsen wertet das Gehirn vorrangig die Phasendifferenzen
zwischen den Signalen der beiden Ohren aus und bestimmt daraus die interaurale Laufzeitdifferenz
(ITD).
[0033] Bei sehr schnell ansteigenden Impulsen basiert die Lokalisation auf der Auswertung
interauraler Pegeldifferenzen ILD, sowie auf der Auswertung interauraler Gruppenlaufzeit-Differenzen,
also den Laufzeitdifferenzen der Signal-Hüllkurven.
[0034] In einem dazwischen liegenden Bereich mittlerer Steilheit überlappt sich der Wirkungsbereich
der beteiligten Effekte. Mit zunehmender Steilheit des Impulses wird der Winkelbereich,
in dem interaurale Phasendifferenzen ausgewertet werden können, immer kleiner. Dafür
steigt die Größe der interauralen Pegeldifferenzen.
[0035] Zu diesen Abläufen schreibt auch
F. Pfander "Das Knalltrauma", Springer 1975, Berlin und "
Das Schalltrauma", BMdV Bonn 1994. In Anlehnung daran zeigt Fig. 1 den Verlauf des Luftdrucks in Abhängigkeit von der
Zeit am Ohr eines Zuhörers, wenn in einem gewissen Abstand von diesem durch eine einmalige,
rechteckförmige Krafteinwirkung eine dynamische Luftdruckänderung erzeugt wird, nachfolgend
auch kurz als "dynamische Druckänderung" bezeichnet. Umgangssprachlich wird eine solche
dynamische Druckänderung auch "Knall" genannt.
[0036] Sie hat ihren Ursprung im sog. Onset-Zeitpunkt
t0, von dem aus der Luftdruck zunächst innerhalb des Zeitintervalls
t0 - t1 bis zum höchsten Druckwert
Pm ansteigt. Darauf folgt ein aperiodischer Druckausgleich, währenddessen der Luftdruck
ab dem Zeitpunkt
t2 unter den atmosphärischen Luftdruck
Pa absinkt und erst zum Zeitpunkt
tv wieder auf den atmosphärischen Luftdruck
Pa angestiegen ist.
[0037] Der Verlauf dieser Druckänderung lässt sich in vier verschiedene charakteristische
Zeitzonen einteilen, die durch unterschiedliche phänomenologische Wirkung beim Menschen
gekennzeichnet sind. Während des ersten Druckänderungsbereiches im Zeitintervall
t0 - t1 beschleunigt die im Onset-Zeitpunkt
t0 einwirkende Kraft die relevanten Luftmassen.
[0038] Diese Beschleunigung ist auch als zeitliche Änderung der Geschwindigkeit zu bezeichnen.
Je nach der Größe des maximalen Druckwertes
Pm bewirken die mit variabler Geschwindigkeit bewegten Luftmoleküle im menschlichen
Gehör den Eindruck eines "Knalls" oder eines "Knackens".
[0039] Zusätzlich zu der Information, dass überhaupt ein Geräusch zu hören ist, leitet das
menschliche Gehör aus dem Laufzeitunterschied des Schalls zwischen den beiden Ohren
die Information über den räumliche Ursprung des Schalls ab, indem es die Richtung
ermittelt, aus der er kommt. Dazu ist es bereits innerhalb des Zeitintervalls
t0 - t1 in der Lage, da - wie zuvor bereits erwähnt - der maximal erkennbare Laufzeitunterschied
des Schalls bei der Auswertung über beide Ohren ca. 630 µs betragen kann, wenn ein
durchschnittlicher Ohrabstand von 21 cm, eine Schallgeschwindigkeit von 343 m/s und
ein genau seitlicher Einfall des Schalls in Richtung einer - gedachten - Verbindungslinie
zwischen beiden Ohren vorausgesetzt werden kann.
[0040] Nach der Messung der Richtung des Schalls konzentriert sich das Gehirn in einer zweiten
Zeitzone
t1 - tv auf die Erkennung der Ursache des Schallimpulses. Typisch für diese Zeitzone ist
der Ausgleich des maximal erreichten Luftdruckwertes
Pm. Dieser Druckausgleich erzeugt ein weiteres Geräusch, das einem sog. "ausklingenden
Grundton" ähnelt.
[0041] Der Begriff "Grundton" bezieht sich auf die Musik, die sich primär mit "Tönen" beschäftigt,
also mit periodischen Schwingungen. Diese Schwingungen sind in der Praxis fast nie
genau sinusförmig, lassen sich aber in eine Summe aus zahlreichen Sinusschwingungen
zerlegen, was als Fourier-Analyse bezeichnet wird.
[0042] Die sich dabei ergebende Schwingung mit der tiefsten Frequenz - also mit der längsten
Periodendauer - wird als "Grundton" bezeichnet. Alle anderen Schwingungen mit höheren
Frequenzen sind sog. "Obertöne". Der "Grundton" bestimmt die wahrgenommene Tonhöhe,
während die mitschwingenden "Obertöne" die Klangfarbe des Tones bestimmen. Sind die
Obertöne eher gering ausgeprägt, spricht man von einem "grundtönigen" Klang.
[0043] In der zweiten Zeitzone
t1 - tv hängt die Art des von den Hörorganen aufgenommenen Grundtons u. a. von der zeitlich
transportierten Energie der Sprunganregung ab.
[0044] Versuche haben das überraschende Ergebnis erbracht, dass in der zweiten Zeitzone
t1 - tv die Druckänderung in Form eines "ausklingenden Grundtons" in den Hörbereichen des
Gehirns fast gar keine Tonhöhen-Empfindung bewirkt, obwohl eine Druckänderung von
gleichem Verlauf in der vierten Zeitzone - etwa 30 ms nach
t0 - sehr wohl als Ton empfunden wird. Deshalb werden die beiden Zeitzonen von
t0 - tv auch als sog. "Verdeckungszeit" bezeichnet. Obwohl die Druckänderung in der zweiten
Zeitzone
t1 - tv periodisch und nicht sprungartig abläuft ist vor dem Erreichen des Zeitpunkts
tv kein Tonhöhen-Empfinden möglich. Stattdessen ist das Gehirn vorrangig auf die Erkennung
der Art des Geräusches fokussiert.
[0045] Erwachsene können in dieser zweiten Zeitzone bereits z.B. eine Trompete von einer
Geige unterscheiden. Das ist insbesondere deshalb bemerkenswert, weil bei einem kontinuierlichen
Ton diese beiden Arten von Musikinstrumenten sehr geringe Unterschiede in ihrem Klang
aufweisen. In dieser Zeit hat im Gehirn der Vergleich mit erlernten Geräuschmustern
den Vorrang.
[0046] Die Dauer der Verdeckungszeit beträgt je nach Anregung z. B. 10 ms bis 22 ms, was
bei einer sinus- oder cosinusförmigen Onset-Anregung einer Anzahl von rund 9 bis 22
Perioden einer 1 kHz-Sinusschwingung entspricht.
Vor Ablauf dieses Zeitintervalls
t0 - tv sind nach genauen empirischen Erkenntnissen des Erfinders nur der Ort und die Art
einer Schallquelle wahrnehmbar.
[0047] Die dritte Zeitzone ist der sog. Unschärfebereich um den Zeitpunkt
tv herum. In dieser Zeitzone ist das Gehirn bei der Auswertung der Druckänderungen nicht
mehr auf Vergleiche mit Geräuschmustern beschränkt, sondern es setzt die Tonhöhenempfindung
ein. Der Unschärfebereich beginnt - je nach Individuum etwa 10ms nach dem Onset-Zeitpunkt
t0 und endet spätestens etwa 30 ms nach
t0.
[0048] Erst in der folgenden, vierten Zeitzone, also - etwa 30 ms nach
t0 - analysiert das Gehirn die Druckänderungen vorrangig auf die darin enthaltenen Frequenzen
und deren Anteil am Frequenzspektrum. Erst nach diesem Zeitpunkt setzt im Gehirn das
ein, was bisher oft alleine unter "Hören" verstanden wurde.
[0049] Tatsächlich besteht das Hören jedoch aus der ersten Zeitzone, die mit dem Onset zum
Zeitpunkt
t0 beginnt und die etwa bis zum Zeitpunkt
t1 fast ausschließlich für den angeborenen Gehirnprozess zum Ortserkennen der Schallquelle
reserviert ist. Der zweite Teil des "Hörens" ist die zweite Zeitzone
t1 - tv, die vor allem zum Vergleich mit erlernten Geräuschmustern genutzt wird. Erst in
der dritten Zeitzone, dem Unschärfebereich von etwa 10ms bis etwa 30ms nach
t0, werden diese Prozesse abgeschlossen und die vierte Zeitzone mit dem Erkennen von
Tonhöhen und Klangfarben beginnt.
[0050] Von diesen vier Zeitzonen des Hörens werden die ersten drei auch heute noch oft verkannt.
Eine Erklärung dafür ist, dass während dieser drei ersten Zeitzonen Tonhöhen und Klangfarben
fast gar nicht wahrgenommen werden, bei der Auswertung im Gehirn also "verdeckt" sind.
Die bis heute überwiegend betrachtete Frequenzanalyse von Tönen und Klängen setzt
erst nach dem Ablauf der vom Geräusch ausgelösten Verdeckungszeit
tv ein, die mit dem Onset-Zeitpunkt
t0 beginnt.
[0051] Im Folgenden wird ein weiterer, wichtiger Effekt beim "Hören" beschrieben, der deutlicht
macht, dass das menschliche Gehör über Fähigkeiten verfügt, die über das Wahrnehmen
von gleichmäßigen periodischen Bewegungen weit hinausgehen. Es ist bekannt, dass das
Gehör einem harmonischen Klang eine Tonhöhe zuordnet, deren Frequenz dem bereits erwähnten
Grundton entspricht. Bei der Zerlegung eines Klanges in eine Vielzahl von sinusförmigen
Schwingungen, auch Teiltöne genannt, ist der sog. Grundton der Teilton mit der niedrigsten
Frequenz.
[0052] Dass beim Hören von allen Teiltönen, die der Klang enthält, gerade der Unterste zum
Leitton gemacht wird, der dann durch seine Tonhöhe den ganzen Klang prägt, könnte
ja dadurch zu erklären sein, dass bei den meisten Klängen der Grundton derjenige Teilton
mit der größten Amplitude ist. Und in der Regel dominiert unter den Teiltönen der
Grundton tatsächlich.
[0053] Deshalb hat man bis vor wenigen Jahrzehnten geglaubt, dass der Grundton aufgrund
seiner spektralen Dominanz die Tonhöhe des ganzen Klanges bestimme. Das folgend beschriebene
Experiment zeigt sehr eindrucksvoll, dass dem nicht so ist: Wenn ein elektronisch
erzeugter, sägezahnförmiger Ton über einen Lautsprecher ausgestrahlt wird, empfindet
das Gehör die Tonhöhe dieses harmonischen Klanges erwartungsgemäß mit der Frequenz
des Grundtons. Und tatsächlich ist hier der Grundton auch mit der weitaus größten
Amplitude im Klangspektrum enthalten.
[0054] Wenn im nächsten Schritt des Versuches der Grundton elektronisch herausgefiltert
wird, entsteht ein Ton, dessen tiefster Teilton nunmehr die doppelte Frequenz des
Grundtones und die größte Amplitude aufweist. Eigentlich wäre im ersten Ansatz zu
erwarten, dass dieser verstümmelte Klang deshalb eine Oktave höher klingen würde als
der ursprüngliche, sägezahnförmige Ton. Das ist aber nicht der Fall. Zwar verliert
der Klang viel von seiner tiefen, vollen Klangfarbe, aber seine Klangtonhöhe ist eindeutig
die gleiche geblieben, nämlich die des - nun nicht mehr im Spektrum enthaltenen -
Grundtons.
[0055] Es ist also davon auszugehen, dass das Gehör die Klangtonhöhe aus der Gesamtheit
der Teiltöne bestimmen kann. Im Hörzentrum des Gehirns ist die Erfahrung abgespeichert,
dass ein harmonischer Klang stets aus Teiltönen besteht und dass in einem Klang meistens
der Grundton dominiert, weshalb grundsätzlich dem Klang die Tonhöhe des Grundtons
zugeordnet wird. Erscheint dem Gehör nun ein Klang, in dem der Grundton nicht dominiert
oder gar fehlt, so rekonstruiert es dennoch den gewohnten Klang aus den vorliegenden
Informationen, nämlich aus den übrigen Teiltönen. Das Gehör extrapoliert gewissermaßen
den fehlenden Grundton, indem es aus der Systematik der vorhandenen Harmonischen auf
das Vorhandensein eines Grundtons schließt.
[0056] Auch andere menschliche Sinnesorgane besitzen ähnliche Fähigkeiten, und zwar vorzugsweise
für zeitlich stationäre Ereignisse. Z.B. hat das menschliche Gehirn ein gutes Gedächtnis
für Bildeindrücke, weniger jedoch für deren zeitliche Folge. Dem entsprechend dient
auch der "Spektralapparat Gehör" wie jeder andere Spektralapparat dazu, zeitliche
Veränderungen als stationäre Ereignisse darzustellen. Es könnte also sein, dass der
Aufwand der Spektralanalyse der Schallbewegungen im Ohr dazu dient, stationäre und
damit lern- und speicherbare Informationen zu erhalten.
[0057] Wenn Schallereignisse auf das Trommelfell des menschlichen Ohres treffen, werden
sie über Hammer, Amboss und Steigbügel mechanisch um das etwa 22-fache verstärkt als
mechanische Schwingungen an die Hörschnecke weitergeleitet. Die Hörschnecke besteht
- auseinander gerollt und vereinfacht beschrieben - aus drei parallel verlaufenden,
flexiblen Schläuchen, auch Scala genannt. Der mittlere der drei Schläuche ist die
Scala media, die an einer Seite an die Scala vestibuli angrenzt und an der gegenüberliegenden
Seite an die Scala tympani. Am Ende der Hörschnecke sind die Scala vestibuli und die
Scala tympani miteinander verbunden und beide mit der flüssigen Perilymphe befüllt.
[0058] Die Verbindungsfläche zwischen der Scala media in der Mitte und der Scala vestibuli
ist die Reissnersche Membran und die Verbindungsfläche zwischen der Scala media und
der Scala tympani ist die Basilarmembran. Die letztere ist am Anfang der Hörschnecke
schmal und steif und am Ende breit und weich.
[0059] Ein eintreffender Schallimpuls wird vom Steigbügel über das ovale Fenster in die
Scala vestibuli eingeleitet und pflanzt sich dort in der flüssigen Perilymphe als
eine Wanderwelle fort. Deren Druck wird durch die Reissnersche Membran hindurch in
die Scala media und von dort durch die Basilarmembran hindurch in die Scala tympani
weitergeleitet.
[0060] Durch die genannte Charakteristik der Basilarmembran nimmt über die Länge der Hörschnecke
hinweg die Geschwindigkeit der Wanderwelle ab und die Verformung der flexiblen Basilarmembran
nimmt dafür zu. Es wandert also eine Verformung die Scala media entlang, die bei sehr
steilen Anstiegen des Schallimpulses oder entsprechend bei sehr hohen Frequenzen schon
im vorderen Teil der Hörschnecke ihre maximale Auslenkung hat und bei sehr langsamen
Impulsanstiegen oder bei sehr niedrigen Frequenzen erst im hinteren Teil der Hörschnecke
ihr Maximum erreicht.
[0061] Deshalb entspricht die Länge der ausgerollten Cochlea von 31,5 mm auch der unteren
Grenzfrequenz der vom Menschen als Ton wahrnehmbaren Schwingung von 16 Hz.
[0062] Zur Übertragung der Information über diese Verformung dienen die Haarzellen, die
an einem Ende mit der Tektorial- oder Deckmembran verbunden sind und am anderen Ende
auf der Basilarmembran mit Nervenzellen in Verbindung stehen. Die Tektorialmembran
ist ein schmaler Streifen, der sich parallel zur Basilarmembran durch die Scala media
erstreckt und dort an einer Längskante verschwenkbar angewachsen ist.
[0063] Auch die schlauchförmige Scala media in der Mitte zwischen den beiden Schläuchen
der Scala vestibuli und der Scala tympani ist mit einer Flüssigkeit befüllt, nämlich
der
Endolymphe. Die Bewegungen der Scala vestibuli und der Scala tympani werden deshalb auch an
die
Endolymphe in der Scala media weitergegeben.
[0064] Durch diese Bewegungen verschwenken sich ebenfalls die Tektorialmembran und die Basilarmembran
gegeneinander und erregen so die eigentlichen Schallsensoren im Innenohr, nämlich
die Haarzellen, die daraufhin Botenstoffe, die sie in kleinen Vesikeln vorrätig halten,
als Information über Nervenzellen weiter an das Gehirn geben.
[0065] Dabei übertragen die Haarzellen die Information mit größter zeitlicher Präzision
und zeigen die höchsten Übertragungsraten im gesamten Nervensystem. Erst seit 2005
ist klar, wie die Haarzellen solch hohe Raten bewerkstelligen können.
[0066] Claudius P.Griesinger vom Physiologischen institut II der AlbertLudwigs-Universität
Freiburg hat zusammen mit Forschern des University College in London herausgefunden,
dass z.B. die Nervenzellen der Großhirnrinde oder des Hippocampus ihre Botenstoffe
über Vesikel ausschütten, die sie ständig recyceln und wieder füllen, sich hingegen
die Haarzellen nur zu etwa zehn Prozent auf das langsame Recycling der Vesikel stützen
. Die meisten ihrer Vesikel produzieren sie kontinuierlich in ihrem Zellkörper, so
dass ständig ein großer Vorrat an Botenstoff-Paketen zur schnellen und akkuraten Signalweiterleitung
zur Verfügung steht.
[0067] Bei herkömmlichen Nervenzellen können maximal nur etwa 20 Vesikel pro Sekunde freigesetzt
werden, da das Recycling höhere Übertragungsraten nicht zulässt. Die Haarzellen im
Ohr haben durch ihre Vorratsproduktion der Vesikel die maximal mögliche Freisetzung
um Größenordnungen gesteigert. Dadurch können sie Information mit viel höheren Geschwindigkeitsraten
übermitteln, was überhaupt erst eine präzise Übertragung der zeitlichen Feinstruktur
von akustischen Informationen ermöglicht.
[0068] Die Haarzellen sind in zwei Gruppen aufgeteilt, nämlich die inneren Haarzellen (IHZ)
und die äußeren Haarzellen (ÄHZ). Die inneren Haarzellen in der Scala media erkennen
wegen ihrer mechanisch geradlinigen Aufreihung auf der Basilarmembran aus ansonsten
gleichförmig-geradlinigen Schallbewegungen eine Krümmung in positiver und negativer
Richtung als absolute physikalische Zeitpunkt-Ursache einer beschleunigten Bewegungsänderung
im Schall-Ansatz aus der Ruhe oder seinem Schall-Fortsatz.
[0069] Möglich wird diese Vektor-Sensorik der Haarzellen dadurch, dass sie - im Gegensatz
zu den äußeren Haarzellen - nicht mit der Tektorialmembran verbunden sind. Stattdessen
können sie sich freischwimmend innerhalb der Endolymphflüssigkeit der Cochlea bewegen.
Bisher werden sie in der Literatur ebenso wie die äußeren Haarzellen als angedockt
an die Tektorialmembran dargestellt.
[0070] Als verfügbarer Analysierbereich stehen 31,5 mm Zilien-Weglänge zur Verfügung. Diese
Weglänge wird von einem Kraftstoß-Impuls in etwa 5ms vom ovalen Fenster bis zum Heliokotrema
durchlaufen. Die Dispersion mit ihrer Wurzel aus der Geschwindigkeit des Biegewellenmechanismus
in der Cochlea erweitert das Verhältnis des Zeitbereiches von 10µs bis 10ms, also
1:1000, auf 1: 31,6ms Zeitdauer. Somit beträgt auch die zurückgelegte Weglänge 31,6mm.
Auf dieser Wegstrecke stehen in gradliniger Reihenfolge etwa 3200 bipolare Haarzellen
(IHZ), welche die Richtung und die Amplitude (max. 30 dB) über der Hörschwelle als
sich ändernde Impulsformung im Schall als Information (lat.: In-Form-Machung) detektieren
können. Ein Beispiel ist der sog. "Schlagton" einer Glocke. Der Grund ist, dass es
eben nur ein Kraftstoß-Impuls, ohne Periodizität und von augenblicklicher Natur ist
(Trendellenburg: Akustik, S. 59, Springer 1961).
[0071] Für das komplette Impuls-Intervall - als Gegensatz zum "Onset-Zeitpunkt zur Ortsbestimmung
(Lokalisation) - steht der transversale Vektorkreis zur Verfügung. Sein Umfang entspricht
2 x 5 ms x 3,14 (π), was einen Laufzeit Erkennungsbereich von 31,4 ms ergibt. Damit
stehen 31,4 ms für den schallgebenden Körper in seiner Abbildung als Quellen-Ort und
-Gestalt dem Gehör zur Verfügung (siehe Fig.1). In dieser Zeitspanne wird im Erkennen
das Einzelbild einer ikonischen Darstellung unterbewusst in der menschlichen Wahrnehmung
als Hörereignis präsentiert, wenn der kleinste Punkt (3200:31,4 ms ≈ 10ms) für das
zentrale Abbildungsvermögen von
10 µs Zeitdauer in seiner
Hörschärfe von der Welt der Technik der menschlichen Hörwelt zur Verfügung gestellt werden kann.
Hierzu dient die neue 3D Stereo-Spaltmikrofon-Technik.
ÄHZ-Empfinden:
[0072] Die an der Tektorialmembran angedockten Sinneszellen analysieren anhand ihrer Sinus-Halbwellenförmigen
Anordnung, auch V- oder W-Formung genannt, die periodischen Schallschwingungen, die
je nach ihrer Tonhöhe mit ihrem Amplitudenmaximum an einem bestimmten Ort auf der
Basilarmembran abgebildet werden. In den drei Reihen der ÄHZ ergeben sich 30 dB im
Amplituden-Maximum, was zusammen mit den IHZ bis zu 120 dB, der Schmerzgrenze, führt
(
Wolf D. Keidel, Erlangen, Physiologie des Gehörs, Thieme Verlag Stuttgart 1975). In der wissenschaftlichen Literatur wurden darüber viele Vorstellungen und Modelle
seit Helmholtz veröffentlicht.
[0073] Diese bei der Schallübertragung wesentlichen Besonderheiten des menschlichen Hörens
müssen auch von den als Schallwandler dienenden Lautsprechern berücksichtigt werden,
denn nur dann hat ein hochwertiges Mikrofon, dessen elektrische Ausgangssignale alle
Informationen geliefert hat, die in den Bewegungsimpulsen am Ort der Entstehung eines
Geräusches oder eines Tones enthalten sind, überhaupt einen Nutzen.
[0074] Da die Güte einer verketteten Übertragung eines Geräusch- oder Klang-Impulses über
Bewegungen der Luftmoleküle, über ein Mikrofon, das zwei elektrische Signale erzeugt
und über zwei Lautsprecher, die aus diesen Signalen wieder Bewegungen von Luftmolekülen
erzeugen bis hin zum menschlichen Gehör nur so hoch sein kann, wie das schwächste
Glied in dieser Kette, muss im Folgenden auch auf die Übertragungsgüte der Lautsprecher
gemäß dem aktuellen Stand der Technik eingegangen werden.
[0075] Denn wesentliche Erfordernisse bei der Übertragung von Schall werden beim Bau von
den meisten Schallwandlern auch heute noch weitgehend missachtet. Für viele Hersteller
gilt auch heute noch ein Lautsprecher als optimal, der einen guten gleichförmigen
Amplituden-Frequenzgang im hörbaren Frequenzbereich hat und kontinuierliche, quasi
statische Sinusschwingungen ausreichend gut reproduzieren kann.
[0076] Dagegen bleibt weitgehend unberücksichtigt, ob mit einem Lautsprecher auch ein dem
dynamischen Druck-Zeitverlauf nach Fig.1 entsprechender Kurvenverlauf erreichbar ist,
was zur vollständigen Übermittlung aller im Zeitintervall
t0 - tv vorhandenen Informationen und damit für einen dem Signal dynamisch genau folgenden
Verlauf erforderlich ist.
[0077] Wenn es also um die Aufzeichnung und die Wiedergabe von Geräuschen und Tönen geht,
dann müssen von den elektromechanischen Wandlern, die als Mikrofon die Bewegungen
von Luftmolekülen in elektrische Signale umsetzen, sowie von den - als Lautsprecher
bezeichneten - anderen elektromechanischen Wandlern, die diese Signale wieder zurück
in Schall, also wieder in Bewegungen von Luftmolekülen umwandeln - idealer Weise sämtliche
zuvor beschriebenen Informationen übertragen werden.
[0078] Auf aktuellem Stand der Technik bestehen durchschnittliche Lautsprecher aus einem
Hohlkegel, der an seinem Rand mit einem umlaufenden, federnden Streifen fest eingespannt
ist und in seiner Mitte von einem elektrischen Antrieb vor und zurück bewegt wird.
[0079] Um zu prüfen, wieweit ein solcher herkömmlicher Lautsprecher auch einen Schallimpuls
exakt wiedergeben kann, wird er einer Sprunganregung unterworfen, indem sein Antrieb
mit einer Gleichspannung verbunden wird, wodurch eine dynamische Druckänderung bewirkt
wird.
[0080] Wenn die Wiedergabetreue des Lautsprechers den zuvor genannten Anforderungen entsprechen
würde, würde er bei einer dynamischen, sprungartigen Aktivierung seines Antriebes
eine Kurve für die Druckänderung in Abhängigkeit von der Zeit erzeugen, die zur Figur
1 identisch wäre.
[0081] Auf dem für Lautsprecher derzeit am weitesten verbreiteten Stand der Technik ergeben
sich jedoch ganz andere Kurvenverläufe, die in Fig. 2 beispielhaft dargestellt sind.
Fig. 2 zeigt oben links das rechteckförmige elektrische Eingangssignal für den Antrieb
des Lautsprechers und daneben die theoretisch ideale Druckänderung an einem Ort vor
dem Schallerzeuger. In den unteren beiden Reihen sind die tatsächlich erhaltenen und
mit einem Messmikrofon gemessenen Kurvenverläufe dargestellt, wenn sechs willkürlich
herausgegriffene, herkömmliche Studio-Abhör-Lautsprecher als Quellen zur Erzeugung
der dynamischen Druckänderung der Luft verwendet werden.
[0082] Es zeigt sich, dass die Kurvenverläufe innerhalb der gemäß Fig.1 ersten Zeitzone
t0 - t1 und der zweiten Zeitzone
t1 - tv in erheblicher Weise verfälscht werden. Insbesondere innerhalb der zweiten Zeitzone
t1 - tv wird der durch die Sprunganregung eigentlich zu reproduzierende, theoretisch ideale
"ausklingende Grundton" durch zahlreiche, vom jeweiligen Lautsprecher erzeugte ganz
kurze Geräusche überlagert, die etwa 0,1 Millisekunden bis zu 20 Millisekunden andauern
und vom der Lautsprechermembrane zu Beginn jeder Klangerzeugung entwickelt werden.
[0083] Die Lautsprechermembrane ist eine relativ träge Masse, die durch den elektrischen
Antrieb in eine Richtung gestoßen wird, wobei sie sich dem Auslenken die Federkraft
der Membrane und ihrer Aufhängung solange entgegensetzt, bis die Masse zum Stillstand
kommt. Dann beschleunigt die Federwirkung die Membrane wieder in die andere Richtung
und schwingt dabei über ihre ursprüngliche Ruhelage hinaus. Mit diesem Einschwingvorgang
pendelt sich der Lautsprecher auf Schwingungen mit einer bestimmten Frequenz ein.
[0084] Konventionelle Lautsprecher reproduzieren nämlich nicht nur sehr frequenzgetreu Musik,
sie produzieren auch ständig eine Unmenge ganz kurzer Geräusche, die etwa 0,1 Millisekunden
bis zu 20 Millisekunden andauern.
[0085] Die Unterteilung in Hochton-, Mittelton- und Tieftonlautsprecher bedingen auch noch
unterschiedliche Eigenschwingungen bei den üblichen Masse/Feder-Systeme herkömmlicher
Wandler. In einer konventionellen Dreiwege-Box sind in Folge die drei ganz verschiedenen
Einschwinggeräusche von Hochton-, Mittelton- und Tieftonlautsprecher zu hören.
[0086] Diese Verfälschungen sind eine Ursache dafür, dass bei sprungförmiger Anregung konventioneller
Lautsprecher die Kurve des Schalldruckes über der Zeit von der idealen Kurve einer
sehr getreuen Musik und Geräuschwiedergabe deutlich abweicht.
[0087] Dieser Effekt wird derzeit auch unter dem Begriff der "Impulstreue" diskutiert. Als
Impulstreue wird das Vermögen eines Lautsprechers bezeichnet, einem impulsförmigen
Signal möglichst ganz ohne Einschwing- bzw. Ausschwingvorgänge zu folgen. Stattdessen
produzieren die meisten Lautsprecher auf aktuellem Stand der Technik selber Schwingungen
mit tiefen, mittleren und hohen Frequenzen, die unter anderem durch Partialschwingungen
auf der Membran, eine insgesamt hart aufgehängte Membran und Hohlraumresonanzen in
der Lautsprecherbox und im Hörraum hervorgerufen werden.
[0088] Wenn eine konventionelle Lautsprechermembran einen Impuls abstrahlen soll, so löst
das Bewegungen der Lautsprechermembran aus, die wellenförmig nach außen laufen. Dadurch
wird noch Schall abgestrahlt, obwohl der Impuls längst zu Ende ist. Im Regelfall ist
der Rand der Membran nicht mit dem korrekten Wellenwiderstand abgeschlossen, so dass
die Welle reflektiert wird und den Impuls weiter verlängert.
[0089] Dadurch wird eine einwandfreie Reproduktion der Schallsignale und der dazu erforderlichen
Druckänderungen unmöglich, denn in der ersten Zeitzone
t0 - t1 und in der zweiten Zeitzone
t1 - tv eines Schallimpulses, in denen das menschliche Gehör und das Hörzentrum des Gehirns
eigentlich den Ort und die Art des Schallimpulses ermitteln, ist der Schallimpuls
überhaupt nicht hörbar, sondern es erklingen nur die Betriebsgeräusche des einschwingenden
Lautsprechers. Dadurch wird die Aufmerksamkeit des Zuhörers auf die Lautsprecher,
ihre Größe und ihren Aufstellungsort gelenkt.
[0090] Nach vielen Jahren von Forschungs- und Entwicklungsarbeit von J. W. Manger ist es
jedoch jetzt gelungen, einen elektroakustischen Wandler zu schaffen, der bei einer
Sprunganregung im wesentlichen einen der Fig. 1 entsprechenden Kurvenverlauf bewirkt.
Ein Ergebnis dieser Forschungen und Entwicklungen ist der unter der Bezeichnung MSW
bekannte Biegewellenwandler, wie u.a. in
DE PS 18 15 694,
DE 22 36 374 C3,
DE25 00 397 A1 und
DE 27 25 346 C3 beschrieben.
[0091] Das Wirkungsprinzip dieses Biegewellenwandlers weicht von üblicher Wandlern mit Konusmembranen
dramatisch ab. Hier dient zur Schallabstrahlung eine biegeweiche, zähelastische Membran,
die in Richtung ihrer Anregung nahezu keine Rückstellelastizität besitzt. Sie erzeugt
Biege- bzw. Wanderwellen, die vom Zentrum zum Rand wandern und dort auslaufen, ohne
dass Eigenschwingungen und/oder stehende Wellen erzeugt werden. Außerdem können extrem
kurze Anstiegszeiten im Bereich bis zu 14 Mikrosekunden entsprechend der ersten Zeitzone
t0-t1 erzielt werden. Mit derartigen Biegewellenwandlern ist es erstmals möglich,
die Kurvenverläufe nach Fig. 1 nahezu unverfälscht zu reproduzieren.
[0092] Dies zeigt Fig. 3 in einer zu Fig. 2 analogen Darstellung. Die erhaltene Luftdruckänderung
am Messort kommt dem im mittleren Bereich gezeigten Ideal vergleichsweise nahe. Insbesondere
fehlen bei Anwendung eines Biegewellenwandlers störende, durch den Lautsprecher bedingte
Druckänderungen nahezu vollständig, wodurch der Lautsprecher als solcher von den Hörern
nicht mehr erkannt und das Originalsignal nahezu unverfälscht übertragen und empfunden
werden kann.
[0093] Die beschriebenen Unterschiede zwischen den beiden Wandlertypen sind besonders bei
stereophonen Reproduktionen mit zwei Lautsprechern sehr deutlich wahrnehmbar. Bei
Anwendung herkömmlicher Lautsprecher ist eine Stereo-Übertragung trotz der genannten
grundsätzlichen Mängel nur dann einigermaßen störungsfrei, solange sich der Zuhörer
genau in der Achse zwischen den beiden Lautsprechern, d. h. in der sog, Stereomitte
befindet. Entfernt sich der Zuhörer auch nur geringfügig von dieser Achse, werden
die Störungen sofort extrem erkennbar, da dann der näher liegende Lautsprecher mit
seinen Fehlern unterschwellig und intuitiv erkannt wird. Als "intuitiv" werden Informationsverarbeitungen
im Gehirn bezeichnet, von denen nur das Ergebnis, nicht aber der Verarbeitungsvorgang
wahrgenommen werden.
[0094] Biegewellenwandler nach dem Prinzip von J.W. Manger sind jedoch im wesentlichen frei
von Eigenschwingungen, so dass sich bei einem Entfernen eines Zuhörers aus der Stereomitte
auch ein anspruchsvolles Hörempfinden nicht verändert, da der dann näher gelegene
Lautsprecher mangels wesentlicher Eigenschwingungen nicht als störend empfunden wird.
Dadurch können gleichzeitig mehrere Personen in den Genuss desselben Darstellungsinhalts
kommen. Und das insbesondere auch beim
Ansatz der Schallschwingungen, dem für die geometrische Ortung im Gehirn des Hörenden entscheidend
wichtigen Teil eines jeden Geräusches.
[0095] Mit dem MSW-Wandler kommt der Musikhörer der Illusion nahe, vor dem Instrument selbst
zu sitzen, denn die Reproduktion ist praktisch nicht mehr hörbar, da der MSW-Wandler
keine Einschwinggeräusche mehr abstrahlt. Anstelle von Lautsprechereigengeräuschen
nimmt das Gehör nur noch die Einschwingvorgänge der Musikinstrumente wahr, die das
Instrument im Konzertraum lokalisieren und sein Charakterbild wiedergeben.
[0096] Das entscheidende Merkmal ist die dünne und biegeweiche Plattenmembrane, die aus
drei Schichten besteht. Sie speichert keine Kräfte, die durch Antrieb oder Rückfederung
entstehen. Stattdessen heben die gegeneinander wirkenden Masse- und Federkräfte ihre
Speicheranteile innerhalb der Membrane selbst auf. Sie werden mit dem Schall als Wärme
abgeführt.
[0097] Die Membrane schwingt in einer Anstiegszeit von nur 0,014 Millisekunden auf die Signalfrequenz
und hält diesen Ton bis zur musikalisch vorgegebenen Signaländerung. Mit einer einzigen
Membrane wird der ganze Übertragungsbereich von 80 Hertz bis 33 Kilohertz abgedeckt.
Damit können die bei konventionellen Mehrfach-Lautsprechern notwendigen Frequenzweichen
und phasenungleichen Überlappungen im klangbildbestimmenden Frequenzbereich vermieden
werden.
[0098] Stattdessen entsteht hier der Klang auf einer einzigen, relativ sehr kleinen Fläche,
die im Vergleich zu bisherigen Systemen dem Ideal der Klangerzeugung in einem Punkt
schon sehr nahe gekommen ist. Alle Wellen, die ihn definieren, bilden vor der Membrane
eine komplexe Schalldruckwellenform, da hohe und niedrige Frequenzen gleichzeitig
an unterschiedlichen Stellen der einen Membrane entstehen. Im Vergleich zu konventionellen
Lautsprechern wird das Eingangssignal nahezu perfekt abgebildet, so dass an das menschliche
Ohr das ursprüngliche und vollständige Schalldruckbild gelangt, das einmal das Mikrofon
zur Reaktion gebracht hat.
[0099] Dennoch hat sich überraschend gezeigt, dass sehr empfindsame Zuhörer auch bei Anwendung
von Biegewellenwandlern nach dem soeben beschriebenen Prinzip immer dann, wenn sie
sich außerhalb der Stereomitte befinden, nicht klar definierbare Änderungen der Schallwiedergabe
erkennen können. Messungen haben ergeben, dass dies direkt darauf zurückzuführen ist,
dass der Onset-Zeitpunkt
t0 umso stärker verschoben und die Anstiegsflanke von Pa auf Pm-siehe Figur 2 - umso
stärker verformt wird, je weiter sich der Zuhörer aus der Mittelachse des Biegewellenwandlers
entfernt.
[0100] Dies ist in Figur 4 gezeigt, bei der das gleiche Messverfahren wie in Figur 3 angewandt
wurde. Der Lautsprecher wurde also mit einer rechteckförmigen Spannung erregt und
seine Sprungantwort mit einem Messmikrofon erfasst. Bei der Anordnung des Messmikrofons
in der Mittelachse ergibt sich für den Verlauf des Luftdruckes am Biegenwellenwandler
über die Zeit hinweg die Kurve A
0-B
0. Wenn das Messmikrofon dann in Schritten von jeweils etwa 15° aus der Mittelachse
verschoben wird, werden vom Messmikrofon die Druckverläufe A
1-B
1 bis A
4-B
4 gemessen. Mit zunehmender Entfernung des Messmikrofons von der Mittelachse bis zum
Extremfall einer Entfernung von 60° wird der Verlauf des Druckanstieges am Biegewellenwandler
immer mehr zu einer S-Kurve. Der Anstieg ist also nicht linear.
[0101] In Figur 4 ist das Messergebnis auf der Zeitachse mit einem Maßstab von 50 Mikrosekunden
pro Rastereinheit wiedergegeben. Figur 4 zeigt, dass der nichtlineare Verlauf des
Druckanstieges der Kurve A
4-B
4 sich über den Zeitraum von etwa einer Rasterlänge, also von etwa 50 Mikrosekunden
erstreckt. Im Vergleich mit der Figur 1 wird deutlich, dass die "erste Zeitzone t0-t1"
des menschlichen Hörens mit der Schallquellenortung nach einer derart langen Zeit
bereits nahezu verstrichen ist. Deshalb ist auch mit einem Biegenwellenwandler nach
dem Prinzip von J. W. Manger eine einwandfreie Wiedergabe der Schallquellenortung
ohne ein weiteres Hilfsmittel nur dann möglich, wenn sich der Zuhörer in der Mittelachse
des Biegewellenwandlers aufhält.
[0102] In Figur 5 ist das Ergebnis einer gleichen Messung wie in Figur 4 wiedergegeben,
hier jedoch mit einem akustischem Umlenkelement, das eine Hälfte des Biegewellenwandlers
abdeckt. Auch bei dieser Messung wird das Messmikrofon wieder zuerst in der Mittelachse
des Biegewellenwandlers angeordnet und dann jeweils in Schritten von etwa 15° aus
dieser Mittelachse heraus entfernt. Figur 5 zeigt als Messergebnis ganz deutlich,
dass der Kurvenanstieg unabhängig vom jeweiligen Winkel absolut linear ist.
[0103] Dadurch ist sicher gestellt, dass Änderungen des Druckwertes unverzerrt wiedergegeben
werden, dass also in dieser Konfiguration eines Biegenwellenwandlers mit einem hälftig
davor gesetzten, akustischen Umlenkelement auch Schallbewegungen aus der ersten Zeitzone
des menschlichen Hörens mit der Schallquellenortung korrekt möglich ist. In dieser
Konfiguration wird das angestrebte Ideal einer nicht mehr wahrnehmbar verfälschten
Wiedergabe der Schallbewegung bei der zeitgenauen Umformung von Schallbewegungen durch
mechanisch bewegte Luftmoleküle in Draht gebundene elektrische Signale und wieder
zurück in Schallbewegungen durch einen als Lautsprecher bezeichneten Wandler erreicht.
[0104] Die bis hier vorgelegte, vergleichsweise sehr ausführliche Beschreibung der physikalischen
Grundlagen und des bisher erreichten Standes der Technik hat gezeigt, dass konventionelle
Lautsprechersysteme und die bisher bekannten Mikrofone nur Klänge und Töne übertragen
können. Das Ziel dieser Erfindung ist jedoch ein dreidimensionales Hören, bei dem
auch die vektoriellen Informationen jedes Schallsignals übertragen werden, so dass
der Zuhörer zusätzlich zu den Klängen und Tönen auch deren Ort und deren Art identifizieren
kann.
[0105] Dieses Ziel wurde mit den MSW-Biegewellenwandlern für die Umwandlung elektrischer
Signale in die Bewegungen von Luftmolekülen fast vollständig erreicht. Erst mit der
Verfügbarkeit solcher Schallwandler können die Grenzen der auf bisherigem Stand der
Technik bekannten Mikrofone aufgezeigt werden.
[0106] Weithin und in zahlreichen Ausführungsvarianten bekannt sind Mikrofone, die als elektroakustische
Wandler die Bewegungsimpulse der sie umgebenden Luft, die durch Geräusche und Töne
entstanden sind, in entsprechende elektrische Spannungsimpulse wandeln.
[0107] Es ist unstrittig, dass von allen bekannten Varianten das Prinzip des sog. Kondensatormikrofons
die geringsten Verfälschungen bei der Umwandlung des Schalldruckbildes in eine elektrische
Spannung bewirkt. Auf aktuellem Stand der Technik besteht ein Kondensatormikrofon
aus einer sehr dünnen, flexiblen und elektrisch leitfähigen Membran, die elektrisch
isoliert und in sehr geringem Abstand vor einer Metallplatte angebracht ist.
[0108] Die Membranen haben meist nur eine Materialstärke von wenigen Mikrometern, so dass
sie auch durch sehr schwache Bewegungsimpulse der Umgebungsluft noch in Bewegung versetzt
werden. Zwischen der Membran und der Metallplatte befindet sich eine Luftschicht,
die bei jeder Bewegung der Membran komprimiert wird. Damit sich diese Luftschicht
nicht verzerrend auf die Bewegung der Membran auswirkt, ist die Metallplatte zumeist
mit zahlreichen Bohrungen versehen, durch welche die unter Druck gesetzte Luft strömt
und in einen - ebenfalls luftgefüllten Hohlraum hinter der Metallplatte fließt, der
im Vergleich zum Luftraum zwischen Membran und Metallplatte sehr groß ist.
[0109] Eine derartige Anordnung wirkt elektrisch wie ein Plattenkondensator mit einem Luft-Dielektrikum.
In der Praxis sind Kapazitäten von etwa 20 bis 100 pF typisch. Die Bewegungsimpulse
der umgebenden Luft bewegen auch die Membran, wodurch sich der Abstand zwischen der
Membran und der Metallpatte und damit auch die Kapazität des Kondensators verändern.
[0110] Um diese Schwankungen der Kapazität in ein elektrisches Spannungssignal umzuwandeln,
wird der Kondensator über einen hochohmigen Widerstand mit einer Gleichspannungsquelle
wie z.B. einer Batterie verbunden, die ihn auflädt. Wenn ein Bewegungsimpuls der Luft
auf die Membran übertragen wird und sie dadurch bewegt, so verändert sich die Kapazität
des aufgeladenen Kondensators und es fließt aus der Gleichspannungsquelle ein Stromimpuls
über die Kapazität und den Widerstand. Ein dazu proportionaler Spannungsimpuls kann
am Widerstand abgegriffen werden und einem Mikrofonverstärker zugeführt werden. Dieser
Mikrofonverstärker dient als Impedanzwandler und passt direkt im Mikrofon dessen Impedanz
an das Kabel zur Signalübertragung an. Die Signalspannung wird dabei nicht verstärkt.
[0111] Der Widerstandswert muss so hoch gewählt werden, dass bei einer Kapazitätsänderung
im Rhythmus der unteren Grenzfrequenz (zum Beispiel 20 Hz) die Ladung noch ausreichend
konstant ist, sodass sich die Spannung am Kondensator mit den Schallschwingungen ändert.
Es ergeben sich je nach Kapselkapazität Widerstandswerte von bis zu etwa 1 GΩ.
[0112] Ein derartiges Kondensatormikrofon erläutert z.B. die Offenlegungsschrift
DE 10 2008 013 395 A1. Darin wird beschrieben, wie die Metaliplatte gegenüber der Membran aus einem Material
hergestellt werden kann, das ursprünglich nur als Platine für elektronische Schaltungen
gedacht war. Auf einem mechanisch sehr stabilen Trägermaterial, z.B. aus Keramik,
ist eine dünne Kupferschicht aufgebracht, die mit geringem Aufwand in die für ein
Kondensatormikrofon erforderliche Form gebracht werden kann.
[0113] Ein einziges dieser Mikrofone kann jedoch keinesfalls elektrische Signale für das
aufgabengemäße, dreidimensionale Hören liefern. Es ist weithin bekannt, dass für jedes
der beiden menschlichen Ohren ein eigenes Signal benötigt wird. Erst aus dem Vergleich
der Signale von allen geformten Luftbewegungen in beiden Gehörorganen kann das menschliche
Gehirn alle Vektor-Informationen im Schall erkennen.
[0114] Deshalb werden zwei Mikrofone benötigt, die insgesamt zwei elektrische Signale erzeugen.
Jedes elektrische Signal wird jeweils einem eigenen Schallwandler zugeführt, insgesamt
werden also zwei Schallwandler angesteuert. Derartige Mikrofone sind auch als Stereomikrofone
bekannt.
[0115] Ein Stereomikrofon stellt die
DE 91 01 371 U vor. Es nennt insgesamt drei Mikrofone, die nebeneinander angeordnet sind und in
verschiedene Winkel zueinander gebracht werden können. Wenn die Mikrofone in einem
Winkel zueinander ausgerichtet sind, treffen die Schallimpulse nur auf ein Mikrofon
frontal auf und auf die anderen seitlich. Da jedes Mikrofon eine Richtcharakteristik
hat, unterscheiden sich die beiden Signale deutlich. Dadurch entsteht der Nachteil
einer gegenseitigen Verzerrung.
[0116] Wenn alle Mikrofone in die gleiche Richtung weisen, sind die Unterschiede in der
Form der empfangenen Signale sehr gering. Ein ganz gravierender Nachteil entsteht
jedoch bei Schallwellen, die nicht genau orthogonal auf die beiden Mikrofone auftreffen,
sondern schräg zu ihrer Längsachse. Die Mikrofone haben einen Abstand zueinander.
Selbst wenn sich die Mikrofone mechanisch berühren, so ist der Abstand im Verhältnis
zu derjenigen Laufzeit des Schalls immer noch sehr groß, innerhalb derer das menschliche
Gehör ein Schallsignal auf seinen Entstehungsort hin auswertet, also die Laufzeitunterschiede
zwischen dem am linken Ohr und dem am rechten Ohr gehörten Schallsignal bewertet.
[0117] Erst durch die Erfassung der Laufzeitunterschiede von ansonsten links und rechts
gleichen Signalen kann das menschliche Gehirn die Richtung des empfangenen Signals
ableiten - wie zuvor in dieser Anmeldung als sog. "erste Zeitzone der Wahrnehmung
eines akustischen Impulses" ausführlich erläutert.
[0118] Deshalb bewirkt der Laufzeitunterschied nach dem Prinzip von
DE 91 01 371 wegen des Abstandes der Mikrofone zueinander - eine für die Erfassung der Richtung
des Schallsignals dramatische Verfälschung.
[0119] In der in dieser Anmeldeschrift als "zweite Zeitzone der Wahrnehmung eines akustischen
Impulses" beschriebenen Phase, in der die Art des Schallsignals bewertet wird, wertet
das menschliche Gehör auch Pegelunterschiede zwischen dem linken und dem rechten Ohr
aus.
[0120] Diese Phase des menschlichen "Hörens" wird bei der Anordnung von zwei Mikrofonen
nach dem Prinzip der
DE 91 01 371 dramatisch verfälscht, wenn sich die beiden Mikrofone nicht exakt gleichen und wenn
sie nicht exakt in die gleiche Richtung ausgerichtet sind. Wenn überhaupt, dann ist
auch schon eine Annäherung an diese Forderung sehr aufwendig und das Ergebnis trotzdem
diesbezüglich nie perfekt.
[0121] Um dieses Problem wenigstens etwas zu entschärfen sind auf aktuellem Stand der Technik
sog. Koinzidenzmikrofone bekannt, bei dem zwei Richtmikrofonkapseln sehr dicht beieinander
in einem gemeinsamen Mikrofongehäuse angeordnet sind. Die beiden Mikrofonkapseln sind
in ihrer Bezugsachse im Achsenwinkel gegeneinander verdrehbar und haben meistens veränderbare
Richtcharakteristiken.
[0122] Dabei wird als prinzipieller Nachteil hingenommen, dass schon im tiefen und im mittleren
Frequenzbereich relative Phasendifferenzen (Phasenunterschiede) infolge von Wegdifferenzen
bei schrägem Schalleinfall zwischen beiden Mikrofonkanälen auftreten. Bei hohen Frequenzen
oder bei einem sehr steilen Anstieg des Schallimpulses ist die Phasendifferenz relativ
noch sehr viel größer.
[0123] Deshalb sind derartige Koinzidenzmikrofone nur für reine, monokompatible Intensitätsstereofonie
verwendbar, die bei der elektrischen Addition der beiden Stereosignale zu einem Monosignal
Auslöschungen oder Beeinträchtigungen von Frequenzteilen vermeidet.
[0124] Aus der
FR2 688 644A1 sind bereits Mikrofone bekannt, die Membrane als Elektroden aufweisen und denen eine
Gegenelektrode zugeordnet ist, die in eine linke als auch eine rechte Metallplatte
aufgeteilt ist, die voneinander isoliert sind und die jeweils einen eigenen elektrischen
Anschluss aufweisen. Die Verarbeitung der Signale macht es unmöglich, dieses Mikrofon
als Stereomikrofon einzusetzen.
[0125] Auf diesem Hintergrund hat sich die Erfindung die Aufgabe gestellt, ein Stereomikrofon
zu entwickeln, dass Bewegungsimpulse und Schallwellen der umgebenden Luft in zwei
elektrische Spannungen umwandelt, mit denen - nach angemessener Verstärkung - ein
hochwertiger Lautsprecher - wie z.B. der Biegewellenwandler nach dem Prinzip von J.W.
Manger - angesteuert werden kann und daraufhin der Umgebungsluft Bewegungsimpulse
verleiht, die nicht nur als Musik und Töne empfundene Schallwellen erzeugen, sondern
auch Luftbewegungen generieren, mit Hilfe derer das menschliche Gehör die Quelle der
Bewegungsimpulse im dreidimensionalen Raum lokalisieren kann und die Art des Schallsignals
schon zu Beginn des Einschwingvorganges beurteilen kann.
[0126] Das Ziel der Erfindung ist also ein Stereomikrofon, das Bewegungsimpulse seiner Umgebungsluft
in elektrische Spannungen umsetzt, mit denen wiederum ein anderer, elektrischer Wandler
so angesteuert wird, dass die von ihm erzeugten Luftbewegungen identisch zu denjenigen
Luftbewegungen sind, die das erfindungsgemäße Stereospaltmikrofon bei der Aufnahme
aktiviert haben. Es ist also ein wesentlicher Teil der Aufgabe der Erfindung, ein
dreidimensionales räumliches Hören zu ermöglichen.
[0127] Als Lösung lehrt die Erfindung, dass die Metallplatte durch einen Spalt in eine linke
Metallplatte als linke Gegenelektrode und eine rechte Metallplatte als rechte Gegenelektrode
aufgeteilt ist, die elektrisch voneinander isoliert sind und je einen eigenen elektrischen
Anschluss aufweisen.
[0128] Damit spalten sich die mechanischen Formbewegungen mittels Isomikrospalt in zwei
elektrische Formbewegungen und damit in das gewünschte formgenaue und interferenzfreie
3D-Stereoformat.
[0129] Mit einem solchen, erfindungsgemäßen Mikrofon ist es möglich, diejenigen elektrischen
Signale bereit zu stellen, mit denen zwei hochwertige Lautsprecher nicht nur Musik
und Töne korrekt wiedergeben können, sondern dem menschlichen Ohr zusätzlich diejenigen
Informationen bereit stellen, die es zu einer Lokalisierung der Quelle des Geräusches
oder des Tones benötigt.
[0130] Das erfindungsgemäße 3D-Stereospaltmikrofon schließt so die Kette in der vollständigen
Übertragung, Speicherung und anschließenden Wiedergabe von Geräuschen und Tönen. Wie
eingangs ausführlich erläutert, nimmt das erfindungsgemäße Mikrofon auch die extrem
schnellen Formänderungen auf, die das menschliche Gehör zur Erfassung des vektoriellen
Charakters von Geräuschen und Tönen benötigt.
[0131] Das Ergebnis ist nicht nur eine Information an den Hörer z.B. eines Orchesters, auf
welcher Seite des Podiums die Pauken aufgestellt worden sind und in welchem Punkt
der Bühne die Blechbläser gestanden haben, sondern auch über die Details der Schallinformationen
zu Beginn eines Tones und beim Wechsel von einem Ton zu einem anderen. Nur zu Beginn
eines Schallimpulses - nämlich in den ersten etwa 60 Mikrosekunden - wertet das Hörzentrum
des Gehirns die empfangenen Informationen in Bezug auf die räumliche Ausrichtung der
Schallbewegung aus. Nur in dieser Zeitspanne kann das Gehör den vektoriellen Charakter
eines Schallbildes erfassen. Das aufgabengemäße dreidimensionale Hören wird erst mit
einem erfindungsgemäßen Mikrofon möglich.
[0132] Wesentlich ist, dass ein erfindungsgemäßes Mikrofon diese aperiodischen, räumlichen
Informationen aufnimmt und elektrisch wiedergibt, die auch am Beginn einer jeden neuen
periodischen Schwingung stehen, also laufend und immer wieder ein wesentlicher Teil
des Klangbildes sind. Durch die Erfassung dieses "dreidimensionalen Teils" ermöglicht
ein erfindungsgemäßes Mikrofon die vollständige Aufnahme und Umwandlung eines kompletten
Klangbildes.
[0133] Diese laufenden kleinen und sehr schnellen Änderungen eines jeden Tones - bestehend
aus seinem Grundton und seinen Oberwellen - bestimmen, was oft auch als "Klangfarbe"
oder "Charakter" bezeichnet wird. Nur aufgrund dieser Merkmale ist es möglich, den
Klang z.B. einer Stradivari von einer anderen gewöhnlichen Geige zu unterscheiden.
[0134] Diese Eigenschaften des erfindungsgemäßen 3D-Spaltmikrofons beruhen auf dem wesentlichen
Merkmal der Erfindung, nämlich dass die Metallplatte eines an sich bekannten Kondensatormikrofons
durch einen Spalt in eine linke Metallplatte und eine rechte Metallplatte aufgeteilt
ist. Beide Metallplatten sind elektrisch von einander isoliert, damit von jeder Metallplatte
ein eigenes, elektrisches Signal zur Ansteuerung des jeweiligen Lautsprechers für
die linke und für die rechte Seite abgegriffen werden kann. Beide Metallplatten haben
jedoch die eine einzige Membran gemeinsam. Dadurch entstehen zwei Mikrofone, die einen
bisher nicht für möglich gehaltenen, winzigen Abstand zueinander aufweisen und deren
sonstige Unterschiede zueinander im Vergleich zum bisherigen Stand der Technik dramatisch
reduziert sind.
[0135] Der ganz entscheidende und wesentliche Effekt der Erfindung ist, dass durch den Spalt
die beiden Metallplatten und damit die beiden, direkt nebeneinander angeordneten Mikrofone
auch geringste Unterschiede in der Laufzeit des Schalls bereits unterschieden und
erfasst werden können. Genauso wie beim menschlichen Ohr empfangen die beiden Metallplatten
genau frontal auf sie auftreffende Bewegungsimpulse ohne jeden Laufzeitunterschied
- also exakt gleichzeitig.
[0136] Wegen der in der Praxis vernachlässigbaren Unterschiede zwischen den beiden Mikrofonen
sind bei genau senkrecht auftreffenden Schallimpulsen die von einem erfindungsgemäßen
3D Spaltmikrofone erzeugten beiden Signale genau identisch. Bei schräg auftreffenden
Schallimpulsen sind die Unterschiede in der Laufzeit und im Pegel exakt erfassbar.
[0137] Die Informationen über Herkunftsort und Art sind in den ersten 30 Millisekunden eines
jeden Schallsignals enthalten, unabhängig davon, ob es ein Geräusch oder ein sich
ändernder Ton ist. Im Unterscheid zum bisher bekannten Stand der Technik sind diese
Informationen auch in den ersten 30 Millisekunden der beiden, vom erfindungsgemäßen
3D-Stereo-Mikrofon abgegebenen, elektrischen Signale enthalten. Je kleiner der Spalt
zwischen den beiden Metallplatten ist, desto geringer sind auch die Laufzeitunterschiede
für Schallwellen, die nicht genau orthogonal auf die Oberfläche der beiden Metallplatten
der linken und der rechten Membranhälfte auftreffen.
[0138] Deshalb ist es von Vorteil, dass die Breite des Spaltes so klein wie nur möglich
ist. Damit jedoch über diesen kleinen Spalt hinweg keine elektrischen Überschläge
zwischen den beiden Metallplatten erfolgen, schlägt die Erfindung als eine Ausführungsvariante
vor, dass der Spalt zwischen den beiden Metallplatten durch einen elektrischen Isolator
vollständig ausgefüllt wird. Dabei sollte der Werkstoff dieses Isolators eine möglichst
hohe Spannungsfestigkeit haben, aber die Kapazität zwischen den beiden Kanten der
Metallplatten möglichst nicht vergrößern, d.h. also keine hohe Dielektrizitätskonstante
aufweisen, die die insgesamt wirksame, parasitäre Kapazität erhöht.
[0139] In der Praxis beträgt die Kapazität jeder einzelnen Hälfte der Mikrofonkapsel etwa
25 - 30 Picofarad. Dem gegenüber hat die parasitäre Kapazität zwischen den beiden
Stirnkanten eine Größenordnung von 3-4 Picofarad, also etwa ein Zehntel der Kapazität
der eigentlichen beiden Mikrofonkapseln.
[0140] Dieser Wert verursacht ein derart geringes "Übersprechen" zwischen den beiden Kanälen
des erfindungsgemäßen 3D-Stereomikrofons, dass es in der Praxis keine Rolle spielt.
Deshalb kann mit dem erfindungsgemäßen Mikrofon erstmals erreicht werden, dass das
elektrische Signal nicht nur die Grundinformationen über die Bewegungsimpulse der
umgebenden Luft enthält, sondern auch all diejenigen Informationen beim Einschwingen
eines Tones, die das menschliche Gehör braucht, um auch die Richtung und damit den
Ort sowie die Art des Schallsignals schnell und präzise bestimmen zu können.
[0141] Damit das mit möglichst hoher Güte möglich ist, ist eine geringe Breite des Spaltes
sinnvoll. In einer ersten Ausführungsvariante schlägt die Erfindung eine Spaltbreite
von 100 Mikrometer vor. Für noch höherwertigere, erfindungsgemäße Mikrofone wird die
Breite des Spaltes auf einen Wert zwischen 40 Mikrometer und 10 Mikrometer eingegrenzt.
[0142] Eine weitere, hilfreiche Verfeinerung ist, dass der Spalt das Profil eines Kegelstumpfes
hat, also an der zur Membran weisenden Seite der beiden Metallplatten deutlich schmäler
ist als an ihrer gegenüberliegenden Seite.
[0143] Ein erfindungsgemäßes 3D-Stereospaltmikrofon ist in der einfachsten Ausführungsform
als ein Druckempfänger aufgebaut, der nur eine große Öffnung aufweist, die mit einer
Membran abgedeckt ist. Damit wird ein etwa kugelförmiges Richtdiagramm erreicht. Nur
für hohe und höchste Frequenzen weist das Richtdiagramm eine Vorzugsrichtung auf,
weshalb es auf die Schallquelle ausgerichtet wird.
[0144] In einer Ausführungsvariante weist ein erfindungsgemäßes 3D-Stereospaltmikrofon auch
zwei Öffnungen in seinem Hohlkörper auf, die jeweils mit einer eigenen Membran verschlossen
sind. Eine derartige Mikrofonkapsel wird als sog. "Druckgradientenempfänger" eingesetzt.
Das ist an der Außenseite des Mikrofons daran erkennbar, dass zu beiden Seiten der
Mikrofonkapsel Öffnungen für den Eintritt und den Austritt von Luft vorhanden sind.
Dadurch werden Schallreflektionen, die z.B. in Innenräumen zusätzlich auf das Mikrofon
einwirken, ausgeblendet, da nur die Differenz der von der einen Seite eintreffenden
Druckwelle zu der von der anderen Seite auftreffenden - reflektierten - Welle erfasst
wird. Deshalb hat ein Druckgradientenempänger grundsätzlich eine Richtcharakteristik.
[0145] Eine erfindungsgemäße Mikrofonkapsel kann natürlich auch in allen anderen bekannten
und noch zu präsentierenden Bauformen eines Kondensatormikrofons eingesetzt werden.
[0146] In weiteren Ausführungsvarianten wird die Mikrofonkapsel von Kugeln, Trennscheiben,
Kugelplatten, anderen Platten, Abhängevorrichtungen für Grenzflächen, Flächenkörpern,
Formkörpern, Kugelkörpern, Richtkörpern wie Niere, Superniere oder Hyperniere, Trennkörpern,
Richtrohrkörpern, Miniaturkörpern und/oder anderen, auf aktuellem Stand der Technik
bekannten zusätzlichen mechanischen Elementen oder körperlichen Formen umgeben. Am
äußeren Erscheinungsbild eines erfindungsgemäßen Mikrofons sind also seine kennzeichnenden
Merkmale deshalb nicht ohne weiteres direkt erkennbar, sondern zumeist erst nach Zerstörung
des Mikrofons selbst.
[0147] Als eine weitere Ausführungsvariante können die beiden Metallplatten der ansonsten
getrennten, beiden Mikrofonkapseln auf einem gemeinsamen Träger befestigt werden.
Dadurch werden eine erhöhte mechanische Stabilität und eine erhöhte Genauigkeit für
die Einstellung des Spaltes zwischen den beiden Metallplatten erreicht. Damit steigt
auch die Genauigkeit des Anteiles vom elektrischen Signal, welches nach der Rückwandlung
in Schallbewegungen der Luft dem menschlichen Gehör die Lokalisierung ermöglicht,
also den dreidimensionalen Anteil des Hörens ausmacht. Durch ein naturgetreues "in-Form-machen"
steigt also der Informationsgehalt des Schallsignals.
[0148] Als eine weitere Verbesserung schlägt die Erfindung vor, dass eine Trennwand an den
Isolator im Spalt und/oder an die linke Metallplatte und/oder an die rechte Metallplatte
nahe dem Spalt angrenzt sowie sich an die Mikrofonkapsel anschließt. Damit wird eine
vollständige Trennung des Hohlraumes hinter den beiden Metallplatten erreicht. Die
Erfindung empfiehlt, die beiden Kammern sogar Luftdicht voneinander abzugrenzen, weil
dadurch jegliches Übersprechen von der "Rückseite" der Metallplatten her vermieden
wird.
[0149] Dann sollte jede dieser beiden Kammern über eine kleine Bohrung mit der Außenatmosphäre
verbunden werden, damit die Luft in den Kammern die Membran nicht wie eine Feder belastet
und damit Luftdruckänderungen die Kammern nicht wie die Dose eines Barometers zusammendrücken
oder aufblähen.
[0150] Im allgemeinsten Fall können die Metallplatten und die Membrane in einem beliebigen
Winkel zueinander ausgerichtet sein. Die Erfindung bevorzugt jedoch, dass die beiden
Metallplatten parallel zur Membrane ausgerichtet sind, weil dann die Fehler bei der
Umwandlung des Schalldruckes in elektrische Spannungen am geringsten sind.
[0151] Eine bevorzugte Ausführungsvariante des erfindungsgemäßen 3D-Spaltmikrofones weist
eine Membrane mit einer extrem niedrigen Biegefestigkeit auf. Der Vorteil ist, dass
die auftreffenden Schallbewegungen mit abnehmender Biegefestigkeit der Membrane immer
weniger verzerrt werden. Deshalb wird für die Membrane in der Praxis eine Goldfolie
mit einer Stärke von wenigen Mikrometern eine bevorzugte Variante sein.
[0152] Die Form des als Mikrofonkapsel dienenden Hohlkörpers ist prinzipiell beliebig. Für
ein gutes Übertragungsverhalten bei allen Frequenzen und bei allen Steilheiten eines
Impulses sind jedoch regelmäßige Formen vorteilhaft. Die Erfindung bevorzugt, dass
die Mikrofonkapsel als Hohlzylinder geformt ist, dessen untere Stirnseite verschlossen
ist und dessen obere Stirnseite die Öffnung ist, die von der Membrane verschlossen
ist und der Querschnitt des Hohlzylinders ein Kreis ist. Da die Metallplatte gegenüber
der Membrane jedoch durch einen Spalt halbiert ist, kann es unter Umständen auch sinnvoll
sein, die Flächen beider Metallplatten zu einem Oval oder zu einer Ellipse zu formen.
[0153] Bei jeder Form der Mikrofonkapsel ist es von Vorteil, wenn der Spalt durch den geometrischen
Mittelpunkt der Mikrofonkapsel verläuft. Damit ist der Spalt im Bereich der geringsten
Biegefestigkeit der Membrane angeordnet. Dadurch kann das erfindungsgemäße Mikrofon
auch noch sehr geringe Laufzeitunterschiede zwischen zwei Schallbewegungen erfassen.
[0154] Die Form des Spaltes ist im allgemeinsten Fall beliebig. Ein grader Spalt reduziert
die parasitären Kapazitäten zwischen den beiden Metallplatten auf das geringste mögliche
Maß.
[0155] Zwecks Erfassung auch kleinster Laufzeitunterschiede zwischen den beiden Mikrofonen
des erfindungsgemäßen 3D-Spaltmikrofons ist ein möglichst kleiner Spalt zu bevorzugen,
der über die gesamte Länge hinweg die gleichen Abmessungen hat. Die Reduzierung der
parasitären Kapazität zwischen den beiden benachbarten Metallplatten kann jedoch die
Begründung dafür sein, den Spalt nach außen hin zu verbreitern und ihm z.B. die Form
einer Parabel zu geben.
[0156] Zum elektrischen Anschluss eines erfindungsgemäßen 3D-Spaltmikrofons wird vorzugsweise
zwischen dem elektrischen Anschluss der Membrane und dem jeweiligen elektrischen Anschluss
der linken Metallplatte und der rechten Metallplatte in Reihe je eine elektrische
Energiequelle wie z.B. eine Batterie und je ein Belastungswiderstand angeschlossen
und an jedem Belastungswiderstand ein elektrisches Signal abgegriffen, das erst einem
Impedanzwandler und dann einem Mikrofonverstärker zugeführt wird.
[0157] Ein erfindungsgemäßes 3D-Spaltmikrofon kann in einer einfacheren Ausführungsform
auch als Elektretmikrofon hergestellt werden. Der Vorteil eines Elektretmikrofons
gegenüber dem Kondensatormikrofon ist, dass es statt einer externen Versorgungsspannung
eine dauerhafte elektrostatische Polarisierung durch eine Elektretfolie als Kondensatorvorspannung
nutzt.
[0158] Auf die der Membran gegenüberliegenden Metallplatten ist jeweils eine Elektretfolie
aufgebracht, die für die Membranvorspannung sorgt. Beim "Back-Elektretmikrofon" ist
das Elektret feststehend und die Membran ist eine metallbedampfte, leichtere Folie.
Die Größe der Mikrofonkapsel liegt meistens zwischen zwei Millimetern und einem Zentimeter.
Der Frequenzgang kann in der Praxis bei einer Ausführung als Druckempfänger - also
einem Mikrofon mit Kugelcharakteristik - von 20 Hz bis 20 kHz reichen. Da wegen des
Elektrets keine hohe Vorspannung für die Membran benötigt wird, reicht in der Praxis
eine Spannung von etwa 1,5 V zur Versorgung des Impedanzwandlers aus.
[0159] In einer weiteren, sehr interessanten Variante ist ein erfindungsgemäßes 3D-Stereospaltmikrofon
in ein Hörgerät integriert. Hier könnte es dramatische Erleichterungen insbesondere
für ältere Menschen schaffen, bei denen oft eine Alterung des Gleichgewichtsorganes
sowieso schon Orientierungsschwierigkeiten generiert. Für die Funktion als Hörgerät
ist es eine sehr interessante Ausführungsvariante, dass ein erfindungsgemäßes 3D-Spaltmikrofon
z. B. in der Vorderseite eines Brille integriert ist und damit ein genau gerichtetes
Hören ermöglicht, also auch dem Hörbehinderten wieder ermöglicht, sich akustisch im
Raum zu orientieren.
[0160] Eine weitere sehr interessante Anwendung eines erfindungsgemäßen 3D-Spaltmikrofons
ist ein Vektormikrofon, das Schallschnelle und Schalldruck aufnimmt. Damit ist die
Erfassung der Teilchenbewegung und ihrer Intensität möglich.
[0161] Im Folgenden sollen weitere Einzelheiten und Merkmale der Erfindung anhand von Beispielen
näher erläutert werden. Diese sollen die Erfindung jedoch nicht einschränken, sondern
nur erläutern. Es zeigt in schematischer Darstellung:
Fig.1: Zeitlicher Verlauf des Luftdrucks an einem Messort, wenn im Abstand davon sprungartig
eine dynamische Druckänderung erzeugt wird gemäß dem aktuellen Stand der Technik.
Fig. 2: verschiedene zeitliche Druckverläufe bei Anwendung von Lautsprechern mit herkömmlichen,
elektrodynamischen Schallwandlern gemäß dem aktuellen Stand der Technik.
Fig. 3: einen Kurvenverlauf analog zur Fig. 2, jedoch bei Anwendung eines Lautsprechers
mit einem Biegewellenwandler gemäß dem aktuellen Stand der Technik.
Fig. 4: verschiedene Kurvenverläufe analog zu Fig. 3 bei Anwendung eines Lautsprechers
mit einem Biegewellenwandler nach dem Stand der Technik an unterschiedlichen, nicht
in der Wandlerachse liegenden Messorten gemäß dem aktuellen Stand der Technik.
Fig. 5: Kurvenverläufe analog zu Fig.4, jedoch bei der hälftigen Abdeckung des Biegewellenwandlers
mit einem akustisch undurchlässigen Umlenkelement gemäß dem aktuellen Stand der Technik.
Fig.6: Schnitt durch ein erfindungsgemäßes 3D-Stereomikrofon
[0162] In
Figur 6 ist der Schnitt durch ein erfindungsgemäßes 3D-Stereomikrofon gezeigt. Das hier dargestellte
Ausführungsbeispiel besteht aus einer hohlzylindrischen Mikrofonkapsel 1, deren Unterseite
durch eine angeformte Ebene verschlossen ist. Die Mikrofonkapsel 1 weist an ihrer
Oberseite die Öffnung 11 auf, die in diesem Ausführungsbeispiel von zwei umlaufenden
Auskragungen umrandet wird.
[0163] Auf der unteren Auskragung in der Öffnung 11 ist die Metallplatte 3 gelagert, die
die Gegenelektrode zu der Membrane 2 als erster Elektrode ist. In Figur 6 ist das
wesentliche Element der Erfindung sehr deutlich und auf den allerersten Blick zu erkennen,
nämlich die Aufteilung der Metallplatte 3 durch den Spalt 4 in die Metallplatte links
3L und die Metallplatte rechts 3R. Der Übersichtlichkeit halber ist der Spalt 4 in
Figur 6 relativ sehr groß dargestellt, obwohl er in der Praxis mit einer Breite von
typischerweise 10 - 40 Mikrometern so schmal ist, dass er bei einer maßstäblichen
Darstellung in Figur 6 nur noch als ein Strich zu identifizieren wäre.
Am obersten Rand der Öffnung 11 läuft die zweite Auskragung der Mikrofonkapsel 1 um,
auf welcher die Membran 2 isoliert befestigt ist. Im Schnitt ist gut zu erkennen,
dass die Membran 2 parallel zu den beiden Metallplatten 3L und 3R verläuft. Sehr gut
zu erkennen ist auch, dass die Membrane 2 als erste Elektrode und die Metallplatte
links 3L als linke Gegenelektrode und die Metallplatte rechts 3R als rechte Gegenelektroden
jeweils zusammen mit einem Teil der Membran 2 einen Plattenkondensator bilden. Das
Dielektrikum dieser beiden Plattenkondensatoren, also das Material zwischen der ersten
Elektrode und der jeweiligen Gegenelektrode ist bei einem erfindungsgemäßen 3D-Stereospaltmikrofon
Luft.
[0164] Die Funktion eines erfindungsgemäßen 3D-Stereospaltmikrofones ist in Figur 6 sehr
gut nachzuvollziehen. Wenn eine Schallbewegung für eine Bewegung der Luftmoleküle
sorgt und sich diese Bewegung von Luftmolekül zu Luftmolekül fortpflanzt, so wird
sie nach dem Ende der Laufzeit der Schallbewegung auf einen Punkt der Membran 2 eintreffen
und diesen verformen. Je nach dem, ob sie im linken Bereich der Membran 2 oder im
rechten Bereich der Membran 2 eintrifft, sorgt sie für eine "Einbeulung" der Membran
2. Damit sinkt auch die Kapazität zwischen der Membran 2 als erster Elektrode und
den beiden Metallplatten 3L und 3R als Gegenelektrode.
[0165] In Figur 6 ist nicht eingezeichnet, dass diese Änderung der Kapazität elektrisch
abgefragt wird, indem zwischen dem elektrischen Anschluss 2E der Membran 2 und dem
elektrischen Anschluss 6L der Metallplatte 3L sowie dem elektrischen Anschluss 6R
der Metallplatte 3R eine Gleichspannungsquelle mit einem Belastungswiderstand in Reihe
geschaltet wird. Jede Änderung der Kapazität zwischen der Membran 2 und einer der
beiden Metallplatten 3L oder 3R kann dann am Belastungswiderstand als elektrische
Spannung abgegriffen werden.
[0166] In Figur 6 ist der Übersichtlichkeit halber im Spalt 4 kein zusätzlicher Werkstoff
als Isolator eingezeichnet.
[0167] Dargestellt ist in Figur 6 die Ausführungsvariante mit einer Trennwand 5, die in
der hier dargestellten Ausführungsform luftdicht mit der Mikrofonkapsel 1 verbunden
ist, sowie ebenfalls luftdicht mit den jeweiligen Kanten der beiden Metallplatten
3L und 3R. Dadurch entstehen zwei Kammern anstellen einer einzigen Kammer wie bei
bekannten Kondensatormikrofonen.
[0168] In Figur 6 ist eingezeichnet, dass die beiden Kammern jeweils durch eine kleine Bohrung
mit der Außenluft verbunden sind, um bei Änderungen des atmosphärischen Druckes der
Umgebungsluft nicht wie eine Barometerdose zusammengedrückt oder auseinander gebläht
zu werden. Diese Bohrung dient ebenfalls zum Entweichen von Luft, die durch ein "Ausbeulen"
der Membran 2 ansonsten komprimiert werden würde.
[0169] In Figur 6 ist als eine Variante der Metallplatte links 3L und rechts 3R eine feine
Lochung gezeigt. Durch diese Löcher entweicht das kleine Luftpolster zwischen der
Membran 2 und den beiden Metallplatten links 3L und rechts 3R.
[0170] In Figur 6 sind die elektrischen Anschlüsse 6L der Metallplatte 3L und 6R der Metallplatte
3R sowie 2E der Membrane 2 nur prinzipiell eingezeichnet.
Bezugszeichenliste
[0171]
- 1
- Mikrofonkapsel
- 11
- Öffnung
- 2
- Membrane
- 2 E
- elektrischer Anschluss der Membran 2
- 3
- Metallplatte
- 3L
- Metallplatte links
- 3R
- Metallplatte rechts
- 4
- Spalt
- 5
- Trennwand
- 6L
- elektrischer Anschluss der Metallplatte 3L
- 6R
- elektrischer Anschluss der Metallplatte 3R