[0001] Die vorliegende Erfindung betrifft ein Verfahren zur Frequenzkompression eines Audiosignals,
das eine Grundfrequenz und mindestens eine Harmonische besitzt, durch Bereitstellen
des Audiosignals in mehreren Frequenzkanälen und Verschieben oder Abbilden der Harmonischen
des Audiosignals von einem ersten Frequenzkanal der mehreren Frequenzkanäle in einen
zweiten Frequenzkanal der mehreren Frequenzkanäle. Darüber hinaus wird eine entsprechende
Vorrichtung zur Frequenzkompression beschrieben. Insbesondere ist eine derartige Vorrichtung
einsetzbar in einer Höreinrichtung. Unter einer Höreinrichtung wird hier jedes im
oder am Ohr tragbare schallausgebende Gerät, insbesondere ein Hörgerät, ein Headset,
Kopfhörer und dergleichen verstanden.
[0002] Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen.
Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche
Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem
Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z.B. auch Concha-Hörgeräte
oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte
werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt
aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur
Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch
oder elektrisch.
[0003] Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler,
einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein
Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z.
B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler,
z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer,
realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert.
Dieser prinzipielle Aufbau ist in FIG 1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts
dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere
Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit
3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale
und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen
Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall
wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang
fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des
Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine
ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.
[0004] Viele Hörverluste können durch eine frequenzabhängige Verstärkung in Kombination
mit einer Dynamikkompression ausgeglichen werden. Es gibt jedoch auch Hörverluste,
bei denen eine Verstärkung keinen Effekt hat bzw. nachteilig ist. Ein Beispiel hierfür
sind Hörverluste mit sog. "toten Regionen". Tote Regionen sind Frequenzbereiche, in
denen Spektralanteile nicht mehr durch Verstärkung hörbar gemacht werden können.
[0005] Eine mögliche Technik, um mit obigem Problem umzugehen, ist die Frequenzkompression.
Hierbei werden Strahlanteile Spektralanteile aus einem Quellfrequenzbereich, der typischerweise
bei höheren Frequenzen liegt und in dem keine Verstärkung angewendet werden soll (z.
B. tote Region), in einen tieferliegenden Zielfrequenzbereich geschoben. In diesem
Zielfrequenzbereich ist in der Regel Hörbarkeit prinzipiell gewährleistet, weswegen
eine Verstärkung angewendet werden kann.
[0006] Es sind Hörgeräte bekannt, die eine derartige Frequenzkompression unterstützen. Bei
dem Kompressionsverfahren werden beispielsweise die Eigenschaften einer Filterbank
für eine einfache Implementierung genutzt. Es werden selektiv einzelne Kanäle, unter
anderem abhängig von deren Momentanleistung, auf andere Kanäle kopiert, sodass die
in diesen Kanälen enthaltenen Frequenzanteile am Ausgang verschoben in einem anderen
Frequenzbereich wieder auftauchen. Wohin die Kanäle abgebildet werden, bestimmt eine
Abbildungsvorschrift, die einstellbar ist, sodass verschiedene Kompressionsverhältnisse
realisierbar sind.
[0007] FIG 2 zeigt das Prinzip der Frequenzkompression durch einfaches Kopieren von Kanälen,
wie es bereits für Hörgeräte verwendet wird. Es wird beispielsweise der Kanal 14'
(gekennzeichnet durch seine Mittenfrequenz 14) auf den Kanal 11' (gekennzeichnet durch
seine Mittenfrequenz 11) kopiert bzw. verschoben). In dem Kanal 14' befindet sich
ein Ton 14" (z. B. eine Harmonische) der auf den Ton 11" in dem Zielkanal 11' verschoben
wird. Der Abstand des Tons 14" zu der Mittenfrequenz 14 ist identisch zu dem Abstand
des Tons 11" zu der Mittenfrequenz 11.
[0008] Diese einfache Abbildungsvorschrift bringt bei Harmonischen Signalen Probleme mit
sich. Harmonische Signale treten z. B. bei stimmhaften Lauten in der Sprache, beispielsweise
bei Vokalen, auf. Hierbei hat das unkomprimierte Spektrum linienartige Struktur, wobei
Spektrallinien bei der Sprachgrundfrequenz und bei deren ganzzahligen Vielfachen auftreten.
Das Raster der harmonischen Signale (Linienstruktur) wird bei der einfachen Abbildungsvorschrift
gemäß dem Stand der Technik nicht berücksichtigt und daher zerstört, d. h. die Spektrallinien
treten nicht mehr garantiert auf einem ganzzahligen Vielfachen der Sprachgrundfrequenz
auf. Dies äußert sich in deutlich wahrnehmbaren Artefakten (Signalanteile, die bei
ganzzahligen Vielfachen der Grundfrequenz auftreten, werden hier kurz "Harmonische"
genannt).
[0009] Aus der Druckschrift
US 6 577 739 B1 ist eine Vorrichtung und ein Verfahren zur proportionalen Audiokompression und zur
Frequenzverschiebung bekannt. Zur Kompression wird das Eingangsspektrum beispielsweise
mit dem Faktor 0,5, 0,7 oder 0,9 multipliziert, sodass eine Proportionalität der spektralen
Spitzen erhalten bleibt.
[0010] Darüber hinaus offenbart die Druckschrift
WO 2009/143898 A1 ein Verfahren zum Anpassen eines Schalls in einem Hörgerät durch Frequenzmodifikation.
Die Modifikation erfolgt auch hier beispielsweise durch Multiplikation des Eingangsspektrums
mit einem Kompressionsfaktor. Gegebenenfalls erfolgt zusätzlich eine Verschiebung.
Die Modifikation kann darüber hinaus auch logarithmisch vorgenommen werden.
[0011] Die Aufgabe der vorliegenden Erfindung besteht somit darin, Artefakte bei der Frequenzkompression
weiter zu reduzieren.
[0012] Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zur Frequenzkompression
eines Audiosignals, das eine Grundfrequenz und mindestens eine Harmonische besitzt,
nach Anspruch 1.
[0013] Es erfolgt beim oder nach dem Verschieben bzw. Abbilden der Harmonischen in einen
anderen Frequenzkanal eine harmonische Korrektur. Dies bedeutet, dass die Harmonische
auf eine Frequenzposition gesetzt wird, die ebenfalls ein ganzzahliges Vielfaches
der Grundfrequenz darstellt. Damit stellt die Harmonische auch nach dem Verschieben
eine Harmonische dar. Dies reduziert die Artefakte deutlich.
[0014] Es wird der erste Frequenzkanal vollständig in den zweiten Frequenzkanal verschoben.
Damit lässt sich beispielsweise ein Frequenzkanal aus einer toten Region in einen
hörbaren Bereich eines Hörgeräteträgers verschieben. Liegt in dem ersten Frequenzkanal
eine Harmonische, so wird sie vollständig mit dem Frequenzkanal verschoben. Ihr Abstand
zur Mittenfrequenz des Kanals bleibt dabei zunächst unverändert.
[0015] Eine der mit dem Frequenzkanal verschobenen Harmonischen zugeordnete zweite Frequenz
wird geschätzt, und die verschobene Harmonische wird dann in dem zweiten Frequenzkanäl
weiter auf die erste Frequenz verschoben. Dies bedeutet, dass das Verschieben in zwei
Schritten erfolgt. Zunächst wird der gesamte Frequenzkanal verschoben und anschließend
wird innerhalb des Frequenzkanals die ursprüngliche Harmonische wieder auf eine harmonische
Frequenzposition geschoben.
[0016] Das Weiterverschieben auf die erste Frequenz in dem zweiten Schiebeschritt erfolgt
durch Amplitudenmodulation. Dies lässt sich im Zeitbereich durch eine einfache Multiplikation
mit einem Faktor exp(j·ω·t) realisieren.
[0017] Vorzugsweise stellt die Harmonische in dem ersten Frequenzkanal eine dominante Frequenz
dar. Damit lässt sich ihre Position vor und nach dem Verschieben verhältnismäßig genau
schätzen.
[0018] Die vorliegende Erfindung wird anhand der beigefügten Zeichnungen näher erläutert,
in denen zeigen:
- FIG 1
- den prinzipiellen Aufbau eines Hörgeräts gemäß dem Stand der Technik;
- FIG 2
- das Prinzip der Frequenzkompression durch einfaches Kopieren von Kanälen gemäß dem
Stand der Technik;
- FIG 3
- eine Kompression gemäß dem Stand der Technik;
- FIG 4
- eine Kompression gemäß der vorliegenden Erfindung; und
- FIG 5
- einen Ausschnitt eines unkomprimierten Spektrums und einen Ausschnitt eines komprimierten
Spektrums.
[0019] Zum besseren Verständnis der Erfindung wird jedoch zunächst anhand von FIG 3 eine
Frequenzkompression gemäß dem Stand der Technik im Detail dargestellt. Demnach werden
Frequenzen gemäß einer Frequenz-Abbildungskurve (z. B. SPINC, BARK, ...) komprimiert.
Ausgangsbasis ist beispielsweise ein Linienspektrum, wie es in FIG 3 oben dargestellt
ist. Die Amplitudenantwort a ist über der Frequenz f aufgetragen. Das Linienspektrum
besitzt zahlreiche Harmonische 20, die die spektrale Feinstruktur des harmonischen
Signals bilden. Die Amplituden der Harmonischen 20 lassen sich durch eine spektrale
Einhüllende 21 verbinden. Der Abstand f
0 zwischen zwei Harmonischen 20 entspricht im gesamten Spektralbereich der Grundfrequenz.
Das Spektrum soll nun oberhalb einer Frequenz f
c komprimiert werden. Das Komprimieren erfolgt kanalweise, indem ausgewählte Kanäle
des Originalspektrums in tiefergelegene Kanäle kopiert werden. Die Kanäle besitzen
jedoch in der Regel eine andere Bandbreite als der Abstand f
0 zwischen den Harmonischen. Aufgrund dessen landen die Harmonischen 20 beim Verschieben
auf Frequenzpositionen außerhalb des in FIG 3 oben dargestellten Linienrasters. FIG
3 unten zeigt ein derartiges komprimiertes Spektrum. Die Abstände f
1, f
2 zwischen den einzelnen Linien 22, die die verschobenen Harmonischen darstellen, sind
nicht mehr konstant und insbesondere ungleich f
0. Die Einhüllende 23 des komprimierten Spektrums zeigt zwar in dem komprimierten Bereich
die verschobenen Formanden 24 und 25, wie sie aus dem Originalspektrum hervorgehen,
aber der Abstand der Linien 22 ist ungleichmäßig, wodurch also die spektrale Feinstruktur
und damit die Struktur des harmonischen Signals zerstört ist. Entsprechende Artefakte
sind die Folge.
[0020] Eine deutliche Verbesserung insbesondere für Sprachsignale ist erreichbar, wenn zusätzlich
zu der einfachen Abbildungsvorschrift gemäß dem Stand der Technik eine harmonische
Korrektur durchgeführt wird, was anhand von FIG 4 näher erläutert wird. Im oberen
Teil der Figur ist nochmals das Originalspektrum mit seinen Harmonischen 20 und der
Einhüllenden 21 wie in FIG 3 oben dargestellt. Der Abstand der einzelnen Harmonischen
20 entspricht im gesamten Originalspektrum der Grundfrequenz f
0.
[0021] In FIG 4 unten ist das durch die Erfindung angestrebte Ziel beispielhaft dargestellt.
Das Spektrum ist oberhalb der Grenzfrequenz f
c komprimiert. Die Einhüllende 23 des komprimierten Spektrums besitzt die gleiche Form
wie diejenige von FIG 3 unten. D. h. auch die Formanden 24 und 25 sind im komprimierten
Bereich zu erkennen. Die Linien 26 des Spektrums im komprimierten Bereich oberhalb
von f
c besitzen untereinander den gleichen Abstand f
0 wie die Linien bzw. Harmonischen 20 im nicht komprimierten Bereich. Dies bedeutet,
dass die Feinstruktur des Spektrums des harmonischen Signals von der Kompression unberührt
ist. Dementsprechend kommt es zu weniger Artefakten.
[0022] Zu dem Zweck der Frequenzkompression mit harmonischer Korrektur wird zunächst die
Frequenzstruktur des harmonischen Rasters des unkomprimierten Signals geschätzt d.h.
es werden die Positionen der Harmonischen im Frequenzbereich ermittelt. Anhand von
FIG 5 sei dies näher erläutert, die oben wieder einen Ausschnitt eines unkomprimierten
Spektrums und unten den Ausschnitt eines komprimierten Spektrums darstellt. Der Abschnitt
des dargestellten Spektrums weist hier eine Linie bzw. Harmonische 30 auf. Diese liegt
in einem Frequenzkanal 31, welcher seinerseits eine Mittenfrequenz f
31 besitzt. Unterhalb des ersten Frequenzkanals 31 befindet sich ein zweiter Frequenzkanal
32, welcher die Mittenfrequenz f
32 besitzt. Für die Kompression wird nun der erste Frequenzkanal 31 auf den zweiten
Frequenzkanal 32 verschoben, kopiert, oder abgebildet. Dies stellt einen ersten Schritt
33 der Frequenzkompression dar. Dieser Schritt 33 entspricht der Kompression gemäß
dem Stand der Technik von FIG 3. Demnach wird die Harmonische 30 des ersten Frequenzkanals
31 auf die Linie 34 geschoben, der eine Frequenz f
34 zugeordnet ist (im Weiteren auch zweite Frequenz genannt). Der Abstand Δf zwischen
den Frequenzen f
31 und f
30 ist identisch mit dem Abstand zwischen den Frequenzen f
32 und f
34. Die Frequenz f
34 entspricht jedoch nicht einer Harmonischen der Grundfrequenz. Vielmehr würde an der
Frequenzposition f
35 in dem zweiten Frequenzkanal 32 eine Harmonische liegen. Dies kann beispielsweise
durch eine erste Frequenzschätzung im Zielfrequenzbereich, d. h. in dem zweiten Frequenzkanal
32, auf den der erste Frequenzkanal 31 abgebildet bzw. verschoben wird, ermittelt
werden. Die Linie 34 muss also auf die Frequenz f
35 geschoben werden, um die Feinstruktur des harmonischen Signals zu erhalten. Hierzu
wird die Frequenzstruktur der noch unkorrigierten komprimierten Spektralanteile in
einer zweiten Schätzung geschätzt. In dem vereinfachten Beispiel von FIG 5, bei dem
nur ein Kanal verschoben wird, wird also nach der Verschiebung im ersten Schritt 33
die Frequenz f
34 der Linie 34 geschätzt bzw. ermittelt. Aus den beiden Frequenzschätzungen kann der
Frequenzversatz, d. h. der Abstand zwischen den Frequenzen f
34 und f
35 ermittelt werden. Der Versatz wird mit Hilfe einer Modulation in einem zweiten Schritt
36 kompensiert, wobei das harmonische Raster wiederhergestellt wird. Dabei wird die
Linie 34 auf die Frequenz f
35 geschoben, wodurch sich die Linie 35 ergibt.
[0023] Die Modulation kann beispielsweise auf der Basis des analytischen Signals durch Multiplikation
mit einem geeigneten komplexen Drehfaktor erreicht werden. So entspricht die Verschiebung
um eine Kreisfrequenz ω1 einer Multiplikation mit dem Faktor exp(j·ω1·t). Die resultierende
Modulation entspricht einer Amplitudenmodulation.
[0024] Vorteilhaft lässt sich dieses Verfahren bei einer Polyphasen-Filterbank einsetzen,
die nur das komplex-wertige, analytische Signal (nur positiver Frequenzanteil einer
FourierTransformation) in den Kanälen erzeugt. Hierbei lässt sich mittels Modulation
mit dem Modulationsterm exp(j·ω1·t) jeder Kanal zyklisch modulieren, sodass die Frequenzanteile
darin entsprechend zyklisch um die Kreisfrequenz ω1 verschoben werden.
[0025] Grundsätzlich sind bei der Schätzung der (dominanten) Frequenz zwei Fälle zu unterscheiden:
- 1) Es existiert eine dominante Frequenz, die gut geschätzt werden kann, d. h. es existiert
ein starker tonaler Anteil in diesem Kanal. Damit kann eine gute Korrektur des harmonischen
Rasters erreicht werden.
- 2) Es existiert keine dominante Frequenz, d. h. das Signal in dem Kanal ist rauschartig.
Die Frequenzschätzung führt zu einer mehr oder weniger zufälligen Momentanfrequenz.
Dies wiederum führt bei der Abbildung auf eine Zielfrequenz zu einer Phasenrandomisierung
bzw. zufälligen Modulation in dem Kanal, was bei rauschartigen Kanälen kaum Einfluss
auf den Höreindruck bewirkt.
[0026] Das oben geschilderte Ausführungsbeispiel basiert darauf, dass die Harmonische 30
als Signalanteil des Audiosignals tatsächlich verschoben wird. Gemäß eines Beispiels,
das nicht Teil der Erfindung ist, werden die komprimierten Spektralanteile halb-synthetisch
erzeugt. Die Information über die Frequenzposition der halb-synthetisch erzeugten
Spektralanteile wird aus der Schätzung der unkomprimierten harmonischen Struktur gewonnen,
d. h. die Frequenz 35 wird wie in dem obigen Beispiel ermittelt. Bei der Frequenz
f
35 wird nun jedoch ein synthetisches Signal erzeugt. Die Amplitude dieses synthetischen
Signals wird so eingestellt, dass sie der Amplitude der ursprünglichen Harmonischen
30 entspricht, d. h. die zugehörige Amplitude wird aus dem Quellspektrum gewonnen.
Auch hierdurch lässt sich eine Frequenzkompression erreichen, bei der das harmonische
Raster erhalten bleibt.
[0027] Die Abbildungsvorschrift von Quellfrequenz nach Zielfrequenz für die Frequenzkompression
wird in der Audiologie in bekannter Weise durchgeführt. Die harmonische Korrektur
bzw. die Einhaltung der harmonischen Struktur der komprimierten Spektralkomponenten
wird dann erfindungsgemäß erzielt. Damit werden die Artefakte der einfachen Abbildungsvorschrift
gemäß dem Stand der Technik massiv reduziert.