[0001] Die vorliegende Erfindung betrifft ein Verfahren zur Störgeräuschreduktion für Hörvorrichtungen
durch Schätzen eines Werts eines Eingangssignals mit einem Schätzalgorithmus. Darüber
hinaus betrifft die vorliegende Erfindung eine entsprechende Hörvorrichtung mit einer
Schätzeinrichtung zum Schätzen eines Werts eines Eingangssignals mit einem Schätzalgorithmus
und einer Störgeräuschreduktionseinrichtung zum Reduzieren eines Störgeräuschs in
dem Eingangssignal. Unter dem Begriff "Hörvorrichtung" wird hier jedes im oder am
Ohr tragbare, schallausgebende Gerät, insbesondere ein Hörgerät, ein Headset, Kopfhörer
und dergleichen, verstanden.
[0002] Hörgeräte sind tragbare Hörvorrichtungen, die zur Versorgung von Schwerhörenden dienen.
Um den zahlreichen individuellen Bedürfnissen entgegenzukommen, werden unterschiedliche
Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO), Hörgerät mit externem
Hörer (RIC: receiver in the canal) und In-dem-Ohr-Hörgeräte (IdO), z.B. auch Concha-Hörgeräte
oder Kanal-Hörgeräte (ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte
werden am Außenohr oder im Gehörgang getragen. Darüber hinaus stehen auf dem Markt
aber auch Knochenleitungshörhilfen, implantierbare oder vibrotaktile Hörhilfen zur
Verfügung. Dabei erfolgt die Stimulation des geschädigten Gehörs entweder mechanisch
oder elektrisch.
[0003] Hörgeräte besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler,
einen Verstärker und einen Ausgangswandler. Der Eingangswandler ist in der Regel ein
Schallempfänger, z. B. ein Mikrofon, und/oder ein elektromagnetischer Empfänger, z.
B. eine Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer Wandler,
z. B. Miniaturlautsprecher, oder als elektromechanischer Wandler, z. B. Knochenleitungshörer,
realisiert. Der Verstärker ist üblicherweise in eine Signalverarbeitungseinheit integriert.
Dieser prinzipielle Aufbau ist in FIG 1 am Beispiel eines Hinter-dem-Ohr-Hörgeräts
dargestellt. In ein Hörgerätegehäuse 1 zum Tragen hinter dem Ohr sind ein oder mehrere
Mikrofone 2 zur Aufnahme des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit
3, die ebenfalls in das Hörgerätegehäuse 1 integriert ist, verarbeitet die Mikrofonsignale
und verstärkt sie. Das Ausgangssignal der Signalverarbeitungseinheit 3 wird an einen
Lautsprecher bzw. Hörer 4 übertragen, der ein akustisches Signal ausgibt. Der Schall
wird gegebenenfalls über einen Schallschlauch, der mit einer Otoplastik im Gehörgang
fixiert ist, zum Trommelfell des Geräteträgers übertragen. Die Energieversorgung des
Hörgeräts und insbesondere die der Signalverarbeitungseinheit 3 erfolgt durch eine
ebenfalls ins Hörgerätegehäuse 1 integrierte Batterie 5.
[0004] Bei der Verarbeitung digitaler Sprachaufnahmen, z. B. digitalen Hörgeräten, ist es
oft wünschenswert, störende Hintergrundgeräusche zu unterdrücken, ohne dabei das Nutzsignal
(Sprache) zu beeinflussen. Hierfür sind Filterverfahren, welche das Kurzzeitspektrum
des Signals beeinflussen, wie das Wiener-Filter, bekannt und geeignet. Allerdings
setzen diese Verfahren eine genaue Schätzung der frequenzabhängigen Leistung des zu
unterdrückenden Störgeräuschs aus einem Eingangssignal voraus. Ist diese Schätzung
ungenau, wird entweder eine nicht zufriedenstellende Störgeräuschunterdrückung erreicht,
das Wunschsignal wird angegriffen oder es entstehen zusätzliche künstlich erzeugte
Störsignale, so genannte "musical tones". Methoden zur Störgeräuschschätzung, welche
diese Probleme vollumfänglich und effizient lösen, stehen noch nicht zur Verfügung.
[0005] Bislang kann die Störgeräuschleistung prinzipiell durch zwei Ansätze geschätzt werden.
Beide Methoden können entweder breitbandig oder bevorzugt in einer Frequenzbereichszerlegung
mittels Filterbank oder Kurzzeit-Fourier-Transformation stattfinden:
- 1. Sprachaktivitätserkennung:
Solange keine Sprachaktivität festgestellt wird, betrachtet man die komplette (zeitveränderliche)
Eingangssignalleistung als Störgeräusch. Sofern Sprachaktivität detektiert wird, hält
man die Störgeräuschschätzung auf dem letzten, vor dem Einsetzen der Sprachaktivität
geschätzten, Wert konstant.
- 2. Störleistungsschätzung während einer Sprachaktivität (so genanntes "Minimum-Tracking-Verfahren"):
Es ist bekannt, dass auch während einer Sprachaktivität die Sprachsignalleistung in
einzelnen Frequenzbereichen immer wieder kurzfristig nahezu Null ist. Liegt nun eine
Mischung aus Sprache und vergleichsweise langsam zeitveränderlichem Störgeräusch zugrunde,
so entsprechen die Minima der zeitlich betrachteten spektralen Signalleistung der
Störgeräuschleistung zu diesen Zeitpunkten. Zwischen den festgestellten Minima muss
die Störsignalleistung liegen ("Minimum-Tracking"). Ein derartiges Minimum-Tracking
kann beispielsweise mit Hilfe eines Glättungsfilters durchgeführt werden, der beispielsweise
beschrieben ist in R. Martin, "Noise power spectral density estimation based on optimal smoothing and
minimum statistics", IEEE Trans. Speech Audio Processing, Vol. 9, Nr. 5, Juli 2001,
Seiten 504 - 512 oder S. Rangachari, P. Loizou, "A noise-estimation algorithm for highly non-stationary
environments", Speech Communication, Vol. 48, Februar 2006, Seiten 220 - 231. Die Ermittlung der Störgeräuschleistung erfolgt typischerweise getrennt für verschiedene
Frequenzbereiche im Eingangssignal. Hierzu wird das Eingangssignal zunächst mittels
einer Filterbank oder einer Fourier-Transformation in einzelne Frequenzkomponenten
aufgespalten. Diese Komponenten werden dann getrennt voneinander verarbeitet.
[0006] Bei der oben genannten Methode 1, stellt einerseits die zuverlässige Erkennung von
Sprachaktivität ein Problem dar, und es ist andererseits nicht möglich, zeitlich veränderliche
Störgeräusche während gleichzeitiger Sprachaktivität zu verfolgen.
[0007] Bei der obigen Methode 2 sind grundsätzliche Widersprüche in der Einstellung des
Algorithmus zu lösen: Wenn Sprache vorliegt, sollte die Störgeräuschschätzung nur
langsam angepasst werden, um nicht durch schnelle Adaption Sprachanteile als Störgeräusche
zu klassifizieren und hierdurch die Sprachqualität anzugreifen. Liegt keine Sprache
vor, so sollte die Störleistungsschätzung ohne Verzögerung der temporalen Feinstruktur
des Eingangssignals folgen. Hieraus ergeben sich für die Einstellparameter des Verfahrens,
wie z. B. Glättungszeitkonstanten, Fensterlänge für eine Minimumsuche oder Gewichtungsfaktoren
widersprüchliche Anforderung, die bislang nur im Mittel optimal gelöst werden konnten.
[0008] Die Aufgabe der vorliegenden Erfindung besteht somit darin, die Qualität einer Störgeräuschunterdrückung
zu verbessern, so dass insbesondere Sprache weniger angegriffen wird und störende
Artefakte besser vermieden werden.
[0009] Erfindungsgemäß wird diese Aufgabe gelöst durch ein Verfahren zur Störgeräuschreduktion
für Hörvorrichtungen durch Schätzen eines ersten Werts eines Eingangssignals mit einem
ersten Schätzalgorithmus, Parametrieren eines zweiten Schätzalgorithmus mit dem geschätzten
ersten Wert, Schätzen eines zweiten Werts des Eingangssignals mit dem zweiten Schätzalgorithmus
und Reduzieren eines Störgeräuschs in dem Eingangssignal anhand des geschätzten zweiten
Werts. Dabei kann der erste Wert hier wie im Folgenden gleich dem zweiten Wert sein.
[0010] Darüber hinaus wird erfindungsgemäß bereitgestellt ein Hörgerät bzw. eine Hörvorrichtung
mit einer ersten Schätzeinrichtung zum Schätzen eines ersten Werts eines Eingangssignals
mit einem ersten Schätzalgorithmus und einer Störgeräuschreduktionseinrichtung zum
Reduzieren eines Störgeräuschs in dem Eingangssignal sowie umfassend eine zweite Schätzeinrichtung,
die mit dem geschätzten ersten Wert parametriert ist, zum Schätzen eines zweiten Werts
des Eingangssignals mit einem zweiten Schätzalgorithmus, wobei die Störgeräuschreduktionseinrichtung
den geschätzten zweiten Wert von der zweiten Schätzeinrichtung zum Reduzieren des
Störgeräuschs erhält.
[0011] Die erfindungsgemäße zweistufige Schätzung führt zu einer deutlich verbesserten Schätzqualität,
denn in der ersten Stufe kann eine einfache Schätzung durchgeführt werden, deren Resultat
zur Parametrierung der zweiten Schätzeinrichtung bzw. des zweiten Schätzalgorithmus
herangezogen wird. Der zweite Schätzalgorithmus lässt sich so an eine spezifische
Störsituation anpassen, wodurch eine situationsspezifische Schätzung erreicht werden
kann.
[0012] Der erste Schätzalgorithmus kann auf einem Minimum-Tracking-Verfahren beruhen. Damit
kann auf einfache Weise ein Störleistungsniveau bei Sprachaktivität ermittelt werden.
[0013] Bei einer speziellen Ausführungsform kann durch den ersten Schätzalgorithmus eine
zeitliche Veränderungsrate des Eingangssignals als erster oder weiterer Wert zur Parametrierung
des zweiten Schätzalgorithmus geschätzt werden. Damit kann die Gesamtleistung und
die Störleistung zuverlässig geschätzt werden.
[0014] Entsprechend einer weiteren Ausführungsform kann der erste Schätzalgorithmus und
der zweite Schätzalgorithmus strukturell gleich sein. Dies reduziert den Implementierungsaufwand.
Insbesondere ist es so möglich, dass die erste Schätzeinrichtung und die zweite Schätzeinrichtung
durch eine einzige Schätzeinrichtung realisiert werden, die im Zeitmultiplex abwechselnd
als erste und zweite Schätzeinrichtung betrieben wird.
[0015] Die beiden Schätzalgorithmen können aber auch unterschiedlich sein. So kann der erste
Schätzalgorithmus eine rekursive Glättung beinhalten und der zweite Schätzalgorithmus
nicht rekursiv sein. Auf diese Weise kann der Implementierungsaufwand an die gewünschte
Schätzqualität angepasst werden.
[0016] Vorzugsweise ist der erste Wert, der mit dem ersten Schätzalgorithmus geschätzt wird,
eine Signalleistung, eine Störleistung oder ein Signal-Stör-Verhältnis. Diese Größen
können direkt zur Dämpfung entsprechender Störungen herangezogen werden.
[0017] Weiterhin kann durch den ersten Schätzalgorithmus für mehrere Frequenzbereiche selektiv
jeweils ein erster Wert geschätzt und diese ersten Werte zusammengefasst werden, um
den zweiten Schätzalgorithmus zu parametrieren. Damit ist es möglich, die Parametrierung
des zweiten Schätzalgorithmus anhand der spektralen Verteilung des Eingangssignals
zu beeinflussen.
[0018] Besonders zu bevorzugen ist das dynamische Parametrieren des zweiten Schätzalgorithmus
mit einem ständig aktualisierten ersten Wert des ersten Schätzalgorithmus. Damit kann
die Störgeräuschreduktion ständig angepasst an die aktuelle akustische Situation stets
mit hoher Qualität erfolgen.
[0019] Weiterhin kann es bei dem beschriebenen Verfahren zur Störgeräuschreduktion günstig
sein, das Eingangsignal in einzelne Frequenzkomponenten aufzuspalten und gegenüber
dem nicht aufgespalteten Signal in zeitlich unterabgetasteter Form zu verarbeiten.
Mit dieser Abwärtstastung kann der Rechnaufwand deutlich reduziert werden.
[0020] Die vorliegende Erfindung ist anhand der beigefügten Zeichnungen näher erläutert,
in denen zeigen:
- FIG 1
- den prinzipielle Aufbau eines Hörgeräts gemäß dem Stand der Technik und
- FIG 2
- ein Blockdiagramm einer Realisierungsform eines er- findungsgemäßen Verfahrens.
[0021] Die nachfolgend näher geschilderten Ausführungsbeispiele stellen bevorzugte Ausführungsformen
der vorliegenden Erfindung dar.
[0022] Die in FIG 2 dargestellte Signalverarbeitungseinrichtung eines Hörgeräts besitzt
am Signaleingang eine Anlaysefilterbank AFB. Sie verfügt über einen breitbandigen
Signaleingang BI und einen mehrkanaligen Ausgang CO. In den breitbandigen Eingang
BI wird ein gestörtes Nutzsignal S eingespeist. Dieses Signal wird durch die Analysefilterbank
AFB spektral zerlegt. Das Ausgangssignal der Analysefilterbank AFB wird an den Eingang
I1 eines ersten Schätzers NS1, an einen Eingang 12 eines zweiten Schätzers NS2 und
an einen Eingang 13 einer Störgeräuschreduktionseinrichtung NR geführt. Der erste
Schätzer NS1 schätzt die Leistung des Störsignals und gibt sie als initiale Störleistung
am Ausgang NP1 aus. Außerdem schätzt der Schätzer NS1 hier auch die Nutzsignalleistung
und gibt sie am Ausgang SP1 aus.
[0023] Der zweite Schätzer NS2 nimmt neben dem Ausgangssignal der Analysefilterbank AFB
die initiale Störsignalleistung an seinem Eingang NP2 und die initiale Nutzsignalleistung
an seinem Eingang SP2 auf. Die initiale Störsignalleistung und die initiale Nutzsignalleistung
werden dazu verwendet, um den adaptiven Schätzer NS2 zu parametrieren. Mit der aktuellen
Parametereinstellung schätzt der zweite Schätzer eine finale Störsignalleistung, die
er an seinem Ausgang FNP2 ausgibt und optional auch eine finale Nutzsignalleistung,
die er an seinem Ausgang FSP2 ausgibt.
[0024] Die dem adaptiven zweiten Schätzer NS2 nachgeschaltete Störsignalreduktionseinrichtung,
die beispielsweise als Wiener-Filter realisiert sein kann, nimmt die finale Störsignalleistung
an ihrem Eingang FNP3 und die finale Nutzsignalleistung an ihrem Eingang FSP3 auf.
Anhand dieser Größen zusammen mit dem Ausgangssignal der Analysefilterbank AFB berechnet
der Störgeräuschreduktionsalgorithmus der Störgeräuschreduktionseinrichtung NR eine
Dämpfung bzw. Reduktionsverstärkung, die am Ausgang RG ausgebeben wird.
[0025] Die bevorzugt mehrkanalige Reduktionsverstärkung der Störgeräuschreduktionseinrichtung
NR wird zusammen mit dem mehrkanaligen Ausgangssignal der Analysefilterbank einem
Multiplizierer M zugeführt, der kanalweise eine Multiplikation durchführt, so dass
ein mehrkanaliges störgeräuschbefreites Signal entsteht, welches einer Synthesefilterbank
SFB speziell deren mehrkanaligem Eingang CI zugeführt wird. Die Synthesefilterbank
SFB synthetisiert die Signale der einzelnen Kanäle zu einem breitbandigen geräuschreduzierten
Ausgangssignal SR. Dieses Signal steht am Ausgang BO zur Verfügung.
[0026] Die Störgeräuschbefreiung basiert also auf einer zweistufigen Schätzung der Störsignalleistung.
Dabei erfolgt zunächst eine erste Schätzung der Gesamtleistung bzw. der Nutzsignalleistung
und der Störleistung in dem ersten Schätzer NS1. Diese erste Schätzung kann beispielsweise
mittels eines fest parametrierten Mimimum-Tracking-Verfahrens, wie es oben beschrieben
wurde, erfolgen. Für die Schätzung kann auch beispielsweise die zeitliche Veränderungsrate
des Eingangssignals als (gegebenenfalls zusätzliches) Kriterium verwendet werden.
Diese Veränderungsrate ist in dem
Aufsatz F. F. Quatieri, R.B. Dunn, "Speech enhancement based on auditory spectral
change", Proc. IEEE Int. Conf. Acoustics, Speech, Signal Processing (ICASSP), Vol.
I, 2002, Seiten 257 bis 260 unter dem Stichwort "spectral change" beschrieben.
[0027] Aufgrund dieser Schätzung des ersten Schätzers NS1, z. B. in Form eines Signal-Rauschverhältnisses
(oder in einer bevorzugten Ausführung in Form eines Rausch-Signalverhältnisses bzw.
der Signalleistung und/oder der Störleistung direkt, werden Betriebsparameter des
zweiten, parallel zu dem ersten betriebenen Störschätzungsverfahrens in dem zweiten
Schätzer NS2 adaptiert.
[0028] Das zweite Störschätzungsverfahren ist in einer bevorzugten Ausführung strukturell
dem ersten gleich und unterscheidet sich nur durch die aufgrund der Ergebnisse des
ersten Verfahrens adaptiv veränderte Parametrierung. In dem zweiten Schätzer kann
beispielsweise eine Zeitkonstante eines Glätters so adaptiert werden, dass bei geringem
geschätzten Signal-Rauschverhältnis eine schnellere Glättung erfolgt als bei hohem
geschätztem Signal-Rauschverhältnis.
[0029] In dem zweiten Schätzer NS2 können weiterhin aufgrund der Schätzgrößen aus dem ersten
Schätzer nicht nur ein Parameter, sondern auch mehrere Parameter verändert werden.
Die Änderung der Parameter des zweiten Störleistungsschätzers NS2 kann direkt entsprechend
der ersten Schätzung der Störleistung frequenzabhängig erfolgen. Alternativ kann die
Änderung der Parameter des zweiten Störleistungsschätzers auch aufgrund einer Zusammenfassung
der ursprünglich frequenzselektiv ermittelten ersten Störgeräuschschätzung erfolgen.
Dabei können die Änderungsbereiche und Grenzwerte der Parameter des zweiten Störgeräuschschätzers
NS2 frequenzabhängig festgelegt werden. Insbesondere ist es vorteilhaft, wenn die
Änderungsbereiche und Grenzwerte der zweiten Störgeräuschschätzers NS2 abhängig von
der ersten Schätzung dynamisch festgelegt werden.
[0030] Das zweite Störgeräuschschätzverfahren bzw. der zweite Störgeräuschschätzer kann
sich auch strukturell vom ersten unterscheiden. So kann z. B. im ersten Verfahren
eine rekursive Glättung (vergleiche R. Martin a.a.O.) zum Einsatz kommen, während
im zweiten ein nicht rekursives Verfahren (vergleiche S. Rangachari, P. Loizou a.a.O.)
adaptiert wird oder umgekehrt.
[0031] Die Aufspaltung des Eingangssignals in Frequenzkomponenten kann entweder mittels
einer (auch nichtgleichförmigen) Filterbank oder mittels (Kurzzeit-)Fourier-Transformation
erfolgen. Weiterhin kann das in einzelne Frequenzkomponenten aufgespaltete Signal
gegenüber dem nicht aufgespalteten Signal in zeitlich unterabgetasteter Form verarbeitet
werden.
[0032] Durch die erfindungsgemäße Kombination eines ersten fest parametrierten Störgeräuschschätzers
mit einem zweiten, anhand von Schätzwerten des ersten Schätzers und gegebenenfalls
weiterer Kriterien zeitveränderlich parametrierten Störgeräuschschätzers kann eine
Störgeräuschschätzung realisiert werden, die nicht die nachteiligen Merkmale eines
fest parametrierten Störgeräuschschätzers hat und nicht die explizite Schätzung von
Sprachaktivität erfordert. Insbesondere muss nicht ein Kompromiss zwischen langsamer
Adaption bei Vorliegen eines Sprachsignals und schneller Adaption, wenn keine Sprache
vorliegt, gefunden werden. Vielmehr kann durch die Anpassung der Parameter insgesamt
eine verbesserte Störgeräuschschätzung und damit eine verbesserte Störgeräuschreduktion
erreicht werden, welche Sprache weniger angreift und gleichzeitig störende Artefakte
wie z.B. "musical tones" signifikant verringert. Gleichzeitig lässt sich die vorgeschlagene
Lösung effizient implementieren z.B. durch einen einzigen, im Zeitmultiplex betriebenen
Störgeräuschschätzer, was den Einsatz in Geräten mit geringer Signalverarbeitungskapazität,
wie z.B. Hörgeräten, ermöglicht.
1. Verfahren zur Störgeräuschreduktion für Hörvorrichtungen durch
- Schätzen eines ersten Werts eines Eingangssignals (S) mit einem ersten Schätzalgorithmus,
gekennzeichnet durch
- Parametrieren eines zweiten Schätzalgorithmus mit dem geschätzten ersten Wert,
- Schätzen eines zweiten Werts des Eingangssignals (S) mit dem zweiten Schätzalgorithmus
und
- Reduzieren eines Störgeräuschs in dem Eingangssignal (S) anhand des geschätzten
zweiten Werts.
2. Verfahren nach Anspruch 1, wobei der erste Schätzalgorithmus auf einem Minimum-Tracking-Verfahren
beruht.
3. Verfahren nach Anspruch 1 oder 2, wobei durch den ersten Schätzalgorithmus eine zeitliche
Veränderungsrate des Eingangssignals (S) als erster oder weiterer Wert zur Parametrierung
des zweiten Schätzalgorithmus geschätzt wird.
4. Verfahren nach einem der vorhergehenden Ansprüche, wobei der erste Schätzalgorithmus
und der zweite Schätzalgorithmus strukturell gleich sind.
5. Verfahren nach einem der Ansprüche 1 bis 3, wobei der erste Schätzalgorithmus eine
rekursive Glättung beinhaltet und der zweite Schätzalgorithmus nicht rekursiv ist.
6. Verfahren nach einem der vorhergehenden Ansprüche, wobei der erste Wert eine Signalleistung,
eine Störleistung oder ein Signal-Stör-Verhältnis ist.
7. Verfahren nach einem der vorhergehenden Ansprüche, wobei durch den ersten Schätzalgorithmus
für mehrere Frequenzbereiche selektiv jeweils ein erster Wert geschätzt wird und diese
ersten Werte zusammengefasst werden, um den zweiten Schätzalgorithmus zu parametrieren.
8. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Parametrieren des zweiten
Schätzalgorithmus dynamisch mit einem ständig aktualisierten ersten Wert erfolgt.
9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Eingangssignal in einzelne
Frequenzkomponenten aufgespalten und gegenüber dem nicht aufgespalteten Signal in
zeitlich unterabgetasteter Form verarbeitet wird.
10. Hörvorrichtung mit
- einer ersten Schätzeinrichtung (NS1) zum Schätzen eines ersten Werts eines Eingangssignals
(S) mit einem ersten Schätzalgorithmus und
- einer Störgeräuschreduktionseinrichtung (NR) zum Reduzieren eines Störgeräuschs
in dem Eingangssignal (S),
gekennzeichnet durch
- eine zweite Schätzeinrichtung (NS2), die mit dem geschätzten ersten Wert parametriert
ist, zum Schätzen eines zweiten Werts des Eingangssignals (S) mit einem zweiten Schätzalgorithmus,
wobei
- die Störgeräuschreduktionseinrichtung (NR) den geschätzten zweiten Wert von der
zweiten Schätzeinrichtung (NS2) zum Reduzieren des Störgeräuschs erhält.
11. Hörvorrichtung nach Anspruch 10, wobei die ersten und zweite Schätzeinrichtung (NS1,
NS2) durch eine einzige Schätzeinrichtung realisiert ist, die im Zeitmultiplex abwechselnd
als erste und zweite Schätzeinrichtung betreibbar ist.