(19)
(11) EP 4 518 357 A1

(12) EUROPÄISCHE PATENTANMELDUNG

(43) Veröffentlichungstag:
05.03.2025  Patentblatt  2025/10

(21) Anmeldenummer: 24196548.2

(22) Anmeldetag:  26.08.2024
(51) Internationale Patentklassifikation (IPC): 
H04R 25/00(2006.01)
(52) Gemeinsame Patentklassifikation (CPC) :
H04R 2225/41; H04R 2225/43; H04R 25/407; H04R 25/552; G10L 25/78; G10L 2021/02087
(84) Benannte Vertragsstaaten:
AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC ME MK MT NL NO PL PT RO RS SE SI SK SM TR
Benannte Erstreckungsstaaten:
BA
Benannte Validierungsstaaten:
GE KH MA MD TN

(30) Priorität: 04.09.2023 DE 102023208468

(71) Anmelder: Sivantos Pte. Ltd.
Singapore 539775 (SG)

(72) Erfinder:
  • WILSON, Cecil
    91058 Erlangen (DE)
  • KAMKAR-PARSI, Homayoun
    91058 Erlangen (DE)
  • LÜKEN, Christoph
    91058 Erlangen (DE)

(74) Vertreter: FDST Patentanwälte 
Nordostpark 16
90411 Nürnberg
90411 Nürnberg (DE)

   


(54) VERFAHREN ZUR DIREKTIONALEN SIGNALVERARBEITUNG FÜR EIN HÖRSYSTEM


(57) Die Erfindung nennt ein Verfahren zur direktionalen Signalverarbeitung für ein Hörsystem (HS) mit wenigstens einem ersten Hörinstrument (H1), wobei aus einem Umgebungsschall (Us) durch einen elektroakustischen ersten Eingangswandler (M1) des ersten Hörinstruments (H1) ein erstes Eingangssignal (E1) erzeugt wird, und durch einen elektroakustischen zweiten Eingangswandler (M2) des Hörsystems (HS) ein zweites Eingangssignal (E2) erzeugt wird, wobei anhand des ersten Eingangssignals (E1) und anhand des zweiten Eingangssignals (E2) eine Anzahl (#N) von Gesprächspartnern (G1-3, Gj) eines Trägers (T1) des Hörsystems (HS) ermittelt wird, wobei in Abhängigkeit der ermittelten Anzahl (#N) der Gesprächspartner (G1-3, Gj) wenigstens eine Kompression und/oder eine Richtmikrofonie und/oder eine Rauschunterdrückung in der Verarbeitung des ersten Eingangssignals (E1) und/oder des zweiten Eingangssignals (E2) modifiziert wird, und hierdurch ein erstes Ausgangssignal (Out1) erzeugt wird.




Beschreibung


[0001] Die Erfindung betrifft ein Verfahren zur direktionalen Signalverarbeitung für ein Hörsystem mit wenigstens einem ersten Hörinstrument, wobei aus einem Umgebungsschall durch einen elektroakustischen ersten Eingangswandler des ersten Hörinstruments ein erstes Eingangssignal erzeugt wird, und durch einen elektroakustischen zweiten Eingangswandler des Hörsystems ein zweites Eingangssignal erzeugt wird, wobei in Abhängigkeit einer Verarbeitung des ersten Eingangssignals und/oder des zweiten Eingangssignals ein erstes Ausgangssignal erzeugt wird.

[0002] In einem Hörgerät für eine Versorgung einer Hörschwäche ist eine der schwierigsten Situationen die Unterstützung eines Hörgeschädigten in einer Konversation mit mehreren potentiellen Gesprächspartnern (z.B. sog. "Cocktail-Party"-Hörsituation). Hierbei sind meist mehrere Nutzsignale, welche in den Gesprächsbeiträgen der Gesprächspartner gegeben sind, von einem Rauschhintergrund abzusetzen, welcher seinerseits weitere, möglicherweise undefinierte bis bruchstückhafte Sprachsignale enthalten kann, und welcher zudem meist keine klar definierten Quellen aufweist.

[0003] In einem Zwiegespräch kann sich ein Hörgeschädigter zumeist voll auf das Gespräch mit dem einzigen Gesprächspartner konzentrieren, sodass er auch besondere Aufmerksamkeit auf non-verbale Kommunikationselemente wie Gestik und/oder Mimik des Gesprächspartners sowie auf direkte Interaktion mit dem Gesprächspartner (also z.B. kurze, wechselseitige Einwürfe o.ä.) richten kann. Ein Zwiegespräch kann hierbei durch eine besondere Hervorhebung der Sprachbeiträge des einzigen Gesprächspartners in effizient lösbarer Weise durch ein Hörgerät unterstützt werden.

[0004] Bei mehreren Gesprächspartnern ist jedoch die Unterstützung durch ein Hörgerät meist allein schon dadurch erschwert, dass die einzelnen Gesprächsbeiträge entweder nicht zufriedenstellend gegen ein Hintergrundrauschen hervorgehoben werden können, oder dass eine solche Hervorhebung zu einem unnatürlich klingenden und somit unangenehmen Hintergrund führen kann. Überdies liegt oftmals einer der Gesprächspartner nicht in Frontalrichtung des Hörgeschädigten, wodurch non-verbale Kommunikationselemente nicht in gleichem Maße wahrgenommen werden, wie es bei einem Zwiegespräch der Fall wäre. Dies, sowie eine potentielle mangelnde Synchronisierung des sog. "Turntaking", also der Reihenfolge beim Sprechen, kann bei einem Hörgeschädigten zu einer erheblichen Anstrengung führen, sodass dieser sich zunehmend in der Kommunikation zurücknimmt, oder die Gesprächsrunde gar ganz verlässt, da er ihr immer weniger folgen kann.

[0005] Der Erfindung liegt daher die Aufgabe zugrunde, für ein Hörinstrument ein Verfahren anzugeben, mittels dessen eine Unterstützung eines Hörgeschädigten möglichst zielgenau in komplexen Gesprächssituationen erreichbar ist, und hierbei der Hintergrund möglichst natürlich bleiben soll.

[0006] Die genannte Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren zur direktionalen Signalverarbeitung für ein Hörsystem mit einem ersten Hörinstrument, wobei aus einem Umgebungsschall durch einen elektroakustischen ersten Eingangswandler des ersten Hörinstruments ein erstes Eingangssignal erzeugt wird, und durch einen elektroakustischen zweiten Eingangswandler des Hörsystems ein zweites Eingangssignal erzeugt wird, wobei anhand des ersten Eingangssignals und anhand des zweiten Eingangssignals eine Anzahl von Gesprächspartnern eines Trägers des Hörsystems ermittelt wird, und wobei in Abhängigkeit der ermittelten Anzahl der Gesprächspartner wenigstens eine Kompression und/oder eine Richtmikrofonie und/oder eine Rauschunterdrückung in der Verarbeitung des ersten Eingangssignals und/oder des zweiten Eingangssignals modifiziert wird, und hierdurch ein erstes Ausgangssignal erzeugt wird. Vorteilhafte und teils für sich gesehen erfinderische Ausgestaltungen sind Gegenstand der Unteransprüche und der nachfolgenden Beschreibung.

[0007] Als ein Hörinstrument ist hierbei generell jedwede Vorrichtung umfasst, welche dazu eingerichtet ist, aus einem Umgebungssignal mittels eines Eingangswandlers ein elektrisches Signal zu erzeugen, und dieses zu einem Ausgangssignal zu verarbeiten, sowie aus dem Ausgangssignal ein Ausgangsschallsignal zu erzeugen und einem Gehör eines Trägers dieser Vorrichtung zuzuführen. Unter einem Hörinstrument ist dabei insbesondere ein Kopfhörer (z.B. als "Earbud"), ein Headset, eine Datenbrille mit Lautsprecher, etc. umfasst. Als ein Hörinstrument ist aber auch ein Hörgerät im engeren Sinne umfasst, also ein Gerät zur Versorgung einer Hörschwäche des Trägers, in welchem eines oder mehrere Eingangssignale in Abhängigkeit audiologischer Anforderungen des Trägers zu besagtem Ausgangssignal verarbeitet und dabei insbesondere frequenzbandabhängig verstärkt wird, sodass das aus dem Ausganssignal mittels eines Lautsprechers o.ä. erzeugte Ausgangsschallsignal dazu geeignet ist, insbesondere benutzerspezifisch die Hörschwäche des Trägers zumindest teilweise zu kompensieren.

[0008] Unter einem elektroakustischen Eingangswandler ist hierbei insbesondere jedwede Vorrichtung umfasst, welche dazu eingerichtet ist, aus einem Schallsignal ein entsprechendes elektrisches Signal zu erzeugen. Insbesondere kann bei der Erzeugung des ersten bzw. zweiten Eingangssignals durch den jeweiligen Eingangswandler auch eine Vorverarbeitung erfolgen, z.B. in Form einer linearen Vorverstärkung und/oder einer A/D-Konvertierung. Das entsprechend erzeugte Eingangssignal ist dabei insbesondere durch ein elektrisches Signal gegeben, dessen Strom- und/oder Spannungsschwankungen im Wesentlichen die Schalldruck-Schwankungen der Luft repräsentieren.

[0009] Das Hörsystem kann hierbei einerseits lediglich das erste Hörinstrument umfassen. In diesem Fall ist der zweite Eingangswandler ebenfalls im ersten Hörinstrument angeordnet. Die Anzahl an Gesprächspartnern kann dann insbesondere anhand von (monauraler) Richtmikrofonie und/oder sonstiger direktionaler Signalverarbeitung erfolgen, wobei zusätzlich insbesondere spektralen Analysen der Eingangssignale herangezogen werden können.

[0010] Bevorzugt ist jedoch das Hörsystem als ein binaurales Hörsystem ausgestaltet, welches das erste Hörinstrument und ein zweites Hörinstrument umfasst, welche jeweils an einem bzw. am anderen Ohr zu tragen sind, wobei das zweite Eingangssignal durch den zweiten Eingangswandler des zweiten Hörinstruments erzeugt wird. In diesem Fall kann die Anzahl an Gesprächspartnern insbesondere anhand von direktionaler Verarbeitung der beiden Eingangssignale erreicht werden, indem bspw. anhand der beiden Eingangssignalen jeweils mittels Richtmikrofonie Zwischensignale mit unterschiedlichen Richtcharakteristiken erzeugt werden, und die Zwischensignale für die Detektion der Gesprächspartner herangezogen werden.

[0011] Üblicherweise erfolgt die Signalverarbeitung in einem Hörinstrument, insbesondere in einem Hörgerät zur Versorgung einer Hörschwäche, in Abhängigkeit von klassifizierten "Hörsituationen" erfolgt. Diese Hörsituationen sind standardisierte Typen möglicher akustischer Umgebungen, welche anhand bestimmter im Hörinstrument messbarer Merkmale wie Signal-zu-Rausch-Verhältnis ("Signal-to-Noise Ratio", SNR), Sprachanteil, Sprachverständlichkeit ("Speech Intelligibility Index", SII) o.ä. bestimmt und eingeteilt werden.

[0012] Diese Einteilung kann jedoch dazu führen, dass in komplexen Hörsituationen mit mehreren Gesprächspartnern im Beisein von Hintergrundgeräuschen (welche ggf. ebenfalls Sprachsignale enthalten können, die jedoch irrelevant für den Träger sind) einerseits entweder eine zu aggressive Rauschunterdrückung und/oder Richtmikrofonie erfolgt, sodass ein unnatürlicher Klangeindruck entsteht, und zudem ggf. ein seitlich stehender Gesprächspartner gar nicht von der Richtmikrofonie erfasst wird, oder andererseits einzelne Gesprächsbeiträge nicht ausreichend hervorgehoben werden.

[0013] Die Erfindung löst dieses Problem, indem die akustischen Begebenheiten einer Situation daraufhin untersucht werden, wie viele Gesprächspartner im Gespräch mit dem Träger des Hörinstrumentes bzw. Hörsystems stehen. Insbesondere wird hierbei explizit eine unterschiedliche Signalverarbeitung für den Fall eines Gesprächspartners einerseits und für den Fall zweier oder mehrerer Gesprächspartner andererseits angewandt. Bevorzugt wird auch bei zwei oder mehr Gesprächspartnern die Signalverarbeitung noch fallweise differenziert angewandt, also insbesondere der Fall zweier Gesprächspartner vom Fall dreier oder mehr Gesprächspartner unterschieden.

[0014] Unter einer Modifizierung einer Kompression und/oder einer Richtmikrofonie und/oder einer Rauschunterdrückung in der Verarbeitung des ersten Eingangssignals und/oder des zweiten Eingangssignals ist hierbei insbesondere umfasst, dass vom ersten Eingangssignal und/oder vom zweiten Eingangssignal, insbesondere auch unter Verwendung der Signalanteile noch weiterer Eingangssignale, ein Zwischensignal abgeleitet wird, und die Kompression bzw. Rauschunterdrückung für dieses Zwischensignal in Abhängigkeit der Anzahl der Gesprächspartner eingestellt wird. Insbesondere kann zudem das Zwischensignal durch ein Richtsignal gegeben sein.

[0015] Dies beinhaltet insbesondere, dass bei nur einem erkannten Gesprächspartner und einer ansonsten gegebenen akustische Situation für einen Parameter der Kompression bzw. der Rauschunterdrückung bzw. der Richtmikrofonie ein bestimmter Wert angewandt wird, und dem Parameter bei zwei oder mehr erkannten Gesprächspartnern ein anderer entsprechend zugehöriger Wert zugewiesen wird. Das erste Ausgangssignal wird dann bevorzugt anhand des Zwischensignals erzeugt, oder direkt durch selbiges gebildet.

[0016] Bevorzugt wird beim Bestimmen der Anzahl an Gesprächspartnern dynamisch die Sprachaktivität eines ermittelten Gesprächspartners dahingehend berücksichtigt, dass nach einer vorgegebenen Zeit ohne Sprachaktivität, also z.B. nach mindestens 100ms, bevorzugt 1s und besonders bevorzugt 3s, sowie höchstens drei Minuten, bevorzugt höchstens eine Minute und besonders höchstens 10 s, eine Person nicht weiter als ein Gesprächspartner gezählt wird. Somit wird bevorzugt nach einer solchen Zeitspanne ohne entsprechenden Sprachbeitrag einer Person, welche bis dahin als Gesprächspartner galt, die Anzahl der Gesprächspartner folglich um 1 verringert (wenn nicht ein neuer Gesprächspartner hinzutritt).

[0017] Bevorzugt werden anhand des ersten Eingangssignals und des zweiten Eingangssignals mittels Richtmikrofonie ein erstes Halbraum-Signal sowie ein zweites Halbraum-Signal erzeugt, wobei die Kompression und/oder Richtmikrofonie und/oder Rauschunterdrückung in Abhängigkeit der ermittelten Anzahl der Gesprächspartner auf das erste oder zweite Halbraum-Signal angewandt wird, und/oder für jedes der beiden Halbraum-Signale getrennt angewandt wird. Dies umfasst insbesondere, dass das jeweilige Halbraum-Signal Schall aus einem Halbraum weitgehend, bevorzugt maximal, abschwächt, und entsprechend nur für Schall aus dem anderen Halbraum (welcher also zum eben genannten komplementär ist) nennenswerte Beiträge liefert. Insbesondere kann dabei der erste Halbraum, für welchen das erste Halbraum-Signals nennenswerte Beiträge liefert, komplementär zum zweiten Halbraum sein, welcher für das zweite Halbraum-Signal nennenswerte Beiträge liefert (nicht jedoch für das erste Halbraum-Signal). Insbesondere kann das erste und/oder das zweite Halbraum-Signal auch anhand eines oder mehrerer Zwischensignale erzeugt werden, wobei das oder jedes Zwischensignal anhand des ersten und des zweiten Eingangssignals erzeugt werden, insbesondere mittels Richtmikrofonie. Die Halbraum-Signale sind eine vorteilhafte Art der Vorverarbeitung, auf welche dann abhängig von der Anzahl der Gesprächspartner weitere Signalverarbeitung zur Verbesserung der Verständlichkeit der Gesprächspartner angewandt werden kann.

[0018] Bevorzugt weist dabei das erste Halbraum-Signal eine Richtcharakteristik auf, welche einen hinteren Halbraum maximal abschwächt, und/oder das zweite Halbraum-Signal eine Richtcharakteristik auf, welche einen vorderen Halbraum maximal abschwächt, wobei der vordere und der hintere Halbraum definiert sind bezüglich einer Frontalrichtung des Trägers. Dies bedeutet insbesondere, dass der o.g. erste Halbraum (für welchen nur das erste Halbraum-Signal nennenswerte Beiträge liefert) gegeben ist durch den vorderen Halbraum, definiert bzgl. der Frontalrichtung des Trägers (bei bestimmungsgemäßem Tragen des Hörsystems), und der o.g. zweite Halbraum (für welchen nur das zweite Halbraum-Signal nennenswerte Beiträge liefert) gegeben ist durch den hinteren Halbraum.

[0019] Günstigerweise wird durch einen ersten hilfsweisen Eingangswandler des ersten Hörinstruments aus dem Umgebungsschall ein erstes hilfsweises Eingangssignal erzeugt, und bevorzugt durch einen zweiten hilfsweisen Eingangswandler des zweiten Hörinstruments ein zweites hilfsweises Eingangssignal, wobei die Anzahl von Gesprächspartnern des Trägers des binaurales Hörsystems zusätzlich anhand des ersten hilfsweisen Eingangssignals und/oder des zweiten hilfsweisen Eingangssignals ermittelt wird. Dies bedeutet insbesondere, dass das binaurale Hörsystem in jedem der beiden Hörinstrumente jeweils zwei Eingangssignale erzeugt, auf welche ggf. eine lokale Vorverarbeitung (durch Richtmikrofonie) angewandt werden kann. Das Ermitteln der Anzahl an Gesprächspartnern erfolgt zumindest in einem (im ersten) Hörinstrument wenigstens anhand der beiden lokalen Eingangssignale (des ersten Eingangssignals sowie des ersten hilfsweisen Eingangssignals) sowie wenigstens eines Eingangssignals (des zweiten Eingangssignals), und bevorzugt anhand beider Eingangssignale (also auch des zweiten hilfsweisen Eingangssignals), des anderen Hörinstrumentes (des zweiten Hörinstrumentes), wobei hierzu insbesondere die jeweiligen Eingangssignale (oder ein von diesen abgeleitetes Zwischensignal, welches ggf. mittels lokaler Richtmikrofonie erzeugt sein kann) zum jeweils anderen Hörinstrument übertragen werden können. Durch das hier beschriebene Vorgehen lässt sich mittels der hilfsweisen Eingangssignale eine besonders präzise Bestimmung insbesondere einer Position eines Gesprächspartners durchführen.

[0020] Bevorzugt wird dabei auch das erste Ausgangssignal anhand des ersten Eingangssignals und des ersten hilfsweisen Eingangssignals, und insbesondere anhand des zweiten Eingangssignals und/oder des zweiten hilfsweisen Eingangssignals erzeugt. Dies umfasst insbesondere, dass in das erste Ausgangssignal die Signalanteile derselben Eingangssignale eingehen, welche auch zum Bestimmen der Anzahl an Gesprächspartnern herangezogen werden.

[0021] Günstigerweise wird anhand des ersten und zweiten Eingangssignals, und bevorzugt auch anhand des ersten und/oder zweiten hilfsweisen Eingangssignals, ein Sprachanteil im Umgebungsschall überwacht, wobei anhand des ersten und zweiten Eingangssignals eine räumliche Analyse zur Bestimmung der Anzahl und der Position der Gesprächspartner durchgeführt wird, und hierzu insbesondere eine Winkelrichtung einer Schallquelle des Umgebungsschalls ermittelt wird, und wobei anhand des Sprachanteils und der Winkelrichtung eine Anwesenheit und eine Position eines einzelnen Sprechers ermittelt werden. Dies ist insbesondere als eine Vorstufe für ein Bestimmen der Anzahl an Gesprächspartnern vorteilhaft. Insbesondere wird auf einzelne Sprachanteile eine spektrale Analyse angewandt, um eine bessere Unterscheidung verschiedener Sprecher voneinander zu erzielen.

[0022] Vorteilhafterweise wird in einem weiteren Schritt anhand des ersten und zweiten Eingangssignals, und bevorzugt auch anhand des ersten und/oder zweiten hilfsweisen Eingangssignals, für besagten einzelnen Sprecher eine Länge eines Gesprächsbeitrags und/oder ein Überlapp eines Gesprächsbeitrags mit einem Gesprächsbeitrag des Trägers ermittelt, und hieraus der einzelne Sprecher als ein Gesprächspartner des Trägers bestimmt. Hierdurch lassen sich insbesondere Sprecher herausfiltern, welche in einer unübersichtlichen akustischen Umgebung an anderen Gesprächen beteiligt sind, und somit keine Gesprächspartner des Trägers sind.

[0023] Zweckmäßigerweise werden die Anwesenheit und Position des einzelnen Sprechers nur in einem Halbraum ermittelt, welcher einem der beiden Halbraum-Signale entspricht. Hierdurch kann, insbesondere für ein Ermitteln im vorderen Halbraum, eine Vorfilterung der akustischen Umgebung erreicht werden.

[0024] Als weiter vorteilhaft erweist es sich zudem, wenn eine Änderung einer Position des einzelnen Sprechers verfolgt wird. Dies kann z.B. durch ein hinreichend häufiges Aktualisieren der Position erfolgen. Durch das Verfolgen seiner Position kann ein einmalig erkannter Gesprächspartner als solcher identifiziert bleiben, ohne dass laufend eine neue, umfangreiche Analyse hinsichtlich seiner spektralen Frequenzkomponenten im Sprachanteil oder hinsichtlich des Überlapps seiner Gesprächsbeiträge zu erfolgen braucht.

[0025] In einer vorteilhaften Ausgestaltung wird bei einem Erkennen nur eines Gesprächspartners ein vorgegebener erster Wert eines Verstärkungsparameters auf ein anhand des ersten und/oder zweiten Eingangssignals erzeugtes Zwischensignal angewandt, und bei einem Erkennen genau zweier Gesprächspartner ein zweiter Wert des Verstärkungsparameters auf das Zwischensignal angewandt, welcher um 2 dB bis 5 dB geringer ist, als der erste Wert, und/oder bei einem Erkennen genau dreier Gesprächspartner ein dritter Wert des Verstärkungsparameters auf das Zwischensignal angewandt, welcher um 4 dB bis 10 dB geringer ist, als der erste Wert. Das Zwischensignal kann hierbei insbesondere durch ein Richtsignal gegeben sein, und insbesondere in das erste Ausgangssignal eingehen, wobei ggf. noch eine zusätzliche frequenzbandabhängige Verstärkung und/oder Kompression auf das Zwischensignal angewandt wird.

[0026] Bevorzugt wird für einen, zwei oder drei Gesprächspartner jeweils eine quantitativ andere Signalverarbeitung vorgenommen, und zwar insbesondere dahingehend, dass eine umso stärkere Rauschunterdrückung angewandt wird, je mehr Gesprächspartner anwesend sind. Ab drei Gesprächspartnern aufwärts kann die Signalverarbeitung insbesondere auch gleichbleiben.

[0027] Bevorzugt wird dabei als Verstärkungsparameter eine Verstärkung und/oder eine Rauschverstärkung und/oder ein Offset einer Hintergrundverstärkung für das zweite Halbraum-Signal verwendet, welches eine Richtcharakteristik aufweist, die einen vorderen Halbraum maximal abschwächt. Dies bedeutet, dass mit zunehmender Anzahl der Gesprächspartner Schal aus dem hinteren Halbraum zunehmend abgeschwächt wird.

[0028] Die Erfindung nennt weiter ein Hörsystem mit wenigstens einem ersten Hörinstrument, wobei das Hörsystem dazu eingerichtet ist, das vorbeschriebene Verfahren durchzuführen. Bevorzugt ist dabei das Hörsystem ausgestaltet als ein binaurales Hörsystem, welches weiter ein zweites Hörinstrument umfasst.

[0029] Das erfindungsgemäße Hörsystem teilt die Vorzüge des erfindungsgemäßen Verfahrens. Die für das Verfahren und für seine Weiterbildungen angegebenen Vorteile können dabei sinngemäß auf das Hörsystem übertragen werden.

[0030] Nachfolgend wird ein Ausführungsbeispiel der Erfindung anhand von Zeichnungen näher erläutert. Hierbei zeigen jeweils schematisch:
Fig. 1
in einem Blockschaltbild ein binaurales Hörsystem mit zwei Hörgeräten,
Fig. 2
in einer Draufsicht einen Träger des binauralen Hörsystems nach Fig. 1 sowie seine Umgebung, und
Fig. 3
in einem Blockdiagramm den Ablauf eines Verfahrens zur Signalverarbeitung für das binaurale Hörsystem nach Fig. 1 in Abhängigkeit der Gesprächspartner in der Umgebung nach Fig. 2.


[0031] Einander entsprechende Teile und Größen sind in allen Figuren jeweils mit denselben Bezugszeichen versehen.

[0032] In Figur 1 ist schematisch in einem Blockschaltbild ein binaurales Hörsystem HS mit einem ersten Hörinstrument H1 und einem zweiten Hörinstrument H2 dargestellt. Die beiden Hörinstrumente H1, H2 sind vorliegend als ein erstes bzw. zweites Hörgerät HG1, HG2 ausgestaltet, welche für eine Versorgung einer Hörschwäche des Trägers des binauralen Hörsystems HS eingerichtet und vorgesehen sind. Das erste Hörgerät HG1 weist einen ersten Eingangswandler M1 sowie einen ersten hilfsweisen Eingangswandler Mh1 auf, während das zweite Hörgerät HG2 einen zweiten Eingangswandler M2 sowie einen zweiten hilfsweisen Eingangswandler Mh2 aufweist. Die besagten Eingangswandler sind dabei jeweils durch entsprechende Mikrofone gegeben.

[0033] Der erste Eingangswandler M1 und der erste hilfsweise Eingangswandler Mh1 sind jeweils dazu eingerichtet, aus einem Umgebungsschall Us ein erstes Eingangssignal E1 bzw. ein erstes hilfsweises Eingangssignal Eh1 zu erzeugen. Entsprechend sind der zweite Eingangswandler M2 und der zweite hilfsweise Eingangswandler Mh2 jeweils dazu eingerichtet, aus dem Umgebungsschall Us ein zweites Eingangssignal E2 bzw. ein zweites hilfsweises Eingangssignal Eh2 zu erzeugen.

[0034] Das erste Hörgerät HG1 weist eine erste Steuereinheit St1 auf, welche das erste Eingangssignal E1 und das erste hilfsweise Eingangssignal Eh1 in noch beschreibender Weise zu einem ersten Ausgangssignal Out1 verarbeitet, das durch einen ersten Ausgangswandler L1 des ersten Hörgerätes HG1 in ein erstes Ausgangsschallsignal Sout1 umgewandelt wird. Der erste Ausgangswandler L1 ist hierbei durch einen Lautsprecher gegeben. Der erste Ausgangswandler L1 könnte jedoch genauso auch durch einen Knochenleithörer gegeben sein. In entsprechender Weise umfasst das zweite Hörgerät eine zweite Steuereinheit St2, welche das zweite Eingangssignal E2 und das zweite hilfsweise Eingangssignal Eh2 zu einem zweiten Ausgangssignal Out2 verarbeitet. Das zweite Ausgangssignal Out2 wird durch einen zweiten Ausgangswandler (nicht dargestellt) des zweiten Hörgerätes HG2 in ein zweites Ausgangsschallsignal umgewandelt.

[0035] In Figur 2 ist in einer Draufsicht ein Träger T1 des binauralen Hörsystems HS nach Figur 1 dargestellt. In einer Umgebung des Trägers befinden sich mehrere Personen P1-P5, wobei insbesondere außerhalb des dargestellten Ausschnitts auch noch weitere, nicht gezeigte Personen anwesend sein können. Die Personen P1-P5 befinden sich teilweise in Gesprächen miteinander, oder auch mit dem Träger T1, wobei zusätzlich auch noch nicht näher dargestellte Hintergrundgeräusche (etwa durch entferntere oder nicht mehr lokalisierbare Konversationen, oder auch durch Verkehrs- oder sonstigen Umgebungslärm) vorhanden sein können. Die Personen P1, P2, P3, welche sich bezüglich einer Frontalrichtung F des Trägers T1 in einem vorderen Halbraum R1 befinden, sind mit dem Träger T1 in ein Gespräch verwickelt, und somit als seine Gesprächspartner G1, G2, G3 anzusehen. Die Person P4, welche ebenfalls im vorderen Halbraum R1 des Trägers T1 steht, nimmt an einem anderen Gespräch teil. Die Person P5 steht im zum vorderen Halbraum R1 komplementären hinteren Halbraum R2 des Trägers T1, und nimmt folgerichtig auch nicht am Gespräch mit dem Träger teil, sondern ist in ein anderes Gespräch verwickelt (die entsprechenden Gesprächspartner der Personen P4 und P5 sind in Figur 2 nicht dargestellt).

[0036] Die Vielzahl an ihn umgebenden Gesprächen (hier exemplarisch die Gespräche der Personen P4 und P5) sowie zusätzliche Hintergrundgeräusche erschweren es dem Träger T1, seinem eigenen Gespräch mit seinen Gesprächspartnern G1-G3 zu folgen. Er muss sich ggf. stärker konzentrieren, kann weniger die non-verbalen Kommunikationselemente (z.B. Gestik, Mimik) der Gesprächspartner G1-G3 beachten, und ist daher in seiner vollständigen Teilhabe am Gespräch potentiell eingeschränkt.

[0037] Für die Lösung dieses Problems wird ein Verfahren vorgeschlagen, welches anhand eines in Figur 3 gezeigten Blockdiagramms erläutert wird.

[0038] Wie in Figur 1 beschrieben, werden im ersten Hörgerät HG1 aus dem Umgebungsschall Us das erste Eingangssignal E1 sowie das erste hilfsweise Eingangssignal Eh1 erzeugt, und im zweiten Hörgerät HG2 das zweite Eingangssignal E2 sowie das zweite hilfsweise Eingangssignal Eh2. Der Umgebungsschall Us umfasst dabei die Gesprächsbeiträge der Personen P1-P5, sowie noch weitere lokalisierte und/oder diffuse Hintergrundgeräusche.

[0039] Es wird nun anhand der besagten Eingangssignale E1, E2, Eh1, Eh2 die Anzahl der Gesprächspartner des Trägers T1 für die in Figur 2 beschriebene Situation ermittelt. Hierfür werden mittels geeigneter Kommunikationseinrichtungen (nicht dargestellt) der beiden Hörgeräte HG1, HG2 die im zweiten Hörgerät erzeugten Eingangssignale E2, Eh2 und/oder ein von diesen durch eine lokale Vorverarbeitung erzeugtes zweites Zwischensignal Z2 vom zweiten Hörgerät HG2 an das erste Hörgerät HG1 übertragen. Im vorliegenden Ausführungsbeispiel wird lediglich besagtes zweites Zwischensignal Z2 übertragen, die Eingangssignale E2, Eh2 des zweiten Hörgerätes HG2 werden nicht an das erste Hörgerät übertragen.

[0040] Anhand des ersten Eingangssignals E1 und des ersten hilfsweisen Eingangssignals Eh1 sowie anhand des zweiten Eingangssignals E2 und des zweiten hilfsweisen Eingangssignals Eh2 (insbesondere in Form des zweiten Zwischensignals Z2) werden nun jeweils Winkelrichtungen αj einzelner Schallquellen SQj sowie Sprachanteile SpA ermittelt. Hierfür kann bspw. aus den genannten Eingangssignalen E1, Eh1, E2, Eh2 bzw. Z2 ein Richtsignal mit veränderlicher Maximalrichtung (keulenförmig Richtsignal) oder mit veränderlicher Minimalrichtung (kerbenförmiges Richtsignal) erzeugt werden. Insbesondere kann hierbei zunächst die Winkelrichtung αj einer Schallquelle SQj ermittelt werden, und anschließend der Sprachanteil SpA für diese Schallquelle SQj bestimmt werden, um zu erkennen, ob es sich bei der Schallquelle SQj um einen Sprecher handelt. Hierdurch wird die Anwesenheit und die Position einzelner Sprecher in der Umgebung des Trägers T1 ermittelt. Insbesondere können hierbei einzelne Sprecher durch eine spektrale Analyse der Sprachanteile SpA voneinander unterschieden werden.

[0041] Um nun zu erkennen, ob Sprachbeitrage Bj eines wie beschrieben ermittelten und lokalisierten Sprechers einem Gespräch mit dem Träger T1 zugehörig sind, und der Sprecher also ein Gesprächspartner Gj des Trägers T1 ist, werden Längen Dj der Sprachbeiträge Bj ermittelt, sowie ein jeweiliger Überlapp ULj der Sprachbeiträge Bj mit Sprachbeiträgen BT des Trägers T1 ermittelt. Bis zu einem geeignet zu wählenden Grenzwert kann ein Überlapp ULj für einen Gesprächspartner Gj vorliegen, da in einem Gespräch immer wieder mit einzelnen Einwürfen durch die Teilnehmer zu rechnen ist, welcher auch die Reihe des Sprechens immer wieder neu festlegt. Übersteigt der Überlapp ULj jedoch diesen Grenzwert, welcher insbesondere auch in Abhängigkeit einer Länge Dj des jeweiligen Sprachbeitrags Bj gewählt werden kann, so ist davon auszugehen, dass dieser Sprachbeitrag Bj für ein anderes Gespräch als dasjenige mit dem Träger T1 bestimmt ist. Entsprechend wird der Sprecher nicht als ein Gesprächspartner gezählt. Insbesondere kann ein einmal erkannter und lokalisierter Gesprächspartner gj in seiner Position verfolgt werden (nicht dargestellt), um die ressourcenintensive Überprüfung seiner Sprachbeiträge Bj nicht erneut durchführen zu müssen.

[0042] Auf die beschriebene Weise lassen sich die einzelnen Gesprächspartner Gj des Trägers T1 identifizieren, und somit auch ihre Anzahl #N. Insbesondere kann die Ermittlung der Anzahl an Gesprächspartnern auf den vorderen Halbraum R1 eingeschränkt werden (etwa, indem überhaupt nur im vorderen Halbraum R1 Schallquellen SQj identifiziert und lokalisiert werden).

[0043] In Abhängigkeit von besagter Anzahl #N an Gesprächspartnern Gj wird nun das anhand der o.g. Eingangssignale E1, Eh1, E2, Eh2 das erste Ausgangssignal Out1 erzeugt. Hierfür wird im ersten Hörgerät HG1 (also insbesondere in der ersten Steuereinheit St1) anhand der besagten Eingangssignale E1, Eh1, E2, Eh2 (die Eingangssignale E2, Eh2 des zweiten Hörgerätes HG2 können hierbei insbesondere zum zweiten Zwischensignal Z2 vorverarbeitet sein) durch eine Richtmikrofonie BF ein erstes Halbraum-Signal SR1 erzeugt, welches nur für Schallquellen SQj aus dem vorderen Halbraum R1, welcher vorliegend als ein erster Halbraum definiert ist, nennenswerte Beiträge liefert, und Schallquellen SQj aus dem hinteren Halbraum R2, welcher vorliegend als ein zweiter Halbraum definiert ist, weitgehend vollständig abschwächt (wobei ggf. ein schmaler Übergangsbereich, bspw. etwa von 10°-20° Winkelaufweitung, zwischen dem ersten und dem zweiten Halbraum existiert, dessen Schallquellen in verringertem Maße in das erste Halbraum-Signal SR1 eingehen). Das erste Halbraum-Signal SR1 ist somit ein Richtsignal, in welches die Signalanteile der Eingangssignale E1, Eh1, E2, Eh2 eingehen (ggf. nach lokaler Vorverarbeitung zum zweiten Zwischensignal Z2, und ggf. auch zu einem ersten Zwischensignal aus den Eingangssignalen E1, Eh1).

[0044] In vergleichbarer Weise wird aus den besagten Eingangssignalen E1, Eh1, E2, Eh2 mittels der Richtmikrofonie BF ein zweites Halbraum-Signal SR2 erzeugt, welches nur für Schallquellen SQj aus dem vorderen Halbraum R2, nennenswerte Beiträge liefert, und Schallquellen SQj aus dem vorderen Halbraum R1 weitgehend vollständig abschwächt (wobei ggf. ebenfalls ein schmaler Übergangsbereich zwischen dem ersten und dem zweiten Halbraum existiert, dessen Schallquellen in verringertem Maße in das zweite Halbraum-Signal SR2 eingehen).

[0045] In Abhängigkeit der Anzahl #N an Gesprächspartnern Gj wird nun ein Verstärkungswert V1, V2 oder V3 für #N=1, #N=2 bzw. #N ≥ 3 auf das zweite Halbraum-signal SR2 angewandt (d.h., in beschriebener Abhängigkeit ein bestimmter Wert für eine auf das zweite Halbraum-Signal SR2 angewandte Verstärkung). Dies kann insbesondere frequenzbandabhängig erfolgen. Das so verstärkte zweite Halbraum-Signal SR2 wird mit dem ersten Halbraum-Signal SR1 kombiniert, und hieraus das erste Ausgangssignal Out1 erzeugt (eine etwaige frequenzabhängige Verstärkung oder Kompression des aus SR1 und SR2 kombinierten Signals ist noch möglich, wird aber in Figur 3 nicht gesondert dargestellt).

[0046] In analoger Weise zum beschriebenen Vorgehen kann auch eine Kompression in Abhängigkeit der Anzahl #N an Gesprächspartnern Gj angewandt werden, indem etwa für einen, zwei und drei (bzw. noch mehr Gesprächspartner) sukzessive kürzere Attack-Konstanten und/oder ein größeres Kompressionsverhältnis auf ein vom ersten Eingangssignal E1 und vom ersten hilfsweisen Eingangssignal Eh1 abgeleitetes erstes Zwischensignal Z1 oder auf das erste Halbraum-Signal SR1 angewandt wird. Weitere Möglichkeiten der Signalverarbeitung in Abhängigkeit der Anzahl #N an Gesprächspartnern Gj bei der Erzeugung des ersten Ausgangssignals Out1 sind denkbar.

[0047] Obwohl die Erfindung im Detail durch das bevorzugte Ausführungsbeispiel näher illustriert und beschrieben wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen.

Bezugszeichenliste



[0048] 
BF
Richtmikrofonie
Bj
Sprachbeitrag
BT
Sprachbeitrag (des Trägers)
Dj
Länge (des Sprachbeitrags Bj)
E 1/2
erstes/zweites Eingangssignal
Eh1/2
erstes/zweites hilfsweises Eingangssignal
F
Frontalrichtung
G1-3, Gj
Gesprächspartner
H1/2
erstes/zweites Hörinstrument
HG1/2
erstes/zweites Hörgerät
HS
binaurales Hörsystem
L1
erster Ausgangswandler
M1/2
erster/zweiter Eingangswandler
Mh1/2
erster/zweiter hilfsweisen Eingangswandler
Out1/2
erstes/zweites Ausgangssignal
P1-5
Person
R1/2
vorderer/hinterer Halbraum
Sout1
erstes Ausgangsschallsignal
SpA
Sprachanteil
SQj
Schallquelle
SR1/2
erstes/zweites Halbraum-Signal
St1/2
erste/zweite Steuereinheit
T1
Träger
Us
Umgebungsschall
ULj
Überlapp
V1-3
Verstärkungswert
Z2
zweites Zwischensignal
#N
Anzahl an Gesprächspartnern
αJ
Winkelrichtung



Ansprüche

1. Verfahren zur direktionalen Signalverarbeitung für ein Hörsystem (HS) mit wenigstens einem ersten Hörinstrument (H1),

wobei aus einem Umgebungsschall (Us) durch einen elektroakustischen ersten Eingangswandler (M1) des ersten Hörinstruments (H1) ein erstes Eingangssignal (E1) erzeugt wird, und durch einen elektroakustischen zweiten Eingangswandler (M2) des Hörsystems (HS) ein zweites Eingangssignal (E2) erzeugt wird,

wobei anhand des ersten Eingangssignals (E1) und anhand des zweiten Eingangssignals (E2) eine Anzahl (#N) von Gesprächspartnern (G1-3, Gj) eines Trägers (T1) des Hörsystems (HS) ermittelt wird,

wobei in Abhängigkeit der ermittelten Anzahl (#N) der Gesprächspartner (G1-3, Gj) wenigstens eine Kompression und/oder eine Richtmikrofonie und/oder eine Rauschunterdrückung in der Verarbeitung des ersten Eingangssignals (E1) und/oder des zweiten Eingangssignals (E2) modifiziert wird, und hierdurch ein erstes Ausgangssignal (Out1) erzeugt wird.


 
2. Verfahren nach Anspruch 1,

wobei als Hörsystem (HS) ein binaurales Hörsystem mit dem ersten Hörinstrument (H1) und einem zweiten Hörinstrument (H2) gegeben ist, und

wobei das zweite Eingangssignal (E2) durch einen zweiten Eingangswandler (M2) des zweiten Hörinstruments (H2) erzeugt wird.


 
3. Verfahren nach Anspruch 1 oder Anspruch 2,

wobei jeweils anhand des ersten Eingangssignals (E1) und des zweiten Eingangssignals (E2) mittels Richtmikrofonie ein erstes Halbraum-Signal (SR1) und/oder ein zweites Halbraum-Signal (SR2) erzeugt werden, und

wobei die Kompression und/oder Richtmikrofonie und/oder Rauschunterdrückung in Abhängigkeit der ermittelten Anzahl (#N) der Gesprächspartner (G1-3, Gj)

- auf das erste oder zweite Halbraum-Signal (SR1, SR2) angewandt wird, und/oder

- für jedes der beiden Halbraum-Signale (SR1, SR2) getrennt angewandt wird.


 
4. Verfahren nach Anspruch 3,

wobei das erste Halbraum-Signal (SR1) eine Richtcharakteristik aufweist, welche einen hinteren Halbraum (R2) maximal abschwächt, und/oder das zweite Halbraum-Signal (SR2) eine Richtcharakteristik aufweist, welche einen vorderen Halbraum (R1) maximal abschwächt,

wobei der vordere und der hintere Halbraum (R1, R2) definiert sind bezüglich einer Frontalrichtung (F) des Trägers (T1).


 
5. Verfahren nach einem der Ansprüche 2 bis 4,

wobei durch einen ersten hilfsweisen Eingangswandler (Mh1) des ersten Hörinstruments (H1) aus dem Umgebungsschall (Us) ein erstes hilfsweises Eingangssignal (Eh1) erzeugt wird, und/oder durch einen zweiten hilfsweisen Eingangswandler (Mh2) des zweiten Hörinstruments (H2) ein zweites hilfsweises Eingangssignal (Eh2), und

wobei die Anzahl (#N) von Gesprächspartnern (G1-3, Gj) des Trägers (T1) des binaurales Hörsystems (HS) zusätzlich anhand des ersten hilfsweisen Eingangssignals (Eh1) und/oder des zweiten hilfsweisen Eingangssignals (Eh2) ermittelt wird.


 
6. Verfahren nach Anspruch 5,
wobei das erste Ausgangssignal (Out1) anhand des ersten Eingangssignals (E1) und des ersten hilfsweisen Eingangssignals (Eh1), und insbesondere anhand des zweiten Eingangssignals (E2) und/oder des zweiten hilfsweisen Eingangssignals (Eh2) erzeugt wird.
 
7. Verfahren nach einem der Ansprüche 2 bis 6,

wobei anhand des ersten und zweiten Eingangssignals (E1, E2) ein Sprachanteil (SpA) im Umgebungsschall (Us) überwacht wird,

wobei anhand des ersten und zweiten Eingangssignals (E1, E2) eine Winkelrichtung (αj) einer Schallquelle (SQj) des Umgebungsschalls (Us) ermittelt wird, und wobei anhand des Sprachanteils (SPAj) und der Winkelrichtung (αj) eine Anwesenheit und eine Position eines einzelnen Sprechers ermittelt werden.


 
8. Verfahren nach Anspruch 7,
wobei anhand des ersten und zweiten Eingangssignals (E1, E2) für besagten einzelnen Sprecher

- eine Länge (Dj) eines Gesprächsbeitrags (Bj) und/oder

- ein Überlapp (ULj) eines Gesprächsbeitrags (Bj) mit einem Gesprächsbeitrag (BT) des Trägers (T1) ermittelt wird, und hieraus der einzelne Sprecher als ein Gesprächspartner (G1-3, Gj) des Trägers (T1) bestimmt wird.


 
9. Verfahren nach Anspruch 7 oder Anspruch 8,
wobei die Anwesenheit und Position des einzelnen Sprechers nur in einem Halbraum (R1, R2) ermittelt werden, welcher einem der beiden Halbraum-Signale (SR1, SR2) entspricht.
 
10. Verfahren nach einem der Ansprüche 7 bis 9,
wobei eine Änderung einer Position des einzelnen Sprechers verfolgt wird.
 
11. Verfahren nach einem der vorhergehenden Ansprüche,
wobei bei einem Erkennen

- nur eines Gesprächspartners (G1-3, Gj) ein vorgegebener erster Wert (V1) eines Verstärkungsparameters auf ein anhand des ersten und/oder zweiten Eingangssignals (E1, E2) erzeugtes Zwischensignal angewandt wird, und

-- genau zweier Gesprächspartner (G1-3, Gj) ein zweiter Wert (V2) des Verstärkungsparameters auf das Zwischensignal angewandt wird, welcher um 2 dB bis 5 dB geringer ist, als der erste Wert, und/oder

-- genau dreier Gesprächspartner (G1-3, Gj) ein dritter Wert (V3) des Verstärkungsparameters auf das Zwischensignal angewandt wird, welcher um 4 dB bis 10 dB geringer ist, als der erste Wert.


 
12. Verfahren nach Anspruch 11 in Verbindung mit Anspruch 4,
wobei als Verstärkungsparameter eine Verstärkung und/oder eine Rauschverstärkung und/oder ein Offset einer Hintergrundverstärkung für das zweite Halbraum-Signal (SR2) verwendet wird, welches eine Richtcharakteristik aufweist, die einen vorderen Halbraum (R1) maximal abschwächt.
 
13. Hörsystem (HS) mit wenigstens einem ersten Hörinstrument (H1), wobei das Hörsystem (HS) dazu eingerichtet ist, das Verfahren nach einem der vorhergehenden Ansprüche durchzuführen.
 
14. Hörsystem (HS) nach Anspruch 13, ausgestaltet als ein binaurales Hörsystem, welches weiter ein zweites Hörinstrument (H2) umfasst, und welches dazu eingerichtet ist, das Verfahren nach einem der Ansprüche 2 bis 12 durchzuführen
 




Zeichnung













Recherchenbericht









Recherchenbericht