(19)
(11) EP 1 519 618 A1

(12) EUROPÄISCHE PATENTANMELDUNG

(43) Veröffentlichungstag:
30.03.2005  Patentblatt  2005/13

(21) Anmeldenummer: 03021578.4

(22) Anmeldetag:  24.09.2003
(51) Internationale Patentklassifikation (IPC)7H04R 3/02
(84) Benannte Vertragsstaaten:
AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT RO SE SI SK TR
Benannte Erstreckungsstaaten:
AL LT LV MK

(71) Anmelder: SIEMENS AKTIENGESELLSCHAFT
80333 München (DE)

(72) Erfinder:
  • Lorenz, Frank
    46397 Bocholt (DE)
  • Pörschmann, Christoph, Dr.
    45966 Gladbeck (DE)

   


(54) Verfahren und Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen


(57) Die Erfindung betrifft ein Verfahren zum Betrieb eines Kommunikationsgerätes (13.1, 13.2, 13.4) und ein Kommunikationsgerät (13.1, 13.2, 13.4) mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät (13.1, 13.2, 13.4) Audiosignale (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufnimmt und andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2 und 15.3) aufnimmt, und ein erster Algorithmus (5) eine Raumimpulsantwort (14) der Umgebung (9) bestimmt.
Das Verfahren zum Betrieb eines Kommunikationsgerätes und das Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen zeichnen sich dadurch aus, dass auf die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers (15), ein zweiter Entstör-Algorithmus (16) angewendet wird, der zur Entstörung, eine Nachhallzeit (T60) verwendet, die er aus der durch den ersten Algorithmus (5) bestimmten Raumimpulsantwort (14) ermittelt.




Beschreibung


[0001] Die Erfindung betrifft ein Verfahren zum Betrieb eines Kommunikationsgerätes, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufnimmt, und die wiederaufgenommenen Audiosignale durch einen ersten Algorithmus benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen.

[0002] Des weiteren betrifft die Erfindung ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät über zumindest einen Lautsprecher verfügt, der Audiosignale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist.

[0003] Es ist allgemein bekannt, dass über Lautsprecher abgestrahlte oder von einer Schallquelle, zum Beispiel der menschlichen Stimme, erzeugte Audiosignale in Räumen im Allgemeinen durch Echos und Nachhall verfälscht werden. Während die Echos aus direkten, einfachen und frühen Reflexionen des Audiosignals an einer der Begrenzungsflächen des Raumes, zum Beispiel den Wänden, dem Boden oder der Decke, bestehen, ist der Nachhall diffus und wird durch mehrfache, nur noch nach statistischen Methoden abschätzbare Reflexionen an den Begrenzungsflächen erzeugt.

[0004] Die Art und Dauer des Nachhalls werden von der Geometrie des Raumes und der Beschaffenheit der Wände entscheidend beeinflusst. Verschiedene Algorithmen der digitalen Sprach- und Audiosignalverarbeitung, vor allem solche, welche sich mit dem Problem der Enthallung von Sprachsignalen befassen, benötigen häufig eine Abschätzung der sogenannten Nachhallzeit. Die Nachhallzeit, meist mit T60 abgekürzt, ist eine in der Akustik bekannte wichtige Kenngröße für Räume. Sie kann frequenzabhängig bestimmt werden und beschreibt, in welcher Zeit nach dem Verstummen einer Signalquelle die Energie des Hallsignals um 60 dB [dB = Dezibel], gegebenenfalls noch abhängig von dem jeweiligen Frequenzband, abgefallen ist.

[0005] Die Nachhallzeit wird bisher über zwei Verfahrensarten bestimmt, nämlich über statistische Schätzverfahren oder durch ein Verfahren, das sich eines oder mehrerer Messsignale bedient.

[0006] Im ersten Fall wird zum Beispiel eine über viele Sprecher und Sprachbeispiele gemittelte Information über das Zeit- und Amplitudenverhältnis von Sprachabschnitten zu Sprachpausen herangezogen, um über die Veränderung dieses Verhältnisses im Vergleich zum Wert bei unverhallter Sprache eine Aussage über die Nachhallzeit zu gewinnen.

[0007] Man kann leicht erkennen, dass hier sprecherspezifische Eigenarten, wie zum Beispiel häufige und/oder lange Sprachpausen, diese Abschätzung stark verfälschen können. Es ist zu betonen, dass eine Abschätzung der Nachhallzeit ohne Verwendung eines Messsignals, also zum Beispiel während eines Telefongesprächs, im Allgemeinen sehr problematisch ist, da nicht ohne weiteres feststellbar ist, welche Signalanteile des vom Mikrofon aufgenommenen Schallsignals Direktschall und welche Anteile Echo oder Hall sind. Unter Direktschall versteht man das Signal, welches ohne eine einzige Reflexion direkt vom Sprecher, also von der "Schallquelle" zum Mikrofon gelangt. Eine auf statistischen Merkmalen basierte Schätzung der Nachhallzeit kann höchstens dadurch erfolgen, dass Merkmale typischer unverhallter, "sauberer" Sprache mit den Merkmalen des vorliegenden, aufgenommenen, verhallten Sprachsignals verglichen werden.

[0008] Im zweiten Fall muss über eine externe Schallquelle ein Messsignal, zum Beispiel weißes Rauschen, abgespielt werden, welches dem System bekannt ist. Über die Korrelation zwischen dem abgespielten Messsignal und dem Signal, welches über das Mikrofon des Kommunikationsgeräts wieder empfangen wird, kann dann die Abschätzung der Nachhallzeit T60 erfolgen. Diese Möglichkeit ist höchstens für Versuchsaufbauten praktikabel, da zum Beispiel dem Benutzer eines Telefons nicht zugemutet werden kann, vor oder während jedes Gesprächs erst mit dem Telefon eine solche Messung durchzuführen.

[0009] Je genauer die Nachhallzeit bekannt ist, desto besser lässt sich die Enthallung eines Audiosignals ermöglichen.

[0010] Es ist daher Aufgabe der Erfindung, ein Verfahren zum Betrieb eines Kommunikationsgerätes und ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen zu finden, welches im Vergleich zu den bisher bekannten Verfahren und Hardwaregeräten mit einer genauer ermittelten Nachhallzeit auch eine bessere Entstörung der Audiosignale zulässt.

[0011] Diese Aufgaben der Erfindung werden durch das Verfahren mit den Merkmalen des Patentanspruches 1 und gegenständlich durch das Kommunikationsgerät mit den Merkmalen des Patentanspruches 8 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter Patentansprüche.

[0012] Die Erfinder haben erkannt, dass Informationen, die in der Raumimpulsantwort enthalten sind, auch zur Entstörung weiterer Audiosignale verwendet werden können. Die Raumimpulsantwort kann mit Hilfe eines bekannten Verfahrens gewonnen werden. Vorteilhaft kann die durch das Acoustic Echo Cancelation-Verfahren berechnete Raumimpulsantwort, wobei das AEC-Verfahren in vielen Telefonen schon vorhanden ist und welches diese Raumimpulsantwort zur Unterdrückung der wiederaufgenommenen Audiosignale benutzt, auch zur Bestimmung der Nachhallzeit der Umgebung verwendet werden.

[0013] Wird beispielsweise - im Falle von zwei Kommunikationsgeräten - das von einem ersten Kommunikationsgerät im Freisprechmodus abgestrahlte Audiosignal, üblicherweise die Stimme des Kommunikationsgerätenutzers des zweiten Kommunikationsgerätes, inklusive der durch die Umgebung des ersten Kommunikationsgeräts bedingter Störanteile wieder vom Mikrofon des ersten Kommunikationsgeräts aufgenommen, so lässt sich aus diesen Audiosignalen mit einem ersten Algorithmus zunächst die Raumimpulsantwort bestimmen. Die Raumimpulsantwort beinhaltet implizit die Nachhallzeit T60, das heißt die Nachhallzeit kann aus ihr berechnet werden.

[0014] Soll nun ein weiteres Audiosignal, zum Beispiel die Sprache des Kommunikationsgerätenutzers vom ersten Kommunikationsgerät, aufgenommen werden, welches seinerseits durch die Umgebung störbehaftet ist, so wird aus der bereits vom ersten Algorithmus bestimmten Raumimpulsantwort die Nachhallzeit des Raumes bestimmt. Diese Nachhallzeit kann dann genutzt werden, um den Nachhall im aufgenommenen Sprachsignal des ersten Kommunikationsgerätenutzers zu bestimmen. Hierbei machen sich die Erfinder zusätzlich die Erkenntnis zu nutzte, das sich die Nachhallzeit auch bei verschiedenen Positionen der Schallquelle im Raum nicht signifikant ändert.

[0015] Entsprechend diesem Erfindungsgedanken schlagen die Erfinder ein Verfahren zum Betrieb eines Kommunikationsgerätes vor, wobei das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile, aufnimmt, und ein erster Algorithmus eine Raumimpulsantwort der Umgebung bestimmt, dahingehend zu verbessern, dass auf die aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers, ein zweiter Entstör-Algorithmus angewendet wird, der zur Entstörung eine Nachhallzeit verwendet, die er aus der durch den ersten Algorithmus bestimmten Raumimpulsantwort ermittelt.

[0016] Hierdurch lässt sich diejenige Nachhallzeit zur Entstörung von Audiosignalen einer externen Schallquelle nutzen, die aus der durch Abstrahlung eines bekannten Audiosignals und der anschließenden Aufnahme des im Raum verhallten Audiosignals bestimmten Raumimpulsantwort berechnet werden kann. Gegenüber der Schätzung der Nachhallzeit von Audiosignalen einer externen Schallquelle ist dieses Verfahren genauer.

[0017] Das Verfahren eignet sich besonders gut für Kommunikationsgeräte, wie zum Beispiel für Funkgeräte, Mobilfunkgeräte oder Festnetztelefone, da gerade hier die Möglichkeit der Abstrahlung eines bekannten Signals und der anschließenden Aufnahme gegeben ist. Aber auch für Stand-Alone-Geräte, die Audiosignale über einen Lautsprecher ausgeben und auch Audiosignale über ein Mikrofon aufnehmen können, ist das Verfahren geeignet, die durch die Umgebungsbedingung des Stand-Alone-Gerätes ergebende Nachhallzeit zu nutzen und entsprechend zu entstören.

[0018] Außerdem ist die Bestimmung der Nachhallzeit über dieses Verfahren wesentlich genauer möglich, als gegenüber einer bisherigen Abschätzung aus dem verhallten Audiosignal.

[0019] Das neue Verfahren kann beispielsweise die Grundlage für eine Echtzeitparametrisierung und eine Echtzeitanpassung von Algorithmen zur Enthallung von Sprachsignalen bilden.

[0020] Es ist vorteilhaft, wenn ausschließlich der erste Algorithmus die Nachhallzeit bestimmt.

[0021] Alternativ dazu ist es möglich, dass ausschließlich der zweite Entstör-Algorithmus die Nachhallzeit bestimmt.

[0022] Weiterhin ist es günstig, wenn die Nachhallzeit aus dem energetischen Abfall des Nachhalls berechnet wird, wobei die Information über die Geschwindigkeit dieses Abfalls in der Raumimpulsantwort enthalten ist. Hierdurch kann eine genauere Bestimmung der Nachhallzeit gegenüber der statistisch basierten Schätzung der Nachhallzeit erfolgen.

[0023] Zur Bestimmung der Raumimpulsantwort, aus der dann die Nachhallzeit bestimmt werden kann, kann in dem neuen Verfahren beim ersten Algorithmus ein AEC-Algorithmus (AEC = Acoustic Echo Cancelation) verwendet werden. Dieser AEC-Algorithmus ist in vielen Telefonen schon heute vorhanden und wird eigentlich zur Unterdrückung der wiederaufgenommenen Audiosignale benutzt. Der Algorithmus berechnet eine Raumimpulsantwort, welche sich erfindungsgemäß zur Bestimmung der Nachhallzeit verwenden lässt.

[0024] Zur Entstörung der aufgenommenen Audiosignale des Kommunikationsgerätenutzers wird ein zweiter Entstör-Algorithmus verwendet. Ein solcher zweiter Entstör-Algorithmus soll unter Ausnutzung der bestimmten oder übernommenen Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgerätenutzers entfernen.

[0025] Für das Verfahren ist es ebenfalls vorteilhaft, wenn die Raumimpulsantwort in Abhängigkeit der Frequenz und vorzugsweise durch mehrere Bandpässe gefiltert wird. Hierdurch kann die Nachhallzeit, die selbst frequenzabhängig ist, in Abhängigkeit der Frequenz bestimmt werden.

[0026] An dieser Stelle sei erwähnt, dass die Anwendung des neuen Verfahrens sehr einfach bei zwei Kommunikationsgeräten nachgewiesen werden kann: Das beschriebene Verfahren zum Betrieb eines Kommunikationsgerätes basiert darauf, dass der Lautsprecher eines Audiosystems, zum Beispiel in einen Raum abstrahlt und dass das durch den Raum verhallte Audiosignal wieder vom Mikrofon des Audiosystems aufgenommen wird.

[0027] Zum Nachweis wird eine Sprachverbindung zwischen den zwei Mobilfunkteilnehmern aufgebaut. Anschließend trennt der erste Mobilfunkteilnehmer, während der zweite Mobilfunkteilnehmer spricht, die akustische Verbindung zwischen Lautsprecher und Mikrofon, zum Beispiel durch Verdecken des Lautsprechers mit der Hand. Bemerkt nun der zweite Mobilfunkteilnehmer eine deutliche Verschlechterung der Qualität des Audiosignals, zum Beispiel in Form einer verhallten Stimme, wenn der erste Mobilfunkendteilnehmer spricht, so wird das neue Verfahren zur Bestimmung der Nachhallzeit im Gerät des ersten Mobilfunkendteilnehmers angewendet. Dies setzt voraus, dass ein Enthallungs-Algorithmus angewendet wird. Die Unterbrechung der Übertragungsstrecke beim ersten Mobilfunkendgerät verhindert eine Adaption des verwendeten "Entstör-Algorithmus" an die Nachhallzeit des Raums.

[0028] Zur gegenständlichen Lösung ihrer Aufgabe schlagen die Erfinder auch vor, ein bekanntes Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät über zumindest einem Lautsprecher verfügt, der Audiosignale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist, dahingehend zu verbessern, dass ein zweites Mittel für die aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers, einschließlich deren umgebungsbedingter Störanteile angeordnet ist, das ein Mittel zur Ermittlung der Nachhallzeit aufweist, das die Nachhallzeit ermittelt, die in der durch das erste Mittel bestimmten Raumimpulsantwort enthalten ist.

[0029] Hierdurch wird ein Kommunikationsgerät zur Verfügung gestellt, in dem die Nachhallzeit, die durch die Ausnutzung der Abstrahlung eines bekannten Audiosignals und der anschließenden Aufnahme des im Raum verhallten Audiosignals über die Bestimmung der Raumimpulsantwort, bestimmt wurde, welches nun auch für die Entstörung der Audiosignale einer externen Schallquelle verwendet werden kann. Die Entstörung kann hierbei genauer als bisher erfolgen, da die Nachhallzeit besser und genauer bestimmt wird.

[0030] Es besteht die Möglichkeit, dass ausschließlich das erste Mittel über Programmmittel und/oder Programmmodule verfügt, die die Nachhallzeit bestimmen.

[0031] Alternativ dazu kann aber auch ausschließlich das zweite Mittel Programmmittel und/oder Programmmodule aufweisen, die die Nachhallzeit bestimmen.

[0032] Das erste Mittel kann über Programmmittel und/oder Programmmodule verfügen, die einen AEC-Algorithmus (AEC = Acoustic Echo Cancellation) oder einen Algorithmus, wie in Welch, P.D.[1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73), beschrieben, ausführen. Der Inhalt dieses Literaturverweises wird vollinhaltlich übernommen.

[0033] Weiterhin ist es vorteilhaft, wenn die zweiten Mittel Programmmittel und/oder Programmmodule aufweisen, die einen Algorithmus ausführen, der unter Ausnutzung der umgebungsabhängig bestimmten Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgerätenutzers entfernt.

[0034] Die Bestimmung der Nachhallzeit in Abhängigkeit der Frequenz und entsprechend die frequenzabhängige Entstörung der Audiosignale wird in dem Kommunikationsgerät günstig realisiert, wenn im Kommunikationsgerät Bandpassfilter angeordnet sind, die die Raumimpulsantwort filtern.

[0035] Bei dem neuen Kommunikationsgerät kann es sich um ein Telefon, zum Beispiel in Form eines Mobilfunkendgerätes oder eines kabelgebundenen Telefons, ein elektrisches Haushaltgerät oder ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe handeln.

[0036] Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele mit Hilfe der Figuren 1 bis 5 beschrieben, wobei in den Figuren die folgenden Abkürzungen verwendet werden: 1: Direktschall eines impulsartigen Audiosignals; 2: Echos; 3: Nachhall/Nachhallkurve; 4: Empfangene Signale vom zweiten Kommunikationsgerät; 4.1: Signale vom Spracherzeugungsmodul; 5: Algorithmus zur Bestimmung der Nachhallzeit; 6: Digital-Analog-Wandler; 7: Lautsprecher; 8.1: Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall; 8.2: Signal des Lautsprechers, das einfach am Objekt reflektiert wird = Echo; 8.3: Signal des Lautsprechers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall; 9: Objekt an dem die Signale reflektiert werden; 10: Mikrofon; 11: Analog-Digital-Wandler; 12: Zu sendende Signale zum zweiten Kommunikationsgerät; 12.1: Signale zum Spracherkennungsmodul; 13.1: Erstes Kommunikationsgerät; 13.2: Zweites Kommunikationsgerät; 13.3: Schnittstelle für Signalübermittlung; 13.4: Sprachgesteuertes Elektrogerät: 14: Raumimpulsantwort; 15: Kommunikationsgerätenutzer/Bediener; 15.1: Signal, das direkt vom Kommunikationsgerätenutzer zum Mikrofon gelangt = Direktschall; 15.2: Signal des Kommunikationsgerätenutzers, das einfach am Objekt reflektiert wird = Echo; 15.3: Signal des Kommunikationsgerätenutzers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall; 16: Algorithmus zur Enthallung der Signale 15.1 bis 15.3; 17: Entstöreinheit; 18: Spracherzeugungsmodul; 19: Spracherkennungsmodul; A60: Energiebereich, in dem die Energie um 60 Dezibel abfällt; T60: Nachhallzeit.

[0037] Es zeigen im Einzelnen:
Figur 1:
Zeitliche Energieverteilung eines ursprünglich impulsförmigen Audiosignals in einem Raum;
Figur 2:
Zeitliche Energieverteilung desselben Audiosignals aus Figur 1, jedoch in einem kleineren Raum;
Figur 3:
Gemessene Raumimpulsantwort eines Raumes;
Figur 4:
Zwei Kommunikationsgeräte, die Signale austauschen, wobei in einem Kommunikationsgerät das neue Verfahren angewendet wird;
Figur 5:
Sprachgesteuertes Elektrogerät, in dem das neue Verfahren angewendet wird.


[0038] Die Figur 1 zeigt exemplarisch in einem Diagramm die zeitliche Energieverteilung eines Audiosignals, die man in einem Raum mit einem Mikrofon aufnehmen und messen kann, wenn ein impulsartiges Audiosignal, zum Beispiel ein Knall, auftritt. Diese Energieverteilung erhält man, indem man das Betragsquadrat einer Raumimpulsantwort bildet und dieses logarithmiert.

[0039] Auf der Ordinate des Diagramms sind die logarithmierten Signalamplituden, als Maß für die Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen Einheiten, aufgetragen.

[0040] Man erkennt als erste Linie ganz links im Diagramm den sogenannten Direktschall 1, welcher auf direktem Weg von der Schallquelle zum Messmikrofon gelangt. Dann folgen, die in diesem Beispiel energetisch schwächeren Echos 2, die einmal oder zweimal an Wänden des Raumes reflektiert wurden, bevor sie zum Messmikrofon gelangen.

[0041] Zuletzt folgt, symbolisiert durch ein Dreieck, der Nachhall 3, welcher aus quasi chaotischen überlagerten Reflexionen des Audiosignals im Raum besteht und diffus am Messmikrofon eintrifft.

[0042] Das neue Verfahren nutzt die Nachhallzeit T60 eines Audiosignals, die aus der Raumimpulsantwort 14, die für einen bestimmten Raum charakteristisch ist, bestimmt wurde.

[0043] Zur Bestimmung der Nachhallzeit T60 wird in Figur 1 auf der Ordinate des Diagramms ein Energiebereich A60 bestimmt, der im Bereich des Nachhalls 3 liegt, in dem die Energie des Nachhalls um 60 Dezibel abfällt. Der obere und der untere Grenzwert des Energiebereiches A60 werden zuerst auf die Nachhallkurve 3 und danach auf die Abszisse also die Zeitachse projiziert. Der projizierte Bereich auf der Zeitachse entspricht der Nachhallzeit T60.

[0044] An dieser Stelle sei erwähnt, dass der Energiebereich nicht notwendigerweise mit 60 Dezibel gewählt werden muss, sondern auch kleiner oder größer gewählt werden kann. Zum Beispiel kann auch ein Bereich gewählt werden, in dem die Energie des Nachhalls, um zum Beispiel 30 Dezibel abfällt. Der Wert, der aus der Projektion auf die Zeitachse erhalten wird, muss entsprechend um den Faktor der Verkleinerung/Vergrößerung der Energie, angepasst werden. Bei einem Energiebereich von nur 30 Dezibel wird entsprechend der Zeitabschnitt mit dem Faktor 2 multipliziert, um die Nachhallzeit T60 zu erhalten.

[0045] In Figur 2 wird wiederum exemplarisch die zeitliche Energieverteilung eines impulsartigen Audiosignals, zum Beispiel eines Knalles gezeigt. Im Unterschied zu den Randbedingungen, die für die Figur 1 galten, soll das Audiosignal in einem kleineren Raum aufgenommen werden. Dies äußert sich in einem geringeren Nachhall 3. Die Nachhallkurve 3 fällt schneller ab, wodurch auch die Nachhallzeit T60 geringer als in Figur 1 ist. Der Einfachheit halber wurde der Direktschall 1 und die Echos 2 im Diagramm der Figur 2 unverändert aus dem Diagramm der Figur 1 übernommen. Bei einer reellen Messung eines Signals könnten hier jedoch Unterschiede auftreten.

[0046] Man erkennt, dass aus dem energetischen Abfall des Nachhalls 3, also der negativen Steigung der Nachhallkurve 3, die Nachhallzeit T60 bestimmt werden kann.

[0047] Die Figur 3 zeigt nun eine gemessene Raumimpulsantwort 14 eines Raumes. Auf der Ordinate sind die Signalamplituden und auf der Abszisse ist die Zeit aufgetragen. Die Geschwindigkeit des Abfalls der Energie in der Raumimpulsantwort über die Zeit ist charakteristisch für diesen bestimmten Raum. Diese Geschwindigkeit wird unabhängig vom Messsignal und der Position von Schallquelle und Mikrofon im Raum für diesen bestimmten Raum erhalten werden.

[0048] Die Figur 4 zeigt zwei Kommunikationsgeräte 13.1 und 13.2, die Signale 4 und 12 über eine Schnittstelle 13.3 austauschen. Dabei kann es sich bei den Kommunikationsgeräten 13.1 und 13.2 beispielsweise um Endgeräte im Mobilfunknetz handeln. Bei der Schnittstelle 13.3 kann es sich beispielsweise um eine Sende-/Empfangsantenne oder um eine Infrarotschnittstelle handeln.

[0049] Im Kommunikationsgerät 13.1 wird das neue Verfahren angewendet.

[0050] Das erste Kommunikationsgerät 13.1 soll sich in einer Umgebung befinden, zum Beispiel in einer Kirche, in der Halleffekte auftreten. Diese Umgebung ist durch ein einseitig offenes Rechteck mit dem Bezugszeichen 9 angedeutet.

[0051] Das Signal 4 wird über die Schnittstelle 13.3 vom zweiten Kommunikationsgerät 13.2 zum ersten Kommunikationsgerät 13.1 gesendet und von diesem empfangen. Das Signal 12 soll vom ersten Kommunikationsgerät 13.1 zum zweiten Kommunikationsgerät 13.2 gesendet werden, dabei sollen Störungen, die durch die Umgebung 9 des ersten Kommunikationsgerätes 13.1 auftreten, unterdrückt werden.

[0052] Das erste Kommunikationsgerät 13.1 verfügt zumindest über einen Digital-Analog-Wandler 6, der die vom zweiten Kommunikationsgerät 13.2 gesendeten digitalen Signale 4 in analoge Signale umwandelt und an einen Lautsprecher 7 weiterleitet. Außerdem verfügt das erste Kommunikationsgerät 13.1 über ein Mikrofon 10, welches analoge Signale aufnehmen kann und über einen Analog-Digital-Wandler 11 digitalisiert.

[0053] Durch das neue Verfahren soll das Signal 15.1, in der Regel Sprachesignale, das ein Kommunikationsgerätenutzer 15 an das Mikrofon 10 des ersten Kommunikationsgeräts 13.1 abgibt, entstört werden. Die Entstörung geschieht durch möglichst vollständige Unterdrückung des unerwünschten Echos 15.2 und des unerwünschten Halls 15.3. Um dieses Signal entstören zu können, muss die Nachhallzeit T60 ermittelt werden. Hierbei macht sich das neue Verfahren Folgendes zu nutze:
  • Die Nachhallzeit, die für diese Umgebung 9 charakteristisch ist, ist in der Raumimpulsantwort enthalten. Die Raumimpulsantwort wiederum lässt sich aus dem Verhältnis der Signale 8.2 und 8.3 zum Signal 8.1 bestimmen.
  • Die Nachhallzeit ändert sich an verschiedenen Positionen der Schallquelle im Raum nicht signifikant. Das heißt, die Signale 8.1 bis 8.3 die vom Lautsprecher 7 zum Mikrofon 10 gelangen und die Signale 15.1 bis 15.3, die vom Kommunikationsgerätenutzer 15 zum Mikrofon 10 gelangen, haben eine ähnliche Nachhallzeit.


[0054] Im neuen Verfahren wird die bereits bekannte Nachhallzeit folgendermaßen für die Entstörung des Signals 15.1 nutzbar gemacht. Das vom zweiten Kommunikationsgerät 13.2 gesendete Signal 4 wird durch den Digital-Analog-Wandler 6 umgewandelt und über den Lautsprecher 7 des ersten Kommunikationsgeräts 13.1 ausgegeben. Analog zu den Diagrammen der Figuren 1 und 2 kann das Signal 4 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 zum Mikrofon 10 des ersten Kommunikationsgerätes 13.1 gelangen.

[0055] Der Direktschall 8.1, das Echo 8.2 und der Nachhall 8.3 werden über einen Analog-Digital-Wandler 6 umgewandelt und über einem Algorithmus 5 wird die Raumimpulsantwort bestimmt.

[0056] Zur Bestimmung der Raumimpulsantwort können verschiedene Methoden eingesetzt werden.

[0057] So kann ein sogenannter AEC-Algorithmus (AEC = Acoustic Echo Cancellation) implementiert werden. Dieser Algorithmus wird verwendet, um im Freisprechmodus das Echo des Sprachsignals des fernen Teilnehmers, welches vom Lautsprecher 7 abgestrahlt und unerwünscht vom Mikrofon 10 wieder aufgenommen wird, zu kompensieren. Hierzu wird mittels Abschätzung der Übertragungsstrecke Lautsprecher 7 und Mikrofon 10 eine Impulsantwort berechnet. Durch Faltung des vom Kommunikationsgerät 13.2 gesendeten Signals 4 mit dieser Impulsantwort und anschließender Subtraktion des so berechneten Signals vom Mikrofonsignal findet die Echo-Unterdrückung statt. Das Signal wird über eine Entstöreinheit 17 entstört.

[0058] Alternativ dazu kann zur Bestimmung der Raumimpulsantwort ein bekannter Algorithmus eingesetzt werden, welcher zuerst von "Welch" publiziert wurde. So beschreibt die Welch Methode (siehe auch Welch, P.D.[1970], "The Use of Fast Fourier Transform for the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73) die Bestimmung einer Impulsantwort durch die Abstrahlung eines Ausgangssignals und der Messung des Eingangssignals. Einzige Anforderung an das Ausgangssignal ist das Vorhandensein von ausreichend Energie in den zu betrachtenden Frequenzbereichen.

[0059] Ist die Raumimpulsantwort mit einem Algorithmus 5 bestimmt, so kann hieraus die Nachhallzeit bestimmt werden. Diese Nachhallzeit kann auch für die Entstörung des Signals 15.1 des Kommunikationsgerätenutzers 15 genutzt werden, da die Nachhallzeiten, die sich für die Übertragung von Signalen 8.1 bis 8.3 vom Lautsprecher 7 über die Umgebung 9 zum Mikrofon 10 und für die Übertragung von Signalen 15.1 bis 15.3 vom Kommunikationsgerätenutzers 15 zum Mikrofon 10 ergeben, ähnlich sind. Um diese Nachhallzeit aus der Raumimpulsantwort, die durch den ersten Algorithmus 5 bestimmt wurde, zu ermitteln, ist ein weiterer Algorithmus 16 vorgesehen, der Zugriff auf die Daten des Algorithmus 5 hat, also auch auf die Raumimpulsantwort und die darin enthaltene Nachhallzeit. Dann werden die Signale 15.1 bis 15.3 mit einer Entstöreinheit 17 entstört und als Signale 12 ausgegeben.

[0060] Die Figur 5 zeigt eine besondere Ausführung eines Kommunikationsgerätes. Hier wird das neue Verfahren in einem sprachgesteuerten Elektrogerät 13.4 angewendet. Dabei steht der Bediener 15 des sprachgesteuerten Elektrogeräts nur mit dem sprachgesteuerten Elektrogerät 13.4 in Kontakt und nicht wie in Figur 4 mit einem weiteren Kommunikationsteilnehmer, der sich an einem zweiten Kommunikationsgerät befindet.

[0061] Das sprachgesteuerte Elektrogerät 13.4 verfügt über ein Spracherzeugungsmodul 18, um Signale 4.1 zum Beispiel den Menüumfang des Elektrogerätes 13.4, über den Lautsprecher 7 ausgeben zu können. Außerdem verfügt das sprachgesteuerte Elektrogerät 13.4 über ein Spracherkennungsmodul 19, um Signale 12.1, zum Beispiel die Sprache des Bedieners 15, erkennen zu können.

[0062] Abhängig von der Umgebung 9, können die über den Lautsprecher 7 in Form von Direktschall 8.1, Echo 8.2 und Nachhall 8.3 ausgegebene Signale ungewollt vom Mikrofon 10 aufgenommen werden. Um diese Rückkopplung zu vermeiden, wird im sprachgesteuerten Elektrogerät 13.4 ein Algorithmus 5 ausgeführt, der unter anderem auch die Raumimpulsantwort bestimmt. Außerdem wird diese Rückkopplung mit einer Entstöreinheit 17 unterdrückt.

[0063] Zur Entstörung des vom Bediener 15 an das Mikrofon 10 geschickten Signals 15.1 kann der Algorithmus 5 nicht verwendet werden. Aber die Nachhallzeit, die sich aus der Raumimpulsantwort berechnen lässt, welche im Algorithmus 5 bestimmt wurde, die aber nahezu gleich für die Signale 15.1 bis 15.3 des Bedieners 15 gilt, kann von einem weiteren Algorithmus 16 verwendet werden, der mit einer Entstöreinheit 17 das Signal 15.1 entstört.

[0064] Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.

Bezugszeichenliste



[0065] 
1
Direktschall eines impulsartigen Audiosignals
2
Echos
3
Nachhall / Nachhallkurve
4
Empfangene Signale vom zweiten Kommunikationsgerät
4.1
Signale vom Spracherzeugungsmodul
5
Algorithmus
6
Digital-Analog-Wandler
7
Lautsprecher
8.1
Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall
8.2
Signal des Lautsprechers, das einfach am Objekt reflektiert wird = Echo
8.3
Signal des Lautsprechers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall
9
Objekt an dem die Signale reflektiert werden
10
Mikrofon
11
Analog-Digital-Wandler
12
Zu sendende Signale zum zweiten Kommunikationsgerät
12.1
Signale zum Spracherkennungsmodul
13.1
Erstes Kommunikationsgerät
13.2
Zweites Kommunikationsgerät
13.3
Schnittstelle für Signalübermittlung
13.4
Sprachgesteuertes Elektrogerät
14
Raumimpulsantwort
15
Kommunikationsgerätenutzer/Bediener
15.1
Signal, das direkt vom Kommunikationsgerätenutzer zum Mikrofon gelangt = Direktschall
15.2
Signal des Kommunikationsgerätenutzers, das einfach am Objekt reflektiert wird = Echo
15.3
Signal des Kommunikationsgerätenutzers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall
16
Algorithmus zur Enthallung der Signale 15.1 bis 15.3
17
Entstöreinheit
18
Spracherzeugungsmodul
19
Spracherkennungsmodul
A60
Energiebereich, in dem die Energie um 60 Dezibel abfällt
T60
Nachhallzeit T60



Ansprüche

1. Verfahren zum Betrieb eines Kommunikationsgerätes (13.1, 13.2, 13.4), wobei
das Kommunikationsgerät (13.1, 13.2, 13.4) Audiosignale (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und
einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufnimmt und
andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2 und 15.3) aufnimmt, und
die wiederaufgenommenen Audiosignale (8.1 bis 8.3) durch einen ersten Algorithmus (5) benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen,
dadurch gekennzeichnet, dass
auf die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsgerätenutzers (15), ein zweiter Entstör-Algorithmus (16) angewendet wird, der zur Entstörung eine Nachhallzeit (T60) verwendet, die er aus der durch den ersten Algorithmus (5) bestimmten Raumimpulsantwort (14) ermittelt.
 
2. Verfahren gemäß dem voranstehenden Patentanspruch 1,
dadurch gekennzeichnet, dass
ausschließlich der erste Algorithmus (5) die Nachhallzeit (T60) bestimmt.
 
3. Verfahren gemäß dem voranstehenden Patentanspruch 1,
dadurch gekennzeichnet, dass
ausschließlich der zweite Entstör-Algorithmus (16) die Nachhallzeit (T60) bestimmt.
 
4. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3,
dadurch gekennzeichnet, dass
die Nachhallzeit (T60) aus dem energetischen Abfall des Nachhalls (8.3) in der Raumimpulsantwort (14) berechnet wird.
 
5. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4,
dadurch gekennzeichnet, dass
als erster Algorithmus ein AEC-Algorithmus (5) (AEC = Acoustic Echo Cancellation) verwendet wird.
 
6. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5,
dadurch gekennzeichnet, dass
der zweite Entstör-Algorithmus (16) unter Ausnutzung der umgebungsabhängig bestimmten oder übernommenen Nachhallzeit (T60) die überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der externen Schallquelle entfernt.
 
7. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6,
dadurch gekennzeichnet, dass
zur Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz die Raumimpulsantwort (14) gefiltert wird, vorzugsweise mit Bandpassfiltern.
 
8. Kommunikationsgerät (13.1, 13.2, 13.4) mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät (13.1, 13.2, 13.4) über
zumindest einen Lautsprecher (7) verfügt, der Audiosignale (8.1 bis 8.3) an eine Umgebung (9) abstrahlt und
weiterhin zumindest ein Mikrofon (10) aufweist, mit dem einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufgenommen werden und
andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2, 15.3) aufgenommen werden, und
im Kommunikationsgerät (13.1, 13.2, 13.4) ein erstes Mittel (5) vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist,
dadurch gekennzeichnet, dass
ein zweites Mittel (16) für die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile (15.2, 15.3) angeordnet ist, das ein Mittel zur Ermittlung der Nachhallzeit (T60) aufweist, das die Nachhallzeit (T60) ermittelt, die in der durch das erste Mittel (5) bestimmen der Raumimpulsantwort (14) enthalten ist.
 
9. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8,
dadurch gekennzeichnet, dass
ausschließlich das erste Mittel (5) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen.
 
10. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8,
dadurch gekennzeichnet, dass
ausschließlich das zweite Mittel (16) Programmmittel und/oder Programmmodule aufweist, die die Nachhallzeit (T60) bestimmen.
 
11. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 10,
dadurch gekennzeichnet, dass
die Programmmittel und/oder Programmmodule des ersten Mittels einen AEC-Algorithmus (5) (AEC = Acoustic Echo Cancelation) beinhalten.
 
12. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche 8 bis 11,
dadurch gekennzeichnet, dass
die Programmmittel und/oder Programmmodule des zweiten Mittels (16) einen Algorithmus beinhalten, der unter Ausnutzung der umgebungsabhängig bestimmten Nachhallzeit die überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der externen Schallquelle (15) entfernt.
 
13. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 12,
dadurch gekennzeichnet, dass
Bandpassfilter vorgesehen sind, die die Raumimpulsantwort (14) filtern und die Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz ermöglichen.
 
14. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein Telefon ist.
 
15. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehenden Patentanspruch 14,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein kabelgebundenes Telefon ist.
 
16. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 14,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein Mobilfunkendgerät ist.
 
17. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 13,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Haushaltgerät mit Mittel zur Spracheingabe und Sprachausgabe ist.
 
18. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche 8 bis 17,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe ist.
 




Zeichnung













Recherchenbericht