[0001] Die Erfindung betrifft ein Verfahren zum Betrieb eines Kommunikationsgerätes, wobei
das Kommunikationsgerät Audiosignale an eine Umgebung abstrahlt und einerseits diese
Audiosignale einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest
Echo und Nachhall enthalten, wieder aufnimmt und andererseits Audiosignale einer externen
Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich deren
umgebungsbedingter Störanteile, aufnimmt, und die wiederaufgenommenen Audiosignale
durch einen ersten Algorithmus benutzt werden, um eine Raumimpulsantwort der Umgebung
zu bestimmen.
[0002] Des weiteren betrifft die Erfindung ein Kommunikationsgerät mit Mitteln zur Entstörung
von Audiosignalen, wobei das Kommunikationsgerät über zumindest einen Lautsprecher
verfügt, der Audiosignale an eine Umgebung abstrahlt und weiterhin zumindest ein Mikrofon
aufweist, mit dem einerseits diese Audiosignale einschließlich umgebungsbedingter
überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufgenommen
werden und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines
Kommunikationsgerätenutzers, einschließlich deren umgebungsbedingter Störanteile,
aufgenommen werden, und im Kommunikationsgerät ein erstes Mittel vorgesehen ist, das
ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist.
[0003] Es ist allgemein bekannt, dass über Lautsprecher abgestrahlte oder von einer Schallquelle,
zum Beispiel der menschlichen Stimme, erzeugte Audiosignale in Räumen im Allgemeinen
durch Echos und Nachhall verfälscht werden. Während die Echos aus direkten, einfachen
und frühen Reflexionen des Audiosignals an einer der Begrenzungsflächen des Raumes,
zum Beispiel den Wänden, dem Boden oder der Decke, bestehen, ist der Nachhall diffus
und wird durch mehrfache, nur noch nach statistischen Methoden abschätzbare Reflexionen
an den Begrenzungsflächen erzeugt.
[0004] Die Art und Dauer des Nachhalls werden von der Geometrie des Raumes und der Beschaffenheit
der Wände entscheidend beeinflusst. Verschiedene Algorithmen der digitalen Sprach-
und Audiosignalverarbeitung, vor allem solche, welche sich mit dem Problem der Enthallung
von Sprachsignalen befassen, benötigen häufig eine Abschätzung der sogenannten Nachhallzeit.
Die Nachhallzeit, meist mit T60 abgekürzt, ist eine in der Akustik bekannte wichtige
Kenngröße für Räume. Sie kann frequenzabhängig bestimmt werden und beschreibt, in
welcher Zeit nach dem Verstummen einer Signalquelle die Energie des Hallsignals um
60 dB [dB = Dezibel], gegebenenfalls noch abhängig von dem jeweiligen Frequenzband,
abgefallen ist.
[0005] Die Nachhallzeit wird bisher über zwei Verfahrensarten bestimmt, nämlich über statistische
Schätzverfahren oder durch ein Verfahren, das sich eines oder mehrerer Messsignale
bedient.
[0006] Im ersten Fall wird zum Beispiel eine über viele Sprecher und Sprachbeispiele gemittelte
Information über das Zeit- und Amplitudenverhältnis von Sprachabschnitten zu Sprachpausen
herangezogen, um über die Veränderung dieses Verhältnisses im Vergleich zum Wert bei
unverhallter Sprache eine Aussage über die Nachhallzeit zu gewinnen.
[0007] Man kann leicht erkennen, dass hier sprecherspezifische Eigenarten, wie zum Beispiel
häufige und/oder lange Sprachpausen, diese Abschätzung stark verfälschen können. Es
ist zu betonen, dass eine Abschätzung der Nachhallzeit ohne Verwendung eines Messsignals,
also zum Beispiel während eines Telefongesprächs, im Allgemeinen sehr problematisch
ist, da nicht ohne weiteres feststellbar ist, welche Signalanteile des vom Mikrofon
aufgenommenen Schallsignals Direktschall und welche Anteile Echo oder Hall sind. Unter
Direktschall versteht man das Signal, welches ohne eine einzige Reflexion direkt vom
Sprecher, also von der "Schallquelle" zum Mikrofon gelangt. Eine auf statistischen
Merkmalen basierte Schätzung der Nachhallzeit kann höchstens dadurch erfolgen, dass
Merkmale typischer unverhallter, "sauberer" Sprache mit den Merkmalen des vorliegenden,
aufgenommenen, verhallten Sprachsignals verglichen werden.
[0008] Im zweiten Fall muss über eine externe Schallquelle ein Messsignal, zum Beispiel
weißes Rauschen, abgespielt werden, welches dem System bekannt ist. Über die Korrelation
zwischen dem abgespielten Messsignal und dem Signal, welches über das Mikrofon des
Kommunikationsgeräts wieder empfangen wird, kann dann die Abschätzung der Nachhallzeit
T60 erfolgen. Diese Möglichkeit ist höchstens für Versuchsaufbauten praktikabel, da
zum Beispiel dem Benutzer eines Telefons nicht zugemutet werden kann, vor oder während
jedes Gesprächs erst mit dem Telefon eine solche Messung durchzuführen.
[0009] Je genauer die Nachhallzeit bekannt ist, desto besser lässt sich die Enthallung eines
Audiosignals ermöglichen.
[0010] Es ist daher Aufgabe der Erfindung, ein Verfahren zum Betrieb eines Kommunikationsgerätes
und ein Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen zu finden,
welches im Vergleich zu den bisher bekannten Verfahren und Hardwaregeräten mit einer
genauer ermittelten Nachhallzeit auch eine bessere Entstörung der Audiosignale zulässt.
[0011] Diese Aufgaben der Erfindung werden durch das Verfahren mit den Merkmalen des Patentanspruches
1 und gegenständlich durch das Kommunikationsgerät mit den Merkmalen des Patentanspruches
8 gelöst. Vorteilhafte Weiterbildungen der Erfindung sind Gegenstand untergeordneter
Patentansprüche.
[0012] Die Erfinder haben erkannt, dass Informationen, die in der Raumimpulsantwort enthalten
sind, auch zur Entstörung weiterer Audiosignale verwendet werden können. Die Raumimpulsantwort
kann mit Hilfe eines bekannten Verfahrens gewonnen werden. Vorteilhaft kann die durch
das Acoustic Echo Cancelation-Verfahren berechnete Raumimpulsantwort, wobei das AEC-Verfahren
in vielen Telefonen schon vorhanden ist und welches diese Raumimpulsantwort zur Unterdrückung
der wiederaufgenommenen Audiosignale benutzt, auch zur Bestimmung der Nachhallzeit
der Umgebung verwendet werden.
[0013] Wird beispielsweise - im Falle von zwei Kommunikationsgeräten - das von einem ersten
Kommunikationsgerät im Freisprechmodus abgestrahlte Audiosignal, üblicherweise die
Stimme des Kommunikationsgerätenutzers des zweiten Kommunikationsgerätes, inklusive
der durch die Umgebung des ersten Kommunikationsgeräts bedingter Störanteile wieder
vom Mikrofon des ersten Kommunikationsgeräts aufgenommen, so lässt sich aus diesen
Audiosignalen mit einem ersten Algorithmus zunächst die Raumimpulsantwort bestimmen.
Die Raumimpulsantwort beinhaltet implizit die Nachhallzeit T60, das heißt die Nachhallzeit
kann aus ihr berechnet werden.
[0014] Soll nun ein weiteres Audiosignal, zum Beispiel die Sprache des Kommunikationsgerätenutzers
vom ersten Kommunikationsgerät, aufgenommen werden, welches seinerseits durch die
Umgebung störbehaftet ist, so wird aus der bereits vom ersten Algorithmus bestimmten
Raumimpulsantwort die Nachhallzeit des Raumes bestimmt. Diese Nachhallzeit kann dann
genutzt werden, um den Nachhall im aufgenommenen Sprachsignal des ersten Kommunikationsgerätenutzers
zu bestimmen. Hierbei machen sich die Erfinder zusätzlich die Erkenntnis zu nutzte,
das sich die Nachhallzeit auch bei verschiedenen Positionen der Schallquelle im Raum
nicht signifikant ändert.
[0015] Entsprechend diesem Erfindungsgedanken schlagen die Erfinder ein Verfahren zum Betrieb
eines Kommunikationsgerätes vor, wobei das Kommunikationsgerät Audiosignale an eine
Umgebung abstrahlt und einerseits diese Audiosignale einschließlich umgebungsbedingter
überlagerter Störanteile, die zumindest Echo und Nachhall enthalten, wieder aufnimmt
und andererseits Audiosignale einer externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers,
einschließlich deren umgebungsbedingter Störanteile, aufnimmt, und ein erster Algorithmus
eine Raumimpulsantwort der Umgebung bestimmt, dahingehend zu verbessern, dass auf
die aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers,
ein zweiter Entstör-Algorithmus angewendet wird, der zur Entstörung eine Nachhallzeit
verwendet, die er aus der durch den ersten Algorithmus bestimmten Raumimpulsantwort
ermittelt.
[0016] Hierdurch lässt sich diejenige Nachhallzeit zur Entstörung von Audiosignalen einer
externen Schallquelle nutzen, die aus der durch Abstrahlung eines bekannten Audiosignals
und der anschließenden Aufnahme des im Raum verhallten Audiosignals bestimmten Raumimpulsantwort
berechnet werden kann. Gegenüber der Schätzung der Nachhallzeit von Audiosignalen
einer externen Schallquelle ist dieses Verfahren genauer.
[0017] Das Verfahren eignet sich besonders gut für Kommunikationsgeräte, wie zum Beispiel
für Funkgeräte, Mobilfunkgeräte oder Festnetztelefone, da gerade hier die Möglichkeit
der Abstrahlung eines bekannten Signals und der anschließenden Aufnahme gegeben ist.
Aber auch für Stand-Alone-Geräte, die Audiosignale über einen Lautsprecher ausgeben
und auch Audiosignale über ein Mikrofon aufnehmen können, ist das Verfahren geeignet,
die durch die Umgebungsbedingung des Stand-Alone-Gerätes ergebende Nachhallzeit zu
nutzen und entsprechend zu entstören.
[0018] Außerdem ist die Bestimmung der Nachhallzeit über dieses Verfahren wesentlich genauer
möglich, als gegenüber einer bisherigen Abschätzung aus dem verhallten Audiosignal.
[0019] Das neue Verfahren kann beispielsweise die Grundlage für eine Echtzeitparametrisierung
und eine Echtzeitanpassung von Algorithmen zur Enthallung von Sprachsignalen bilden.
[0020] Es ist vorteilhaft, wenn ausschließlich der erste Algorithmus die Nachhallzeit bestimmt.
[0021] Alternativ dazu ist es möglich, dass ausschließlich der zweite Entstör-Algorithmus
die Nachhallzeit bestimmt.
[0022] Weiterhin ist es günstig, wenn die Nachhallzeit aus dem energetischen Abfall des
Nachhalls berechnet wird, wobei die Information über die Geschwindigkeit dieses Abfalls
in der Raumimpulsantwort enthalten ist. Hierdurch kann eine genauere Bestimmung der
Nachhallzeit gegenüber der statistisch basierten Schätzung der Nachhallzeit erfolgen.
[0023] Zur Bestimmung der Raumimpulsantwort, aus der dann die Nachhallzeit bestimmt werden
kann, kann in dem neuen Verfahren beim ersten Algorithmus ein AEC-Algorithmus (AEC
= Acoustic Echo Cancelation) verwendet werden. Dieser AEC-Algorithmus ist in vielen
Telefonen schon heute vorhanden und wird eigentlich zur Unterdrückung der wiederaufgenommenen
Audiosignale benutzt. Der Algorithmus berechnet eine Raumimpulsantwort, welche sich
erfindungsgemäß zur Bestimmung der Nachhallzeit verwenden lässt.
[0024] Zur Entstörung der aufgenommenen Audiosignale des Kommunikationsgerätenutzers wird
ein zweiter Entstör-Algorithmus verwendet. Ein solcher zweiter Entstör-Algorithmus
soll unter Ausnutzung der bestimmten oder übernommenen Nachhallzeit die umgebungsbedingt
überlagerten Störanteile, wie Echo und Hall, aus dem aufgenommenen Audiosignal des
Kommunikationsgerätenutzers entfernen.
[0025] Für das Verfahren ist es ebenfalls vorteilhaft, wenn die Raumimpulsantwort in Abhängigkeit
der Frequenz und vorzugsweise durch mehrere Bandpässe gefiltert wird. Hierdurch kann
die Nachhallzeit, die selbst frequenzabhängig ist, in Abhängigkeit der Frequenz bestimmt
werden.
[0026] An dieser Stelle sei erwähnt, dass die Anwendung des neuen Verfahrens sehr einfach
bei zwei Kommunikationsgeräten nachgewiesen werden kann: Das beschriebene Verfahren
zum Betrieb eines Kommunikationsgerätes basiert darauf, dass der Lautsprecher eines
Audiosystems, zum Beispiel in einen Raum abstrahlt und dass das durch den Raum verhallte
Audiosignal wieder vom Mikrofon des Audiosystems aufgenommen wird.
[0027] Zum Nachweis wird eine Sprachverbindung zwischen den zwei Mobilfunkteilnehmern aufgebaut.
Anschließend trennt der erste Mobilfunkteilnehmer, während der zweite Mobilfunkteilnehmer
spricht, die akustische Verbindung zwischen Lautsprecher und Mikrofon, zum Beispiel
durch Verdecken des Lautsprechers mit der Hand. Bemerkt nun der zweite Mobilfunkteilnehmer
eine deutliche Verschlechterung der Qualität des Audiosignals, zum Beispiel in Form
einer verhallten Stimme, wenn der erste Mobilfunkendteilnehmer spricht, so wird das
neue Verfahren zur Bestimmung der Nachhallzeit im Gerät des ersten Mobilfunkendteilnehmers
angewendet. Dies setzt voraus, dass ein Enthallungs-Algorithmus angewendet wird. Die
Unterbrechung der Übertragungsstrecke beim ersten Mobilfunkendgerät verhindert eine
Adaption des verwendeten "Entstör-Algorithmus" an die Nachhallzeit des Raums.
[0028] Zur gegenständlichen Lösung ihrer Aufgabe schlagen die Erfinder auch vor, ein bekanntes
Kommunikationsgerät mit Mitteln zur Entstörung von Audiosignalen, wobei das Kommunikationsgerät
über zumindest einem Lautsprecher verfügt, der Audiosignale an eine Umgebung abstrahlt
und weiterhin zumindest ein Mikrofon aufweist, mit dem einerseits diese Audiosignale
einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest Echo und
Nachhall enthalten, wieder aufgenommen werden und andererseits Audiosignale einer
externen Schallquelle, vorzugsweise eines Kommunikationsgerätenutzers, einschließlich
deren umgebungsbedingter Störanteile aufgenommen werden, und im Kommunikationsgerät
ein erstes Mittel vorgesehen ist, das ein Mittel zur Berechnung einer Raumimpulsantwort
der Umgebung aufweist, dahingehend zu verbessern, dass ein zweites Mittel für die
aufgenommenen Audiosignale der externen Schallquelle, vorzugsweise des Kommunikationsengerätenutzers,
einschließlich deren umgebungsbedingter Störanteile angeordnet ist, das ein Mittel
zur Ermittlung der Nachhallzeit aufweist, das die Nachhallzeit ermittelt, die in der
durch das erste Mittel bestimmten Raumimpulsantwort enthalten ist.
[0029] Hierdurch wird ein Kommunikationsgerät zur Verfügung gestellt, in dem die Nachhallzeit,
die durch die Ausnutzung der Abstrahlung eines bekannten Audiosignals und der anschließenden
Aufnahme des im Raum verhallten Audiosignals über die Bestimmung der Raumimpulsantwort,
bestimmt wurde, welches nun auch für die Entstörung der Audiosignale einer externen
Schallquelle verwendet werden kann. Die Entstörung kann hierbei genauer als bisher
erfolgen, da die Nachhallzeit besser und genauer bestimmt wird.
[0030] Es besteht die Möglichkeit, dass ausschließlich das erste Mittel über Programmmittel
und/oder Programmmodule verfügt, die die Nachhallzeit bestimmen.
[0031] Alternativ dazu kann aber auch ausschließlich das zweite Mittel Programmmittel und/oder
Programmmodule aufweisen, die die Nachhallzeit bestimmen.
[0032] Das erste Mittel kann über Programmmittel und/oder Programmmodule verfügen, die einen
AEC-Algorithmus (AEC = Acoustic Echo Cancellation) oder einen Algorithmus, wie in
Welch, P.D.[1970], "The Use of Fast Fourier Transform for the Estimation of Power
Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73), beschrieben, ausführen.
Der Inhalt dieses Literaturverweises wird vollinhaltlich übernommen.
[0033] Weiterhin ist es vorteilhaft, wenn die zweiten Mittel Programmmittel und/oder Programmmodule
aufweisen, die einen Algorithmus ausführen, der unter Ausnutzung der umgebungsabhängig
bestimmten Nachhallzeit die umgebungsbedingt überlagerten Störanteile, wie Echo und
Hall, aus dem aufgenommenen Audiosignal des Kommunikationsgerätenutzers entfernt.
[0034] Die Bestimmung der Nachhallzeit in Abhängigkeit der Frequenz und entsprechend die
frequenzabhängige Entstörung der Audiosignale wird in dem Kommunikationsgerät günstig
realisiert, wenn im Kommunikationsgerät Bandpassfilter angeordnet sind, die die Raumimpulsantwort
filtern.
[0035] Bei dem neuen Kommunikationsgerät kann es sich um ein Telefon, zum Beispiel in Form
eines Mobilfunkendgerätes oder eines kabelgebundenen Telefons, ein elektrisches Haushaltgerät
oder ein elektrisches Modul eines Fahrzeuges mit Mitteln zur Spracheingabe und Sprachausgabe
handeln.
[0036] Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele mit Hilfe
der Figuren 1 bis 5 beschrieben, wobei in den Figuren die folgenden Abkürzungen verwendet
werden: 1: Direktschall eines impulsartigen Audiosignals; 2: Echos; 3: Nachhall/Nachhallkurve;
4: Empfangene Signale vom zweiten Kommunikationsgerät; 4.1: Signale vom Spracherzeugungsmodul;
5: Algorithmus zur Bestimmung der Nachhallzeit; 6: Digital-Analog-Wandler; 7: Lautsprecher;
8.1: Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall; 8.2:
Signal des Lautsprechers, das einfach am Objekt reflektiert wird = Echo; 8.3: Signal
des Lautsprechers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall;
9: Objekt an dem die Signale reflektiert werden; 10: Mikrofon; 11: Analog-Digital-Wandler;
12: Zu sendende Signale zum zweiten Kommunikationsgerät; 12.1: Signale zum Spracherkennungsmodul;
13.1: Erstes Kommunikationsgerät; 13.2: Zweites Kommunikationsgerät; 13.3: Schnittstelle
für Signalübermittlung; 13.4: Sprachgesteuertes Elektrogerät: 14: Raumimpulsantwort;
15: Kommunikationsgerätenutzer/Bediener; 15.1: Signal, das direkt vom Kommunikationsgerätenutzer
zum Mikrofon gelangt = Direktschall; 15.2: Signal des Kommunikationsgerätenutzers,
das einfach am Objekt reflektiert wird = Echo; 15.3: Signal des Kommunikationsgerätenutzers,
das mehrfach und diffus am Objekt reflektiert wird = Nachhall; 16: Algorithmus zur
Enthallung der Signale 15.1 bis 15.3; 17: Entstöreinheit; 18: Spracherzeugungsmodul;
19: Spracherkennungsmodul; A60: Energiebereich, in dem die Energie um 60 Dezibel abfällt;
T60: Nachhallzeit.
[0037] Es zeigen im Einzelnen:
- Figur 1:
- Zeitliche Energieverteilung eines ursprünglich impulsförmigen Audiosignals in einem
Raum;
- Figur 2:
- Zeitliche Energieverteilung desselben Audiosignals aus Figur 1, jedoch in einem kleineren
Raum;
- Figur 3:
- Gemessene Raumimpulsantwort eines Raumes;
- Figur 4:
- Zwei Kommunikationsgeräte, die Signale austauschen, wobei in einem Kommunikationsgerät
das neue Verfahren angewendet wird;
- Figur 5:
- Sprachgesteuertes Elektrogerät, in dem das neue Verfahren angewendet wird.
[0038] Die Figur 1 zeigt exemplarisch in einem Diagramm die zeitliche Energieverteilung
eines Audiosignals, die man in einem Raum mit einem Mikrofon aufnehmen und messen
kann, wenn ein impulsartiges Audiosignal, zum Beispiel ein Knall, auftritt. Diese
Energieverteilung erhält man, indem man das Betragsquadrat einer Raumimpulsantwort
bildet und dieses logarithmiert.
[0039] Auf der Ordinate des Diagramms sind die logarithmierten Signalamplituden, als Maß
für die Energie des Audiosignals, und auf der Abszisse die Zeit, jeweils in willkürlichen
Einheiten, aufgetragen.
[0040] Man erkennt als erste Linie ganz links im Diagramm den sogenannten Direktschall 1,
welcher auf direktem Weg von der Schallquelle zum Messmikrofon gelangt. Dann folgen,
die in diesem Beispiel energetisch schwächeren Echos 2, die einmal oder zweimal an
Wänden des Raumes reflektiert wurden, bevor sie zum Messmikrofon gelangen.
[0041] Zuletzt folgt, symbolisiert durch ein Dreieck, der Nachhall 3, welcher aus quasi
chaotischen überlagerten Reflexionen des Audiosignals im Raum besteht und diffus am
Messmikrofon eintrifft.
[0042] Das neue Verfahren nutzt die Nachhallzeit T60 eines Audiosignals, die aus der Raumimpulsantwort
14, die für einen bestimmten Raum charakteristisch ist, bestimmt wurde.
[0043] Zur Bestimmung der Nachhallzeit T60 wird in Figur 1 auf der Ordinate des Diagramms
ein Energiebereich A60 bestimmt, der im Bereich des Nachhalls 3 liegt, in dem die
Energie des Nachhalls um 60 Dezibel abfällt. Der obere und der untere Grenzwert des
Energiebereiches A60 werden zuerst auf die Nachhallkurve 3 und danach auf die Abszisse
also die Zeitachse projiziert. Der projizierte Bereich auf der Zeitachse entspricht
der Nachhallzeit T60.
[0044] An dieser Stelle sei erwähnt, dass der Energiebereich nicht notwendigerweise mit
60 Dezibel gewählt werden muss, sondern auch kleiner oder größer gewählt werden kann.
Zum Beispiel kann auch ein Bereich gewählt werden, in dem die Energie des Nachhalls,
um zum Beispiel 30 Dezibel abfällt. Der Wert, der aus der Projektion auf die Zeitachse
erhalten wird, muss entsprechend um den Faktor der Verkleinerung/Vergrößerung der
Energie, angepasst werden. Bei einem Energiebereich von nur 30 Dezibel wird entsprechend
der Zeitabschnitt mit dem Faktor 2 multipliziert, um die Nachhallzeit T60 zu erhalten.
[0045] In Figur 2 wird wiederum exemplarisch die zeitliche Energieverteilung eines impulsartigen
Audiosignals, zum Beispiel eines Knalles gezeigt. Im Unterschied zu den Randbedingungen,
die für die Figur 1 galten, soll das Audiosignal in einem kleineren Raum aufgenommen
werden. Dies äußert sich in einem geringeren Nachhall 3. Die Nachhallkurve 3 fällt
schneller ab, wodurch auch die Nachhallzeit T60 geringer als in Figur 1 ist. Der Einfachheit
halber wurde der Direktschall 1 und die Echos 2 im Diagramm der Figur 2 unverändert
aus dem Diagramm der Figur 1 übernommen. Bei einer reellen Messung eines Signals könnten
hier jedoch Unterschiede auftreten.
[0046] Man erkennt, dass aus dem energetischen Abfall des Nachhalls 3, also der negativen
Steigung der Nachhallkurve 3, die Nachhallzeit T60 bestimmt werden kann.
[0047] Die Figur 3 zeigt nun eine gemessene Raumimpulsantwort 14 eines Raumes. Auf der Ordinate
sind die Signalamplituden und auf der Abszisse ist die Zeit aufgetragen. Die Geschwindigkeit
des Abfalls der Energie in der Raumimpulsantwort über die Zeit ist charakteristisch
für diesen bestimmten Raum. Diese Geschwindigkeit wird unabhängig vom Messsignal und
der Position von Schallquelle und Mikrofon im Raum für diesen bestimmten Raum erhalten
werden.
[0048] Die Figur 4 zeigt zwei Kommunikationsgeräte 13.1 und 13.2, die Signale 4 und 12 über
eine Schnittstelle 13.3 austauschen. Dabei kann es sich bei den Kommunikationsgeräten
13.1 und 13.2 beispielsweise um Endgeräte im Mobilfunknetz handeln. Bei der Schnittstelle
13.3 kann es sich beispielsweise um eine Sende-/Empfangsantenne oder um eine Infrarotschnittstelle
handeln.
[0049] Im Kommunikationsgerät 13.1 wird das neue Verfahren angewendet.
[0050] Das erste Kommunikationsgerät 13.1 soll sich in einer Umgebung befinden, zum Beispiel
in einer Kirche, in der Halleffekte auftreten. Diese Umgebung ist durch ein einseitig
offenes Rechteck mit dem Bezugszeichen 9 angedeutet.
[0051] Das Signal 4 wird über die Schnittstelle 13.3 vom zweiten Kommunikationsgerät 13.2
zum ersten Kommunikationsgerät 13.1 gesendet und von diesem empfangen. Das Signal
12 soll vom ersten Kommunikationsgerät 13.1 zum zweiten Kommunikationsgerät 13.2 gesendet
werden, dabei sollen Störungen, die durch die Umgebung 9 des ersten Kommunikationsgerätes
13.1 auftreten, unterdrückt werden.
[0052] Das erste Kommunikationsgerät 13.1 verfügt zumindest über einen Digital-Analog-Wandler
6, der die vom zweiten Kommunikationsgerät 13.2 gesendeten digitalen Signale 4 in
analoge Signale umwandelt und an einen Lautsprecher 7 weiterleitet. Außerdem verfügt
das erste Kommunikationsgerät 13.1 über ein Mikrofon 10, welches analoge Signale aufnehmen
kann und über einen Analog-Digital-Wandler 11 digitalisiert.
[0053] Durch das neue Verfahren soll das Signal 15.1, in der Regel Sprachesignale, das ein
Kommunikationsgerätenutzer 15 an das Mikrofon 10 des ersten Kommunikationsgeräts 13.1
abgibt, entstört werden. Die Entstörung geschieht durch möglichst vollständige Unterdrückung
des unerwünschten Echos 15.2 und des unerwünschten Halls 15.3. Um dieses Signal entstören
zu können, muss die Nachhallzeit T60 ermittelt werden. Hierbei macht sich das neue
Verfahren Folgendes zu nutze:
- Die Nachhallzeit, die für diese Umgebung 9 charakteristisch ist, ist in der Raumimpulsantwort
enthalten. Die Raumimpulsantwort wiederum lässt sich aus dem Verhältnis der Signale
8.2 und 8.3 zum Signal 8.1 bestimmen.
- Die Nachhallzeit ändert sich an verschiedenen Positionen der Schallquelle im Raum
nicht signifikant. Das heißt, die Signale 8.1 bis 8.3 die vom Lautsprecher 7 zum Mikrofon
10 gelangen und die Signale 15.1 bis 15.3, die vom Kommunikationsgerätenutzer 15 zum
Mikrofon 10 gelangen, haben eine ähnliche Nachhallzeit.
[0054] Im neuen Verfahren wird die bereits bekannte Nachhallzeit folgendermaßen für die
Entstörung des Signals 15.1 nutzbar gemacht. Das vom zweiten Kommunikationsgerät 13.2
gesendete Signal 4 wird durch den Digital-Analog-Wandler 6 umgewandelt und über den
Lautsprecher 7 des ersten Kommunikationsgeräts 13.1 ausgegeben. Analog zu den Diagrammen
der Figuren 1 und 2 kann das Signal 4 in Form von Direktschall 8.1, Echo 8.2 und Nachhall
8.3 zum Mikrofon 10 des ersten Kommunikationsgerätes 13.1 gelangen.
[0055] Der Direktschall 8.1, das Echo 8.2 und der Nachhall 8.3 werden über einen Analog-Digital-Wandler
6 umgewandelt und über einem Algorithmus 5 wird die Raumimpulsantwort bestimmt.
[0056] Zur Bestimmung der Raumimpulsantwort können verschiedene Methoden eingesetzt werden.
[0057] So kann ein sogenannter AEC-Algorithmus (AEC = Acoustic Echo Cancellation) implementiert
werden. Dieser Algorithmus wird verwendet, um im Freisprechmodus das Echo des Sprachsignals
des fernen Teilnehmers, welches vom Lautsprecher 7 abgestrahlt und unerwünscht vom
Mikrofon 10 wieder aufgenommen wird, zu kompensieren. Hierzu wird mittels Abschätzung
der Übertragungsstrecke Lautsprecher 7 und Mikrofon 10 eine Impulsantwort berechnet.
Durch Faltung des vom Kommunikationsgerät 13.2 gesendeten Signals 4 mit dieser Impulsantwort
und anschließender Subtraktion des so berechneten Signals vom Mikrofonsignal findet
die Echo-Unterdrückung statt. Das Signal wird über eine Entstöreinheit 17 entstört.
[0058] Alternativ dazu kann zur Bestimmung der Raumimpulsantwort ein bekannter Algorithmus
eingesetzt werden, welcher zuerst von "Welch" publiziert wurde. So beschreibt die
Welch Methode (siehe auch Welch, P.D.[1970], "The Use of Fast Fourier Transform for
the Estimation of Power Spectra", IEEE Trans Audio Electroacoustic, Vol AU15, pp70-73)
die Bestimmung einer Impulsantwort durch die Abstrahlung eines Ausgangssignals und
der Messung des Eingangssignals. Einzige Anforderung an das Ausgangssignal ist das
Vorhandensein von ausreichend Energie in den zu betrachtenden Frequenzbereichen.
[0059] Ist die Raumimpulsantwort mit einem Algorithmus 5 bestimmt, so kann hieraus die Nachhallzeit
bestimmt werden. Diese Nachhallzeit kann auch für die Entstörung des Signals 15.1
des Kommunikationsgerätenutzers 15 genutzt werden, da die Nachhallzeiten, die sich
für die Übertragung von Signalen 8.1 bis 8.3 vom Lautsprecher 7 über die Umgebung
9 zum Mikrofon 10 und für die Übertragung von Signalen 15.1 bis 15.3 vom Kommunikationsgerätenutzers
15 zum Mikrofon 10 ergeben, ähnlich sind. Um diese Nachhallzeit aus der Raumimpulsantwort,
die durch den ersten Algorithmus 5 bestimmt wurde, zu ermitteln, ist ein weiterer
Algorithmus 16 vorgesehen, der Zugriff auf die Daten des Algorithmus 5 hat, also auch
auf die Raumimpulsantwort und die darin enthaltene Nachhallzeit. Dann werden die Signale
15.1 bis 15.3 mit einer Entstöreinheit 17 entstört und als Signale 12 ausgegeben.
[0060] Die Figur 5 zeigt eine besondere Ausführung eines Kommunikationsgerätes. Hier wird
das neue Verfahren in einem sprachgesteuerten Elektrogerät 13.4 angewendet. Dabei
steht der Bediener 15 des sprachgesteuerten Elektrogeräts nur mit dem sprachgesteuerten
Elektrogerät 13.4 in Kontakt und nicht wie in Figur 4 mit einem weiteren Kommunikationsteilnehmer,
der sich an einem zweiten Kommunikationsgerät befindet.
[0061] Das sprachgesteuerte Elektrogerät 13.4 verfügt über ein Spracherzeugungsmodul 18,
um Signale 4.1 zum Beispiel den Menüumfang des Elektrogerätes 13.4, über den Lautsprecher
7 ausgeben zu können. Außerdem verfügt das sprachgesteuerte Elektrogerät 13.4 über
ein Spracherkennungsmodul 19, um Signale 12.1, zum Beispiel die Sprache des Bedieners
15, erkennen zu können.
[0062] Abhängig von der Umgebung 9, können die über den Lautsprecher 7 in Form von Direktschall
8.1, Echo 8.2 und Nachhall 8.3 ausgegebene Signale ungewollt vom Mikrofon 10 aufgenommen
werden. Um diese Rückkopplung zu vermeiden, wird im sprachgesteuerten Elektrogerät
13.4 ein Algorithmus 5 ausgeführt, der unter anderem auch die Raumimpulsantwort bestimmt.
Außerdem wird diese Rückkopplung mit einer Entstöreinheit 17 unterdrückt.
[0063] Zur Entstörung des vom Bediener 15 an das Mikrofon 10 geschickten Signals 15.1 kann
der Algorithmus 5 nicht verwendet werden. Aber die Nachhallzeit, die sich aus der
Raumimpulsantwort berechnen lässt, welche im Algorithmus 5 bestimmt wurde, die aber
nahezu gleich für die Signale 15.1 bis 15.3 des Bedieners 15 gilt, kann von einem
weiteren Algorithmus 16 verwendet werden, der mit einer Entstöreinheit 17 das Signal
15.1 entstört.
[0064] Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur
in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder
in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.
Bezugszeichenliste
[0065]
- 1
- Direktschall eines impulsartigen Audiosignals
- 2
- Echos
- 3
- Nachhall / Nachhallkurve
- 4
- Empfangene Signale vom zweiten Kommunikationsgerät
- 4.1
- Signale vom Spracherzeugungsmodul
- 5
- Algorithmus
- 6
- Digital-Analog-Wandler
- 7
- Lautsprecher
- 8.1
- Signal, das direkt vom Lautsprecher zum Mikrofon gelangt = Direktschall
- 8.2
- Signal des Lautsprechers, das einfach am Objekt reflektiert wird = Echo
- 8.3
- Signal des Lautsprechers, das mehrfach und diffus am Objekt reflektiert wird = Nachhall
- 9
- Objekt an dem die Signale reflektiert werden
- 10
- Mikrofon
- 11
- Analog-Digital-Wandler
- 12
- Zu sendende Signale zum zweiten Kommunikationsgerät
- 12.1
- Signale zum Spracherkennungsmodul
- 13.1
- Erstes Kommunikationsgerät
- 13.2
- Zweites Kommunikationsgerät
- 13.3
- Schnittstelle für Signalübermittlung
- 13.4
- Sprachgesteuertes Elektrogerät
- 14
- Raumimpulsantwort
- 15
- Kommunikationsgerätenutzer/Bediener
- 15.1
- Signal, das direkt vom Kommunikationsgerätenutzer zum Mikrofon gelangt = Direktschall
- 15.2
- Signal des Kommunikationsgerätenutzers, das einfach am Objekt reflektiert wird = Echo
- 15.3
- Signal des Kommunikationsgerätenutzers, das mehrfach und diffus am Objekt reflektiert
wird = Nachhall
- 16
- Algorithmus zur Enthallung der Signale 15.1 bis 15.3
- 17
- Entstöreinheit
- 18
- Spracherzeugungsmodul
- 19
- Spracherkennungsmodul
- A60
- Energiebereich, in dem die Energie um 60 Dezibel abfällt
- T60
- Nachhallzeit T60
1. Verfahren zum Betrieb eines Kommunikationsgerätes (13.1, 13.2, 13.4), wobei
das Kommunikationsgerät (13.1, 13.2, 13.4) Audiosignale (8.1 bis 8.3) an eine Umgebung
(9) abstrahlt und
einerseits diese Audiosignale (8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter
Störanteile, die zumindest Echo (8.2) und Nachhall (8.3) enthalten, wieder aufnimmt
und
andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise
eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile
(15.2 und 15.3) aufnimmt, und
die wiederaufgenommenen Audiosignale (8.1 bis 8.3) durch einen ersten Algorithmus
(5) benutzt werden, um eine Raumimpulsantwort der Umgebung zu bestimmen,
dadurch gekennzeichnet, dass
auf die aufgenommenen Audiosignale (15.1 bis 15.3) der externen Schallquelle, vorzugsweise
des Kommunikationsgerätenutzers (15), ein zweiter Entstör-Algorithmus (16) angewendet
wird, der zur Entstörung eine Nachhallzeit (T60) verwendet, die er aus der durch den
ersten Algorithmus (5) bestimmten Raumimpulsantwort (14) ermittelt.
2. Verfahren gemäß dem voranstehenden Patentanspruch 1,
dadurch gekennzeichnet, dass
ausschließlich der erste Algorithmus (5) die Nachhallzeit (T60) bestimmt.
3. Verfahren gemäß dem voranstehenden Patentanspruch 1,
dadurch gekennzeichnet, dass
ausschließlich der zweite Entstör-Algorithmus (16) die Nachhallzeit (T60) bestimmt.
4. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3,
dadurch gekennzeichnet, dass
die Nachhallzeit (T60) aus dem energetischen Abfall des Nachhalls (8.3) in der Raumimpulsantwort
(14) berechnet wird.
5. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4,
dadurch gekennzeichnet, dass
als erster Algorithmus ein AEC-Algorithmus (5) (AEC = Acoustic Echo Cancellation)
verwendet wird.
6. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5,
dadurch gekennzeichnet, dass
der zweite Entstör-Algorithmus (16) unter Ausnutzung der umgebungsabhängig bestimmten
oder übernommenen Nachhallzeit (T60) die überlagerten Störanteile (15.2 und 15.3)
aus dem aufgenommenen Audiosignal (15.1 bis 15.3) der externen Schallquelle entfernt.
7. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6,
dadurch gekennzeichnet, dass
zur Bestimmung der Nachhallzeit (T60) in Abhängigkeit der Frequenz die Raumimpulsantwort
(14) gefiltert wird, vorzugsweise mit Bandpassfiltern.
8. Kommunikationsgerät (13.1, 13.2, 13.4) mit Mitteln zur Entstörung von Audiosignalen,
wobei das Kommunikationsgerät (13.1, 13.2, 13.4) über
zumindest einen Lautsprecher (7) verfügt, der Audiosignale (8.1 bis 8.3) an eine Umgebung
(9) abstrahlt und
weiterhin zumindest ein Mikrofon (10) aufweist, mit dem einerseits diese Audiosignale
(8.1 bis 8.3) einschließlich umgebungsbedingter überlagerter Störanteile, die zumindest
Echo (8.2) und Nachhall (8.3) enthalten, wieder aufgenommen werden und
andererseits Audiosignale (15.1 bis 15.3) einer externen Schallquelle, vorzugsweise
eines Kommunikationsgerätenutzers (15), einschließlich deren umgebungsbedingter Störanteile
(15.2, 15.3) aufgenommen werden, und
im Kommunikationsgerät (13.1, 13.2, 13.4) ein erstes Mittel (5) vorgesehen ist, das
ein Mittel zur Berechnung einer Raumimpulsantwort der Umgebung aufweist,
dadurch gekennzeichnet, dass
ein zweites Mittel (16) für die aufgenommenen Audiosignale (15.1 bis 15.3) der externen
Schallquelle, vorzugsweise des Kommunikationsengerätenutzers (15), einschließlich
deren umgebungsbedingter Störanteile (15.2, 15.3) angeordnet ist, das ein Mittel zur
Ermittlung der Nachhallzeit (T60) aufweist, das die Nachhallzeit (T60) ermittelt,
die in der durch das erste Mittel (5) bestimmen der Raumimpulsantwort (14) enthalten
ist.
9. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8,
dadurch gekennzeichnet, dass
ausschließlich das erste Mittel (5) Programmmittel und/oder Programmmodule aufweist,
die die Nachhallzeit (T60) bestimmen.
10. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehende Patentanspruch 8,
dadurch gekennzeichnet, dass
ausschließlich das zweite Mittel (16) Programmmittel und/oder Programmmodule aufweist,
die die Nachhallzeit (T60) bestimmen.
11. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche
8 bis 10,
dadurch gekennzeichnet, dass
die Programmmittel und/oder Programmmodule des ersten Mittels einen AEC-Algorithmus
(5) (AEC = Acoustic Echo Cancelation) beinhalten.
12. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehende Patentansprüche
8 bis 11,
dadurch gekennzeichnet, dass
die Programmmittel und/oder Programmmodule des zweiten Mittels (16) einen Algorithmus
beinhalten, der unter Ausnutzung der umgebungsabhängig bestimmten Nachhallzeit die
überlagerten Störanteile (15.2 und 15.3) aus dem aufgenommenen Audiosignal (15.1 bis
15.3) der externen Schallquelle (15) entfernt.
13. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche
8 bis 12,
dadurch gekennzeichnet, dass
Bandpassfilter vorgesehen sind, die die Raumimpulsantwort (14) filtern und die Bestimmung
der Nachhallzeit (T60) in Abhängigkeit der Frequenz ermöglichen.
14. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche
8 bis 13,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein Telefon ist.
15. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß dem voranstehenden Patentanspruch 14,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein kabelgebundenes Telefon ist.
16. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche
8 bis 14,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein Mobilfunkendgerät ist.
17. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche
8 bis 13,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Haushaltgerät mit Mittel
zur Spracheingabe und Sprachausgabe ist.
18. Kommunikationsgerät (13.1, 13.2, 13.4) gemäß einem der voranstehenden Patentansprüche
8 bis 17,
dadurch gekennzeichnet, dass
das Kommunikationsgerät (13.1, 13.2, 13.4) ein elektrisches Modul eines Fahrzeuges
mit Mitteln zur Spracheingabe und Sprachausgabe ist.