[0001] Verfahren zur Entstörung übermittelter Audiosignale zwischen Telekommunikationsendgeräten
und Nachweisverfahren hierfür
[0002] Die Erfindung betrifft ein Verfahren zur Entstörung übermittelter Audiosignale zwischen
Telekommunikationsendgeräten, bei dem die Audiosignale mit verschiedenen Frequenzen
zwischen den Telekommunikationsendgeräten übermittelt werden und denen störende Anteile,
vorzugsweise in Form eines Nachhalls der zu übermittelnden Audiosignale, überlagert
sein können, wobei von den übermittelten und störbehafteten Audiosignalen eine spektrale
Einhüllende bestimmt wird und die Audiosignale gefiltert werden.
[0003] Des weiteren betrifft die Erfindung ein Nachweisverfahren, welches es ermöglicht,
festzustellen, ob das neue Verfahren in einem Telekommunikationsendgerät angewendet
wird.
[0004] Es ist allgemein bekannt, dass sich die Qualität eines übertragenen Audiosignals
zwischen zwei Telekommunikationsendgeräten verschlechtert, wenn sich dem eigentlichen
zu übertragenden Audiosignal störende Signale überlagern.
[0005] Ein solch störendes Signal kann beispielsweise der eigene Nachhall des Audiosignals
sein. So kann die Schallwelle des zu übertragenen Audiosignal zum Beispiel an den
Wänden eines Raumes und den Raumeinrichtungsgegenständen reflektiert werden und zusätzlich
dem zu übertragenen Audiosignals überlagert sein.
[0006] Dieses Phänomen tritt häufig bei Telefongesprächen im Mobilfunknetz beziehungsweise
im Festnetz auf, wenn ein erster Gesprächspartner im Freisprechmodus telefoniert und
sich in einem Raum befindet, zum Beispiel einem Büro oder einem Wohnzimmer. Für den
zweiten Gesprächspartner klingt die Stimme des erster Gesprächspartners ziemlich "hallend"
und somit störend.
[0007] Um diese störenden Überlagerungseffekte zumindest teilweise zu eliminieren werden
bereits bestimmte Techniken und Algorithmen verwendet. Die bekanntesten Algorithmen
lassen sich in drei Kategorien klassifizieren.
- Algorithmen, die auf der Schätzung der Raumimpulsantwort basieren.
- Algorithmen, die statistische Eigenschaften des Audiosignals benutzen.
- Algorithmen, die mehrere Mikrofone benutzen.
[0008] Im Ersten Fall wird das Audiosignal mit der Inversen der Raumübertragungsfunktion
gefiltert. Auf diese Weise wird versucht den Einfluss des Raumes zu eliminieren. Hauptnachteile
dieses Verfahrens liegen darin, dass die Raumimpulsantwort in der Regel unbekannt
ist und dass solche Verfahren eine hohe Rechnerleistung erfordern.
[0009] Im Zweiten Fall werden anhand bestimmter Parameter des Audiosignals, die in besonderer
Weise vom Nachhall abhängig sind, Filter gesteuert, die das Audiosignal enthallen.
Die Filter können verschiedener Art sein, beispielweise adaptive Filter. In diesem
Fall wird der Filter so adaptiert, dass das gefilterte Signal bestimmte Eigenschaften
aufweist. Zum Beispiel kann der Filter das Signal so filtern, dass sich die Kurtosis
(Moment 3. Ordnung) des Signals an einen bestimmten Wert annähert. Eine weitere Möglichkeit
für die Implementierung des Filters liegt darin, dass der Filter die Signalzeitabschnitte
dämpft, die einen besonders hohen Nachhall haben. Nachteil dieses Verfahren liegt
in möglichen Artefakten, die von einem zeitvariablen Dämpfungsfaktor verursacht werden
können.
[0010] Die dritte Möglichkeit zur Entstörung eines übertragenen Audiosignals besteht darin,
mehrere Mikrofone einzusetzen, um dass Signal an mehreren Stellen aufzunehmen und
dann zu korrigieren. Diese Möglichkeit wird in den meisten Kommunikationsendgeräten
nicht angewendet, da sie eine Steigerung der Hardwarekosten verursacht.
[0011] Es ist daher Aufgabe der Erfindung, ein verbessertes Verfahren zur Entstörung übermittelter
Audiosignale zwischen Telekommunikationsendgeräten zu finden, welches gegenüber den
bekannten Verfahren und Techniken einfacher und mit geringerem Hardwareaufwand durchgeführt
werden kann.
[0012] In der Praxis hat es sich gezeigt, dass vor allem der Nachweis über die Anwendung
neuer Verfahren meist nur schwer erbracht werden kann. Es besteht die Gefahr, dass
Nachahmer oder Mitwettbewerber sich eines neuen Verfahrens unrechtmäßig bedienen.
[0013] Aus diesem Grund ist es auch Aufgabe der Erfindung ein Nachweisverfahren vorzustellen,
dass es ermöglicht festzustellen, ob das neue Verfahren in einem Telekommunikationsendgerät
Anwendung findet.
[0014] Diese Aufgaben der Erfindung werden durch das Verfahren mit den Merkmalen des Patentanspruches
1 und durch das Verfahren mit Merkmalen des Patentanspruches 11 gelöst. Vorteilhafte
Weiterbildungen der Erfindung sind Gegenstand untergeordneter Patentansprüche.
[0015] Der Erfinder hat erkannt, dass sich Störeinflüsse, wie zum Beispiel der Nachhall,
in den Bereichen, in denen die Energie des Audiosignals niedrig ist, mehr störend
auf ein zu übertragenes Audiosignal auswirken, als in den Bereichen des Audiosignals,
in denen die Energie hoch ist. Weiter hat der Erfinder erkannt, dass diese Bereiche
in der Darstellung des Audiosignals durch die Kurve der spektralen Einhüllenden sehr
leicht bestimmt werden können. Wird nur selektiv in den Bereichen eine Dämpfung vorgenommen,
in denen das Signal schwach ist und eine Störung sich stärker auf das Signal-Rausch-Verhältnis
auswirkt, so kann die Qualität des zu übertragenen Audiosignals verbessert werden
und so zum Beispiel ein "Halleffekt" reduziert werden. Entsprechend kann die Qualität
des zu übertragenen Audiosignals verbessert werden, wenn nur selektiv in den Bereichen
eine Verstärkung vorgenommen wird, in denen das Signal dominierend ist und eine Störung
sich schwächer auf das Signal-Rausch-Verhältnis auswirkt.
[0016] Entsprechend diesem Erfindungsgedanken schlägt der Erfinder vor, das an sich bekannte
Verfahren zur Entstörung übermittelter Audiosignale zwischen Telekommunikationsendgeräten,
bei dem die Audiosignale mit verschiedenen Frequenzen zwischen den Telekommunikationsendgeräten
übermittelt werden und denen störende Anteile, vorzugsweise in Form eines Nachhalls
der zu übermittelnden Audiosignale, überlagert sein können, wobei von den übermittelten
und störbehafteten Audiosignalen eine spektrale Einhüllende bestimmt wird und die
Audiosignale gefiltert werden, dahingehend zu verbessern, dass zur Entstörung die
übertragenen Audiosignale in unterschiedlichen Frequenzbereichen unterschiedlich stark
gedämpft und/oder verstärkt werden.
[0017] Durch das unterschiedliche Dämpfen und/oder Verstärken in unterschiedlichen Frequenzbereichen
wird erreicht, dass eine selektive Dämpfung/Verstärkung, in den Frequenzbereichen
vorgenommen werden kann, in denen der Einfluss der störenden Anteile dominierend oder
nicht dominierend ist. Gegenüber den bekannten Verfahren und Techniken kann dieses
neue Verfahren einfacher und mit geringerem Hardwareaufwand durchgeführt werden.
[0018] Es ist günstig, wenn Autokorrelationskoeffizienten für Frames des Audiosignals berechnet
werden und danach ein Levinson-Durbin Algorithmus angewendet wird wodurch die LPC-Koeffizienten
(LPC = Linear Predictive Coding) ermittelt werden.
[0019] Hierdurch lässt sich der zeitlich Verlauf der Audiosignale in eine Frequenz abhängige
Darstellung transformieren.
[0020] Weiterhin ist es vorteilhaft, wenn die spektrale Einhüllende der Audiosignale aus
den LPC-Koeffizienten berechnet wird. In der Kurve der spektralen Einhüllenden werden
die Beträge der Signalamplituden über der Frequenz aufgetragen. Maxima oder auch Formanten
in der spektralen Einhüllenden entsprechen den Audiosignalbereichen, in denen die
Energie des Audiosignals ausreichend ist, sich gegenüber Einflüssen störender Signalanteile
durchzusetzen. Minima in der Kurve der spektralen Einhüllenden entsprechen den Frequenzbereichen
des Audiosignals, in denen die Energie des Audiosignals zu gering ist, um sich gegenüber
Einflüssen störender Signalanteile durchzusetzen.
[0021] Aus dem Kurvenverlauf der spektralen Einhüllenden können also die verschiedenen Frequenzbereich
einfach entnommen werden, in denen eine unterschiedliche Dämpfung/Verstärkung zu erfolgen
hat.
[0022] Für das Verfahren ist es vorteilhaft, wenn die übermittelten Audiosignale nur in
den Frequenzbereichen gedämpft werden, in denen die Energie der Audiosignale gering
ist. In diesen Frequenzbereichen dominieren die störenden und dem Audiosignal überlagerten
Anteile, wie zum Beispiel Nachhall. Wird nun gezielt in diesen Bereichen gedämpft,
so kann der Störeinfluss zumindest reduziert werden.
[0023] Entsprechend ist es günstig, wenn die übermittelten Audiosignale in den Frequenzbereichen
nahezu unverändert belassen werden, in denen die Energie der Audiosignale hoch ist.
In diesen Frequenzbereichen dominieren die Audiosignale gegenüber den störenden und
den überlagerten Anteilen. Der Einfluss der überlagerten Anteile ist somit weniger
störend.
[0024] Alternativ dazu, die Audiosignale in den Frequenzbereichen mit hoher Energie nahezu
unverändert zu belassen, besteht auch die Möglichkeit, dass die übermittelten Audiosignale
gerade in den Frequenzbereichen verstärkt werden, in denen die Energie der Audiosignale
hoch ist. In diesen Frequenzbereichen dominieren die Audiosignale gegenüber den störenden
und den überlagerten Anteilen. Durch verstärken dieser Frequenzbereiche wird der Einfluss
der überlagerten Anteile noch weniger störend.
[0025] Um die Dämpfung des Audiosignals in unterschiedlichen Frequenzbereich unterschiedlich
durchführen zu können, ist es vorteilhaft, wenn eine Filterfunktion ermittelt wird,
durch die die Audiosignale in den unterschiedlichen Frequenzbereichen unterschiedlich
gedämpft/verstärkt werden.
[0026] Entsprechend dem eben beschriebenen Verfahren zur Entstörung übermittelter Audiosignale
zwischen Telekommunikationsendgeräten schlägt der Erfinder auch ein Nachweisverfahren
vor, das es ermöglicht festzustellen, ob das eben beschriebene Verfahren in einem
Telekommunikationsendgerät angewendet wird, wobei sich das Nachweisverfahren dadurch
kennzeichnet, dass folgende Schritte durchgeführt werden:
[0027] Es wird ein störbehaftetes Audiosignal mit einem Audiosignalkodierer kodiert und
dann dekodiert. Als Codierung eignet sich beispielsweise G726 für DECT, wobei G726
ein Sprachcode für DECT Telefone ist. Auch eine EFR-/FR-Codierung für GSM ist möglich,
wobei die Abkürzungen EFR/FR der Sprachcodes Enhanced Full Rate und Full Rate bedeuten.
[0028] Dann wird der Verlauf der Maxima und Minima der spektralen Einhüllenden bestimmt
und die entsprechenden Werte gespeichert.
[0029] Das gleiche störbehaftetes Audiosignal wird in das zu überprüfende Telekommunikationsendgerät
eingespeist. Dies kann beispielsweise durch Einspeisung akustischer Testsignale in
das Mikrofon des Telekommunikationsendgerät erfolgen.
[0030] Auch hier wird der Verlauf der Maxima und der Minima der spektralen Einhüllenden
bestimmt und dann die entsprechenden Werte, zum Beispiel Maximalwert und Minimalwert
und dazugehörige Frequenz, gespeichert.
[0031] Es wird ein Vergleich zwischen Maxima- und Minima-Verläufen und zwischen den gespeicherten
Signalwerten durchgeführt.
[0032] Wird bei diesem Vergleich festgestellt, dass die Maxima übereinstimmende Werten haben
und die Minima gedämpft werden, so kann darauf geschlossen werden, dass das Verfahren
zur Entstörung in dem geprüften Telekommunikationsendgerät angewendet wurde.
[0033] Im Folgenden wird die Erfindung anhand bevorzugter Ausführungsbeispiele mit Hilfe
der Figuren 1 bis 4 beschrieben, wobei in den Figuren die folgenden Abkürzungen verwendet
werden: 1: Audiosignal mit überlagertem eigenem Nachhall; 1.1 Bereich, in dem der
Nachhall das Audiosignal überlagert ist; 2: Kurve der spektralen Einhüllenden von
einem Zeitabschnitt eines Audiosignals; 2.1: Erstes Minimum der Kurve 2; 2.2: Zweites
Minimum der Kurve 2; 2.3: Drittes Minimum der Kurve 2; 2.4: Erstes Maximum der Kurve
2; 2.5: Zweites Maximum der Kurve 2; 2.6: Drittes Maximum der Kurve 2; 3: Filterkurve
für die Enthallung des Audiosignals; 3.1: Erstes Minimum der Filterkurve 3; 3.2: Zweites
Minimum der Filterkurve 3; 3.3: Drittes Minimum der Filterkurve 3; 4: Audiosignal,
bei dem der überlagerter Nachhall gedämpft wurde; 4.1: Bereich, in dem der Nachhall
des Audiosignals gedämpft wurde.
- Figur 1:
- Zeitausschnitt eines Audiosignals mit überlagertem Nachhall;
- Figur 2:
- Kurve der spektralen Einhüllenden von einem Zeitabschnitt des Audiosignals aus Figur
1;
- Figur 3:
- Filterkurve für die Enthallung des Audiosignals;
- Figur 4:
- Zeitausschnitt des Audiosignals aus Figur 1 jedoch mit gedämpften Nachhall.
[0034] Die Figur 1 zeigt in dem Diagramm einen Zeitausschnitt eines Audiosignals 1, dem
der eigene Nachhall überlagert ist. Auf der Ordinate sind die Schwingungsamplituden
des Audiosignals 1 aufgetragen. Auf der Abszisse ist die Zeit aufgetragen.
[0035] Beispielhaft für den Einfluss des überlagerten Nachhalls ist ein Bereich 1.1 (elliptisch
eingerahmter Bereich) kenntlich gemacht, in dem der Nachhall das Audiosignal stört.
In diesem neuen Verfahren soll der störende Einfluss des Nachhalls zumindest gedämpft
werden.
[0036] Zuerst wird in dem Verfahren für einen Zeitbereich des Audiosignals 1 die spektrale
Einhüllende aus den LPC-Koeffizienten (LPC = Linear Predictive Coding) berechnet.
Die Figur 2 zeigt eine Kurve 2 einer solchen spektralen Einhüllenden.
[0037] In den Figuren 2 und 3 wird jeweils auf der Ordinate der Betrag der Amplitude in
willkürlichen Einheiten und auf der Abszisse die Frequenz in willkürlichen Einheiten
aufgetragen.
[0038] Die Figur 2 zeigt eine Kurve 2, die exemplarisch die spektrale Einhüllenden von einem
Zeitabschnitt des Audiosignals 1 aus Figur 1 wiedergibt. Danach werden die Maxima
2.4 bis 2.6 und die Minima 2.1 bis 2.3 der Kurve 2 bestimmt.
[0039] Im Bereich um die Maxima 2.4 bis 2.6 hat das Audiosignal 1 eine hohe Energie, der
Betrag der Amplitude ist entsprechend hoch. Im Bereich um die Maxima 2.4 bis 2.6 herrscht
entsprechend ein gutes Signal-Rausch-Verhältnis (Signal to noise ratio). Eine Überlagerung
von, zum Beispiel einem Nachhall zum originalen Audiosignal wirkt sich in diesen Bereichen
nicht besonders störend aus. Man kann sagen, dass das zu übertragene Audiosignal gegenüber
dem störenden Anteil dominiert. Aus diesem Grund wird im neuen Verfahren ein solches
"verhalltes" Audiosignal in diesen Bereichen nahezu nicht verändert.
[0040] Im Bereich um die Minima 2.1 bis 2.3 hingegen hat das Audiosignal eine geringere
Energie, der Betrag der Amplitude ist entsprechend niedrig. Im Bereich um die Minima
2.1 bis 2.3 ist das Signal-Rausch-Verhältnis schlechter. Eine Überlagerung von einem
Nachhall zum ungestörten originalen Audiosignal wirkt sich in diesen Bereichen mehr
störend aus. Das neue Verfahren verändert eine solch "verhalltes" Audiosignal in diesen
Bereichen. In diesen Bereich wird das Audiosignal abhängig vom Absolutwert der Minima
2.1 bis 2.3 und vom Verlauf der Minima gedämpft.
[0041] Die Figur 3 zeigt beispielhaft eine Filterkurve 3, für die in Figur 2 dargestellte
Kurve 2 der spektralen Einhüllenden des Audiosignals. Aus Figur 3 ist zu entnehmen,
dass im Bereich der Maxima 2.4 bis 2.6 der Kurve 2 die Filterkurve 3 konstante Werte
aufweist,.während im Bereich der Minima 2.1 bis 2.3 der Kurve 2 die Filterkurve 3
ebenfalls Minima 3.1 bis 3.3 aufweist. Zur Verdeutlichung sind die Minima 2.1 bis
2.3 der Kurve 2 der spektralen Einhüllenden durch gepunktete Linien mit den Minima
3.1 bis 3.3 der Filterkurve 3 verbunden. Die Minima 3.1 bis 3.3 der Filterkurve 3
bewirken, dass das Audiosignal in diesen Bereichen gedämpft wird.
[0042] Die Figur 4 zeigt nun in dem Diagramm einen Zeitausschnitt eines Audiosignals wie
in Figur 1. Im Unterschied dazu weist das Audiosignal 4 einen gedämpften Nachhall
auf. Beispielhaft wurde der Bereich 4.1 (elliptisch eingerahmter Bereich) markiert,
in dem im Unterschied zum Diagramm der Figur 1 keine Störanteile vorhanden sind.
[0043] In diesem neuen Verfahren wird erreicht, dass durch Ausfiltern der Bereiche mit schlechten
Signal-Rausch-Verhältnis insgesamt die Qualität des übertragenen Audiosignals verbessert
wird. Hierdurch kann zum Beispiel der eigene Nachhall eines zu übertragen Audiosignals
zumindest reduziert werden.
[0044] Es versteht sich, dass die vorstehend genannten Merkmale der Erfindung nicht nur
in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder
in Alleinstellung verwendbar sind, ohne den Rahmen der Erfindung zu verlassen.
[0045] Auflistung der verwendeten Abkürzungen:
- DECT
- Digital Enhanced Cordless Telecommunication
- EFR
- Enhanced Full Rate (GSM Codierung)
- FR
- Full Rate (GSM Codierung)
- G726
- Sprachcode für DECT
- GSM
- Global System for Mobile Communications (Mobilfunk)
- LPC
- Linear Predictive Coding
1. Verfahren zur Entstörung übermittelter Audiosignale (1) zwischen Telekommunikationsendgeräten,
bei dem die Audiosignale (1) mit verschiedenen Frequenzen zwischen den Telekommunikationsendgeräten
übermittelt werden und denen störende Anteile (1.1), vorzugsweise in Form eines Nachhalls
der zu übermittelnden Audiosignale, überlagert sein können, wobei von den übermittelten
und störbehafteten Audiosignalen (1) eine spektrale Einhüllende (2) bestimmt wird
und die Audiosignale (1) gefiltert werden,
dadurch gekennzeichnet,
dass zur Entstörung die übertragenen Audiosignale (1) in unterschiedlichen Frequenzbereichen
unterschiedlich stark gedämpft und/oder verstärkt werden.
2. Verfahren gemäß dem voranstehenden Patentanspruch 1,
dadurch gekennzeichnet,
dass Autokorrelationskoeffizienten für Frames (Datenübertragungsrahmen) der Audiosignale
(1) berechnet werden.
3. Verfahren gemäß einem der voranstehenden Patentansprüche 1 und 2,
dadurch gekennzeichnet,
dass ein Levinson-Durbin Algorithmus angewendet wird.
4. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 3,
dadurch gekennzeichnet,
dass LPC-Koeffizienten (LPC = Linear Predictive Coding) ermittelt werden.
5. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 4,
dadurch gekennzeichnet,
dass die spektrale Einhüllende (2) der Audiosignale (1) aus den LPC-Koeffizienten berechnet
wird.
6. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5,
dadurch gekennzeichnet,
dass die übermittelten Audiosignale (1) nur in den Frequenzbereichen gedämpft werden,
in denen die Energie der Audiosignale (1) gering ist.
7. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 6,
dadurch gekennzeichnet,
dass die übermittelten Audiosignale (1) in den Frequenzbereichen nahezu unverändert belassen
werden, in denen die Energie der Audiosignale hoch ist.
8. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 5,
dadurch gekennzeichnet,
dass die übermittelten Audiosignale (1) nur in den Frequenzbereichen verstärkt werden,
in denen die Energie der Audiosignale (1) hoch ist.
9. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 8,
dadurch gekennzeichnet,
dass die Frequenzbereiche aus der spektralen Einhüllenden (2) des Audiosignals (1) ermittelt
werden.
10. Verfahren gemäß einem der voranstehenden Patentansprüche 1 bis 9,
dadurch gekennzeichnet,
dass eine Filterfunktion (3) ermittelt wird, durch die die Audiosignale (1) in den unterschiedliche
Frequenzbereichen unterschiedlich gedämpft werden.
11. Nachweisverfahren, welches es ermöglicht, festzustellen, ob das in einem der voranstehenden
Patentansprüchen 1 bis 7 beschriebene Verfahren in einem Telekommunikationsendgerät
angewendet wird,
dadurch gekennzeichnet,
dass folgende Schritte durchgeführt werden:
- ein störbehaftetes Audiosignal wird mit einem Audiosignalkodierer kodiert und dann
dekodiert.
- der Verlauf der Maxima und Minima der spektralen Einhüllenden wird bestimmt und
gespeichert.
- das gleiche störbehaftetes Audiosignal wird in das zu überprüfende Telekommunikationsendgerät
eingespeist.
- der Verlauf der Maxima und Minima der spektralen Einhüllenden wird bestimmt und
gespeichert.
- ein Vergleich zwischen beiden Verläufen wird durchgeführt.