(19)
(11) EP 1 091 349 A2

(12) EUROPÄISCHE PATENTANMELDUNG

(43) Veröffentlichungstag:
11.04.2001  Patentblatt  2001/15

(21) Anmeldenummer: 00250301.9

(22) Anmeldetag:  08.09.2000
(51) Internationale Patentklassifikation (IPC)7G10L 21/02, G06F 15/18
(84) Benannte Vertragsstaaten:
AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE
Benannte Erstreckungsstaaten:
AL LT LV MK RO SI

(30) Priorität: 06.10.1999 DE 19948308

(71) Anmelder: Cortologic AG
12459 Berlin (DE)

(72) Erfinder:
  • Ruwisch, Dietmar, Dr.
    12459 Berlin (DE)

(74) Vertreter: Scholz, Hartmut, Dipl.-Ing. Patentanwalt 
Rheinstrasse 64
12159 Berlin
12159 Berlin (DE)

   


(54) Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung


(57) Verfahren zur Geräuschunterdrückung bei der Sprachübertragung durch ein mehrschichtiges, selbstorganisierendes, rückgekoppeltes neuronales Netzwerk, mit einer Minimadetektionsschicht, einer Reaktionsschicht, einer Diffusionsschicht und einer Integrationsschicht, die eine Filterfunktion F(f,T) zur Geräuschfilterung bestimmen.




Beschreibung


[0001] Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung durch ein mehrschichtiges, selbstorganisierendes, rückgekoppeltes neuronales Netzwerk.

[0002] Bei der Telekommunikation sowie bei der Aufzeichnung von Sprache in tragbaren Speichergeräten tritt das Problem auf, daß die Sprachverständlichkeit durch Störgeräusche stark beeinträchtigt ist. Insbesondere beim Telefonieren im Auto mit Hilfe einer Freisprecheinrichtung ist dieses Problem evident. Zur Unterdrückung der Störgeräusche werden Filter in den Signalweg eingebaut. Klassische Bandpaßfilter bieten nur einen geringen Nutzen, da Störgeräusche im allgemeinen in denselben Frequenzbereichen liegen wie das Sprachsignal. Daher werden adaptive Filter benötigt, die sich selbständig den vorhandenen Störgeräuschen und den Eigenschaften des zu übertragenden Sprachsignals anpassen. Hierzu sind verschiedene Konzepte bekannt.

[0003] Aus der optimalen Filtertheorie abgeleitet ist das Wiener-Komolgorov-Filter. (S.V. Vaseghi, Advanced Signal Processing and Digital Noise Reduction", John Wiley and Teubner-Verlag, 1996). Dieses Verfahren basiert auf der Minimierung des mittleren quadratischen Fehlers zwischen dem tatsächlichen und dem erwarteten Sprachsignal. Dieses Filterkonzept erfordert einen erheblichen Rechenaufwand. Außerdem ist wie bei meisten bekannten Verfahren ein stationäres Störsignal theoretische Voraussetzung.

[0004] Ein ähnliches Filterprinzip liegt dem Kalman-Filter zugrunde (E. Wan and A. Nelson, Removal of noise from speech using the Dual Extended Kalman Filter algorithm, Proceedings of the IEEE International Conference on Acoustics and Signal Processing (ICASSP'98), Seattle 1998). Nachteilig bei diesem Filterkonzept wirkt sich die lange Trainingszeit aus, die benötigt wird, um die Filterparameter zu ermitteln.

[0005] Ein weiteres Filterkonzept ist aus H. Hermansky and N. Morgan, RASTA processing of speech, IEEE Transactions on Speech and Audio Processing, Vol. 2, No. 4, p. 587, 1994, bekannt. Auch bei diesem Verfahren ist eine Trainingsprozedur erforderlich, außerdem erfordern unterschiedliche Störgeräusche verschiedene Parametereinstellungen.

[0006] Ein als LPC bekanntes Verfahren benötigt die aufwendige Berechnung von Korrelationsmatrizen, um mit Hilfe eines linearen Prädiktionsverfahrens Filterkoeffizienten zu berechnen, wie aus T. Arai, H. Hermansky, M. Paveland, C. Avendano, Intelligibility of Speech with Filtered Time Trajectories of LPC Cepstrum, The Journal of the Acoustical Society of Maerica, Vol. 100, No. 4, Pt. 2, p. 2756, 1996, bekannt ist.

[0007] Andere bekannte Verfahren setzen neuronale Netzwerke vom Typ eines mehrschichtigen Perzeptrons zur Sprachverstärkung ein, so wie in H. Hermansky, E. Wan, C. Avendano, Speech Enhancement Based on Temporal Processing. Proceedings of the IEEE International Conference on Acoustics and Signal Processing (ICASSP'95), Detroit, 1995, beschrieben.

[0008] Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zu schaffen, das mit geringem Rechenaufwand ein Sprachsignal an seinen zeitlichen und spektralen Eigenschaften erkennt und von Störgeräuschen befreit werden kann.

[0009] Gelöst wird diese Aufgabe dadurch, daß eine Minimadetektionsschicht, eine Reaktionsschicht, eine Diffusionsschicht und eine Integrationsschicht eine Filterfunktion F(f,T) zur Geräuschfilterung bestimmen.

[0010] Ein derart ausgelegtes Netzwerk erkennt ein Sprachsignal an seinen zeitlichen und spektralen Eigenschaften und befreit dieses von Störgeräuschen. Im Vergleich zu bekannten Verfahren ist der benötigte Rechenaufwand gering. Das Verfahren zeichnet sich durch eine besonders kurze Adaptionszeit aus, innerhalb derer sich das System auf die Art des Störgeräusches einstellt. Die Signalverzögerung bei der Verarbeitung des Signals ist sehr kurz, so daß das Filter im Echtzeitbetrieb für Telekommunikation einsatzfähig ist.

[0011] Weitere vorteilhafte Maßnahmen sind in den Unteransprüchen beschrieben. Die Erfindung ist in der beiliegenden Zeichnung dargestellt und wird nachfolgend näher beschrieben; es zeigt:
Figur 1
das Gesamtsystem zur Sprachfilterung;
Figur 2
ein eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und eine Integrations-Schicht enthaltendes neuronales Netzwerk;
Figur 3
ein Neuron der Minima-Detektions-Schicht, welche M(f,T) ermittelt;
Figur 4
ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion r[S(T-1)] aus dem Integralsignal S(T-1) und einem frei wählbaren Parameter K, welcher den Grad der Geräuschunterdrückung bestimmt, aus A(f,T) und M(f,T) das Relativspektrum R(f,T) ermittelt;
Figur 5
Neuronen der Diffusionsschicht, in welcher eine der Diffusion entsprechende, lokale Kopplung zwischen den Moden hergestellt wird;
Figur 6
ein Neuron der gezeigte Ausführung der Integrationsschicht;
Figur 7
ein Beispiel für Filtereigenschaften der Erfindung bei verschiedenen Einstellungen des Kontrollparameters K.


[0012] In der Figur 1 ist schematisch und beispielhaft ein Gesamtsystem zur Sprachfilterung dargestellt. Dieses besteht aus einer Samplingeinheit 10, die das geräuschbehaftete Sprachsignal in der Zeit t abtastet und diskretisiert und somit Samples x(t) erzeugt, die in der Zeit T zu Frames aus n Samples zusammengefaßt werden.

[0013] Von jedem Frame wird mittels Fouriertransformation das Spektrum A(f,T) zur Zeit T ermittelt und einer Filtereinheit 11 zugeführt, die mit Hilfe eines neuronalen Netzwerks, wie es in der Figur 2 dargestellt ist, eine Filterfunktion F(f,T) berechnet, mit der das Spektrum A(f,T) des Signals multipliziert wird, um das geräuschbefreite Spektrum B(f,T) zu erzeugen. Anschließend wird das so gefilterte Signal einer Syntheseeinheit (12) übergeben, die mittels inverser Fouriertransformation aus dem gefilterten Spektrum B(f,T) das geräuschbefreite Sprachsignal y(t) synthetisiert.

[0014] Die Figur 2 zeigt ein eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und eine Integrations-Schicht enthaltende neuronales Netzwerk, welches insbesondere Gegenstand der Erfindung ist und welchem das Spektrum A(f,T) des Eingangssignals zugeführt wird, woraus die Filterfunktion F(f,T) berechnet wird. Jeder der Moden des Spektrums, die sich durch die Frequenz f unterscheiden, entspricht dabei einem einzelnen Neuron pro Schicht des Netzwerks mit Ausnahme der Integrationsschicht. Die einzelnen Schichten werden in den folgenden Figuren genauer spezifiziert.

[0015] So zeigt Figur 3 ein Neuron der Minima-Detektions-Schicht, welche M(f,T) ermittelt. M(f,T) ist in der Mode mit Frequenz f das Minimum der über m Frames gemittelten Amplitude A(f,T) innerhalb eines Intervalls der Zeit T, welches der Länge von 1 Frames entspricht.

[0016] Figur 4 zeigt ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion r[S(T-1)] aus dem Integralsignal S(T-1), wie es in der Figur 6 im Detail dargestellt ist, und einem frei wählbaren Parameter K, welcher den Grad der Geräuschunterdrückung bestimmt, aus A(f,T) und M(f,T) das Relativspektrum R(f,T) ermittelt. R(f,T) hat einen Wert zwischen null und eins. Die Reaktionsschicht unterscheidet Sprache von Geräuschen anhand des zeitlichen Verhaltens des Signals.

[0017] Figur 5 zeigt ein Neuron der Diffusionsschicht, in welcher eine der Diffusion entsprechende, lokale Kopplung zwischen den Moden hergestellt wird. Die Diffusionskonstante D bestimmt dabei die Stärke der resultierenden Glättung über den Frequenzen f bei festgehaltener Zeit T. Die Diffusionsschicht bestimmt aus dem Relativsignal R(f,T) die eigentliche Filterfunktion F(f,T), mit der das Spektrum A(f,T) multipliziert wird, um Störgeräusche zu eliminieren. In der Diffusionsschicht wird Sprache von Geräuschen anhand spektraler Eigenschaften unterschieden.

[0018] Figur 6 zeigt das in der gewählten Ausführung der Erfindung einzige Neuron der Integrationsschicht, das die Filterfunktion F(f,T) bei festgehaltener Zeit T über die Frequenzen f integriert und das so erhaltene Integralsignal S(T) in die Reaktionsschicht zurückkoppelt, wie Figur 2 zeigt. Diese globale Kopplung sorgt dafür, daß bei hohem Störpegel stark gefiltert wird, während geräuschfreie Sprache unverfälscht übertragen wird.

[0019] Figur 7 zeigt beispielhafte Angaben der Filtereigenschaften der Erfindung für verschiedene Einstellungen des Kontrollparameters K. Die restlichen Parameter der Erfindung haben die Werte n=256 Samples/Frame, m=2.5 Frames, 1=15 Frames, D=0.25. Die Abbildung zeigt die Dämpfung von amplitudenmoduliertem weißen Rauschen in Abhängigkeit der Modulationsfrequenz. Bei Modulationsfrequenzen zwischen 0.6 Hz und 6 Hz beträgt die Dämpfung weniger als 3 dB. Dieses Intervall entspricht der typischen Modulation menschlicher Sprache.

[0020] Die Erfindung wird im folgenden anhand eines Ausführungsbeispiels näher erläutert. Zunächst wird ein Sprachsignal, das durch beliebige Störgeräusche beeinträchtigt sei, in einer Sampling-Einheit 10 abgetastet und digitalisiert, wie die Figur 1 zeigt. Auf diese Weise erhält man in der Zeit t die Samples x(t). Von diesen Samples werden jeweils n zu einem Frame zusammengefaßt, von dem zur Zeit T mittels Fouriertransformation ein Spektrum A(f,T) berechnet wird.

[0021] Die Moden des Spektrums unterscheiden sich durch ihre Frequenz f. In einer Filtereinheit 11 wird aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) erzeugt und mit dem Spektrum multipliziert. Dadurch erhält man das gefilterte Spektrum B(f,T), aus dem in einer Syntheseeinheit durch inverse Fouriertransformation das geräuschbefreite Sprachsignal y(t) erzeugt wird. Dieses kann nach Digital-Analog-Wandlung in einem Lautsprecher hörbar gemacht werden.

[0022] Die Filterfunktion F(f,T) wird von einem neuronalen Netzwerk erzeugt, das eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und eine Integrationsschicht enthält, wie Figur 2 zeigt. Das von der Samplingeinheit 10 erzeugte Spektrum A(f,T) wird zunächst der Minimadetektions-Schicht zugeführt, wie sie die Figur 3 zeigt.

[0023] Ein einzelnes Neuron dieser Schicht bearbeitet unabhängig von den anderen Neuronen der Minimadetektions-Schicht eine einzelne Mode, die durch die Frequenz f gekennzeichnet ist. Für diese Mode mittelt das Neuron die Amplituden A(f,T) in der Zeit T über m Frames. Von diesen gemittelten Amplituden bestimmt das Neuron sodann über einen Zeitraum in T, der der Länge von 1 Frames entspricht, für seine Mode das Minimum. Auf diese Weise erzeugen die Neuronen der Minimadetektionsschicht das Signal M(f,T), das sodann der Reaktionsschicht zugeführt wird.

[0024] Auch jedes Neuron der Reaktionsschicht, wie sie Figur 4 zeigt, bearbeitet eine einzelne Mode der Frequenz f, unabhängig von den anderen Neuronen in dieser Schicht. Dazu wird allen Neuronen außerdem ein extern einstellbarer Paramter K zugeführt, dessen Größe den Grad der Geräuschunterdrückung des gesamten Filters bestimmt Zusätzlich steht diesen Neuronen das Integralsignal S(T-1) vom vorigen Frame (Zeitpunkt T-1) zur Verfügung, das in der Integrations-Schicht, wie sie Figur 6 zeigt, berechnet wurde.

[0025] Dieses Signal ist das Argument einer nichtlinearen Reaktionsfunktion r, mit deren Hilfe die Neuronen der Reaktionsschicht das Relativspektrum R(f,T) zum Zeitpunkt T berechnen.

[0026] Der Wertebereich der Reaktionsfunktion ist auf ein Intervall [r1, r2] eingeschränkt. Der Wertebereich des auf diese Weise resultierenden Relativspektrums R(f,T) beschränkt sich auf das Intervall [0, 1].

[0027] In der Reaktionsschicht wird das zeitliche Verhalten des Sprachsignals zur Unterscheidung von Nutz- und Störsignal ausgewertet.

[0028] Spektrale Eigenschaften des Sprachsignals werden in der Diffusionsschicht, wie sie die Figur 5 zeigt, ausgewertet, deren Neuronen eine lokale Modenkopplung nach Art einer Diffusion im Frequenzraum durchführen.

[0029] In der von den Neuronen der Diffusions-Schicht erzeugten Filterfunktion F(f,T) führt dies zu einer Angleichung benachbarter Moden, deren Stärke durch die Diffusionskonstante D bestimmt wird. Ähnliche Mechanismen, wie sie in der Reaktions- und der Diffusionsschicht am Werke sind, führen in sogenannten dissipativen Medien zu Strukturbildungsphänomenen, die ein Forschungsgegenstand der nichtlinearen Physik sind.

[0030] Alle Moden der Filterfunktion F(f,T) werden zum Zeitpunkt T mit den entsprechenden Amplituden A(f,T) multipliziert. Auf diese Weise resultiert das von Störgeräuschen befreite Spektrum B(f,T), das mittels inverser Fouriertransformation in das geräuschbefreite Sprachsignal y(t) verwandelt wird. Über die Moden der Filterfunktion F(f,T) wird in der Integrations-Schicht integriert, so daß das Integralsignal S(T) resultiert, wie es Figur 6 zeigt.

[0031] Dieses Integralsignal wird in die Reaktions-Schicht zurückgekoppelt. Diese globale Kopplung führt dazu, daß die Stärke der Signalmanipulation im Filter vom Störpegel abhängig ist. Sprachsignale mit geringer Geräuschbelastung passieren das Filter praktisch unbeeinflußt, während bei hohem Geräuschpegel ein starker Filtereffekt wirksam wird. Dadurch unterscheidet sich die Erfindung von klassischen Bandpaßfiltern, deren Einfluß auf das Signal nur von den gewählten, fest vorgegebenen Parametern abhängig ist.

[0032] Anders als ein klassisches Filter besitzt der Gegenstand der Erfindung keinen Frequenzgang im herkömmlichen Sinne. Bei der Messung mit einem durchstimmbaren sinusförmigen Testsignal würde bereits die Modulationsgeschwindigkeit des Testsignals die Filtereigenschaften beeinflussen.

[0033] Ein geeignetes Verfahren zur Analyse der Eigenschaften des Filters benutzt ein amplitudenmoduliertes Rauschsignal, um in Abhängigkeit der Modulationsfrequenz die Dämpfung des Filters zu bestimmen, wie die Figur 7 zeigt. Dazu setzt man die eingangs- und ausgangsseitige mittlere integrale Leistung zueinander ins Verhältnis und trägt diesen Wert gegen die Modulationsfrequenz des Testsignals auf. In Figur 7 ist dieser "Modulationsgang" für verschiedene Werte des Kontrollparameters K dargestellt.

[0034] Für Modulationsfrequenzen zwischen 0.6 Hz und 6 Hz beträgt die Dämpfung für alle gezeigten Werte des Kontrollparameters K weniger als 3 dB. Dieses Intervall entspricht der Modulation menschlicher Sprache, die den Filter daher optimal passieren kann. Signale außerhalb des genannten Modulationsfrequenzintervalls werden dagegen als Störgeräusche identifiziert und in Abhängigkeit der Einstellung des Parameters K stark gedämpft.

Bezugszeichen



[0035] 
10
Samplingeinheit, die ein Sprachsignal x(t) abtastet, digitalisiert, in Frames zerlegt und durch Fouriertransformation das Spektrum A(f,T) ermittelt
11
Filtereinheit, die aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) berechnet und damit das geräuschbefreite Spektrum B(f,T) erzeugt
12
Syntheseeinheit, die aus dem gefilterten Spektrum B(f,T) das geräuschbefreite Sprachsignal y(t) erzeugt
A(f,T)
Signalspektrum, d.h. Amplitude der Mode der Frequenz f zum Zeitpunkt T
B(f,T)
spektrale Amplitude der Mode der Frequenz f zum Zeitpunkt T nach der Filterung
D
Diffusionskonstante, die die Stärke der Glättung in der Diffusions-Schicht bestimmt
F(f,T)
Filterfunktion, die B(f,T) aus A(f,T) erzeugt: B(f,T)=F(f,T)A(f,T) für alle f zur Zeit T
f
Frequenz, durch die sich die Moden eines Spektrums unterscheiden
K
Parameter zum Einstellen der Stärke der Geräuschunterdrückung.
l
Anzahl der Frames, aus denen man M(f,T) als Minimum der gemittelten A(f,T) erhält
m
Anzahl der Frames, über die bei der Bestimmung von M(f,T) gemittelt wird
n
Anzahl der Abtastwerte (Samples) pro Frame
M(f,T)
Minimum der über m Frames gemittelten Amplitude A(f,T) innerhalb von 1 Frames.
R(f,T)
Relativspektrum, das von der Reaktionsschicht erzeugt wird
r[S(T)]
Reaktionsfunktion der Neuronen in der Reaktionsschicht
r1, r2
Grenzen des Wertebereichs der Reaktionsfunktion r1<r(S(T))<r2
S(T)
Integralsignal, das dem Integral von F(f,T) über f zum Zeitpunkt T entspricht
t
Zeit in der das Sprachsignal abgetastet wird
T
Zeit in der das Zeitsignal zu Frames und diese zu Spektren verarbeitet werden
x(t)
Samples des geräuschbehafteten Sprachsignals
y(t)
Samples des geräuschbefreiten Sprachsignals



Ansprüche

1. Verfahren zur Geräuschunterdrückung bei der Sprachübertragung durch ein mehrschichtiges, selbstorganisierendes, rückgekoppeltes neuronales Netzwerk, dadurch gekennzeichnet, daß eine Minimadetektionsschicht, eine Reaktionsschicht, eine Diffusionsschicht und eine Integrationsschicht eine Filterfunktion F(f,T) zur Geräuschfilterung bestimmen.
 
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das mittels der Filterfunktion F(f,T) von Störgeräuschen befreite Spektrum B(f,T) mittels inverser Fouriertransformation in ein geräuschbefreites Sprachsignal y(t) verwandelt wird.
 
3. Verfahren nach den Ansprüchen 1 und 2, dadurch gekennzeichnet, daß die Signalverzögerung bei der Verarbeitung des Signals so kurz ist, daß das Filter im Echtzeitbetrieb für Telekommunikation einsatzfähig bleibt wird, wobei allen Neuronen ein extern einstellbarer Paramter K zugeführt wird, dessen Größe den Grad der Geräuschunterdrückung des gesamten Filters bestimmt.
 
4. Verfahren nach den Ansprüchen 1 bis 3, dadurch gekennzeichnet, daß das Neuron der Intergrationsschicht die Filterfunktion F(f,T) bei festgehaltener Zeit T über die Frequenzen f integriert und das so erhaltene Integralsignal S(T) in die Reaktionsschicht zurückkoppelt wird.
 
5. Verfahren nach den Ansprüchen 1 bis 4, dadurch gekennzeichnet, daß das von einer Samplingeinheit (10) erzeugte Spektrum A(f,T) der Minimadetektions-Schicht zugeführt wird.
 
6. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekennzeichnet, daß in einer Filtereinheit (11) aus dem Spektrum A(f,T) eine Filterfunktion F(f,T) erzeugt und mit dem Spektrum multipliziert wird.
 
7. Verfahren nach den Ansprüchen 1 bis 6, gekennzeichnet durch einen Frame mittels dem eine Fouriertransformiation das Spektrum A(f,T) zur Zeit T ermittelt und einer Filtereinheit (11) zugeführt wird, die mit Hilfe eines neuronalen Netzwerks eine Filterfunktion F(f,T) berechnet, mit der das Spektrum A(f,T) des Signals multipliziert wird, um ein geräuschbefreites Spektrum B(f,T) zu erzeugen.
 
8. Verfahren nach den Ansprüchen 1 bis 7, dadurch gekennzeichnet, daß das ein gefiltertes Signal einer Syntheseeinheit (12) übergeben wird, die mittels inverser Fouriertransformation aus dem gefilterten Spektrum B(f,T) ein geräuschbefreites Sprachsignal y(t) synthetisiert.
 
9. Verfahren nach den Ansprüchen 1 bis 8, dadurch gekennzeichnet, daß ein einzelnes Neuron einer Schicht unabhängig von den anderen Neuronen der Minimadetektions-Schicht eine einzelne Mode bearbeitet, die durch die Frequenz f gekennzeichnet ist.
 
10. Verfahren nach den Ansprüchen 1 bis 9, dadurch gekennzeichnet, daß die spektralen Eigenschaften des Sprachsignals in der Diffusionsschicht ausgewertet werden, deren Neuronen eine lokale Modenkopplung nach Art einer Diffusion im Frequenzraum durchführen.
 
11. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekennzeichnet, daß alle Moden der Filterfunktion F(f,T) zum Zeitpunkt T mit den entsprechenden Amplituden A(f,T) multipliziert werden.
 
12. Verfahren nach den Ansprüchen 1 bis 11, dadurch gekennzeichnet, daß über die Moden der Filterfunktion F(f,T) in der Integrations-Schicht integriert wird, so daß das Integralsignal S(T) resultiert.
 
13. Verfahren nach den Ansprüchen 1 bis 12, dadurch gekennzeichnet, daß Sprachsignale mit geringer Geräuschbelastung das Filter praktisch unbeeinflußt passieren, während bei Sprachsignalen mit hohem Geräuschpegel ein starker Filtereffekt wirksam wird.
 
14. Vorrichtung zur Geräuschunterdruckung bei der Sprachübertragung, insbesondere bei einem Verfahren nach den Ansprüchen 1 bis 13, dadurch gekennzeichnet, daß ein eine Minimadetektions-Schicht, eine Reaktions-Schicht, eine Diffusions-Schicht und eine Integrations-Schicht enthaltendes neuronales Netzwerk vorgesehen ist.
 
15. Vorrichtung nach Anspruch 13, dadurch gekennzeichnet, daß die Moden des Spektrums, die sich durch die Frequenz f unterscheiden, einen einzelnen Neuron pro Schicht des Netzwerks mit Ausnahme der Integrationsschicht entsprechen.
 
16. Vorrichtung nach den Ansprüchen 13 bis 15, dadurch gekennzeichnet, daß ein Neuron der Minima-Detektions-Schicht die Funktion M(f,T) ermittelt, wobei M(f,T) in der Mode mit Frequenz f das Minimum der über m Frames gemittelten Amplitude A(f,T) innerhalb eines Zeitintervalls ist, welches der Länge von 1 Frames entspricht.
 
17. Vorrichtung nach den Ansprüchen 13 bis 16, gekennzeichnet durch ein Neuron der Reaktions-Schicht, welches mit Hilfe einer Reaktionsfunktion r[S(T-1)] aus dem Integralsignal S(T-1) und einem frei wählbaren Parameter K, welcher den Grad der Geräuschunterdrückung bestimmt, aus A(f,T) und M(f,T) das Relativspektrum R(f,T) ermittelt, wobei das Relativspektrum R(f,T) einen Wertebereich zwischen null und eins hat.
 
18. Vorrichtung nach den Ansprüchen 13 bis 17, dadurch gekennzeichnet, daß den Neuronen ein in der Integrations-Schicht berechnetes Integralsignal S(T-1) vom vorigen Frame (Zeitpunkt T-1) zur Verfügung steht.
 
19. Vorrichtung nach den Ansprüchen 13 bis 18, dadurch gekennzeichnet, daß der Wertebereich der Reaktionsfunktion auf ein Intervall [r1, r2] eingeschränkt ist, wobei der Wertebereich des resultierenden Relativspektrums R(f,T) auf das Intervall [0, 1] beschränkt ist.
 
20. Vorrichtung nach den Ansprüchen 13 bis 19, dadurch gekennzeichnet, daß für Modulationsfrequenzen zwischen 0.6 Hz und 6 Hz die Dämpfung für alle gezeigten Werte des Kontrollparameters K weniger als 3 dB beträgt.
 




Zeichnung