[0001] Die Erfindung geht aus von einem Verfahren nach der Gattung des Hauptanspruchs und
umfaßt ferner eine Anordnung zur Durchführung des erfindungsgemäßen Verfahrens.
[0002] Zur Erkennung von Sprache sind verschiedene Verfahren bekannt, bei denen jedoch die
Erkennungssicherheit durch Hintergrundgeräusche beeinträchtigt wird. Derartige störende
Schallereignisse treten beispielsweise in einem fahrenden Kraftfahrzeug auf, in welchem
außerdem noch das Autoradio eingeschaltet ist.
[0003] Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Störbefreiung von Sprachsignalen
und eine Schaltungsanordnung zur Durchführung dieses Verfahrens anzugeben, wonach
die Sprachsignale einer geeigneten Spracherkennungsanordnung zugeführt werden können.
[0004] Das erfindungsgemäße Verfahren mit den kennzeichnenden Merkmalen des Hauptanspruchs
hat den Vorteil, daß die durch auftretende störende Schallereignisse erzeugten Störsignale
mit hoher Sicherheit unterdrückt werden. Die zur Durchführung des erfindungsgemäßen
Verfahrens erforderlichen Anordnungen können mit Mitteln der modernen Halbleitertechnik
in einfacher Weise realisiert werden.
[0005] Durch die in den Unteransprüchen aufgeführten Maßnahmen sind vorteilhafte Weiterbildungen
und Verbesserungen der im Hauptanspruch angegebenen Erfindung und vorteilhafte Anordnungen
zur Durchführung des erfindungsgemäßen Verfahrens möglich.
[0006] Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung anhand mehrerer Figuren
dargestellt und in der nachfolgenden Beschreibung näher erläutert. Es zeigt:
Fig. 1 eine schematische Darstellung einer erfindungsgemäßen Anordnung in einem Kraftfahrzeug
und
Fig. 2 ein Blockschaltbild einer erfindungsgemäßen Anordnung.
[0007] Gleiche Teile sind in den Figuren mit gleichen Bezugszeichen versehen.
[0008] In Fig. 1 sind von einem Kraftfahrzeug lediglich je ein Teil des Fahrgastraums 1
und des Motorraums 2 dargestellt. Ein Mikrofon 3 ist im Fahrgastraum, beispielsweise
oberhalb der Windschutzscheibe, angeordnet und nimmt Sprache, Fahrgeräusche und Schall
von einem Autoradio 5 auf, der von einem Lautsprecher 4 abgestrahlt wird. Das vom
Mikrofon 3 abgegebene Summensignal Σ(t) wird einer Anordnung 6 zur Durchführung des
erfindungsgemäßen Verfahrens zugeführt, an deren Ausgang 7 das weitgehend von Störungen
befreite Sprachsignal D₂(t) abnehmbar ist.
[0009] Ein weiteres Mikrofon 8 ist im Motorraum 2 angeordnet, nimmt Fahrgeräusche auf und
leitet diese als Signal F(t) an die Anordnung 6 weiter. Schließlich wird das dem Lautsprecher
4 zugeführte Audiosignal als Signal A(t) ebenfalls der Anordnung 6 zugeleitet. Falls
keine monaurale Wiedergabe beim Autoradio vorgesehen ist, können mehrere Audiosignale
A(t) abgenommen und der Anordnung 6 zugeführt werden.
[0010] Bei den folgenden Betrachtungen werden die jeweiligen akustischen und elektrischen
Signale gleichgesetzt. Das infolge der Schallabstrahlung des Lautsprechers 4 vom Mikrofon
3 aufgenommene Signal unterscheidet sich vom Signal A(t) durch eine zunächst unbekannte
Übertragungsfunktion. Das auf das Mikrofon 3 einwirkende vom Lautsprecher 4 stammende
Signal wird daher als A₁(t) bezeichnet. In ähnlicher Weise unterscheidet sich das
vom Mikrofon 3 aufgenommene Fahrgeräusch F₁(t) von dem durch das Mikrofon 8 aufgenommenen
Fahrgeräusch F(t). Das Summensignal ergibt sich somit zu Σ(t) = S(t) + F₁(t) + A₁(t).
[0011] Die Anteile des Summensignals F₁(t) und A₁(t) sind A₁(t) = H
A x A(t) und F₁(t) = H
F x F(t), wobei H
A und H
F die entsprechenden Übertragungsfunktionen sind und x eine Faltung bedeutet.
[0012] Um die Anteile F₁(t) und A₁(t) aus dem Summensignal zu entfernen, ist eine Kenntnis
der zunächst unbekannten Funktionen H
F und H
A erforderlich. Hierzu dienen adaptive Filter, die in der Anordnung nach Fig. 2 vorgesehen
sind. Die Signale Σ(t) und F(t) werden von den Mikrofonen 3, 8 über geeignete Verstärker
11, 12 und Tiefpaßfilter 13, 14 Analog/Digital-Wandlern 15, 16 zugeführt. Das Audiosignal
A(t) wird ebenfalls über ein Tiefpaßfilter 17 einem Analog/Digital-Wandler 18 zugeleitet.
Die Tiefpaßfilter begrenzen die Bandbreite der Signale auf einen Wert, der für das
nachgeschaltete Spracherkennungssystem notwendig ist.
[0013] Ein erstes adaptives Filter 19 dient zusammen mit einem Korrelator 20 zur Ableitung
des Signals A₁(t) aus dem Signal A(t). In einem Subtrahierer 21 wird dann das Signal
A₁(t) von dem Summensignal Σ(t) subtrahiert, wodurch das Signal D₁(t) entsteht.
[0014] Ein weiteres adaptives Filter 22 und ein Korrelator 23 sind zur Ableitung des Signals
F₁(t) aus dem Signal F(t) vorgesehen. Mit Hilfe eines weiteren Subtrahierers 24 wird
das Signal F₁(t) von dem Signal D₁(t) subtrahiert. Am Ausgang 7 steht somit das Signal
D₂(t) zur Weiterleitung an ein Spracherkennungssystem zur Verfügung.
[0015] Das adaptive Filter 19 ist ein nichtrekursives Filter der Ordnung ungefähr 100 mit
der Zielfunktion
Z₁(t) = (Σ(t)-H
AZ x A) ■ A(t) = 0 für H
AZ = H
A, (1)
wobei ■ a die Korrelationsfunktion bedeutet. Die Zielfunktion nutzt aus, daß für das
richtige H
AZ das Signal [S(t) + F₁(t)] unkorreliert zum Audiosignal A(t) ist.
[0016] Die Berechnung der Filterkoeffizienten im einzelnen kann nach Standardverfahren der
digitalen Signalverarbeitung erfolgen, wie sie beispielsweise im Aufsatz "Adaptive
Noise Cancelling: Principles and Applications", Proceedings of the IEEE, Vol. 63,
No. 12, December 1975, Seiten 1692 bis 1716 beschrieben sind. Die adaptiven Filter
und die Korrelatoren können mit geeignet programmierten Signalprozessoren realisiert
werden.
[0017] Das Ausgangssignal D₁(t) des Subtrahierers 21 wird sowohl im Korrelator 20 verwendet
als auch dem weiteren Subtrahierer 24 zugeführt. Es ergibt sich zu D₁(t) = Σ(t) -
H
AZ x A(t).
[0018] Zur Bestimmung von H
F wird das bereits von den Audiosignalen befreite Signal D₁(t) verwendet, welches sich
aus Fahrgeräusch und Sprache zusammensetzt. Diese sind ebenfalls unkorreliert, so
daß sich das für das Audiosignal verwendete Verfahren auch für das Geräuschsignal
anwenden läßt. Dabei ist die Zielfunktion
Z₂(t) = [(D₁(t) - H
FZ x F(t)] ■ F(t) = 0 für H
FZ = H
F(t) (2)
[0019] Das Ausgangssignal des Subtrahieres 24 wird dann
D₂(t) = S(t) + (H
F-H
FZ)xF(t) + [(H
A-H
AZ)xA(t)] x F(t) (3)
[0020] Aus Gleichung (3) ist ersichtlich, daß sich das Ausgangssignal D₂(t) umso mehr dem
Signal S(t) nähert, je besser die Annäherung von H
FZ an H
F bzw. H
AZ an H
A erfolgt. Auch bei einer nicht vollständigen Annäherung erfolgt eine deutliche Reduzierung
des Störanteils.
1. Verfahren zur Störbefreiung von Sprachsignalen zu Zwecken der Spracherkennung,
wobei die Sprache zusammen mit anderen Schallereignissen in ein elektrisches Signal
(Summensignal) umgewandelt wird und wobei die anderen Schallereignisse von einem durch
elektro-akustische Wandlung eines Audiosignals entstandenen Schallereignis und Geräuschen
bestehen, dadurch gekennzeichnet, daß ferner die Geräusche aufgenommen und in ein
Geräuschsignal umgewandelt werden,
daß das Geräuschsignal und das Audiosignal über adaptive Filter geleitet und von dem
Summensignal subtrahiert werden,
daß das resultierende Signal einerseits mit dem Geräuschsignal und andererseits mit
dem Audiosignal verglichen wird und
daß die Vergleichsergebnisse zur Steuerung der adaptiven Filter verwendet werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Geräusche an ihrem Ursprung
aufgenommen werden.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Audiosignal, das Geräuschsignal
und das Summensignal zuvor tiefpaßgefiltert und analog/digital-gewandelt werden.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß in einem Kraftfahrzeug das
Geräusch außerhalb des Fahrgastraums, die Sprache und die anderen Schallereignisse
im Fahrgastraum aufgenommen werden und daß das Audiosignal einer Audiosignalquelle
(Autoradio, Kassettenspieler, CD-Spieler) entnommen wird.
5. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, dadurch gekennzeichnet,
daß zum Vergleich des resultierenden Signals mit dem Audiosignal bzw. mit dem Geräuschsignal
Korrelatoren (20, 23) vorgesehen sind.
6. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß das Summensignal von einem
Mikrofon (3) im Fahrgastraum eines Kraftfahrzeugs über einen Verstärker (11) und einen
Analog/Digital-Wandler (15) Mitteln (21, 24) zur Subtraktion anderer Signale vom Summensignal
zuführbar ist
daß das Audiosignal über einen weiteren Analog/Digital-Wandler (18) einem ersten adaptiven
Filter (19) und einem ersten Korrelator (20) zuführbar ist, welcher das erste adaptive
Filter (19) steuert und welchem ferner die Differenz zwischen dem Summensignal und
dem Ausgangssignal des ersten adaptiven Filters (19) zuführbar ist, und
daß das Geräuschsignal von einem weiteren, außerhalb des Fahrgastraums angeordneten
Mikrofon (8) über einen weiteren Verstärker (12) und einen dritten Analog/Digital-Wandler
(16) einem zweiten adaptiven Filter (22) und einem zweiten Korrelator (23) zuführbar
ist, welcher das zweite adaptive Filter (22) steuert und welchem ferner die Differenz
zwischen dem Summensignal und mindestens dem Ausgangssignal des zweiten adaptiven
Filters zuführbar ist.
7. Anordnung nach Anspruch 6, dadurch gekennzeichnet, daß den Analog/Digital-Wandlern
(15, 16, 18) Tiefpaßfilter (13, 14, 17) vorgeschaltet sind.
8. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß die adaptiven Filter (19,
22) nichtrekursive Filter sind.
9. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß die Ordnung der adaptiven
Filter etwa 100 beträgt.