(19)
(11) EP 0 411 360 A1

(12) EUROPÄISCHE PATENTANMELDUNG

(43) Veröffentlichungstag:
06.02.1991  Patentblatt  1991/06

(21) Anmeldenummer: 90113320.7

(22) Anmeldetag:  12.07.1990
(51) Internationale Patentklassifikation (IPC)5G10L 3/02
(84) Benannte Vertragsstaaten:
DE FR GB IT SE

(30) Priorität: 02.08.1989 DE 3925589

(71) Anmelder: Blaupunkt-Werke GmbH
D-31132 Hildesheim (DE)

(72) Erfinder:
  • Kässer, Jürgen, Dr.
    D-3201 Diekholzen (DE)


(56) Entgegenhaltungen: : 
   
       


    (54) Verfahren und Anordnung zur Störbefreiung von Sprachsignalen


    (57) Bei einem Verfahren und einer Anordnung zur Störbefreiung von Sprachsignalen zu Zwecken der Spracherkennung, wobei die Sprache zusammen mit anderen Schallereignissen in ein elektrisches Signal (Summensignal) umgewandelt wird und wobei die anderen Schallereignisse von einem durch elektro-akustische Wandlung eines Audiosignals entstandenen Schallereignis und Geräuschen bestehen, werden ferner die Geräusche aufgenommen und in ein Geräuschsignal umgewandelt. Das Geräuschsignal und das Audiosignal werden über adaptive Filter geleitet und von dem Summensignal subtrahiert. Das resultierende Signal wird einerseits mit dem Geräuschsignal und andererseits mit dem Audiosignal verglichen. Die Vergleichsergebnisse werden zur Steuerung der adaptiven Filter verwendet.




    Beschreibung


    [0001] Die Erfindung geht aus von einem Verfahren nach der Gattung des Hauptanspruchs und umfaßt ferner eine Anordnung zur Durchführung des erfindungsgemäßen Verfahrens.

    [0002] Zur Erkennung von Sprache sind verschiedene Verfahren bekannt, bei denen jedoch die Erkennungssicherheit durch Hintergrundgeräusche beeinträchtigt wird. Derartige störende Schallereignisse treten beispielsweise in einem fahrenden Kraftfahrzeug auf, in welchem außerdem noch das Autoradio eingeschaltet ist.

    [0003] Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zur Störbefreiung von Sprachsignalen und eine Schaltungsanordnung zur Durchführung dieses Verfahrens anzugeben, wonach die Sprachsignale einer geeigneten Spracherkennungsanordnung zugeführt werden können.

    [0004] Das erfindungsgemäße Verfahren mit den kennzeichnenden Merkmalen des Hauptanspruchs hat den Vorteil, daß die durch auftretende störende Schallereignisse erzeugten Störsignale mit hoher Sicherheit unterdrückt werden. Die zur Durchführung des erfindungsgemäßen Verfahrens erforderlichen Anordnungen können mit Mitteln der modernen Halbleitertechnik in einfacher Weise realisiert werden.

    [0005] Durch die in den Unteransprüchen aufgeführten Maßnahmen sind vorteilhafte Weiterbildungen und Verbesserungen der im Hauptanspruch angegebenen Erfindung und vorteilhafte Anordnungen zur Durchführung des erfindungsgemäßen Verfahrens möglich.

    [0006] Ein Ausführungsbeispiel der Erfindung ist in der Zeichnung anhand mehrerer Figuren dargestellt und in der nachfolgenden Beschreibung näher erläutert. Es zeigt:

    Fig. 1 eine schematische Darstellung einer erfindungsgemäßen Anordnung in einem Kraftfahrzeug und

    Fig. 2 ein Blockschaltbild einer erfindungsgemäßen Anordnung.



    [0007] Gleiche Teile sind in den Figuren mit gleichen Bezugszeichen versehen.

    [0008] In Fig. 1 sind von einem Kraftfahrzeug lediglich je ein Teil des Fahrgastraums 1 und des Motorraums 2 dargestellt. Ein Mikrofon 3 ist im Fahrgastraum, beispielsweise oberhalb der Windschutzscheibe, angeordnet und nimmt Sprache, Fahrgeräusche und Schall von einem Autoradio 5 auf, der von einem Lautsprecher 4 abgestrahlt wird. Das vom Mikrofon 3 abgegebene Summensignal Σ(t) wird einer Anordnung 6 zur Durchführung des erfindungsgemäßen Verfahrens zugeführt, an deren Ausgang 7 das weitgehend von Störungen befreite Sprachsignal D₂(t) abnehmbar ist.

    [0009] Ein weiteres Mikrofon 8 ist im Motorraum 2 angeordnet, nimmt Fahrgeräusche auf und leitet diese als Signal F(t) an die Anordnung 6 weiter. Schließlich wird das dem Lautsprecher 4 zugeführte Audiosignal als Signal A(t) ebenfalls der Anordnung 6 zugeleitet. Falls keine monaurale Wiedergabe beim Autoradio vorgesehen ist, können mehrere Audiosignale A(t) abgenommen und der Anordnung 6 zugeführt werden.

    [0010] Bei den folgenden Betrachtungen werden die jeweiligen akustischen und elektrischen Signale gleichgesetzt. Das infolge der Schallabstrahlung des Lautsprechers 4 vom Mikrofon 3 aufgenommene Signal unterscheidet sich vom Signal A(t) durch eine zunächst unbekannte Übertragungsfunktion. Das auf das Mikrofon 3 einwirkende vom Lautsprecher 4 stammende Signal wird daher als A₁(t) bezeichnet. In ähnlicher Weise unterscheidet sich das vom Mikrofon 3 aufgenommene Fahrgeräusch F₁(t) von dem durch das Mikrofon 8 aufgenommenen Fahrgeräusch F(t). Das Summensignal ergibt sich somit zu Σ(t) = S(t) + F₁(t) + A₁(t).

    [0011] Die Anteile des Summensignals F₁(t) und A₁(t) sind A₁(t) = HA x A(t) und F₁(t) = HF x F(t), wobei HA und HF die entsprechenden Übertragungsfunktionen sind und x eine Faltung bedeutet.

    [0012] Um die Anteile F₁(t) und A₁(t) aus dem Summensignal zu entfernen, ist eine Kenntnis der zunächst unbekannten Funktionen HF und HA erforderlich. Hierzu dienen adaptive Filter, die in der Anordnung nach Fig. 2 vorgesehen sind. Die Signale Σ(t) und F(t) werden von den Mikrofonen 3, 8 über geeignete Verstärker 11, 12 und Tiefpaßfilter 13, 14 Analog/Digital-Wandlern 15, 16 zugeführt. Das Audiosignal A(t) wird ebenfalls über ein Tiefpaßfilter 17 einem Analog/Digital-Wandler 18 zugeleitet. Die Tiefpaßfilter begrenzen die Bandbreite der Signale auf einen Wert, der für das nachgeschaltete Spracherkennungssystem notwendig ist.

    [0013] Ein erstes adaptives Filter 19 dient zusammen mit einem Korrelator 20 zur Ableitung des Signals A₁(t) aus dem Signal A(t). In einem Subtrahierer 21 wird dann das Signal A₁(t) von dem Summensignal Σ(t) subtrahiert, wodurch das Signal D₁(t) entsteht.

    [0014] Ein weiteres adaptives Filter 22 und ein Korrelator 23 sind zur Ableitung des Signals F₁(t) aus dem Signal F(t) vorgesehen. Mit Hilfe eines weiteren Subtrahierers 24 wird das Signal F₁(t) von dem Signal D₁(t) subtrahiert. Am Ausgang 7 steht somit das Signal D₂(t) zur Weiterleitung an ein Spracherkennungssystem zur Verfügung.

    [0015] Das adaptive Filter 19 ist ein nichtrekursives Filter der Ordnung ungefähr 100 mit der Zielfunktion
    Z₁(t) = (Σ(t)-HAZ x A) ■ A(t) = 0 für HAZ = HA,      (1)
    wobei ■ a die Korrelationsfunktion bedeutet. Die Zielfunktion nutzt aus, daß für das richtige HAZ das Signal [S(t) + F₁(t)] unkorreliert zum Audiosignal A(t) ist.

    [0016] Die Berechnung der Filterkoeffizienten im einzelnen kann nach Standardverfahren der digitalen Signalverarbeitung erfolgen, wie sie beispielsweise im Aufsatz "Adaptive Noise Cancelling: Principles and Applications", Proceedings of the IEEE, Vol. 63, No. 12, December 1975, Seiten 1692 bis 1716 beschrieben sind. Die adaptiven Filter und die Korrelatoren können mit geeignet programmierten Signalprozessoren realisiert werden.

    [0017] Das Ausgangssignal D₁(t) des Subtrahierers 21 wird sowohl im Korrelator 20 verwendet als auch dem weiteren Subtrahierer 24 zugeführt. Es ergibt sich zu D₁(t) = Σ(t) - HAZ x A(t).

    [0018] Zur Bestimmung von HF wird das bereits von den Audiosignalen befreite Signal D₁(t) verwendet, welches sich aus Fahrgeräusch und Sprache zusammensetzt. Diese sind ebenfalls unkorreliert, so daß sich das für das Audiosignal verwendete Verfahren auch für das Geräuschsignal anwenden läßt. Dabei ist die Zielfunktion
    Z₂(t) = [(D₁(t) - HFZ x F(t)] ■ F(t) = 0 für HFZ = HF(t)      (2)

    [0019] Das Ausgangssignal des Subtrahieres 24 wird dann
    D₂(t) = S(t) + (HF-HFZ)xF(t) + [(HA-HAZ)xA(t)] x F(t)      (3)

    [0020] Aus Gleichung (3) ist ersichtlich, daß sich das Ausgangssignal D₂(t) umso mehr dem Signal S(t) nähert, je besser die Annäherung von HFZ an HF bzw. HAZ an HA erfolgt. Auch bei einer nicht vollständigen Annäherung erfolgt eine deutliche Reduzierung des Störanteils.


    Ansprüche

    1. Verfahren zur Störbefreiung von Sprachsignalen zu Zwecken der Spracherkennung, wobei die Sprache zusammen mit anderen Schallereignissen in ein elektrisches Signal (Summensignal) umgewandelt wird und wobei die anderen Schallereignisse von einem durch elektro-akustische Wandlung eines Audiosignals entstandenen Schallereignis und Geräuschen bestehen, dadurch gekennzeichnet, daß ferner die Geräusche aufgenommen und in ein Geräuschsignal umgewandelt werden,
    daß das Geräuschsignal und das Audiosignal über adaptive Filter geleitet und von dem Summensignal subtrahiert werden,
    daß das resultierende Signal einerseits mit dem Geräuschsignal und andererseits mit dem Audiosignal verglichen wird und
    daß die Vergleichsergebnisse zur Steuerung der adaptiven Filter verwendet werden.
     
    2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Geräusche an ihrem Ursprung aufgenommen werden.
     
    3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Audiosignal, das Geräuschsignal und das Summensignal zuvor tiefpaßgefiltert und analog/digital-gewandelt werden.
     
    4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß in einem Kraftfahrzeug das Geräusch außerhalb des Fahrgastraums, die Sprache und die anderen Schallereignisse im Fahrgastraum aufgenommen werden und daß das Audiosignal einer Audiosignalquelle (Autoradio, Kassettenspieler, CD-Spieler) entnommen wird.
     
    5. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, dadurch gekennzeichnet, daß zum Vergleich des resultierenden Signals mit dem Audiosignal bzw. mit dem Geräuschsignal Korrelatoren (20, 23) vorgesehen sind.
     
    6. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß das Summensignal von einem Mikrofon (3) im Fahrgastraum eines Kraftfahrzeugs über einen Verstärker (11) und einen Analog/Digital-Wandler (15) Mitteln (21, 24) zur Subtraktion anderer Signale vom Summensignal zuführbar ist
    daß das Audiosignal über einen weiteren Analog/Digital-Wandler (18) einem ersten adaptiven Filter (19) und einem ersten Korrelator (20) zuführbar ist, welcher das erste adaptive Filter (19) steuert und welchem ferner die Differenz zwischen dem Summensignal und dem Ausgangssignal des ersten adaptiven Filters (19) zuführbar ist, und
    daß das Geräuschsignal von einem weiteren, außerhalb des Fahrgastraums angeordneten Mikrofon (8) über einen weiteren Verstärker (12) und einen dritten Analog/Digital-Wandler (16) einem zweiten adaptiven Filter (22) und einem zweiten Korrelator (23) zuführbar ist, welcher das zweite adaptive Filter (22) steuert und welchem ferner die Differenz zwischen dem Summensignal und mindestens dem Ausgangssignal des zweiten adaptiven Filters zuführbar ist.
     
    7. Anordnung nach Anspruch 6, dadurch gekennzeichnet, daß den Analog/Digital-Wandlern (15, 16, 18) Tiefpaßfilter (13, 14, 17) vorgeschaltet sind.
     
    8. Anordnung nach Anspruch 5, dadurch gekennzeichnet, daß die adaptiven Filter (19, 22) nichtrekursive Filter sind.
     
    9. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß die Ordnung der adaptiven Filter etwa 100 beträgt.
     




    Zeichnung







    Recherchenbericht