Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen

(19)

(11)

EP 0 957 471 B1

(12)	EUROPÄISCHE PATENTSCHRIFT

(45)	Hinweis auf die Patenterteilung:
	01.02.2006 Patentblatt 2006/05

(21)	Anmeldenummer: 99106223.3

(22)	Anmeldetag: 12.04.1999

(51)

Internationale Patentklassifikation (IPC):

G10L 19/00^(2006.01)

(54)	Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen Measuring process for loudness quality assessment of audio signals Procédé d'évaluation de la qualité de la correction physiologique de signaux audio

(84)	Benannte Vertragsstaaten:
	AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

(30)

Priorität:

13.05.1998 DE 19821273

(43)	Veröffentlichungstag der Anmeldung:
	17.11.1999 Patentblatt 1999/46

(73)	Patentinhaber: Deutsche Telekom AG
	53113 Bonn (DE)

(72)	Erfinder:
	Thiede, Thilo 10715 Berlin (DE)

(56)

Entgegenhaltungen: :

EP-A2- 0 417 739

US-A- 4 860 360

HANSEN M ET AL: "Using a quantitative psychoacoustical signal representation for objective speech quality measurement" ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1997. ICASSP-97., 1997 IEEE INTERNATIONAL CONFERENCE ON MUNICH, GERMANY 21-24 APRIL 1997, LOS ALAMITOS, CA, USA,IEEE COMPUT. SOC, US, 21. April 1997 (1997-04-21), Seiten 1387-1390, XP010226062 ISBN: 0-8186-7919-0
BRANDENBURG K ET AL: "NMR AND MASKING FLAG: EVALUATION OF QUALITY USING PERCEPTUAL CRITERIA" PROCEEDINGS OF THE INTERNATIONAL TEST AND MEASUREMENT CONFERENCE. PORTLAND, MAY 21 - 31, 1992, NEW YORK, AES, US, Bd. CONF. 11, 29. Mai 1992 (1992-05-29), Seiten 169-179, XP000300175

Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen).

Beschreibung

[0001] Die Erfindung betrifft ein Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen nach dem Oberbegriff des Patentanspruchs 1.

[0002] Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen sind grundsätzlich bekannt. Die grundsätzliche Struktur eines solchen Messverfahrens besteht in der Abbildung der Eingangssignale auf eine gehörgerechte Zeit-Frequenz-Repräsentation, einem Vergleich dieser Darstellung und der Berechnung von Einzelzahlwerten zur Abschätzung der wahrnehmbaren Störungen. Hierzu wird auf folgende Veröffentlichungen verwiesen:

Schroeder, M.R.; Atal, B. S.; Hall, J.L: Optimizing digital speech coders by exploiting masking properties of the human ear. J. Acoust. Soc. Am., Vol. 66 (1979), No. 6, December, Seiten 1647 - 1652.

Beerends, J.G.; Stemerdink, J.A.: A Perceptual Audio Quality Measure Based on a Psychoacoustic Sound Representation. J. AES, Voi. 40 (1992), No. 12, December, Seiten 963 - 978.

Brandenburg, K.H.; Sporer, Th.: NMR* and Masking Flag: Evaluation of Quality Using Perceptual Criteria. Proceedings of the AES 11th International Conference, Portland, Oregon, USA, 1992, Seiten 169-179.

[0003] Wie aus diesen Veröffentlichungen hervorgeht, benutzen die für die Beurteilung von codierten Audiosignalen verwendeten Modelle jedoch FFT Algorithmen und erfordern daher eine Umrechnung von der durch die FFT vorgegebenen linearen Frequenzeinteilung auf eine gehörgerechte Frequenzeinteilung. Dadurch ist die zeitliche Auflösung suboptimal. Außerdem erfolgt die Faltung mit Verschmierungsfunktion nach der Gleichrichtung bzw. Betragsbildung.

[0004] Aus der Fachveröffentlichung Hansen et. Al. "Using a qualitative Psychoacoustical Signal representation for Objective Speech Quality Measurements" ICASSP' 97, S. 1387 - 1390, ist ein Meßverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mit Hilfe von Filtern bzw. einer Filterbank bekannt. Das Signal wird in 19 Frequenzbänder von 350 Hz - 3500 Hz aufgeteilt.

[0005] Der Erfindung liegt die Aufgabe zugrunde, ein objektives Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mittels neuer schneller Algorithmen zur Berechnung linearphasiger Filter zu schaffen, wobei die Laufzeit der hörbaren Störungen unter Berücksichtigung der zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen berechnet und eine gehörangepasste Filterbank verwendet werden soll, wodurch eine optimale zeitliche Auflösung erreicht werden soll und zwar bei signifikanter Einsparung von Rechenzeit gegenüber anderen Filterbänken. Die erfindungsgemäße Lösung der Aufgabe ist im Kennzeichen des Patentanspruchs 1 charakterisiert.

[0006] Weitere Lösungen bzw. Ausgestaltungen der Erfindung sind in den Patentansprüchen 2 bis 23 charakterisiert.

[0007] Ein wesentlicher Vorteil des erfindungsgemäßen Verfahrens besteht darin, dass ein genaueres Gehörmodell erzielt wird, da hörbare Störungen unter Berücksichtigung der zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen berechnet werden.

[0008] Außerdem wird eine gehörangepasste Filterbank verwendet, wodurch eine optimale zeitliche Auflösung erreicht wird, und das zeitliche Verhalten der Filter (Impulsantwort u.s.w.) direkt mit der Pegelabhängigkeit der Übertragungsfunktionen korrespondiert. Die Phaseninformation in den Filterkanälen bleibt erhalten. Wie bereits ausgeführt, erfolgt bei den bisher bekannten Lösungen die Faltung mit Verschmierfunktion erst nach der Gleichrichtung bzw. Betragsbildung. Eine Signalabhängigkeit der Filtercharakteristiken wird dadurch erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer pegelabhängigen Verschmierfunktion im Frequenzbereich gefaltet werden.

[0009] Dadurch, dass ein neuer schneller Algorithmus zur rekursiven Berechnung linearphasiger Filter verwendet wird, ergibt sich eine wesentliche Einsparung an Rechenzeit, ein einfacher Entwurf und Filter, die leichter variierbar als die bisher angewandten konventionellen rekursiven Filter sind.

[0010] Im Originalsignal vorhandene und lediglich in ihrer spektralen Verteilung veränderten Signalanteile werden von additiven bzw. von durch Nichtlinearitäten erzeugten Störungen getrennt, wobei die Trennung durch Auswertung der Orthogonalitätsbeziehung zwischen den zeitlichen Verläufen der Hüllkurven an einander entsprechenden Filterausgängen des zu bewertenden Signals und des Originalsignals erfolgt. Die Trennung dieser Störanteile entspricht besser dem tatsächlichen Höreindruck.

[0011] Der Filterbankalgorithmus wird in folgender Weise realisiert:

Aus jedem einlaufendem Impuls wird durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt.

Die zu einem Eingangsimpuls gehörende Sinusschwingung wird durch Subtraktion des um dem Kehrwert der gewünschten Filterbandbreite entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangsimpuls wieder abgebrochen.

Durch Faltung im Frequenzbereich wird durch gewichtete Summation von je n Filterausgängen gleicher Bandbreite und um jeweils eine Periode versetzter Mittenfrequenz aus dem nach Schritt 2 resultierendem sin(x)/x-förmigen Dämpfungsverlauf ein der Fouriertransformierten eines cos^(n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt. Hierdurch kann der Dämpfungsverlauf in der Umgebung der Filtermittenfrequenzen geformt und eine ausreichend hohe Sperrdämpfung ermöglicht werden.
Der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz kann durch eine weitere Faltung im Frequenzbereich bestimmt werden (Übergang zwischen Durchlaßbereich und Sperrbereich).

[0012] Weitere Vorteile, Merkmale und Anwendungsmöglichkeiten der vorliegenden Erfindung ergeben sich aus der nachfolgenden Beschreibung in Verbindung mit den in der Zeichnung dargestellten Ausführungsbeispielen.

[0013] Die Erfindung wird im folgenden anhand von in den Zeichnungen dargestellten Ausführungsbeispielen näher beschrieben. In der Beschreibung, in den Patentansprüchen, der Zusammenfassung und in der Zeichnung werden die in der hinten angeführten Liste der Bezugszeichen verwendeten Begriffe und zugeordneten Bezugszeichen verwendet.

[0014] In den Zeichnungen bedeuten:

Fig. 1: eine Struktur des Meßverfahrens und
Fig. 2: eine Filterstruktur.

[0015] Das vorliegende Meßverfahren bewertet die Störungen eines Audiosignals durch Vergleich mit einem ungestörten Referenzsignal. Nach einer Filterung mit den Übertragungsfunktionen von Außen- und Mittelohr werden die Eingangssignale durch eine gehörangepaßte Filterbank in eine Zeit-Tonheits-Darstellung umgerechnet. Es werden die - Betragsquadrate der Filterausgangssignale berechnet (Gleichrichtung) und es wird eine Faltung der Filterausgänge mit einer Verschmierfunktion durchgeführt. Die Faltung kann im Gegensatz zu den bisher bekannten Verfahren vor der Gleichrichtung erfolgen oder auch danach. Pegelunterschiede zwischen Test- und Referenzsignal sowie lineare Verzerrungen im Testsignal werden kompensiert und getrennt ausgewertet. Anschließend wird ein frequenzabhängiger Offset addiert, um das Eigenrauschen des Gehörs zu modellieren und es wird eine zeitliche Verschmierung der Ausgangssignale vorgenommen. Ein Teil dieser zeitlichen Verschmierung kann bereits direkt nach der Gleichrichtung erfolgen, um Rechenzeit zu sparen. Nach der zeitlichen Verschmierung (Tiefpaßfilterung) ist dann eine Unterabtastung der Signale zulässig. Durch einen Vergleich zwischen dem sich ergebenden gehörgerechten Zeit-Frequenzmustern von Test- und Referenzsignal können eine Reihe von Ausgangsgrößen berechnet werden, die eine Abschätzung der wahrnehmbaren Störungen liefern.

[0016] Zunächst soll die in Fig. 1 als Ausführungsbeispiel dargestellte Struktur bzw. der Aufbau des Meßverfahrens erklärt werden. Die Testsignale 1a, 1b, für den linken bzw. rechten Kanal und die Referenzsignale 1c, 1d, für den linken bzw. rechten Kanal werden zur Vorfilterung jeweils auf Vorfilter 2 gegeben. Nach der Vorfilterung erfolgt die eigentliche Filterung in der Filterbank 3. Danach erfolgt die spektrale Verschmierung 4 und die Berechnung der Betragsquadrate 5. Die mit 6 bezeichneten Kästchen in der Figur stellen symbolisch die zeitliche Verschmierung dar. Danach erfolgt der Pegel- und Frequenzgangangleich 7, wobei auch Ausgangsparameter 11 geliefert werden. Nach dem Pegel-und Frequenzangleich 7 erfolgt die Addition von Eigenrauschen 8 und danach die zeitliche Verschmierung 9.

[0017] Die Berechnung von Ausgangsparametern 11 erfolgt in der dargestellten Struktur bei dem symbolisch dargestellten Block 10. Der Pegel- und Frequenzgangangleich 7 kann auch zwischen Schritt bzw. Operation 9 und 10 erfolgen.

[0018] Zunächst wird die Berechnung der Erregungsmuster mittels der gehörangepaßten Filterbank 3 beschrieben.

[0019] Die Filterbank 3 besteht aus einer beliebig wählbaren Anzahl von Filterpaaren für Test- und Referenzsignal 1a,b bzw. 1d,c (sinnvoll sind Werte zwischen 30 und 200) Die Filter können auf weitgehend beliebigen Tonhöhenskalen gleichmäßig verteilt werden. Eine geeignete Tonhöhenskala ist z. B. folgende von Schroeder vorgeschlagen Näherung:

[0020] Die Filter sind lineärphasig und werden durch Impulsantworten folgender Form definiert:

und

[0021] Der Wert n bestimmt die Sperrdämpfung der Filter und sollte >= 2 sein.

[0022] Die Ausgangswerte der Filterbank 3 werden zur Berücksichtigung der Simultanverdeckung mit 31 dB/Bark an der unteren Flanke und zwischen -24 und -6 dB/Bark an der oberen Flanke spektral verschmiert, das heißt, es wird ein Übersprechen zwischen den Filterausgängen erzeugt. Die obere Flanke wird pegelabhängig berechnet:

[0023] Der Pegel L wird unabhängig für jeden Filterausgang aus dem mit einer Zeitkonstante von 10ms tiefpaßgefilterten Betragsquadrat 5 des entsprechenden Ausgangswertes berechnet. Diese Verschmierung wird unabhängig für die Filter, die den Realteil des Signals representieren (G1. 2) und die Filter, die den Imaginärteil (G1. 3) des Signals representieren durchgeführt. Als Alternative kann der Pegel auch ohne Tiefpaßfilter berechnet werden und stattdessen der das Übersprechen bestimmende Faktor, der sich durch Delogarithmierung der Flankensteilheit (G1. 4) ergibt, tiefpaßgefiltert werden. Da diese Faltungsoperation quasi linear ist und daher die Relation zwischen dem resultierenden Frequenzgang und der resultierenden Impulsantwort bewahrt, kann sie als Teil der Filterbank 3 aufgefaßt werden.

[0024] Da die Filterbank 3 Paare von Ausgangssignalen mit um 90° verschobenen Phasen liefert, kann die Gleichrichtung durch Bildung der Betragsquadrate 5 der Filterausgänge erfolgen:

[0025] Die zeitliche Verschmierung der Filterausgangssignale erfolgt in zwei Stufen. In der ersten Stufe werden die Signale über ein cos²-förmiges Zeitfenster gemittelt, wodurch in erster Linie die Vorverdeckung modelliert wird. In der zweiten Stufe wird dann die Nachverdeckung modelliert ,die später genauer beschrieben wird. Das cos²-förmige Zeitfenster hat eine Länge von 400 Abtastwerten bei einer Abtatstrate von 48 kHz. Der Abstand zwischen dem Maximum des Zeitfensters und seinem 3 dB Punkt beträgt damit etwa 100 Abtastwerte oder 2 ms, was etwa einer oft für die Vorverdeckung angenommenen Zeitspanne enspricht.

[0026] Pegeldifferenzen und lineare Verzerrungen (Frequenzgänge des Testobjekts) zwischen Test- und Referenzsignal 1a,b bzw. 1c,d können kompensiert und damit von der Bewertung anderer Störungsarten getrennt werden.

[0027] Für den Pegelangleich werden die momentanen Betragsquadrate an den Filterausgängen durch Tiefpässe erster Ordnung zeitlich geglättet. Die verwendeten Zeitkonstanten werden in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt:

τ₁₀₀ ≥ τ₀.

[0028] Aus den so geglätteten Filterausgangswerten P_test and P_ref wird ein Korrekturfaktor corr_total berechnet:

[0029] Ist dieser Korrekturfaktor größer eins, wird das Referenzsignal 1a; b durch den Korrekturfaktor geteilt, ansonsten wird das Testsignal 1c; d mit dem Korrekturfaktor multipliziert.

[0030] Für jeden Filterkanal werden Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal 1a,b; 1c,d berechnet:

[0031] Die Zeitkonstanten werden nach Gl. 6 bestimmt. Wenn ratio_f,t größer eins ist, wird der Korrekturfaktor für das Testsignal zu ratio_f,t^-1 gesetzt und der Korrekturfaktor für das Referenzsignal auf eins gesetzt. Im umgekehrten Fall wird der Korrekturfaktor für das Referenzsignal zu ratio_f,t gesetzt und der Korrekturfaktor für das Test signal auf eins gesetzt.

[0032] Die Korrekturfaktoren werden über mehrere benachbarte Filterkanäle, und mit denselben Zeitkonstanten zeitlich geglättet, wie oben angegeben.

[0033] Ein frequenzabhängiger Offset zur Modellierung des Eigenrauschens des Gehörs wird zu den Betragsquadraten an allen Filterausgängen addiert. Ein weiterer Offset zur Berücksichtung von Hintergrundgeräuschen kann ebenfalls addiert werden (wird aber im Normalfall auf 0 gesetzt).

[0034] Zur Modellierung der Nachverdeckung werden die momentanen Betragsquadrate in jedem Filterkanal durch einen Tiefpaß erster Ordnung mit einer Zeitkonsante von ca. 10 ms zeitlich verschmiert. Die Zeitkonstante kann wahlweise auch in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters berechnet werden. In diesem Fall liegt sie bei 50 ms für niedrige Frequenzen und bei 8 ms bei hohen Frequenzen (wie G1. 6) .

[0035] Vor der soeben beschriebenen zweiten Stufe der zeitlichen Verschmierung, wird eine einfache Näherung für die Lautheit berechnet, indem die Betragsquadrate an den Filterausgängen hoch 0.3 genommen werden. Dieser Wert

und der Betrag seiner zeitlichen Ableitung

werden mit denselben Zeitkonstanten geglättet wie bereits beschrieben. Aus dem Ergebnis der zeitlichen Glättung

wird ein Maß für die Hüllkurvenmodulation in jedem Kanal bestimmt:

[0036] Der wichtigste und am höchsten mit subjektiven Hörtestdaten korrelierte Ausgangsparameter des Verfahrens ist die Lautheit der Störung bei Drosselung durch das Nutzsignal. Die Eingangswerte hierzu sind die Betragsquadrate in jedem Filterkanal E_ref und E_test ("Erregung"), die Hüllkurvenmodulation, das Eigenrauschen des Gehörs ("Grunderregung") E_HS und die Konstanten E_o und α. Die gedrosselte Störlautheit wird nach

berechnet, wobei gilt:

E₀ = 10⁴

α = 1.0

s = 0.04·mod(f_c,t) / Hz + 1

[0037] G1. 11 ist hier so entworfen worden, daß sie die spezifische Lautheit der Störung liefert, wenn kein Maskierer vorhanden ist und in etwa das Verhältnis zwischen Störung und Maskierer liefert, wenn die Störung im Verhältnis zum Maskierer sehr klein ist. Der die Drosselung bestimmende Faktor β wird nach folgender Gleichung berechnet:

[0038] Die "Gedrosselte Störlautheit" entspricht dem Mittelwert dieser Größe über Zeit und Filterkanäle. Um lineare Verzerrungen zu bestimmen, wird dieselbe Berechnung nochmals ohne Frequenzgangangleich durchgeführt, wobei in den oben angegebenen Gleichungen Test- und Referenzsignal vertauscht werden. Der sich ergebende Ausgangsparameter wird als "Lautheit fehlender Signalanteile" bezeichnet. Mit Hilfe dieser beiden Ausgangsgrößen ist eine gute Vorhersage der subjektiv empfundenen Signalqualität eines codierten Audiosignals möglich. Alternativ können lineare Verzerrungen auch bestimmt werden, indem das Referenzsignal vor dem Signalangleich als Testsignal verwendet wird. Eine weitere Ausgangsgröße ist die Modulationsdifferenz, die sich durch Normierung des Betrages der Differenz der Modulation von Test- und Referenzsignal auf die Modulation des Referenzsignals ergibt. Dabei wird bei der Normierung auf das Referenzsignal ein Offset addiert, um die berechneten Werte bei sehr kleiner Modulation des Referenzsignals zu begrenzen:

[0039] Die Modulationsdifferenz wird über Zeit und Filterbänder gemittelt.

[0040] Die eingangsseitig verwendete Modulation ergibt sich durch Normierung der zeitlichen Ableitung der Momentanwerte auf ihren zeitlich geglätteten Wert.

[0041] In Fig. 2 ist eine Filterstruktur zur rekursiven Berechnung eines einfachen Bandpass mit endlicher Impulsantwort (FIR) dargestellt.

[0042] Das Signal wird getrennt nach Realteil (oberer Pfad) und Imaginärteil (unterer Pfad) verarbeitet. Da das Eingangssignal X ursprünglich rein reell ist, fehlt der untere Pfad zunächst. Das Eingangssignal X wird um N Abtastwerte verzögert (21) und nach einer Multiplikation mit einem komplexwertigen Faktor cos(N._ϕ)+j.sin(N._ϕ)vom ursprünglichen Eingangssignal subtrahiert (22). Das resultierende Signal V wird zu dem um einen Abtastwert verzögerten Ausgangssignal addiert (23). Das Resultat multipliziert mit einem weiteren komplexwertigen Faktor cos(_ϕ)+j.sin(_ϕ) ergibt das neue Ausgangssignal Y (24). Die überstrichenen Bezeichner für V und Y markieren jeweils den Imaginärteil.

[0043] Die zweite komplexe Multiplikation setzt das Eingangssignal periodisch fort. Die Addition des verzögerten und durch die erste komplexe Multiplikation gewichteten Eingangssignals bricht die Fortsetzung des Eingangssignals nach N Abtastwerten wieder ab.

[0044] Das gesamte Filter, bestehend aus Real- und Imaginärteilausgang, hat den Amplitudenfrequenzgang

Wobei f_A die Abtastfrequenz bezeichnet.

[0045] Die zunächst geringe Sperrdämpfung dieser Bandpässe läßt sich erhöhen, indem man K+1 solcher Bandpässe mit gleicher Impulsantwortlänge N, aber verschiedenen Werten von ϕ parallel berechnet, ihre Phasengänge durch eine weitere komplexe Multiplikation einander anpaßt und ihre Ausgangssignale gewichtet aufaddiert:

mit

(f_M: Mittenfrequenz des Bandpasses) und

[0046] Die Sperrdämpfung der resultierenden Filter nimmt mit der (K+1) ten Potenz des Abstandes der Signalfrequenz zur Mittenfrequenz des Filters ab: Die Impulsantwort des gesamten Filters hat die Form

für den Realteil und

für den Imaginärteil. Dies entspricht den in Gl. 2 und 3 beschriebenen Charakteristiken.

Liste der Bezugszeichen

[0047]

1a: Testsignal, linker Kanal
1b: Testsignal, rechter Kanal
1c: Referenzsignal, linker Kanal
1d: Referenzsignal, rechter Kanal
2: Vorfilterung
3: Filterbank
4: spektrale Verschmierung
5: Berechnung der Betragsquadrate
6: zeitliche Verschmierung
7: Pegel- und Frequenzgangangleich
8: Addition von Eigenrauschen
9: zeitliche Verschmierung
10: Berechnung von Ausgangsparametern
11: Ausgangsparameter

Ansprüche

1. Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mit Hilfe von Filtern, zeitlicher Verschmierung, Pegel- und Frequenzgangleich, dadurch gekennzeichnet, dass das zu bewertende Audiosignal als Testsignal (1a, 1b) mit einem als Referenzsignal (1c, 1d) gelieferten Originalsignal verglichen wird, dass das Testsignal (1a,1b) und das Referenzsignal (1c,1d) zunächst einer Vorfilterung (2) unterworfen werden, danach in eine Filterbank (3) geleitet werden, so dass danach eine spektrale Verschmierung (4) erfolgt, dass dann die Berechnung von Betragsquadraten (5) erfolgt, worauf eine zeitliche Verschmierung durchgeführt wird, dass die so erzielten Ausgangsgrößen einem Pegel- und Frequenzgangangleich (7) unterworfen werden und dass danach eine Addition von Eigenrauschen des Gehörs (8) erfolgt, worauf wiederum eine zeitliche Verschmierung (9) und eine Berechnung (10) von Ausgangsparametern (11) erfolgt oder der Regel- und Frequenzangleich zwischen der zeitlichen Verschmierung und der Berechnung von Ausgangsparametern durchgeführt wird.

2. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass die Filterbank (3) gehörangepasst ist und aus jedem einlaufenden Signal durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt, dass die zu einem Testsignal (1a,1b) gehörende Sinusschwingung durch Subtraktion des um den Kehrwert der gewünschten Filterbandbreite um eine entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangstestsignal (1a,1b) wieder abgebrochen wird.

3. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass durch Faltung im Frequenzbereich aus je n Filterausgängen gleicher Bandbreite und um jeweils den Kehrwert der Fensterlänge versetzter Mittenfrequenz ein der Fouriertransformierten eines cosⁿ (n-1) förmigen Zeitfensters ein entsprechender Dämpfungsverlauf erzeugt wird.

4. Verfahren nach einem der Patentansprüche 2 oder 3, dadurch gekennzeichnet, dass der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz im Übergang zwischen Durchlassbereich und Sperrbereich durch eine weitere Faltung im Frequenzbereich bestimmt wird.

5. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass aus jedem einlaufenden Testsignal (1a,1b) durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt wird, dass die zu einem Eingangstestsignal (1a, 1b) gehörende Sinusschwingung durch Subtraktion des um den Kehrwert der gewünschten Filterbandbreite entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangstestsignal (1a,1b) wieder abgebrochen wird, dass durch Faltung im Frequenzbereich aus je n Filterausgängen gleicher Bandbreite und jeweils den Kehrwert der Fensterlänge versetzter Mittenfrequenzen ein der Fouriertransformierten eines cosⁿ (n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt wird und dass der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz durch eine weitere Faltung im Frequenzbereich bestimmt wird.

6. Verfahren nach einem der Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass die Eingangstestsignale (1a,1b) und die Referenzsignale (1c,1d) jeweils für einen linken und einen rechten Kanal, das heißt paarweise als Eingangsgröße eingeführt werden.

7. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass beide Signale bzw. Signalpaare (1a,1b; 1c,1d) nach einer Vorfilterung (2) durch eine Filterbank (3) in den Frequenzbereich zerlegt werden, dass durch die Charakteristik der Filterbank (3) und eine anschließende zeitliche Verschmierung (9) der Filterausgangssignale eine gehörgerechte Darstellung der als Testsignal (1a,1b) zu bewertenden Audiosignale erzeugt wird und dass durch Vergleich der gehörgerechten Darstellungen von Testsignal (1a,1b) und Referenzsignal (1c,1d) nach nichtlinearen Umformungen eine Abschätzung des zu erwartenden Höreindrucks geliefert wird.

8. Verfahren nach einem der Patentansprüche 1 bis 7, dadurch gekennzeichnet, dass nach der Filterung mit Übertragungsfunktionen von Außen- und Mittelohr Eingangssignale durch eine gehörangepasste Filterbank (3) eine Umrechnung in eine Zeit-Tonheits-Darstellung durchgeführt wird, dass danach Betragsquadrate (5) der Filterausgangssignale berechnet werden und eine Faltung der Filteräusgangssignale mit einer Verschmierungsfunktion (6) durchgeführt wird.

9. Verfahren nach Patentanspruch 8, dadurch gekennzeichnet, dass die Faltung vor oder nach der Gleichrichtung erfolgt.

10. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass Pegelunterschiede zwischen Test- und Referenzsignal (1a,1b bzw. 1c,1d) sowie lineare Verzerrungen des Referenzsignales (1c,1d) kompensiert und getrennt ausgewertet werden.

11. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass ein Teil der zeitlichen Verschmierung direkt nach der Gleichrichtung erfolgt.

12. Verfahren nach einem der Patentansprüche 1 oder 5, dadurch gekennzeichnet, dass eine gehörangepasste Filterbank (3) verwendet wird, die eine Signalabhängigkeit der Filtercharakteristiken dadurch erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer pegelabhängigen Verschmierungsfunktion im Frequenzbereich gefaltet werden

13. Verfahren nach einem der Patentansprüche 1 bis 12, dadurch gekennzeichnet, dass im Referenzsignal (1c,1d) vorhandene und lediglich in ihrer spektralen Verteilung veränderten Signalanteile von additiven bzw. von durch nicht Linearitäten erzeugten Störungen getrennt werden und dass die Trennung dieser Störanteile durch Auswertung der Orthogonalitätsbeziehung zwischen den zeitlichen Verläufen der Hüllkurven an einander entsprechenden Filterausgängen des zu bewertenden Testsignals (1a,1b) und des Referenzsignals (1c,1d) erfolgt.

14. Verfahren nach einem der Patentansprüche 1 bis 13, dadurch gekennzeichnet, dass die Filterbank (3) aus einer beliebigen wählbaren Anzahl von Filterpaaren für Test- und Referenzsignal (1a,1b) bzw. 1c,1d) besteht und dass die Filter auf weitgehend beliebigen Tonhöhenskalen gleichmäßig verteilt werden.

15. Verfahren nach einem der Patentansprüche 1 bis 14, dadurch gekennzeichnet, dass die Ausgangswerte der Filterbank (3) zur Berücksichtigung der Simultanverdeckung an der oberen Flanke spektral verschmiert werden, dass der Pegel (L) abhängig für jeden Filterausgang aus dem mit einer Zeitkonstante tiefpassgefilterten Betragsquadrat (5) des entsprechenden Ausgangswertes berechnet wird oder ohne Tiefpassfilter bestimmt und stattdessen der Verschmierungsfaktor tiefpassgefiltert wird und dass die Verschmierung unabhängig für die Filter, die den Realteil des Signals repräsentieren und die Filter, die den Imaginärteil des Signals repräsentieren, durchgeführt wird.

16. Verfahren nach einem der Patentansprüche 1 bis 15, dadurch gekennzeichnet, dass die zeitliche Verschmierung der Filterausgangssignale in zwei Stufen erfolgt, wobei in der ersten Stufe die Signale über ein Cosinus²-förmiges Zeitfenster ermittelt werden und in der zweiten Stufe eine Nachverdeckung moduliert wird.

17. Verfahren nach Patentanspruch 16, dadurch gekennzeichnet, dass die Cosinus²-förmigen Zeitfenster eine Länge zwischen 1 bis 16 ms haben.

18. Verfahren nach einem der Patentansprüche 1 bis 17, dadurch gekennzeichnet, dass zum Pegelangleich die momentanen Betragsquadrate (5) an den Filterausgängen durch Tiefpässe erster Ordnung zeitlich geglättet werden, dass die verwendeten Zeitkonstanten in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt werden und dass ein Korrekturfaktor aus der Orthogonalitätsbeziehung zwischen spektraler Hüllkurven der zeitlich geglätteten Filterausgänge von Test- und Referenzsignal (1a, 1b; 1c, 1d) berechnet wird.

19. Verfahren nach Patentanspruch 18, dadurch gekennzeichnet, dass das Testsignal mit dem Korrekturfaktor multipliziert wird, wenn der Korrekturfaktor < 1 ist und das Referenzsignal durch den Korrekturfaktor geteilt wird, wenn der Korrekturfaktor > 1 ist.

20. Verfahren nach einem der Patentansprüche 1 bis 19, dadurch gekennzeichnet, dass für jeden Filterkanal Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal (1a,1b; 1c,1d) berechnet werden.

21. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass aus der auf die Modulation des Referenzsignals normierten (absolute) Differenz der Hüllkurven von Test- und Referenzsignal für jeden Filterkanal und jedes Filterband eine Modulationsdifferenz bestimmt wird, die nach zeitlicher und spektraler Mittelung zur Abschätzung bestimmter hörbarer Störungen geeignet ist.

22. Verfahren nach einem der Patentansprüche 1 bis 21, dadurch gekennzeichnet, dass aus Eingangswerten in Form der Betragsquadrate (5) in jedem Filterkanal, die Hüllkurvenmodulation, das Eigenrauschen des Gehörs und Konstanten eine gedrosselte Störlautheit ermittelt und über Zeit und Filterkanäle gemittelt wird.

23. Verfahren nach einem der Patentansprüche 1 bis 22, dadurch gekennzeichnet, dass das Eingangssignal (X) um N Abtastwerte verzögert und nach einer Multiplikation mit einem komplexwertigen Faktor vom ursprünglichen Eingangssignal subtrahiert wird, dass das resultierende Signal (V) zu dem um einen Abtastwert verzögerten Ausgangssignal addiert wird und dass das Resultat multipliziert mit einem weiteren komplexwertigen Faktor das neue Ausgangssignal ergibt.

Claims

1. Measurement method for aurally compensated quality assessment of audio signals with the aid of filters, temporal smearing, and level and frequency response matching, characterized in that the audio signal to be assessed is compared as a test signal (1a, 1b) to an original signal supplied as reference signal (1c, 1d), in that the test signal (1a, 1b) and the reference signal (1c, 1d) are first subjected to a prefiltering (2), are next passed into a filter bank (3) so that a spectral smearing (4) then takes place, in that calculation of absolute squares (5) is then performed, whereupon a temporal smearing takes place, in that the output quantities thus obtained are subjected to a level and frequency response matching (7), and in that an addition of inherent noise (8) of the human auditory system then takes place, whereupon another temporal smearing (9) and a calculation (10) of output parameters (11) takes place, or alternately the level and frequency response matching is performed after the temporal smearing and before the calculation of output parameters.

2. Method according to claim 1, characterized in that the filter bank (3) is aurally matched and generates an undamped sinusoidal oscillation with the desired filter center frequency from each incoming signal through recursive complex multiplication, in that the sinusoidal oscillation pertaining to a test signal (1a, 1b) is again truncated by subtraction of the input test signal (1a, 1b), said signal having been delayed by a time corresponding to the reciprocal of the desired filter bandwidth and multiplied by the phase angle corresponding to the delay.

3. Method according to claim 1, characterized in that an attenuation curve corresponding to the Fourier transform of a time window having a cosⁿ (n-1) shape is generated through convolution, in the frequency domain, of each set of n filter outputs having equal bandwidth and having center frequencies offset in each case by the reciprocal of the window length.

4. Method according to any one of claims 2 or 3, characterized in that the attenuation curve is determined at relatively great separation from the filter center frequency in the transition between pass band and stop band by a further convolution in the frequency domain.

5. Method according to any one of the preceding claims, characterized in that an undamped sinusoidal oscillation with the desired filter center frequency is generated from each incoming test signal (1a, 1b) through recursive complex multiplication, in that the sinusoidal oscillation pertaining to an incoming test signal (1a, 1b) is again truncated by subtraction of the input test signal (1a, 1b), said signal having been delayed by a time corresponding to the reciprocal of the desired filter bandwidth and multiplied by the phase angle corresponding to the delay, in that an attenuation curve corresponding to the Fourier transform of a time window having a cosⁿ (n-1) shape is generated through convolution, in the frequency domain, of each set of n filter outputs having equal bandwidth and having center frequencies offset in each case by the reciprocal of the window length, and in that the attenuation curve is determined at relatively great separation from the filter center frequency by a further convolution in the frequency domain.

6. Method according to any one of claims 1 through 5, characterized in that the input test signals (1a, 1b) and the reference signals (1c, 1d) are each fed in for a left channel and a right channel, which is to say in pairs, as input quantities.

7. Method according to any one of the preceding claims, characterized in that both signals or signal pairs (1a, 1b; 1c, 1d) are decomposed in the frequency domain after prefiltering (2) by a filter bank (3), in that an aurally compensated representation of the audio signals to be evaluated as the test signal (1a, 1b) is generated through the characteristics of the filter bank (3) and a subsequent temporal smearing (9) of the filter output signals, and in that an estimation of the auditory perception to be expected is provided by comparison of the aurally compensated representations of the test signal (1a, 1b) and reference signal (1c, 1d) after nonlinear transformations.

8. Method according to any one of claims I through 7, characterized in that, after the filtering with transfer functions of input signals of the outer and middle ear by an aurally matched filter bank (3), a conversion to a time-pitch representation is performed, in that thereafter absolute squares (5) of the filter output signals are calculated, and a convolution of the filter output signals with a smearing function (6) is performed.

9. Method according to claim 8, characterized in that the convolution occurs either before or after the rectification.

10. Method according to any one of claims 1 through 9, characterized in that differences in level between the test and reference signal (1a, 1b or 1c, 1d, respectively) and linear distortions of the reference signal (1c, 1d) are compensated and are evaluated separately.

11. Method according to any one of claims 1 through 9, characterized in that a part of the temporal smearing takes place directly after the rectification.

12. Method according to any one of claims 1 or 5, characterized in that an aurally matched filter bank (3) is used, said filter bank achieving a signal dependency of the filter characteristics through convolution of the filter outputs with a level-dependent smearing function in the frequency domain prior to the rectification/value determination.

13. Method according to any one of claims 1 through 12, characterized in that signal components present in the reference signal (1c, 1d) and changed only in their spectral distribution are separated from additive distortions or from distortions produced by non-linearities, and in that the separation of these distortion components is accomplished by analysis of the orthogonality relationship between the time behavior of the envelope curves at corresponding filter outputs of the test signal (1a, 1b) to be assessed and of the reference signal (1c, 1d).

14. Method according to any one of claims 1 through 13, characterized in that the filter bank (3) consists of an arbitrarily chosen number of filter pairs for the test and reference signal (1a, 1b or 1c, 1d, respectively), and in that the filters are evenly distributed over largely arbitrary pitch scales.

15. Method according to any one of claims 1 through 14, characterized in that the output values of the filter bank (3) are spectrally smeared to account for simultaneous masking at the upper edge, in that the level (L) is calculated dependently for each filter output from the absolute square (5) of the corresponding output value, said absolute square having been low-pass-filtered with a time constant, or is determined without the low-pass filter and instead the smearing factor is low-pass-filtered, and in that the smearing is carried out independently for the filters representing the real part of the signal and the filters representing the imaginary part of the signal.

16. Method according to any one of claims 1 through 15, characterized in that the temporal smearing of the filter output signal takes place in two stages, with the signals being determined in the first stage through a time window having a cosine² shape, and subsequent masking being modulated in the second stage.

17. Method according to claim 16, characterized in that the cosine² shaped time windows are between 1 and 16 ms in length.

18. Method according to any one of claims 1 through 17, characterized in that the instantaneous absolute squares (5) at the filter outputs are temporally smoothed by first-order low-pass filters for level matching, in that the time constants used are selected as a function of the center frequency of the filter in question, and in that a correction factor is calculated from the orthogonality relationship between spectral envelope curves of the temporally smoothed filter outputs of the test and reference signals (1a, 1b; 1c, 1d).

19. Method according to claim 18, characterized in that the test signal is multiplied by the correction factor if the correction factor < 1, and the reference signal is divided by the correction factor if the correction factor > 1.

20. Method according to any one of claims 1 through 19, characterized in that correction factors are calculated from the orthogonality relationship between the temporal envelope curves of the filter outputs of the test and reference signals (1a, 1b; 1c, 1d) for each filter channel.

21. Method according to claim 1, characterized in that a modulation difference is determined, for each filter channel and each filter band, from the (absolute) difference between the envelope curves of test and reference signals normalized to the modulation of the reference signal, said modulation difference being suitable, after temporal and spectral averaging, for estimating certain audible distortions.

22. Method according to any one of claims 1 through 21, characterized in that a throttled noise loudness is determined from input values in the form of the absolute squares (5) in each filter channel, the envelope curve modulation, the inherent noise of the human auditory system, and constants, and is averaged over time and filter channels.

23. Method according to any one of claims 1 through 22, characterized in that the input signal (X) is delayed by N sampled values and after being multiplied by a complex-valued factor is subtracted from the original input signal, in that the resultant signal (V) is added to the output signal delayed by a sampled value, and in that the result multiplied by another complex-valued factor yields the new output signal.

Revendications

1. Procédé de mesure d'évaluation de la qualité auditive de signaux audio à l'aide de filtres, d'un étalement temporel, d'une harmonisation du niveau et de la fréquence caractérisé en ce que

le signal audio à évaluer est comparé comme signal-test (1a, 1b) avec un signal original livré comme signal de référence (1c, 1d),

le signal-test (1a, 1b) et le signal de référence (1c, 1d) sont d'abord soumis à un préfiltrage (2), puis conduits dans un banc de filtrage (3), de sorte qu'il est procédé ensuite à un étalement spectral (4),

l'évaluation des carrés de valeurs absolues (5) s'effectue ensuite, après quoi il est procédé à un étalement temporel,

les grandeurs de sorties ainsi atteintes sont soumises à une harmonisation du niveau et de la fréquence (7) et

une addition de bruit auditif propre (8) est enfin effectuée, suite à quoi il est à nouveau procédé à un étalement temporel (9) et à un calcul (10) des paramètres de sortie (11) ou à l'harmonisation du niveau et de la fréquence entre l'étalement temporel et le calcul de paramètres de sortie.

2. Procédé selon la revendication 1, caractérisé en ce que

le banc de filtrage (3) est adapté auditivement et produit une oscillation sinusoïdale non amortie dotée de la fréquence centrale de filtrage souhaitée à partir de chaque signal entrant à l'aide d'une multiplication récursive complexe,

l'oscillation sinusoïdale appartenant à un signal-test (1a, 1b) est de nouveau interrompue par soustraction du signal-test d'entrée (1a, 1b) retardé d'une période correspondante de la valeur réciproque de la largeur de bande souhaitée et multiplié par l'angle de phase correspondant au retard.

3. Procédé selon la revendication 1, caractérisé en ce que
une courbe d'atténuation correspondant à la transformée de Fourier d'une fenêtre temporelle de forme cosⁿ (n-1) est produite par convolution dans la gamme des fréquences, à partir de n sorties de filtre de même largeur de bande et à partir de la valeur réciproque de la longueur de fenêtre de fréquences centrales décalées.

4. Procédé selon l'une des revendications 2 ou 3, caractérisé en ce que
la courbe d'atténuation est définie par une autre convolution dans la gamme des fréquences, et ce à une plus grande distance de la fréquence centrale de filtrage en transition entre la bande de transmission et la bande éliminée.

5. Procédé selon l'une des revendications précédentes, caractérisé en ce que

une oscillation sinusoïdale non amortie à la fréquence centrale de filtrage souhaitée est produite par multiplication récursive complexe à partir de chaque signal-test (1a, 1b) entrant,

l'oscillation sinusoïdale appartenant à un signal-test d'entrée (1a, 1b) est de nouveau interrompue par soustraction du signal-test d'entrée (1a, 1b) retardé de la période correspondante de la valeur réciproque de la largeur de bande souhaitée et multipliée par l'angle de phase correspondant au retard,

une courbe d'atténuation correspondant à la transformée de Fourier d'une fenêtre temporelle de forme cosⁿ (n-1) est produite par convolution dans la gamme des fréquences, à partir de n sorties de filtre de même largeur de bande et à partir de la valeur réciproque de la longueur de fenêtre de fréquences centrales décalées, et

la courbe d'atténuation est définie par une autre convolution dans la gamme des fréquences, et ce à une plus grande distance de la fréquence centrale de filtrage.

6. Procédé selon l'une des revendications 1 à 5, caractérisé en ce que
les signaux-tests d'entrée (1a, 1b) et les signaux de référence (1c, 1d) sont introduits chacun pour un canal de droite et un canal de gauche, c'est-à-dire par paire, comme grandeur d'entrée.

7. Procédé selon l'une des revendications précédentes, caractérisé en ce que

les deux signaux ou les paires de signaux (1a, 1b ; 1c, 1d) sont décomposés par un banc de filtrage (3) après un préfiltrage (2) dans la gamme des fréquences,

une présentation conforme à l'audition des signaux audio (1a, 1b) à évaluer comme signal-test est produite par la caractéristique du banc de filtrage (3) et un étalement temporel (9) des signaux de sortie de filtre et

une estimation de l'impression auditive à attendre est livrée par comparaison des présentations conformes à l'audition de signaux-test (1a, 1b) et de signaux de référence (1c, 1d) selon des déformages non linéaires.

8. Procédé selon l'une des revendications 1 à 7, caractérisé en ce que

une conversion en une représentation de tonalité temporelle s'effectue grâce à un banc de filtrage (3) adapté à l'audition après le filtrage avec des fonctions de transmission de signaux d'entrée d'oreille externe et d'oreille moyenne,

des carrés de valeurs absolues (5) des signaux de sortie de filtre sont calculés ensuite et une convolution des signaux de sortie de filtre est effectuée avec une fonction d'étalement (6).

9. Procédé selon la revendication 8, caractérisé en ce que
la convolution s'effectue avant ou après le redressement.

10. Procédé selon l'une des revendications 1 à 9, caractérisé en ce que
les différences de niveau entre le signal-test et le signal de référence (1a, 1b ou 1c, 1d) ainsi que les distorsions linéaires du signal de référence (1c, 1d) sont compensées et analysées séparément.

11. Procédé selon l'une des revendications 1 à 9, caractérisé en ce qu'une partie de l'étalement temporel s'effectue directement après le redressement.

12. Procédé selon l'une des revendications 1 ou 5, caractérisé en ce qu'un banc de filtrage (3) adapté à l'audition est utilisé, ledit banc atteignant une dépendance des caractéristiques de filtrage par rapport au signal en ceci que les sorties de filtre sont convoluées dans la gamme des fréquences avant le redressement/la constitution de la valeur absolue à l'aide d'une fonction d'étalement dépendante du niveau.

13. Procédé selon l'une des revendications 1 à 12, caractérisé en ce que

des parts de signaux existantes dans le signal de référence (1c, 1d) et modifiées uniquement dans leur répartition spectrale sont séparés des interférences additives ou produites par des non-linéarités, et

la séparation de ces parts d'interférences s'effectue par analyse de la relation d'orthogonalité entre les phases temporelles des enveloppantes sur les sorties de filtre, correspondant l'une à l'autre, du signal-test (1a, 1b) à évaluer et du signal de référence (1c, 1d).

14. Procédé selon l'une des revendications 1 à 13, caractérisé en ce que

le banc de filtrage (3) est composé d'un nombre éligible arbitraire de paires de filtres pour signal-test et de référence (1a, 1b ou 1c, 1d) et

les filtres sont répartis régulièrement sur des échelles de tonalité en grande partie arbitraire.

15. Procédé selon l'une des revendications 1 à 14, caractérisé en ce que

les valeurs de sortie du banc de filtrage (3) sont étalées spectralement sur le flanc supérieur pour tenir compte de la couverture simultanée,

le niveau (L) est calculé en fonction de chaque sortie de filtre à partir du carré de valeur absolue (5) de la valeur de sortie correspondante, filtré en passe-bas avec une constante temporelle, ou déterminé sans filtre passe-bas, le facteur d'étalement étant filtré au lieu de cela en passe-bas, et

l'étalement s'effectue indépendamment pour les filtres qui représentent la part réelle du signal et pour les filtres qui représentent la part imaginaire du signal.

16. Procédé selon l'une des revendications 1 à 15, caractérisé en ce que
l'étalement temporel des signaux de sortie de filtre s'effectue en deux étapes, les signaux étant détectés à la première étape par l'intermédiaire d'une fenêtre temporelle en forme de cosinus² et une couverture ultérieure étant modulée à la deuxième étape.

17. Procédé selon la revendication 16, caractérisé en ce que
les fenêtres temporelles en forme de cosinus² ont une longueur comprise entre 1 et 16 ms.

18. Procédé selon l'une des revendications 1 à 17, caractérisé en ce que,

pour l'harmonisation du niveau, les carrés momentanés de valeurs absolues (5) sont lissés temporellement sur les sorties de filtre par des passe-bas de premier ordre,

les constantes temporelles utilisées sont choisies en fonction de la fréquence centrale du filtre respectif et

un facteur de correction est calculé à partir de la relation d'orthogonalité entre les enveloppantes spectrales des sorties de filtre du signal-test et du signal de référence (1a, 1b ; 1c, 1d) lissées temporellement.

19. Procédé selon la revendication 18, caractérisé en ce que

le signal-test est multiplié par le facteur de correction si ledit facteur de correction est < 1 et

le signal de référence est divisé par le facteur de correction si ledit facteur de correction est > i.

20. Procédé selon l'une des revendications 1 à 19, caractérisé en ce que
des facteurs de correction sont calculés pour chaque canal de filtrage à partir de la relation d'orthogonalité entre les enveloppantes temporelles des sorties de filtre du signal-test et de référence (1a, 1b ; 1c, 1d).

21. Procédé selon la revendication 1, caractérisé en ce que
une différence de modulation est définie pour chaque canal de filtrage et pour chaque bande de filtrage à partir de la différence (absolue), normée sur la modulation du signal de référence, des enveloppantes de signal-test et de signal de référence, ladite différence de modulation étant adaptée à estimer certaines interférences audibles après indication temporelle et spectrale.

22. Procédé selon l'une des revendications 1 à 21, caractérisé en ce que
des valeurs d'entrée servent, sous forme des carrés de valeur absolue (5) dans chaque canal de filtrage, de la modulation des enveloppantes, du bruit de fond de l'audition et des constantes, à détecter un volume sonore atténué des interférences, celui-ci étant transmis par canaux temporels et de filtrage.

23. Procédé selon l'une des revendications 1 à 22, caractérisé en ce que

le signal d'entrée (X) est retardé de N valeurs de balayage et soustrait du signal d'entrée original après une multiplication par un facteur de valeur complexe,

le signal résultant (V) est ajouté au signal de sortie retardé d'une valeur de balayage et

le résultat multiplié par un autre facteur de valeur complexe donne le nouveau signal de sortie.

Zeichnung