(19) |
|
|
(11) |
EP 0 957 471 B1 |
(12) |
EUROPÄISCHE PATENTSCHRIFT |
(45) |
Hinweis auf die Patenterteilung: |
|
01.02.2006 Patentblatt 2006/05 |
(22) |
Anmeldetag: 12.04.1999 |
|
(51) |
Internationale Patentklassifikation (IPC):
|
|
(54) |
Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
Measuring process for loudness quality assessment of audio signals
Procédé d'évaluation de la qualité de la correction physiologique de signaux audio
|
(84) |
Benannte Vertragsstaaten: |
|
AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
(30) |
Priorität: |
13.05.1998 DE 19821273
|
(43) |
Veröffentlichungstag der Anmeldung: |
|
17.11.1999 Patentblatt 1999/46 |
(73) |
Patentinhaber: Deutsche Telekom AG |
|
53113 Bonn (DE) |
|
(72) |
Erfinder: |
|
- Thiede, Thilo
10715 Berlin (DE)
|
(56) |
Entgegenhaltungen: :
EP-A2- 0 417 739
|
US-A- 4 860 360
|
|
|
|
|
- HANSEN M ET AL: "Using a quantitative psychoacoustical signal representation for objective
speech quality measurement" ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1997. ICASSP-97.,
1997 IEEE INTERNATIONAL CONFERENCE ON MUNICH, GERMANY 21-24 APRIL 1997, LOS ALAMITOS,
CA, USA,IEEE COMPUT. SOC, US, 21. April 1997 (1997-04-21), Seiten 1387-1390, XP010226062
ISBN: 0-8186-7919-0
- BRANDENBURG K ET AL: "NMR AND MASKING FLAG: EVALUATION OF QUALITY USING PERCEPTUAL
CRITERIA" PROCEEDINGS OF THE INTERNATIONAL TEST AND MEASUREMENT CONFERENCE. PORTLAND,
MAY 21 - 31, 1992, NEW YORK, AES, US, Bd. CONF. 11, 29. Mai 1992 (1992-05-29), Seiten
169-179, XP000300175
|
|
|
|
Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die
Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen
das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich
einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr
entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen). |
[0001] Die Erfindung betrifft ein Messverfahren zur gehörrichtigen Qualitätsbewertung von
Audiosignalen nach dem Oberbegriff des Patentanspruchs 1.
[0002] Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen sind grundsätzlich
bekannt. Die grundsätzliche Struktur eines solchen Messverfahrens besteht in der Abbildung
der Eingangssignale auf eine gehörgerechte Zeit-Frequenz-Repräsentation, einem Vergleich
dieser Darstellung und der Berechnung von Einzelzahlwerten zur Abschätzung der wahrnehmbaren
Störungen. Hierzu wird auf folgende Veröffentlichungen verwiesen:
Schroeder, M.R.; Atal, B. S.; Hall, J.L: Optimizing digital speech coders by exploiting
masking properties of the human ear. J. Acoust. Soc. Am., Vol. 66 (1979), No. 6, December,
Seiten 1647 - 1652.
Beerends, J.G.; Stemerdink, J.A.: A Perceptual Audio Quality Measure Based on a Psychoacoustic
Sound Representation. J. AES, Voi. 40 (1992), No. 12, December, Seiten 963 - 978.
Brandenburg, K.H.; Sporer, Th.: NMR* and Masking Flag: Evaluation of Quality Using
Perceptual Criteria. Proceedings of the AES 11th International Conference, Portland,
Oregon, USA, 1992, Seiten 169-179.
[0003] Wie aus diesen Veröffentlichungen hervorgeht, benutzen die für die Beurteilung von
codierten Audiosignalen verwendeten Modelle jedoch FFT Algorithmen und erfordern daher
eine Umrechnung von der durch die FFT vorgegebenen linearen Frequenzeinteilung auf
eine gehörgerechte Frequenzeinteilung. Dadurch ist die zeitliche Auflösung suboptimal.
Außerdem erfolgt die Faltung mit Verschmierungsfunktion nach der Gleichrichtung bzw.
Betragsbildung.
[0004] Aus der Fachveröffentlichung Hansen et. Al. "Using a qualitative Psychoacoustical
Signal representation for Objective Speech Quality Measurements" ICASSP' 97, S. 1387
- 1390, ist ein Meßverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
mit Hilfe von Filtern bzw. einer Filterbank bekannt. Das Signal wird in 19 Frequenzbänder
von 350 Hz - 3500 Hz aufgeteilt.
[0005] Der Erfindung liegt die Aufgabe zugrunde, ein objektives Messverfahren zur gehörrichtigen
Qualitätsbewertung von Audiosignalen mittels neuer schneller Algorithmen zur Berechnung
linearphasiger Filter zu schaffen, wobei die Laufzeit der hörbaren Störungen unter
Berücksichtigung der zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen
berechnet und eine gehörangepasste Filterbank verwendet werden soll, wodurch eine
optimale zeitliche Auflösung erreicht werden soll und zwar bei signifikanter Einsparung
von Rechenzeit gegenüber anderen Filterbänken. Die erfindungsgemäße Lösung der Aufgabe
ist im Kennzeichen des Patentanspruchs 1 charakterisiert.
[0006] Weitere Lösungen bzw. Ausgestaltungen der Erfindung sind in den Patentansprüchen
2 bis 23 charakterisiert.
[0007] Ein wesentlicher Vorteil des erfindungsgemäßen Verfahrens besteht darin, dass ein
genaueres Gehörmodell erzielt wird, da hörbare Störungen unter Berücksichtigung der
zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen berechnet werden.
[0008] Außerdem wird eine gehörangepasste Filterbank verwendet, wodurch eine optimale zeitliche
Auflösung erreicht wird, und das zeitliche Verhalten der Filter (Impulsantwort u.s.w.)
direkt mit der Pegelabhängigkeit der Übertragungsfunktionen korrespondiert. Die Phaseninformation
in den Filterkanälen bleibt erhalten. Wie bereits ausgeführt, erfolgt bei den bisher
bekannten Lösungen die Faltung mit Verschmierfunktion erst nach der Gleichrichtung
bzw. Betragsbildung. Eine Signalabhängigkeit der Filtercharakteristiken wird dadurch
erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer
pegelabhängigen Verschmierfunktion im Frequenzbereich gefaltet werden.
[0009] Dadurch, dass ein neuer schneller Algorithmus zur rekursiven Berechnung linearphasiger
Filter verwendet wird, ergibt sich eine wesentliche Einsparung an Rechenzeit, ein
einfacher Entwurf und Filter, die leichter variierbar als die bisher angewandten konventionellen
rekursiven Filter sind.
[0010] Im Originalsignal vorhandene und lediglich in ihrer spektralen Verteilung veränderten
Signalanteile werden von additiven bzw. von durch Nichtlinearitäten erzeugten Störungen
getrennt, wobei die Trennung durch Auswertung der Orthogonalitätsbeziehung zwischen
den zeitlichen Verläufen der Hüllkurven an einander entsprechenden Filterausgängen
des zu bewertenden Signals und des Originalsignals erfolgt. Die Trennung dieser Störanteile
entspricht besser dem tatsächlichen Höreindruck.
[0011] Der Filterbankalgorithmus wird in folgender Weise realisiert:
Aus jedem einlaufendem Impuls wird durch rekursive komplexe Multiplikation eine ungedämpfte
Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt.
Die zu einem Eingangsimpuls gehörende Sinusschwingung wird durch Subtraktion des um
dem Kehrwert der gewünschten Filterbandbreite entsprechende Zeit verzögerten und mit
dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangsimpuls wieder
abgebrochen.
- Durch Faltung im Frequenzbereich wird durch gewichtete Summation von je n Filterausgängen
gleicher Bandbreite und um jeweils eine Periode versetzter Mittenfrequenz aus dem
nach Schritt 2 resultierendem sin(x)/x-förmigen Dämpfungsverlauf ein der Fouriertransformierten
eines cos^(n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt. Hierdurch
kann der Dämpfungsverlauf in der Umgebung der Filtermittenfrequenzen geformt und eine
ausreichend hohe Sperrdämpfung ermöglicht werden.
- Der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz kann durch
eine weitere Faltung im Frequenzbereich bestimmt werden (Übergang zwischen Durchlaßbereich
und Sperrbereich).
[0012] Weitere Vorteile, Merkmale und Anwendungsmöglichkeiten der vorliegenden Erfindung
ergeben sich aus der nachfolgenden Beschreibung in Verbindung mit den in der Zeichnung
dargestellten Ausführungsbeispielen.
[0013] Die Erfindung wird im folgenden anhand von in den Zeichnungen dargestellten Ausführungsbeispielen
näher beschrieben. In der Beschreibung, in den Patentansprüchen, der Zusammenfassung
und in der Zeichnung werden die in der hinten angeführten Liste der Bezugszeichen
verwendeten Begriffe und zugeordneten Bezugszeichen verwendet.
[0014] In den Zeichnungen bedeuten:
- Fig. 1
- eine Struktur des Meßverfahrens und
- Fig. 2
- eine Filterstruktur.
[0015] Das vorliegende Meßverfahren bewertet die Störungen eines Audiosignals durch Vergleich
mit einem ungestörten Referenzsignal. Nach einer Filterung mit den Übertragungsfunktionen
von Außen- und Mittelohr werden die Eingangssignale durch eine gehörangepaßte Filterbank
in eine Zeit-Tonheits-Darstellung umgerechnet. Es werden die - Betragsquadrate der
Filterausgangssignale berechnet (Gleichrichtung) und es wird eine Faltung der Filterausgänge
mit einer Verschmierfunktion durchgeführt. Die Faltung kann im Gegensatz zu den bisher
bekannten Verfahren vor der Gleichrichtung erfolgen oder auch danach. Pegelunterschiede
zwischen Test- und Referenzsignal sowie lineare Verzerrungen im Testsignal werden
kompensiert und getrennt ausgewertet. Anschließend wird ein frequenzabhängiger Offset
addiert, um das Eigenrauschen des Gehörs zu modellieren und es wird eine zeitliche
Verschmierung der Ausgangssignale vorgenommen. Ein Teil dieser zeitlichen Verschmierung
kann bereits direkt nach der Gleichrichtung erfolgen, um Rechenzeit zu sparen. Nach
der zeitlichen Verschmierung (Tiefpaßfilterung) ist dann eine Unterabtastung der Signale
zulässig. Durch einen Vergleich zwischen dem sich ergebenden gehörgerechten Zeit-Frequenzmustern
von Test- und Referenzsignal können eine Reihe von Ausgangsgrößen berechnet werden,
die eine Abschätzung der wahrnehmbaren Störungen liefern.
[0016] Zunächst soll die in Fig. 1 als Ausführungsbeispiel dargestellte Struktur bzw. der
Aufbau des Meßverfahrens erklärt werden. Die Testsignale 1a, 1b, für den linken bzw.
rechten Kanal und die Referenzsignale 1c, 1d, für den linken bzw. rechten Kanal werden
zur Vorfilterung jeweils auf Vorfilter 2 gegeben. Nach der Vorfilterung erfolgt die
eigentliche Filterung in der Filterbank 3. Danach erfolgt die spektrale Verschmierung
4 und die Berechnung der Betragsquadrate 5. Die mit 6 bezeichneten Kästchen in der
Figur stellen symbolisch die zeitliche Verschmierung dar. Danach erfolgt der Pegel-
und Frequenzgangangleich 7, wobei auch Ausgangsparameter 11 geliefert werden. Nach
dem Pegel-und Frequenzangleich 7 erfolgt die Addition von Eigenrauschen 8 und danach
die zeitliche Verschmierung 9.
[0017] Die Berechnung von Ausgangsparametern 11 erfolgt in der dargestellten Struktur bei
dem symbolisch dargestellten Block 10. Der Pegel- und Frequenzgangangleich 7 kann
auch zwischen Schritt bzw. Operation 9 und 10 erfolgen.
[0018] Zunächst wird die Berechnung der Erregungsmuster mittels der gehörangepaßten Filterbank
3 beschrieben.
[0019] Die Filterbank 3 besteht aus einer beliebig wählbaren Anzahl von Filterpaaren für
Test- und Referenzsignal 1a,b bzw. 1d,c (sinnvoll sind Werte zwischen 30 und 200)
Die Filter können auf weitgehend beliebigen Tonhöhenskalen gleichmäßig verteilt werden.
Eine geeignete Tonhöhenskala ist z. B. folgende von Schroeder vorgeschlagen Näherung:
[0020] Die Filter sind lineärphasig und werden durch Impulsantworten folgender Form definiert:
und
[0021] Der Wert n bestimmt die Sperrdämpfung der Filter und sollte >= 2 sein.
[0022] Die Ausgangswerte der Filterbank 3 werden zur Berücksichtigung der Simultanverdeckung
mit 31 dB/Bark an der unteren Flanke und zwischen -24 und -6 dB/Bark an der oberen
Flanke spektral verschmiert, das heißt, es wird ein Übersprechen zwischen den Filterausgängen
erzeugt. Die obere Flanke wird pegelabhängig berechnet:
[0023] Der Pegel L wird unabhängig für jeden Filterausgang aus dem mit einer Zeitkonstante
von 10ms tiefpaßgefilterten Betragsquadrat 5 des entsprechenden Ausgangswertes berechnet.
Diese Verschmierung wird unabhängig für die Filter, die den Realteil des Signals representieren
(G1. 2) und die Filter, die den Imaginärteil (G1. 3) des Signals representieren durchgeführt.
Als Alternative kann der Pegel auch ohne Tiefpaßfilter berechnet werden und stattdessen
der das Übersprechen bestimmende Faktor, der sich durch Delogarithmierung der Flankensteilheit
(G1. 4) ergibt, tiefpaßgefiltert werden. Da diese Faltungsoperation quasi linear ist
und daher die Relation zwischen dem resultierenden Frequenzgang und der resultierenden
Impulsantwort bewahrt, kann sie als Teil der Filterbank 3 aufgefaßt werden.
[0024] Da die Filterbank 3 Paare von Ausgangssignalen mit um 90° verschobenen Phasen liefert,
kann die Gleichrichtung durch Bildung der Betragsquadrate 5 der Filterausgänge erfolgen:
[0025] Die zeitliche Verschmierung der Filterausgangssignale erfolgt in zwei Stufen. In
der ersten Stufe werden die Signale über ein cos
2-förmiges Zeitfenster gemittelt, wodurch in erster Linie die Vorverdeckung modelliert
wird. In der zweiten Stufe wird dann die Nachverdeckung modelliert ,die später genauer
beschrieben wird. Das cos
2-förmige Zeitfenster hat eine Länge von 400 Abtastwerten bei einer Abtatstrate von
48 kHz. Der Abstand zwischen dem Maximum des Zeitfensters und seinem 3 dB Punkt beträgt
damit etwa 100 Abtastwerte oder 2 ms, was etwa einer oft für die Vorverdeckung angenommenen
Zeitspanne enspricht.
[0026] Pegeldifferenzen und lineare Verzerrungen (Frequenzgänge des Testobjekts) zwischen
Test- und Referenzsignal 1a,b bzw. 1c,d können kompensiert und damit von der Bewertung
anderer Störungsarten getrennt werden.
[0027] Für den Pegelangleich werden die momentanen Betragsquadrate an den Filterausgängen
durch Tiefpässe erster Ordnung zeitlich geglättet. Die verwendeten Zeitkonstanten
werden in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt:
τ
100 ≥ τ
0.
[0028] Aus den so geglätteten Filterausgangswerten
Ptest and
Pref wird ein Korrekturfaktor
corrtotal berechnet:
[0029] Ist dieser Korrekturfaktor größer eins, wird das Referenzsignal 1a; b durch den Korrekturfaktor
geteilt, ansonsten wird das Testsignal 1c; d mit dem Korrekturfaktor multipliziert.
[0030] Für jeden Filterkanal werden Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen
den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal 1a,b; 1c,d
berechnet:
[0031] Die Zeitkonstanten werden nach Gl. 6 bestimmt. Wenn
ratiof,t größer eins ist, wird der Korrekturfaktor für das Testsignal zu
ratiof,t-1 gesetzt und der Korrekturfaktor für das Referenzsignal auf eins gesetzt. Im umgekehrten
Fall wird der Korrekturfaktor für das Referenzsignal zu
ratiof,t gesetzt und der Korrekturfaktor für das Test signal auf eins gesetzt.
[0032] Die Korrekturfaktoren werden über mehrere benachbarte Filterkanäle, und mit denselben
Zeitkonstanten zeitlich geglättet, wie oben angegeben.
[0033] Ein frequenzabhängiger Offset zur Modellierung des Eigenrauschens des Gehörs wird
zu den Betragsquadraten an allen Filterausgängen addiert. Ein weiterer Offset zur
Berücksichtung von Hintergrundgeräuschen kann ebenfalls addiert werden (wird aber
im Normalfall auf 0 gesetzt).
[0034] Zur Modellierung der Nachverdeckung werden die momentanen Betragsquadrate in jedem
Filterkanal durch einen Tiefpaß erster Ordnung mit einer Zeitkonsante von ca. 10 ms
zeitlich verschmiert. Die Zeitkonstante kann wahlweise auch in Abhängigkeit von der
Mittenfrequenz des jeweiligen Filters berechnet werden. In diesem Fall liegt sie bei
50 ms für niedrige Frequenzen und bei 8 ms bei hohen Frequenzen (wie G1. 6) .
[0035] Vor der soeben beschriebenen zweiten Stufe der zeitlichen Verschmierung, wird eine
einfache Näherung für die Lautheit berechnet, indem die Betragsquadrate an den Filterausgängen
hoch 0.3 genommen werden. Dieser Wert
und der Betrag seiner zeitlichen Ableitung
werden mit denselben Zeitkonstanten geglättet wie bereits beschrieben. Aus dem Ergebnis
der zeitlichen Glättung
wird ein Maß für die Hüllkurvenmodulation in jedem Kanal bestimmt:
[0036] Der wichtigste und am höchsten mit subjektiven Hörtestdaten korrelierte Ausgangsparameter
des Verfahrens ist die Lautheit der Störung bei Drosselung durch das Nutzsignal. Die
Eingangswerte hierzu sind die Betragsquadrate in jedem Filterkanal E
ref und E
test ("Erregung"), die Hüllkurvenmodulation, das Eigenrauschen des Gehörs ("Grunderregung")
E
HS und die Konstanten E
o und α. Die gedrosselte Störlautheit wird nach
berechnet, wobei gilt:
E0 = 104
α = 1.0
s = 0.04·mod(fc,t) / Hz + 1
[0037] G1. 11 ist hier so entworfen worden, daß sie die spezifische Lautheit der Störung
liefert, wenn kein Maskierer vorhanden ist und in etwa das Verhältnis zwischen Störung
und Maskierer liefert, wenn die Störung im Verhältnis zum Maskierer sehr klein ist.
Der die Drosselung bestimmende Faktor β wird nach folgender Gleichung berechnet:
[0038] Die "Gedrosselte Störlautheit" entspricht dem Mittelwert dieser Größe über Zeit und
Filterkanäle. Um lineare Verzerrungen zu bestimmen, wird dieselbe Berechnung nochmals
ohne Frequenzgangangleich durchgeführt, wobei in den oben angegebenen Gleichungen
Test- und Referenzsignal vertauscht werden. Der sich ergebende Ausgangsparameter wird
als "Lautheit fehlender Signalanteile" bezeichnet. Mit Hilfe dieser beiden Ausgangsgrößen
ist eine gute Vorhersage der subjektiv empfundenen Signalqualität eines codierten
Audiosignals möglich. Alternativ können lineare Verzerrungen auch bestimmt werden,
indem das Referenzsignal vor dem Signalangleich als Testsignal verwendet wird. Eine
weitere Ausgangsgröße ist die Modulationsdifferenz, die sich durch Normierung des
Betrages der Differenz der Modulation von Test- und Referenzsignal auf die Modulation
des Referenzsignals ergibt. Dabei wird bei der Normierung auf das Referenzsignal ein
Offset addiert, um die berechneten Werte bei sehr kleiner Modulation des Referenzsignals
zu begrenzen:
[0039] Die Modulationsdifferenz wird über Zeit und Filterbänder gemittelt.
[0040] Die eingangsseitig verwendete Modulation ergibt sich durch Normierung der zeitlichen
Ableitung der Momentanwerte auf ihren zeitlich geglätteten Wert.
[0041] In Fig. 2 ist eine Filterstruktur zur rekursiven Berechnung eines einfachen Bandpass
mit endlicher Impulsantwort (FIR) dargestellt.
[0042] Das Signal wird getrennt nach Realteil (oberer Pfad) und Imaginärteil (unterer Pfad)
verarbeitet. Da das Eingangssignal X ursprünglich rein reell ist, fehlt der untere
Pfad zunächst. Das Eingangssignal X wird um N Abtastwerte verzögert (21) und nach
einer Multiplikation mit einem komplexwertigen Faktor cos(N.
ϕ)+j.sin(N.
ϕ)vom ursprünglichen Eingangssignal subtrahiert (22). Das resultierende Signal V wird
zu dem um einen Abtastwert verzögerten Ausgangssignal addiert (23). Das Resultat multipliziert
mit einem weiteren komplexwertigen Faktor cos(
ϕ)+j.sin(
ϕ) ergibt das neue Ausgangssignal Y (24). Die überstrichenen Bezeichner für V und Y
markieren jeweils den Imaginärteil.
[0043] Die zweite komplexe Multiplikation setzt das Eingangssignal periodisch fort. Die
Addition des verzögerten und durch die erste komplexe Multiplikation gewichteten Eingangssignals
bricht die Fortsetzung des Eingangssignals nach N Abtastwerten wieder ab.
[0044] Das gesamte Filter, bestehend aus Real- und Imaginärteilausgang, hat den Amplitudenfrequenzgang
Wobei f
A die Abtastfrequenz bezeichnet.
[0045] Die zunächst geringe Sperrdämpfung dieser Bandpässe läßt sich erhöhen, indem man
K+1 solcher Bandpässe mit gleicher Impulsantwortlänge N, aber verschiedenen Werten
von ϕ parallel berechnet, ihre Phasengänge durch eine weitere komplexe Multiplikation
einander anpaßt und ihre Ausgangssignale gewichtet aufaddiert:
mit
(f
M: Mittenfrequenz des Bandpasses) und
[0046] Die Sperrdämpfung der resultierenden Filter nimmt mit der (K+1) ten Potenz des Abstandes
der Signalfrequenz zur Mittenfrequenz des Filters ab: Die Impulsantwort des gesamten
Filters hat die Form
für den Realteil und
für den Imaginärteil. Dies entspricht den in Gl. 2 und 3 beschriebenen Charakteristiken.
Liste der Bezugszeichen
[0047]
- 1a
- Testsignal, linker Kanal
- 1b
- Testsignal, rechter Kanal
- 1c
- Referenzsignal, linker Kanal
- 1d
- Referenzsignal, rechter Kanal
- 2
- Vorfilterung
- 3
- Filterbank
- 4
- spektrale Verschmierung
- 5
- Berechnung der Betragsquadrate
- 6
- zeitliche Verschmierung
- 7
- Pegel- und Frequenzgangangleich
- 8
- Addition von Eigenrauschen
- 9
- zeitliche Verschmierung
- 10
- Berechnung von Ausgangsparametern
- 11
- Ausgangsparameter
1. Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mit Hilfe von
Filtern, zeitlicher Verschmierung, Pegel- und Frequenzgangleich, dadurch gekennzeichnet, dass das zu bewertende Audiosignal als Testsignal (1a, 1b) mit einem als Referenzsignal
(1c, 1d) gelieferten Originalsignal verglichen wird, dass das Testsignal (1a,1b) und
das Referenzsignal (1c,1d) zunächst einer Vorfilterung (2) unterworfen werden, danach
in eine Filterbank (3) geleitet werden, so dass danach eine spektrale Verschmierung
(4) erfolgt, dass dann die Berechnung von Betragsquadraten (5) erfolgt, worauf eine
zeitliche Verschmierung durchgeführt wird, dass die so erzielten Ausgangsgrößen einem
Pegel- und Frequenzgangangleich (7) unterworfen werden und dass danach eine Addition
von Eigenrauschen des Gehörs (8) erfolgt, worauf wiederum eine zeitliche Verschmierung
(9) und eine Berechnung (10) von Ausgangsparametern (11) erfolgt oder der Regel- und
Frequenzangleich zwischen der zeitlichen Verschmierung und der Berechnung von Ausgangsparametern
durchgeführt wird.
2. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass die Filterbank (3) gehörangepasst ist und aus jedem einlaufenden Signal durch rekursive
komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz
erzeugt, dass die zu einem Testsignal (1a,1b) gehörende Sinusschwingung durch Subtraktion
des um den Kehrwert der gewünschten Filterbandbreite um eine entsprechende Zeit verzögerten
und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangstestsignal
(1a,1b) wieder abgebrochen wird.
3. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass durch Faltung im Frequenzbereich aus je n Filterausgängen gleicher Bandbreite und
um jeweils den Kehrwert der Fensterlänge versetzter Mittenfrequenz ein der Fouriertransformierten
eines cosn (n-1) förmigen Zeitfensters ein entsprechender Dämpfungsverlauf erzeugt wird.
4. Verfahren nach einem der Patentansprüche 2 oder 3, dadurch gekennzeichnet, dass der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz im Übergang
zwischen Durchlassbereich und Sperrbereich durch eine weitere Faltung im Frequenzbereich
bestimmt wird.
5. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass aus jedem einlaufenden Testsignal (1a,1b) durch rekursive komplexe Multiplikation
eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt
wird, dass die zu einem Eingangstestsignal (1a, 1b) gehörende Sinusschwingung durch
Subtraktion des um den Kehrwert der gewünschten Filterbandbreite entsprechende Zeit
verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten
Eingangstestsignal (1a,1b) wieder abgebrochen wird, dass durch Faltung im Frequenzbereich
aus je n Filterausgängen gleicher Bandbreite und jeweils den Kehrwert der Fensterlänge
versetzter Mittenfrequenzen ein der Fouriertransformierten eines cosn (n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt wird und dass
der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz durch eine
weitere Faltung im Frequenzbereich bestimmt wird.
6. Verfahren nach einem der Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass die Eingangstestsignale (1a,1b) und die Referenzsignale (1c,1d) jeweils für einen
linken und einen rechten Kanal, das heißt paarweise als Eingangsgröße eingeführt werden.
7. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass beide Signale bzw. Signalpaare (1a,1b; 1c,1d) nach einer Vorfilterung (2) durch eine
Filterbank (3) in den Frequenzbereich zerlegt werden, dass durch die Charakteristik
der Filterbank (3) und eine anschließende zeitliche Verschmierung (9) der Filterausgangssignale
eine gehörgerechte Darstellung der als Testsignal (1a,1b) zu bewertenden Audiosignale
erzeugt wird und dass durch Vergleich der gehörgerechten Darstellungen von Testsignal
(1a,1b) und Referenzsignal (1c,1d) nach nichtlinearen Umformungen eine Abschätzung
des zu erwartenden Höreindrucks geliefert wird.
8. Verfahren nach einem der Patentansprüche 1 bis 7, dadurch gekennzeichnet, dass nach der Filterung mit Übertragungsfunktionen von Außen- und Mittelohr Eingangssignale
durch eine gehörangepasste Filterbank (3) eine Umrechnung in eine Zeit-Tonheits-Darstellung
durchgeführt wird, dass danach Betragsquadrate (5) der Filterausgangssignale berechnet
werden und eine Faltung der Filteräusgangssignale mit einer Verschmierungsfunktion
(6) durchgeführt wird.
9. Verfahren nach Patentanspruch 8, dadurch gekennzeichnet, dass die Faltung vor oder nach der Gleichrichtung erfolgt.
10. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass Pegelunterschiede zwischen Test- und Referenzsignal (1a,1b bzw. 1c,1d) sowie lineare
Verzerrungen des Referenzsignales (1c,1d) kompensiert und getrennt ausgewertet werden.
11. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass ein Teil der zeitlichen Verschmierung direkt nach der Gleichrichtung erfolgt.
12. Verfahren nach einem der Patentansprüche 1 oder 5, dadurch gekennzeichnet, dass eine gehörangepasste Filterbank (3) verwendet wird, die eine Signalabhängigkeit der
Filtercharakteristiken dadurch erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer
pegelabhängigen Verschmierungsfunktion im Frequenzbereich gefaltet werden
13. Verfahren nach einem der Patentansprüche 1 bis 12, dadurch gekennzeichnet, dass im Referenzsignal (1c,1d) vorhandene und lediglich in ihrer spektralen Verteilung
veränderten Signalanteile von additiven bzw. von durch nicht Linearitäten erzeugten
Störungen getrennt werden und dass die Trennung dieser Störanteile durch Auswertung
der Orthogonalitätsbeziehung zwischen den zeitlichen Verläufen der Hüllkurven an einander
entsprechenden Filterausgängen des zu bewertenden Testsignals (1a,1b) und des Referenzsignals
(1c,1d) erfolgt.
14. Verfahren nach einem der Patentansprüche 1 bis 13, dadurch gekennzeichnet, dass die Filterbank (3) aus einer beliebigen wählbaren Anzahl von Filterpaaren für Test-
und Referenzsignal (1a,1b) bzw. 1c,1d) besteht und dass die Filter auf weitgehend
beliebigen Tonhöhenskalen gleichmäßig verteilt werden.
15. Verfahren nach einem der Patentansprüche 1 bis 14, dadurch gekennzeichnet, dass die Ausgangswerte der Filterbank (3) zur Berücksichtigung der Simultanverdeckung
an der oberen Flanke spektral verschmiert werden, dass der Pegel (L) abhängig für
jeden Filterausgang aus dem mit einer Zeitkonstante tiefpassgefilterten Betragsquadrat
(5) des entsprechenden Ausgangswertes berechnet wird oder ohne Tiefpassfilter bestimmt
und stattdessen der Verschmierungsfaktor tiefpassgefiltert wird und dass die Verschmierung
unabhängig für die Filter, die den Realteil des Signals repräsentieren und die Filter,
die den Imaginärteil des Signals repräsentieren, durchgeführt wird.
16. Verfahren nach einem der Patentansprüche 1 bis 15, dadurch gekennzeichnet, dass die zeitliche Verschmierung der Filterausgangssignale in zwei Stufen erfolgt, wobei
in der ersten Stufe die Signale über ein Cosinus2-förmiges Zeitfenster ermittelt werden und in der zweiten Stufe eine Nachverdeckung
moduliert wird.
17. Verfahren nach Patentanspruch 16, dadurch gekennzeichnet, dass die Cosinus2-förmigen Zeitfenster eine Länge zwischen 1 bis 16 ms haben.
18. Verfahren nach einem der Patentansprüche 1 bis 17, dadurch gekennzeichnet, dass zum Pegelangleich die momentanen Betragsquadrate (5) an den Filterausgängen durch
Tiefpässe erster Ordnung zeitlich geglättet werden, dass die verwendeten Zeitkonstanten
in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt werden und dass
ein Korrekturfaktor aus der Orthogonalitätsbeziehung zwischen spektraler Hüllkurven
der zeitlich geglätteten Filterausgänge von Test- und Referenzsignal (1a, 1b; 1c,
1d) berechnet wird.
19. Verfahren nach Patentanspruch 18, dadurch gekennzeichnet, dass das Testsignal mit dem Korrekturfaktor multipliziert wird, wenn der Korrekturfaktor
< 1 ist und das Referenzsignal durch den Korrekturfaktor geteilt wird, wenn der Korrekturfaktor
> 1 ist.
20. Verfahren nach einem der Patentansprüche 1 bis 19, dadurch gekennzeichnet, dass für jeden Filterkanal Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen
den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal (1a,1b;
1c,1d) berechnet werden.
21. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass aus der auf die Modulation des Referenzsignals normierten (absolute) Differenz der
Hüllkurven von Test- und Referenzsignal für jeden Filterkanal und jedes Filterband
eine Modulationsdifferenz bestimmt wird, die nach zeitlicher und spektraler Mittelung
zur Abschätzung bestimmter hörbarer Störungen geeignet ist.
22. Verfahren nach einem der Patentansprüche 1 bis 21, dadurch gekennzeichnet, dass aus Eingangswerten in Form der Betragsquadrate (5) in jedem Filterkanal, die Hüllkurvenmodulation,
das Eigenrauschen des Gehörs und Konstanten eine gedrosselte Störlautheit ermittelt
und über Zeit und Filterkanäle gemittelt wird.
23. Verfahren nach einem der Patentansprüche 1 bis 22, dadurch gekennzeichnet, dass das Eingangssignal (X) um N Abtastwerte verzögert und nach einer Multiplikation mit
einem komplexwertigen Faktor vom ursprünglichen Eingangssignal subtrahiert wird, dass
das resultierende Signal (V) zu dem um einen Abtastwert verzögerten Ausgangssignal
addiert wird und dass das Resultat multipliziert mit einem weiteren komplexwertigen
Faktor das neue Ausgangssignal ergibt.
1. Measurement method for aurally compensated quality assessment of audio signals with
the aid of filters, temporal smearing, and level and frequency response matching,
characterized in that the audio signal to be assessed is compared as a test signal (1a, 1b) to an original
signal supplied as reference signal (1c, 1d), in that the test signal (1a, 1b) and the reference signal (1c, 1d) are first subjected to
a prefiltering (2), are next passed into a filter bank (3) so that a spectral smearing
(4) then takes place, in that calculation of absolute squares (5) is then performed, whereupon a temporal smearing
takes place, in that the output quantities thus obtained are subjected to a level and frequency response
matching (7), and in that an addition of inherent noise (8) of the human auditory system then takes place,
whereupon another temporal smearing (9) and a calculation (10) of output parameters
(11) takes place, or alternately the level and frequency response matching is performed
after the temporal smearing and before the calculation of output parameters.
2. Method according to claim 1, characterized in that the filter bank (3) is aurally matched and generates an undamped sinusoidal oscillation
with the desired filter center frequency from each incoming signal through recursive
complex multiplication, in that the sinusoidal oscillation pertaining to a test signal (1a, 1b) is again truncated
by subtraction of the input test signal (1a, 1b), said signal having been delayed
by a time corresponding to the reciprocal of the desired filter bandwidth and multiplied
by the phase angle corresponding to the delay.
3. Method according to claim 1, characterized in that an attenuation curve corresponding to the Fourier transform of a time window having
a cosn (n-1) shape is generated through convolution, in the frequency domain, of each set
of n filter outputs having equal bandwidth and having center frequencies offset in
each case by the reciprocal of the window length.
4. Method according to any one of claims 2 or 3, characterized in that the attenuation curve is determined at relatively great separation from the filter
center frequency in the transition between pass band and stop band by a further convolution
in the frequency domain.
5. Method according to any one of the preceding claims, characterized in that an undamped sinusoidal oscillation with the desired filter center frequency is generated
from each incoming test signal (1a, 1b) through recursive complex multiplication,
in that the sinusoidal oscillation pertaining to an incoming test signal (1a, 1b) is again
truncated by subtraction of the input test signal (1a, 1b), said signal having been
delayed by a time corresponding to the reciprocal of the desired filter bandwidth
and multiplied by the phase angle corresponding to the delay, in that an attenuation curve corresponding to the Fourier transform of a time window having
a cosn (n-1) shape is generated through convolution, in the frequency domain, of each set
of n filter outputs having equal bandwidth and having center frequencies offset in
each case by the reciprocal of the window length, and in that the attenuation curve is determined at relatively great separation from the filter
center frequency by a further convolution in the frequency domain.
6. Method according to any one of claims 1 through 5, characterized in that the input test signals (1a, 1b) and the reference signals (1c, 1d) are each fed in
for a left channel and a right channel, which is to say in pairs, as input quantities.
7. Method according to any one of the preceding claims, characterized in that both signals or signal pairs (1a, 1b; 1c, 1d) are decomposed in the frequency domain
after prefiltering (2) by a filter bank (3), in that an aurally compensated representation of the audio signals to be evaluated as the
test signal (1a, 1b) is generated through the characteristics of the filter bank (3)
and a subsequent temporal smearing (9) of the filter output signals, and in that an estimation of the auditory perception to be expected is provided by comparison
of the aurally compensated representations of the test signal (1a, 1b) and reference
signal (1c, 1d) after nonlinear transformations.
8. Method according to any one of claims I through 7, characterized in that, after the filtering with transfer functions of input signals of the outer and middle
ear by an aurally matched filter bank (3), a conversion to a time-pitch representation
is performed, in that thereafter absolute squares (5) of the filter output signals are calculated, and
a convolution of the filter output signals with a smearing function (6) is performed.
9. Method according to claim 8, characterized in that the convolution occurs either before or after the rectification.
10. Method according to any one of claims 1 through 9, characterized in that differences in level between the test and reference signal (1a, 1b or 1c, 1d, respectively)
and linear distortions of the reference signal (1c, 1d) are compensated and are evaluated
separately.
11. Method according to any one of claims 1 through 9, characterized in that a part of the temporal smearing takes place directly after the rectification.
12. Method according to any one of claims 1 or 5, characterized in that an aurally matched filter bank (3) is used, said filter bank achieving a signal dependency
of the filter characteristics through convolution of the filter outputs with a level-dependent
smearing function in the frequency domain prior to the rectification/value determination.
13. Method according to any one of claims 1 through 12, characterized in that signal components present in the reference signal (1c, 1d) and changed only in their
spectral distribution are separated from additive distortions or from distortions
produced by non-linearities, and in that the separation of these distortion components is accomplished by analysis of the
orthogonality relationship between the time behavior of the envelope curves at corresponding
filter outputs of the test signal (1a, 1b) to be assessed and of the reference signal
(1c, 1d).
14. Method according to any one of claims 1 through 13, characterized in that the filter bank (3) consists of an arbitrarily chosen number of filter pairs for
the test and reference signal (1a, 1b or 1c, 1d, respectively), and in that the filters are evenly distributed over largely arbitrary pitch scales.
15. Method according to any one of claims 1 through 14, characterized in that the output values of the filter bank (3) are spectrally smeared to account for simultaneous
masking at the upper edge, in that the level (L) is calculated dependently for each filter output from the absolute
square (5) of the corresponding output value, said absolute square having been low-pass-filtered
with a time constant, or is determined without the low-pass filter and instead the
smearing factor is low-pass-filtered, and in that the smearing is carried out independently for the filters representing the real part
of the signal and the filters representing the imaginary part of the signal.
16. Method according to any one of claims 1 through 15, characterized in that the temporal smearing of the filter output signal takes place in two stages, with
the signals being determined in the first stage through a time window having a cosine2 shape, and subsequent masking being modulated in the second stage.
17. Method according to claim 16, characterized in that the cosine2 shaped time windows are between 1 and 16 ms in length.
18. Method according to any one of claims 1 through 17, characterized in that the instantaneous absolute squares (5) at the filter outputs are temporally smoothed
by first-order low-pass filters for level matching, in that the time constants used are selected as a function of the center frequency of the
filter in question, and in that a correction factor is calculated from the orthogonality relationship between spectral
envelope curves of the temporally smoothed filter outputs of the test and reference
signals (1a, 1b; 1c, 1d).
19. Method according to claim 18, characterized in that the test signal is multiplied by the correction factor if the correction factor <
1, and the reference signal is divided by the correction factor if the correction
factor > 1.
20. Method according to any one of claims 1 through 19, characterized in that correction factors are calculated from the orthogonality relationship between the
temporal envelope curves of the filter outputs of the test and reference signals (1a,
1b; 1c, 1d) for each filter channel.
21. Method according to claim 1, characterized in that a modulation difference is determined, for each filter channel and each filter band,
from the (absolute) difference between the envelope curves of test and reference signals
normalized to the modulation of the reference signal, said modulation difference being
suitable, after temporal and spectral averaging, for estimating certain audible distortions.
22. Method according to any one of claims 1 through 21, characterized in that a throttled noise loudness is determined from input values in the form of the absolute
squares (5) in each filter channel, the envelope curve modulation, the inherent noise
of the human auditory system, and constants, and is averaged over time and filter
channels.
23. Method according to any one of claims 1 through 22, characterized in that the input signal (X) is delayed by N sampled values and after being multiplied by
a complex-valued factor is subtracted from the original input signal, in that the resultant signal (V) is added to the output signal delayed by a sampled value,
and in that the result multiplied by another complex-valued factor yields the new output signal.
1. Procédé de mesure d'évaluation de la qualité auditive de signaux audio à l'aide de
filtres, d'un étalement temporel, d'une harmonisation du niveau et de la fréquence
caractérisé en ce que
le signal audio à évaluer est comparé comme signal-test (1a, 1b) avec un signal original
livré comme signal de référence (1c, 1d),
le signal-test (1a, 1b) et le signal de référence (1c, 1d) sont d'abord soumis à un
préfiltrage (2), puis conduits dans un banc de filtrage (3), de sorte qu'il est procédé
ensuite à un étalement spectral (4),
l'évaluation des carrés de valeurs absolues (5) s'effectue ensuite, après quoi il
est procédé à un étalement temporel,
les grandeurs de sorties ainsi atteintes sont soumises à une harmonisation du niveau
et de la fréquence (7) et
une addition de bruit auditif propre (8) est enfin effectuée, suite à quoi il est
à nouveau procédé à un étalement temporel (9) et à un calcul (10) des paramètres de
sortie (11) ou à l'harmonisation du niveau et de la fréquence entre l'étalement temporel
et le calcul de paramètres de sortie.
2. Procédé selon la revendication 1,
caractérisé en ce que
le banc de filtrage (3) est adapté auditivement et produit une oscillation sinusoïdale
non amortie dotée de la fréquence centrale de filtrage souhaitée à partir de chaque
signal entrant à l'aide d'une multiplication récursive complexe,
l'oscillation sinusoïdale appartenant à un signal-test (1a, 1b) est de nouveau interrompue
par soustraction du signal-test d'entrée (1a, 1b) retardé d'une période correspondante
de la valeur réciproque de la largeur de bande souhaitée et multiplié par l'angle
de phase correspondant au retard.
3. Procédé selon la revendication 1, caractérisé en ce que
une courbe d'atténuation correspondant à la transformée de Fourier d'une fenêtre temporelle
de forme cosn (n-1) est produite par convolution dans la gamme des fréquences, à partir de n sorties
de filtre de même largeur de bande et à partir de la valeur réciproque de la longueur
de fenêtre de fréquences centrales décalées.
4. Procédé selon l'une des revendications 2 ou 3, caractérisé en ce que
la courbe d'atténuation est définie par une autre convolution dans la gamme des fréquences,
et ce à une plus grande distance de la fréquence centrale de filtrage en transition
entre la bande de transmission et la bande éliminée.
5. Procédé selon l'une des revendications précédentes,
caractérisé en ce que
une oscillation sinusoïdale non amortie à la fréquence centrale de filtrage souhaitée
est produite par multiplication récursive complexe à partir de chaque signal-test
(1a, 1b) entrant,
l'oscillation sinusoïdale appartenant à un signal-test d'entrée (1a, 1b) est de nouveau
interrompue par soustraction du signal-test d'entrée (1a, 1b) retardé de la période
correspondante de la valeur réciproque de la largeur de bande souhaitée et multipliée
par l'angle de phase correspondant au retard,
une courbe d'atténuation correspondant à la transformée de Fourier d'une fenêtre temporelle
de forme cosn (n-1) est produite par convolution dans la gamme des fréquences, à partir de n sorties
de filtre de même largeur de bande et à partir de la valeur réciproque de la longueur
de fenêtre de fréquences centrales décalées, et
la courbe d'atténuation est définie par une autre convolution dans la gamme des fréquences,
et ce à une plus grande distance de la fréquence centrale de filtrage.
6. Procédé selon l'une des revendications 1 à 5, caractérisé en ce que
les signaux-tests d'entrée (1a, 1b) et les signaux de référence (1c, 1d) sont introduits
chacun pour un canal de droite et un canal de gauche, c'est-à-dire par paire, comme
grandeur d'entrée.
7. Procédé selon l'une des revendications précédentes,
caractérisé en ce que
les deux signaux ou les paires de signaux (1a, 1b ; 1c, 1d) sont décomposés par un
banc de filtrage (3) après un préfiltrage (2) dans la gamme des fréquences,
une présentation conforme à l'audition des signaux audio (1a, 1b) à évaluer comme
signal-test est produite par la caractéristique du banc de filtrage (3) et un étalement
temporel (9) des signaux de sortie de filtre et
une estimation de l'impression auditive à attendre est livrée par comparaison des
présentations conformes à l'audition de signaux-test (1a, 1b) et de signaux de référence
(1c, 1d) selon des déformages non linéaires.
8. Procédé selon l'une des revendications 1 à 7,
caractérisé en ce que
une conversion en une représentation de tonalité temporelle s'effectue grâce à un
banc de filtrage (3) adapté à l'audition après le filtrage avec des fonctions de transmission
de signaux d'entrée d'oreille externe et d'oreille moyenne,
des carrés de valeurs absolues (5) des signaux de sortie de filtre sont calculés ensuite
et une convolution des signaux de sortie de filtre est effectuée avec une fonction
d'étalement (6).
9. Procédé selon la revendication 8, caractérisé en ce que
la convolution s'effectue avant ou après le redressement.
10. Procédé selon l'une des revendications 1 à 9, caractérisé en ce que
les différences de niveau entre le signal-test et le signal de référence (1a, 1b ou
1c, 1d) ainsi que les distorsions linéaires du signal de référence (1c, 1d) sont compensées
et analysées séparément.
11. Procédé selon l'une des revendications 1 à 9, caractérisé en ce qu'une partie de l'étalement temporel s'effectue directement après le redressement.
12. Procédé selon l'une des revendications 1 ou 5, caractérisé en ce qu'un banc de filtrage (3) adapté à l'audition est utilisé, ledit banc atteignant une
dépendance des caractéristiques de filtrage par rapport au signal en ceci que les
sorties de filtre sont convoluées dans la gamme des fréquences avant le redressement/la
constitution de la valeur absolue à l'aide d'une fonction d'étalement dépendante du
niveau.
13. Procédé selon l'une des revendications 1 à 12,
caractérisé en ce que
des parts de signaux existantes dans le signal de référence (1c, 1d) et modifiées
uniquement dans leur répartition spectrale sont séparés des interférences additives
ou produites par des non-linéarités, et
la séparation de ces parts d'interférences s'effectue par analyse de la relation d'orthogonalité
entre les phases temporelles des enveloppantes sur les sorties de filtre, correspondant
l'une à l'autre, du signal-test (1a, 1b) à évaluer et du signal de référence (1c,
1d).
14. Procédé selon l'une des revendications 1 à 13,
caractérisé en ce que
le banc de filtrage (3) est composé d'un nombre éligible arbitraire de paires de filtres
pour signal-test et de référence (1a, 1b ou 1c, 1d) et
les filtres sont répartis régulièrement sur des échelles de tonalité en grande partie
arbitraire.
15. Procédé selon l'une des revendications 1 à 14,
caractérisé en ce que
les valeurs de sortie du banc de filtrage (3) sont étalées spectralement sur le flanc
supérieur pour tenir compte de la couverture simultanée,
le niveau (L) est calculé en fonction de chaque sortie de filtre à partir du carré
de valeur absolue (5) de la valeur de sortie correspondante, filtré en passe-bas avec
une constante temporelle, ou déterminé sans filtre passe-bas, le facteur d'étalement
étant filtré au lieu de cela en passe-bas, et
l'étalement s'effectue indépendamment pour les filtres qui représentent la part réelle
du signal et pour les filtres qui représentent la part imaginaire du signal.
16. Procédé selon l'une des revendications 1 à 15, caractérisé en ce que
l'étalement temporel des signaux de sortie de filtre s'effectue en deux étapes, les
signaux étant détectés à la première étape par l'intermédiaire d'une fenêtre temporelle
en forme de cosinus2 et une couverture ultérieure étant modulée à la deuxième étape.
17. Procédé selon la revendication 16, caractérisé en ce que
les fenêtres temporelles en forme de cosinus2 ont une longueur comprise entre 1 et 16 ms.
18. Procédé selon l'une des revendications 1 à 17,
caractérisé en ce que,
pour l'harmonisation du niveau, les carrés momentanés de valeurs absolues (5) sont
lissés temporellement sur les sorties de filtre par des passe-bas de premier ordre,
les constantes temporelles utilisées sont choisies en fonction de la fréquence centrale
du filtre respectif et
un facteur de correction est calculé à partir de la relation d'orthogonalité entre
les enveloppantes spectrales des sorties de filtre du signal-test et du signal de
référence (1a, 1b ; 1c, 1d) lissées temporellement.
19. Procédé selon la revendication 18,
caractérisé en ce que
le signal-test est multiplié par le facteur de correction si ledit facteur de correction
est < 1 et
le signal de référence est divisé par le facteur de correction si ledit facteur de
correction est > i.
20. Procédé selon l'une des revendications 1 à 19, caractérisé en ce que
des facteurs de correction sont calculés pour chaque canal de filtrage à partir de
la relation d'orthogonalité entre les enveloppantes temporelles des sorties de filtre
du signal-test et de référence (1a, 1b ; 1c, 1d).
21. Procédé selon la revendication 1, caractérisé en ce que
une différence de modulation est définie pour chaque canal de filtrage et pour chaque
bande de filtrage à partir de la différence (absolue), normée sur la modulation du
signal de référence, des enveloppantes de signal-test et de signal de référence, ladite
différence de modulation étant adaptée à estimer certaines interférences audibles
après indication temporelle et spectrale.
22. Procédé selon l'une des revendications 1 à 21, caractérisé en ce que
des valeurs d'entrée servent, sous forme des carrés de valeur absolue (5) dans chaque
canal de filtrage, de la modulation des enveloppantes, du bruit de fond de l'audition
et des constantes, à détecter un volume sonore atténué des interférences, celui-ci
étant transmis par canaux temporels et de filtrage.
23. Procédé selon l'une des revendications 1 à 22,
caractérisé en ce que
le signal d'entrée (X) est retardé de N valeurs de balayage et soustrait du signal
d'entrée original après une multiplication par un facteur de valeur complexe,
le signal résultant (V) est ajouté au signal de sortie retardé d'une valeur de balayage
et
le résultat multiplié par un autre facteur de valeur complexe donne le nouveau signal
de sortie.