[0002] Im Rundfunk, Internet und Heimbereich hat mittlerweile neben Zweikanal-Stereo und
Mono auch das 5.1 Tonformat Einzug erhalten. Durch die Zunahme der verfügbaren Tonformate
steigt somit auch der Aufwand der Audioproduktion, d.h. der Aufwand der Aufnahme und
Abmischung in die entsprechenden Tonformate. Ebenso muss eine Kompatibilität zu den
Wiedergabegeräten gewährleistet sein, damit diese unabhängig von der Anzahl der Audiokanäle,
die sie wiedergeben können, jedes Tonformat trotzdem abspielen können.
[0003] Die eine Möglichkeit ist die Aussendung des Tonformats mit der größten Anzahl an
Audiokanälen und - falls nötig - einer automatischen empfängerseitigen Konvertierung
des Signals auf ein Tonformat mit geringerer Anzahl an Audiokanälen (automatischer
Downmix).
[0004] Ebenso kann bereits in der Audioproduktion das Material in allen Formaten produziert
werden und diese parallel (simulcast) ausgestrahlt werden. Hierbei kann die Erstellung
jedes Tonformats einzeln erfolgen. Diese Art der Abmischung erfordert jedoch einen
erheblichen Produktionsaufwand. Meistens sind hierzu entweder zusätzliche Arbeitskräfte,
ein merklich höherer Zeitaufwand oder mehrfache Ausstattung (z.B. im Fall von Liveübertragungen)
nötig. Der resultierende Produktionsumfang ist daher schwer tragbar. Alternativ kann
- wie in voriger Vorgehensweise - ein automatischer Downmix erfolgen.
[0005] Solche Verfahren zur automatischen Umrechnung existieren bereits, allerdings sind
weitere Verbesserungen notwendig, um für ein möglichst breites Spektrum an Ausgangsmaterial
ein qualitativ zufriedenstellendes Ergebnis zu liefern.
[0006] Automatische Downmixverfahren können grob in aktive und passive Verfahren unterteilt
werden. Aktive Verfahren adaptieren die automatische Umrechung je nach Ausgangsmaterial,
wobei passive Verfahren signalunabhängig funktionieren. Ein bekanntes passives Downmixverfahren
liegt der Rundfunkempfehlung ITU-R BS.775 zugrunde und ist in Figur 1 erläutert.
[0007] Ausgehend von einem fünfkanaligen Tonformat mit den Tonkanälen
- Linkskanal (L)
- Rechtskanal (R)
- Centerkanal (C)
- Linkshintenkanal (Ls)
- Rechtshintenkanal (Rs),
sieht das bekannte Downmixverfahren zunächst eine Pegelabsenkung des Centerkanals
C, sowie des Linkshintenkanal LS und des Rechtshintenkanals RS um jeweils -3dB durch
die Dämpfungsfunktion 50, bzw. 60 bzw. 70 vor.
[0008] Der um - 3dB abgesenkte Centerkanal wird über die Summationsfunktionen 10, bzw. 20
auf den Linkskanal L und den Rechtskanal R verteilt, unter Bildung eines ersten Summensignals
(Ausgang Summationsfunktionen 10) und eines zweiten Summensignals (Ausgang Summationsfunktionen
20). Die im Pegel um -3dB abgesenkten Linkshinten- und Rechtshintensignale Ls, bzw.
Rs werden über Summationsfunktionen 30, bzw. 40 auf das erste, bzw. zweite Summensignal
verteilt, unter Bildung des Links- und Rechtskanäls L
0, R
0 des gewünschten zweikanaligen Tonformates.
[0009] Bei dem aktiven Verfahren werden in den Summationsfunktionen des Blockschaltbildes
nach Figur 1 die Eigenschaften der zu summierenden Audiosignale überprüft und ggf.
korrigiert, um unerwünschte Klangergebnisse zu vermeiden. Hierzu hat die Firma Coding
Technologies einen Downmixalgorithmus vorgeschlagen bei welchem ausgehend von dem
ITU-Downmix nach Figur 1 der Energiegehalt aller Summationssignale in 28 Frequenzbänder/Teilbänder
analysiert und mit dem Energiegehalt des fünfkanaligen Audioformates verglichen wird.
Auf diese Weise können Anhebungen und Absenkungen des Energiegehaltes ermittelt und
durch Amplitudenkorrecktur in den betreffenden Teilbändern kompensiert werden. Eine
Klangfarbenveränderung durch einen Kammfiltereffekt kann so begrenzt werden. Die Korrektur
erfolgt aber nur zu einem sinnvollen Anteil, da ein vollständig sich auslöschendes
Signal einen unendlich großen Korrekturfaktor hervorrufen würde. Indessen können bei
dem Downmixalgorithmus der Firma Coding Technologies Verschiebungen der Phantomschallquelle
zwischen den resultierenden Links- und Rechtskanälen des zweikanaligen Tonformates
auftreten und zwar in Abhängigkeit von der ursprünglichen Position der Phantomschallquellen
in dem fünfkanaligen Quellmaterial.
[0010] Zur Verringerung von derartigen Verschiebungen der Phantomschallquelle hat die Firma
Lexicon das Verfahren Logic 7 vorgeschlagen, bei welchem neben dem Downmix auch die
Möglichkeit zu einem Upmix besteht. Der Mehrkanalton kann sowohl auf ein Mono als
auch ein Stereosignal downgemixt werden. Ferner können aus einem Stereodownmix, beispielsweise
bis zu acht Kanäle dekodiert werden. Hierzu werden über variable Koeffizienten der
Anteil des Centerkanals im Downmix geregelt und mit weiteren Koeffizienten der Anteile
der Rechtshinten- und Linkshintenkanäle angepasst werden. Für den Linkskanal wird
ein Anteil von 0.91 des Linkshintenkanals mit einem Anteil von -0.38 des Rechtshintenkanals.
Die Mischung für den Rechtskanal erfolgt entsprechend. Mit dieser Vorgehensweise bleiben
die Pegel der beiden Hintenkanäle erhalten. Durch die Phasendrehung von 90° wird die
spätere Trennung der beiden Hintenkanäle von den Links- und Lechtskanälen möglich.
Allerdings lassen sich bei dem Verfahren Logic 7 Klangfarbenveränderungen infolge
von Kammfiltereffekten durch Phasendrehungen nicht begrenzen.
[0011] Die Aufgabe der Erfindung besteht darin, die Verschiebung der Phantomschallquellen,
die Änderung der Pegeldifferenz zwischen kohärenten und inkohärenten Signalanteilen
als auch Klangfarbenveränderungen weitgehend zu kompensieren.
[0012] Die Lösung dieser Aufgabe ergibt sich aus den Merkmalen des Patentanspruchs 1.
[0013] Der Erfindung liegt die Überlegung zugrunde, bei der Bildung des ersten (L') und
zweiten (R') Summensignals jeweils eine dynamische Korrektur der Spektralwerte von
überlappenden Zeitfenstern mit k Abtastwerten des Linkskanals (L) bzw. Rechtskanals
(R) vorzunehmen. Desweiteren erfolgt bei der Bildung des dritten und vierten Summensignals
jeweils eine dynamische Korrektur der Spektralwerte von überlappenden Zeitfenstern
mit k Abtastwerten des ersten (L') bzw. zweiten (R') Summensignals.
[0014] Die Erfindung wird anhand eines in den Figuren 2 bis 6 gezeigten Ausführungsbeispiels
näher erläutert. Es zeigt:
Figur 2 ein generelles Blockschaltbild zu einer Anordnung zur Durchführung des erfindungsgemäßen
Verfahrens; Figuren 3 - 6 Ablaufdiagramme für die in den Analyse- und Korrekturblöcken
vorgesehenen Funktionen.
[0015] Das in Figur 2 veranschaulichte Blockschalbild ist ähnlich aufgebaut, wie das Blockschaltbild
in Figur 1, jedoch mit dem wesentlichen Unterschied, dass in den Summationsfunktionen
100 und 200 zur Bildung der ersten und zweiten Summensignale L' und R', sowie in den
Summationsfunktionen 300 und 400 zur Bildung der Links- und Rechtssignale L
IRT und R
IRT des zweikanaligen Tonformates zusätzlich zur Summation eine Analyse und Korrektur
1-4 erfolgt. Die Pegelabsenkung des Centersignal C, sowie der Rechtshinten- und Linkshintensignale
Ls, Rs erfolgt bei dem Blockschaltbild 2 in Übereinstimmung mit dem Blockschaltbild
nach Figur 1 um beispielsweise - 3dB durch Dämpfungsfunktionen 50, 60, bzw. 70. Allerdings
sind auch andere Dämpfungen als -3 dB denkbar insbesondere in Abhängigkeit von dem
Genre bzw. Inhalt des fünfkanaligen Quellensignals.
[0016] Der funktionale Aufbau der Analyse und Korrekturblöcke 100, 200, 300, 400 in Figur
2 ist für den Block 100 anhand der Figur 3, für den Block 200 anhand der Figur 4,
für den Block 300 anhand der Figur 5 und für den Block 400 anhand der Figur 6 erläutert.
[0017] Der in Figur 3 dargestellte Block 100 sieht zunächst eine Transformation der eingangsseitigen
Links, bzw. Centersignal L bzw. C in Spektralwerte beispielsweise durch eine FFT 101
vor. Die gebildeten Spektralwerte l(k), c(k) werden in der Summierfunktion 102 addiert.
Die Betragssumme S
l(k) der Spektralwerte wird anschließend in der Entscheidungsraute 103 dahingehend
bewertet ob sie größer als ein Sollwert A
soll,l(k) ist. Der Sollwert A
Soll,l(k) bestimmt sich zu
[0018] Ist die Betragssumme größer als A
soll,l(k), so wird in Block 104 der Wert
gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme
nicht größer als der Sollwert A
soll,l(k), so werden in Block 105 die Spektralwerte l(k) des linken Kanals mit einem Faktor
m
l(k) gewichtet. Der Faktor m
l(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung.
Das Produkt m
l(k) * l(k) wird mit den Spektralwerten c(k) des Centerkanals addiert (m
l(k) * l + c).
[0019] Im Ergebnis wird in dem Block 100 mithilfe der Entscheidungsraute 103 das im Pegel
angepasste Signal l'(k) entweder nach m
l(k) * l(k) + c(k) oder A
Soll,l(k) + (|l(k) + c(k)| - A
Soll,l(k)) * n gebildet, welches nach einer inversen Transformation 106 das erste Summensignal
L' ergibt.
[0020] Der in Figur 4 dargestellte Block 200 sieht zunächst eine Transformation der eingangsseitigen
Rechts, bzw. Centersignale R bzw. C in Spektralwerte beispielsweise durch eine FFT
201 vor. Die gebildeten Spektralwerte r(k), c(k) werden in der Summierfunktion 202
addiert. Die Betragssumme S
r(k) der Spektralwerte wird anschließend in der Entscheidungsraute 203 dahingehend
bewertet ob sie größer als ein Sollwert A
Soll,r(k) ist. Der Sollwert A
Soll,r(k) bestimmt sich zu
[0021] Ist die Betragssumme größer als A
Soll,r(k), so wird in Block 204 der Wert
gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme
nicht größer als der Sollwert A
Soll,r(k), so werden in Block 205 die Spektralwerte r(k) des rechten Kanals mit einem Faktor
m
r(k) gewichtet. Der Faktor m
r(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung.
Das Produkt m
r(k) * r wird mit den Spektralwerten c(k) des Centerkanals addiert (m
r(k) * r(k) +c(k)).
[0022] Im Ergebnis wird in dem Block 200 mithilfe der Entscheidungsraute 203 das im Pegel
angepasste Signal r'(k) entweder nach m
r(k) * r(k) + c(k) oder A
Soll,r(k) + (|r(k) + c(k)| - A
Soll,r(k)) * n gebildet, welches nach einer inversen Transformation 206 das zweite Summensignal
R' ergibt.
[0023] Der in Figur 5 dargestellte Block 300 sieht die zunächst eine Transformation der
eingangsseitigen Linkshintensignals, bzw. ersten Summensignals Ls bzw. L' in Spektralwerte
beispielsweise durch eine FFT 301 vor. Die gebildeten Spektralwerte ls(k), l'(k) werden
in der Summierfunktion 302 addiert. Die Betragssumme S
ls(k) der Spektralwerte wird anschließend in der Entscheidungsraute 304 dahingehend
bewertet ob sie größer als ein Sollwert A
Soll,ls(k) ist. Der Sollwert A
Soll,ls(k) bestimmt sich zu
[0024] Ist die Betragssumme größer als A
Soll,ls(k), so wird in Block 304 das Signal
gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme
nicht größer als der Sollwert A
Soll,ls(k), so werden in Block 305 die Spektralwerte l'(k) des ersten Summensignals mit dem
Faktor m
ls(k) gewichtet. Der Faktor m
ls(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung.
Das Produkt m
ls(k) * l'(k) wird mit den Spektralwerten ls(k) des Linkshintenkanals addiert (m
ls(k) * l'(k) + ls(k)). Im Ergebnis wird in dem Block 300 mithilfe der Entscheidungsraute
303 das im Pegel angepasste Signal entweder nach m
ls(k) * l'(k) + ls(k) oder A
Soll,ls(k) + (|l'(k) + ls(k)| - A
Soll,ls(k)) * n gebildet, welches nach einer inversen Transformation 306 das dritte Summensignal
und somit das linke Ausgangssignal L ergibt.
[0025] Der in Figur 6 dargestellte Block 400 sieht die zunächst eine Transformation der
eingangsseitigen Linkshintensignals, bzw. zweiten Summensignals Rs bzw. R' in Spektralwerte
beispielsweise durch eine FFT 401 vor. Die gebildeten Spektralwerte rs(k), r'(k) werden
in der Summierfunktion 402 addiert. Die Betragssumme S
rs(k) der Spektralwerte wird anschließend in der Entscheidungsraute 403 dahingehend
bewertet ob sie größer als ein Sollwert A
Soll,rs(k) ist. Der Sollwert A
Soll,rs(k) bestimmt sich zu
[0026] Ist die Betragssumme größer als A
Soll,ls(k), so wird das Signal
gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme
nicht größer als der Sollwert A
Soll,rs(k), so werden in Block 405 die Spektralwerte r'(k) des ersten Summensignals mit dem
Faktor m
rs(k) gewichtet. Der Faktor m
rs(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung.
Das Produkt m
rs(k) * r'(k) wird mit den Spektralwerten rs(k) des Rechtshintenkanals addiert (m
rs(k) * r'(k) + rs(k)).
[0027] Im Ergebnis wird in dem Block 400 mithilfe der Entschedidungsraute 403 das im Pegel
angepasste Signal entweder nach m
rs(k) * r'(k) + rs(k) oder A
Soll,rs(k) + (|r'(k) + rs(k)| - A
Soll,rs(k)) * n gebildet, welches nach einer inversen Transformation 406 das vierte Summensignal
und somit das rechte Ausgangssignal R ergibt.
[0028] Es versteht sich, dass die Erfindung nicht auf einen Downmix eines fünfkanaligen
Tonformates auf ein zweikanaliges Tonformat beschränkt ist.
[0029] Es ist ebenso gut im Rahmen der Erfindung möglich, ein zweikanaliges Tonformat (Stereo)
auf ein einkanaliges Tonformat (Mono) kompatibel abzumischen.
1. Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates, insbesondere eines zweikanaligen
Tonformates, mit Rechtskanal (R
IRT) und Linkskanal (L
IRT) aus einem mehrkanaligen Tonformat, insbesondere einem fünfkanaligen Tonformat, mit
folgenden Tonkanälen:
- Linkskanal (L)
- Rechtskanal (R)
- Centerkanal (C)
- Linkshintenkanal (Ls)
- Rechtshintenkanal (Rs),
bei welcher
- der Centerkanal (C) im Pegel abgesenkt wird
- der im Pegel abgesenkte Centerkanal (C) auf den Linkskanal (L) verteilt wird unter
Bildung eines ersten Summensignals (L')
- der Linkshintenkanal (Ls) im Pegel abgesenkt wird
- der im Pegel abgesenkte Linkshintenkanal (Ls) auf das erste Summensignal unter Bildung
des dritten Summensignals verteilt wird, welches dem Linkskanal (LIRT) des zweikanaligen Tonformates entspricht
- der im Pegel abgesenkte Centerkanal (C) auf den Rechtskanal (R) verteilt wird unter
Bildung eines zweiten Summensignals (R'),
- der Rechtshintenkanal (Rs) im Pegel abgesenkt wird
- der im Pegel abgesenkte Rechtshintenkanal (Rs) auf das zweite Summensignal unter
Bildung eines vierten Summensignals verteilt wird, welches dem Rechtskanal (RIRT) des zweikanaligen Tonformates entspricht,
dadurch gekennzeichnet, dass bei der Bildung des ersten (L') und zweiten (R') Summensignals jeweils eine dynamische
Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des
Linkskanals (L) bzw. Rechtskanals (R) erfolgt,
dass bei der Bildung des dritten und vierten Summensignals jeweils eine dynamische
Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des
ersten (L') bzw. zweiten (R') Summensignals erfolgt,
dass vor jeder dynamischen Korrektur von Spektralwerten des Linkskanals (L) und Rechtskanals
(R) jede Summe der Spektralwerte mit einem Sollwert (A
soll, mit
) verglichen wird, welcher sich aus folgender Beziehung ergibt:
in welcher
|l(k)| der Betrag eines Spektralwertes des transformierten Linkskanals (L) in der
komplexen Zahlenebene C,
|c(k)| der Betrag des zugehörigen Spektralwertes des transformierten Centerkanals
(C) in der komplexen Zahlenebene
,
|r(k)| der Betrag eines Spektralwertes des transformierten Rechtskanals (R) in der
komplexen Zahlenebene
,
bedeuten,
dass vor jeder dynamischen Korrektur von Spektralwerten des ersten (L') bzw. zweiten
(R') Summensignals jede Summe der Spektralwerte mit einem Sollwert (A
soll, mit
) verglichen wird, welcher sich aus folgender Beziehung ergibt:
in welcher
|r'(k)| der Betrag der Spektralwerte des transformierten dritten Summensignals (R')
in der komplexen Zahlenebene
,
|l'(k)| der Betrag des zugehörigen Spektralwertes des transformierten ersten Summensignals
(L') in der komplexen Zahlenebene
, |rs(k)| der Betrag des Spektralwertes des transformierten Rechtshintenkanals Rs
in der komplexen Zahlenebene,
|ls(k)| der Betrag des zugehörigen Spektralwertes des transformierten Linkshintenkanals
Ls in der komplexen Zahlenebene
, bedeuten, dass für
den Fall, dass der Sollwert (A
soll, mit
) überschritten wird, die Frequenzkomponente aufaddiert und die daraus resultierende
Betragssumme nach
abgesenkt wird, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist,
und
dass für den Fall, dass der Sollwert (A
soll, mit
) unterschritten wird, die Spektralwerte der jeweils zu korrigierenden Signale mit
folgendem Faktor (m(k), mit m(k) ∈
) multipliziert werden:
wobei
A(k) der k-te Spektralwert von r', 1', 1 und r, mit
B (k) der k-te Spektralwert von rs, ls, und c, mit
insbesondere dem Wert w ein Skalierungsfaktor im Bereich von -1 < w< 1 bedeuten,
mit
2. Anordnung zum Erzeugen eines abwärtskompatiblen Tonformates, einschliessend Mittel
um die Schritte des Verfahrens nach Anspruch 1 auszuführen.
1. Method for generating a downward-compatible sound format, in particular a two-channel
sound format, with a right channel (R
IRT) and a left channel (L
IRT) from a multichannel sound format, in particular a five-channel sound format, with
the following sound channels:
- left channel (L)
- right channel (R)
- center channel (C)
- left rear channel (Ls)
- right rear channel (Rs),
in which
- the level of the center channel (C) is reduced
- the center channel (C) with the reduced level is distributed on the left channel
(L) by forming a first sum signal (L')
- the level of the left rear channel (Ls) is reduced
- the left rear channel (Ls) with the reduced level is distributed on the first sum
signal by forming a third sum signal, which corresponds to the left channel (LIRT) of the two-channel sound format
- the center channel (C) with the reduced level is distributed on the right channel
(R) by forming a second sum signal (R'),
- the level of the right rear channel (Rs) is reduced
- the right rear channel (Rs) with the reduced level is distributed on the second
sum signal by forming a fourth sum signal, which corresponds to the right channel
(RIRT) of the two-channel sound format,
characterized in that in the forming of the first (L') and the second (R') sum signals a dynamic correction
of the spectral values of overlapping time windows with k sample values of the left
channel (L) and the right channel (R), respectively, is performed,
that in the forming of the third and fourth sum signals a dynamic correction of the
spectral values of overlapping time windows with k sample values of the first (L')
second (R') sum signals, respectively, is performed,
that before each dynamic correction of spectral values of the left channel (L) resp.
the right channel (R), each sum of the spectral values is compared to a target value
(A
soll, with
) which follows from the following relationship:
in which
|l(k)| is the absolute value of a spectral value of the transformed left channel (L)
in the complex plane
,
|c(k)| is the absolute value of the associated spectral value of the transformed center
channel (C) in the complex plane
,
|r(k)| is the absolute value of a spectral value of the transformed right channel
(R) in the complex plane
,
that before each dynamic correction of spectral values of the first (L') resp. second
(R') sum signals, each sum of the spectral values is compared to a target value (A
soll, with A
soll ∈
), which follows from the following relationship:
in which
|r'(k)| is the absolute value of a spectral value of the transformed third sum signals
(R') in the complex plane
,
|l'(k)| is the absolute value of the associated spectral value of the transformed
first sum signal (L') in the complex plane
,
|rs(k)| is the absolute value of a spectral value of the transformed right rear channel
(Rs) in the complex plane
,
|ls(k)| is the absolute value of the associated spectral value of the transformed
left rear channel (Ls) in the complex plane
,
that for the case that the target value (A
soll, with
) is exceeded, the frequency component is added and the absolute sum value resulting
therefrom is reduced according to
wherein n is a factor larger than 0.1 and smaller than 0.4, and
that for the case that the target value (A
soll, with
) is fallen short of, the spectral values of the respective signals to be corrected
are multiplied with the following factor (m(k), with
):
wherein
A(k) is the k
th spectral value of r', l', l and r, with
B(k) is the k
th spectral value of rs, ls and c, with
wherein in particular w is a scaling factor in the range of -1 < w < 1, with W ∈
R.
2. Apparatus for generating a downward-compatible sound format, comprising means for
performing the steps of the method according to claim 1.
1. Procédé destiné à la génération d'un format audio à compatibilité descendante, en
particulier d'un format audio à double canal,
avec un canal de droite (R
IRT) et un canal de gauche (L
IRT) à partir d'un format audio à plusieurs canaux, en particulier d'un format audio
à cinq canaux, avec les canaux audio suivants :
- canal de gauche (L)
- canal de droite (R)
- canal central (C)
- canal arrière de gauche (Ls)
- canal arrière de droite (Rs),
pour lesquels
- le canal central (C) est abaissé dans le niveau du signal
- le canal central (C) abaissé dans le niveau du signal est distribué sur le canal
de gauche (L) par la formation d'un premier signal de somme (L')
- le canal arrière de gauche (Ls) est abaissé dans le niveau du signal
- le canal arrière de gauche (Ls) abaissé dans le niveau du signal est distribué sur
le premier signal de somme par la formation du troisième signal de somme, lequel correspond
au canal de gauche (LIRT) du format audio à double canal
- le canal central (C) abaissé dans le niveau du signal est distribué sur le canal
de droite (R) par la formation d'un deuxième signal de somme (R'),
- le canal arrière de droite (Rs) est abaissé dans le niveau du signal
- le canal arrière de droite (Rs) abaissé dans le niveau du signal est distribué sur
le deuxième signal de somme par la formation d'un quatrième signal de somme, lequel
correspond au canal de droite (RIRT) du format audio à double canal,
caractérisé en ce que, lors de la formation du premier (L') et du deuxième (R') signal de somme a lieu respectivement
une correction dynamique des valeurs spectrales de fenêtres de temps se chevauchant
avec des échantillons k du canal de gauche (L) ou du canal de droite (R),
en ce que, lors de la formation du troisième et du quatrième signal de somme a lieu respectivement
une correction dynamique des valeurs spectrales de fenêtres de temps avec des échantillons
k du premier (L') ou du deuxième (R') signal de somme,
en ce que, avant chaque correction dynamique des valeurs spectrales du canal de gauche (L)
et du canal de droite (R), chaque somme des valeurs spectrales est comparée à une
valeur nominale (A
soll, avec A
soll € R), laquelle résulte de la relation suivante :
dans laquelle
|l(k)| signifie le montant d'une valeur spectrale du canal de gauche (L) transformé
au niveau complexe des chiffres C,
|c(k)| signifie le montant de la valeur spectrale associée du canal central (C) transformé
au niveau complexe des chiffres C,
|r(k)| signifie le montant d'une valeur spectrale du canal de droite (R) transformé
au niveau complexe des chiffres C,
en ce que, avant chaque correction dynamique des valeurs spectrales du premier (L') ou du deuxième
(R') signal de somme, chaque somme des valeurs spectrales est comparée à une valeur
nominale (A
soll, avec A
soll € R) laquelle résulte de la relation suivante :
dans laquelle
|r'(k)| signifie le montant des valeurs spectrales du troisième signal de somme (R)
transformé au niveau complexe des chiffres C,
|l'(k)| signifie le montant de la valeur spectrale associée du premier signal de somme
(L') transformé au niveau complexe des chiffres C,
|rs(k)| signifie le montant de la valeur spectrale du canal arrière de droite Rs transformé
au niveau complexe des chiffres,
|ls(k)| signifie le montant de la valeur spectrale associée du canal arrière de gauche
Ls transformé au niveau complexe des chiffres C,
en ce que, au cas où la valeur nominale (A
soll, avec A
soll € R) est dépassée par le haut, les composantes de fréquence sont additionnées et
le montant total en résultant est abaissé selon la formule
où n représente un facteur supérieur à 0,1 et inférieur à 0,4 et
caractérisé en ce que, au cas où la valeur nominale (A
soll, avec A
soll € R) est dépassée par le bas, les valeurs spectrales des signaux à corriger respectivement
sont multipliées par le facteur suivant (m(k), avec m(k) € R) :
où
A(k) signifie la k
e valeur spectrale de r', l', 1 et r, avec A(k) € C
où
B(k) signifie la k
e valeur spectrale de rs, ls et c, avec B(k)€ C, avec en particulier la valeur w qui
signifie un facteur d'échelle dans la plage comprise entre -1 < w < 1, avec w € R.
2. disposition destinée à la génération d'un format audio à compatibilité descendante,
y compris un moyen en vue de réaliser les phases du procédé selon la revendication
1.