VERFAHREN ZUM ERZEUGEN EINES ABWÄRTSKOMPATIBLEN TONFORMATES

(19)

(11)

EP 2 353 305 B1

(12)	EUROPÄISCHE PATENTSCHRIFT

(45)	Hinweis auf die Patenterteilung:
	23.03.2016 Patentblatt 2016/12

(21)	Anmeldenummer: 09753036.4

(22)	Anmeldetag: 07.11.2009

(51)

Internationale Patentklassifikation (IPC):

H04S 3/00^(2006.01)

(86)	Internationale Anmeldenummer:
	PCT/EP2009/007971

(87)	Internationale Veröffentlichungsnummer:
	WO 2010/054780 (20.05.2010 Gazette 2010/20)

(54)	VERFAHREN ZUM ERZEUGEN EINES ABWÄRTSKOMPATIBLEN TONFORMATES METHOD FOR GENERATING A DOWNWARD-COMPATIBLE SOUND FORMAT PROCÉDÉ DE PRODUCTION D'UN FORMAT SONORE À COMPATIBILITÉ DESCENDANTE

(84)	Benannte Vertragsstaaten:
	AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK SM TR

(30)

Priorität:

11.11.2008 DE 102008056704

(43)	Veröffentlichungstag der Anmeldung:
	10.08.2011 Patentblatt 2011/32

(73)	Patentinhaber: Institut für Rundfunktechnik GmbH
	80939 München (DE)

(72)	Erfinder:
	STOLL, Gerhard 85406 Zolling (DE) GROH, Jens 80807 München (DE) LINK, Martin 82131 Gauting (DE) DEIGMÖLLER, Jörg 80807 München (DE) RUNOW, Bernfried 78532 Tuttlingen (DE) KEIL, Martin 81543 München (DE)

(74)	Vertreter: Dini, Roberto et al
	Metroconsult S.r.l. Via Sestriere 100 10060 None (TO) 10060 None (TO) (IT)

(56)

Entgegenhaltungen: :

David Griesinger: "Progress in 5-2-5 Matrix Systems" Lexicon homepage 25. Oktober 2001 (2001-10-25), XP002568517 Gefunden im Internet: URL:http://www.lexicon.com/logic7/whitepap ers.asp> [gefunden am 2010-01-27]
Bernfried Runow: "Automatischer Stereo-Downmix von 5.1-Mehrkanalproduktionen" 13. Februar 2009 (2009-02-13), XP002568518 Gefunden im Internet: URL:http://www.b-public.de/da/da_runow_dow nmix.pdf> [gefunden am 2010-01-27]
Bernfried Runow, Jörg Deigmöller: "Optimierter Stereo-Downmix von 5.1-Mehrkanalproduktionen" 25. Tonmeistertagung vom 13.-16.11.2008 - VDT international convention, November 2008 16. November 2008 (2008-11-16), XP002568519 Gefunden im Internet: URL:http://www.b-public.de/da/Downmix%20TM T-Manuskript-2008%20Runow.pdf> [gefunden am 2010-01-27]

Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen).

Beschreibung

[0001] Die Erfindung bezieht sich auf ein Verfahren gemäß dem Oberbegriff des Patentanspruchs 1. Ein derartiges Verfahren ist aus der Druckschrift Griesinger D.: "Progress in 5-2-5 Matrix Systems", URL: "http://www.lexicon.com/logic7/whitepapers.asp" bekannt.

[0002] Im Rundfunk, Internet und Heimbereich hat mittlerweile neben Zweikanal-Stereo und Mono auch das 5.1 Tonformat Einzug erhalten. Durch die Zunahme der verfügbaren Tonformate steigt somit auch der Aufwand der Audioproduktion, d.h. der Aufwand der Aufnahme und Abmischung in die entsprechenden Tonformate. Ebenso muss eine Kompatibilität zu den Wiedergabegeräten gewährleistet sein, damit diese unabhängig von der Anzahl der Audiokanäle, die sie wiedergeben können, jedes Tonformat trotzdem abspielen können.

[0003] Die eine Möglichkeit ist die Aussendung des Tonformats mit der größten Anzahl an Audiokanälen und - falls nötig - einer automatischen empfängerseitigen Konvertierung des Signals auf ein Tonformat mit geringerer Anzahl an Audiokanälen (automatischer Downmix).

[0004] Ebenso kann bereits in der Audioproduktion das Material in allen Formaten produziert werden und diese parallel (simulcast) ausgestrahlt werden. Hierbei kann die Erstellung jedes Tonformats einzeln erfolgen. Diese Art der Abmischung erfordert jedoch einen erheblichen Produktionsaufwand. Meistens sind hierzu entweder zusätzliche Arbeitskräfte, ein merklich höherer Zeitaufwand oder mehrfache Ausstattung (z.B. im Fall von Liveübertragungen) nötig. Der resultierende Produktionsumfang ist daher schwer tragbar. Alternativ kann - wie in voriger Vorgehensweise - ein automatischer Downmix erfolgen.

[0005] Solche Verfahren zur automatischen Umrechnung existieren bereits, allerdings sind weitere Verbesserungen notwendig, um für ein möglichst breites Spektrum an Ausgangsmaterial ein qualitativ zufriedenstellendes Ergebnis zu liefern.

[0006] Automatische Downmixverfahren können grob in aktive und passive Verfahren unterteilt werden. Aktive Verfahren adaptieren die automatische Umrechung je nach Ausgangsmaterial, wobei passive Verfahren signalunabhängig funktionieren. Ein bekanntes passives Downmixverfahren liegt der Rundfunkempfehlung ITU-R BS.775 zugrunde und ist in Figur 1 erläutert.

[0007] Ausgehend von einem fünfkanaligen Tonformat mit den Tonkanälen

Linkskanal (L)
Rechtskanal (R)
Centerkanal (C)
Linkshintenkanal (Ls)
Rechtshintenkanal (Rs),

sieht das bekannte Downmixverfahren zunächst eine Pegelabsenkung des Centerkanals C, sowie des Linkshintenkanal LS und des Rechtshintenkanals RS um jeweils -3dB durch die Dämpfungsfunktion 50, bzw. 60 bzw. 70 vor.

[0008] Der um - 3dB abgesenkte Centerkanal wird über die Summationsfunktionen 10, bzw. 20 auf den Linkskanal L und den Rechtskanal R verteilt, unter Bildung eines ersten Summensignals (Ausgang Summationsfunktionen 10) und eines zweiten Summensignals (Ausgang Summationsfunktionen 20). Die im Pegel um -3dB abgesenkten Linkshinten- und Rechtshintensignale Ls, bzw. Rs werden über Summationsfunktionen 30, bzw. 40 auf das erste, bzw. zweite Summensignal verteilt, unter Bildung des Links- und Rechtskanäls L₀, R₀ des gewünschten zweikanaligen Tonformates.

[0009] Bei dem aktiven Verfahren werden in den Summationsfunktionen des Blockschaltbildes nach Figur 1 die Eigenschaften der zu summierenden Audiosignale überprüft und ggf. korrigiert, um unerwünschte Klangergebnisse zu vermeiden. Hierzu hat die Firma Coding Technologies einen Downmixalgorithmus vorgeschlagen bei welchem ausgehend von dem ITU-Downmix nach Figur 1 der Energiegehalt aller Summationssignale in 28 Frequenzbänder/Teilbänder analysiert und mit dem Energiegehalt des fünfkanaligen Audioformates verglichen wird. Auf diese Weise können Anhebungen und Absenkungen des Energiegehaltes ermittelt und durch Amplitudenkorrecktur in den betreffenden Teilbändern kompensiert werden. Eine Klangfarbenveränderung durch einen Kammfiltereffekt kann so begrenzt werden. Die Korrektur erfolgt aber nur zu einem sinnvollen Anteil, da ein vollständig sich auslöschendes Signal einen unendlich großen Korrekturfaktor hervorrufen würde. Indessen können bei dem Downmixalgorithmus der Firma Coding Technologies Verschiebungen der Phantomschallquelle zwischen den resultierenden Links- und Rechtskanälen des zweikanaligen Tonformates auftreten und zwar in Abhängigkeit von der ursprünglichen Position der Phantomschallquellen in dem fünfkanaligen Quellmaterial.

[0010] Zur Verringerung von derartigen Verschiebungen der Phantomschallquelle hat die Firma Lexicon das Verfahren Logic 7 vorgeschlagen, bei welchem neben dem Downmix auch die Möglichkeit zu einem Upmix besteht. Der Mehrkanalton kann sowohl auf ein Mono als auch ein Stereosignal downgemixt werden. Ferner können aus einem Stereodownmix, beispielsweise bis zu acht Kanäle dekodiert werden. Hierzu werden über variable Koeffizienten der Anteil des Centerkanals im Downmix geregelt und mit weiteren Koeffizienten der Anteile der Rechtshinten- und Linkshintenkanäle angepasst werden. Für den Linkskanal wird ein Anteil von 0.91 des Linkshintenkanals mit einem Anteil von -0.38 des Rechtshintenkanals. Die Mischung für den Rechtskanal erfolgt entsprechend. Mit dieser Vorgehensweise bleiben die Pegel der beiden Hintenkanäle erhalten. Durch die Phasendrehung von 90° wird die spätere Trennung der beiden Hintenkanäle von den Links- und Lechtskanälen möglich. Allerdings lassen sich bei dem Verfahren Logic 7 Klangfarbenveränderungen infolge von Kammfiltereffekten durch Phasendrehungen nicht begrenzen.

[0011] Die Aufgabe der Erfindung besteht darin, die Verschiebung der Phantomschallquellen, die Änderung der Pegeldifferenz zwischen kohärenten und inkohärenten Signalanteilen als auch Klangfarbenveränderungen weitgehend zu kompensieren.

[0012] Die Lösung dieser Aufgabe ergibt sich aus den Merkmalen des Patentanspruchs 1.

[0013] Der Erfindung liegt die Überlegung zugrunde, bei der Bildung des ersten (L') und zweiten (R') Summensignals jeweils eine dynamische Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des Linkskanals (L) bzw. Rechtskanals (R) vorzunehmen. Desweiteren erfolgt bei der Bildung des dritten und vierten Summensignals jeweils eine dynamische Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des ersten (L') bzw. zweiten (R') Summensignals.

[0014] Die Erfindung wird anhand eines in den Figuren 2 bis 6 gezeigten Ausführungsbeispiels näher erläutert. Es zeigt:

Figur 2 ein generelles Blockschaltbild zu einer Anordnung zur Durchführung des erfindungsgemäßen Verfahrens; Figuren 3 - 6 Ablaufdiagramme für die in den Analyse- und Korrekturblöcken vorgesehenen Funktionen.

[0015] Das in Figur 2 veranschaulichte Blockschalbild ist ähnlich aufgebaut, wie das Blockschaltbild in Figur 1, jedoch mit dem wesentlichen Unterschied, dass in den Summationsfunktionen 100 und 200 zur Bildung der ersten und zweiten Summensignale L' und R', sowie in den Summationsfunktionen 300 und 400 zur Bildung der Links- und Rechtssignale L_IRT und R_IRT des zweikanaligen Tonformates zusätzlich zur Summation eine Analyse und Korrektur 1-4 erfolgt. Die Pegelabsenkung des Centersignal C, sowie der Rechtshinten- und Linkshintensignale Ls, Rs erfolgt bei dem Blockschaltbild 2 in Übereinstimmung mit dem Blockschaltbild nach Figur 1 um beispielsweise - 3dB durch Dämpfungsfunktionen 50, 60, bzw. 70. Allerdings sind auch andere Dämpfungen als -3 dB denkbar insbesondere in Abhängigkeit von dem Genre bzw. Inhalt des fünfkanaligen Quellensignals.

[0016] Der funktionale Aufbau der Analyse und Korrekturblöcke 100, 200, 300, 400 in Figur 2 ist für den Block 100 anhand der Figur 3, für den Block 200 anhand der Figur 4, für den Block 300 anhand der Figur 5 und für den Block 400 anhand der Figur 6 erläutert.

[0017] Der in Figur 3 dargestellte Block 100 sieht zunächst eine Transformation der eingangsseitigen Links, bzw. Centersignal L bzw. C in Spektralwerte beispielsweise durch eine FFT 101 vor. Die gebildeten Spektralwerte l(k), c(k) werden in der Summierfunktion 102 addiert. Die Betragssumme S_l(k) der Spektralwerte wird anschließend in der Entscheidungsraute 103 dahingehend bewertet ob sie größer als ein Sollwert A_soll,l(k) ist. Der Sollwert A_Soll,l(k) bestimmt sich zu

[0018] Ist die Betragssumme größer als A_soll,l(k), so wird in Block 104 der Wert

gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme nicht größer als der Sollwert A_soll,l(k), so werden in Block 105 die Spektralwerte l(k) des linken Kanals mit einem Faktor m_l(k) gewichtet. Der Faktor m_l(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung. Das Produkt m_l(k) * l(k) wird mit den Spektralwerten c(k) des Centerkanals addiert (m_l(k) * l + c).

[0019] Im Ergebnis wird in dem Block 100 mithilfe der Entscheidungsraute 103 das im Pegel angepasste Signal l'(k) entweder nach m_l(k) * l(k) + c(k) oder A_Soll,l(k) + (|l(k) + c(k)| - A_Soll,l(k)) * n gebildet, welches nach einer inversen Transformation 106 das erste Summensignal L' ergibt.

[0020] Der in Figur 4 dargestellte Block 200 sieht zunächst eine Transformation der eingangsseitigen Rechts, bzw. Centersignale R bzw. C in Spektralwerte beispielsweise durch eine FFT 201 vor. Die gebildeten Spektralwerte r(k), c(k) werden in der Summierfunktion 202 addiert. Die Betragssumme S_r(k) der Spektralwerte wird anschließend in der Entscheidungsraute 203 dahingehend bewertet ob sie größer als ein Sollwert A_Soll,r(k) ist. Der Sollwert A_Soll,r(k) bestimmt sich zu

[0021] Ist die Betragssumme größer als A_Soll,r(k), so wird in Block 204 der Wert

gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme nicht größer als der Sollwert A_Soll,r(k), so werden in Block 205 die Spektralwerte r(k) des rechten Kanals mit einem Faktor m_r(k) gewichtet. Der Faktor m_r(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung. Das Produkt m_r(k) * r wird mit den Spektralwerten c(k) des Centerkanals addiert (m_r(k) * r(k) +c(k)).

[0022] Im Ergebnis wird in dem Block 200 mithilfe der Entscheidungsraute 203 das im Pegel angepasste Signal r'(k) entweder nach m_r(k) * r(k) + c(k) oder A_Soll,r(k) + (|r(k) + c(k)| - A_Soll,r(k)) * n gebildet, welches nach einer inversen Transformation 206 das zweite Summensignal R' ergibt.

[0023] Der in Figur 5 dargestellte Block 300 sieht die zunächst eine Transformation der eingangsseitigen Linkshintensignals, bzw. ersten Summensignals Ls bzw. L' in Spektralwerte beispielsweise durch eine FFT 301 vor. Die gebildeten Spektralwerte ls(k), l'(k) werden in der Summierfunktion 302 addiert. Die Betragssumme S_ls(k) der Spektralwerte wird anschließend in der Entscheidungsraute 304 dahingehend bewertet ob sie größer als ein Sollwert A_Soll,ls(k) ist. Der Sollwert A_Soll,ls(k) bestimmt sich zu

[0024] Ist die Betragssumme größer als A_Soll,ls(k), so wird in Block 304 das Signal

gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme nicht größer als der Sollwert A_Soll,ls(k), so werden in Block 305 die Spektralwerte l'(k) des ersten Summensignals mit dem Faktor m_ls(k) gewichtet. Der Faktor m_ls(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung. Das Produkt m_ls(k) * l'(k) wird mit den Spektralwerten ls(k) des Linkshintenkanals addiert (m_ls(k) * l'(k) + ls(k)). Im Ergebnis wird in dem Block 300 mithilfe der Entscheidungsraute 303 das im Pegel angepasste Signal entweder nach m_ls(k) * l'(k) + ls(k) oder A_Soll,ls(k) + (|l'(k) + ls(k)| - A_Soll,ls(k)) * n gebildet, welches nach einer inversen Transformation 306 das dritte Summensignal und somit das linke Ausgangssignal L ergibt.

[0025] Der in Figur 6 dargestellte Block 400 sieht die zunächst eine Transformation der eingangsseitigen Linkshintensignals, bzw. zweiten Summensignals Rs bzw. R' in Spektralwerte beispielsweise durch eine FFT 401 vor. Die gebildeten Spektralwerte rs(k), r'(k) werden in der Summierfunktion 402 addiert. Die Betragssumme S_rs(k) der Spektralwerte wird anschließend in der Entscheidungsraute 403 dahingehend bewertet ob sie größer als ein Sollwert A_Soll,rs(k) ist. Der Sollwert A_Soll,rs(k) bestimmt sich zu

[0026] Ist die Betragssumme größer als A_Soll,ls(k), so wird das Signal

gebildet, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist. Ist die Betragssumme nicht größer als der Sollwert A_Soll,rs(k), so werden in Block 405 die Spektralwerte r'(k) des ersten Summensignals mit dem Faktor m_rs(k) gewichtet. Der Faktor m_rs(k) ist größer als eins und dient ebenso wie der vorgenannte Faktor n zur Pegelanpassung. Das Produkt m_rs(k) * r'(k) wird mit den Spektralwerten rs(k) des Rechtshintenkanals addiert (m_rs(k) * r'(k) + rs(k)).

[0027] Im Ergebnis wird in dem Block 400 mithilfe der Entschedidungsraute 403 das im Pegel angepasste Signal entweder nach m_rs(k) * r'(k) + rs(k) oder A_Soll,rs(k) + (|r'(k) + rs(k)| - A_Soll,rs(k)) * n gebildet, welches nach einer inversen Transformation 406 das vierte Summensignal und somit das rechte Ausgangssignal R ergibt.

[0028] Es versteht sich, dass die Erfindung nicht auf einen Downmix eines fünfkanaligen Tonformates auf ein zweikanaliges Tonformat beschränkt ist.

[0029] Es ist ebenso gut im Rahmen der Erfindung möglich, ein zweikanaliges Tonformat (Stereo) auf ein einkanaliges Tonformat (Mono) kompatibel abzumischen.

Ansprüche

1. Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates, insbesondere eines zweikanaligen Tonformates, mit Rechtskanal (R_IRT) und Linkskanal (L_IRT) aus einem mehrkanaligen Tonformat, insbesondere einem fünfkanaligen Tonformat, mit folgenden Tonkanälen:

- Linkskanal (L)

- Rechtskanal (R)

- Centerkanal (C)

- Linkshintenkanal (Ls)

- Rechtshintenkanal (Rs),

bei welcher

- der Centerkanal (C) im Pegel abgesenkt wird

- der im Pegel abgesenkte Centerkanal (C) auf den Linkskanal (L) verteilt wird unter Bildung eines ersten Summensignals (L')

- der Linkshintenkanal (Ls) im Pegel abgesenkt wird

- der im Pegel abgesenkte Linkshintenkanal (Ls) auf das erste Summensignal unter Bildung des dritten Summensignals verteilt wird, welches dem Linkskanal (L_IRT) des zweikanaligen Tonformates entspricht

- der im Pegel abgesenkte Centerkanal (C) auf den Rechtskanal (R) verteilt wird unter Bildung eines zweiten Summensignals (R'),

- der Rechtshintenkanal (Rs) im Pegel abgesenkt wird

- der im Pegel abgesenkte Rechtshintenkanal (Rs) auf das zweite Summensignal unter Bildung eines vierten Summensignals verteilt wird, welches dem Rechtskanal (R_IRT) des zweikanaligen Tonformates entspricht,

dadurch gekennzeichnet, dass bei der Bildung des ersten (L') und zweiten (R') Summensignals jeweils eine dynamische Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des Linkskanals (L) bzw. Rechtskanals (R) erfolgt,
dass bei der Bildung des dritten und vierten Summensignals jeweils eine dynamische Korrektur der Spektralwerte von überlappenden Zeitfenstern mit k Abtastwerten des ersten (L') bzw. zweiten (R') Summensignals erfolgt,
dass vor jeder dynamischen Korrektur von Spektralwerten des Linkskanals (L) und Rechtskanals (R) jede Summe der Spektralwerte mit einem Sollwert (A_soll, mit

) verglichen wird, welcher sich aus folgender Beziehung ergibt:

in welcher

|l(k)| der Betrag eines Spektralwertes des transformierten Linkskanals (L) in der komplexen Zahlenebene C,

|c(k)| der Betrag des zugehörigen Spektralwertes des transformierten Centerkanals (C) in der komplexen Zahlenebene

,

|r(k)| der Betrag eines Spektralwertes des transformierten Rechtskanals (R) in der komplexen Zahlenebene

,

bedeuten,
dass vor jeder dynamischen Korrektur von Spektralwerten des ersten (L') bzw. zweiten (R') Summensignals jede Summe der Spektralwerte mit einem Sollwert (A_soll, mit

) verglichen wird, welcher sich aus folgender Beziehung ergibt:

in welcher

|r'(k)| der Betrag der Spektralwerte des transformierten dritten Summensignals (R') in der komplexen Zahlenebene

,

|l'(k)| der Betrag des zugehörigen Spektralwertes des transformierten ersten Summensignals (L') in der komplexen Zahlenebene

, |rs(k)| der Betrag des Spektralwertes des transformierten Rechtshintenkanals Rs in der komplexen Zahlenebene,

|ls(k)| der Betrag des zugehörigen Spektralwertes des transformierten Linkshintenkanals Ls in der komplexen Zahlenebene

, bedeuten, dass für

den Fall, dass der Sollwert (A_soll, mit

) überschritten wird, die Frequenzkomponente aufaddiert und die daraus resultierende Betragssumme nach

abgesenkt wird, wobei n ein Faktor größer 0.1 und kleiner 0.4 ist,
und
dass für den Fall, dass der Sollwert (A_soll, mit

) unterschritten wird, die Spektralwerte der jeweils zu korrigierenden Signale mit folgendem Faktor (m(k), mit m(k) ∈

) multipliziert werden:

wobei
A(k) der k-te Spektralwert von r', 1', 1 und r, mit

B (k) der k-te Spektralwert von rs, ls, und c, mit

insbesondere dem Wert w ein Skalierungsfaktor im Bereich von -1 < w< 1 bedeuten, mit

2. Anordnung zum Erzeugen eines abwärtskompatiblen Tonformates, einschliessend Mittel um die Schritte des Verfahrens nach Anspruch 1 auszuführen.

Claims

1. Method for generating a downward-compatible sound format, in particular a two-channel sound format, with a right channel (R_IRT) and a left channel (L_IRT) from a multichannel sound format, in particular a five-channel sound format, with the following sound channels:

- left channel (L)

- right channel (R)

- center channel (C)

- left rear channel (Ls)

- right rear channel (Rs),

in which

- the level of the center channel (C) is reduced

- the center channel (C) with the reduced level is distributed on the left channel (L) by forming a first sum signal (L')

- the level of the left rear channel (Ls) is reduced

- the left rear channel (Ls) with the reduced level is distributed on the first sum signal by forming a third sum signal, which corresponds to the left channel (L_IRT) of the two-channel sound format

- the center channel (C) with the reduced level is distributed on the right channel (R) by forming a second sum signal (R'),

- the level of the right rear channel (Rs) is reduced

- the right rear channel (Rs) with the reduced level is distributed on the second sum signal by forming a fourth sum signal, which corresponds to the right channel (R_IRT) of the two-channel sound format,

characterized in that in the forming of the first (L') and the second (R') sum signals a dynamic correction of the spectral values of overlapping time windows with k sample values of the left channel (L) and the right channel (R), respectively, is performed,
that in the forming of the third and fourth sum signals a dynamic correction of the spectral values of overlapping time windows with k sample values of the first (L') second (R') sum signals, respectively, is performed,
that before each dynamic correction of spectral values of the left channel (L) resp. the right channel (R), each sum of the spectral values is compared to a target value (A_soll, with

) which follows from the following relationship:

in which

|l(k)| is the absolute value of a spectral value of the transformed left channel (L) in the complex plane

,

|c(k)| is the absolute value of the associated spectral value of the transformed center channel (C) in the complex plane

,

|r(k)| is the absolute value of a spectral value of the transformed right channel (R) in the complex plane

,

that before each dynamic correction of spectral values of the first (L') resp. second (R') sum signals, each sum of the spectral values is compared to a target value (A_soll, with A_soll ∈

), which follows from the following relationship:

in which

|r'(k)| is the absolute value of a spectral value of the transformed third sum signals (R') in the complex plane

,

|l'(k)| is the absolute value of the associated spectral value of the transformed first sum signal (L') in the complex plane

,

|rs(k)| is the absolute value of a spectral value of the transformed right rear channel (Rs) in the complex plane

,

|ls(k)| is the absolute value of the associated spectral value of the transformed left rear channel (Ls) in the complex plane

,

that for the case that the target value (A_soll, with

) is exceeded, the frequency component is added and the absolute sum value resulting therefrom is reduced according to

wherein n is a factor larger than 0.1 and smaller than 0.4, and
that for the case that the target value (A_soll, with

) is fallen short of, the spectral values of the respective signals to be corrected are multiplied with the following factor (m(k), with

wherein
A(k) is the k^th spectral value of r', l', l and r, with

B(k) is the k^th spectral value of rs, ls and c, with

wherein in particular w is a scaling factor in the range of -1 < w < 1, with W ∈ R.

2. Apparatus for generating a downward-compatible sound format, comprising means for performing the steps of the method according to claim 1.

Revendications

1. Procédé destiné à la génération d'un format audio à compatibilité descendante, en particulier d'un format audio à double canal,
avec un canal de droite (R_IRT) et un canal de gauche (L_IRT) à partir d'un format audio à plusieurs canaux, en particulier d'un format audio à cinq canaux, avec les canaux audio suivants :

- canal de gauche (L)

- canal de droite (R)

- canal central (C)

- canal arrière de gauche (Ls)

- canal arrière de droite (Rs),

pour lesquels

- le canal central (C) est abaissé dans le niveau du signal

- le canal central (C) abaissé dans le niveau du signal est distribué sur le canal de gauche (L) par la formation d'un premier signal de somme (L')

- le canal arrière de gauche (Ls) est abaissé dans le niveau du signal

- le canal arrière de gauche (Ls) abaissé dans le niveau du signal est distribué sur le premier signal de somme par la formation du troisième signal de somme, lequel correspond au canal de gauche (L_IRT) du format audio à double canal

- le canal central (C) abaissé dans le niveau du signal est distribué sur le canal de droite (R) par la formation d'un deuxième signal de somme (R'),

- le canal arrière de droite (Rs) est abaissé dans le niveau du signal

- le canal arrière de droite (Rs) abaissé dans le niveau du signal est distribué sur le deuxième signal de somme par la formation d'un quatrième signal de somme, lequel correspond au canal de droite (R_IRT) du format audio à double canal,

caractérisé en ce que, lors de la formation du premier (L') et du deuxième (R') signal de somme a lieu respectivement une correction dynamique des valeurs spectrales de fenêtres de temps se chevauchant avec des échantillons k du canal de gauche (L) ou du canal de droite (R),
en ce que, lors de la formation du troisième et du quatrième signal de somme a lieu respectivement une correction dynamique des valeurs spectrales de fenêtres de temps avec des échantillons k du premier (L') ou du deuxième (R') signal de somme,
en ce que, avant chaque correction dynamique des valeurs spectrales du canal de gauche (L) et du canal de droite (R), chaque somme des valeurs spectrales est comparée à une valeur nominale (A_soll, avec A_soll € R), laquelle résulte de la relation suivante :

dans laquelle

|l(k)| signifie le montant d'une valeur spectrale du canal de gauche (L) transformé au niveau complexe des chiffres C,

|c(k)| signifie le montant de la valeur spectrale associée du canal central (C) transformé au niveau complexe des chiffres C,

|r(k)| signifie le montant d'une valeur spectrale du canal de droite (R) transformé au niveau complexe des chiffres C,

en ce que, avant chaque correction dynamique des valeurs spectrales du premier (L') ou du deuxième (R') signal de somme, chaque somme des valeurs spectrales est comparée à une valeur nominale (A_soll, avec A_soll € R) laquelle résulte de la relation suivante :

dans laquelle

|r'(k)| signifie le montant des valeurs spectrales du troisième signal de somme (R) transformé au niveau complexe des chiffres C,

|l'(k)| signifie le montant de la valeur spectrale associée du premier signal de somme (L') transformé au niveau complexe des chiffres C,

|rs(k)| signifie le montant de la valeur spectrale du canal arrière de droite Rs transformé au niveau complexe des chiffres,

|ls(k)| signifie le montant de la valeur spectrale associée du canal arrière de gauche Ls transformé au niveau complexe des chiffres C,

en ce que, au cas où la valeur nominale (A_soll, avec A_soll € R) est dépassée par le haut, les composantes de fréquence sont additionnées et le montant total en résultant est abaissé selon la formule

où n représente un facteur supérieur à 0,1 et inférieur à 0,4 et
caractérisé en ce que, au cas où la valeur nominale (A_soll, avec A_soll € R) est dépassée par le bas, les valeurs spectrales des signaux à corriger respectivement sont multipliées par le facteur suivant (m(k), avec m(k) € R) :

où
A(k) signifie la k^e valeur spectrale de r', l', 1 et r, avec A(k) € C

où
B(k) signifie la k^e valeur spectrale de rs, ls et c, avec B(k)€ C, avec en particulier la valeur w qui signifie un facteur d'échelle dans la plage comprise entre -1 < w < 1, avec w € R.

2. disposition destinée à la génération d'un format audio à compatibilité descendante, y compris un moyen en vue de réaliser les phases du procédé selon la revendication 1.

Zeichnung

Angeführte Verweise

IN DER BESCHREIBUNG AUFGEFÜHRTE DOKUMENTE

Diese Liste der vom Anmelder aufgeführten Dokumente wurde ausschließlich zur Information des Lesers aufgenommen und ist nicht Bestandteil des europäischen Patentdokumentes. Sie wurde mit größter Sorgfalt zusammengestellt; das EPA übernimmt jedoch keinerlei Haftung für etwaige Fehler oder Auslassungen.

In der Beschreibung aufgeführte Nicht-Patentliteratur

GRIESINGER D.Progress in 5-2-5 Matrix Systems, [0001]