VERFAHREN ZUR DEKODIERUNG VON DIGITALEN AUDIODATEN

(19)

(11)

EP 1 238 481 B1

(12)	EUROPÄISCHE PATENTSCHRIFT

(45)	Hinweis auf die Patenterteilung:
	11.04.2007 Patentblatt 2007/15

(21)	Anmeldenummer: 00981165.4

(22)	Anmeldetag: 07.11.2000

(51)

Internationale Patentklassifikation (IPC):

H04H 1/00^(2006.01)

G10L 19/00^(2006.01)

(86)	Internationale Anmeldenummer:
	PCT/DE2000/003896

(87)	Internationale Veröffentlichungsnummer:
	WO 2001/043320 (14.06.2001 Gazette 2001/24)

(54)	VERFAHREN ZUR DEKODIERUNG VON DIGITALEN AUDIODATEN METHOD FOR DECODING DIGITAL AUDIO DATA PROCEDE PERMETTANT DE DECODER DES DONNEES AUDIO NUMERIQUES

(84)	Benannte Vertragsstaaten:
	DE FR GB NL SE

(30)

Priorität:

08.12.1999 DE 19959038

(43)	Veröffentlichungstag der Anmeldung:
	11.09.2002 Patentblatt 2002/37

(73)	Patentinhaber: ROBERT BOSCH GMBH
	70442 Stuttgart (DE)

(72)	Erfinder:
	KUPFERSCHMIDT, Claus 30900 Wedemark (DE) MLASKO, Torsten 31141 Hildesheim (DE) KLEIN MIDDELINK, Marc 6851 CW Huissen (NL)

(56)

Entgegenhaltungen: :

DE-A- 4 409 960
US-A- 5 706 396

US-A- 4 831 624

WIESE D: "OPTIMIZATION OF ERROR DETECTION AND CONCEALMENT FOR ISO/MPEG/AUDIO CODECS LAYER-I AND II" PREPRINTS OF PAPERS PRESENTED AT THE AES CONVENTION, XX, XX, Nr. 3388, 1992, Seiten 1-29, XP000996599

Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen).

Beschreibung

Stand der Technik

[0001] Die Erfindung geht aus von einem Verfahren zur Dekodierung von digitalen Audiodaten nach der Gattung des unabhängigen Patentanspruchs.

[0002] Es ist bereits bekannt, daß bei DAB (Digital Audio Broadcasting) sendeseitig das gesamte Frequenzspektrum der zu übertragenden digitalen Audiosignale in Frequenzbereiche aufgeteilt wird. Diese Frequenzbereiche werden im englischen mit Subbands bezeichnet. Pro Frequenzbereich werden maximal drei Skalenfaktoren als Referenzwerte festgelegt. In jedem Frequenzbereich werden pro Kanal bei Stereoübertragungen 36 Abtastwerte zeitlich hintereinander erzeugt. Die 36 Abtastwerte werden in zeitlich voneinander getrennte Gruppen zu je 12 Abtastwerten aufgeteilt. Pro Gruppe wird maximal ein Skalenfaktor definiert. Sind zwei oder alle drei Skalenfaktoren eines Frequenzbereichs gleich oder zumindest mit sehr ähnlichen Werten, dann wird für diese Skalenfaktoren nur ein Skalenfaktor übertragen. Innerhalb eines DAB-Rahmens, in dem die Abtastwerte und ihre Skalenfaktoren übertragen werden, wird daher signalisiert, für welche Gruppe oder Gruppen von Abtastwerten für einen Frequenzbereich ein jeweiliger Skalenfaktor zu verwenden ist. Diese Skalenfaktoren weisen in einer jeweiligen Gruppe oder Gruppen von Abtastwerten den größten Signalleistungswert auf. Die übrigen Signalwerte in dieser Gruppe oder in diesen Gruppen werden auf diesen Skalenfaktor normiert.

[0003] Im Empfänger werden dann Fehlererkennung und Korrekturverfahren bei der Quellendekodierung durchgeführt, nachdem solche Verfahren bei einer vorhergehenden Kanaldekodierung durchgeführt wurden. Diese Fehlererkennung und Korrekturverfahren während der Quellendekodierung betreffen sowohl den DAB-Rahmen als auch die Skalenfaktoren. Dann werden die digitalen Audiodaten mittels der Skalenfaktoren denormiert, und eine Dekodierung der Audiodaten findet statt.

[0004] In US 5,706,396 A wird ein Vergleich des Übergangs von Skalenfaktoren bei der Dekodierung beschrieben. Dabei wird ein Schellwertvergleich, ein Vergleich mit einem erwarteten Übergang oder ein Polaritätsvergleich durchgeführt, Aus DE 44 09 960 A ist bekannt die Fehlererkennung bei digitalen Audiodaten, dabei insbesondere bei Skalenfaktoren mittels einer Prüfsumme, also CRC, zu bestimmen und in Abhängigkeit von diesen Fehlererkennung Fehlerverschleierungsmaßnahmen einzusetzen. In US-A-4831624 wird eine Fehlererkennung mittels CRC beschrieben.

Vorteile der Erfindung

[0005] Das erfindungsgemäße Verfahren ergibt sich aus der Merkmalskombination vom Anspruch 1 und hat den Vorteil, dass mittels einer Plausibilitätsuntersuchung ein Fehler erkannt wird, um dann Fehlerkorrektur- oder Verschleierungsverfahren einzuleiten. Das Verfahren ist einfach und nutzt die Eigenschaft von Audiodaten, dass in ihrem zeitlichen Verlauf keine großen Sprünge auftreten. Daher führt vorteilhafterweise eine Vergleichsbildung von zeitlich aufeinander folgenden Referenzwerten, die von den Audiodaten abhängen, zu einem aussagekräftigen Ergebnis, ob ein Fehler vorliegt oder nicht.

[0006] Das erfindungsgemäße Verfahren ist vorteilhafterweise einfach und kann in jedem Audiodekoder implementiert werden. Darüber hinaus ist das erfindungsgemäße Verfahren auf weitere Audiodekodierungsverfahren (Standards) anwendbar. Zu diesen Standards gehören MPEG-1, MPEG-2 und MPEG-4. Die Standards können eine eigenen Fehlerbeschreibung aufweisen oder nicht.

[0007] Durch die in den abhängigen Ansprüchen aufgeführten Maßnahmen sind vorteilhafte Weiterbildungen und Verbesserungen des im unabhängigen Patentanspruch angegebenen Verfahrens möglich.

[0008] Darüber hinaus ist es von Vorteil, daß eine mehrstufige Fehlererkennung durchgeführt wird, denn zu den oben genannten Fehlererkennungs- und -korrekturvefahren, zum Beispiel bei DAB, wird ein weiteres Verfahren hinzugenommen, um weitere Fehler aufzuspüren.

[0009] Vorteilhafterweise wird bei dem erfindungsgemäßen Verfahren eine enge Korrelation zwischen den Referenzwerten, die bei DAB Skalenfaktoren sind, ausgenutzt, um festzustellen, ob ein Fehler vorliegt. Audiodaten bringen es mit sich, daß zeitlich benachbarte Daten miteinander in einer engen Korrelation stehen. Dies ist eine Eigenschaft der Sprache und Musik.

[0010] Besonders vorteilhaft ist, daß das Merkmal mittels einer Differenz- oder Mittelwertbildung ermittelt wird, wodurch eine aussagekräftige, überschaubare und einfache Entscheidung getroffen wird, ob ein Fehler vorliegt oder nicht. Außerdem ist damit das erfindungsgemäße Verfahren unabhängig von einer Signalart, denn es kann die Berechnungsmethode verwendet werden, die für ein jeweiliges Signal optimal ist.

[0011] Darüber hinaus ist es von Vorteil, daß die Signalisierung der Entscheidung, ob ein Fehler vorliegt, mittels einer Bitfolge, vorzugsweise eines Flags, erfolgt, wodurch eine einfache Auswertung dieser Entscheidung möglich ist.

[0012] Weiterhin ist es von Vorteil, daß durch eine Verknüpfung der Auswertung des Merkmals und der Fehlererkennung der Referenzwerte eine Gesamtaussage getroffen wird, wobei der Auswertung des Merkmals ein Übergewicht gegeben wird, da hier eine sachliche Beziehung zwischen zeitlich aufeinanderfolgenden Referenzwerten, nämlich eine enge Korrelation zwischen den Audiodaten, ausgenutzt wird.

[0013] Des weiteren ist es von Vorteil, daß neben den Referenzwerten, vorzugsweise den Skalenfaktoren, auch Rahmen, die zur Übertragung der digitalen Audiodaten genutzt werden, eine Fehlererkennung aufweisen. Dadurch wird in einfacher Weise ein doppelter Fehlerschutz realisiert.

[0014] Weiterhin ist es von Vorteil, daß wenn in einem Frequenzbereich keine Daten übertragen werden, sogenannte Ersatzwerte, im Englischen als Default bekannt, als Referenzwerte eingetragen werden und daß dann diese Ersatzwerte als solche identifiziert werden, so daß die erfindungsgemäße Fehlererkennung hier nicht durchgeführt wird, da ansonsten irrtümlicherweise ein Fehler angenommen werden würde.

[0015] Darüber hinaus können geeignete Ersatzwerte bestimmt werden, so daß die Fehlererkennung für alle Frequenzwerte durchgeführt werden kann. Dabei werden vorteilhafterweise solche Ersatzwerte bestimmt, die zu einem Merkmal führen, das keinen Fehler indiziert, also eine adaptive Bestimmung der Ersatzwerte. Das vereinfacht das Verfahren, da der Sonderfall des Ersatzwerts nicht abgefangen werden muß.

Zeichnung

[0016] Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und in der nachfolgenden Beschreibung näher erläutert. Es zeigen Figur 1 einen MPEG1 Layer II Rahmen und Figur 2 ein Blockschaltbild des erfindungsgemäßen Verfahrens.

Beschreibung der Ausführungsbeispiele

[0017] Bei den digitalen Übertragungsverfahren, wie zum Beispiel DAB (Digital Audio Broadcasting), werden sendeseitig sogenannte Skalenfaktoren verwendet, die hier im folgenden als Referenzwerte bezeichnet werden. Weiter unten wird jedoch gezeigt, daß auch andere charakteristische Daten, die von den Audiodaten abhängen, als Referenzwerte verwendet werden können.

[0018] Diese Referenzwerte repräsentieren in aufeinanderfolgenden Frequenzbereichen die stärksten Signalwerte, auf die die übrigen Signalwerte in diesen Frequenzbereichen normiert werden. Damit wird die maximale Differenz zwischen den Amplituden der Audiosignalwerte reduziert. Im Empfänger werden dann die Signalwerte mittels der ebenso übertragenen Referenzwerte denormiert.

[0019] Neben DAB, das insbesondere für den mobilen Empfang von Hörfunkprogrammen und anderen Multimediadaten geeignet ist, gilt das hier Dargestellte auch für andere digitale Rundfunkübertragungsverfahren, wie DVB (Digital Video Broadcasting) und DRM (Digital Radio Mondial) oder weitere Verfahren.

[0020] Bei digitalen Übertragungsverfahren wie DAB werden durch die Quellenkodierung im Sender eine Irrelevanz aus den digitalen Rohdaten, z.B. Sprachdaten als PCM (Pulscodemodulation)-Daten, entnommen. Um die zu übertragenen Daten vor Übertragungsfehlern zu schützen, wird nach der Quellenkodierung Redundanz in einer Kanalkodierung wieder hinzugefügt. Diese Redundanz wird empfängerseitig verwendet, um eine Fehlererkennung und -korrektur während der Kanaldekodierung durchzuführen. Darüber hinaus weist eine Quellendekodierung, die nach der Kanaldekodierung folgt, hier auch eine Fehlererkennung und -korrektur zusätzlich auf. Die Fehlererkennung und gegebenenfalls -korrektur während der Quellendekodierung wird an den durch die Kanaldekodierung bereits dekodierten Daten durchgeführt. Treten jedoch viele Fehler auf, versagt diese Fehlererkennung und -korrektur während der Quellendekodierung, und es kommt zu einer schlechten Audioqualität. Unter Fehlerkorrektur ist bei der Quellendekodierung auch eine Fehlerverschleierung zu verstehen.

[0021] Bei digital kodierten Audiodaten kann ein nicht korrigierbarer Fehler zu einem deutlich bemerkbaren und damit hörbaren Fehler führen, der für einen Hörer weit unangenehmer ist, als es bei analogen, fehlerbehafteten Audiosignalen der Fall ist. Hier liegt nämlich ein gleitender Übergang von sehr guter Audioqualität bis zur sehr schlechten Audioqualität vor, wobei selbst bei schlechter Qualität immer noch ein Nutzsignal hörbar ist.

[0022] Dies ist bei digitalen Audiodaten eben nicht der Fall: Kann die Kanaldekodierung nicht mehr alle auftretenden Fehler empfangsseitig korrigieren, dann werden bei DAB zunächst die Abtastwerte betroffen, und es kommt zu einem gurgelnden Störgeräusch. Treten immer mehr Fehler auf, werden auch die Skalenfaktoren als Referenzwerte betroffen, so daß dann krachende Störgeräusche auftreten. Werden auch noch ganze Rahmen wiederholt fehlerhaft übertragen, tritt eine Stummschaltung ein.

[0023] Daher ist hier auf eine sichere Fehlererkennung und - korrektur größten Wert zu legen, um ein hörbares Auftreten von Fehlern auf ein absolutes Minimum zu reduzieren.

[0024] Erfindungsgemäß wird daher ein Merkmal generiert, das für einen zusätzlichen Fehlerschutz bei der Quellendekodierung geeignet ist, um in einer weiteren Stufe festzustellen, ob ein Fehler vorliegt. Das erfindungsgemäße Verfahren setzt also hier auf die bereits vorhandenen Verfahren auf. Dies betrifft hier die Fehlererkennung und -korrektur von Referenzwerten bei der Quellendekodierung. Liegen hier nun Fehler vor, werden die als fehlerhaft erkannten Referenzwerte durch vorhergehende Referenzwerte, die abgespeichert wurden, ersetzt. Die Referenzwerte werden damit durch zwei Verfahren auf Fehler hin überwacht.

[0025] Alternativ kann das erfindungsgemäße Verfahren auch als alleinige Fehlererkennung bei der Dekodierung der digitalen Audiodaten wirken, weil es von anderen Fehlererkennungsverfahren und von dem Rahmenaufbau unabhängig ist.

[0026] In Figur 1 ist ein MPEG-1-Layer-II-Rahmen dargestellt. Der MPEG-1-Layer-II-Rahmen beginnt mit einem Rahmenkopf 1, auf den ein Feld 2 für eine Rahmenfehlererkennung folgt. Dabei wird hier eine Prüfsumme, im Englischen als Cyclic Redundancy Check bezeichnet, eingesetzt. Ist ein fehlerhafter Rahmen anhand der Prüfsumme erkannt worden, dann wird ein geeigneter Rahmen den fehlerhaften Rahmen ersetzen, zum Beispiel kann der vorhergehende Rahmen dazu verwendet werden, oder es erfolgt eine Stummschaltung für den fehlerhaften Rahmen. Alternativ kann auch eine Prädiktion vorgenommen werden. Dabei wird aus korrekt empfangenen oder korrigierten Rahmen ein nicht zu korrigierender und damit fehlerhafter Rahmen berechnet.

[0027] Mittels geeigneten Modellen kann dies abgeschätzt und damit vorhergesagt werden.

[0028] Die Prüfsumme ist derart gestaltet, daß sie aus Übertragungseffizienzgründen nicht alle möglicherweise auftretenden Fehler erkennen kann. In einem solchem Fall versagt die Prüfsumme. Bei einer Prüfsumme können sich allerdings auch mehrere überlagernde Fehler gegenseitig korrigieren, so daß in einem solchen Fall irrtümlicherweise kein Fehler mittels der Prüfsumme erkannt wird. Charakteristisch für die Prüfsumme ist der Test einer Bitsumme, wobei eine inhaltliche Betrachtung der Audiodaten, wie es beim erfindungsgemäßen Verfahren der Fall ist, unterbleibt.

[0029] Dann folgt ein Feld für eine Bitzuweisung 3. Bei DAB, wie auch bei anderen digitalen Übertragungs- und Aufzeichnungsverfahren, werden die Audiosignale quantisiert. Dabei wird eine nichtlineare Quantisierung durchgeführt, wobei eine psychoakustische Quantisierungskurve zugrunde gelegt wird. Es werden Geräusche, die sich in der Nähe in Bezug auf die Frequenz zu einem aus dem Klangspektrum herausragenden Ton befinden, durch das Ohr nicht mehr wahrgenommen. Dies bezeichnet man als die Mithörschwelle. Dadurch ist es möglich, die Datenrate zu reduzieren, indem solche Geräusche, die unter der Mithörschwelle liegen, aus den Daten entfernt werden. Es werden dabei auch die verschiedenen Frequenzbereiche unterschiedlich fein quantisiert, wobei die Feinheit der Quantisierung dadurch bestimmt ist, daß das Quantisierungsrauschen noch unterhalb der Mithörschwelle liegt. Aus dieser unterschiedlichen Quantisierung pro Frequenzbereich ergibt sich, daß unterschiedlich viele Bits pro Frequenzbereich zuzuweisen sind. Z.B. schwankt die Bitzuweisung pro Frequenzbereich zwischen 3 und 16 Bit.

[0030] In dem nächsten Feld 4 wird eine Referenzwerteauswahl getroffen. Es kommt durchaus vor, daß zeitlich aufeinanderfolgende Referenzwerte für einen Frequenzbereich die gleiche oder zumindest sehr ähnliche Größe haben, da die Leistung in etwa übereinstimmt. Daher ist es nicht notwendig, für den Frequenzbereich mehrere Referenzwerte zu übertragen, wenn ein Referenzwert mehrere zeitlich voneinander getrennte Gruppen von Abtastwerten repräsentiert. In diesem Feld 4 ist nun beschrieben, welche Referenzwerte für welche Gruppen von Abtastwerten zur Denormierung zu verwenden sind.

[0031] Im Feld 5 sind dann die Referenzwerte selbst abgespeichert. Im Feld 6 sind die eigentlichen Audiodaten, die mit den Referenzwerten denormiert werden, abgelegt. Im Feld 7 befinden sich Zusatzdaten, die programmbegleitende Informationen umfassen und vor allem die Prüfsumme für die Referenzwerte des folgenden Rahmens.

[0032] In Figur 2 ist ein Blockschaltbild des erfindungsgemäßen Verfahrens dargestellt. An einem Eingang 8 liegen die Audiodaten vor. In Block 9 wird eine Fehlererkennung der Referenzwerte des vergangenen Rahmens durchgeführt. In Block 10 wird aus dem aktuellen Rahmen ein Merkmal extrahiert, in dem die Referenzwerte des vergangenen Rahmens und des aktuellen Rahmens voneinander abgezogen werden. Liegt die Summe über einem vorgegebenen Schwellwert, dann ist der Unterschied so groß, daß keine Korrelation zwischen den beiden Referenzwerten vorliegt, was bei Audiodaten eigentlich nicht vorkommen kann. Daher wird dieser Fall als Fehler erkannt.

[0033] Alternativ kann anstatt einer bloßen Differenzbildung auch eine Mittelwertbildung verwendet werden, um beispielsweise eine Standardabweichung zu berechnen. Liegt die Standardabweichung über einem vorgegebenen Schwellwert, wird dies als Fehler erkannt.

[0034] Im Block 11 ist ein Entscheider vorhanden, der die Differenz der aufeinanderfolgenden Referenzwerte mit dem vorgegebenen Schwellwert vergleicht und eine entsprechende Ausgabe macht, d.h. liegt ein Fehler vor, wird ein Bit auf 1 gesetzt, liegt kein Fehler vor, bleibt dieses Bit auf 0. Dieses Bit wird auch mit Flag bezeichnet.

[0035] Im Block 12 wird die Fehlererkennung vom Block 9 für die Referenzwerte und die Fehlererkennung mittels der Merkmalsanalyse vom Block 11 miteinander verknüpft, wobei das Verfahren so ausgebildet ist, daß vom Block 11 das Ergebnis des vorhergehenden Rahmens verwendet wird, daher wird auch im Block 9 die Fehlererkennung für den Referenzwert des vergangenen Rahmens durchgeführt. Die Verknüpfung 12 ist so ausgebildet, daß mittels einer logischen Oderverknüpfung die Entscheidung, ob ein Fehler vorliegt, festgestellt wird, d.h. Fehler werden hier durch eine 1 signalisiert, kein Fehler durch eine 0, so daß beide, die Fehlererkennung mittels Prüfsumme und die Merkmalsanalyse, keinen Fehler anzeigen dürfen, wenn kein Fehler erkannt werden soll.

[0036] Sind Fehler erkannt worden, setzen nun Fehlerkorrektur- oder -verschleierungsverfahren ein. Dazu gehören Rahmenwiederholungen und eine Prädiktion.

[0037] In manchen Frequenzbereichen wird zum Teil keine Audioinformation übertragen. Statt dessen wird dann ein Ersatzwert, ein Default, eingetragen. Die Differenzbildung eines Defaults mit einem anderen Referenzwert kann zu einer Indikation eines Fehlers führen. Dieser Ersatzwert muß charakteristisch sein, wobei er üblicherweise bei den Audiodaten nicht vorkommt, so daß in diesem Falle die Differenzbildung unterbleibt und hier allein die Fehlererkennung für die Referenzwerte mittels Prüfsumme durchgeführt wird. D.h. das Flag für die Fehlererkennung der Referenzwerte bleibt hier auf 0. Alternativ kann der Ersatzwert auch so ausgebildet sein, daß das mit dem Ersatzwert gebildete Merkmal immer unter dem Schwellwert für die Fehlererkennung liegt. Damit wird der Ersatzwert an die Referenzwerte angeglichen. Im Prinzip kann dann auch einfach der entsprechende Referenzwert genommen werden, so daß eine Differenzbild Null ergeben wird.

[0038] Im Block 13 wird die Entscheidung signalisiert, ob ein Fehler vorliegt oder nicht. Liegt ein Fehler vor, werden abgespeicherte Referenzwerte aus einem vergangenen Rahmen, der korrekt übertragen wurde, anstatt des fehlerhaften Referenzwerts genommen, liegt kein Fehler vor, werden alle Referenzwerte aus diesem Rahmen verwendet.

[0039] Neben den hier genannten Skalenfaktoren als Referenzwerte sind auch andere Daten dafür verwendbar. Zu diesen Daten gehören Gewinnfaktoren, die pro Frequenzbereich für die Ermittlung eines optimalen Aussteuerungsbereichs notwendig sind und die von den Audiodaten abhängen. Aber auch andere Daten können für das erfindungsgemäße Verfahren verwendet werden. Die einzige Voraussetzung ist die enge Korrelation mit den Audiodaten.

Ansprüche

1. Verfahren zur Dekodierung von digitalen Audiodaten, wobei die digitalen Audiodaten in Rahmen empfangen werden, wobei die digitalen Audiodaten dekodiert werden, wobei bei der Dekodierung aus den aktuellen und den vergangenen Rahmen Skalenfaktoren entnommen werden, die abhängigen von den digitalen Audiodaten (10) sind, um mittels der Skalenfaktoren ein Merkmal zu erzeugen, wobei das Merkmal (11) mit einem vorgegebenen Schwellwert verglichen wird, wobei, wenn das Merkmal über dem vorgegebenen Schwellwert liegt, dies mittels einer Signalisierung als eine erste Fehlererkennung (10,11) angezeigt wird, wobei eine zweite Fehlererkennung (9) mittels einer Prüfsumme (10,11) an den Skalenfaktoren durchgeführt wird, dadurch gekennzeichnet, dass das Merkmal mittels einer Mittelwertbildung von dem Skalenfaktor mit mindestens einem vorhergehenden Skalenfaktor erzeugt wird, und dass die erste und die zweite Fehlererkennung (9) mittels einer logischen Oder-Verknüpfung (12) verknüpft werden, um einen Fehler zu erkennen wenn in einem Frequenzbereich keine Audioinformationen übertragenwerden ein Ersatzwert statt einem Skalenfalktor übertragen wird, und dass der Ersatzwert keinem Vergleich mit einem vorhergehenden Skalenfaktor unterworfen wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die digitalen Audiodaten in aufeinander folgende Frequenzbereiche aufgeteilt werden, wobei die digitalen Audiodaten für einen jeweiligen Frequenzbereich mittels mindestens eines Skalenfaktors für den jeweiligen Frequenzbereich denormiert werden und dass der mindestens eine Skalenfaktor für den jeweiligen Frequenzbereich mit vorhergehenden Skalenfaktoren für den jeweiligen Frequenzbereich verglichen wird, um das Merkmal zu erzeugen.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Signalisierung mittels einer Bitfolge, vorzugsweise eines Flags, angezeigt wird.

4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass die Bitfolge mit einer Anzeige für die Fehlererkennung verglichen wird.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass für jeden Rahmen die zweite Fehlererkennung durchgeführt wird.

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass der Rahmen einen Rahmenkopf (1), ein Feld für die Fehlererkennung des Rahmens (2), ein Feld für eine Bitzuweisung (3), ein Feld für eine Auswahl der Referenzwerte (4), ein Feld für die Referenzwerte (5), ein Feld für die digitalen Audiodaten (6) und ein Zusatzdatenfeld (7) aufweist.

7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Zusatzdatenfeld (7) Daten für die zweite Fehlererkennung für die Referenzwerte aufweist.

8. Verfahren nach Anspruch 7. dadurch gekennzeichnet, dass als Rahmen ein MPEG-1-Layer-II Rahmen verwendet wird.

Claims

1. Method for decoding digital audio data, where the digital audio data are received in frames, where the digital audio data are decoded, where scale factors which are dependent on the digital audio data (10) are taken from the present and past frames during decoding in order to use the scale factors to produce a feature, where the feature (11) is compared with a prescribed threshold value, where, if the feature is above the prescribed threshold value, this is indicated as first error recognition (10, 11) by means of signalling, and where second error recognition (9) is performed on the scale factors using a checksum (10, 11), characterized in that the feature is produced by means of averaging of the scale factor with at least one preceding scale factor, and in that the first and second error recognition (9) are logic ORed (12) in order to recognize an error, and in that, if no audio information is being transmitted in a frequency range, a substitute value is transmitted instead of a scale factor, and in that the substitute value is not subjected to a comparison with a preceding scale factor.

2. Method according to Claim 1, characterized in that the digital audio data are split into successive frequency ranges, with the digital audio data for a respective frequency range being denormalized by means of at least one scale factor for the respective frequency range, and in that the at least one scale factor for the respective frequency range is compared with preceding scale factors for the respective frequency range in order to produce the feature.

3. Method according to Claim 2, characterized in that the signalling is indicated by means of a bit string, preferably a flag.

4. Method according to Claim 3, characterized in that the bit string is compared with an indicator for the error recognition.

5. Method according to Claim 4, characterized in that the second error recognition is performed for each frame.

6. Method according to Claim 5, characterized in that the frame has a frame header (1), a field for the error recognition of the frame (2), a field for a bit allocation (3), a field for a selection of the reference values (4), a field for the reference values (5), a field for the digital audio data (6) and a supplementary data field (7).

7. Method according to Claim 6, characterized in that the supplementary data field (7) has data for the second error recognition for the reference values.

8. Method according to Claim 7, characterized in that the frame used is an MPEG-1 Layer-II frame.

Revendications

1. Procédé de décodage de données audio numériques, selon lequel les données audio numériques sont reçues dans des trames et décodées, des facteurs d'échelle dépendants des données audio numériques (10), étant prélevés des trames actuelles et passées lors du décodage, pour produire une caractéristique à l'aide des facteurs d'échelle, la caractéristique (11) étant comparée à une valeur de seuil prescrite, et si la caractéristique se situe au-dessus de la valeur de seuil prescrite, on l'affiche à l'aide d'une signalisation en tant que première détection d'erreurs (10, 11), et on fait une seconde détection d'erreurs (9) sur les facteurs d'échelle à l'aide d'une somme de contrôle (10,11),
caractérisé en ce qu'
on produit la caractéristique avec au moins un facteur d'échelle précédent à l'aide d'une formation de valeur moyenne du facteur d'échelle, et on combine la première et la seconde détection d'erreurs (9) à l'aide d'une fonction logique OU (12), pour détecter une erreur, et si aucune information audio n'est transmise dans une gamme de fréquences, une valeur de remplacement est transmise au lieu d'un facteur d'échelle, et la valeur de remplacement n'est soumise à aucune comparaison avec un facteur d'échelle précédent.

2. Procédé selon la revendication 1,
caractérisé en ce que
les données audio numériques sont réparties en gammes de fréquences successives, les données audio numériques étant dénormées pour une gamme de fréquences respective à l'aide d'au moins un facteur d'échelle pour la gamme de fréquences respective, et au moins un facteur d'échelle pour la gamme de fréquences respective est comparé aux facteurs d'échelle précédents pour la gamme de fréquences respective, pour produire la caractéristique.

3. Procédé selon la revendication 2,
caractérisé en ce que
la signalisation est indiquée à l'aide d'une séquence de bits, de préférence un drapeau.

4. Procédé selon la revendication 3,
caractérisé en ce que
la séquence de bits est comparée à une annonce pour la détection d'erreurs.

5. Procédé selon la revendication 4,
caractérisé en ce que
la seconde détection d'erreurs est effectuée pour chaque trame.

6. Procédé selon la revendication 5,
caractérisé en ce que
la trame présente une tête de trame (1), un champ pour la détection d'erreurs de la trame (2), un champ pour une allocation de bits (3), un champ pour un choix des valeurs de référence (4), un champ pour les valeurs de référence (5), un champ pour les données audio numériques (6) et un champ de données supplémentaire (7).

7. Procédé selon la revendication 6,
caractérisé en ce que
le champ de données supplémentaire (7) présente des données pour la seconde détection d'erreurs pour les valeurs de référence.

8. Procédé selon la revendication 7,
caractérisé en ce qu'
on utilise comme trame une trame MPEG-1-Couche-II.

Zeichnung