[0001] Die vorliegende Erfindung bezieht sich auf ein Schema zur Einbringung eines Wasserzeichens
in ein Informationssignal, wie z.B. ein Audiosignal.
[0002] Mit zunehmender Verbreitung des Internets hat auch die Musikpiraterie drastisch zugenommen.
An vielen Stellen im Internet werden Musikstücke bzw. allgemeine Audiosignale angeboten,
um dort heruntergeladen werden zu können. In den allerwenigsten Fällen werden hierbei
Urheberrechte beachtet. Insbesondere wird sehr selten die Erlaubnis des Urhebers eingeholt,
sein Werk zur Verfügung zu stellen. Noch seltener werden Gebühren an den Urheber bezahlt,
die der Preis für ein rechtmäßiges Kopieren sind. Darüber hinaus findet ein unkontrolliertes
Kopieren von Werken statt, was in den allermeisten Fällen ebenfalls ohne Berücksichtigung
von Urheberrechten geschieht.
[0003] Wenn Musikstücke über das Internet von einem Provider bzw. Anbieter für Musikstücke
rechtmäßig erworben werden, erzeugt der Provider üblicherweise einen Header bzw. einen
dem Musikstück beigefügten Datenblock, in dem Copyright-Informationen sowie beispielsweise
eine Kundennummer eingebracht sind, wobei die Kundennummer eindeutig auf den aktuell
vorliegenden Käufer hinweist. Es ist ferner bekannt, Kopiererlaubnisinformationen
in diesen Header einzufügen, welche die verschiedensten Arten von Kopierrechten signalisieren,
wie z.B. dass das Kopieren des aktuellen Stücks vollständig untersagt ist, dass das
Kopieren des aktuellen Stücks nur ein einziges Mal erlaubt ist, dass das Kopieren
des aktuellen Stücks völlig frei ist, usw. Der Kunde verfügt über einen Decodierer
oder eine Verwaltungssoftware, der bzw. die den Header einliest und unter Beachtung
der erlaubten Handlungen beispielsweise nur eine einzige Kopie zulässt und weitere
Kopien verweigert, oder dergleichen.
[0004] Dieses Konzept zur Beachtung der Urheberrechte funktioniert jedoch nur für Kunden,
die sich legal verhalten. Illegale Kunden haben üblicherweise ein wesentliches Potential
an Kreativität, die mit einem Header versehenen Musikstücke zu "knacken". Hier zeigt
sich bereits der Nachteil der beschriebenen Vorgehensweise zum Schutz von Urheberrechten.
Ein solcher Header kann einfach entfernt werden. Alternativ könnte ein illegaler Benutzer
auch einzelne Einträge in dem Header modifizieren, um beispielsweise den Eintrag "Kopieren
untersagt" in einen Eintrag "Kopieren völlig frei" umzuwandeln. Denkbar ist auch der
Fall, dass ein illegaler Kunde seine eigene Kundennummer aus dem Header entfernt und
dann das Musikstück auf seiner oder einer anderen Homepage im Internet anbietet. Ab
diesem Moment ist es nicht mehr möglich, den illegalen Kunden zu ermitteln, da er
seine Kundennummer entfernt hat.
[0005] Aus der
WO 97/33391 ist ein Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein
Audiosignal bekannt. Dabei wird das Audiosignal, in das das nicht hörbare Datensignal,
hier Wasserzeichen genannt, eingebracht werden soll, in den Frequenzbereich umgewandelt,
um mittels eines psychoakustischen Modells die Maskierungsschwelle des Audiosignals
zu bestimmen. Das Datensignal, das in das Audiosignal eingebracht werden soll, wird
mit einem Pseudorauschsignal moduliert, um ein frequenzmäßig gespreiztes Datensignal
zu schaffen. Das frequenzmäßig gespreizte Datensignal wird dann mit der psychoakustischen
Maskierungsschwelle gewichtet, derart, dass die Energie des frequenzmäßig gespreizten
Datensignals immer unterhalb der Maskierungsschwelle liegt. Schließlich wird das gewichtete
Datensignal dem Audiosignal überlagert, wodurch ein Audiosignal erzeugt wird, in das
das Datensignal unhörbar eingebracht ist. Das Datensignal kann zum einen dazu verwendet
werden, dem Audiosignal Urheber Informationen hinzuzufügen und alternativ kann das
Datensignal zur Kennzeichnung von Audiosignalen verwendet werden, um eventuelle Raubkopien
ohne weiteres zu identifizieren, da jeder Tonträger beispielsweise in Form einer CompactDisk
ab Werk mit einer individuellen Kennung versehen wird.
[0007] Audiosignale liegen jedoch häufig auch bereits als komprimierte Audiodatenströme
vor, die beispielsweise einer Verarbeitung nach einem der MPEG-Audioverfahren unterzogen
worden sind. Würde man nun eines der vorhergehenden Wasserzeicheneinbettungsverfahren
verwenden wollen, um Musikstücke vor der Auslieferung an einen Kunden mit einem Wasserzeichen
zu versehen, so müssten dieselben vor der Wasserzeicheneinbringung vollständig dekomprimiert
werden, um wieder eine Folge von Zeitbereichs-Audiowerten zu erhalten. Dies bedeutete
jedoch neben einem hohen Rechenaufwand aufgrund der zusätzlichen Decodierung vor der
Wasserzeicheneinbettung auch, dass bei erneuter Codierung die Gefahr des Auftretens
von Tandem-Codiereffekten besteht, wenn diese wasserzeichenbehafteten Audiosignale
erneut codiert werden.
[0008] Es sind deshalb auch Schemata zur Einbettung eines Wasserzeichens in bereits komprimierte
Audiosignale bzw. komprimierte Audiobitströme entwickelt worden, die unter anderem
den Vorteil besitzen, dass sie eine niedrigere Rechenkomplexität erfordern, da keine
volle Decodierung des mit einem Wasserzeichen zu versehenden Audiobitstroms erfolgen
muss, d.h. also insbesondere die Anwendung von Analyse- und Synthese-Filterbanken
auf das Audiosignal entfallen. Weitere Vorteile dieser bereits auf komprimierte Audiosignale
anwendbaren Verfahren sind die hohe Audioqualität, da das Quantisierungsgeräusch und
das Wasserzeichengeräusch genau aufeinander abgestimmt werden können, ihre hohe Robustheit,
da das Wasserzeichen nicht durch einen nachfolgenden Audiocodierer "geschwächt" wird,
und die Ermöglichung einer geeigneten Wahl der Spreizbandparameter, so dass eine Kompatibilität
zu PCM-Wasserzeichen-Verfahren (PCM = Pulse Code Modulation = Pulscodemodulation)
bzw. den an unkomprimierten Audiosignalen arbeitenden Einbettungsschemata erzielt
werden kann. Ein Überblick über Schemata zur Einbettung von Wasserzeichen in bereits
komprimierte Audiosignale findet sich in
C. Neubauer, J. Herre: "Audio Watermarking of MPEG-2 AAC Bit Streams", 108th AES Convention,
Paris 2000, Preprint 5101 und ferner in der
DE 10129239 C1.
[0009] Eine weitere verbesserte Weise der Einbringung eines Wasserzeichens in Audiosignale
betreffen diejenigen Schemata, die die Einbettung während der Komprimierung eines
noch unkomprimierten Audiosignals vornehmen. Einbettungsschemata dieser Art weisen
unter anderem den Vorteil einer niedrigeren Rechenkomplexität auf, da durch die Zusammenziehung
von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z.B. die Berechnung
des Maskierungsmodells und die Überführung des Audiosignals in den Spektralbereich,
nur einmal durchgeführt werden müssen. Weitere Vorteile umfassen eine höhere Audioqualität,
da das Quantisierungsgeräusch und das Wasserzeichengeräusch genau aufeinander abgestimmt
werden können, eine hohe Robustheit, da das Wasserzeichen nicht durch einen nachfolgenden
Audiocodierer "geschwächt" wird, und die Möglichkeit einer geeigneten Wahl der Spreizbandparameter,
um eine Kompatibilität zu dem PCM-Wasserzeichenverfahren zu erzielen. Ein Überblick
über die komprimierte Wasserzeicheneinbettung/Codierung findet sich beispielsweise
in
Siebenhaar, Frank; Neubauer, Christian; Herre, Jürgen: "Combined Compression/Watermarking
for Audio Signals", In 110th AES Convention, Amsterdam, preprint 5344;
C. Neubauer, R. Kulessa and J. Herre: "A Compatible Family of Bitstream Watermarking
Systems for MPEG-Audio", 110th AES Convention, Amsterdam, May 2000, Preprint 5346, und der
DE 199 47 877.
[0010] Zusammenfassend ausgedrückt sind Wasserzeichen für codierte und uncodierte Audiosignale
in verschiedenen Varianten bekannt. Mit Hilfe von Wasserzeichen können Zusatzdaten
robust und unhörbar innerhalb eines Audiosignals übertragen werden. Es existieren
heutzutage wie oben gezeigt verschiedene Wasserzeicheneinbettungsverfahren, die sich
in der Domäne der Einbettung, wie z.B. dem Zeitbereich, dem Frequenzbereich usw.,
und der Art der Einbettung, wie z.B. der Quantisierung, der Auslöschung einzelner
Werte, usw., unterscheiden. Zusammenfassende Beschreibungen existierender Verfahren
finden sich in
M. van der Veen, F. Brukers et al.: "Robust, Multi-Functional and High-Quality Audio
Watermarking Technology", 110th AES Convention, Amsterdam May 2002, Preprint 5345;
Jaap Haitsma, Michiel van der Veen, Ton Kalker and Fons Bruekers: "Audio Watermarking
for Monitoring and Copy Protection", ACM Workshop 2000, Los Angeles, und der bereits zitierten
DE 196 40 814.
[0011] Obwohl die im Vorhergehenden kurz skizzierten Arten von Schemata zur Einbettung eines
Wasserzeichens in Audiosignalen bereits recht ausgefeilt sind, besteht ein Nachteil
darin, dass sich existierende Wasserzeichenverfahren fast ausschließlich auf die Aufgabe
konzentriert haben, ein Wasserzeichen unhörbar mit einer hohen Einbringungsrate und
einer hohen Robustheit, d.h. mit der Eigenschaft, dass das Wasserzeichen auch nach
Signalveränderungen verwertbar ist, in das ursprüngliche Audiosignal einzubetten.
Dabei wurde für die meisten Anwendungsgebiete das Hauptaugenmerk auf die Robustheit
gelegt. Das am weitesten verbreitete Verfahren zur Beaufschlagung von Audiosignalen
mit einem Wasserzeichen, nämlich die Spreizbandmodulation, wie sie beispielsweise
in der im Vorhergehenden genannten
WO 97/33391 beschrieben ist, gilt als sehr robust und sicher.
[0012] Aufgrund der Popularität und der Tatsache, dass die Prinzipien der spreizbandmodulationsbasierten
Wasserzeichenverfahren allgemein bekannt sind, besteht die Gefahr, dass Verfahren
bekannt werden, mit denen umgekehrt eine Zerstörung des Wasserzeichens aus den mit
diesem Verfahren wasserzeichenbehafteten Audiosignalen erzielt werden kann. Aus diesem
Grund ist es sehr wichtig, neue hochwertige Verfahren zu entwickeln, die als Alternative
zur Spreizbandmodulation dienen können.
[0013] Die Aufgabe der vorliegenden Erfindung besteht folglich darin, ein völlig neuartiges
und damit auch sichereres Schema zur Einbringung eines Wasserzeichens in ein Informationssignal
zu schaffen.
[0014] Diese Aufgabe wird durch Vorrichtungen gemäß Anspruch 1 oder 22 und Verfahren gemäß
Anspruch 23 oder 24 gelöst.
[0015] Nach einem erfindungsgemäßen Schema zum Einbringen eines Wasserzeichens in ein Informationssignal
wird zunächst das Informationssignal von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung
überführt. Das Informationssignal wird dann in der Spektral/Modulationsspektraldarstellung
abhängig von dem einzubringenden Wasserzeichen manipuliert, um eine modifizierte Spektral/Modulationsspektraldarstellung
zu erhalten, und anschließend wird ein wasserzeichenbehaftetes Informationssignal
basierend auf der modifizierten Spektral/Modulationsspektraldarstellung gebildet.
[0016] Nach einem erfindungsgemäßen Schema zum Extrahieren eines Wasserzeichens aus einem
wasserzeichenbehafteten Informationssignal, wird dementsprechend das wasserzeichenbehaftete
Informationssignal von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung
überführt, woraufhin das Wasserzeichen basierend auf der Spektral/Modulationsspektraldarstellung
hergeleitet wird.
[0017] Ein Vorteil der vorliegenden Erfindung besteht darin, dass dadurch, dass gemäß der
vorliegenden Erfindung das Wasserzeichen in der Spektral/Modulationsspektraldarstellung
bzw. -Domäne eingebettet bzw. hergeleitet wird, traditionelle Korrelationsangriffe,
wie sie bei den spreizbandmodulationsbasierten Wasserzeichenverfahren eingesetzt werden,
nicht ohne weiteres zum Ziel führen. Hier macht sich insbesondere positiv bemerkbar,
dass die Analyse eines Signals in der Spektral/Modulationsspektral-Domäne für potentielle
Angreifer noch Neuland ist.
[0018] Weiterhin birgt die erfindungsgemäße Einbettung des Wasserzeichens in der Spektral/Modulationsspektral-Domäne
bzw. in der 2-dimensionalen Modulationsspektral/Spektral-Ebene wesentlich mehr Variationen
der Einbettungsparameter, wie z.B. an welchen "Stellen" in dieser Ebene die Einbettung
lokalisiert ist, als dies bisher der Fall war. Die Auswahl der entsprechenden Stellen
kann dabei gegebenenfalls auch zeitvariant erfolgen.
[0019] Durch Einbettung des Wasserzeichens in der Spektral/Modulationsspektral-Domäne ist
es in dem Fall eines Audiosignals als dem Informationssignal unter Umständen ferner
möglich, ohne die aufwendige Berechnung herkömmlicher psychoakustischer Parameter,
wie z.B. der Mithörschwelle, eine unhörbare Einbettung eines Wasserzeichens vorzunehmen,
um somit mit geringerem Aufwand trotzdem die Unhörbarkeit des Wasserzeichens sicherzustellen.
Die Modifikation der Modulationswerte kann hierbei beispielsweise unter Ausnutzung
von Verdeckungseffekten im Modulationsspektralbereich durchgeführt werden.
[0020] Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung sind nachfolgend bezugnehmend
auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
- Fig. 1
- ein Blockdiagramm einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal
gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
- Fig. 2
- eine schematische Zeichnung zur Veranschaulichung der Vorrichtung nach Fig. 1 zugrunde
liegenden Überführung eines Audiosignals in eine Frequenz/Modulationsfrequenz-Domäne;
- Fig. 3
- ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach
Fig. 1 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal;
- Fig. 4
- ein Blockschaltbild einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal
gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung; und
- Fig. 5
- ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach
Fig. 4 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal.
[0021] Bezugnehmend auf die Figuren 1-3 wird im Folgenden ein Schema zur Einbettung eines
Wasserzeichens in ein Audiosignal beschrieben, bei dem zunächst ein eingehendes Audiosignal
bzw. ein Audioeingangssignal, das in einem Zeitbereich bzw. einer Zeitdarstellung
vorliegt, blockweise in eine Zeit/Frequenzdarstellung und von dort aus in eine Frequenz/Modulationsfrequenzdarstellung
überführt wird. In dieser Darstellung wird dann das Wasserzeichen in das Audiosignal
eingebracht, indem abhängig vom Wasserzeichen Modulationswerte der Frequenz/Modulationsfrequenzbereichsdarstellung
modifiziert werden. Derart modifiziert wird das Audiosignal dann wieder zurück in
den Zeit/Frequenzbereich und von dort aus wieder in den Zeitbereich rücküberführt.
[0022] Die Wasserzeicheneinbettung nach dem Schema von Fig. 1-3 wird durch die Vorrichtung
nach Fig. 1 durchgeführt, die im Folgenden auch als Wasserzeichen-Einbetter bezeichnet
wird und mit dem Bezugszeichen 10 angezeigt ist. Der Einbetter 10 umfasst einen Eingang
12 zum Empfangen des Audioeingangssignals, in welches das einzubringende Wasserzeichen
eingebracht werden soll. Das Wasserzeichen, wie z.B. eine Kundennummer, erhält der
Einbetter 10 an einem Eingang 14. Neben den Eingängen 12 und 14 umfasst der Einbetter
10 einen Ausgang 16 zum Ausgeben des mit dem Wasserzeichen versehenen bzw. des wasserzeichenbehafteten
Ausgangssignals.
[0023] Intern umfasst der Einbetter 10 eine Fensterungseinrichtung 18 und eine erste Filterbank
20, die in Reihe hinter den Eingang 12 geschaltet sind und dafür zuständig sind, das
Audiosignal am Eingang 12 durch blockweise Verarbeitung von dem Zeitbereich 22 in
den Zeit/Frequenzbereich 24 zu überführen. An den Ausgang der Filterbank 20 schließt
eine Betrag/Phase-Detektionseinrichtung 26 an, um eine Aufteilung der Zeit/Frequenzbereichsdarstellung
des Audiosignals in Betrag und Phase vorzunehmen. Eine zweite Filterbank 28 ist mit
der Detektionseinrichtung 26 verbunden, um den Betragsanteil der Zeit/Frequenzbereichsdarstellung
zu erhalten, und überführt den Betragsanteil in die Frequenz/Modulationsfrequenzbereichsdomäne
30, um auf diese Weise eine Frequenz/Modulationsfrequenzdarstellung des Audiosignals
12 zu erzeugen. Die Blöcke 18, 20, 26, 28 stellen somit einen Analyseteil des Einbetters
10 dar, der die Überführung des Audiosignals in die Frequenz/Modulationsfrequenzdarstellung
erzielt.
[0024] Eine Wasserzeicheneinbettungseinrichtung 32 ist mit der zweiten Filterbank 28 verbunden,
um von derselben die Frequenz/Modulationsfrequenzdarstellung des Audiosignals 12 zu
erhalten. Ein weiterer Eingang der Wasserzeicheneinbettungseinrichtung 32 ist mit
dem Eingang 14 des Einbetters 10 verbunden. Die Wasserzeicheneinbettungseinrichtung
32 erzeugt eine modifizierte Frequenz/Modulationsfrequenzdarstellung.
[0025] Ein Ausgang der Wasserzeicheneinbettungseinrichtung 32 ist mit einem Eingang einer
zu der zweiten Filterbank 28 inversen Filterbank 34 verbunden, die für die Rücküberführung
in den Zeit/Frequenzbereich 24 zuständig ist. Eine Phasenverarbeitungseinrichtung
36 ist mit der Detektionseinrichtung 26 verbunden, um den Phasenanteil der Zeit/Frequenzbereichsdarstellung
24 des Audiosignals zu erhalten und in manipulierter Form, wie es im Folgenden noch
beschrieben wird, an eine Rekombinationseinrichtung 38 weiterzuleiten, die darüber
hinaus mit einem Ausgang der inversen Filterbank 34 verbunden ist, um den modifizierten
Betragsanteil der Zeit/Frequenzdarstellung des Audiosignals zu erhalten. Die Rekombinationseinrichtung
38 vereint den durch die Phasenverarbeitung 36 modifizierten Phasenanteil mit dem
um das Wasserzeichen modifizierten Betragsanteil der Zeit/Frequenzbereichsdarstellung
des Audiosignals und gibt das Ergebnis, nämlich die Zeit/Frequenzdarstellung des wasserzeichenbehafteten
Audiosignals, an eine zu der ersten Filterbank 20 inverse Filterbank 40 aus. Zwischen
den Ausgang der inversen Filterbank 40 und den Ausgang 16 ist eine Fensterungseinrichtung
42 geschaltet. Der Teil aus den Komponenten 34, 38, 40, 42 kann als Syntheseteil des
Einbetters 10 betrachtet werden, da er dafür verantwortlich ist, aus der modifizierten
Frequenz/Modulationsfrequenzdarstellung das wasserzeichenbehaftete Audiosignal in
der Zeitdarstellung zu erzeugen.
[0026] Nachdem im Vorhergehenden der Aufbau des Einbetters 10 beschrieben worden ist, wird
im Folgenden dessen Funktionsweise beschrieben.
[0027] Die Einbettung beginnt mit der Überführung des Audiosignals am Eingang 12 von der
Zeitdarstellung in die Zeit/Frequenzdarstellung durch die Einrichtungen 18 und 20,
wobei davon ausgegangen wird, dass das Audioeingangssignal am Eingang 12 in einer
mit einer vorbestimmten Abtastfrequenz abgetasteten Weise vorliegt, nämlich als eine
Folge von Abtast- bzw. Audiowerten. Liegt das Audiosignal noch nicht in einer solchen
abgetasteten Form vor, so kann hierzu ein entsprechender A/D-Wandler als eine Abtasteinrichtung
verwendet werden.
[0028] Die Fensterungseinrichtung 18 empfängt das Audiosignal und extrahiert aus demselben
eine Folge von Blöcken von Audiowerten. Hierzu fasst die Fensterungseinrichtung 18
jeweils eine vorbestimmte Anzahl von aufeinander folgenden Audiowerten des Audiosignals
am Eingang 12 zu Zeitblöcken zusammen und multipliziert bzw. fenstert diese Zeitblöcke,
die ja einen Zeitausschnitt aus dem Audiosignal 12 darstellen, mit einer Fenster-
bzw. Gewichtungsfunktion, wie z.B. einem Sinusfenster, einem KBD-Fenster oder dergleichen.
Dieser Vorgang wird als Fensterung bezeichnet und dabei beispielsweise derart durchgeführt,
dass die einzelnen Zeitblöcke Zeitabschnitte des Audiosignals betreffen, die sich
gegenseitig überlappen, wie z.B. um die Hälfte, sodass jeder Audiowert zwei Zeitblöcken
zugeteilt ist.
[0029] Der Vorgang der Fensterung durch die Einrichtung 18 ist in Fig. 2 exemplarisch für
den Fall des 50%-Überlapps näher veranschaulicht. Fig. 2 veranschaulicht mit einem
Pfeil 50 die Folge von Audiowerten in ihrer zeitlichen Abfolge ihres Eintreffens am
Eingang 12. Sie stellen das Audiosignal 12 im Zeitbereich 22 dar. Der Index n in Fig.
2 soll einen in Pfeilrichtung zunehmenden Index der Audiowerte bezeichnen. Mit 52
sind die Fensterfunktionen angedeutet, die die Fensterungseinrichtung 18 auf die Zeitblöcke
anwendet. Die ersten beiden Fensterfunktionen für die ersten beiden Zeitblöcke sind
in Fig. 2 mit dem Index 2m bzw. 2m+1 überschrieben. Wie es zu erkennen ist, überlappen
der Zeitblock 2m und der darauf folgende Zeitblock 2m+1 um die Hälfte bzw. 50% und
weisen somit jeweils die Hälfte ihrer Audiowerte gemeinsam auf. Die von der Einrichtung
18 erzeugten und an die Filterbank 20 weitergeleiteten Blöcke entsprechen einer Gewichtung
der zu einem Zeitblock gehörenden Audiowerte mit der Fensterfunktion 52 bzw. einer
Multiplikation zwischen denselben.
[0030] Die Filterbank 20 erhält die Zeitblöcke bzw. Blöcke von gefensterten Audiowerten,
wie es in Fig. 2 mit Pfeilen 54 angedeutet ist, und überführt dieselben durch eine
Zeit/Frequenz-Transformation 56 blockweise in eine Spektraldarstellung. Dabei nimmt
die Filterbank je nach Ausführung eine vorbestimmte Zerlegung des Spektralbereiches
in vorbestimmte Frequenzbänder bzw. Spektralkomponenten vor. Die spektrale Darstellung
umfasst beispielsweise frequenzmäßig nebeneinander liegende Spektralwerte von der
Frequenz Null bis zur maximalen Audiofrequenz, die dem Audiosignal zugrunde liegt
und beispielsweise 44,1 kHz beträgt. In Fig. 2 ist exemplarisch der Fall einer Spektralzerlegung
in zehn Teilbänder dargestellt.
[0031] Die blockweise Überführung ist in Fig. 2 durch eine Mehrzahl von Pfeilen 58 angedeutet.
Jeder Pfeil entspricht der Überführung eines Zeitblockes in den Frequenzbereich. Beispielsweise
wird der Zeitblock 2m in einen Block 60 von Spektralwerten 62 überführt, wie er in
Fig. 2 durch eine Spalte von Kästchen angedeutet ist. Die Spektralwerte betreffen
jeweils eine unterschiedliche Frequenzkomponente oder ein unterschiedliches Frequenzband,
wobei in Fig. 2 durch die Achse 64 die Richtung angedeutet sein soll, entlang der
die Frequenz k verläuft. Wie bereits erwähnt wird vorliegend davon ausgegangen, dass
lediglich zehn Spektralkomponenten vorliegen, wobei jedoch die Anzahl lediglich veranschaulichender
Natur ist und in Wirklichkeit vermutlich höher liegen wird.
[0032] Da die Filterbank 20 pro Zeitblock einen Block 60 von Spektralwerten 62 erzeugt,
ergeben sich mit der Zeit mehrere Folgen von Spektralwerten 62, nämlich eine pro Spektralkomponente
k bzw. Teilband k. In Fig. 2 verlaufen diese zeitlichen Folgen in Zeilenrichtung,
wie sie durch den Pfeil 66 dargestellt ist. Der Pfeil 66 stellt somit die Zeitachse
der Zeit/Frequenzdarstellung dar, während der Pfeil 64 die Frequenzachse dieser Darstellung
repräsentiert. Die "Abtastfrequenz" bzw. der Wiederholabstand der Spektralwerte innerhalb
der einzelnen Teilbänder entspricht der Frequenz bzw. dem Wiederholabstand der Zeitblöcke
aus dem Audiosignal. Die Zeitblockwiederholfrequenz entspricht wiederum zwei mal der
Abtastfrequenz des Audiosignals dividiert durch die Anzahl an Audiowerten pro Zeitblock.
Der Pfeil 66 entspricht somit einer Zeitdimension insofern als er die zeitliche Abfolge
der Zeitblöcke verkörpert.
[0033] Wie es zu erkennen ist, entsteht somit über eine gewisse Anzahl, hier exemplarisch
einer Anzahl von 8, von aufeinander folgenden Zeitblöcken hinweg eine Matrix 68 von
Spektralwerten 62, die eine Zeit/Frequenzbereichsdarstellung 24 des Audiosignals über
die Zeitdauer dieser Zeitblöcke hinweg darstellt.
[0034] Die blockweise an den Zeitblöcken durch die Filterbank 20 durchgeführte Zeit/Frequenz-Transformation
56 ist beispielsweise eine DFT, DCT, MDCT oder dergleichen. Je nach Transformation
sind die einzelnen Spektralwerte innerhalb eines Blockes 60 in bestimmte Teilbänder
eingeteilt. Für jedes Teilband kann jeder Block 60 mehr als einen Spektralwert 62
aufweisen. Insgesamt entsteht somit über die Folge von Zeitblöcken hinweg pro Teilband
bzw. Spektralkomponente eine Folge von Spektralwerten, die den zeitlichen Verlauf
des jeweiligen Teilbandes wiedergeben und in Fig. 2 in Zeilenrichtung 84 verlaufen.
[0035] Die Filterbank 20 gibt blockweise die Blöcke 60 von Spektralwerten 62 an die Betrags/Phasen-Detektionseinrichtung
26 weiter. Letztere verarbeitet die komplexen Spektralwerte und gibt lediglich die
Beträge derselben an die Filterbank 28 weiter. Die Phasen der Spektralwerte 62 gibt
sie hingegen an die Phasenverarbeitungseinrichtung 36 weiter.
[0036] Die Filterbank 28 verarbeitet die pro Teilband vorliegenden Folgen 70 von Beträgen
von Spektralwerten 62 ähnlich der Filterbank 20, nämlich durch blockweises Transformieren
dieser Folgen Block für Block in die Spektraldarstellung bzw. die Modulationsfrequenzdarstellung,
und zwar unter Verwendung von vorzugsweise wiederum gefensterten und sich gegenseitig
überlappenden Blöcken, wobei die zugrundeliegenden Blöcke aller Teilbänder vorzugsweise
zeitlich zueinander gleich ausgerichtet sind. Anders ausgedrückt verarbeitet die Filterbank
28 jeweils N Spektralblöcke 60 von Spektralwertbeträgen gleichzeitig bzw. gemeinsam.
Die N Spektralblöcke 60 von Spektralwertbeträgen bilden eine Matrix 68 von Spektralwertbeträgen.
Existieren beispielsweise M Teilbänder, verarbeitet die Filterbank 28 die Spektralwertbeträge
in Matrizen zu je N*M Spektralwertbeträgen. In Fig. 3 ist exemplarisch der Fall angenommen,
dass M=N gilt, während in Fig. 2 exemplarisch angenommen wurde, dass N=10 und M=8
gilt. Die Weiterleitung des Betragsanteils einer solchen Matrix 68 von Spektralwertbeträgen
62 an die Filterbank 28 ist in Fig. 2 durch die Pfeile 72 angedeutet.
[0037] Nach Erhalt des Betragsanteils N aufeinanderfolgender Spektralblöcke bzw. der Matrix
68 transformiert also die Filterbank 28 - getrennt für jedes Teilband - die Blöcke
von Spektralwertbeträgen der jeweiligen Teilbänder, also der Zeilen in der Matrix
68, von der Zeitdomäne 66 in eine Frequenzdarstellung, wobei wie bereits erwähnt die
Spektralwertbeträge zur Vermeidung von Aliasingeffekten gefenstert sein können. Anders
ausgedrückt überführt die Filterbank 28 jeden dieser Spektralwertbetragsblöcke aus
den den zeitlichen Verlauf eines jeweiligen Teilbandes darstellenden Folgen 70 in
eine Spektraldarstellung und erzeugt somit pro Teilband einen Block von Modulationswerten,
die in Fig. 2 mit 74 angezeigt sind. Jeder Block 74 enthält mehrere Modulationswerte,
die in Fig. 2 nicht mehr veranschaulicht sind. Jeder dieser Modulationswerte innerhalb
eines Blockes 74 ist einer unterschiedlichen Modulationsfrequenz zugeordnet, die in
Fig. 2 entlang der Achse 76 verlaufen soll, die somit die Modulationsfrequenzachse
der Frequenz/Modulationsfrequenzdarstellung repräsentiert. Durch Anordnung der Blöcke
74 je nach Teilbandfrequenz entlang einer Achse 78 entsteht hierdurch eine Matrix
80 von Modulationswerten, die eine Frequenz/Modulationsfrequenzbereichsdarstellung
des Audiosignals am Eingang 12 in dem der Matrix 68 zugeordneten Zeitabschnitt darstellt.
[0038] Wie bereits erwähnt kann zur Vermeidung von Artefakten die Filterbank 28 oder die
Einrichtung 26 eine interne Fenstereinrichtung (nicht gezeigt) aufweisen, die die
Transformationsblöcke, also die Zeilen der Matrix 68, von Spektralwerten pro Teilband
vor ihrer jeweiligen Zeit/Modulationsfrequenz-Transformation 80 durch die Filterbank
28 in den Modulationsfrequenzbereich 30, um die Blöcke 74 zu erhalten, einer Fensterung
mit einer Fensterfunktion 82 unterzieht.
[0039] Es wird noch einmal explizit darauf hingewiesen, dass auf die im Vorhergehenden beschriebene
Weise eine Folge von Matrizen 80 verarbeitet werden, die sich in dem im Vorhergehenden
erwähnten exemplarisch 50%-Überlapp-Fensterung - um 50% in der Zeit überlappen. Anders
ausgedrückt bildet die Filterbank 28 die Matrix 80 für aufeinander folgende N Zeitblöcke
derart, dass die Matrizen 80 jeweils N Zeitblöcke betreffen, die sich um die Hälfte
überschneiden, wie es in Fig. 2 exemplarisch durch eine gestrichelte Fensterfunktion
84 angedeutet werden soll, die die Fensterung für die nächste Matrix darstellen.
[0040] Die Modulationswerte der Frequenz/Modulationsfrequenzbereichsdarstellung 30, wie
sie von der Filterbank 28 ausgegeben werden, erreichen die Wasserzeicheneinbettungseinrichtung
32. Die Wasserzeicheneinbettungseinrichtung 32 modifiziert nun die Modulationsmatrix
80 bzw. einzelne oder mehrere der Modulationswerte der Modulationsmatrizen 80 des
Audiosignals 12. Die von der Einrichtung 32 vorgenommene Modifikation kann beispielsweise
durch eine multiplikative Gewichtung einzelner Modulationsfrequenz/Frequenz-Segmente
des Modulationsteilbandspektrums bzw. der Frequenz/Modulationsfrequenzbereichsdarstellung
erfolgen, d.h. durch eine Gewichtung der Modulationswerte innerhalb eines bestimmten
Bereichs des durch die Achsen 76 und 78 aufgespannten Frequenz/Modulationsfrequenz-Raumes.
Ebenso könnte die Modifikation das Setzen einzelner Segmente bzw. Modulationswerte
auf bestimmte Werte aufweisen.
[0041] Die multiplikative Gewichtung bzw. die bestimmten Werte würden in vorgegebener Weise
von dem Wasserzeichen abhängen, das am Eingang 14 erhalten wird. Dabei könnte das
Setzen einzelner Modulationswerte bzw. Segmente von Modulationswerten auf bestimmte
Werte signaladaptiv erfolgen, d.h. zusätzlich abhängig von dem Audiosignal 12 an sich.
[0042] Die einzelnen Segmente des 2-dimensionalen Modulationsteilbandspektrums können einerseits
durch Unterteilung der akustischen Frequenzachse 78 in Frequenzgruppen gewonnen werden,
andererseits kann eine weitere Segmentierung durch Unterteilung der Modulationsfrequenzachse
76 in Modulationsfrequenzgruppen durchgeführt werden. In Fig. 1 ist exemplarisch eine
Segmentierung der Frequenzachse in 5 und der Modulationsfrequenzachse in 4 Gruppen
angedeutet, wodurch sich 20 Segmente ergeben. Die dunklen Segmente zeigen exemplarisch
die Stellen an, an denen die Einrichtung 32 die Modulationsmatrix 80 modifiziert,
wobei, wie im Vorhergehenden erwähnt, die zur Modifikation herangezogen Stellen zeitlich
variieren können. Die Stellen werden vorzusgweise derart ausgewählt, dass durch Verdeckungseffekte
die Änderungen an dem Audiosignal in der Frequenz/Modulationsfrequenzdarstellung nicht
oder kaum hörbar sind.
[0043] Nachdem die Einrichtung 32 die Modulationsmatrix 80 modifiziert hat, sendet dieselbe
die modifizierten Modulationswerte der Modulationsmatrix 80 an die inverse Filterbank
34 weiter. Diese überführt mittels einer Transformation, die zu derjenigen der Filterbank
28 invers ist, also z.B. einer IDFT, IFFT, IDCT, IMDCT oder dergleichen, die Modulationsmatrix
80 Block-74-weise, d.h. getrennt nach Teilband, entlang der Modulationsfrequenzachse
76 in die Zeit/Frequenzbereichsdarstellung 24 zurück, um dadurch modifizierte Betragsanteil-Spektralwerte
zu erhalten. Anders ausgedrückt transformiert die inverse Filterbank 34 jeden einem
bestimmten Teilband zugehörigen Block von modifizierten Modulationswerten 74 mit einer
zu der Transformation 86 inversen Transformation in eine Folge von Betragsanteil-Spektralwerten
pro Teilband, wodurch sich nach dem vorhergehenden Ausführungsbeispiel eine Matrix
von N x M Betragsanteil-Spektralwerten ergibt.
[0044] Die Betragsanteil-Spektralwerte von der inversen Filterbank 34 beziehen sich also
immer auf zweidimensionale Blöcke bzw. Matrizen aus dem Strom von Folgen von Spektralwerten,
in natürlich um das Wasserzeichen modifizierter Form. Nach dem exemplarischen Ausführungsbeispiel
überlappen sich diese Blöcke um 50%. Eine beispielsweise in der Einrichtung 34 vorgesehene
Einrichtung (nicht gezeigt) kompensiert nun in diesem exemplarischen 50%-Überlappungsfall
die Fensterung, indem sie die sich überlappenden rekombinierten Spektralwerte aufeinanderfolgender,
durch Rücktransformation aufeinanderfolgender Modulationsmatrizen erhaltener Matrizen
von Spektralwerten addiert. Hierdurch entstehen aus den einzelnen Matrizen von modifizierten
Spektralwerten wieder Ströme bzw. Folgen von modifizierten Spektralwerten, nämlich
eine pro Teilband. Diese Folgen korrespondieren lediglich mit dem Betragsanteil der
unmodifizierten Folgen 70 von Spektralwerten, wie sie von der Einrichtung 20 ausgegeben
wurden.
[0045] Die Rekombinationseinrichtung 38 verknüpft die zu Teilbandströmen zusammengeführten
Betragsanteil-Spektralwerte von der inversen Filterbank 34 mit den Phasenanteilen
der Spektralwerte 62, wie sie von der Detektionseinrichtung 26 unmittelbar nach der
Transformation 56 durch die erste Filterbank 20 abgesondert worden sind, jedoch in
einer durch die Phasenverarbeitung 36 modifizierten Form. Und zwar modifiziert die
Phasenverarbeitungseinrichtung 36 die Phasenanteile in einer von der Wasserzeicheneinbettung
durch die Einrichtung 32 getrennten aber unter Umständen von dieser Einbettung abhängigen
Weise derart, dass die Detektierbarkeit des Wasserzeichens im später bezugnehmend
auf Fig. 3 erläuterten Detektor bzw. Decodersystem besser detektierbar ist oder/und
die akustische Verdeckung des Wasserzeichensignals im später am Ausgang 16 auszugebenden
wasserzeichenbehafteten Ausgangssignal und damit die Unhörbarkeit des Wasserzeichens
verbessert ist. Die Rekombination kann die Rekombinationseinrichtung 38 matrixweise
pro Matrix 68 oder kontinuierlich über die Folgen von modifizierten Betragsanteil-Spektralwerten
pro Teilband vornehmen. Die optionale Abhängigkeit der Manipulation des Phasenanteils
der Zeit/Frequenzdarstellung des Audiosignals am Eingang 12 von der Manipulation der
Frequenz/Modulationsfrequenzdarstellung durch die Manipulationseinrichtung 32 ist
in Fig. 1 durch einen gestrichelten Pfeil 88 veranschaulicht. Die Rekombination wird
beispielsweise durch Addieren der Phase eines Spektralwertes auf den Phasenanteil
des entsprechenden modifizierten Spektralwerts durchgeführt, wie er von der Filterbank
34 ausgegeben wird.
[0046] Auf diese Weise erzeugt die Einrichtung 38 also Folgen von Spektralwerten pro Teilband
wie diejenige, die nach der Filterbank 20 direkt aus dem unveränderten Audiosignal
erhalten worden ist, nämlich die Folgen 70, jedoch in um das Wasserzeichen veränderter
Form, so dass die von der Einrichtung 38 ausgegebenen rekombinierten und bezüglich
des Betragsanteils modifizierten Spektralwerte eine Zeit/Frequenzdarstellung des wasserzeichenbehafteten
Audiosignals repräsentieren.
[0047] Die inverse Filterbank 40 erhält somit wieder Folgen von modifizierten Spektralwerten,
nämlich eine pro Teilband. Anders ausgedrückt, erhält die inverse Filterbank 40 pro
Zyklus eine Block von modifizierten Spektralwerte, also eine Frequenzdarstellung des
wasserzeichenbehafteten Audiosignals bezüglich eines Zeitabschnittes desselben. Dementsprechend
führt die Filterbank 40 eine zu der Transformation 56 der Filterbank 20 inverse Transformation
an jedem solchen Block von Spektralwerten, d.h. entlang der Frequenzachse 70 angeordneten
Spektralwerten, durch, um als Ergebnis modifizierte gefensterte Zeitblöcke bzw. Zeitblöcke
von gefensterten modifizierten Audiowerten zu erhalten. Die anschließende Fensterungseinrichtung
42 kompensiert die Fensterung, wie sie durch die Fensterungseinrichtung 18 eingeführt
worden ist, indem sie innerhalb der überlappenden Bereiche einander entsprechende
Audiowerte addiert, wodurch sich am Ausgang 16 das wasserzeichenbehaftete Ausgangssignal
in der Zeitbereichsdarstellung 22 ergibt.
[0048] Nachdem im Vorhergehenden die Einbettung eines Wasserzeichens gemäß dem Ausführungsbeispiel
von Fig. 1-2 beschrieben worden ist, wird im Folgenden bezugnehmend auf Fig. 3 eine
Vorrichtung beschrieben, die dazu geeignet ist, ein durch den Einbetter 10 erzeugtes
wasserzeichenbehaftetes Ausgangssignal erfolgreich zu analysieren, um wieder das Wasserzeichen
aus demselben zu rekonstruieren bzw. detektieren, das ja in dem wasserzeichenbehafteten
Ausgangssignal zusammen mit den Nutzaudioinformationen für das menschliche Gehör vorzugsweise
unhörbar enthalten ist.
[0049] Der Wasserzeichendecoder von Fig. 3, der allgemein mit 100 angezeigt ist, umfasst
einen Audiosignaleingang 112 zum Empfangen des wasserzeichenbehafteten Audiosignals
und einen Ausgang 114 zum Ausgeben des aus dem wasserzeichenbehafteten Audiosignal
extrahierten Wasserzeichens. An den Eingang 112 schließen sich in Reihe geschaltet
und in der Reihenfolge, wie sie im Folgenden aufgelistet sind, eine Fenstereinrichtung
118, eine Filterbank 120, eine Betrags/Phasen-Detektionseinrichtung 126 und eine zweite
Filterbank 128 an, die in ihrer Funktion und Arbeitsweise den Blöcken 18, 20, 26 und
28 aus dem Einbetter 10 entsprechen. Dies bedeutet, dass das wasserzeichenbehaftete
Audiosignal am Eingang 112 durch die Fenstereinrichtung 118 und die Filterbank 120
von dem Zeitbereich 122 in den Zeitfrequenzbereich 124 überführt wird, von wo aus
durch die Detektionseinrichtung 126 und die zweite Filterbank 128 eine Überführung
des Audiosignals am Eingang 112 in den Frequenz/Modulationsfrequenzbereich 130 stattfindet.
Das wasserzeichenbehaftete Audiosignal wird durch die Einrichtungen 118, 120, 126
und 128 folglich denselben Verarbeitungen unterzogen, wie sie bezüglich des ursprünglichen
Audiosignals bezugnehmend auf Fig. 2 beschrieben worden sind. Die sich ergebenden
Modulationsmatrizen entsprechen jedoch nicht vollständig denjenigen, wie sie in dem
Einbetter 10 von der Wassereinbettungseinrichtung 32 ausgegeben wurden, da durch die
Phasenrekombinationen der Rekombinationseinrichtung 38 einige der Modulationsanteile
bezüglich der modifizierten Modulationsmatrizen, wie sie von der Einrichtung 32 ausgegeben
werden, verändert werden und sich somit in etwas veränderter Form im wasserzeichenbehafteten
Ausgangssignal widerspiegeln. Auch die Fensterungsrückgängigmachung bzw. OLA verändert
die Modulationsanteile bis zur erneuten Modulationsspektralanalyse im Dekodierer 100.
[0050] Eine Wasserzeichen-Decodierungseinrichtung 132, die mit der Filterbank 128 verbunden
ist, um die Frequenz/Modulationsbereichsdarstellung des wasserzeichenbehafteten Eingangssignals
bzw. die Modulationsmatrizen zu erhalten, ist vorgesehen, um das ursprünglich durch
den Einbetter 10 eingebrachte Wasserzeichen aus dieser Darstellung zu extrahieren
und am Ausgang 114 auszugeben. Die Extraktion wird an vorbestimmten Stellen der Modulationsmatrizen
vorgenommen, die mit denjenigen korrespondieren, die von dem Einbetter 10 zur Einbettung
verwendet worden sind. Die Übereinstimmung der Auswahl der Stellen wird beispielsweise
durch entsprechende Standardisierung sichergestellt.
[0051] Gegenüber den Modulationsmatrizen, wie sie im Einbetter 10 in der Einrichtung 32
erzeugt wurden, bewirkte Veränderungen der Modulationsmatrizen, wie sie der Wasserzeichen-Decodierungseinrichtung
132 zugehen, können auch daher rühren, dass das wasserzeichenbehaftete Eingangssignal
zwischen seiner Erzeugung bzw. Ausgabe am Ausgang 16 und der Detektion durch den Detektierer
100 bzw. dem Empfang am Eingang 112 auf irgendeine Weise verschlechtert worden ist,
wie z.B. durch eine gröbere Quantisierung der Audiowerte oder dergleichen.
[0052] Bevor im Folgenden bezugnehmend auf die Figuren 4 und 5 ein weiteres Ausführungsbeispiel
für ein Schema einer Einbettung eines Wasserzeichens in ein Audiosignal beschrieben
wird, das sich im Hinblick auf das bezugnehmend auf Fig. 1-3 beschriebene Schema lediglich
im Hinblick auf die Art und Weise der Überführung des Audiosignals vom Zeitbereich
in den Frequenz/Modulationsfrequenzbereich unterscheidet, werden im Folgenden exemplarische
Anwendungsbereiche bzw. Möglichkeiten beschrieben, auf welche das im Vorhergehenden
beschriebene Einbettungsschema sinnvoll eingesetzt werden kann. Die folgenden Beispiele
beziehen sich dabei exemplarisch auf Einsatzgebiete in der Rundfunküberwachung (broadcast
monitoring) und bei DRM-Systemen, wie herkömmliche WM-Systemen (WM = watermark = Wasserzeichen).
Die im Folgenden beschriebenen Anwendungsmöglichkeiten treffen aber natürlich auch
auf das im Folgenden noch zu beschreibende Ausführungsbeispiel von Fig. 4 und 5 zu.
[0053] Einerseits kann das im Vorhergehenden beschriebene Ausführungsbeispiel zur Einbettung
eines Wasserzeichens in ein Audiosignal zum Nachweis der Urheberschaft eines Audiosignals
verwendet werden. Bei dem ursprünglichen Audiosignal, das am Eingang 12 eintrifft,
handelt es sich beispielsweise um ein Musikstück. Während der Produktion von Musikstücken
können durch den Einbetter 10 Urheberinformationen in Form eines Wasserzeichens in
das Audiosignal eingebracht werden, wodurch das wasserzeichenbehaftete Audiosignal
am Ausgang 16 entsteht. Wenn nun ein Dritter behauptet, Urheber des entsprechenden
Musikstückes bzw. Musiktitels zu sein, kann der Nachweis der tatsächlichen Urheberschaft
mit Hilfe des Wasserzeichens geführt werden, das aus dem wasserzeichenbehafteten Audiosignal
mittels des Detektors 100 wieder extrahiert werden kann und ansonsten bei normalem
Abspielen unhörbar ist.
[0054] Ein weiterer möglicher Einsatz oben dargestellter Wasserzeicheneinbettung besteht
darin, Wasserzeichen für die Protokollierung des Sendeprogramms von TV- und Radiosendern
zu verwenden. Rundfunkprogramme untergliedern sich zumeist in unterschiedliche Abschnitte,
wie z.B. einzelne Musiktitel, Hörspiele, Werbespots oder dergleichen. Der Urheber
eines Audiosignals oder zumindest derjenige, der an einem bestimmten Musiktitel oder
Werbespot verdienen darf und möchte, kann nun sein Audiosignal mit dem Einbetter 10
mit einem Wasserzeichen versehen, und das wasserzeichenbehaftete Audiosignal dem Rundfunkbetreiber
zukommen lassen. Musiktitel oder auch Werbespots können auf diese Weise mit einem
jeweils eindeutigen Wasserzeichen beaufschlagt werden. Zur Protokollierung des Sendeprogramms
kann nun z.B. ein Computer herangezogen werden, der das Rundfunksignal auf ein Wasserzeichen
hin untersucht und gefundene Wasserzeichen protokolliert. Anhand der Liste des entdeckten
Wasserzeichens lässt sich ohne weiteres eine Sendeliste für den entsprechenden Rundfunksender
generieren, was die Abrechnung bzw. Gebührenbezahlung erleichtert.
[0055] Ein weiteres Einsatzgebiet besteht darin, Wasserzeichen zur Ermittelung illegaler
Kopien zu verwenden. In dieser Hinsicht lohnt sich der Einsatz von Wasserzeichen insbesondere
für den Musikvertrieb über das Internet. Erwirbt ein Käufer einen Musiktitel, wird
während der Übermittlung der Musikdaten an den Käufer eine eindeutige Kundennummer
mit Hilfe eines Wasserzeichens in die Daten eingebettet. Das Ergebnis sind Musiktitel,
in denen das Wasserzeichen unhörbar eingebettet ist. Wird zu einem späteren Zeitpunkt
ein Musiktitel an einer nicht genehmigten Stelle im Internet, wie z.B. einer Tauschbörse,
gefunden, kann dieses Stück auf das Wasserzeichen hin mittels eines Decodierers nach
Fig. 3 untersucht und anhand des Wasserzeichens der ursprüngliche Käufer identifiziert
werden. Der letztgenannte Einsatz könnte auch für die aktuellen DRM-(DRM = Digital
Rights Management = Digitale-Rechte-Verwaltung) Lösungen eine wichtige Rolle spielen.
Das Wasserzeichen in den wasserzeichenbehafteten Audiosignalen könnte hier als eine
Art "zweite Verteidigungslinie" dienen, die auch dann noch Rückschlüsse auf den ursprünglichen
Käufer zulässt, wenn der kryptographische Schutz eines wasserzeichenbehafteten Audiosignals
bereits umgangen worden ist.
[0057] Im folgenden werden ein Einbetter und ein WasserzeichenDecoder bezüglich eines Ausführungsbeispiels
für ein Einbettungsschema beschrieben, bei dem eine verglichen zu dem Ausführungsbeispiel
in Fig. 1-3 unterschiedliche Überführung des Audiosignals vom Zeitbereich in den Frequenz/Modulationsfrequenzbereich
verwendet wird. In der nachfolgenden Beschreibung werden Elemente in den Figuren,
die zu denjenigen von Fig. 1 und 3 identisch oder gleichbedeutend sind, mit gleichen
Bezugszeichen versehen, wie sie in Fig. 1 und 3 versehen worden sind, wobei für eine
detailliertere Erörterung der Funktionsweise oder Bedeutung dieser Elemente zur Vermeidung
von Wiederholungen ergänzend auf die Beschreibung der Figuren 1-3 verwiesen wird.
[0058] Der Einbetter von Fig. 4, der allgemein mit 210 angezeigt ist, umfasst ebenso wie
der Einbetter von Fig. 1 einen Audiosignaleingang 12, einen Wasserzeicheneingang 14
und einen Ausgang 16 zur Ausgabe des wasserzeichenbehafteten Audiosignals. An den
Eingang 12 schließen sich die Fensterungseinrichtung 18 und die erste Filterbank 20
an, um das Audiosignal blockweise in Blöcke 60 von Spektralwerten 62 (Fig. 2) zu überführen,
wobei die Folge von Blöcken von Spektralwerten, die hierdurch am Ausgang der Filterbank
20 entsteht, die Zeit/Frequenzbereichsdarstellung 24 des Audiosignals darstellt. Im
Unterschied zu dem Einbetter 10 von Fig. 1 werden jedoch die komplexen Spektralwerte
62 nicht in Betrag und Phase unterteilt, sondern die komplexen Spektralwerte werden
vollständig weiterverarbeitet, um das Audiosignal in den Frequenz/Modulationsfrequenzbereich
zu überführen. Die Folgen 70 von aufeinander folgenden Spektralwerten eines Teilbandes
werden deshalb unter Berücksichtigung von Betrag und Phase blockweise in eine spektrale
Darstellung überführt. Zuvor wird jedoch jede Teilbandspektralwertfolge 70 noch einer
Demodulation unterzogen. Jede Folge 70, also die Abfolge von Spektralwerten, die sich
bei aufeinander folgenden Zeitblöcken durch Überführung in den Spektralbereich für
ein bestimmtes Teilband ergeben, wird nämlich durch einen Mischer 212 mit dem komplex
Konjugierten einer Modulationsträgerkomponente multipliziert bzw. gemischt, welche
durch eine Trägerfrequenzbestimmungseinrichtung 214 aus den Spektralwerten und insbesondere
dem Phasenanteil dieser Spektralwerte der Zeit/Frequenzbereichsdarstellung des Audiosignals
ermittelt wird. Die Einrichtungen 212 und 214 dienen dazu, eine Kompensation dazu
zu liefern, dass der Wiederholabstand der Zeitblöcke nicht unbedingt zu der Periodendauer
der Trägerfrequenzkomponente des Audiosignals abgestimmt ist, d.h. derjenigen hörbaren
Frequenz, die im Mittel die Trägerfrequenz des Audiosignals darstellt. In dem Fall
der Fehlabstimmung sind aufeinander folgende Zeitblöcke um einen unterschiedlichen
Phasenversatz zu der Trägerfrequenz des Audiosignals verschoben. Dies führt dazu,
dass jeder Block 60 von Spektralwerten, wie er von der Filterbank 20 ausgegeben wird,
je nach Phasenversatz des jeweiligen Zeitblockes zu der Trägerfrequenz im Phasenanteil
einen linearen Phasenanstieg aufweist, der auf den zeitblockindividuellen Phasenversatz
zurückzuführen ist, d.h. deren Steigung und Achsenabschnitt von dem Phasenversatz
abhängt. Da der Phasenversatz zwischen aufeinander folgenden Zeitblöcken zunächst
immer zunimmt, wird auch die Steigung des auf den Phasenversatz zurückzuführenden
Phasenanstieg für jeden Block 60 von Spektralwerten 62 größer, so lange, bis der Phasenversatz
wieder Null wird usw.
[0059] Die vorhergehende Betrachtung bezog sich lediglich auf einzelne Blöcke 60 von Spektralwerten.
Aus der vorhergehenden Erörterung wird jedoch auch deutlich, dass ein linearer Phasenanstieg
auch bei Spektralwerten feststellbar ist, die sich bei aufeinander folgenden Zeitblöcken
für ein und dasselbe Teilband ergeben, also ein Phasenanstieg entlang der Zeilen in
Fig. 2 in der Matrix 68. Auch dieser Phasenanstieg ist auf den Phasenversatz der aufeinander
folgenden Zeitblöcke rückzuführen und von demselben abhängig. Insgesamt erfahren die
Spektralwerte 62 in der Matrix 68 aufgrund des Zeitversatzes der aufeinander folgenden
Zeitblöcke eine kumulative Phasenänderung, die sich als Ebene in dem durch die Achsen
66 und 64 aufgespannten Raum darstellt.
[0060] Die Trägerfrequenzbestimmungseinrichtung 214 fittet bzw. passt deshalb durch geeignete
Verfahren, beispielsweise mit einem kleinste-Fehlerquadrate-Algorithmus, eine Ebene
in die geunwrappten bzw. einem Phasenunwrapping bzw. einer Phasenentwicklung bzw.
Phasenabschnittsaneinanderreichung unterzogenen Phasen der Spektralwerte 62 der Matrix
68 ein, und schließt aufgrund dessen auf den auf den Phasenversatz der Zeitblöcke
rückzuführenden Phasenanstieg zurück, der bei den Folgen 70 von Spektralwerten für
die einzelnen Teilbänder innerhalb der Matrix 68 auftritt. Insgesamt ergeben sich
somit pro Teilband ein hergeleiteter Phasenanstieg, der der gesuchten Modulationsträgerkomponente
entspricht. Diese gibt die Einrichtung 214 an den Mischer 212 weiter, damit die jeweilige
Folge 70 von Spektralwerten durch den Mischer 212 mit der komplex Konjugierten derselben
gemischt wird, bzw. mit e
-j(w*m+ϕ) multipliziert wird, wobei m den bestimmten Träger angibt, m der Index für die Spektralwerte
ist und ϕ einen Phasenversatz des bestimmten Trägers zum betrachteten Zeitausschnitt
der N Zeitblöcke ist. Natürlich kann die Trägerfrequenzbestimmungseinrichtung 214
auch eindimensionale Einpassungen einer Geraden in die Phasenverläufe der einzelnen
Folgen 70 von Spektralwerten 62 innerhalb der Matrizen 68 durchführen, um die einzelnen
auf den Phasenversatz der Zeitblöcke rückzuführenden Phasenanstieg zu erhalten. Nach
der Demodulation durch den Mischer 212 ist deshalb der Phasenanteil der Spektralwerte
der Matrix 68 "eingeebnet", und variiert lediglich noch im Mittel um die Phase Null
aufgrund der Gestalt des Audiosignals selbst herum.
[0061] Die so modifizierten Spektralwerte 62 gibt der Mischer 212 an die Filterbank 28 weiter,
die dieselben matrixweise (Matrix 68 in Fig. 2) in den Frequenz/Modulationsfrequenzbereich
überführt. Ähnlich wie bei dem Ausführungsbeispiel von Fig. 1-3 wird folglich eine
Matrix von Modulationswerten erhalten, in der diesmal jedoch sowohl Phase als auch
Betrag der Zeit/Frequenbereichsdarstellung 24 berücksichtigt worden sind. Wie bei
dem Beispiel von Fig. 1 kann eine Fensterung mit 50%-Überlappung oder dergleichen
vorgesehen sein.
[0062] Die so erzeugten aufeinander folgenden Modulationsmatrizen werden einer Wasserzeichen-Einbettungseinrichtung
216 weitergeleitet, die an einem weiteren Eingang das Wasserzeichen 14 erhält. Die
Wasserzeicheneinbettungseinrichtung 216 funktioniert beispielsweise auf ähnliche Weise
wie die Einbettungseinrichtung 32 des Einbetters 10 von Fig. 1. Die Einbettungsstellen
innerhalb der Frequenz/Modulationsfrequenzbereichsdarstellung 30 werden jedoch gegebenenfalls
unter Verwendung von andere Verdeckungseffekte berücksichtigenden Regeln ausgewählt,
als dies bei der Einbettungseinrichtung 32 der Fall ist. Die Stellen der Einbettung
sollten wie auch bei der Einrichtung 32 derart ausgewählt sein, dass die dort modifizierten
Modulationswerte sich nicht hörbar auf das wasserzeichenbehaftete Audiosignal auswirken,
wie es später am Ausgang des Einbetters 210 ausgegeben wird.
[0063] Die veränderten Modulationswerte bzw. die veränderten bzw. modifizierten Modulationsmatrizen
werden an die inverse Filterbank 34 weitergeleitet, wodurch sich aus den modifizierten
Modulationsmatrizen Matrizen von modifizierten Spektralwerten ergeben. Bei diesen
modifizierten Spektralwerten ist noch die Phasenkorrektur rückgängig zu machen, die
durch die Demodulation mittels des Mischers 212 herbeigeführt worden ist. Deshalb
werden die von der inversen Filterbank 34 pro Teilband ausgegebenen Blöcke von modifizierten
Spektralwerten mittels eines Mischers 218 mit einer Demodulationsträgerkomponente
gemischt bzw. multipliziert, die zu derjenigen komplex konjugiert ist, die vor der
Überführung in den Frequenz/Modulationsfrequenzbereich zur Demodulation durch den
Mischer 212 für dieses Teilband verwendet worden ist, indem also eine Multiplikation
dieser Blöcke mit e
j(w*m+ϕ) durchgeführt wird, wobei wiederum w den bestimmten Träger für das jeweilige Teilband
angibt, m der Index für die modifizierten Spektralwerte ist und ϕ einen Phasenversatz
des bestimmten Trägers zum betrachteten Zeitausschnitt der N Zeitblöcke für das jeweilige
Teilband ist. Hierdurch wird der jeweilige Modulator für das jeweilige Teilband, der
sich ja auf den Inhalt eines bestimmten Subbandblockes bezieht bzw. nach der Blockeinteilung
durch die Modulation 212, 214 angewendet worden ist, vor der anschließenden Blockzusammenführung
wieder invertiert.
[0064] Die so erhaltenen Spektralwerte liegen noch in Form von Blöcken, nämlich zu je einem
Block von modifizierten Spektralwertblöcken pro Teilband vor und werden gegebenenfalls
noch einer OLA bzw. Zusammenfügung zur Rückgängigmachung der Fensterung unterzogen,
wie z.B. auf die bezugnehmend auf 34 von Fig. 1 beschriebene Weise. Die so erhaltenen
ungefensterten Spektralwerte stehen dann als Ströme von modifizierten Spektralwerten
pro Teilband zur Verfügung und stellen die Zeit/Frequenzbereichsdarstellung des wasserzeichenbehafteten
Audiosignals dar. An den Ausgang des Mischers 218 schließen sich die inverse Filterbank
40 und die Fensterungseinrichtung 42 an, die die Überführung der Zeit/Frequenzbereichsdarstellung
des wasserzeichenbehafteten Audiosignals in den Zeitbereich 22 übernehmen, wodurch
sich am Ausgang 16 eine Folge von Audiowerten ergeben, die das wasserzeichenbehaftete
Audiosignal darstellen.
[0065] Ein Vorteil der Vorgehensweise nach Fig. 4 bezüglich der Vorgehensweise nach Fig.
1 besteht darin, dass dadurch, dass Phase und Betrag zusammen zur Überführung in den
Frequenz/Modulationsfrequenzbereich verwendet werden, keine Wiedereinführung von Modulationsanteilen
bei der Rekombination von Phase und modifiziertem Betrags-Anteil hervorgerufen wird.
[0066] Ein Wasserzeichen-Decodierer, der geeignet ist, um das wasserzeichenbehaftete Audiosignal,
wie es von dem Einbetter 210 ausgegeben wird, zu verarbeiten, um daraus das Wasserzeichen
zu extrahieren, ist in Fig. 5 gezeigt. Der Decodierer, der allgemein mit 310 angezeigt
ist, umfasst einen Eingang 312 zum Empfangen des wasserzeichenbehafteten Audiosignals
und einen Ausgang 314 zum Ausgeben des extrahierten Wasserzeichens. An den Eingang
312 des Decodierers 310 schließen sich in Reihe geschaltet und in der Reihenfolge,
wie sie im Folgenden genannt sind, eine Fensterungseinrichtung 318, eine Filterbank
320, ein Mischer 412 und eine Filterbank 328 an, wobei ein weiterer Eingang des Mischers
412 mit einem Ausgang einer Trägerfrequenzbestimmungseinrichtung 414 verbunden ist,
die einen mit dem Ausgang der Filterbank 320 verbundenen Eingang aufweist. Die Komponenten
318, 320, 412, 328 und 414 erfüllen den selben Zweck und arbeiten auf die gleiche
Weise wie die Komponenten 18, 20, 212, 28 und 214 des Einbetters 210. Auf diese Weise
wird das wasserzeichenbehaftete Eingangssignal im Decodierer 310 vom Zeitbereich 322
über den Zeitfrequenzbereich 324 in den Frequenz/Modulationsfrequenzbereich 330 überführt,
wo eine Wasserzeichen-Decodierungseinrichtung 332 die Frequenz/Modulationsfrequenzbereichsdarstellung
des wasserzeichenbehafteten Audiosignals empfängt und verarbeitet, um das Wasserzeichen
zu extrahieren und am Eingang 314 des Decodierers 310 auszugeben. Wie im Vorhergehenden
erwähnt, unterscheiden sich die der Decodierungseinrichtung 332 im Decodierer 310
zugeführten Modulationsmatrizen um weniger als die der Dekodierungseinrichtung 132
zugeführten von denen der Einbettungseinrichtung 216 zugeführten in dem Ausführungsbeispiel
von Fig. 1-3, da die Rekombination zwischen Phasenanteil und modifiziertem Betragsanteil
im Einbettersystem von Fig. 4 wegfällt.
[0067] Die vorhergehenden Ausführungsbeispiele betrafen folglich eine bisher nicht da gewesene
Verbindung der Themenbereiche "Teilbandmodulationsspektralanalyse" und "digitales
Wasserzeichen" zu einem Gesamtsystem zur Einbringung von Wasserzeichen mit einem Einbettersystem
auf der einen und einem Detektorsystem auf der anderen Seite. Das Einbettersystem
dient zum Einbringen des Wasserzeichens. Es besteht aus einer Teilbandmodulationsspektralanalyse,
einer Einbetterstufe, die eine Modifikation der durch die Analyse gewonnenen Signalrepräsentation
vornimmt, und einer Synthese des Signals der modifizierten Repräsentation. Das Detektorsystem
dient umgekehrt zur Erkennung eines vorhandenen Wasserzeichens in einem wasserzeichenbehafteten
Audiosignal. Es besteht aus einer Teilbandmodulationsspektralanalyse und einer Detektionsstufe,
die unter Verwendung der durch die Analyse gewonnenen Signalrepräsentation das Wasserzeichen
erkennt und auswertet.
[0068] Im Hinblick auf die Auswahl derjenigen Stellen im Frequenz/Modulationsfrequenzbereich
bzw. derjeniger Modulationswerte im Frequenz/Modulationsfrequenzbereich, die zur Wasserzeicheneinbettung
bzw. Wasserzeichenextraktion herangezogen werden, wird darauf hingewiesen, dass diese
Auswahl nach psychoakustischen Gesichtspunkten getroffen werden sollte, um zu gewährleisten,
dass das Wasserzeichen bei Abspielen des wasserzeichenbehafteten Audiosginals unhörbar
ist. Zur geeigneten Auswahl können Verdeckungseffekte im Modulationsspektralbereich
ausgenutzt werden. Hierzu sei beispielsweise auf
T. Houtgast: "Frequency Selectivity in Amplitude Modulation Detection", J. Acoust.
Soc. Am. vol. 85, No. 4, April 1989 verwiesen, welche hiermit bezüglich der Auswahl unhörbar modifizierbarer Modulationswerte
im Frequenz/Modulationsfrequenzbereich unter Bezugnahme aufgenommen wird.
[0069] Für ein näheres Verständnis der Modulationsspektralanalyse im allgemeinen sei noch
auf folgende Veröffentlichungen verwiesen, die sich auf die Audiocodierung unter Verwendung
einer Modulationstransformation beziehen, und bei denen das Signal durch eine Transformation
in Frequenzbänder zerlegt wird, anschließend eine Zerlegung nach Betrag und Phase
vorgenommen wird, und dann, während die Phase nicht weiterverarbeitet wird, die Beträge
je Teilband über eine Anzahl von Transformationsblöcken in einer zweiten Transformation
erneut transformiert werden. Ergebnis ist eine Frequenzzerlegung der zeitlichen Hüllkurve
des betreffenden Teilbandes in "Modulationskoeffizienten". Diese weiterführenden Druckschriften
umfassen den Artikel
M. Vinton and L. Atlas, "A Scalable and Progressive Audio Codec," in Proceedings of
the 2001 IEEE ICASSP, May 7-11, 2001, Salt Lake City, die
US 2002/0176353A1 von Atlas et al mit dem Titel "Scalable And Perceptually Ranked Signal Coding And Decoding",
den Artikel J. Thompson and L. Atlas, "A Non-uniform Modulation Transform for Audio
Coding with Increased Time Resolution," in Proceedings of the 2003 IEEE ICASSP, April
6-10, Hong Kong, 2003, und den
Artikel L. Atlas, "Joint Acoustic And Modulation Frequency", Journal on Applied Signal
Processing 7 EURASIP, S. 668-675, 2003.
[0070] Die vorhergehenden Ausführungsbeispiele stellen lediglich exemplarische Möglichkeiten
dar, um Audioaufnahmen mit unhörbaren und gegen Manipulation robusten Zusatzinformationen
versehen zu können, und dabei die Wasserzeicheneinbringung im sogenannten Teilbandmodulationsspektralbereich
vorzunehmen sowie die Detektierung im Teilbandmödulationsspektralbereich vorzunehmen.
Jedoch können verschiedene Variationen an diesen Ausführungsbeispielen vorgenommen
werden. Die im Vorhergehenden erwähnten Fensterungseinrichtungen könnten lediglich
der Blockbildung dienen, d.h. die Multiplikation bzw. Gewichtung mit den Fensterfunktionen
könnte auch entfallen. Ferner könnte man auch andere Fensterfunktionen als die im
Vorhergehenden erwähnten Beträge von trigonometrischen Funktionen verwenden. Auch
die 50%-Blocküberlappung könnte entfallen oder anders ausgeführt sein. Dementsprechend
könnte auch die Blocküberlappung auf Seiten der Sythese andere Operationen als eine
reine Addition zusammengehörender Audiowerte in aufeinander folgenden Zeitblöcken
umfassen. Auch die Fensterungen bei der zweiten Transformationsstufe könnten auf entsprechende
Weise variiert werden.
[0071] Es wird ferner darauf hingewiesen, dass die Audiosignaleinbringung nicht unbedingt
vom Zeitbereich in die Frequenz/Modulationsfrequenzbereichsdarstellung und von dort
wieder - nach der Modifikation - in die Zeitbereichsdarstellung zurückführen muss.
Es wäre ferner möglich, dass die beiden vorhergehenden Ausführungsbeispiele dahin
gehend modifiziert werden, dass die Werte, wie sie von der Rekombinationseinrichtung
38 bzw. dem Mischer 218 ausgegeben werden, zu einem wasserzeichenbehafteten Audiosignal
in einem Bitstrom vereinigt werden, um in einem Zeit/Frequenzbereich vorzuliegen.
[0072] Ferner könnte die im zweiten Ausführungsbeispiel verwendete Demodulation auch anders
ausgeführt sein, z.B. durch Veränderung der Phasenverläufe der Spektralwertblöcke
innerhalb der Matrizen 68 durch andere Maßnahmen als durch reine Multiplikation mit
einem festen komplexen Träger.
[0073] In Bezug auf die vorhergehenden Ausführungsbeispiele für mögliche Decodierer, die
bezugnehmend auf Figuren 3 und 5 erläutert worden sind, wird darauf hingewiesen, dass
aufgrund der Übereinstimmung der zwischen der Wasserzeichen-Decodierungseinrichtung
und dem Eingang angeordneten Blöcke mit den entsprechenden aus dem zugehörigen Einbetter
alle Variationsmöglichkeiten, die im Hinblick auf den Einbetter in Bezug auf diese
Einrichtungen beschrieben wurden, auf dieselbe Weise auf die Wasserzeichen-Decodierer
von Fig. 3 und 5 zutreffen.
[0074] Es wird noch darauf hingewiesen, dass sich vorhergehenden Ausführungsbeispiele zwar
ausschließlich auf die Wasserzeicheneinbettung in Hinblick auf Audiosignale bezog,
dass das vorliegende Wasserzeicheneinbettungsschema aber auch auf andere Informationssignale
anwendbar ist, wie z.B. auf Steuersignale, Messsignale, Videosignale oder dergleichen,
um dieselben beispielsweise auf ihre Authentizität zu überprüfen. In all diesen Fällen
ist es durch das vorliegend vorgeschlagene Schema möglich, die Einbettung von Informationen
derart vorzunehmen, dass sie die üblichen Nutzung des Informationssignals in der wasserzeichenbehafteten
Form nicht beeinträchtigt, wie z.B. die Analyse des Messergebnisse oder den optischen
Eindruck des Videos oder dergleichen, weshalb auch in diesen Fällen die einzubettenden
Zusatzdaten als Wasserzeichen bezeichnet werden.
[0075] Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße
Schema auch in Software implementiert sein kann. Die Implementation kann auf einem
digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch
auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem
zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein
besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren
Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens,
wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt
kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung
des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.
1. Vorrichtung zum Einbringen eines Wasserzeichens in ein Informationssignal, mit
einer Einrichtung (18, 20, 26, 28; 18, 20, 212, 214, 28) zum Überführen des Informationssignals
von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30);
einer Einrichtung (32; 216) zum Modifizieren des Informationssignals in der Spektral/Modulationsspektraldarstellung
abhängig von dem einzubringenden Wasserzeichen, um eine modifizierte Spektral/Modulationsspektraldarstellung
zu erhalten; und
einer Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden eines wasserzeichenbehafteten
Informationssignals basierend auf der modifizierten Spektral/Modulationsspektraldarstellung.
2. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung zum Überführen in die Spektral/Modulationsspektraldarstellung
folgende Merkmale aufweist:
eine Einrichtung (18, 20) zum Überführen des Informationssignals in eine Zeit/Spektraldarstellung
durch blockweises Transformieren des Informationssignals; und
eine Einrichtung (26, 28; 212, 214, 28) zum Überführen des Informationssignals von
der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung.
3. Vorrichtung gemäß Anspruch 2, bei der die Einrichtung (18, 20) zum Überführen des
Informationssignals in eine Zeit/Spektraldarstellung ausgebildet ist, um die Zeit/Spektraldarstellung
in eine Mehrzahl von Spektralkomponenten zu zerlegen, um pro Spektralkomponente eine
Folge von Spektralwerten zu erhalten, und die Einrichtung (26, 28; 212, 214, 28) zum
Überführen des Informationssignals von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung
eine Einrichtung (26, 28; 212, 214, 28) zum, für eine vorbestimmte Spektralkomponente,
blockweisen spektralen Zerlegen der Folge von Spektralwerten aufweist, um einen Teil
der Spektral/Modulationsspektraldarstellung zu erhalten.
4. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (212, 214, 28) zum, für eine
vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten
ausgebildet ist, um die Folge von Spektralwerten blockweise zunächst mit einem komplexen
Träger zu multiplizieren (212), derart, dass sich ein Betrag einer mittleren Steigung
eines Phasenverlaufs der Folge von Spektralwerten verringert, um demodulierte Blöcke
von Spektralwerten zu erhalten, und die demodulierten Blöcke von Spektralwerten dann
blockweise spektral zu zerlegen (28), um den Teil der modifizierten Spektral/Modulationsspektraldarstellung
zu erhalten.
5. Vorrichtung gemäß Anspruch 4, bei der die Einrichtung (212, 214, 28) zum, für eine
vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten
eine Einrichtung (214) zum, abhängig von der Zeit/Spektraldarstellung des Informationssignals,
blockweise Variieren des komplexen Trägers aufweist, mit dem die Folge von Spektralwerten
multipliziert wird.
6. Vorrichtung gemäß Anspruch 5, bei der die Einrichtung (214) zum Variieren ausgebildet
ist, um zum blockweisen Variieren des komplexen Trägers blockweise Phasen der Spektralwerte
in der Folge von Spektralwerten zu unwrappen, um einen Phasenverlauf zu erhalten,
eine mittlere Steigung des Phasenverlaufs zu bestimmen und basierend auf der mittleren
Steigung den komplexen Träger zu bestimmen.
7. Vorrichtung gemäß Anspruch 6, bei der die Einrichtung (214) zum Variieren ferner ausgebildet
ist, um aus dem Phasenverlauf einen Achsenabschnitt des Phasenverlaufs zu bestimmen
und den komplexen Träger ferner basierend auf dem Achsenabschnitt zu bestimmen.
8. Vorrichtung gemäß einem der Ansprüche 4 bis 7, bei der die Einrichtung (34, 218, 40,
42) zum Bilden des wasserzeichenbehafteten Informationssignals folgende Einrichtungen
aufweist:
eine Einrichtung (34) zum Rücküberführen des Informationssignals von der modifizierten
Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung,
um modifizierte demodulierte Blöcke von Spektralwerten für die vorbestimmte Spektralkomponente
zu erhalten; und
eine Einrichtung (218) zum blockweisen Multiplizieren der modifizierten demodulierten
Blöcke von Spektralwerten mit einem zu dem komplexen Träger komplex konjugierten Träger,
um modifizierte Blöcke von Spektralwerten zu erhalten; und
eine Einrichtung zum Zusammenfügen der modifizierten demodulierte Blöcke von Spektralwerten
zu einer modifizierten Folge von Spektralwerten, um einen Teil einer Zeit/Spektraldarstellung
des wasserzeichenbehafteten Informationssignals zu erhalten.
9. Vorrichtung gemäß Anspruch 8, bei der die Einrichtung zum Bilden ferner folgendes
Merkmal aufweist:
eine Einrichtung zum Rücküberführen des wasserzeichenbehafteten Informationssignals
von der Zeit-/Spektraldarstellung in die Zeitdarstellung.
10. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (26, 28) zum, für eine vorbestimmte
Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten ausgebildet
ist, um die Folge von Spektralwerten zunächst einer Betragsbildung (26) zu unterziehen,
um eine Folge von Beträgen von Spektralwerten zu erhalten, und die Folge von Beträgen
von Spektralwerten dann blockweise in die Modulationsspektraldarstellung zu transformieren
(28), um den Teil der Spektral/Modulationsspektraldarstellung zu erhalten.
11. Vorrichtung gemäß Anspruch 10, bei der die Einrichtung (34, 218, 40, 42) zum Bilden
des wasserzeichenbehafteten Informationssignals folgende Einrichtungen aufweist:
eine Einrichtung (34) zum Rücküberführen des Informationssignals von der modifizierten
Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung,
um eine modifizierte Folge von Spektralwerten für die vorbestimmte Spektralkomponente
zu erhalten; und
eine Einrichtung (38) zum Rekombinieren der modifizierten Folge von Spektralwerten
mit auf Phasen der Folge von Spektralwerten basierenden Phasen, um einen Teil einer
Zeit/Spektraldarstellung des wasserzeichenbehafteten Informationssignals zu erhalten.
12. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung (18, 20) zum Überführen des
Informationssignals von der Zeitdarstellung in die Spektral/Modulationsspektraldarstellung
folgende Merkmale aufweist:
eine Blockbildungseinrichtung (18) zur Bildung einer Folge von Blöcken von Informationswerten
aus dem Informationssignal; und
eine Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten,
um eine Folge von Spektralwertblöcken zu erhalten, wobei jeder Spektralwertblock einen
Spektralwert für jede einer vorbestimmten Mehrzahl von Spektralkomponenten aufweist,
so dass die Folge von Spektralwertblöcken pro Spektralkomponente eine Folge von Spektralwerten
bildet; und
eine Einrichtung (26, 28; 212, 214, 28) zum spektralen Zerlegen einer vorbestimmten
Folge der Folgen, um einen Block von Modulationswerten zu erhalten,
wobei die Einrichtung (32, 216) zum Modifizieren ausgebildet ist, um den Block von
Modulationswerten abhängig von dem einzubringenden Wasserzeichen zu modifizieren,
um einen modifizierten Block von Modulationswerten zu erhalten, und die Einrichtung
(34, 38, 40, 42; 34, 218, 40, 42) zum Bilden ausgebildet ist, um das wasserzeichenbehaftete
Informationssignal basierend auf dem modifizierten Block von Modulationswerten zu
bilden.
13. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (34, 38, 40, 42; 34, 218, 40,
42) zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von
der spektralen Zerlegung rückzuüberführen (34, 38; 34, 218), um eine modifizierte
Folge von Spektralwerten zu erhalten, und eine Folge von modifizierten Spektralblöcken,
die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (40),
um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die
modifizierten Blöcke von Informationswerten zusammenzufügen (42), um das wasserzeichenbehaftete
Informationssignal zu erhalten.
14. Vorrichtung gemäß einem der Ansprüche 12 bis 13, bei der die Blockbildungseinrichtung
(18) ausgebildet ist, um die Blöcke von Informationswerten derart aus dem Informationssignal
zu extrahieren, dass die Blöcke von Informationswerten sich gegenseitig um die Hälfte
überlappenden aufeinanderfolgenden Zeitabschnitten des Informationssignals zugeordnet
sind, und die Einrichtung (42) zum Bilden ausgebildet ist, um beim Zusammenfügen die
modifizierten Zeitblöcke gegenseitig um die Hälfte zu überlappen und zueinander ausgerichtete
Informationswerte benachbarter Informationsblöcke zu kombinieren.
15. Vorrichtung gemäß einem der Ansprüche 12 bis 14, bei der die Einrichtung (20) zum
spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten derart ausgebildet
ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen
Spektralwerten liefert, und die Einrichtung (26, 28) zum spektralen Zerlegen der vorbestimmten
Folge der Folgen von Spektralwerten ausgebildet ist, um lediglich die Beträge der
komplexen Spektralwerte spektral zu zerlegen (28), um den Block von Modulationswerten
zu erhalten.
16. Vorrichtung gemäß Anspruch 15, bei der die Einrichtung zum Bilden ausgebildet ist,
um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen
(34), um eine modifizierte Folge von Spektralwerten zu erhalten, Phasen der Folge
von komplexen Spektralwerten abhängig von der Modifikation durch die Einrichtung zum
Modifizieren anzupassen (36), um eine Folge von angepassten Phasenwerten zu erhalten,
die Folge von angepassten Phasenwerten mit der modifizierten Folge von Spektralwerten
zu rekombinieren (38), um eine rekombinierte modifizierte Folge von Spektralwerten
zu erhalten, und eine Folge von modifizierten Spektralwertblöcken rückzuüberführen
(40), die auf der rekombinierten modifizierten Folge von Spektralwerten basiert, um
die modifizierten Blöcke von Informationswerten zu erhalten.
17. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (20) zum spektralen Zerlegen
jedes der Folge von Blöcken von Informationswerten derart ausgebildet ist, dass sie
bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen Spektralwerten
liefert, und die Einrichtung (212, 214, 28) zum Überführen der vorbestimmten der Folgen
von Spektralwerten in die Spektral/Modulationsspektraldarstellung ausgebildet ist,
um zunächst die Folge von Spektralwerten derart zu manipulieren (212), dass eine Phase
der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge
stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert
wird, um eine phasenmanipulierte Folge von Spektralwerten zu erhalten, und dann die
phasenmanipulierte Folge von Spektralwerten spektral zu zerlegen (28), um den zumindest
einen Block von Modulationswerten zu erhalten, und die Einrichtung zum Bilden (34,
218, 40, 42) ausgebildet ist, um den modifizierten Block von Modulationswerten von
der spektralen Zerlegung rückzuüberführen, um eine modifizierte Folge von Spektralwerten
zu erhalten, die modifizierte Folge von Spektralwerten umgekehrt zu der Einrichtung
(212) zum spektralen Zerlegen der vorbestimmten der Folgen von Spektralwerten derart
zu manipulieren (218), dass eine Phase der Spektralwerte der zumindest einen Folge
von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden
Betrag vergrößert oder verkleinert wird, um eine manipulierte Folge von Spektralwerten
zu erhalten, eine Folge von modifizierten Spektralblöcken, die auf der modifizierten
Folge von Spektralwerten basiert, rückzuüberführen (40), um eine Folge von modifizierten
Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten
zusammenzufügen (42), um das wasserzeichenbehaftete Informationssignal zu erhalten.
18. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32;
216) zum Modifizieren angepasst ist, um die Modifikation an Stellen der Spektral/Modulationsspektraldarstellung
vorzunehmen, die zeitlich variieren.
19. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32;
216) zum Modifizieren angepasst ist, um die Modifikation abhängig von dem Informationssignal
vorzunehmen.
20. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32;
216) zum Modifizieren angepasst ist, um die Modifikation derart vorzunehmen, dass
aufgrund von psychoakustischen Verdeckungseffekten die Modifikation nicht zu einer
hörbaren Veränderung des wasserzeichenbehafteten Informationssignals führt.
21. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der das Wasserzeichen eine
Urheberinformation, eine das Informationssignal kennzeichnende Kennnummer oder eine
Kundennummer anzeigt.
22. Vorrichtung zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten
Informationssignal, mit einer Einrichtung (118, 120, 126, 128; 318, 320, 414, 412,
328) zum Überführen des wasserzeichenbehafteten Informationssignals von einer Zeitdarstellung
in eine Spektral/Modulationsspektraldarstellung;
einer Einrichtung (132; 332) zum Herleiten des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarstellung.
23. Verfahren zum Einbringen eines Wasserzeichens in ein Informationssignal, mit
Überführen (18, 20, 26, 28; 18, 20, 212, 214, 28) des Informationssignals von einer
Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30);
Modifizieren (32; 216) des Informationssignals in der Spektral/Modulationsspektraldarstellung
abhängig von dem einzubringenden Wasserzeichen, um eine modifizierte Spektral/Modulationsspektraldarstellung
zu erhalten; und
Bilden (34, 38, 40, 42; 34, 218, 40, 42) eines wasserzeichenbehafteten Informationssignals
basierend auf der modifizierten Spektral/Modulationsspektraldarstellung.
24. Verfahren zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal,
mit
Überführen (118, 120, 126, 128; 318, 320, 414, 412, 328) des wasserzeichenbehafteten
Informationssignals von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung;
Herleiten (132; 332) des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarstellung.
25. Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch
23 oder 24, wenn das Computer-Programm auf einem Computer abläuft.
1. A device for introducing a watermark into an information signal, comprising:
means (18, 20, 26, 28; 18, 20, 212, 214, 28) for transferring the information signal
from a time representation (22) to a spectral/modulation spectral representation (30);
means (32; 216) for modifying the information signal in the spectral/modulation spectral
representation in dependence on the watermark to be introduced to obtain a modified
spectral/modulation spectral representation; and
means (34, 38, 40, 42; 34, 218, 40, 42) for forming an information signal provided
with a watermark based on the modified spectral/modulation spectral representation.
2. The device according to claim 1, wherein the means for transferring to the spectral/modulation
spectral representation comprises:
means (18, 20) for transferring the information signal to a time/spectral representation
by transforming the information signal block by block; and
means (26, 28; 212, 214, 28) for transferring the information signal from the time/spectral
representation to the spectral/modulation spectral representation.
3. The device according to claim 2, wherein the means (18, 20) for transferring the information
signal to a time/spectral representation is formed to divide the time/spectral representation
to a plurality of spectral components to obtain a sequence of spectral values per
spectral component, and the means (26, 28; 212, 214, 28) for transferring the information
signal from the time/spectral representation to the spectral/modulation spectral representation
comprises means (26, 28; 212, 214, 28) for, for a predetermined spectral component,
spectrally dividing the sequence of spectral values block by block to obtain a part
of the spectral/modulation spectral representation.
4. The device according to claim 3, wherein the means (212, 214, 28) for, for a predetermined
spectral component, spectrally dividing the sequence of spectral values block by block
is formed to at first multiply (212) the sequence of spectral values block by block
by a complex carrier such that a magnitude of a mean slope of a phase form of the
sequence of spectral values decreases to obtain demodulated blocks of spectral values,
and to then spectrally divide (28) the demodulated blocks of spectral values block
by block to obtain the part of the modified spectral/modulation spectral representation.
5. The device according to claim 4, wherein the means (212, 214, 28) for, for a predetermined
spectral component, spectrally dividing the sequence of spectral values block by block
comprises means (214) for, depending on the time/spectral representation of the information
signal, varying block by block the complex carrier by which the sequence of spectral
values is multiplied.
6. The device according to claim 5, wherein the means (214) for varying is formed to
unwrap phases of the spectral values in the sequence of spectral values block by block
for varying the complex carrier block by block to obtain a phase form, to determine
a mean slope of the phase form and to determine the complex carrier based on the mean
slope.
7. The device according to claim 6, wherein the means (214) for varying is further formed
to determine an axis portion of the phase form from the phase form and to determine
the complex carrier additionally based on the axis portion.
8. The device according to one of claims 4 to 7, wherein the means (34, 218, 40, 42)
for forming the information signal provided with a watermark comprises:
means (34) for retransferring the information signal from the modified spectral/modulation
spectral representation to a modified time/spectral representation to obtain modified
demodulated blocks of spectral values for the predetermined spectral component; and
means (218) for multiplying the modified demodulated blocks of spectral values block
by block by a carrier being a complex conjugate to the complex carrier to obtain modified
blocks of spectral values; and
means for uniting the modified demodulated blocks of spectral values to form a modified
sequence of spectral values to obtain a part of a time/spectral representation of
the information signal provided with a watermark.
9. The device according to claim 8, wherein the means for forming further comprises:
means for retransferring the information signal provided with a watermark from the
time/spectral representation to the time representation.
10. The device according to claim 3, wherein the means (26, 28) for, for a predetermined
spectral component, spectrally dividing the sequence of spectral values block by block
is formed to at first subject the sequence of spectral values to a magnitude calculation
(26) to obtain a sequence of magnitudes of spectral values, and to then transform
the sequence of magnitudes of spectral values block by block to the modulation spectral
representation (28) to obtain the part of the spectral/modulation spectral representation.
11. The device according to claim 10, wherein the means (34, 218, 40, 42) for forming
the information signal provided with a watermark comprises:
means (34) for retransferring the information signal from the modified spectral/modulation
spectral representation to a modified time/spectral representation to obtain a modified
sequence of spectral values for the predetermined spectral component; and
means (38) for recombining the modified sequence of spectral values with phases which
are based on phases of the sequence of spectral values to obtain a part of a time/spectral
representation of the information signal provided with a watermark.
12. The device according to claim 1, wherein the means (18, 20) for transferring the information
signal from the time representation to the spectral/modulation spectral representation
comprises:
block forming means (18) for forming a sequence of blocks of information values from
the information signal; and
means (20) for spectrally dividing each of the sequence of blocks of information values
to obtain a sequence of spectral value blocks, each spectral value block comprising
a spectral value for each of a predetermined plurality of spectral components so that
the sequence of spectral value blocks forms a sequence of spectral values per spectral
component; and
means (26, 28; 212, 214, 28) for spectrally dividing a predetermined sequence of the
sequences to obtain a block of modulation values,
wherein the means (32, 216) for modifying is formed to modify the block of modulation
values in dependence on the watermark to be introduced to obtain a modified block
of modulation values, and the means (34, 38, 40, 42; 34, 218, 40, 42) for forming
is formed to form the information signal provided with a watermark based on the modified
block of modulation values.
13. The device according to claim 12, wherein the means (34, 38, 40, 42; 34, 218, 40,
42) for forming is formed to retransfer the modified block of modulation values from
the spectral division (34, 38; 34, 218) to obtain a modified sequence of spectral
values, and to retransfer (40) a sequence of modified spectral blocks which is based
on the modified sequence of spectral values to obtain a sequence of modified blocks
of information values, and to unite (42) the modified blocks of information values
to obtain the information signal provided with a watermark.
14. The device according to claims 12 or 13, wherein the block forming means (18) is formed
to extract the blocks of information values from the information signal such that
the blocks of information values are associated to successive time sections of the
information signal overlapping one another by one half, and the means (42) for forming
is formed to, when uniting, overlap the modified time blocks to one another by one
half and combine aligned information values of neighboring information blocks.
15. The device according to one of claims 12 to 14, wherein the means (20) for spectrally
dividing each of the sequence of blocks of information values is formed such that
it provides a sequence of complex spectral values per spectral component when spectrally
dividing, and the means (26, 28) for spectrally dividing the predetermined sequence
of the sequences of spectral values is formed to only spectrally divide (28) the magnitudes
of the complex spectral values to obtain the block of modulation values.
16. The device according to claim 15, wherein the means for forming is formed to retransfer
(34) the modified block of modulation values from the spectral division to obtain
a modified sequence of spectral values, to adjust (36) phases of the sequence of complex
spectral values in dependence on the modification by the means for modifying to obtain
a sequence of adjusted phase values, to recombine (38) the sequence of adjusted phase
values with the modified sequence of spectral values to obtain a recombined modified
sequence of spectral values, and to retransfer (40) a sequence of modified spectral
value blocks which is based on the recombined modified sequence of spectral values
to obtain the modified blocks of information values.
17. The device according to claim 12, wherein the means (20) for spectrally dividing each
of the sequence of blocks of information values is formed such that it provides a
sequence of complex spectral values per spectral component when spectrally dividing,
and the means (212, 214, 28) for transferring the predetermined ones of the sequences
of spectral values to the spectral/modulation spectral representation is formed to
at first manipulate (212) the sequence of spectral values such that a phase of the
spectral values of the at least one sequence of spectral values is increased or decreased
by a magnitude continually increasing with the sequence or decreasing to obtain a
phase-manipulated sequence of spectral values, and to then spectrally divide (28)
the phase-manipulated sequence of spectral values to obtain the at least one block
of modulation values, and the means for forming (34, 218, 40, 42) is formed to retransfer
the modified block of modulation values from the spectral division to obtain a modified
sequence of spectral values, to manipulate (218) the modified sequence of spectral
values conversely to the means (212) for spectrally dividing the predetermined ones
of the sequences of spectral values such that a phase of the spectral values of the
at least one sequence of spectral values is increased or decreased by a magnitude
continuously increasing with the sequence or decreasing to obtain a manipulated sequence
of spectral values, to retransfer (40) a sequence of modified spectral blocks which
is based on the modified sequence of spectral values to obtain a sequence of modified
blocks of information values, and to unite (42) the modified blocks of information
values to obtain the information signal provided with a watermark.
18. The device according to one of the preceding claims, wherein the means (32; 216) for
modifying is adjusted to perform the modification at locations of the spectral/modulation
spectral representation varying in time.
19. The device according to one of the preceding claims, wherein the means (32; 216) for
modifying is adjusted to perform modification in dependence on the information signal.
20. The device according to one of the preceding claims, wherein the means (32; 216) for
modifying is adjusted to perform the modification, such that, due to psychoacoustic
masking effects, the modification does not result in an audible alteration of the
information signal provided with a watermark.
21. The device according to one of the preceding claims, wherein the watermark indicates
author information, an identification number characterizing the information signal
or a customer number.
22. A device for extracting a watermark from an information signal provided with a watermark,
comprising:
means (118, 120, 126, 128; 318, 320, 414, 412, 328) for transferring the information
signal provided with a watermark from a time representation to a spectral/modulation
spectral representation;
means (132; 332) for deriving the watermark based on the spectral/modulation spectral
representation.
23. A method for introducing a watermark into an information signal, comprising:
transferring (18, 20, 26, 28; 18, 20, 212, 214, 28) the information signal from a
time representation (22) to a spectral/modulation spectral representation (30);
modifying (32; 216) the information signal in the spectral/modulation spectral representation
in dependence on the watermark to be introduced to obtain a modified spectral/modulation
spectral representation; and
forming (34, 38, 40, 42; 34, 218, 40, 42) an information signal provided with a watermark
based on the modified spectral/modulation spectral representation.
24. A method for extracting a watermark from an information signal provided with a watermark,
comprising:
transferring (118, 120, 126, 128; 318, 320, 414, 412, 328) the information signal
provided with a watermark from a time representation to a spectral/modulation spectral
representation;
deriving (132; 332) the watermark based on the spectral/modulation spectral representation.
25. A computer program having a program code for performing the method according to claims
23 or 24 when the computer program runs on a computer.
1. Dispositif pour incorporer un filigrane dans un signal d'information, avec
un moyen (18, 20, 26, 28; 18, 20, 212, 214, 28) pour transposer le signal d'information
d'une représentation temporelle (22) dans une représentation spectrale/spectrale à
modulation (30);
un moyen (32; 216) destiné à modifier le signal d'information dans la représentation
spectrale/spectrale à modulation en fonction du filigrane à incorporer, pour obtenir
une représentation spectrale/ spectrale à modulation modifiée; et
un moyen (34, 38, 40, 42; 34, 218, 40, 42) destiné à former un signal d'information
contenant un filigrane sur base de la représentation spectrale/spectrale à modulation.
2. Dispositif selon la revendication 1, dans lequel le moyen destiné à transposer dans
la représentation spectrale/spectrale à modulation présente les caractéristiques suivantes:
un moyen (18, 20) destiné à transposer le signal d'information dans une représentation
temporelle/spectrale par transformation par bloc du signal d'information; et
un moyen (26, 28; 212, 214, 28) destiné à transposer le signal d'information de la
représentation temporelle/spectrale dans la représentation spectrale/spectrale à modulation.
3. Dispositif selon la revendication 2, dans lequel le moyen (18, 20) destiné à transposer
le signal d'information dans une représentation temporelle/spectrale est réalisé pour
décomposer la représentation temporelle/spectrale en une pluralité de composantes
spectrales, pour obtenir, par composante spectrale, une succession de valeurs spectrales,
et le moyen (26, 28; 212, 214, 28) destiné à transposer le signal d'information de
la représentation temporelle/ spectrale dans la représentation spectrale/spectrale
à modulation présente un moyen (26, 28; 212, 214, 28) destiné à décomposer de manière
spectrale par bloc, pour une composante spectrale déterminée, la succession de valeurs
spectrales, pour obtenir une partie de la représentation spectrale/spectrale à modulation.
4. Dispositif selon la revendication 3, dans lequel le moyen (212, 214, 28) destiné à
décomposer de manière spectrale par bloc, pour une composante spectrale prédéterminée,
la succession de valeurs spectrales est réalisé pour tout d'abord multiplier par bloc
(212) la succession de valeurs spectrales par un support complexe, de sorte qu'une
quantité d'une montée moyenne d'une évolution de phase de la succession de valeurs
spectrales diminue, pour obtenir des blocs démodulés de valeurs spectrales, et ensuite
décomposer de manière spectrale par bloc (28) les blocs démodulés de valeurs spectrales,
pour obtenir la partie de la représentation spectrale/spectrale à modulation modifiée.
5. Dispositif selon la revendication 4, dans lequel le moyen (212, 214, 28) destiné à
décomposer de manière spectrale par bloc, pour une composante spectrale prédéterminée,
la succession de valeurs spectrales présente un moyen (214) pour faire varier par
bloc, en fonction de la représentation temporelle/spectrale du signal d'information,
le support complexe par lequel est multipliée la succession de valeurs spectrales.
6. Dispositif selon la revendication 5, dans lequel le moyen (214) destiné à faire varier
est réalisé pour dévoiler, pour faire varier par bloc le support complexe, les phases
des valeurs spectrales dans la succession de valeurs spectrales, pour obtenir une
évolution de phases, pour déterminer une montée moyenne de l'évolution de phases et
pour déterminer, sur base de la montée moyenne, le support complexe.
7. Dispositif selon la revendication 6, dans lequel le moyen (214) pour faire varier
est par ailleurs réalisé pour déterminer, à partir de l'évolution de phases, un segment
d'axe de l'évolution de phases et pour déterminer le support complexe par ailleurs
sur base du segment d'axe.
8. Dispositif selon l'une des revendications 4 à 7, dans lequel le moyen (34, 218, 40,
42) destiné à former le signal d'information contenant un filigrane présente les moyens
suivants:
un moyen (34) destiné à retransposer le signal d'information de la représentation
spectrale/spectrale à modulation modifiée dans une représentation temporelle/spectrale
modifiée, pour obtenir des blocs démodulés de valeurs spectrales pour la composante
spectrale prédéterminée; et
un moyen (218) destiné à multiplier par bloc les blocs démodulés modifiés de valeurs
spectrales par un support conjugué complexe par rapport au support complexe, pour
obtenir des blocs modifiés de valeurs spectrales; et
un moyen destiné à regrouper les blocs démodulés modifiés de valeurs spectrales en
une succession modifiée de valeurs spectrales, pour obtenir une partie d'une représentation
temporelle/spectrale du signal d'information contenant un filigrane.
9. Dispositif selon la revendication 8, dans lequel le moyen destiné à former présente
par ailleurs la caractéristique suivante:
un moyen pour retransposer le signal d'information contenant un filigrane de la représentation
temporelle/spectrale dans la représentation temporelle.
10. Dispositif selon la revendication 3, dans lequel le moyen (26, 28) destiné à décomposer
de manière spectrale par bloc, pour une composante spectrale prédéterminée, la succession
de valeurs spectrales est réalisé pour tout d'abord soumettre la succession de valeurs
spectrales à une formation de quantités (26), pour obtenir une succession de quantités
de valeurs spectrales, et pour transformer (28) ensuite la succession de quantités
de valeurs spectrales par bloc dans la représentation spectrale à modulation, pour
obtenir la partie de la représentation spectrale/spectrale à modulation.
11. Dispositif selon la revendication 10, dans lequel le moyen (34, 218, 40, 42) destiné
à former le signal d'information contenant un filigrane présente les moyens suivants:
un moyen (34) destiné à retransposer le signal d'information de la représentation
spectrale/spectrale à modulation modifiée en une représentation temporelle/spectrale
modifiée, pour obtenir une succession modifiée de valeurs spectrales pour la composante
spectrale prédéterminée; et
un moyen (38) destiné à recombiner la succession modifiée de valeurs spectrales avec
des phases basées sur des phases de la succession de valeurs spectrales, pour obtenir
une partie d'une représentation temporelle/spectrale du signal d'information contenant
un filigrane.
12. Dispositif selon la revendication 1, dans lequel le moyen (18, 20) destiné à transposer
le signal d'information de la représentation temporelle dans la représentation spectrale/spectrale
à modulation présente les caractéristiques suivantes:
un moyen de formation de blocs (18) destiné à former une succession de blocs de valeurs
d'information à partir du signal d'information; et
un moyen (20) destiné à décomposer de manière spectrale chaque succession de blocs
de valeurs d'information, pour obtenir une succession de blocs de valeurs spectrales,
chaque bloc de valeurs spectrales présentant une valeur spectrale pour chaque pluralité
prédéterminée de composantes spectrales, de sorte que la succession de blocs de valeurs
spectrales forme, par composante spectrale, une succession de valeurs spectrales;
et
un moyen (26, 28; 212, 214, 28) destiné à décomposer de manière spectrale une succession
prédéterminée parmi les successions, pour obtenir un bloc de valeurs de modulation,
le moyen (32, 216) destiné à modifier étant réalisé pour modifier le bloc de valeurs
de modulation en fonction du filigrane à incorporer, pour obtenir un bloc modifié
de valeurs de modulation, et le moyen (34, 38, 40, 42; 34, 218, 40, 42) destiné à
former étant réalisé pour former le signal d'information contenant un filigrane sur
base du bloc modifié de valeurs de modulation.
13. Dispositif selon la revendication 12, dans lequel le moyen (34, 38, 40, 42; 34, 218,
40, 42) destiné à former est réalisé pour transformer inversement le bloc modifié
de valeurs de modulation de la décomposition spectrale (34, 38; 34, 218), pour obtenir
une succession modifiée de valeurs spectrales, et pour transposer inversement une
succession de blocs spectraux modifiés qui se base sur la succession de valeurs spectrales
modifiées (40), pour obtenir une succession de blocs modifiés de valeurs d'information,
et pour regrouper (42) les blocs modifiés de valeurs d'information pour obtenir le
signal d'information contenant un filigrane.
14. Dispositif selon l'une des revendications 12 à 13, dans lequel le moyen de formation
de blocs (18) est réalisé pour extraire les blocs de valeurs d'information du signal
d'information de sorte que les blocs de valeurs d'information soient associés mutuellement
l'un à l'autre pour la moitié des segments temporels successifs se recouvrant du signal
d'information, et le moyen (42) destiné à former est réalisé pour recouvrir, lors
du regroupement, les blocs temporels modifiés réciproquement de la moitié et pour
combiner les valeurs d'information orientées l'une vers l'autre de blocs d'information
adjacents.
15. Dispositif selon l'une des revendications 12 à 14, dans lequel le moyen (20) destiné
à décomposer de manière spectrale chaque succession de blocs de valeurs d'information
est réalisé de sorte qu'il fournisse, lors de la décomposition spectrale, par composante
spectrale une succession de valeurs spectrales complexes, et le moyen (26, 28) destiné
à décomposer de manière spectrale la succession prédéterminée parmi les successions
de valeurs spectrales est réalisé pour ne décomposer (28) spectralement que les quantités
de valeurs spectrales complexes pour obtenir le bloc de valeurs de modulation.
16. Dispositif selon la revendication 15, dans lequel le moyen destiné à former est réalisé
pour retransposer (34) le bloc modifié de valeurs de modulation de la décomposition
spectrale, pour obtenir une succession modifiée de valeurs spectrales, pour adapter
les phases de la succession de valeurs spectrales complexes en fonction de la modification
par le moyen destiné à modifier (36), pour obtenir une succession de valeurs de phase
adaptées, pour recombiner (38) la succession de valeurs de phase adaptées avec la
succession modifiée de valeurs spectrales, pour obtenir une succession modifiée recombinée
de valeurs spectrales, et pour retransposer (40) une succession de blocs de valeurs
spectrales modifiés qui est basée sur la succession modifiée recombinée de valeurs
spectrales, pour obtenir les blocs modifiés de valeurs d'information.
17. Dispositif selon la revendication 12, dans lequel le moyen (20) destiné à décomposer
de manière spectrale chaque succession de blocs de valeurs d'information est réalisé
de sorte qu'il fournisse, lors de la décomposition spectrale, par composante spectrale
une succession de valeurs spectrales complexes, et le moyen (212, 214, 28) destiné
à transposer la prédéterminée parmi les successions de valeurs spectrales dans la
représentation spectrale/spectrale à modulation est réalisé pour tout d'abord manipuler
la succession de valeurs spectrales (212) de sorte qu'une phase de valeurs spectrales
de l'au moins une succession de valeurs spectrales augmente ou diminue d'une quantité
augmentant ou diminuant en continu avec la succession, pour obtenir une succession
à phases manipulées de valeurs spectrales, et pour décomposer (28) ensuite la succession
à phases manipulées de valeurs spectrales, pour obtenir l'au moins un bloc de valeurs
de modulation, et le moyen destiné à former (34, 218, 40, 42) est réalisé pour retransposer
le bloc modifié de valeurs de modulation de la décomposition spectrale, pour obtenir
une succession modifiée de valeurs spectrales, pour manipuler la succession modifiée
de valeurs spectrales inversement au moyen (212) destiné à décomposer de manière spectrale
la prédéterminée parmi les successions de valeurs spectrales (218) de sorte qu'une
phase des valeurs spectrales de l'au moins une succession de valeurs spectrales soit
augmentée ou diminuée d'une quantité augmentant au diminuant en continu avec la succession,
pour obtenir une succession manipulée de valeurs spectrales, pour retransposer (40)
une succession de blocs spectraux modifiés basée sur la succession modifiée de valeurs
spectrales, pour obtenir une succession de blocs modifiés de valeurs d'information,
et pour regrouper (42) les blocs modifiés de valeurs d'information pour obtenir le
signal d'information contenant un filigrane.
18. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216)
destiné à modifier est adapté pour procéder à la modification à des endroits de la
représentation spectrale/spectrale à modulation qui varient dans le temps.
19. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216)
destiné à modifier est adapté pour procéder à la modification en fonction du signal
d'information.
20. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216)
destiné à modifier est adapté pour procéder à la modification de sorte que sur base
d'effets de masquage psycho-acoustiques la modification n'entraîne pas de modification
audible du signal d'information contenant un filigrane.
21. Dispositif selon l'une des revendications précédentes, dans lequel le filigrane indique
une information de droit d'auteur, un numéro de série caractérisant le signal d'information
ou un numéro de client.
22. Dispositif pour extraire un filigrane d'un signal d'information contenant un filigrane,
avec
un moyen (118, 120, 126, 128; 318, 320, 414, 412, 328) destiné à transposer le signal
d'information contenant un filigrane d'une représentation temporelle dans une représentation
spectrale/spectrale à modulation;
un moyen (132; 332) destiné à dériver le filigrane sur base de la représentation spectrale/spectrale
à modulation.
23. Procédé pour incorporer un filigrane dans un signal d'information, avec
transposer (18, 20, 26, 28; 18, 20, 212, 214, 28) le signal d'information d'une représentation
temporelle (22) dans une représentation spectrale/spectrale à modulation (30);
modifier (32; 216) le signal d'information dans la représentation spectrale / spectrale
à modulation en fonction du filigrane à incorporer, pour obtenir une représentation
spectrale/spectrale à modulation modifiée; et
former (34, 38, 40, 42; 34, 218, 40, 42) un signal d'information contenant un filigrane
sur base de la représentation spectrale/ spectrale à modulation modifiée.
24. Procédé pour extraire un filigrane d'un signal d'information contenant un filigrane,
avec
transposer (118, 120, 126, 128; 318, 320, 414, 412, 328) le signal d'information contenant
un filigrane d'une représentation temporelle dans une représentation spectrale/ spectrale
à modulation;
dériver (132; 332) le filigrane sur base de la représentation spectrale/spectrale
à modulation.
25. Programme d'ordinateur avec un code de programme pour réaliser le procédé selon la
revendication 23 ou 24 lorsque le programme d'ordinateur est exécuté sur un ordinateur.