WASSERZEICHENEINBETTUNG - Patent 1741215

(19)

(11)

EP 1 741 215 B1

(12)	EUROPÄISCHE PATENTSCHRIFT

(45)	Hinweis auf die Patenterteilung:
	25.12.2013 Patentblatt 2013/52

(21)	Anmeldenummer: 05715993.1

(22)	Anmeldetag: 11.03.2005

(51)

Internationale Patentklassifikation (IPC):

H04H 20/31^(2008.01)

G10L 19/00^(2013.01)

(86)	Internationale Anmeldenummer:
	PCT/EP2005/002636

(87)	Internationale Veröffentlichungsnummer:
	WO 2005/109702 (17.11.2005 Gazette 2005/46)

(54)	WASSERZEICHENEINBETTUNG WATERMARK INCORPORATION INTEGRATION DE FILIGRANES

(84)	Benannte Vertragsstaaten:
	AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU MC NL PL PT RO SE SI SK TR

(30)

Priorität:

30.04.2004 DE 102004021404

(43)	Veröffentlichungstag der Anmeldung:
	10.01.2007 Patentblatt 2007/02

(73)	Patentinhaber: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
	80686 München (DE)

(72)	Erfinder:
	HERRE, Juergen 91054 Buckenhof (DE) KULESSA, Ralph 91161 Hilpoltstein (DE) DISCH, Sascha 90763 Fuerth (DE) LINZMEIER, Karsten 91058 Erlangen (DE) NEUBAUER, Christian 90408 Nuernberg (DE) SIEBENHAAR, Frank 90401 Nuernberg (DE)

(74)	Vertreter: Schenk, Markus et al
	Schoppe, Zimmermann, Stöckeler & Zinkler Patentanwälte Postfach 246 82043 Pullach bei München 82043 Pullach bei München (DE)

(56)

Entgegenhaltungen: :

US-A1- 2002 176 353

THOMPSON J K ET AL: "A non-uniform modulation transform for audio coding with increased time resolution" 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. PROCEEDINGS. (ICASSP). HONG KONG, APRIL 6 - 10, 2003, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), NEW YORK, NY : IEEE, US, Bd. VOL. 1 OF 6, 6. April 2003 (2003-04-06), Seiten V397-V400, XP010639292 ISBN: 0-7803-7663-3 in der Anmeldung erwähnt

Anmerkung: Innerhalb von neun Monaten nach der Bekanntmachung des Hinweises auf die Erteilung des europäischen Patents kann jedermann beim Europäischen Patentamt gegen das erteilte europäischen Patent Einspruch einlegen. Der Einspruch ist schriftlich einzureichen und zu begründen. Er gilt erst als eingelegt, wenn die Einspruchsgebühr entrichtet worden ist. (Art. 99(1) Europäisches Patentübereinkommen).

Beschreibung

[0001] Die vorliegende Erfindung bezieht sich auf ein Schema zur Einbringung eines Wasserzeichens in ein Informationssignal, wie z.B. ein Audiosignal.

[0002] Mit zunehmender Verbreitung des Internets hat auch die Musikpiraterie drastisch zugenommen. An vielen Stellen im Internet werden Musikstücke bzw. allgemeine Audiosignale angeboten, um dort heruntergeladen werden zu können. In den allerwenigsten Fällen werden hierbei Urheberrechte beachtet. Insbesondere wird sehr selten die Erlaubnis des Urhebers eingeholt, sein Werk zur Verfügung zu stellen. Noch seltener werden Gebühren an den Urheber bezahlt, die der Preis für ein rechtmäßiges Kopieren sind. Darüber hinaus findet ein unkontrolliertes Kopieren von Werken statt, was in den allermeisten Fällen ebenfalls ohne Berücksichtigung von Urheberrechten geschieht.

[0003] Wenn Musikstücke über das Internet von einem Provider bzw. Anbieter für Musikstücke rechtmäßig erworben werden, erzeugt der Provider üblicherweise einen Header bzw. einen dem Musikstück beigefügten Datenblock, in dem Copyright-Informationen sowie beispielsweise eine Kundennummer eingebracht sind, wobei die Kundennummer eindeutig auf den aktuell vorliegenden Käufer hinweist. Es ist ferner bekannt, Kopiererlaubnisinformationen in diesen Header einzufügen, welche die verschiedensten Arten von Kopierrechten signalisieren, wie z.B. dass das Kopieren des aktuellen Stücks vollständig untersagt ist, dass das Kopieren des aktuellen Stücks nur ein einziges Mal erlaubt ist, dass das Kopieren des aktuellen Stücks völlig frei ist, usw. Der Kunde verfügt über einen Decodierer oder eine Verwaltungssoftware, der bzw. die den Header einliest und unter Beachtung der erlaubten Handlungen beispielsweise nur eine einzige Kopie zulässt und weitere Kopien verweigert, oder dergleichen.

[0004] Dieses Konzept zur Beachtung der Urheberrechte funktioniert jedoch nur für Kunden, die sich legal verhalten. Illegale Kunden haben üblicherweise ein wesentliches Potential an Kreativität, die mit einem Header versehenen Musikstücke zu "knacken". Hier zeigt sich bereits der Nachteil der beschriebenen Vorgehensweise zum Schutz von Urheberrechten. Ein solcher Header kann einfach entfernt werden. Alternativ könnte ein illegaler Benutzer auch einzelne Einträge in dem Header modifizieren, um beispielsweise den Eintrag "Kopieren untersagt" in einen Eintrag "Kopieren völlig frei" umzuwandeln. Denkbar ist auch der Fall, dass ein illegaler Kunde seine eigene Kundennummer aus dem Header entfernt und dann das Musikstück auf seiner oder einer anderen Homepage im Internet anbietet. Ab diesem Moment ist es nicht mehr möglich, den illegalen Kunden zu ermitteln, da er seine Kundennummer entfernt hat.

[0005] Aus der WO 97/33391 ist ein Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal bekannt. Dabei wird das Audiosignal, in das das nicht hörbare Datensignal, hier Wasserzeichen genannt, eingebracht werden soll, in den Frequenzbereich umgewandelt, um mittels eines psychoakustischen Modells die Maskierungsschwelle des Audiosignals zu bestimmen. Das Datensignal, das in das Audiosignal eingebracht werden soll, wird mit einem Pseudorauschsignal moduliert, um ein frequenzmäßig gespreiztes Datensignal zu schaffen. Das frequenzmäßig gespreizte Datensignal wird dann mit der psychoakustischen Maskierungsschwelle gewichtet, derart, dass die Energie des frequenzmäßig gespreizten Datensignals immer unterhalb der Maskierungsschwelle liegt. Schließlich wird das gewichtete Datensignal dem Audiosignal überlagert, wodurch ein Audiosignal erzeugt wird, in das das Datensignal unhörbar eingebracht ist. Das Datensignal kann zum einen dazu verwendet werden, dem Audiosignal Urheber Informationen hinzuzufügen und alternativ kann das Datensignal zur Kennzeichnung von Audiosignalen verwendet werden, um eventuelle Raubkopien ohne weiteres zu identifizieren, da jeder Tonträger beispielsweise in Form einer CompactDisk ab Werk mit einer individuellen Kennung versehen wird.

[0006] Die Einbettung eines Wasserzeichens in ein unkomprimiertes Audiosignal, bei dem also das Audiosignal noch im Zeitbereich bzw. in der Zeitbereichsdarstellung vorliegt, sind auch noch in C. Neubauer, J. Herre: "Digital Watermarking and its Influence on Audio Quality", 105th AES Convention, San Francisco 1998, Preprint 4823 und in der DE 196 40 814 beschrieben.

[0007] Audiosignale liegen jedoch häufig auch bereits als komprimierte Audiodatenströme vor, die beispielsweise einer Verarbeitung nach einem der MPEG-Audioverfahren unterzogen worden sind. Würde man nun eines der vorhergehenden Wasserzeicheneinbettungsverfahren verwenden wollen, um Musikstücke vor der Auslieferung an einen Kunden mit einem Wasserzeichen zu versehen, so müssten dieselben vor der Wasserzeicheneinbringung vollständig dekomprimiert werden, um wieder eine Folge von Zeitbereichs-Audiowerten zu erhalten. Dies bedeutete jedoch neben einem hohen Rechenaufwand aufgrund der zusätzlichen Decodierung vor der Wasserzeicheneinbettung auch, dass bei erneuter Codierung die Gefahr des Auftretens von Tandem-Codiereffekten besteht, wenn diese wasserzeichenbehafteten Audiosignale erneut codiert werden.

[0008] Es sind deshalb auch Schemata zur Einbettung eines Wasserzeichens in bereits komprimierte Audiosignale bzw. komprimierte Audiobitströme entwickelt worden, die unter anderem den Vorteil besitzen, dass sie eine niedrigere Rechenkomplexität erfordern, da keine volle Decodierung des mit einem Wasserzeichen zu versehenden Audiobitstroms erfolgen muss, d.h. also insbesondere die Anwendung von Analyse- und Synthese-Filterbanken auf das Audiosignal entfallen. Weitere Vorteile dieser bereits auf komprimierte Audiosignale anwendbaren Verfahren sind die hohe Audioqualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch genau aufeinander abgestimmt werden können, ihre hohe Robustheit, da das Wasserzeichen nicht durch einen nachfolgenden Audiocodierer "geschwächt" wird, und die Ermöglichung einer geeigneten Wahl der Spreizbandparameter, so dass eine Kompatibilität zu PCM-Wasserzeichen-Verfahren (PCM = Pulse Code Modulation = Pulscodemodulation) bzw. den an unkomprimierten Audiosignalen arbeitenden Einbettungsschemata erzielt werden kann. Ein Überblick über Schemata zur Einbettung von Wasserzeichen in bereits komprimierte Audiosignale findet sich in C. Neubauer, J. Herre: "Audio Watermarking of MPEG-2 AAC Bit Streams", 108th AES Convention, Paris 2000, Preprint 5101 und ferner in der DE 10129239 C1.

[0009] Eine weitere verbesserte Weise der Einbringung eines Wasserzeichens in Audiosignale betreffen diejenigen Schemata, die die Einbettung während der Komprimierung eines noch unkomprimierten Audiosignals vornehmen. Einbettungsschemata dieser Art weisen unter anderem den Vorteil einer niedrigeren Rechenkomplexität auf, da durch die Zusammenziehung von Wasserzeicheneinbettung und Codierung bestimmte Operationen, wie z.B. die Berechnung des Maskierungsmodells und die Überführung des Audiosignals in den Spektralbereich, nur einmal durchgeführt werden müssen. Weitere Vorteile umfassen eine höhere Audioqualität, da das Quantisierungsgeräusch und das Wasserzeichengeräusch genau aufeinander abgestimmt werden können, eine hohe Robustheit, da das Wasserzeichen nicht durch einen nachfolgenden Audiocodierer "geschwächt" wird, und die Möglichkeit einer geeigneten Wahl der Spreizbandparameter, um eine Kompatibilität zu dem PCM-Wasserzeichenverfahren zu erzielen. Ein Überblick über die komprimierte Wasserzeicheneinbettung/Codierung findet sich beispielsweise in Siebenhaar, Frank; Neubauer, Christian; Herre, Jürgen: "Combined Compression/Watermarking for Audio Signals", In 110th AES Convention, Amsterdam, preprint 5344; C. Neubauer, R. Kulessa and J. Herre: "A Compatible Family of Bitstream Watermarking Systems for MPEG-Audio", 110th AES Convention, Amsterdam, May 2000, Preprint 5346, und der DE 199 47 877.

[0010] Zusammenfassend ausgedrückt sind Wasserzeichen für codierte und uncodierte Audiosignale in verschiedenen Varianten bekannt. Mit Hilfe von Wasserzeichen können Zusatzdaten robust und unhörbar innerhalb eines Audiosignals übertragen werden. Es existieren heutzutage wie oben gezeigt verschiedene Wasserzeicheneinbettungsverfahren, die sich in der Domäne der Einbettung, wie z.B. dem Zeitbereich, dem Frequenzbereich usw., und der Art der Einbettung, wie z.B. der Quantisierung, der Auslöschung einzelner Werte, usw., unterscheiden. Zusammenfassende Beschreibungen existierender Verfahren finden sich in M. van der Veen, F. Brukers et al.: "Robust, Multi-Functional and High-Quality Audio Watermarking Technology", 110th AES Convention, Amsterdam May 2002, Preprint 5345; Jaap Haitsma, Michiel van der Veen, Ton Kalker and Fons Bruekers: "Audio Watermarking for Monitoring and Copy Protection", ACM Workshop 2000, Los Angeles, und der bereits zitierten DE 196 40 814.

[0011] Obwohl die im Vorhergehenden kurz skizzierten Arten von Schemata zur Einbettung eines Wasserzeichens in Audiosignalen bereits recht ausgefeilt sind, besteht ein Nachteil darin, dass sich existierende Wasserzeichenverfahren fast ausschließlich auf die Aufgabe konzentriert haben, ein Wasserzeichen unhörbar mit einer hohen Einbringungsrate und einer hohen Robustheit, d.h. mit der Eigenschaft, dass das Wasserzeichen auch nach Signalveränderungen verwertbar ist, in das ursprüngliche Audiosignal einzubetten. Dabei wurde für die meisten Anwendungsgebiete das Hauptaugenmerk auf die Robustheit gelegt. Das am weitesten verbreitete Verfahren zur Beaufschlagung von Audiosignalen mit einem Wasserzeichen, nämlich die Spreizbandmodulation, wie sie beispielsweise in der im Vorhergehenden genannten WO 97/33391 beschrieben ist, gilt als sehr robust und sicher.

[0012] Aufgrund der Popularität und der Tatsache, dass die Prinzipien der spreizbandmodulationsbasierten Wasserzeichenverfahren allgemein bekannt sind, besteht die Gefahr, dass Verfahren bekannt werden, mit denen umgekehrt eine Zerstörung des Wasserzeichens aus den mit diesem Verfahren wasserzeichenbehafteten Audiosignalen erzielt werden kann. Aus diesem Grund ist es sehr wichtig, neue hochwertige Verfahren zu entwickeln, die als Alternative zur Spreizbandmodulation dienen können.

[0013] Die Aufgabe der vorliegenden Erfindung besteht folglich darin, ein völlig neuartiges und damit auch sichereres Schema zur Einbringung eines Wasserzeichens in ein Informationssignal zu schaffen.

[0014] Diese Aufgabe wird durch Vorrichtungen gemäß Anspruch 1 oder 22 und Verfahren gemäß Anspruch 23 oder 24 gelöst.

[0015] Nach einem erfindungsgemäßen Schema zum Einbringen eines Wasserzeichens in ein Informationssignal wird zunächst das Informationssignal von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung überführt. Das Informationssignal wird dann in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen manipuliert, um eine modifizierte Spektral/Modulationsspektraldarstellung zu erhalten, und anschließend wird ein wasserzeichenbehaftetes Informationssignal basierend auf der modifizierten Spektral/Modulationsspektraldarstellung gebildet.

[0016] Nach einem erfindungsgemäßen Schema zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, wird dementsprechend das wasserzeichenbehaftete Informationssignal von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung überführt, woraufhin das Wasserzeichen basierend auf der Spektral/Modulationsspektraldarstellung hergeleitet wird.

[0017] Ein Vorteil der vorliegenden Erfindung besteht darin, dass dadurch, dass gemäß der vorliegenden Erfindung das Wasserzeichen in der Spektral/Modulationsspektraldarstellung bzw. -Domäne eingebettet bzw. hergeleitet wird, traditionelle Korrelationsangriffe, wie sie bei den spreizbandmodulationsbasierten Wasserzeichenverfahren eingesetzt werden, nicht ohne weiteres zum Ziel führen. Hier macht sich insbesondere positiv bemerkbar, dass die Analyse eines Signals in der Spektral/Modulationsspektral-Domäne für potentielle Angreifer noch Neuland ist.

[0018] Weiterhin birgt die erfindungsgemäße Einbettung des Wasserzeichens in der Spektral/Modulationsspektral-Domäne bzw. in der 2-dimensionalen Modulationsspektral/Spektral-Ebene wesentlich mehr Variationen der Einbettungsparameter, wie z.B. an welchen "Stellen" in dieser Ebene die Einbettung lokalisiert ist, als dies bisher der Fall war. Die Auswahl der entsprechenden Stellen kann dabei gegebenenfalls auch zeitvariant erfolgen.

[0019] Durch Einbettung des Wasserzeichens in der Spektral/Modulationsspektral-Domäne ist es in dem Fall eines Audiosignals als dem Informationssignal unter Umständen ferner möglich, ohne die aufwendige Berechnung herkömmlicher psychoakustischer Parameter, wie z.B. der Mithörschwelle, eine unhörbare Einbettung eines Wasserzeichens vorzunehmen, um somit mit geringerem Aufwand trotzdem die Unhörbarkeit des Wasserzeichens sicherzustellen. Die Modifikation der Modulationswerte kann hierbei beispielsweise unter Ausnutzung von Verdeckungseffekten im Modulationsspektralbereich durchgeführt werden.

[0020] Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung sind nachfolgend bezugnehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:

Fig. 1: ein Blockdiagramm einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem Ausführungsbeispiel der vorliegenden Erfindung;
Fig. 2: eine schematische Zeichnung zur Veranschaulichung der Vorrichtung nach Fig. 1 zugrunde liegenden Überführung eines Audiosignals in eine Frequenz/Modulationsfrequenz-Domäne;
Fig. 3: ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach Fig. 1 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal;
Fig. 4: ein Blockschaltbild einer Vorrichtung zum Einbetten eines Wasserzeichens in ein Audiosignal gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung; und
Fig. 5: ein Blockdiagramm einer Vorrichtung zum Extrahieren eines durch die Vorrichtung nach Fig. 4 eingebetteten Wasserzeichens aus einem wasserzeichenbehafteten Audiosignal.

[0021] Bezugnehmend auf die Figuren 1-3 wird im Folgenden ein Schema zur Einbettung eines Wasserzeichens in ein Audiosignal beschrieben, bei dem zunächst ein eingehendes Audiosignal bzw. ein Audioeingangssignal, das in einem Zeitbereich bzw. einer Zeitdarstellung vorliegt, blockweise in eine Zeit/Frequenzdarstellung und von dort aus in eine Frequenz/Modulationsfrequenzdarstellung überführt wird. In dieser Darstellung wird dann das Wasserzeichen in das Audiosignal eingebracht, indem abhängig vom Wasserzeichen Modulationswerte der Frequenz/Modulationsfrequenzbereichsdarstellung modifiziert werden. Derart modifiziert wird das Audiosignal dann wieder zurück in den Zeit/Frequenzbereich und von dort aus wieder in den Zeitbereich rücküberführt.

[0022] Die Wasserzeicheneinbettung nach dem Schema von Fig. 1-3 wird durch die Vorrichtung nach Fig. 1 durchgeführt, die im Folgenden auch als Wasserzeichen-Einbetter bezeichnet wird und mit dem Bezugszeichen 10 angezeigt ist. Der Einbetter 10 umfasst einen Eingang 12 zum Empfangen des Audioeingangssignals, in welches das einzubringende Wasserzeichen eingebracht werden soll. Das Wasserzeichen, wie z.B. eine Kundennummer, erhält der Einbetter 10 an einem Eingang 14. Neben den Eingängen 12 und 14 umfasst der Einbetter 10 einen Ausgang 16 zum Ausgeben des mit dem Wasserzeichen versehenen bzw. des wasserzeichenbehafteten Ausgangssignals.

[0023] Intern umfasst der Einbetter 10 eine Fensterungseinrichtung 18 und eine erste Filterbank 20, die in Reihe hinter den Eingang 12 geschaltet sind und dafür zuständig sind, das Audiosignal am Eingang 12 durch blockweise Verarbeitung von dem Zeitbereich 22 in den Zeit/Frequenzbereich 24 zu überführen. An den Ausgang der Filterbank 20 schließt eine Betrag/Phase-Detektionseinrichtung 26 an, um eine Aufteilung der Zeit/Frequenzbereichsdarstellung des Audiosignals in Betrag und Phase vorzunehmen. Eine zweite Filterbank 28 ist mit der Detektionseinrichtung 26 verbunden, um den Betragsanteil der Zeit/Frequenzbereichsdarstellung zu erhalten, und überführt den Betragsanteil in die Frequenz/Modulationsfrequenzbereichsdomäne 30, um auf diese Weise eine Frequenz/Modulationsfrequenzdarstellung des Audiosignals 12 zu erzeugen. Die Blöcke 18, 20, 26, 28 stellen somit einen Analyseteil des Einbetters 10 dar, der die Überführung des Audiosignals in die Frequenz/Modulationsfrequenzdarstellung erzielt.

[0024] Eine Wasserzeicheneinbettungseinrichtung 32 ist mit der zweiten Filterbank 28 verbunden, um von derselben die Frequenz/Modulationsfrequenzdarstellung des Audiosignals 12 zu erhalten. Ein weiterer Eingang der Wasserzeicheneinbettungseinrichtung 32 ist mit dem Eingang 14 des Einbetters 10 verbunden. Die Wasserzeicheneinbettungseinrichtung 32 erzeugt eine modifizierte Frequenz/Modulationsfrequenzdarstellung.

[0025] Ein Ausgang der Wasserzeicheneinbettungseinrichtung 32 ist mit einem Eingang einer zu der zweiten Filterbank 28 inversen Filterbank 34 verbunden, die für die Rücküberführung in den Zeit/Frequenzbereich 24 zuständig ist. Eine Phasenverarbeitungseinrichtung 36 ist mit der Detektionseinrichtung 26 verbunden, um den Phasenanteil der Zeit/Frequenzbereichsdarstellung 24 des Audiosignals zu erhalten und in manipulierter Form, wie es im Folgenden noch beschrieben wird, an eine Rekombinationseinrichtung 38 weiterzuleiten, die darüber hinaus mit einem Ausgang der inversen Filterbank 34 verbunden ist, um den modifizierten Betragsanteil der Zeit/Frequenzdarstellung des Audiosignals zu erhalten. Die Rekombinationseinrichtung 38 vereint den durch die Phasenverarbeitung 36 modifizierten Phasenanteil mit dem um das Wasserzeichen modifizierten Betragsanteil der Zeit/Frequenzbereichsdarstellung des Audiosignals und gibt das Ergebnis, nämlich die Zeit/Frequenzdarstellung des wasserzeichenbehafteten Audiosignals, an eine zu der ersten Filterbank 20 inverse Filterbank 40 aus. Zwischen den Ausgang der inversen Filterbank 40 und den Ausgang 16 ist eine Fensterungseinrichtung 42 geschaltet. Der Teil aus den Komponenten 34, 38, 40, 42 kann als Syntheseteil des Einbetters 10 betrachtet werden, da er dafür verantwortlich ist, aus der modifizierten Frequenz/Modulationsfrequenzdarstellung das wasserzeichenbehaftete Audiosignal in der Zeitdarstellung zu erzeugen.

[0026] Nachdem im Vorhergehenden der Aufbau des Einbetters 10 beschrieben worden ist, wird im Folgenden dessen Funktionsweise beschrieben.

[0027] Die Einbettung beginnt mit der Überführung des Audiosignals am Eingang 12 von der Zeitdarstellung in die Zeit/Frequenzdarstellung durch die Einrichtungen 18 und 20, wobei davon ausgegangen wird, dass das Audioeingangssignal am Eingang 12 in einer mit einer vorbestimmten Abtastfrequenz abgetasteten Weise vorliegt, nämlich als eine Folge von Abtast- bzw. Audiowerten. Liegt das Audiosignal noch nicht in einer solchen abgetasteten Form vor, so kann hierzu ein entsprechender A/D-Wandler als eine Abtasteinrichtung verwendet werden.

[0028] Die Fensterungseinrichtung 18 empfängt das Audiosignal und extrahiert aus demselben eine Folge von Blöcken von Audiowerten. Hierzu fasst die Fensterungseinrichtung 18 jeweils eine vorbestimmte Anzahl von aufeinander folgenden Audiowerten des Audiosignals am Eingang 12 zu Zeitblöcken zusammen und multipliziert bzw. fenstert diese Zeitblöcke, die ja einen Zeitausschnitt aus dem Audiosignal 12 darstellen, mit einer Fenster- bzw. Gewichtungsfunktion, wie z.B. einem Sinusfenster, einem KBD-Fenster oder dergleichen. Dieser Vorgang wird als Fensterung bezeichnet und dabei beispielsweise derart durchgeführt, dass die einzelnen Zeitblöcke Zeitabschnitte des Audiosignals betreffen, die sich gegenseitig überlappen, wie z.B. um die Hälfte, sodass jeder Audiowert zwei Zeitblöcken zugeteilt ist.

[0029] Der Vorgang der Fensterung durch die Einrichtung 18 ist in Fig. 2 exemplarisch für den Fall des 50%-Überlapps näher veranschaulicht. Fig. 2 veranschaulicht mit einem Pfeil 50 die Folge von Audiowerten in ihrer zeitlichen Abfolge ihres Eintreffens am Eingang 12. Sie stellen das Audiosignal 12 im Zeitbereich 22 dar. Der Index n in Fig. 2 soll einen in Pfeilrichtung zunehmenden Index der Audiowerte bezeichnen. Mit 52 sind die Fensterfunktionen angedeutet, die die Fensterungseinrichtung 18 auf die Zeitblöcke anwendet. Die ersten beiden Fensterfunktionen für die ersten beiden Zeitblöcke sind in Fig. 2 mit dem Index 2m bzw. 2m+1 überschrieben. Wie es zu erkennen ist, überlappen der Zeitblock 2m und der darauf folgende Zeitblock 2m+1 um die Hälfte bzw. 50% und weisen somit jeweils die Hälfte ihrer Audiowerte gemeinsam auf. Die von der Einrichtung 18 erzeugten und an die Filterbank 20 weitergeleiteten Blöcke entsprechen einer Gewichtung der zu einem Zeitblock gehörenden Audiowerte mit der Fensterfunktion 52 bzw. einer Multiplikation zwischen denselben.

[0030] Die Filterbank 20 erhält die Zeitblöcke bzw. Blöcke von gefensterten Audiowerten, wie es in Fig. 2 mit Pfeilen 54 angedeutet ist, und überführt dieselben durch eine Zeit/Frequenz-Transformation 56 blockweise in eine Spektraldarstellung. Dabei nimmt die Filterbank je nach Ausführung eine vorbestimmte Zerlegung des Spektralbereiches in vorbestimmte Frequenzbänder bzw. Spektralkomponenten vor. Die spektrale Darstellung umfasst beispielsweise frequenzmäßig nebeneinander liegende Spektralwerte von der Frequenz Null bis zur maximalen Audiofrequenz, die dem Audiosignal zugrunde liegt und beispielsweise 44,1 kHz beträgt. In Fig. 2 ist exemplarisch der Fall einer Spektralzerlegung in zehn Teilbänder dargestellt.

[0031] Die blockweise Überführung ist in Fig. 2 durch eine Mehrzahl von Pfeilen 58 angedeutet. Jeder Pfeil entspricht der Überführung eines Zeitblockes in den Frequenzbereich. Beispielsweise wird der Zeitblock 2m in einen Block 60 von Spektralwerten 62 überführt, wie er in Fig. 2 durch eine Spalte von Kästchen angedeutet ist. Die Spektralwerte betreffen jeweils eine unterschiedliche Frequenzkomponente oder ein unterschiedliches Frequenzband, wobei in Fig. 2 durch die Achse 64 die Richtung angedeutet sein soll, entlang der die Frequenz k verläuft. Wie bereits erwähnt wird vorliegend davon ausgegangen, dass lediglich zehn Spektralkomponenten vorliegen, wobei jedoch die Anzahl lediglich veranschaulichender Natur ist und in Wirklichkeit vermutlich höher liegen wird.

[0032] Da die Filterbank 20 pro Zeitblock einen Block 60 von Spektralwerten 62 erzeugt, ergeben sich mit der Zeit mehrere Folgen von Spektralwerten 62, nämlich eine pro Spektralkomponente k bzw. Teilband k. In Fig. 2 verlaufen diese zeitlichen Folgen in Zeilenrichtung, wie sie durch den Pfeil 66 dargestellt ist. Der Pfeil 66 stellt somit die Zeitachse der Zeit/Frequenzdarstellung dar, während der Pfeil 64 die Frequenzachse dieser Darstellung repräsentiert. Die "Abtastfrequenz" bzw. der Wiederholabstand der Spektralwerte innerhalb der einzelnen Teilbänder entspricht der Frequenz bzw. dem Wiederholabstand der Zeitblöcke aus dem Audiosignal. Die Zeitblockwiederholfrequenz entspricht wiederum zwei mal der Abtastfrequenz des Audiosignals dividiert durch die Anzahl an Audiowerten pro Zeitblock. Der Pfeil 66 entspricht somit einer Zeitdimension insofern als er die zeitliche Abfolge der Zeitblöcke verkörpert.

[0033] Wie es zu erkennen ist, entsteht somit über eine gewisse Anzahl, hier exemplarisch einer Anzahl von 8, von aufeinander folgenden Zeitblöcken hinweg eine Matrix 68 von Spektralwerten 62, die eine Zeit/Frequenzbereichsdarstellung 24 des Audiosignals über die Zeitdauer dieser Zeitblöcke hinweg darstellt.

[0034] Die blockweise an den Zeitblöcken durch die Filterbank 20 durchgeführte Zeit/Frequenz-Transformation 56 ist beispielsweise eine DFT, DCT, MDCT oder dergleichen. Je nach Transformation sind die einzelnen Spektralwerte innerhalb eines Blockes 60 in bestimmte Teilbänder eingeteilt. Für jedes Teilband kann jeder Block 60 mehr als einen Spektralwert 62 aufweisen. Insgesamt entsteht somit über die Folge von Zeitblöcken hinweg pro Teilband bzw. Spektralkomponente eine Folge von Spektralwerten, die den zeitlichen Verlauf des jeweiligen Teilbandes wiedergeben und in Fig. 2 in Zeilenrichtung 84 verlaufen.

[0035] Die Filterbank 20 gibt blockweise die Blöcke 60 von Spektralwerten 62 an die Betrags/Phasen-Detektionseinrichtung 26 weiter. Letztere verarbeitet die komplexen Spektralwerte und gibt lediglich die Beträge derselben an die Filterbank 28 weiter. Die Phasen der Spektralwerte 62 gibt sie hingegen an die Phasenverarbeitungseinrichtung 36 weiter.

[0036] Die Filterbank 28 verarbeitet die pro Teilband vorliegenden Folgen 70 von Beträgen von Spektralwerten 62 ähnlich der Filterbank 20, nämlich durch blockweises Transformieren dieser Folgen Block für Block in die Spektraldarstellung bzw. die Modulationsfrequenzdarstellung, und zwar unter Verwendung von vorzugsweise wiederum gefensterten und sich gegenseitig überlappenden Blöcken, wobei die zugrundeliegenden Blöcke aller Teilbänder vorzugsweise zeitlich zueinander gleich ausgerichtet sind. Anders ausgedrückt verarbeitet die Filterbank 28 jeweils N Spektralblöcke 60 von Spektralwertbeträgen gleichzeitig bzw. gemeinsam. Die N Spektralblöcke 60 von Spektralwertbeträgen bilden eine Matrix 68 von Spektralwertbeträgen. Existieren beispielsweise M Teilbänder, verarbeitet die Filterbank 28 die Spektralwertbeträge in Matrizen zu je N*M Spektralwertbeträgen. In Fig. 3 ist exemplarisch der Fall angenommen, dass M=N gilt, während in Fig. 2 exemplarisch angenommen wurde, dass N=10 und M=8 gilt. Die Weiterleitung des Betragsanteils einer solchen Matrix 68 von Spektralwertbeträgen 62 an die Filterbank 28 ist in Fig. 2 durch die Pfeile 72 angedeutet.

[0037] Nach Erhalt des Betragsanteils N aufeinanderfolgender Spektralblöcke bzw. der Matrix 68 transformiert also die Filterbank 28 - getrennt für jedes Teilband - die Blöcke von Spektralwertbeträgen der jeweiligen Teilbänder, also der Zeilen in der Matrix 68, von der Zeitdomäne 66 in eine Frequenzdarstellung, wobei wie bereits erwähnt die Spektralwertbeträge zur Vermeidung von Aliasingeffekten gefenstert sein können. Anders ausgedrückt überführt die Filterbank 28 jeden dieser Spektralwertbetragsblöcke aus den den zeitlichen Verlauf eines jeweiligen Teilbandes darstellenden Folgen 70 in eine Spektraldarstellung und erzeugt somit pro Teilband einen Block von Modulationswerten, die in Fig. 2 mit 74 angezeigt sind. Jeder Block 74 enthält mehrere Modulationswerte, die in Fig. 2 nicht mehr veranschaulicht sind. Jeder dieser Modulationswerte innerhalb eines Blockes 74 ist einer unterschiedlichen Modulationsfrequenz zugeordnet, die in Fig. 2 entlang der Achse 76 verlaufen soll, die somit die Modulationsfrequenzachse der Frequenz/Modulationsfrequenzdarstellung repräsentiert. Durch Anordnung der Blöcke 74 je nach Teilbandfrequenz entlang einer Achse 78 entsteht hierdurch eine Matrix 80 von Modulationswerten, die eine Frequenz/Modulationsfrequenzbereichsdarstellung des Audiosignals am Eingang 12 in dem der Matrix 68 zugeordneten Zeitabschnitt darstellt.

[0038] Wie bereits erwähnt kann zur Vermeidung von Artefakten die Filterbank 28 oder die Einrichtung 26 eine interne Fenstereinrichtung (nicht gezeigt) aufweisen, die die Transformationsblöcke, also die Zeilen der Matrix 68, von Spektralwerten pro Teilband vor ihrer jeweiligen Zeit/Modulationsfrequenz-Transformation 80 durch die Filterbank 28 in den Modulationsfrequenzbereich 30, um die Blöcke 74 zu erhalten, einer Fensterung mit einer Fensterfunktion 82 unterzieht.

[0039] Es wird noch einmal explizit darauf hingewiesen, dass auf die im Vorhergehenden beschriebene Weise eine Folge von Matrizen 80 verarbeitet werden, die sich in dem im Vorhergehenden erwähnten exemplarisch 50%-Überlapp-Fensterung - um 50% in der Zeit überlappen. Anders ausgedrückt bildet die Filterbank 28 die Matrix 80 für aufeinander folgende N Zeitblöcke derart, dass die Matrizen 80 jeweils N Zeitblöcke betreffen, die sich um die Hälfte überschneiden, wie es in Fig. 2 exemplarisch durch eine gestrichelte Fensterfunktion 84 angedeutet werden soll, die die Fensterung für die nächste Matrix darstellen.

[0040] Die Modulationswerte der Frequenz/Modulationsfrequenzbereichsdarstellung 30, wie sie von der Filterbank 28 ausgegeben werden, erreichen die Wasserzeicheneinbettungseinrichtung 32. Die Wasserzeicheneinbettungseinrichtung 32 modifiziert nun die Modulationsmatrix 80 bzw. einzelne oder mehrere der Modulationswerte der Modulationsmatrizen 80 des Audiosignals 12. Die von der Einrichtung 32 vorgenommene Modifikation kann beispielsweise durch eine multiplikative Gewichtung einzelner Modulationsfrequenz/Frequenz-Segmente des Modulationsteilbandspektrums bzw. der Frequenz/Modulationsfrequenzbereichsdarstellung erfolgen, d.h. durch eine Gewichtung der Modulationswerte innerhalb eines bestimmten Bereichs des durch die Achsen 76 und 78 aufgespannten Frequenz/Modulationsfrequenz-Raumes. Ebenso könnte die Modifikation das Setzen einzelner Segmente bzw. Modulationswerte auf bestimmte Werte aufweisen.

[0041] Die multiplikative Gewichtung bzw. die bestimmten Werte würden in vorgegebener Weise von dem Wasserzeichen abhängen, das am Eingang 14 erhalten wird. Dabei könnte das Setzen einzelner Modulationswerte bzw. Segmente von Modulationswerten auf bestimmte Werte signaladaptiv erfolgen, d.h. zusätzlich abhängig von dem Audiosignal 12 an sich.

[0042] Die einzelnen Segmente des 2-dimensionalen Modulationsteilbandspektrums können einerseits durch Unterteilung der akustischen Frequenzachse 78 in Frequenzgruppen gewonnen werden, andererseits kann eine weitere Segmentierung durch Unterteilung der Modulationsfrequenzachse 76 in Modulationsfrequenzgruppen durchgeführt werden. In Fig. 1 ist exemplarisch eine Segmentierung der Frequenzachse in 5 und der Modulationsfrequenzachse in 4 Gruppen angedeutet, wodurch sich 20 Segmente ergeben. Die dunklen Segmente zeigen exemplarisch die Stellen an, an denen die Einrichtung 32 die Modulationsmatrix 80 modifiziert, wobei, wie im Vorhergehenden erwähnt, die zur Modifikation herangezogen Stellen zeitlich variieren können. Die Stellen werden vorzusgweise derart ausgewählt, dass durch Verdeckungseffekte die Änderungen an dem Audiosignal in der Frequenz/Modulationsfrequenzdarstellung nicht oder kaum hörbar sind.

[0043] Nachdem die Einrichtung 32 die Modulationsmatrix 80 modifiziert hat, sendet dieselbe die modifizierten Modulationswerte der Modulationsmatrix 80 an die inverse Filterbank 34 weiter. Diese überführt mittels einer Transformation, die zu derjenigen der Filterbank 28 invers ist, also z.B. einer IDFT, IFFT, IDCT, IMDCT oder dergleichen, die Modulationsmatrix 80 Block-74-weise, d.h. getrennt nach Teilband, entlang der Modulationsfrequenzachse 76 in die Zeit/Frequenzbereichsdarstellung 24 zurück, um dadurch modifizierte Betragsanteil-Spektralwerte zu erhalten. Anders ausgedrückt transformiert die inverse Filterbank 34 jeden einem bestimmten Teilband zugehörigen Block von modifizierten Modulationswerten 74 mit einer zu der Transformation 86 inversen Transformation in eine Folge von Betragsanteil-Spektralwerten pro Teilband, wodurch sich nach dem vorhergehenden Ausführungsbeispiel eine Matrix von N x M Betragsanteil-Spektralwerten ergibt.

[0044] Die Betragsanteil-Spektralwerte von der inversen Filterbank 34 beziehen sich also immer auf zweidimensionale Blöcke bzw. Matrizen aus dem Strom von Folgen von Spektralwerten, in natürlich um das Wasserzeichen modifizierter Form. Nach dem exemplarischen Ausführungsbeispiel überlappen sich diese Blöcke um 50%. Eine beispielsweise in der Einrichtung 34 vorgesehene Einrichtung (nicht gezeigt) kompensiert nun in diesem exemplarischen 50%-Überlappungsfall die Fensterung, indem sie die sich überlappenden rekombinierten Spektralwerte aufeinanderfolgender, durch Rücktransformation aufeinanderfolgender Modulationsmatrizen erhaltener Matrizen von Spektralwerten addiert. Hierdurch entstehen aus den einzelnen Matrizen von modifizierten Spektralwerten wieder Ströme bzw. Folgen von modifizierten Spektralwerten, nämlich eine pro Teilband. Diese Folgen korrespondieren lediglich mit dem Betragsanteil der unmodifizierten Folgen 70 von Spektralwerten, wie sie von der Einrichtung 20 ausgegeben wurden.

[0045] Die Rekombinationseinrichtung 38 verknüpft die zu Teilbandströmen zusammengeführten Betragsanteil-Spektralwerte von der inversen Filterbank 34 mit den Phasenanteilen der Spektralwerte 62, wie sie von der Detektionseinrichtung 26 unmittelbar nach der Transformation 56 durch die erste Filterbank 20 abgesondert worden sind, jedoch in einer durch die Phasenverarbeitung 36 modifizierten Form. Und zwar modifiziert die Phasenverarbeitungseinrichtung 36 die Phasenanteile in einer von der Wasserzeicheneinbettung durch die Einrichtung 32 getrennten aber unter Umständen von dieser Einbettung abhängigen Weise derart, dass die Detektierbarkeit des Wasserzeichens im später bezugnehmend auf Fig. 3 erläuterten Detektor bzw. Decodersystem besser detektierbar ist oder/und die akustische Verdeckung des Wasserzeichensignals im später am Ausgang 16 auszugebenden wasserzeichenbehafteten Ausgangssignal und damit die Unhörbarkeit des Wasserzeichens verbessert ist. Die Rekombination kann die Rekombinationseinrichtung 38 matrixweise pro Matrix 68 oder kontinuierlich über die Folgen von modifizierten Betragsanteil-Spektralwerten pro Teilband vornehmen. Die optionale Abhängigkeit der Manipulation des Phasenanteils der Zeit/Frequenzdarstellung des Audiosignals am Eingang 12 von der Manipulation der Frequenz/Modulationsfrequenzdarstellung durch die Manipulationseinrichtung 32 ist in Fig. 1 durch einen gestrichelten Pfeil 88 veranschaulicht. Die Rekombination wird beispielsweise durch Addieren der Phase eines Spektralwertes auf den Phasenanteil des entsprechenden modifizierten Spektralwerts durchgeführt, wie er von der Filterbank 34 ausgegeben wird.

[0046] Auf diese Weise erzeugt die Einrichtung 38 also Folgen von Spektralwerten pro Teilband wie diejenige, die nach der Filterbank 20 direkt aus dem unveränderten Audiosignal erhalten worden ist, nämlich die Folgen 70, jedoch in um das Wasserzeichen veränderter Form, so dass die von der Einrichtung 38 ausgegebenen rekombinierten und bezüglich des Betragsanteils modifizierten Spektralwerte eine Zeit/Frequenzdarstellung des wasserzeichenbehafteten Audiosignals repräsentieren.

[0047] Die inverse Filterbank 40 erhält somit wieder Folgen von modifizierten Spektralwerten, nämlich eine pro Teilband. Anders ausgedrückt, erhält die inverse Filterbank 40 pro Zyklus eine Block von modifizierten Spektralwerte, also eine Frequenzdarstellung des wasserzeichenbehafteten Audiosignals bezüglich eines Zeitabschnittes desselben. Dementsprechend führt die Filterbank 40 eine zu der Transformation 56 der Filterbank 20 inverse Transformation an jedem solchen Block von Spektralwerten, d.h. entlang der Frequenzachse 70 angeordneten Spektralwerten, durch, um als Ergebnis modifizierte gefensterte Zeitblöcke bzw. Zeitblöcke von gefensterten modifizierten Audiowerten zu erhalten. Die anschließende Fensterungseinrichtung 42 kompensiert die Fensterung, wie sie durch die Fensterungseinrichtung 18 eingeführt worden ist, indem sie innerhalb der überlappenden Bereiche einander entsprechende Audiowerte addiert, wodurch sich am Ausgang 16 das wasserzeichenbehaftete Ausgangssignal in der Zeitbereichsdarstellung 22 ergibt.

[0048] Nachdem im Vorhergehenden die Einbettung eines Wasserzeichens gemäß dem Ausführungsbeispiel von Fig. 1-2 beschrieben worden ist, wird im Folgenden bezugnehmend auf Fig. 3 eine Vorrichtung beschrieben, die dazu geeignet ist, ein durch den Einbetter 10 erzeugtes wasserzeichenbehaftetes Ausgangssignal erfolgreich zu analysieren, um wieder das Wasserzeichen aus demselben zu rekonstruieren bzw. detektieren, das ja in dem wasserzeichenbehafteten Ausgangssignal zusammen mit den Nutzaudioinformationen für das menschliche Gehör vorzugsweise unhörbar enthalten ist.

[0049] Der Wasserzeichendecoder von Fig. 3, der allgemein mit 100 angezeigt ist, umfasst einen Audiosignaleingang 112 zum Empfangen des wasserzeichenbehafteten Audiosignals und einen Ausgang 114 zum Ausgeben des aus dem wasserzeichenbehafteten Audiosignal extrahierten Wasserzeichens. An den Eingang 112 schließen sich in Reihe geschaltet und in der Reihenfolge, wie sie im Folgenden aufgelistet sind, eine Fenstereinrichtung 118, eine Filterbank 120, eine Betrags/Phasen-Detektionseinrichtung 126 und eine zweite Filterbank 128 an, die in ihrer Funktion und Arbeitsweise den Blöcken 18, 20, 26 und 28 aus dem Einbetter 10 entsprechen. Dies bedeutet, dass das wasserzeichenbehaftete Audiosignal am Eingang 112 durch die Fenstereinrichtung 118 und die Filterbank 120 von dem Zeitbereich 122 in den Zeitfrequenzbereich 124 überführt wird, von wo aus durch die Detektionseinrichtung 126 und die zweite Filterbank 128 eine Überführung des Audiosignals am Eingang 112 in den Frequenz/Modulationsfrequenzbereich 130 stattfindet. Das wasserzeichenbehaftete Audiosignal wird durch die Einrichtungen 118, 120, 126 und 128 folglich denselben Verarbeitungen unterzogen, wie sie bezüglich des ursprünglichen Audiosignals bezugnehmend auf Fig. 2 beschrieben worden sind. Die sich ergebenden Modulationsmatrizen entsprechen jedoch nicht vollständig denjenigen, wie sie in dem Einbetter 10 von der Wassereinbettungseinrichtung 32 ausgegeben wurden, da durch die Phasenrekombinationen der Rekombinationseinrichtung 38 einige der Modulationsanteile bezüglich der modifizierten Modulationsmatrizen, wie sie von der Einrichtung 32 ausgegeben werden, verändert werden und sich somit in etwas veränderter Form im wasserzeichenbehafteten Ausgangssignal widerspiegeln. Auch die Fensterungsrückgängigmachung bzw. OLA verändert die Modulationsanteile bis zur erneuten Modulationsspektralanalyse im Dekodierer 100.

[0050] Eine Wasserzeichen-Decodierungseinrichtung 132, die mit der Filterbank 128 verbunden ist, um die Frequenz/Modulationsbereichsdarstellung des wasserzeichenbehafteten Eingangssignals bzw. die Modulationsmatrizen zu erhalten, ist vorgesehen, um das ursprünglich durch den Einbetter 10 eingebrachte Wasserzeichen aus dieser Darstellung zu extrahieren und am Ausgang 114 auszugeben. Die Extraktion wird an vorbestimmten Stellen der Modulationsmatrizen vorgenommen, die mit denjenigen korrespondieren, die von dem Einbetter 10 zur Einbettung verwendet worden sind. Die Übereinstimmung der Auswahl der Stellen wird beispielsweise durch entsprechende Standardisierung sichergestellt.

[0051] Gegenüber den Modulationsmatrizen, wie sie im Einbetter 10 in der Einrichtung 32 erzeugt wurden, bewirkte Veränderungen der Modulationsmatrizen, wie sie der Wasserzeichen-Decodierungseinrichtung 132 zugehen, können auch daher rühren, dass das wasserzeichenbehaftete Eingangssignal zwischen seiner Erzeugung bzw. Ausgabe am Ausgang 16 und der Detektion durch den Detektierer 100 bzw. dem Empfang am Eingang 112 auf irgendeine Weise verschlechtert worden ist, wie z.B. durch eine gröbere Quantisierung der Audiowerte oder dergleichen.

[0052] Bevor im Folgenden bezugnehmend auf die Figuren 4 und 5 ein weiteres Ausführungsbeispiel für ein Schema einer Einbettung eines Wasserzeichens in ein Audiosignal beschrieben wird, das sich im Hinblick auf das bezugnehmend auf Fig. 1-3 beschriebene Schema lediglich im Hinblick auf die Art und Weise der Überführung des Audiosignals vom Zeitbereich in den Frequenz/Modulationsfrequenzbereich unterscheidet, werden im Folgenden exemplarische Anwendungsbereiche bzw. Möglichkeiten beschrieben, auf welche das im Vorhergehenden beschriebene Einbettungsschema sinnvoll eingesetzt werden kann. Die folgenden Beispiele beziehen sich dabei exemplarisch auf Einsatzgebiete in der Rundfunküberwachung (broadcast monitoring) und bei DRM-Systemen, wie herkömmliche WM-Systemen (WM = watermark = Wasserzeichen). Die im Folgenden beschriebenen Anwendungsmöglichkeiten treffen aber natürlich auch auf das im Folgenden noch zu beschreibende Ausführungsbeispiel von Fig. 4 und 5 zu.

[0053] Einerseits kann das im Vorhergehenden beschriebene Ausführungsbeispiel zur Einbettung eines Wasserzeichens in ein Audiosignal zum Nachweis der Urheberschaft eines Audiosignals verwendet werden. Bei dem ursprünglichen Audiosignal, das am Eingang 12 eintrifft, handelt es sich beispielsweise um ein Musikstück. Während der Produktion von Musikstücken können durch den Einbetter 10 Urheberinformationen in Form eines Wasserzeichens in das Audiosignal eingebracht werden, wodurch das wasserzeichenbehaftete Audiosignal am Ausgang 16 entsteht. Wenn nun ein Dritter behauptet, Urheber des entsprechenden Musikstückes bzw. Musiktitels zu sein, kann der Nachweis der tatsächlichen Urheberschaft mit Hilfe des Wasserzeichens geführt werden, das aus dem wasserzeichenbehafteten Audiosignal mittels des Detektors 100 wieder extrahiert werden kann und ansonsten bei normalem Abspielen unhörbar ist.

[0054] Ein weiterer möglicher Einsatz oben dargestellter Wasserzeicheneinbettung besteht darin, Wasserzeichen für die Protokollierung des Sendeprogramms von TV- und Radiosendern zu verwenden. Rundfunkprogramme untergliedern sich zumeist in unterschiedliche Abschnitte, wie z.B. einzelne Musiktitel, Hörspiele, Werbespots oder dergleichen. Der Urheber eines Audiosignals oder zumindest derjenige, der an einem bestimmten Musiktitel oder Werbespot verdienen darf und möchte, kann nun sein Audiosignal mit dem Einbetter 10 mit einem Wasserzeichen versehen, und das wasserzeichenbehaftete Audiosignal dem Rundfunkbetreiber zukommen lassen. Musiktitel oder auch Werbespots können auf diese Weise mit einem jeweils eindeutigen Wasserzeichen beaufschlagt werden. Zur Protokollierung des Sendeprogramms kann nun z.B. ein Computer herangezogen werden, der das Rundfunksignal auf ein Wasserzeichen hin untersucht und gefundene Wasserzeichen protokolliert. Anhand der Liste des entdeckten Wasserzeichens lässt sich ohne weiteres eine Sendeliste für den entsprechenden Rundfunksender generieren, was die Abrechnung bzw. Gebührenbezahlung erleichtert.

[0055] Ein weiteres Einsatzgebiet besteht darin, Wasserzeichen zur Ermittelung illegaler Kopien zu verwenden. In dieser Hinsicht lohnt sich der Einsatz von Wasserzeichen insbesondere für den Musikvertrieb über das Internet. Erwirbt ein Käufer einen Musiktitel, wird während der Übermittlung der Musikdaten an den Käufer eine eindeutige Kundennummer mit Hilfe eines Wasserzeichens in die Daten eingebettet. Das Ergebnis sind Musiktitel, in denen das Wasserzeichen unhörbar eingebettet ist. Wird zu einem späteren Zeitpunkt ein Musiktitel an einer nicht genehmigten Stelle im Internet, wie z.B. einer Tauschbörse, gefunden, kann dieses Stück auf das Wasserzeichen hin mittels eines Decodierers nach Fig. 3 untersucht und anhand des Wasserzeichens der ursprüngliche Käufer identifiziert werden. Der letztgenannte Einsatz könnte auch für die aktuellen DRM-(DRM = Digital Rights Management = Digitale-Rechte-Verwaltung) Lösungen eine wichtige Rolle spielen. Das Wasserzeichen in den wasserzeichenbehafteten Audiosignalen könnte hier als eine Art "zweite Verteidigungslinie" dienen, die auch dann noch Rückschlüsse auf den ursprünglichen Käufer zulässt, wenn der kryptographische Schutz eines wasserzeichenbehafteten Audiosignals bereits umgangen worden ist.

[0056] Weitere Anwendungen für Wasserzeichen sind beispielsweise in der Druckschrift Chr. Neubauer, J. Herre, "Advanced Watermarking and its Applications", 109th Audio Engineering Society Convention, Los Angeles, Sept. 2000, Preprint 5176, beschrieben.

[0057] Im folgenden werden ein Einbetter und ein WasserzeichenDecoder bezüglich eines Ausführungsbeispiels für ein Einbettungsschema beschrieben, bei dem eine verglichen zu dem Ausführungsbeispiel in Fig. 1-3 unterschiedliche Überführung des Audiosignals vom Zeitbereich in den Frequenz/Modulationsfrequenzbereich verwendet wird. In der nachfolgenden Beschreibung werden Elemente in den Figuren, die zu denjenigen von Fig. 1 und 3 identisch oder gleichbedeutend sind, mit gleichen Bezugszeichen versehen, wie sie in Fig. 1 und 3 versehen worden sind, wobei für eine detailliertere Erörterung der Funktionsweise oder Bedeutung dieser Elemente zur Vermeidung von Wiederholungen ergänzend auf die Beschreibung der Figuren 1-3 verwiesen wird.

[0058] Der Einbetter von Fig. 4, der allgemein mit 210 angezeigt ist, umfasst ebenso wie der Einbetter von Fig. 1 einen Audiosignaleingang 12, einen Wasserzeicheneingang 14 und einen Ausgang 16 zur Ausgabe des wasserzeichenbehafteten Audiosignals. An den Eingang 12 schließen sich die Fensterungseinrichtung 18 und die erste Filterbank 20 an, um das Audiosignal blockweise in Blöcke 60 von Spektralwerten 62 (Fig. 2) zu überführen, wobei die Folge von Blöcken von Spektralwerten, die hierdurch am Ausgang der Filterbank 20 entsteht, die Zeit/Frequenzbereichsdarstellung 24 des Audiosignals darstellt. Im Unterschied zu dem Einbetter 10 von Fig. 1 werden jedoch die komplexen Spektralwerte 62 nicht in Betrag und Phase unterteilt, sondern die komplexen Spektralwerte werden vollständig weiterverarbeitet, um das Audiosignal in den Frequenz/Modulationsfrequenzbereich zu überführen. Die Folgen 70 von aufeinander folgenden Spektralwerten eines Teilbandes werden deshalb unter Berücksichtigung von Betrag und Phase blockweise in eine spektrale Darstellung überführt. Zuvor wird jedoch jede Teilbandspektralwertfolge 70 noch einer Demodulation unterzogen. Jede Folge 70, also die Abfolge von Spektralwerten, die sich bei aufeinander folgenden Zeitblöcken durch Überführung in den Spektralbereich für ein bestimmtes Teilband ergeben, wird nämlich durch einen Mischer 212 mit dem komplex Konjugierten einer Modulationsträgerkomponente multipliziert bzw. gemischt, welche durch eine Trägerfrequenzbestimmungseinrichtung 214 aus den Spektralwerten und insbesondere dem Phasenanteil dieser Spektralwerte der Zeit/Frequenzbereichsdarstellung des Audiosignals ermittelt wird. Die Einrichtungen 212 und 214 dienen dazu, eine Kompensation dazu zu liefern, dass der Wiederholabstand der Zeitblöcke nicht unbedingt zu der Periodendauer der Trägerfrequenzkomponente des Audiosignals abgestimmt ist, d.h. derjenigen hörbaren Frequenz, die im Mittel die Trägerfrequenz des Audiosignals darstellt. In dem Fall der Fehlabstimmung sind aufeinander folgende Zeitblöcke um einen unterschiedlichen Phasenversatz zu der Trägerfrequenz des Audiosignals verschoben. Dies führt dazu, dass jeder Block 60 von Spektralwerten, wie er von der Filterbank 20 ausgegeben wird, je nach Phasenversatz des jeweiligen Zeitblockes zu der Trägerfrequenz im Phasenanteil einen linearen Phasenanstieg aufweist, der auf den zeitblockindividuellen Phasenversatz zurückzuführen ist, d.h. deren Steigung und Achsenabschnitt von dem Phasenversatz abhängt. Da der Phasenversatz zwischen aufeinander folgenden Zeitblöcken zunächst immer zunimmt, wird auch die Steigung des auf den Phasenversatz zurückzuführenden Phasenanstieg für jeden Block 60 von Spektralwerten 62 größer, so lange, bis der Phasenversatz wieder Null wird usw.

[0059] Die vorhergehende Betrachtung bezog sich lediglich auf einzelne Blöcke 60 von Spektralwerten. Aus der vorhergehenden Erörterung wird jedoch auch deutlich, dass ein linearer Phasenanstieg auch bei Spektralwerten feststellbar ist, die sich bei aufeinander folgenden Zeitblöcken für ein und dasselbe Teilband ergeben, also ein Phasenanstieg entlang der Zeilen in Fig. 2 in der Matrix 68. Auch dieser Phasenanstieg ist auf den Phasenversatz der aufeinander folgenden Zeitblöcke rückzuführen und von demselben abhängig. Insgesamt erfahren die Spektralwerte 62 in der Matrix 68 aufgrund des Zeitversatzes der aufeinander folgenden Zeitblöcke eine kumulative Phasenänderung, die sich als Ebene in dem durch die Achsen 66 und 64 aufgespannten Raum darstellt.

[0060] Die Trägerfrequenzbestimmungseinrichtung 214 fittet bzw. passt deshalb durch geeignete Verfahren, beispielsweise mit einem kleinste-Fehlerquadrate-Algorithmus, eine Ebene in die geunwrappten bzw. einem Phasenunwrapping bzw. einer Phasenentwicklung bzw. Phasenabschnittsaneinanderreichung unterzogenen Phasen der Spektralwerte 62 der Matrix 68 ein, und schließt aufgrund dessen auf den auf den Phasenversatz der Zeitblöcke rückzuführenden Phasenanstieg zurück, der bei den Folgen 70 von Spektralwerten für die einzelnen Teilbänder innerhalb der Matrix 68 auftritt. Insgesamt ergeben sich somit pro Teilband ein hergeleiteter Phasenanstieg, der der gesuchten Modulationsträgerkomponente entspricht. Diese gibt die Einrichtung 214 an den Mischer 212 weiter, damit die jeweilige Folge 70 von Spektralwerten durch den Mischer 212 mit der komplex Konjugierten derselben gemischt wird, bzw. mit e^-j(w*m+ϕ) multipliziert wird, wobei m den bestimmten Träger angibt, m der Index für die Spektralwerte ist und ϕ einen Phasenversatz des bestimmten Trägers zum betrachteten Zeitausschnitt der N Zeitblöcke ist. Natürlich kann die Trägerfrequenzbestimmungseinrichtung 214 auch eindimensionale Einpassungen einer Geraden in die Phasenverläufe der einzelnen Folgen 70 von Spektralwerten 62 innerhalb der Matrizen 68 durchführen, um die einzelnen auf den Phasenversatz der Zeitblöcke rückzuführenden Phasenanstieg zu erhalten. Nach der Demodulation durch den Mischer 212 ist deshalb der Phasenanteil der Spektralwerte der Matrix 68 "eingeebnet", und variiert lediglich noch im Mittel um die Phase Null aufgrund der Gestalt des Audiosignals selbst herum.

[0061] Die so modifizierten Spektralwerte 62 gibt der Mischer 212 an die Filterbank 28 weiter, die dieselben matrixweise (Matrix 68 in Fig. 2) in den Frequenz/Modulationsfrequenzbereich überführt. Ähnlich wie bei dem Ausführungsbeispiel von Fig. 1-3 wird folglich eine Matrix von Modulationswerten erhalten, in der diesmal jedoch sowohl Phase als auch Betrag der Zeit/Frequenbereichsdarstellung 24 berücksichtigt worden sind. Wie bei dem Beispiel von Fig. 1 kann eine Fensterung mit 50%-Überlappung oder dergleichen vorgesehen sein.

[0062] Die so erzeugten aufeinander folgenden Modulationsmatrizen werden einer Wasserzeichen-Einbettungseinrichtung 216 weitergeleitet, die an einem weiteren Eingang das Wasserzeichen 14 erhält. Die Wasserzeicheneinbettungseinrichtung 216 funktioniert beispielsweise auf ähnliche Weise wie die Einbettungseinrichtung 32 des Einbetters 10 von Fig. 1. Die Einbettungsstellen innerhalb der Frequenz/Modulationsfrequenzbereichsdarstellung 30 werden jedoch gegebenenfalls unter Verwendung von andere Verdeckungseffekte berücksichtigenden Regeln ausgewählt, als dies bei der Einbettungseinrichtung 32 der Fall ist. Die Stellen der Einbettung sollten wie auch bei der Einrichtung 32 derart ausgewählt sein, dass die dort modifizierten Modulationswerte sich nicht hörbar auf das wasserzeichenbehaftete Audiosignal auswirken, wie es später am Ausgang des Einbetters 210 ausgegeben wird.

[0063] Die veränderten Modulationswerte bzw. die veränderten bzw. modifizierten Modulationsmatrizen werden an die inverse Filterbank 34 weitergeleitet, wodurch sich aus den modifizierten Modulationsmatrizen Matrizen von modifizierten Spektralwerten ergeben. Bei diesen modifizierten Spektralwerten ist noch die Phasenkorrektur rückgängig zu machen, die durch die Demodulation mittels des Mischers 212 herbeigeführt worden ist. Deshalb werden die von der inversen Filterbank 34 pro Teilband ausgegebenen Blöcke von modifizierten Spektralwerten mittels eines Mischers 218 mit einer Demodulationsträgerkomponente gemischt bzw. multipliziert, die zu derjenigen komplex konjugiert ist, die vor der Überführung in den Frequenz/Modulationsfrequenzbereich zur Demodulation durch den Mischer 212 für dieses Teilband verwendet worden ist, indem also eine Multiplikation dieser Blöcke mit e^j(w*m+ϕ) durchgeführt wird, wobei wiederum w den bestimmten Träger für das jeweilige Teilband angibt, m der Index für die modifizierten Spektralwerte ist und ϕ einen Phasenversatz des bestimmten Trägers zum betrachteten Zeitausschnitt der N Zeitblöcke für das jeweilige Teilband ist. Hierdurch wird der jeweilige Modulator für das jeweilige Teilband, der sich ja auf den Inhalt eines bestimmten Subbandblockes bezieht bzw. nach der Blockeinteilung durch die Modulation 212, 214 angewendet worden ist, vor der anschließenden Blockzusammenführung wieder invertiert.

[0064] Die so erhaltenen Spektralwerte liegen noch in Form von Blöcken, nämlich zu je einem Block von modifizierten Spektralwertblöcken pro Teilband vor und werden gegebenenfalls noch einer OLA bzw. Zusammenfügung zur Rückgängigmachung der Fensterung unterzogen, wie z.B. auf die bezugnehmend auf 34 von Fig. 1 beschriebene Weise. Die so erhaltenen ungefensterten Spektralwerte stehen dann als Ströme von modifizierten Spektralwerten pro Teilband zur Verfügung und stellen die Zeit/Frequenzbereichsdarstellung des wasserzeichenbehafteten Audiosignals dar. An den Ausgang des Mischers 218 schließen sich die inverse Filterbank 40 und die Fensterungseinrichtung 42 an, die die Überführung der Zeit/Frequenzbereichsdarstellung des wasserzeichenbehafteten Audiosignals in den Zeitbereich 22 übernehmen, wodurch sich am Ausgang 16 eine Folge von Audiowerten ergeben, die das wasserzeichenbehaftete Audiosignal darstellen.

[0065] Ein Vorteil der Vorgehensweise nach Fig. 4 bezüglich der Vorgehensweise nach Fig. 1 besteht darin, dass dadurch, dass Phase und Betrag zusammen zur Überführung in den Frequenz/Modulationsfrequenzbereich verwendet werden, keine Wiedereinführung von Modulationsanteilen bei der Rekombination von Phase und modifiziertem Betrags-Anteil hervorgerufen wird.

[0066] Ein Wasserzeichen-Decodierer, der geeignet ist, um das wasserzeichenbehaftete Audiosignal, wie es von dem Einbetter 210 ausgegeben wird, zu verarbeiten, um daraus das Wasserzeichen zu extrahieren, ist in Fig. 5 gezeigt. Der Decodierer, der allgemein mit 310 angezeigt ist, umfasst einen Eingang 312 zum Empfangen des wasserzeichenbehafteten Audiosignals und einen Ausgang 314 zum Ausgeben des extrahierten Wasserzeichens. An den Eingang 312 des Decodierers 310 schließen sich in Reihe geschaltet und in der Reihenfolge, wie sie im Folgenden genannt sind, eine Fensterungseinrichtung 318, eine Filterbank 320, ein Mischer 412 und eine Filterbank 328 an, wobei ein weiterer Eingang des Mischers 412 mit einem Ausgang einer Trägerfrequenzbestimmungseinrichtung 414 verbunden ist, die einen mit dem Ausgang der Filterbank 320 verbundenen Eingang aufweist. Die Komponenten 318, 320, 412, 328 und 414 erfüllen den selben Zweck und arbeiten auf die gleiche Weise wie die Komponenten 18, 20, 212, 28 und 214 des Einbetters 210. Auf diese Weise wird das wasserzeichenbehaftete Eingangssignal im Decodierer 310 vom Zeitbereich 322 über den Zeitfrequenzbereich 324 in den Frequenz/Modulationsfrequenzbereich 330 überführt, wo eine Wasserzeichen-Decodierungseinrichtung 332 die Frequenz/Modulationsfrequenzbereichsdarstellung des wasserzeichenbehafteten Audiosignals empfängt und verarbeitet, um das Wasserzeichen zu extrahieren und am Eingang 314 des Decodierers 310 auszugeben. Wie im Vorhergehenden erwähnt, unterscheiden sich die der Decodierungseinrichtung 332 im Decodierer 310 zugeführten Modulationsmatrizen um weniger als die der Dekodierungseinrichtung 132 zugeführten von denen der Einbettungseinrichtung 216 zugeführten in dem Ausführungsbeispiel von Fig. 1-3, da die Rekombination zwischen Phasenanteil und modifiziertem Betragsanteil im Einbettersystem von Fig. 4 wegfällt.

[0067] Die vorhergehenden Ausführungsbeispiele betrafen folglich eine bisher nicht da gewesene Verbindung der Themenbereiche "Teilbandmodulationsspektralanalyse" und "digitales Wasserzeichen" zu einem Gesamtsystem zur Einbringung von Wasserzeichen mit einem Einbettersystem auf der einen und einem Detektorsystem auf der anderen Seite. Das Einbettersystem dient zum Einbringen des Wasserzeichens. Es besteht aus einer Teilbandmodulationsspektralanalyse, einer Einbetterstufe, die eine Modifikation der durch die Analyse gewonnenen Signalrepräsentation vornimmt, und einer Synthese des Signals der modifizierten Repräsentation. Das Detektorsystem dient umgekehrt zur Erkennung eines vorhandenen Wasserzeichens in einem wasserzeichenbehafteten Audiosignal. Es besteht aus einer Teilbandmodulationsspektralanalyse und einer Detektionsstufe, die unter Verwendung der durch die Analyse gewonnenen Signalrepräsentation das Wasserzeichen erkennt und auswertet.

[0068] Im Hinblick auf die Auswahl derjenigen Stellen im Frequenz/Modulationsfrequenzbereich bzw. derjeniger Modulationswerte im Frequenz/Modulationsfrequenzbereich, die zur Wasserzeicheneinbettung bzw. Wasserzeichenextraktion herangezogen werden, wird darauf hingewiesen, dass diese Auswahl nach psychoakustischen Gesichtspunkten getroffen werden sollte, um zu gewährleisten, dass das Wasserzeichen bei Abspielen des wasserzeichenbehafteten Audiosginals unhörbar ist. Zur geeigneten Auswahl können Verdeckungseffekte im Modulationsspektralbereich ausgenutzt werden. Hierzu sei beispielsweise auf T. Houtgast: "Frequency Selectivity in Amplitude Modulation Detection", J. Acoust. Soc. Am. vol. 85, No. 4, April 1989 verwiesen, welche hiermit bezüglich der Auswahl unhörbar modifizierbarer Modulationswerte im Frequenz/Modulationsfrequenzbereich unter Bezugnahme aufgenommen wird.

[0069] Für ein näheres Verständnis der Modulationsspektralanalyse im allgemeinen sei noch auf folgende Veröffentlichungen verwiesen, die sich auf die Audiocodierung unter Verwendung einer Modulationstransformation beziehen, und bei denen das Signal durch eine Transformation in Frequenzbänder zerlegt wird, anschließend eine Zerlegung nach Betrag und Phase vorgenommen wird, und dann, während die Phase nicht weiterverarbeitet wird, die Beträge je Teilband über eine Anzahl von Transformationsblöcken in einer zweiten Transformation erneut transformiert werden. Ergebnis ist eine Frequenzzerlegung der zeitlichen Hüllkurve des betreffenden Teilbandes in "Modulationskoeffizienten". Diese weiterführenden Druckschriften umfassen den Artikel M. Vinton and L. Atlas, "A Scalable and Progressive Audio Codec," in Proceedings of the 2001 IEEE ICASSP, May 7-11, 2001, Salt Lake City, die US 2002/0176353A1 von Atlas et al mit dem Titel "Scalable And Perceptually Ranked Signal Coding And Decoding", den Artikel J. Thompson and L. Atlas, "A Non-uniform Modulation Transform for Audio Coding with Increased Time Resolution," in Proceedings of the 2003 IEEE ICASSP, April 6-10, Hong Kong, 2003, und den Artikel L. Atlas, "Joint Acoustic And Modulation Frequency", Journal on Applied Signal Processing 7 EURASIP, S. 668-675, 2003.

[0070] Die vorhergehenden Ausführungsbeispiele stellen lediglich exemplarische Möglichkeiten dar, um Audioaufnahmen mit unhörbaren und gegen Manipulation robusten Zusatzinformationen versehen zu können, und dabei die Wasserzeicheneinbringung im sogenannten Teilbandmodulationsspektralbereich vorzunehmen sowie die Detektierung im Teilbandmödulationsspektralbereich vorzunehmen. Jedoch können verschiedene Variationen an diesen Ausführungsbeispielen vorgenommen werden. Die im Vorhergehenden erwähnten Fensterungseinrichtungen könnten lediglich der Blockbildung dienen, d.h. die Multiplikation bzw. Gewichtung mit den Fensterfunktionen könnte auch entfallen. Ferner könnte man auch andere Fensterfunktionen als die im Vorhergehenden erwähnten Beträge von trigonometrischen Funktionen verwenden. Auch die 50%-Blocküberlappung könnte entfallen oder anders ausgeführt sein. Dementsprechend könnte auch die Blocküberlappung auf Seiten der Sythese andere Operationen als eine reine Addition zusammengehörender Audiowerte in aufeinander folgenden Zeitblöcken umfassen. Auch die Fensterungen bei der zweiten Transformationsstufe könnten auf entsprechende Weise variiert werden.

[0071] Es wird ferner darauf hingewiesen, dass die Audiosignaleinbringung nicht unbedingt vom Zeitbereich in die Frequenz/Modulationsfrequenzbereichsdarstellung und von dort wieder - nach der Modifikation - in die Zeitbereichsdarstellung zurückführen muss. Es wäre ferner möglich, dass die beiden vorhergehenden Ausführungsbeispiele dahin gehend modifiziert werden, dass die Werte, wie sie von der Rekombinationseinrichtung 38 bzw. dem Mischer 218 ausgegeben werden, zu einem wasserzeichenbehafteten Audiosignal in einem Bitstrom vereinigt werden, um in einem Zeit/Frequenzbereich vorzuliegen.

[0072] Ferner könnte die im zweiten Ausführungsbeispiel verwendete Demodulation auch anders ausgeführt sein, z.B. durch Veränderung der Phasenverläufe der Spektralwertblöcke innerhalb der Matrizen 68 durch andere Maßnahmen als durch reine Multiplikation mit einem festen komplexen Träger.

[0073] In Bezug auf die vorhergehenden Ausführungsbeispiele für mögliche Decodierer, die bezugnehmend auf Figuren 3 und 5 erläutert worden sind, wird darauf hingewiesen, dass aufgrund der Übereinstimmung der zwischen der Wasserzeichen-Decodierungseinrichtung und dem Eingang angeordneten Blöcke mit den entsprechenden aus dem zugehörigen Einbetter alle Variationsmöglichkeiten, die im Hinblick auf den Einbetter in Bezug auf diese Einrichtungen beschrieben wurden, auf dieselbe Weise auf die Wasserzeichen-Decodierer von Fig. 3 und 5 zutreffen.

[0074] Es wird noch darauf hingewiesen, dass sich vorhergehenden Ausführungsbeispiele zwar ausschließlich auf die Wasserzeicheneinbettung in Hinblick auf Audiosignale bezog, dass das vorliegende Wasserzeicheneinbettungsschema aber auch auf andere Informationssignale anwendbar ist, wie z.B. auf Steuersignale, Messsignale, Videosignale oder dergleichen, um dieselben beispielsweise auf ihre Authentizität zu überprüfen. In all diesen Fällen ist es durch das vorliegend vorgeschlagene Schema möglich, die Einbettung von Informationen derart vorzunehmen, dass sie die üblichen Nutzung des Informationssignals in der wasserzeichenbehafteten Form nicht beeinträchtigt, wie z.B. die Analyse des Messergebnisse oder den optischen Eindruck des Videos oder dergleichen, weshalb auch in diesen Fällen die einzubettenden Zusatzdaten als Wasserzeichen bezeichnet werden.

[0075] Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Schema auch in Software implementiert sein kann. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.

Ansprüche

1. Vorrichtung zum Einbringen eines Wasserzeichens in ein Informationssignal, mit
einer Einrichtung (18, 20, 26, 28; 18, 20, 212, 214, 28) zum Überführen des Informationssignals von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30);
einer Einrichtung (32; 216) zum Modifizieren des Informationssignals in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen, um eine modifizierte Spektral/Modulationsspektraldarstellung zu erhalten; und
einer Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden eines wasserzeichenbehafteten Informationssignals basierend auf der modifizierten Spektral/Modulationsspektraldarstellung.

2. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung zum Überführen in die Spektral/Modulationsspektraldarstellung folgende Merkmale aufweist:

eine Einrichtung (18, 20) zum Überführen des Informationssignals in eine Zeit/Spektraldarstellung durch blockweises Transformieren des Informationssignals; und

eine Einrichtung (26, 28; 212, 214, 28) zum Überführen des Informationssignals von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung.

3. Vorrichtung gemäß Anspruch 2, bei der die Einrichtung (18, 20) zum Überführen des Informationssignals in eine Zeit/Spektraldarstellung ausgebildet ist, um die Zeit/Spektraldarstellung in eine Mehrzahl von Spektralkomponenten zu zerlegen, um pro Spektralkomponente eine Folge von Spektralwerten zu erhalten, und die Einrichtung (26, 28; 212, 214, 28) zum Überführen des Informationssignals von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung eine Einrichtung (26, 28; 212, 214, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten aufweist, um einen Teil der Spektral/Modulationsspektraldarstellung zu erhalten.

4. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (212, 214, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten ausgebildet ist, um die Folge von Spektralwerten blockweise zunächst mit einem komplexen Träger zu multiplizieren (212), derart, dass sich ein Betrag einer mittleren Steigung eines Phasenverlaufs der Folge von Spektralwerten verringert, um demodulierte Blöcke von Spektralwerten zu erhalten, und die demodulierten Blöcke von Spektralwerten dann blockweise spektral zu zerlegen (28), um den Teil der modifizierten Spektral/Modulationsspektraldarstellung zu erhalten.

5. Vorrichtung gemäß Anspruch 4, bei der die Einrichtung (212, 214, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten eine Einrichtung (214) zum, abhängig von der Zeit/Spektraldarstellung des Informationssignals, blockweise Variieren des komplexen Trägers aufweist, mit dem die Folge von Spektralwerten multipliziert wird.

6. Vorrichtung gemäß Anspruch 5, bei der die Einrichtung (214) zum Variieren ausgebildet ist, um zum blockweisen Variieren des komplexen Trägers blockweise Phasen der Spektralwerte in der Folge von Spektralwerten zu unwrappen, um einen Phasenverlauf zu erhalten, eine mittlere Steigung des Phasenverlaufs zu bestimmen und basierend auf der mittleren Steigung den komplexen Träger zu bestimmen.

7. Vorrichtung gemäß Anspruch 6, bei der die Einrichtung (214) zum Variieren ferner ausgebildet ist, um aus dem Phasenverlauf einen Achsenabschnitt des Phasenverlaufs zu bestimmen und den komplexen Träger ferner basierend auf dem Achsenabschnitt zu bestimmen.

8. Vorrichtung gemäß einem der Ansprüche 4 bis 7, bei der die Einrichtung (34, 218, 40, 42) zum Bilden des wasserzeichenbehafteten Informationssignals folgende Einrichtungen aufweist:

eine Einrichtung (34) zum Rücküberführen des Informationssignals von der modifizierten Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung, um modifizierte demodulierte Blöcke von Spektralwerten für die vorbestimmte Spektralkomponente zu erhalten; und

eine Einrichtung (218) zum blockweisen Multiplizieren der modifizierten demodulierten Blöcke von Spektralwerten mit einem zu dem komplexen Träger komplex konjugierten Träger, um modifizierte Blöcke von Spektralwerten zu erhalten; und

eine Einrichtung zum Zusammenfügen der modifizierten demodulierte Blöcke von Spektralwerten zu einer modifizierten Folge von Spektralwerten, um einen Teil einer Zeit/Spektraldarstellung des wasserzeichenbehafteten Informationssignals zu erhalten.

9. Vorrichtung gemäß Anspruch 8, bei der die Einrichtung zum Bilden ferner folgendes Merkmal aufweist:

eine Einrichtung zum Rücküberführen des wasserzeichenbehafteten Informationssignals von der Zeit-/Spektraldarstellung in die Zeitdarstellung.

10. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung (26, 28) zum, für eine vorbestimmte Spektralkomponente, blockweisen spektralen Zerlegen der Folge von Spektralwerten ausgebildet ist, um die Folge von Spektralwerten zunächst einer Betragsbildung (26) zu unterziehen, um eine Folge von Beträgen von Spektralwerten zu erhalten, und die Folge von Beträgen von Spektralwerten dann blockweise in die Modulationsspektraldarstellung zu transformieren (28), um den Teil der Spektral/Modulationsspektraldarstellung zu erhalten.

11. Vorrichtung gemäß Anspruch 10, bei der die Einrichtung (34, 218, 40, 42) zum Bilden des wasserzeichenbehafteten Informationssignals folgende Einrichtungen aufweist:

eine Einrichtung (34) zum Rücküberführen des Informationssignals von der modifizierten Spektral/Modulationsspektraldarstellung in eine modifizierte Zeit/Spektraldarstellung, um eine modifizierte Folge von Spektralwerten für die vorbestimmte Spektralkomponente zu erhalten; und

eine Einrichtung (38) zum Rekombinieren der modifizierten Folge von Spektralwerten mit auf Phasen der Folge von Spektralwerten basierenden Phasen, um einen Teil einer Zeit/Spektraldarstellung des wasserzeichenbehafteten Informationssignals zu erhalten.

12. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung (18, 20) zum Überführen des Informationssignals von der Zeitdarstellung in die Spektral/Modulationsspektraldarstellung folgende Merkmale aufweist:

eine Blockbildungseinrichtung (18) zur Bildung einer Folge von Blöcken von Informationswerten aus dem Informationssignal; und

eine Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten, um eine Folge von Spektralwertblöcken zu erhalten, wobei jeder Spektralwertblock einen Spektralwert für jede einer vorbestimmten Mehrzahl von Spektralkomponenten aufweist, so dass die Folge von Spektralwertblöcken pro Spektralkomponente eine Folge von Spektralwerten bildet; und

eine Einrichtung (26, 28; 212, 214, 28) zum spektralen Zerlegen einer vorbestimmten Folge der Folgen, um einen Block von Modulationswerten zu erhalten,

wobei die Einrichtung (32, 216) zum Modifizieren ausgebildet ist, um den Block von Modulationswerten abhängig von dem einzubringenden Wasserzeichen zu modifizieren, um einen modifizierten Block von Modulationswerten zu erhalten, und die Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden ausgebildet ist, um das wasserzeichenbehaftete Informationssignal basierend auf dem modifizierten Block von Modulationswerten zu bilden.

13. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (34, 38, 40, 42; 34, 218, 40, 42) zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (34, 38; 34, 218), um eine modifizierte Folge von Spektralwerten zu erhalten, und eine Folge von modifizierten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (40), um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (42), um das wasserzeichenbehaftete Informationssignal zu erhalten.

14. Vorrichtung gemäß einem der Ansprüche 12 bis 13, bei der die Blockbildungseinrichtung (18) ausgebildet ist, um die Blöcke von Informationswerten derart aus dem Informationssignal zu extrahieren, dass die Blöcke von Informationswerten sich gegenseitig um die Hälfte überlappenden aufeinanderfolgenden Zeitabschnitten des Informationssignals zugeordnet sind, und die Einrichtung (42) zum Bilden ausgebildet ist, um beim Zusammenfügen die modifizierten Zeitblöcke gegenseitig um die Hälfte zu überlappen und zueinander ausgerichtete Informationswerte benachbarter Informationsblöcke zu kombinieren.

15. Vorrichtung gemäß einem der Ansprüche 12 bis 14, bei der die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten derart ausgebildet ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen Spektralwerten liefert, und die Einrichtung (26, 28) zum spektralen Zerlegen der vorbestimmten Folge der Folgen von Spektralwerten ausgebildet ist, um lediglich die Beträge der komplexen Spektralwerte spektral zu zerlegen (28), um den Block von Modulationswerten zu erhalten.

16. Vorrichtung gemäß Anspruch 15, bei der die Einrichtung zum Bilden ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen (34), um eine modifizierte Folge von Spektralwerten zu erhalten, Phasen der Folge von komplexen Spektralwerten abhängig von der Modifikation durch die Einrichtung zum Modifizieren anzupassen (36), um eine Folge von angepassten Phasenwerten zu erhalten, die Folge von angepassten Phasenwerten mit der modifizierten Folge von Spektralwerten zu rekombinieren (38), um eine rekombinierte modifizierte Folge von Spektralwerten zu erhalten, und eine Folge von modifizierten Spektralwertblöcken rückzuüberführen (40), die auf der rekombinierten modifizierten Folge von Spektralwerten basiert, um die modifizierten Blöcke von Informationswerten zu erhalten.

17. Vorrichtung gemäß Anspruch 12, bei der die Einrichtung (20) zum spektralen Zerlegen jedes der Folge von Blöcken von Informationswerten derart ausgebildet ist, dass sie bei der spektralen Zerlegung pro Spektralkomponente eine Folge von komplexen Spektralwerten liefert, und die Einrichtung (212, 214, 28) zum Überführen der vorbestimmten der Folgen von Spektralwerten in die Spektral/Modulationsspektraldarstellung ausgebildet ist, um zunächst die Folge von Spektralwerten derart zu manipulieren (212), dass eine Phase der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert wird, um eine phasenmanipulierte Folge von Spektralwerten zu erhalten, und dann die phasenmanipulierte Folge von Spektralwerten spektral zu zerlegen (28), um den zumindest einen Block von Modulationswerten zu erhalten, und die Einrichtung zum Bilden (34, 218, 40, 42) ausgebildet ist, um den modifizierten Block von Modulationswerten von der spektralen Zerlegung rückzuüberführen, um eine modifizierte Folge von Spektralwerten zu erhalten, die modifizierte Folge von Spektralwerten umgekehrt zu der Einrichtung (212) zum spektralen Zerlegen der vorbestimmten der Folgen von Spektralwerten derart zu manipulieren (218), dass eine Phase der Spektralwerte der zumindest einen Folge von Spektralwerten um einen mit der Folge stetig größer werdenden oder kleiner werdenden Betrag vergrößert oder verkleinert wird, um eine manipulierte Folge von Spektralwerten zu erhalten, eine Folge von modifizierten Spektralblöcken, die auf der modifizierten Folge von Spektralwerten basiert, rückzuüberführen (40), um eine Folge von modifizierten Blöcken von Informationswerten zu erhalten, und die modifizierten Blöcke von Informationswerten zusammenzufügen (42), um das wasserzeichenbehaftete Informationssignal zu erhalten.

18. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren angepasst ist, um die Modifikation an Stellen der Spektral/Modulationsspektraldarstellung vorzunehmen, die zeitlich variieren.

19. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren angepasst ist, um die Modifikation abhängig von dem Informationssignal vorzunehmen.

20. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung (32; 216) zum Modifizieren angepasst ist, um die Modifikation derart vorzunehmen, dass aufgrund von psychoakustischen Verdeckungseffekten die Modifikation nicht zu einer hörbaren Veränderung des wasserzeichenbehafteten Informationssignals führt.

21. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der das Wasserzeichen eine Urheberinformation, eine das Informationssignal kennzeichnende Kennnummer oder eine Kundennummer anzeigt.

22. Vorrichtung zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, mit einer Einrichtung (118, 120, 126, 128; 318, 320, 414, 412, 328) zum Überführen des wasserzeichenbehafteten Informationssignals von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung;
einer Einrichtung (132; 332) zum Herleiten des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarstellung.

23. Verfahren zum Einbringen eines Wasserzeichens in ein Informationssignal, mit
Überführen (18, 20, 26, 28; 18, 20, 212, 214, 28) des Informationssignals von einer Zeitdarstellung (22) in eine Spektral/Modulationsspektraldarstellung (30);
Modifizieren (32; 216) des Informationssignals in der Spektral/Modulationsspektraldarstellung abhängig von dem einzubringenden Wasserzeichen, um eine modifizierte Spektral/Modulationsspektraldarstellung zu erhalten; und
Bilden (34, 38, 40, 42; 34, 218, 40, 42) eines wasserzeichenbehafteten Informationssignals basierend auf der modifizierten Spektral/Modulationsspektraldarstellung.

24. Verfahren zum Extrahieren eines Wasserzeichens aus einem wasserzeichenbehafteten Informationssignal, mit
Überführen (118, 120, 126, 128; 318, 320, 414, 412, 328) des wasserzeichenbehafteten Informationssignals von einer Zeitdarstellung in eine Spektral/Modulationsspektraldarstellung;
Herleiten (132; 332) des Wasserzeichens basierend auf der Spektral/Modulationsspektraldarstellung.

25. Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 23 oder 24, wenn das Computer-Programm auf einem Computer abläuft.

Claims

1. A device for introducing a watermark into an information signal, comprising:

means (18, 20, 26, 28; 18, 20, 212, 214, 28) for transferring the information signal from a time representation (22) to a spectral/modulation spectral representation (30);

means (32; 216) for modifying the information signal in the spectral/modulation spectral representation in dependence on the watermark to be introduced to obtain a modified spectral/modulation spectral representation; and

means (34, 38, 40, 42; 34, 218, 40, 42) for forming an information signal provided with a watermark based on the modified spectral/modulation spectral representation.

2. The device according to claim 1, wherein the means for transferring to the spectral/modulation spectral representation comprises:

means (18, 20) for transferring the information signal to a time/spectral representation by transforming the information signal block by block; and

means (26, 28; 212, 214, 28) for transferring the information signal from the time/spectral representation to the spectral/modulation spectral representation.

3. The device according to claim 2, wherein the means (18, 20) for transferring the information signal to a time/spectral representation is formed to divide the time/spectral representation to a plurality of spectral components to obtain a sequence of spectral values per spectral component, and the means (26, 28; 212, 214, 28) for transferring the information signal from the time/spectral representation to the spectral/modulation spectral representation comprises means (26, 28; 212, 214, 28) for, for a predetermined spectral component, spectrally dividing the sequence of spectral values block by block to obtain a part of the spectral/modulation spectral representation.

4. The device according to claim 3, wherein the means (212, 214, 28) for, for a predetermined spectral component, spectrally dividing the sequence of spectral values block by block is formed to at first multiply (212) the sequence of spectral values block by block by a complex carrier such that a magnitude of a mean slope of a phase form of the sequence of spectral values decreases to obtain demodulated blocks of spectral values, and to then spectrally divide (28) the demodulated blocks of spectral values block by block to obtain the part of the modified spectral/modulation spectral representation.

5. The device according to claim 4, wherein the means (212, 214, 28) for, for a predetermined spectral component, spectrally dividing the sequence of spectral values block by block comprises means (214) for, depending on the time/spectral representation of the information signal, varying block by block the complex carrier by which the sequence of spectral values is multiplied.

6. The device according to claim 5, wherein the means (214) for varying is formed to unwrap phases of the spectral values in the sequence of spectral values block by block for varying the complex carrier block by block to obtain a phase form, to determine a mean slope of the phase form and to determine the complex carrier based on the mean slope.

7. The device according to claim 6, wherein the means (214) for varying is further formed to determine an axis portion of the phase form from the phase form and to determine the complex carrier additionally based on the axis portion.

8. The device according to one of claims 4 to 7, wherein the means (34, 218, 40, 42) for forming the information signal provided with a watermark comprises:

means (34) for retransferring the information signal from the modified spectral/modulation spectral representation to a modified time/spectral representation to obtain modified demodulated blocks of spectral values for the predetermined spectral component; and

means (218) for multiplying the modified demodulated blocks of spectral values block by block by a carrier being a complex conjugate to the complex carrier to obtain modified blocks of spectral values; and

means for uniting the modified demodulated blocks of spectral values to form a modified sequence of spectral values to obtain a part of a time/spectral representation of the information signal provided with a watermark.

9. The device according to claim 8, wherein the means for forming further comprises:

means for retransferring the information signal provided with a watermark from the time/spectral representation to the time representation.

10. The device according to claim 3, wherein the means (26, 28) for, for a predetermined spectral component, spectrally dividing the sequence of spectral values block by block is formed to at first subject the sequence of spectral values to a magnitude calculation (26) to obtain a sequence of magnitudes of spectral values, and to then transform the sequence of magnitudes of spectral values block by block to the modulation spectral representation (28) to obtain the part of the spectral/modulation spectral representation.

11. The device according to claim 10, wherein the means (34, 218, 40, 42) for forming the information signal provided with a watermark comprises:

means (34) for retransferring the information signal from the modified spectral/modulation spectral representation to a modified time/spectral representation to obtain a modified sequence of spectral values for the predetermined spectral component; and

means (38) for recombining the modified sequence of spectral values with phases which are based on phases of the sequence of spectral values to obtain a part of a time/spectral representation of the information signal provided with a watermark.

12. The device according to claim 1, wherein the means (18, 20) for transferring the information signal from the time representation to the spectral/modulation spectral representation comprises:

block forming means (18) for forming a sequence of blocks of information values from the information signal; and

means (20) for spectrally dividing each of the sequence of blocks of information values to obtain a sequence of spectral value blocks, each spectral value block comprising a spectral value for each of a predetermined plurality of spectral components so that the sequence of spectral value blocks forms a sequence of spectral values per spectral component; and

means (26, 28; 212, 214, 28) for spectrally dividing a predetermined sequence of the sequences to obtain a block of modulation values,

wherein the means (32, 216) for modifying is formed to modify the block of modulation values in dependence on the watermark to be introduced to obtain a modified block of modulation values, and the means (34, 38, 40, 42; 34, 218, 40, 42) for forming is formed to form the information signal provided with a watermark based on the modified block of modulation values.

13. The device according to claim 12, wherein the means (34, 38, 40, 42; 34, 218, 40, 42) for forming is formed to retransfer the modified block of modulation values from the spectral division (34, 38; 34, 218) to obtain a modified sequence of spectral values, and to retransfer (40) a sequence of modified spectral blocks which is based on the modified sequence of spectral values to obtain a sequence of modified blocks of information values, and to unite (42) the modified blocks of information values to obtain the information signal provided with a watermark.

14. The device according to claims 12 or 13, wherein the block forming means (18) is formed to extract the blocks of information values from the information signal such that the blocks of information values are associated to successive time sections of the information signal overlapping one another by one half, and the means (42) for forming is formed to, when uniting, overlap the modified time blocks to one another by one half and combine aligned information values of neighboring information blocks.

15. The device according to one of claims 12 to 14, wherein the means (20) for spectrally dividing each of the sequence of blocks of information values is formed such that it provides a sequence of complex spectral values per spectral component when spectrally dividing, and the means (26, 28) for spectrally dividing the predetermined sequence of the sequences of spectral values is formed to only spectrally divide (28) the magnitudes of the complex spectral values to obtain the block of modulation values.

16. The device according to claim 15, wherein the means for forming is formed to retransfer (34) the modified block of modulation values from the spectral division to obtain a modified sequence of spectral values, to adjust (36) phases of the sequence of complex spectral values in dependence on the modification by the means for modifying to obtain a sequence of adjusted phase values, to recombine (38) the sequence of adjusted phase values with the modified sequence of spectral values to obtain a recombined modified sequence of spectral values, and to retransfer (40) a sequence of modified spectral value blocks which is based on the recombined modified sequence of spectral values to obtain the modified blocks of information values.

17. The device according to claim 12, wherein the means (20) for spectrally dividing each of the sequence of blocks of information values is formed such that it provides a sequence of complex spectral values per spectral component when spectrally dividing, and the means (212, 214, 28) for transferring the predetermined ones of the sequences of spectral values to the spectral/modulation spectral representation is formed to at first manipulate (212) the sequence of spectral values such that a phase of the spectral values of the at least one sequence of spectral values is increased or decreased by a magnitude continually increasing with the sequence or decreasing to obtain a phase-manipulated sequence of spectral values, and to then spectrally divide (28) the phase-manipulated sequence of spectral values to obtain the at least one block of modulation values, and the means for forming (34, 218, 40, 42) is formed to retransfer the modified block of modulation values from the spectral division to obtain a modified sequence of spectral values, to manipulate (218) the modified sequence of spectral values conversely to the means (212) for spectrally dividing the predetermined ones of the sequences of spectral values such that a phase of the spectral values of the at least one sequence of spectral values is increased or decreased by a magnitude continuously increasing with the sequence or decreasing to obtain a manipulated sequence of spectral values, to retransfer (40) a sequence of modified spectral blocks which is based on the modified sequence of spectral values to obtain a sequence of modified blocks of information values, and to unite (42) the modified blocks of information values to obtain the information signal provided with a watermark.

18. The device according to one of the preceding claims, wherein the means (32; 216) for modifying is adjusted to perform the modification at locations of the spectral/modulation spectral representation varying in time.

19. The device according to one of the preceding claims, wherein the means (32; 216) for modifying is adjusted to perform modification in dependence on the information signal.

20. The device according to one of the preceding claims, wherein the means (32; 216) for modifying is adjusted to perform the modification, such that, due to psychoacoustic masking effects, the modification does not result in an audible alteration of the information signal provided with a watermark.

21. The device according to one of the preceding claims, wherein the watermark indicates author information, an identification number characterizing the information signal or a customer number.

22. A device for extracting a watermark from an information signal provided with a watermark, comprising:

means (118, 120, 126, 128; 318, 320, 414, 412, 328) for transferring the information signal provided with a watermark from a time representation to a spectral/modulation spectral representation;

means (132; 332) for deriving the watermark based on the spectral/modulation spectral representation.

23. A method for introducing a watermark into an information signal, comprising:

transferring (18, 20, 26, 28; 18, 20, 212, 214, 28) the information signal from a time representation (22) to a spectral/modulation spectral representation (30);

modifying (32; 216) the information signal in the spectral/modulation spectral representation in dependence on the watermark to be introduced to obtain a modified spectral/modulation spectral representation; and

forming (34, 38, 40, 42; 34, 218, 40, 42) an information signal provided with a watermark based on the modified spectral/modulation spectral representation.

24. A method for extracting a watermark from an information signal provided with a watermark, comprising:

transferring (118, 120, 126, 128; 318, 320, 414, 412, 328) the information signal provided with a watermark from a time representation to a spectral/modulation spectral representation;

deriving (132; 332) the watermark based on the spectral/modulation spectral representation.

25. A computer program having a program code for performing the method according to claims 23 or 24 when the computer program runs on a computer.

Revendications

1. Dispositif pour incorporer un filigrane dans un signal d'information, avec
un moyen (18, 20, 26, 28; 18, 20, 212, 214, 28) pour transposer le signal d'information d'une représentation temporelle (22) dans une représentation spectrale/spectrale à modulation (30);
un moyen (32; 216) destiné à modifier le signal d'information dans la représentation spectrale/spectrale à modulation en fonction du filigrane à incorporer, pour obtenir une représentation spectrale/ spectrale à modulation modifiée; et
un moyen (34, 38, 40, 42; 34, 218, 40, 42) destiné à former un signal d'information contenant un filigrane sur base de la représentation spectrale/spectrale à modulation.

2. Dispositif selon la revendication 1, dans lequel le moyen destiné à transposer dans la représentation spectrale/spectrale à modulation présente les caractéristiques suivantes:

un moyen (18, 20) destiné à transposer le signal d'information dans une représentation temporelle/spectrale par transformation par bloc du signal d'information; et

un moyen (26, 28; 212, 214, 28) destiné à transposer le signal d'information de la représentation temporelle/spectrale dans la représentation spectrale/spectrale à modulation.

3. Dispositif selon la revendication 2, dans lequel le moyen (18, 20) destiné à transposer le signal d'information dans une représentation temporelle/spectrale est réalisé pour décomposer la représentation temporelle/spectrale en une pluralité de composantes spectrales, pour obtenir, par composante spectrale, une succession de valeurs spectrales, et le moyen (26, 28; 212, 214, 28) destiné à transposer le signal d'information de la représentation temporelle/ spectrale dans la représentation spectrale/spectrale à modulation présente un moyen (26, 28; 212, 214, 28) destiné à décomposer de manière spectrale par bloc, pour une composante spectrale déterminée, la succession de valeurs spectrales, pour obtenir une partie de la représentation spectrale/spectrale à modulation.

4. Dispositif selon la revendication 3, dans lequel le moyen (212, 214, 28) destiné à décomposer de manière spectrale par bloc, pour une composante spectrale prédéterminée, la succession de valeurs spectrales est réalisé pour tout d'abord multiplier par bloc (212) la succession de valeurs spectrales par un support complexe, de sorte qu'une quantité d'une montée moyenne d'une évolution de phase de la succession de valeurs spectrales diminue, pour obtenir des blocs démodulés de valeurs spectrales, et ensuite décomposer de manière spectrale par bloc (28) les blocs démodulés de valeurs spectrales, pour obtenir la partie de la représentation spectrale/spectrale à modulation modifiée.

5. Dispositif selon la revendication 4, dans lequel le moyen (212, 214, 28) destiné à décomposer de manière spectrale par bloc, pour une composante spectrale prédéterminée, la succession de valeurs spectrales présente un moyen (214) pour faire varier par bloc, en fonction de la représentation temporelle/spectrale du signal d'information, le support complexe par lequel est multipliée la succession de valeurs spectrales.

6. Dispositif selon la revendication 5, dans lequel le moyen (214) destiné à faire varier est réalisé pour dévoiler, pour faire varier par bloc le support complexe, les phases des valeurs spectrales dans la succession de valeurs spectrales, pour obtenir une évolution de phases, pour déterminer une montée moyenne de l'évolution de phases et pour déterminer, sur base de la montée moyenne, le support complexe.

7. Dispositif selon la revendication 6, dans lequel le moyen (214) pour faire varier est par ailleurs réalisé pour déterminer, à partir de l'évolution de phases, un segment d'axe de l'évolution de phases et pour déterminer le support complexe par ailleurs sur base du segment d'axe.

8. Dispositif selon l'une des revendications 4 à 7, dans lequel le moyen (34, 218, 40, 42) destiné à former le signal d'information contenant un filigrane présente les moyens suivants:

un moyen (34) destiné à retransposer le signal d'information de la représentation spectrale/spectrale à modulation modifiée dans une représentation temporelle/spectrale modifiée, pour obtenir des blocs démodulés de valeurs spectrales pour la composante spectrale prédéterminée; et

un moyen (218) destiné à multiplier par bloc les blocs démodulés modifiés de valeurs spectrales par un support conjugué complexe par rapport au support complexe, pour obtenir des blocs modifiés de valeurs spectrales; et

un moyen destiné à regrouper les blocs démodulés modifiés de valeurs spectrales en une succession modifiée de valeurs spectrales, pour obtenir une partie d'une représentation temporelle/spectrale du signal d'information contenant un filigrane.

9. Dispositif selon la revendication 8, dans lequel le moyen destiné à former présente par ailleurs la caractéristique suivante:

un moyen pour retransposer le signal d'information contenant un filigrane de la représentation temporelle/spectrale dans la représentation temporelle.

10. Dispositif selon la revendication 3, dans lequel le moyen (26, 28) destiné à décomposer de manière spectrale par bloc, pour une composante spectrale prédéterminée, la succession de valeurs spectrales est réalisé pour tout d'abord soumettre la succession de valeurs spectrales à une formation de quantités (26), pour obtenir une succession de quantités de valeurs spectrales, et pour transformer (28) ensuite la succession de quantités de valeurs spectrales par bloc dans la représentation spectrale à modulation, pour obtenir la partie de la représentation spectrale/spectrale à modulation.

11. Dispositif selon la revendication 10, dans lequel le moyen (34, 218, 40, 42) destiné à former le signal d'information contenant un filigrane présente les moyens suivants:

un moyen (34) destiné à retransposer le signal d'information de la représentation spectrale/spectrale à modulation modifiée en une représentation temporelle/spectrale modifiée, pour obtenir une succession modifiée de valeurs spectrales pour la composante spectrale prédéterminée; et

un moyen (38) destiné à recombiner la succession modifiée de valeurs spectrales avec des phases basées sur des phases de la succession de valeurs spectrales, pour obtenir une partie d'une représentation temporelle/spectrale du signal d'information contenant un filigrane.

12. Dispositif selon la revendication 1, dans lequel le moyen (18, 20) destiné à transposer le signal d'information de la représentation temporelle dans la représentation spectrale/spectrale à modulation présente les caractéristiques suivantes:

un moyen de formation de blocs (18) destiné à former une succession de blocs de valeurs d'information à partir du signal d'information; et

un moyen (20) destiné à décomposer de manière spectrale chaque succession de blocs de valeurs d'information, pour obtenir une succession de blocs de valeurs spectrales, chaque bloc de valeurs spectrales présentant une valeur spectrale pour chaque pluralité prédéterminée de composantes spectrales, de sorte que la succession de blocs de valeurs spectrales forme, par composante spectrale, une succession de valeurs spectrales; et

un moyen (26, 28; 212, 214, 28) destiné à décomposer de manière spectrale une succession prédéterminée parmi les successions, pour obtenir un bloc de valeurs de modulation,

le moyen (32, 216) destiné à modifier étant réalisé pour modifier le bloc de valeurs de modulation en fonction du filigrane à incorporer, pour obtenir un bloc modifié de valeurs de modulation, et le moyen (34, 38, 40, 42; 34, 218, 40, 42) destiné à former étant réalisé pour former le signal d'information contenant un filigrane sur base du bloc modifié de valeurs de modulation.

13. Dispositif selon la revendication 12, dans lequel le moyen (34, 38, 40, 42; 34, 218, 40, 42) destiné à former est réalisé pour transformer inversement le bloc modifié de valeurs de modulation de la décomposition spectrale (34, 38; 34, 218), pour obtenir une succession modifiée de valeurs spectrales, et pour transposer inversement une succession de blocs spectraux modifiés qui se base sur la succession de valeurs spectrales modifiées (40), pour obtenir une succession de blocs modifiés de valeurs d'information, et pour regrouper (42) les blocs modifiés de valeurs d'information pour obtenir le signal d'information contenant un filigrane.

14. Dispositif selon l'une des revendications 12 à 13, dans lequel le moyen de formation de blocs (18) est réalisé pour extraire les blocs de valeurs d'information du signal d'information de sorte que les blocs de valeurs d'information soient associés mutuellement l'un à l'autre pour la moitié des segments temporels successifs se recouvrant du signal d'information, et le moyen (42) destiné à former est réalisé pour recouvrir, lors du regroupement, les blocs temporels modifiés réciproquement de la moitié et pour combiner les valeurs d'information orientées l'une vers l'autre de blocs d'information adjacents.

15. Dispositif selon l'une des revendications 12 à 14, dans lequel le moyen (20) destiné à décomposer de manière spectrale chaque succession de blocs de valeurs d'information est réalisé de sorte qu'il fournisse, lors de la décomposition spectrale, par composante spectrale une succession de valeurs spectrales complexes, et le moyen (26, 28) destiné à décomposer de manière spectrale la succession prédéterminée parmi les successions de valeurs spectrales est réalisé pour ne décomposer (28) spectralement que les quantités de valeurs spectrales complexes pour obtenir le bloc de valeurs de modulation.

16. Dispositif selon la revendication 15, dans lequel le moyen destiné à former est réalisé pour retransposer (34) le bloc modifié de valeurs de modulation de la décomposition spectrale, pour obtenir une succession modifiée de valeurs spectrales, pour adapter les phases de la succession de valeurs spectrales complexes en fonction de la modification par le moyen destiné à modifier (36), pour obtenir une succession de valeurs de phase adaptées, pour recombiner (38) la succession de valeurs de phase adaptées avec la succession modifiée de valeurs spectrales, pour obtenir une succession modifiée recombinée de valeurs spectrales, et pour retransposer (40) une succession de blocs de valeurs spectrales modifiés qui est basée sur la succession modifiée recombinée de valeurs spectrales, pour obtenir les blocs modifiés de valeurs d'information.

17. Dispositif selon la revendication 12, dans lequel le moyen (20) destiné à décomposer de manière spectrale chaque succession de blocs de valeurs d'information est réalisé de sorte qu'il fournisse, lors de la décomposition spectrale, par composante spectrale une succession de valeurs spectrales complexes, et le moyen (212, 214, 28) destiné à transposer la prédéterminée parmi les successions de valeurs spectrales dans la représentation spectrale/spectrale à modulation est réalisé pour tout d'abord manipuler la succession de valeurs spectrales (212) de sorte qu'une phase de valeurs spectrales de l'au moins une succession de valeurs spectrales augmente ou diminue d'une quantité augmentant ou diminuant en continu avec la succession, pour obtenir une succession à phases manipulées de valeurs spectrales, et pour décomposer (28) ensuite la succession à phases manipulées de valeurs spectrales, pour obtenir l'au moins un bloc de valeurs de modulation, et le moyen destiné à former (34, 218, 40, 42) est réalisé pour retransposer le bloc modifié de valeurs de modulation de la décomposition spectrale, pour obtenir une succession modifiée de valeurs spectrales, pour manipuler la succession modifiée de valeurs spectrales inversement au moyen (212) destiné à décomposer de manière spectrale la prédéterminée parmi les successions de valeurs spectrales (218) de sorte qu'une phase des valeurs spectrales de l'au moins une succession de valeurs spectrales soit augmentée ou diminuée d'une quantité augmentant au diminuant en continu avec la succession, pour obtenir une succession manipulée de valeurs spectrales, pour retransposer (40) une succession de blocs spectraux modifiés basée sur la succession modifiée de valeurs spectrales, pour obtenir une succession de blocs modifiés de valeurs d'information, et pour regrouper (42) les blocs modifiés de valeurs d'information pour obtenir le signal d'information contenant un filigrane.

18. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216) destiné à modifier est adapté pour procéder à la modification à des endroits de la représentation spectrale/spectrale à modulation qui varient dans le temps.

19. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216) destiné à modifier est adapté pour procéder à la modification en fonction du signal d'information.

20. Dispositif selon l'une des revendications précédentes, dans lequel le moyen (32; 216) destiné à modifier est adapté pour procéder à la modification de sorte que sur base d'effets de masquage psycho-acoustiques la modification n'entraîne pas de modification audible du signal d'information contenant un filigrane.

21. Dispositif selon l'une des revendications précédentes, dans lequel le filigrane indique une information de droit d'auteur, un numéro de série caractérisant le signal d'information ou un numéro de client.

22. Dispositif pour extraire un filigrane d'un signal d'information contenant un filigrane, avec
un moyen (118, 120, 126, 128; 318, 320, 414, 412, 328) destiné à transposer le signal d'information contenant un filigrane d'une représentation temporelle dans une représentation spectrale/spectrale à modulation;
un moyen (132; 332) destiné à dériver le filigrane sur base de la représentation spectrale/spectrale à modulation.

23. Procédé pour incorporer un filigrane dans un signal d'information, avec
transposer (18, 20, 26, 28; 18, 20, 212, 214, 28) le signal d'information d'une représentation temporelle (22) dans une représentation spectrale/spectrale à modulation (30);
modifier (32; 216) le signal d'information dans la représentation spectrale / spectrale à modulation en fonction du filigrane à incorporer, pour obtenir une représentation spectrale/spectrale à modulation modifiée; et
former (34, 38, 40, 42; 34, 218, 40, 42) un signal d'information contenant un filigrane sur base de la représentation spectrale/ spectrale à modulation modifiée.

24. Procédé pour extraire un filigrane d'un signal d'information contenant un filigrane, avec
transposer (118, 120, 126, 128; 318, 320, 414, 412, 328) le signal d'information contenant un filigrane d'une représentation temporelle dans une représentation spectrale/ spectrale à modulation;
dériver (132; 332) le filigrane sur base de la représentation spectrale/spectrale à modulation.

25. Programme d'ordinateur avec un code de programme pour réaliser le procédé selon la revendication 23 ou 24 lorsque le programme d'ordinateur est exécuté sur un ordinateur.

Zeichnung

Angeführte Verweise

IN DER BESCHREIBUNG AUFGEFÜHRTE DOKUMENTE

Diese Liste der vom Anmelder aufgeführten Dokumente wurde ausschließlich zur Information des Lesers aufgenommen und ist nicht Bestandteil des europäischen Patentdokumentes. Sie wurde mit größter Sorgfalt zusammengestellt; das EPA übernimmt jedoch keinerlei Haftung für etwaige Fehler oder Auslassungen.

In der Beschreibung aufgeführte Patentdokumente

In der Beschreibung aufgeführte Nicht-Patentliteratur

C. NEUBAUERJ. HERREDigital Watermarking and its Influence on Audio Quality105th AES Convention, 1998, [0006]
C. NEUBAUERJ. HERREAudio Watermarking of MPEG-2 AAC Bit Streams108th AES Convention, 2000, [0008]
SIEBENHAAR, FRANKNEUBAUER, CHRISTIANHERRE, JÜRGENCombined Compression/Watermarking for Audio Signals110th AES Convention, Amsterdam, preprint 5344, [0009]
C. NEUBAUERR. KULESSAJ. HERREA Compatible Family of Bitstream Watermarking Systems for MPEG-Audio110th AES Convention, Amsterdam, 2000, [0009]
M. VAN DER VEENF. BRUKERS et al.Robust, Multi-Functional and High-Quality Audio Watermarking Technology110th AES Convention, Amsterdam, 2002, [0010]
JAAP HAITSMAMICHIEL VAN DER VEENTON KALKERFONS BRUEKERSAudio Watermarking for Monitoring and Copy ProtectionACM Workshop20000000 [0010]
CHR. NEUBAUERJ. HERREAdvanced Watermarking and its Applications109th Audio Engineering Society Convention, Los Angeles, 2000, [0056]
T. HOUTGASTFrequency Selectivity in Amplitude Modulation DetectionJ. Acoust. Soc. Am., 1989, vol. 85, 4 [0068]
M. VINTONL. ATLASA Scalable and Progressive Audio CodecProceedings of the 2001 IEEE ICASSP, 2001, [0069]
DEN ARTIKEL J. THOMPSONL. ATLASA Non-uniform Modulation Transform for Audio Coding with Increased Time ResolutionProceedings of the 2003 IEEE ICASSP, 2003, [0069]
ARTIKEL L. ATLASJoint Acoustic And Modulation FrequencyJournal on Applied Signal Processing 7 EURASIP, 2003, 668-675 [0069]