METHOD AND DEVICE FOR INSERTING INFORMATION INTO AN AUDIO SIGNAL, AND METHOD AND DEVICE FOR DETECTING INFORMATION INSERTED INTO AN AUDIO SIGNAL

Title:

METHOD AND DEVICE FOR INSERTING INFORMATION INTO AN AUDIO SIGNAL, AND METHOD AND DEVICE FOR DETECTING INFORMATION INSERTED INTO AN AUDIO SIGNAL

Document Type and Number:

WIPO Patent Application WO/2001/013552

Kind Code:

Abstract:

According to the inventive method for inserting information into an audio signal, a time multiplex method is combined with a code multiplex method in order to preprocess the information which is to be inserted into the audio signal. During a time multiplex method, a spreading is carried out (22, 24) with two different data sequences in order to be able to distinguish a first time slot from additional time slots. The code multiplex channels are added (26) and weighted (26, 28, 30, 32) while taking into account a psychoacoustic masking threshold of the audio signal, whereupon the weighted code multiplex signal is combined (34) with the audio signal. The time slot of the information channel is used while detecting the information that is inserted into the audio signal in order to synchronize the second information channel which had been spread with a data sequence differing from the data sequence for the other time slots. This results in the provision of a very reliable data transmission in a first information channel as well as the provision of a data transmission with a high transmission rate in the second transmission channel.

Inventors:

NEUBAUER CHRISTIAN (DE)
ALLAMANCHE ERIC (DE)
HERRE JUERGEN (DE)
SPORER THOMAS (DE)
KULESSA RALPH (DE)
BRANDENBURG KARLHEINZ (DE)
GEIGER RALF (DE)

Application Number:

PCT/EP2000/003292

Publication Date:

February 22, 2001

Filing Date:

April 12, 2000

Export Citation:

Click for automatic bibliography generation Help

Assignee:

FRAUNHOFER GES FORSCHUNG (DE)
NEUBAUER CHRISTIAN (DE)
ALLAMANCHE ERIC (DE)
HERRE JUERGEN (DE)
SPORER THOMAS (DE)
KULESSA RALPH (DE)
BRANDENBURG KARLHEINZ (DE)
GEIGER RALF (DE)

International Classes:

G10L19/018; G11B20/00; H04H20/00; H04H20/31; H04B1/707; H04J13/00; (IPC1-7): H04H1/00

Domestic Patent References:

WO1997033391A1	1997-09-12
WO1997031440A1	1997-08-28

Foreign References:

US5805583A	1998-09-08
US5793759A	1998-08-11

Attorney, Agent or Firm:

Schoppe, Fritz (Zimmermann & Stöckeler Postfach 71 08 67 München, DE)

Download PDF:

View/Download PDF PDF Help

Claims:

Patentansprüche

Verfahren zum Einbringen von Informationen in ein Audiosignal, wobei die Informationen eine Mehrzahl von Informationseinheiten aufweisen, mit folgenden Schrit ten : Beaufschlagen (16a) einer ersten Datensequenz mit einer ersten Informationseinheit, um eine verarbeitete erste Datensequenz zu erhalten, die die Informationen der er sten Informationseinheit trägt ; Beaufschlagen (16b) einer zweiten Datensequenz mit ei ner zweiten Informationseinheit, um eine verarbeitete zweite Datensequenz zu erhalten, die die Informationen der zweiten Informationseinheit trägt, wobei sich die zweite Datensequenz von der ersten Datensequenz unter scheidet ; Multiplexen (18) der verarbeiteten ersten Datensequenz und der verarbeiteten zweiten Datensequenz, um einen ZeitmultiplexDatenstrom zu erhalten, der die erste verarbeitete Datensequenz und die zweite verarbeitete Datensequenz aufweist, wobei der ZeitmultiplexDaten strom einen ersten Informationskanal bildet ; Bilden (20) eines zweiten Informationskanals, der wei tere Informationseinheiten der in das Audiosignal ein zubringenden Informationen aufweist, wobei die Länge des zweiten Informationskanals gleich der Länge des er sten Informationskanals ist ; Beaufschlagen (22) des ersten Informationskanals mit einer ersten Codesequenz, um einen gespreizten ersten Informationskanal zu erhalten ; Beaufschlagen (24) des zweiten Informationskanals mit einer zweiten Codesequenz, die sich von der ersten Codesequenz unterscheidet, um einen gespreizten zweiten Informationskanal zu erhalten, wobei der erste und der zweite Informationskanal gleich lang sind ; Addieren (26) des gespreizten ersten und des gespreiz ten zweiten Informationskanals, um ein Codemultiplex Zeitsignal, das die einzubringenden Informationen auf weist, zu erzeugen ; Erzeugen (28) einer Spektraldarstellung des Codemulti plexZeitsignals ; Berechnen (30) einer Maskierungsschwelle des Audiosi gnals ; Gewichten (32) der spektralen Darstellung des Codemul tiplexZeitsignals, derart, daß die Energie der gewich teten spektralen Darstellung des CodemultiplexZeitsi gnals die Maskierungsschwelle des Audiosignals im we sentlichen nicht überschreitet ; und Kombinieren (34) der gewichteten spektralen Darstellung mit dem Audiosignal, um ein Audiosignal zu erzeugen, in dem die Informationen eingebracht sind.

2.	Verfahren nach Anspruch 1, bei dem die erste und die zweite Datensequenz zueinander orthogonal sind.

3.	Verfahren nach Anspruch 1 oder 2, bei dem die erste und die zweite Codesequenz zueinander orthogonal sind.

4.	Verfahren nach einem der vorhergehenden Ansprüche, bei dem die erste und die zweite Datensequenz sowie die er ste und die zweite Codesequenz PseudoNoiseSequenzen sind.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Länge einer Informationseinheit ein Bit beträgt, bei dem die Längen der ersten und der zweiten Daten sequenz größer als ein Bit sind ; und bei dem die Längen der ersten und der zweiten Code sequenz größer als die Längen der ersten und der zweiten Datensequenz sind.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Audiosgnal eine Audioabtastrate hat, wobei die erste und die zweite Codesequenz Chips aufweisen, deren Längen gleich der Länge eines Abtastwerts ist, um eine abtastwertweise bzw. chipweise Kombination im Schritt des Kombinierens zu ermöglichen.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Schritt des Kombinierens folgende Teilschritte aufweist : Transformieren der gewichteten spektralen Darstellung des CodemultiplexZeitsignals in den Zeitbereich, um ein gewichtetes Zeitsignal zu erhalten, das die ein zubringenden Informationen aufweist ; und abtastwertweises Addieren (34b) des Audiosignals und des gewichteten Zeitsignals.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Schritt des Multiplexens der ersten verarbei teten Datensequenz und der zweiten verarbeiteten Da tensequenz folgenden Schritt aufweist : Verschachteln (44) der verarbeiteten ersten Datense quenz und der verarbeiteten zweiten Datensequenz.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem im Schritt des Bildens (20) des zweiten Informa tionskanals eine Anzahl von Informationseinheiten ge nommen wird, die gleich der Anzahl von Informations einheiten, die über den ersten Informationskanal übertragen werden, multipliziert mit der Anzahl von Bits der ersten Datensequenz ist.

10.

Verfahren nach einem der vorhergehenden Ansprüche, bei dem die eingebrachten Informationen Kopiererlaubnisin formationen für das Audiosignal umfassen, bei dem die erste Informationseinheit, die über den er sten Informationskanal übertragen wird, anzeigt, daß das Audiosignal eingebrachte Informationen aufweist, bei dem sich die zweite Informationseinheit auf Kopier modalitäten bezieht, und bei dem die Informationseinheiten, die in dem zweiten Informationskanal übertragen werden, eine Identifi kation des Musikstücks und/oder des Nutzers umfassen.

11.	Verfahren nach Anspruch 10, bei dem die zweite Informa tionseinheit anzeigt, ob bzw. wie oft das Audiosignal kopiert werden darf.

12.

Verfahren nach einem der vorhergehenden Ansprüche, das ferner folgenden Schritt aufweist : Beaufschlagen (16c) der zweiten Datensequenz mit einer weiteren Informationseinheit, um eine weitere verarbei tete zweite Datensequenz zu erhalten ; und bei dem im Schritt des Multiplexens (18) ein Zeitmulti plexDatenstrom erzeugt wird, der auch die weitere ver arbeitete Datensequenz aufweist.

13.

Verfahren nach einem der vorhergehenden Ansprüche, das ferner folgenden Schritt aufweist : Beaufschlagen der zweiten Datensequenz mit einer Platz halterInformationseinheit (Bitl), die die zweite Informationseinheit oder eine weitere Informationseinheit ist, wobei die Platzhal terInformationseinheit keine Informationen trägt und damit keinen Energiebeitrag liefert ; Multiplexen der verarbeiteten zweiten Datensequenz, die die Platzhalterinformationseinheit umfaßt, mit der ver arbeiteten ersten Datensequenz und der verarbeiteten zweiten Datensequenz, um den ersten Informationskanal zu erhalten ; und zu einem späteren Zeitpunkt nach dem Erzeugen des Audiosignals, in das die Informationen eingebracht sind, und als Reaktion auf ein Ereignis, Auffinden des Bereichs in dem Audiosignal, dem die PlatzhalterInformationseinheit zugeordnet ist ; Eintragen eines Kennzeichens, das auf das Ereignis hinweist, in die PlatzhalterInformationseinheit ; und Verarbeiten der PlatzhalterInformation, die das Kennzeichen umfaßt, wie die zweite Informationsein heit, derart, daß das Kennzeichen in das Audiosi gnal eingebracht wird, ohne daß die zuvor einge brachten Informationen verändert werden, und ohne daß das Kennzeichen zu einer hörbaren Störung führt.

14.	Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Informationseinheit durch antipodische Signale dargestellt werden.

15.

Verfahren zum Ermitteln von in einem Audiosignal einge brachten Informationen, wobei die Informationen in zwei gespreizten Informationskanälen vorhanden sind, wobei dem ersten gespreizten Informationskanal eine erste Codesequenz und dem zweiten gespreizten Informations kanal eine zweite Codesequenz zugeordnet sind, wobei der erste Informationskanal eine ZeitmultiplexDatense quenz aufweist, die eine erste verarbeitete Datense quenz und eine zweite verarbeitete Datensequenz umfaßt, und wobei die erste verarbeitete Datensequenz eine er ste Informationseinheit, und die zweite verarbeitete Datensequenz eine zweite Informationseinheit der ver arbeiteten Informationen darstellen, mit folgenden Schritten : Extrahieren (70) des ersten Informationskanals aus dem Audiosignal durch Korrelieren des Audiosignals mit der ersten Codesequenz ; Feststellen (76) der verarbeiteten ersten Datensequenz in dem ersten Informationskanal durch Korrelieren (76a, 76b) des ersten Informationskanals mit der ersten Da tensequenz, wobei eine verarbeitete erste Datensequenz dann vorliegt, wenn während des Korrelierens eine Spit ze auftritt ; Extrahieren (78a, 78b) der ersten Informationseinheit aus der verarbeiteten ersten Datensequenz ; und Extrahieren (80a, 80b) der zweiten Informationseinheit aus der verarbeiteten zweiten Datensequenz durch Korre lieren des anderen Datenstroms mit der zweiten Datense quenz.

16.

Verfahren nach Anspruch 15, bei dem der erste und der zweite Informationskanal nach einer Verschachtelungs vorschrift verschachtelt sind, das ferner folgenden Schritt aufweist : Demultiplexen (74) des ersten Informationskanals unter Verwendung der Verschachtelungsvorschrift, um zwei Da tenströme zu erhalten, von denen einer die verarbeitete erste Datensequenz und der andere die verarbeitete zweite Datensequenz ist ; und bei dem im Schritt des Feststellens festgestellt wird, welcher der beiden Datenströme die verarbeitete erste Datensequenz darstellt, indem die beiden Daten ströme mit der ersten Datensequenz korreliert werden (76a, 76b), wobei der Datenstrom, bei dem während des Korrelierens mit der ersten Datensequenz eine Spitze erzeugt wird, die verarbeitete erste Datensequenz ist (76e).

17.

Verfahren nach Anspruch 15 oder 16, das ferner folgen den Schritt aufweist : Extrahieren (72) des zweiten Informationskanals aus dem Audiosignal durch Korrelieren des Audiosignals mit der zweiten Codesequenz, um den zweiten Informationskanal zu erhalten ; Verwenden (84c) der extrahierten ersten Informations einheit als Synchronisationssignal (82), um den zweiten Informationskanal auf den ersten Informationskanal zu synchronisieren ; und Ermitteln (84) der Informationseinheiten aus dem zwei ten Informationskanal unter Verwendung des Synchronisa tionssignals.

18.

Verfahren nach Anspruch 17, bei dem der zweite Infor mationskanal ebenfalls verschachtelte Datenströme auf weist, die nach derselben Verschachtelungsvorschrift wie der erste Informationskanal verschachtelt sind, wo bei das Verfahren ferner folgende Schritte aufweist : Demultiplexen (84a) des zweiten Informationskanals in Datenströme des zweiten Informationskanals ; und Bestimmen (84b), welcher Datenstrom der Datenströme des zweiten Informationskanals welche Informationseinheit darstellt, unter Verwendung der im Schritt des Fest stellens (76) gewonnenen Zuordnung bezüglich des ersten Informationskanals.

19.

Verfahren nach einem der Ansprüche 15 bis 18, bei dem der Schritt des Extrahierens (70) des ersten Informa tionskanals folgende Schritte aufweist : Selektieren (90,98) von durch das Korrelieren er zeugten Spitzen, um ein Signal zu erzeugen, das nur noch aus Impulsen besteht, die ein positives cder negatives Vorzeichen haben ; Bestimmen (100) des Vorzeichens jeder Spitze ; und Erzeugen von Pulsen aus den Spitzen, wobei jeder Puls lediglich einen von zwei Zuständen haben kann, wobei die Zustände der Pulse durch die Vorzeichen der Spitzen bestimmt sind, um den ersten Informationskanal zu er zeugen.

20.

Verfahren nach einem der Ansprüche 15 bis 19, bei dem in den Schritten des Extrahierens (78) der ersten In formationseinheit und des Extrahierens (80) der zweiten Informationseinheit eine Schwellwertentscheidung (78b, 80b) durchgeführt wird, derart, daß ein positives oder negatives Signal erzeugt wird, wenn ein Ergebniswert des Korrelierens eine vorbestimmte Schwelle überschrei tet.

21.	Verfahren nach einem der Ansprüche 15 bis 20, bei dem die Informationseinheiten durch binäre Signale dargestellt sind, die einen positiven oder negativen Signalpegel haben,.

22.

Verfahren nach Anspruch 21, bei dem im Schritt des Extrahierens der ersten Informa tionseinheit das Vorzeichen des Signalpegels festge stellt wird, der die erste Informationseinheit dar stellt, bei dem im Schritt des Extrahierens der zweiten Infor mationseinheit das Vorzeichen des Signalpegels, der die zweite Informationseinheit darstellt, festgestellt wird, und mit dem Vorzeichen des Signalpegels, der die erste Informationseinheit darstellt, verglichen wird, und bei dem für die zweite Informationseinheit ein erster Wert bestimmt wird, wenn beide Vorzeichen gleich sind, oder ein zweiter Wert bestimmt wird, wenn beide Vorzei chen unterschiedlich sind.

23.	Verfahren nach einem der Ansprüche 15 bis 22, bei dem die erste Informationseinheit anzeigt, daß überhaupt Informationen in das zu decodierende Audiosignal einge bracht sind, und bei dem die zweite Informationseinheit Kopiererlaubnis informationen umfaßt.

24.	Verfahren nach einem der Ansprüche 16 bis 23, bei dem der zweite Informationskanal Informationen über den Benutzer des Audiosignals und/oder eine Kennzeich nung des Audiosignals umfaßt.

25.

Vorrichtung zum Einbringen von Informationen in ein Audiosignal, wobei die Informationen eine Mehrzahl von Informationseinheiten aufweisen, mit folgenden Merkma len : einer Einrichtung zum Beaufschlagen (16a) einer ersten Datensequenz mit einer ersten Informationseinheit, um eine verarbeitete erste Datensequenz zu erhalten, die die Informationen der ersten Informationseinheit trägt ; einer Einrichtung zum Beaufschlagen (16b) einer zweiten Datensequenz mit einer zweiten Informationseinheit, um eine verarbeitete zweite Datensequenz zu erhalten, die die Informationen der zweiten Informationseinheit trägt, wobei sich die zweite Datensequenz von der er sten Datensequenz unterscheidet ; einer Einrichtung zum Multiplexen (18) der verarbei teten ersten Datensequenz und der verarbeiteten zweiten Datensequenz, um einen ZeitmultiplexDatenstrom zu er halten, der die erste verarbeitete Datensequenz und die zweite verarbeitete Datensequenz aufweist, wobei der ZeitmultiplexDatenstrom einen ersten Informationskanal bildet ; einer Einrichtung zum Bilden (20) eines zweiten In formationskanals, der weitere Informationseinheiten der in das Audiosignal einzubringenden Informationen auf weist, wobei die Länge des zweiten Informationskanals gleich der Länge des ersten Informationskanals ist ; einer Einrichtung zum Beaufschlagen (22) des ersten Informationskanals mit einer ersten Codesequenz, um einen gespreizten ersten Informationskanal zu erhalten ; einer Einrichtung zum Beaufschlagen (24) des zweiten Informationskanals mit einer zweiten Codesequenz, die sich von der ersten Codesequenz unterscheidet, um einen gespreizten zweiten Informationskanal zu erhalten, wo bei der erste und der zweite Informationskanal gleich lang sind ; einer Einrichtung zum Addieren (26) des gespreizten ersten und des gespreizten zweiten Informationskanals, um ein CodemultiplexZeitsignal, das die einzubringen den Informationen aufweist, zu erzeugen ; einer Einrichtung zum Erzeugen (28) einer Spektraldar stellung des CodemultiplexZeitsignals ; einer Einrichtung zum Berechnen (30) einer Maskierungs schwelle des Audiosignals ; einer Einrichtung zum Gewichten (32) der spektralen Darstellung des CodemultiplexZeitsignals, derart, daß die Energie der gewichteten spektralen Darstellung des CodemultiplexZeitsignals die Maskierungsschwelle des Audiosignals im wesentlichen nicht überschreitet ; und einer Einrichtung zum Kombinieren (34) der gewichteten spektralen Darstellung mit dem Audiosignal, um ein Audiosignal zu erzeugen, in dem die Informationen ein gebracht sind.

26.

Vorrichtung zum Ermitteln von in einem Audiosignal eingebrachten Informationen, wobei die Informationen in zwei gespreizten Informationskanälen vorhanden sind, wobei dem ersten gespreizten Informationskanal eine er ste Codesequenz und dem zweiten gespreizten Informa tionskanal eine zweite Codesequenz zugeordnet sind, wo bei der erste Informationskanal eine ZeitmultiplexDa tensequenz aufweist, die eine erste verarbeitete Da tensequenz und eine zweite verarbeitete Datensequenz umfaßt, und wobei die erste verarbeitete Datensequenz eine erste Informationseinheit, und die zweite verar beitete Datensequenz eine zweite Informationseinheit der verarbeiteten Informationen darstellt, mit folgen den Merkmalen : einer Einrichtung zum Extrahieren (70) des ersten In formationskanals aus dem Audiosignal durch Korrelieren des Audiosignals mit der ersten Codesequenz ; einer Einrichtung zum Feststellen (76) der verarbeite ten ersten Datensequenz in dem ersten Informationskanal durch Korrelieren (76a, 76b) des ersten Informations kanals mit der ersten Datensequenz, wobei eine verar beitete erste Datensequenz dann vorliegt, wenn während des Korrelierens eine Spitze auftritt ; einer Einrichtung zum Extrahieren (78a, 78b) der ersten Informationseinheit aus der verarbeiteten ersten Da tensequenz ; und einer Einrichtung zum Extrahieren (80a, 80b) der zwei ten Informationseinheit aus der verarbeiteten zweiten Datensequenz durch Korrelieren des anderen Datenstroms mit der zweiten Datensequenz.

27.

Vorrichtung nach Anspruch 16, bei der der erste und der zweite Informationskanal nach einer Verschachtelungs vorschrift verschachtelt sind, das ferner folgendes Merkmal aufweist : eine Einrichtung zum Demultiplexen (74) des ersten In formationskanals unter Verwendung der Verschachtelungs vorschrift, um zwei Datenströme zu erhalten, von denen einer die verarbeitete erste Datensequenz und der an dere die verarbeitete zweite Datensequenz ist ; und bei der die einrichtung zum Feststellen angeordnet ist um festzustellen, welcher der beiden Datenströme die verarbeitete erste Datensequenz darstellt, indem die beiden Datenströme mit der ersten Datensequenz kor relierbar sind (76a, 76b), wobei der Datenstrom, bei dem während des Korrelierens mit der ersten Datense quenz eine Spitze erzeugt wird, die verarbeitete erste Datensequenz ist (76e).

Description:

Verfahren und Vorrichtung zum Einbringen von Informationen in ein Audiosignal und Verfahren und Vorrichtung zum Ermit- teln von in einem Audiosignal eingebrachten Informationen Beschreibuna Die vorliegende Erfindung bezieht sich allgemein auf das Co- dieren und Decodieren von Audiosignalen und insbesondere auf das Einbringen von Informationen in ein Audiosignal und das Ermitteln der in ein Audiosignal eingebrachten Informatio- nen. Insbesondere auf dem Gebiet des Urheberrechtsschutzes für Audiosignale dient die vorliegende Erfindung dazu, Urhe- berrechts-bzw. Kopierinformationen in ein Audiosignal un- hörbar einzubringen.

Mit zunehmender Verbreitung des Internets hat auch die Mu- sikpiraterie drastisch zugenommen. An vielen Stellen im In- ternet können Musikstücke bzw. allgemein Audiosignale herun- tergeladen werden. In den allerwenigsten Fällen werden hier- bei Urheberrechte beachtet. Insbesondere wird sehr selten die Erlaubnis des Urhebers eingeholt, sein Werk zur Verfü- gung zu stellen. Noch seltener werden Gebühren an den Urhe- ber bezahlt, die der Preis für ein rechtmäßiges Kopieren sind. Darüberhinaus findet ein unkontrolliertes Kopieren von Werken statt, was in den allermeisten Fällen ebenfalls ohne Berücksichtigung von Urheberrechten geschieht.

Wenn Musikstücke über das Internet von einem Provider für Musikstücke rechtmäßig erworben werden, erzeugt der Provider üblicherweise einen Header, in dem Copyright-Informationen sowie beispielsweise eine Kundennummer eingebracht sind, wo- bei die Kundennummer eindeutig auf den aktuell vorliegenden Käufer hinweist. Es ist ferner bekannt, Kopiererlaubnisin- formationen in diesen Header einzufügen, welche die ver- schiedensten Arten von Kopierrechten signalisieren, wie z.

B. daß das Kopieren des aktuellen Stücks vollständig unter- sagt ist, daß das Kopieren des aktuellen Stücks nur ein einziges Mal erlaubt ist, daß das Kopieren des aktuellen Stücks völlig frei ist, etc.

Der Kunde verfügt über einen Decodierer, der den Header ein- liest und unter Beachtung der erlaubten Handlungen bei- spielsweise nur eine einzige Kopie zuläßt und weitere Kopien verweigert.

Dieses Konzept zur Beachtung der Urheberrechte funktioniert jedoch nur für Kunden, die sich legal verhalten.

Illegale Kunden haben üblicherweise ein wesentliches Poten- tial an Kreativität, um mit einem Header versehene Musik- stücke zu"knacken". Hier zeigt sich bereits der Nachteil der beschriebenen Vorgehensweise zum Schutz von Urheberrech- ten. Ein solcher Header kann einfach entfernt werden. Alter- nativ könnte ein illegaler Benutzer auch einzelne Einträge in dem Header modifizieren, um beispielsweise aus dem Ein- trag"Kopieren untersagt"einen Eintrag"Kopieren völlig frei"zu machen. Denkbar ist auch der Fall, daß ein ille- galer Kunde seine eigene Kundennummer aus dem Header ent- fernt und dann das Musikstück auf seiner oder einer anderen Homepage im Internet anbietet. Ab diesem Moment ist es nicht mehr möglich, den illegalen Kunden zu ermitteln, da er seine Kundennummer entfernt hat. Versuche, solche Verletzungen des Urheberrechts zu unterbinden, werden daher zwangsläufig ins Leere laufen, da die Kopierinformationen aus dem Musikstück entfernt worden sind bzw. modifiziert worden sind, und da der illegale Kunde, der dies tat, nicht mehr ermittelt werden kann, um ihn zur Verantwortung zu ziehen. Wäre stattdessen eine sichere Einbringung von Informationen in das Audiosignal vorhanden, so könnten staatliche Behörden, die Urheberrechtsverletzungen verfolgen, verdächtige Musik- stücke im Internet ermitteln und beispielsweise die Be- nutzeridentifikation solcher illegalen Stücke feststellen, um den illegalen Benutzern das Handwerk zu legen.

Aus der WO 97/33391 ist ein Codierverfahren zur Einbringung eines nicht hörbaren Datensignals in ein Audiosignal be- kannt. Dabei wird das Audiosignal, in das das nicht hörbare Datensignal eingebracht werden soll, in den Frequenzbereich umgewandelt, um mittels eines psychoakustischen Modells die Maskierungsschwelle des Audiosignals zu bestimmen. Das Da- tensignal, das in das Audiosignal eingebracht werden soll, wird mit einem Pseudorauschsignal multipliziert, um ein fre- quenzmäßig gespreiztes Datensignal zu schaffen. Das fre- quenzmäßig gespreizte Datensignal wird dann mit der psycho- akustischen Maskierungsschwelle gewichtet, derart, daß die Energie des frequenzmäßig gespreizten Datensignals immer un- terhalb der Maskierungsschwelle liegt. Schließlich wird das gewichtete Datensignal dem Audiosignal überlagert, wodurch ein Audiosignal erzeugt wird, in das das Datensignal unhör- bar eingebracht ist. Das Datensignal kann zum einen dazu verwendet werden, die Reichweite eines Senders zu ermitteln.

Alternativ kann das Datensignal zur Kennzeichnung von Audio- signalen verwendet werden, um eventuelle Raubkopien ohne weiteres zu identifizieren, da jeder Tonträger beispielswei- se in Form einer CompactDisc ab Werk mit einer individuellen Kennung versehen wird. Weitere beschriebene Anwendungsmög- lichkeiten des Datensignals bestehen im Fernsteuern von Audiogeräten in Analogie zum"VPS"-Verfahren beim Fernsehen.

Dieses Verfahren liefert bereits eine hohe Sicherheit gegen- über Musikpiraten, da sie zum einen unter Umständen gar nicht wissen, daß das Musikstück, das sie gerade vervielfäl- tigen, gekennzeichnet ist. Darüberhinaus ist es nahezu un- möglich, ohne einen autorisierten Decodierer das Datensi- gnal, das unhörbar in dem Audiosignal vorhanden ist, zu ex- trahieren.

Audiosignale liegen, wenn sie von einer CompactDisc stammen, als 16-Bit-PCM-Abtastwerte vor. Ein Musikpirat könnte bei- spielsweise die Abtastrate bzw. die Pegel oder Phasen der Abtastwerte manipulieren, um das Datensignal unlesbar, d. h. undecodierbar zu machen, wodurch die Urheberrechtsinforma- tionen ebenfalls aus dem Audiosignal entfernt wären. Dies wird jedoch nicht ohne signifikante Qualitätseinbußen mög- lich sein. Solchermaßen in Audiosignale eingebrachte Daten können daher auch in Analogie zu Banknoten als"Wasserzei- chen"bezeichnet werden.

Nachteilig an dem beschriebenen Verfahren ist die Tatsache, daß es sehr unflexibel ist. Dies zeigt sich darin, daß das einmal eingebrachte Wasserzeichen nicht mehr geändert bzw.

"ergänzt"werden kann. Eine solche"Ergänzung"wäre bei- spielsweise von einem autorisierten Decodierer gefordert, der ein Kopier-Bit in dem Audiosignal setzt, um zu signali- sieren, daß der Benutzer eine Kopie gezogen hat, und daß nun keine weiteren Kopien mehr möglich sind. Ein solches nach- trägliches Modifizieren des Wasserzeichens ist bei dem bekannten Verfahren nicht durchführbar. Das Datensignal belegt stattdessen die gesamte Energie bis zur psychoakusti- schen Maskierungsschwelle. Eine zusätzlich eingeführte Si- gnalenergie in Form eines gesetzten Kopier-Bits wurde zu hörbaren Qualitätseinbußen führen, welche selbstverständlich nicht erwünscht sind.

Ein weiteres Problem beim bekannten Verfahren besteht darin, daß, wenn viele Zusatzdaten in das Audiosignal eingebracht werden, die Decodierer immer komplexer und aufwendiger wer- den. Decodierer sind jedoch Massenartikel, die, um auf dem Markt bestehen zu können, sehr preisgünstig angeboten werden müssen. Alternativ ausgedrückt wird sich ein Verfahren zur wirksamen Durchsetzung von Urheberrechten selbst nicht durchsetzen, wenn es zu einer signifikanten Verteuerung der Decodierer führt. Werden dagegen nur wenig Daten in das Audiosignal eingebracht, um die Decodierer nicht zu ver- teuern, so ist die Anwendungsmöglichkeit des Verfahrens wiederum sehr begrenzt, da unter Umständen nicht alle Infor- mationen eingebracht werden können, die eingebracht werden sollten.

Die Aufgabe der vorliegenden Erfindung besteht darin, ein flexibleres Konzept zum Einbringen von Informationen in ein Audiosignal zu schaffen.

Diese Aufgabe wird durch ein Verfahren zum Einbringen von Informationen in ein Audiosignal nach Patentanspruch 1 oder durch eine Vorrichtung zum Einbringen von Informationen in ein Audiosignal nach Patentanspruch 24 gelöst.

Eine weitere Aufgabe der vorliegenden Erfindung besteht dar- in, ein flexibles Konzept zum Ermitteln von Informationen, die in einem Audiosignal eingebracht sind, zu schaffen.

Diese Aufgabe wird durch ein Verfahren zum Ermitteln von In- formationen, die in einem Audiosignal eingebracht sind, nach Patentanspruch 14 oder durch eine Vorrichtung zum Ermitteln von Informationen, die in ein Audiosignal eingebracht sind, nach Patentanspruch 25 gelöst.

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß nur ein flexibles Konzept der Informationsaufbereitung einerseits zu preisgünstigen Decodierern und andererseits zur Berücksichtigung der nötigen Informationen für einen wirksamen Urheberrechtsschutz führen wird. Die Informations- aufbereitung wird dadurch erreicht, daß die in das Audiosi- gnal einzubringenden Informationen über zumindest zwei In- formationskanäle verteilt werden. Ein erster Informationska- nal wird vorzugsweise die Kopierinformationen umfassen. Die Kopierinformationen können üblicherweise durch eine relativ geringe Datenmenge dargestellt werden und sind wesentlich, um ein unerlaubtes Kopieren, d. h. eine Verletzung von Ur- heberrechten, zu unterbinden. Weitere Informationen, wie z.

B. der ISRC (ISRC = International Standard Recording Code) sowie eine Identifikation des Kunden sowie weitere interes- sierende Daten können in einem zweiten Informationskanal un- tergebracht werden. Die beiden Kanäle sind voneinander unab- hängig decodierbar. Dies ermöglicht den Einsatz von soge- nannten skalierbaren Decodierern. Sehr einfach ausgeführte Decodierer werden nur den ersten Kanal, der vorzugsweise Ko- pierinformationen enthält, decodieren. Solche Decodierer können daher sehr preisgünstig angeboten werden, da sie nicht die gesamte Informationsmenge ermitteln müssen. Auf- wendigere Decodierer dagegen, bei denen der Preis nicht die entscheidende Rolle spielt, werden ausgestattet sein, um auch den zweiten Informationskanal bzw. einen dritten, vier- ten usw. Informationskanal zu decodieren, um sämtliche In- formationen, die ursprünglich in das Audiosignal eingebracht worden sind, zu eruieren.

Angeknüpft an das eingangs erläuterte Szenario wurde ein üb- licher User nur den ersten Informationskanal decodieren und im Falle der Anfertigung einer Kopie ein Kopierbit im Was- serzeichen setzen, um weitere legale Kopien zu unterbinden, wenn der Benutzer lediglich eine Lizenz für eine einzige Kopie gekauft hat. Dieses Verfahren wird als Remark-Ver- fahren bezeichnet.

Ein aufwendigerer Decodierer, beispielsweise im Besitz von Behörden, die eine Durchsetzung von Urheberrechten zum Ziel haben, könnte dazu verwendet werden, den zweiten Informa- tionskanal zu decodieren, um im Falle eines verdächtigen Stücks bzw. überhaupt bei jedem Musikstück den berechtigten Benutzer anhand seiner Benutzerkennung zu identifizieren.

Sollte ein Benutzer das Musikstück unerlaubt kopiert haben, so könnte er, da seine Identifikation über den zweiten In- formationskanal decodiert werden kann, ermittelt werden und zur Rechenschaft gezogen werden.

Das erfindungsgemäße Verfahren liefert somit den Vorteil ei- ner mehrkanaligen Aufbereitung der in das Audiosignal einzu- bringenden Informationen, was wiederum den Einsatz von ska- lierbaren Decodierern ermöglicht.

Bei der Verwendung mehrerer Kanäle muß eine Synchronisation der Kanäle durchgeführt werden. Üblicherweise wird jeder Ka- nal mit einer geeigneten Präambel synchronisiert. Dadurch erniedrigt sich jedoch die Nettodatenrate. Erfindungsgemäß wird, um die Datenrate für den zweiten Informationskanal ma- ximal zu halten, derselbe mittels des ersten Informations- kanals synchronisiert. Dies wird dadurch erreicht, daß auch der erste Informationskanal in einzelne Teilkanäle oder "Zeitschlitze"unterteilt wird.

Die Unterteilung bereits des ersten Informationskanals, der vorzugsweise die nötigen Kopierinformationen aufweist, er- möglicht es auch, sogenannte"Platzhalterstellen"vorzuse- hen, d. h. Zeitschlitze, die beim ersten Einbringen des Was- serzeichens in das Audiosignal freibleiben, d. h. keine In- formation tragen, wodurch aufgrund der psychoakustischen Ge- wichtung an Stellen im Audiosignal, die für die Platzhalter vorgesehen sind, keine Energie eingebracht wird, derart, daß auch eine nachträgliche Einbringung von Informationen, d. h.

Remarken, beispielsweise bezüglich eines erfolgten Kopier- vorgangs durchgeführt werden kann, ohne das ursprüngliche Wasserzeichen zu verändern, und ohne hörbare Störungen in das Audiosignal einzubringen.

Das erfindungsgemäße Verfahren verwendet eine Art TDMA-Ver- arbeitung (TDMA = Time Division Multiple Access) für den er- sten Informationskanal und eine Art CDMA-Verarbeitung (CDMA = Code Division Multiple Access) zur Codierung des ersten Informationskanals und eines weiteren Informationskanals.

Die CDMA-Verarbeitung erlaubt eine Trennung der Informati- onskanäle beim Ermitteln der in das Audiosignal eingebrach- ten Informationen, während die TDMA-Verarbeitung ein flexib- les Wasserzeichen ermöglicht, d. h. ein Wasserzeichen, bei dem nachträglich noch Bits gesetzt werden können. Der zweite Informationskanal kann ebenfalls einer TDMA-Verarbeitung unterzogen sein. Dies ist jedoch für die vorliegende Erfin- dung nicht wesentlich.

Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend bezugnehmend auf die beiliegenden Zeich- nungen detailliert erläutert. Es zeigen : Fig. 1 ein Blockschaltbild zur Verdeutlichung des erfin- dungsgemäßen Konzepts zum Einbringen von Informa- tionen in ein Audiosignal ; Fig. 2 eine detailliertere Darstellung zur Verdeutlichung des Bildens des ersten Informationskanals ; Fig. 3 eine detaillierte Darstellung zur Verdeutlichung des Bildens des zweiten Informationskanals ; Fig. 4 eine detaillierte Darstellung zur Verdeutlichung des Bildens des Codemultiplex-Zeitsignals vor dem Gewichten ; Fig. 5 eine detaillierte Darstellung zur Verdeutlichung des Bildens des Audiosignals, in das die Informa- tionen eingebracht sind, unter Verwendung des ur- sprünglichen Audiosignals und des Codemultiplex- Zeitsignals ; Fig. 6A eine allgemeine Übersicht über die TDMA/CDMA-Verar- beitung der in das Audiosignal einzubringenden In- formationen ; Fig. 6B eine Übersicht über das Datenformat zu verschiede- nen Zeitpunkten während des Verarbeitens des ersten Informationskanals anhand eines bevorzugten Ausfüh- rungsbeispiels, das vier Zeitschlitze aufweist ; Fig. 7 ein Blockschaltbild zur Erläuterung einer Vorrich- tung zum Ermitteln von in einem Audiosignal einge- brachten Informationen gemäß einem bevorzugten Aus- führungsbeispiel ; Fig. 8 eine detaillierte Darstellung zur Veranschaulichung der Ermittlung des ersten und des zweiten Informa- tionskanals ; Fig. 9 ein Zeitdiagramm eines beispielhaften Zeitsignals nach dem Matched-Filter für den ersten Informa- tionskanal ; Fig. 10 eine Prinzipdarstellung einer Schaltung zum Erzeu- gen von Bitströmen aus Korrelatorausgangssignalen ; Fig. 11 eine detaillierte Darstellung zum Demultiplexen und Identifizieren der einzelnen verarbeiteten Datense- quenzen, die die erste, die zweite und die weiteren Informationseinheiten darstellen ; Fig. 12 eine detaillierte Darstellung einer Schaltung zum Extrahieren der ersten, der zweiten sowie der wei- teren Informationseinheiten aus dem ersten Informa- tionskanal und zum Ausgeben eines Sychronisations- signals für den zweiten Informationskanal ; Fig. 13 eine zeitliche Darstellung des Pegelverlaufs an dem Punkt P von Fig. 12 ; Fig. 14 eine detaillierte Darstellung der Schaltung zum Er- mitteln der Informationseinheiten des zweiten In- formationskanals gemäß einem bevorzugten Ausfüh- rungsbeispiel der vorliegenden Erfindung, bei dem der zweite Informationskanal ebenfalls einer TDMA- Verarbeitung unterzogen ist.

Bevor detaillierter auf die einzelnen Figuren eingegangen wird, wird der systemtheoretische Hintergrund der vorliegen- den Erfindung kurz beleuchtet. Generell darf das Einbringen der Informationen in das Audiosignal zu keiner bzw. nur ei- ner sehr schwer hörbaren Qualitätsverschlechterung des Audiosignals führen. Um festzustellen, wieviel Energie das Signal, das die einzubringenden Informationen darstellt, ha- ben darf, wird unter Verwendung eines psychoakustischen Mo- dells die Maskierungsschwelle des Audiosignals fortlaufend berechnet. Die frequenzselektive Berechnung der Maskierungs- schwelle unter Verwendung beispielsweise der kritischen Bän- der sowie eine Vielzahl weiterer psychoakustischer Modelle sind in der Technik bekannt. Beispielhaft wird auf den Standard MPEG2-AAC (ISO/IEC 13818-7) verwiesen.

Das psychoakustische Modell führt zu einer Maskierungs- schwelle für ein Kurzzeitspektrum des Audiosignals. Übli- cherweise wird die Maskierungsschwelle über der Frequenz va- riieren. Per Definition wird angenommen, daß ein in das Audiosignal eingebrachtes Signal dann unhörbar sein wird, wenn die Energie dieses Signals unterhalb der Maskierungs- schwelle ist. Die Maskierungsschwelle hängt stark von der Zusammensetzung des Audiosignals ab. Rauschhafte Signale ha- ben eine höhere Maskierungsschwelle als sehr tonale Signale.

Die Energie des Signals, das in das Audiosignal eingebracht wird, variiert daher stark über der Zeit. Üblicherweise wird zum Decodieren der in ein Audiosignal eingebrachten Informa- tionen ein bestimmtes Signal/Rausch-Verhältnis benötigt. Da- bei kann es vorkommen, daß bei sehr tonalen Audiosignalab- schnitten die Energie des zusätzlich eingebrachten Signals derart gering wird, daß das Signal/Rausch-Verhältnis zum sicheren Decodieren nicht mehr ausreicht. Ein Decodierer kann daher in solchen Bereichen einzelne Bits nicht mehr korrekt decodieren. Systemtheoretisch gesehen kann daher das Einbringen von Informationen in ein Audiosignal in Abhängig- keit von der psychoakustischen Maskierungsschwelle als das Übertragen eines Datensignals über einen Kanal mit stark va- riierender Störenergie betrachtet werden, wobei das Audiosi- gnal, d. h. das Musiksignal, als Störsignal aufgefaßt wird.

Um trotz des stark variierenden Übertragungskanals eine si- chere Detektion zu gewährleisten, wird erfindungsgemäß ein zweifaches Spreizungsverfahren für den ersten Informations- kanal eingesetzt. Dadurch und aufgrund der Tatsache, daß die Informationen während des gesamten Audiostücks zyklisch in das Audiosignal eingebracht werden, wird eine sichere Detek- tion während nahezu des gesamten Audiosignals, d. h. Musik- stücks, sichergestellt. Bevorzugterweise wird, wie es weiter hinten ausführlicher dargestellt wird, ferner ein Interlea- ver eingesetzt, der eine Verschachtelung der einzelnen TDMA-Kanäle durchführt, um eine größere Unabhängigkeit von "Burst-Fehlern", d. h. längeren tonalen Abschnitten im Audiosignal, zu erreichen.

Fig. 1 zeigt ein Blockschaltbild für eine Vorrichtung bzw. ein Verfahren zum Einbringen von Informationen, die aus ei- ner Quelle 10 für Informationen stammen, in ein Audiosignal, das aus einer Quelle 12 für das Audiosignal stammt. Zum Er- zeugen 16a einer ersten verarbeiteten Datensequenz wird eine erste Datensequenz 14a mit einer ersten Informationseinheit 12a beaufschlagt. Analog dazu wird eine zweite Datensequenz 14b mit einer zweiten Informationseinheit 12b beaufschlagt, um eine zweite verarbeitete Datensequenz zu erzeugen (16b).

Am Ausgang der Einrichtung 16a liegt somit eine erste verar- beitete Datensequenz vor, die als Informationsinhalt die er- ste Informationseinheit 12a trägt, und am Ausgang der Ein- heit 16b zum Erzeugen der zweiten verarbeiteten Datensequenz liegt die zweite verarbeitete Datensequenz vor, die die zweite Informationseinheit 12b trägt. Die beiden verarbeite- ten Datensequenzen werden in einen Multiplexer 18 einge- speist, um einen Zeitmultiplex-Datenstrom zu erzeugen, der auch als erster Informationskanal bezeichnet wird. Die Ein- richtungen 16a, 16b und 18 führen somit eine TDMA-Verarbei- tung der ersten und zweiten Informationseinheit 12a, 12b durch, wobei der Datenstrom am Ausgang des Multiplexers 18, d. h. der Zeitmultiplex-Datenstrom, der den ersten Informa- tionskanal bildet, Zeitschlitze aufweist, die von einem ge- eigneten Decodierer verwendet werden können, um die erste und die zweite Informationseinheit 12a, 12b wieder zu ermit- teln.

Um weitere Informationseinheiten aus der Quelle 10 für In- formationen in das Audiosignal einzubringen, ist eine Ein- richtung 20 zum Bilden eines zweiten Informationskanals vor- gesehen. Die Einrichtung 20 kann die gleichen Elemente auf- weisen, wie sie zum Bilden des ersten Informationskanals vorgesehen sind. Aus Einfachheitsgründen wird es jedoch be- vorzugt, daß zur Zeitschlitz-Verarbeitung des zweiten Infor- mationskanals keine unterschiedlichen Datensequenzen verwen- det werden, sondern nur eine einzige Datensequenz.

Der erste Informationskanal und der zweite Informationskanal werden unter Verwendung einer Einrichtung 22 bzw. 24 und ei- nes Addierers 26 verarbeitet, um ein Codemultiplex-Zeitsi- gnal am Ausgang des Addierers 26 zu erzeugen, das die Infor- mationen sowohl des ersten Informationskanals als auch des zweiten Informationskanals im TDMA/CDMA-Format aufweist.

Insbesondere wird der erste Informationskanal mit einer ersten Codesequenz gespreizt, um die Energie frequenzmäßig zu verteilen, z. B. über die gesamte zur Verfügung stehende Bandbreite. Analog dazu wird auch der zweite Informations- kanal unter Verwendung einer zweiten Codesequenz mittels der Einrichtung 24 gespreizt, um auch seine Energie über z. B. das gesamte zur Verfügung stehende Band zu verteilen.

Das Codemultiplex-Zeitsignal am Ausgang des Addierers 26 wird anschließend einer Transformation vom Zeitbereich in den Frequenzbereich in einer Einrichtung 28 zum Tranformie- ren unterzogen, um eine spektrale Darstellung des Codemulti- plex-Zeitsignals zu erzeugen.

Das Audiosignal aus der Quelle 12 für das Audiosignal wird in ein psychoakustisches Modell 30 eingespeist, um die Mas- kierungsschwelle zu berechnen. Die Maskierungsschwelle wird ebenso wie die spektrale Darstellung des Codemultiplex-Zeit- signals in eine Einrichtung 32 zum Gewichten der beiden Ein- gangssignale eingespeist. Die Einrichtung 32 zum Gewichten skaliert die Energie des in den Frequenzbereich transfor- mierten Codemultiplex-Zeitsignals so, daß der Energieverlauf der Maskierungsschwelle entspricht bzw. um einen bestimmten Sicherheitsabstand kleiner als die maximal zulässige Energie ist. Es sei darauf hingewiesen, daß die Energie der ersten Informationseinheit 12a und der zweiten Informationseinheit 12b beliebig ist, da die Informationseinheiten durch Bits dargestellt sind, deren Amplitude frei wählbar ist. Daher ist auch die Energie der Spektraldarstellung am Ausgang der Einrichtung 28 beliebig aber von der Energie der ursprüng- lichen Ausgangssignale der Quelle 10 für Informationen ab- hängig. Erst durch die Einrichtung 32 zum Gewichten findet eine Skalierung der Energie statt, so daß die in das Audio- signal eingebrachten zusätzlichen Informationen von dem Audiosignal psychoakustisch maskiert werden.

Unter Verwendung einer Einrichtung 34 zum Kombinieren wird die skalierte spektrale Darstellung des Codemultiplex-Zeit- signals mit dem Audiosignal kombiniert, um als Ausgangssi- gnal das Audiosignal mit den eingebrachten Informationen zu erhalten.

Erfindungsgemäß werden zum Erzeugen des ersten Informations- kanal zwei unterschiedliche Datensequenzen verwendet. Insbe- sondere wird die erste Informationseinheit mit einer anderen Datensequenz beaufschlagt als die zweite Informationseinheit sowie unter Umständen weitere Informationseinheiten, die in den ersten Informationskanal eingebracht werden sollen. Auf- grund ihrer guten Korrelationseigenschaften werden für die erste Datensequenz und für die zweite Datensequenz Pseudo- Noise-Datensequenzen bevorzugt. Damit im Empfänger die erste Informationseinheit von der zweiten Informationseinheit un- terschieden werden kann, und damit erfindungsgemäß eine Syn- chronisation auf die erste Informationseinheit im Decoder, d. h. in der Vorrichtung zum Ermitteln der in das Audiosi- gnal eingebrachten Informationen erhalten werden kann. Um eine gute Trennung mittels eines Korrelators herzustellen, wird es ferner bevorzugt, daß die erste und die zweite Da- tensequenz orthogonal zueinander sind, da dann die Kreuzkor- relation beider Datensequenzen Null ist.

Das für die erste und die zweite Datensequenz Gesagte gilt im wesentlichen auch für die erste Codesequenz und die zwei- te Codesequenz. Es wird bevorzugt, daß sowohl die erste Codesequenz als auch die zweite Codesequenz aufgrund ihrer guten Korrelationseigenschaften Pseudo-Noise-Bitsequenzen sind, die zudem bevorzugterweise orthogonal sind, damit ihre Kreuzkorrelierte Null ist.

Übliche CD-Audiosignale liegen mit einer Abtastfrequenz von 44,1 kHz vor. Im Professional-Bereich werden dagegen 48 kHz verwendet. Um unnötige Dezimationen bzw. Interpolationen des Codemultiplex-Zeitsignals zu vermeiden, wird es bevorzugt, daß sowohl die erste Datensequenz als auch die zweite Datensequenz gleich lang sind, und daß sowohl die erste Codesequenz als auch die zweite Codesequenz gleich lang sind, und daß das Verhältnis der ersten Codesequenz zur er- sten Datensequenz ferner so gewählt wird, daß auf jeden PCM-Abtastwert des Audiosignals ein Abtastwert des Zeit- signals, das die Informationen hat, die in das Audiosignal einzubringen sind, fällt. Dann kann das Kombinieren 34 ein- fach dadurch durchgeführt werden, daß beispielsweise die ge- wichtete spektrale Darstellung des Codemultiplex-Zeitsignals in den Zeitbereich transformiert wird und Abtastwert für Ab- tastwert mit dem Audiosignal addiert wird, um das Audiosi- gnal mit dem Zeitsignal zu beaufschlagen, das die einzubrin- genden Informationen aufweist. Anders ausgedrückt ist dann das ursprüngliche Audiosignal eine Folge von PCM-Abtastwer- ten, während das Audiosignal mit eingebrachten Informationen ebenfalls eine Folge von PCM-Abtastwerten ist, die sich je- doch üblicherweise in relativ kleinem Maße von den PCM-Ab- tastwerten des"unbehandelten"Audiosignals unterscheiden.

Abhängig von der Beschaffenheit des binären Signals, das die Informationseinheiten darstellt, findet das Beaufschlagen der ersten und zweiten Datensequenz mit der ersten bzw. zweiten Informationseinheit statt. Liegen die Informations- einheiten als Bits vor, bei denen eine"Null"durch einen negativen Pegel dargestellt wird, und bei denen eine"Eins" durch einen positiven Pegel dargestellt wird, d. h. durch ein antipodisches Signal, so findet das Beaufschlagen ein- fach durch einen Multiplikator statt. Im Falle einer Eins entspricht die erste verarbeitete Datensequenz identisch der ersten Datensequenz. Im Falle einer"Null"ist die erste verarbeitete Datensequenz das Negative der ersten Datense- quenz, d. h. die erste verarbeitete Datensequenz entspricht bis auf eine Phasendrehung von 180° der ersten Datensequenz.

Liegt das binäre Signal, das die erste und die zweite In- formationseinheit darstellt, jedoch als Signal vor, bei dem eine"Eins"durch einen positiven Pegel dargestellt wird, und eine"Null"durch einen Null-Pegel dargestellt wird, so muß statt des Multiplikators eine XOR-Verknüpfung eingesetzt werden, um die erste bzw. zweite verarbeitete Datensequenz zu erzeugen. Dasselbe gilt auch für die Einrichtungen 22,24 zum Spreizen der Informationskanäle. Liegen die Informa- tionskanäle als antipodische Signale vor, so wird das Sprei- zen durch einen Multiplikator erreicht, der jedes Bit des Informationskanals mit der gesamten Codesequenz multipli- ziert. Liegt der Informationskanal dagegen als Signal mit Pegeln von Null und Eins vor, so muß eine XOR-Verknüpfung zwischen dem Informationskanal und der entsprechenden Code- sequenz gewählt werden.

Für die nachfolgende Beschreibung wird von einem antipodi- schen Signal ausgegangen, d. h. ein binärer Wert von"Eins" wird durch einen positiven Pegel dargestellt, während ein binärer Wert von"Null"durch einen negativen Pegel darge- stellt wird oder umgekehrt. Soll ein Bit freigehalten wer- den, d. h. als"Platzhalter"dienen, so kann einfach der Wert dieses Bits auf Null gesetzt werden. Im Falle eines nicht-antipodischen Signals könnte dies durch einen negati- ven Pegel erreicht werden. Antipodische Signale können je- doch leichter Platzhalter beinhalten, weshalb dieselben be- vorzugt werden.

Fig. 2 zeigt eine detaillierte Darstellung der Quelle 10 für Informationen und der Einrichtungen 16a, 16b zum Erzeugen der verarbeiteten Datensequenzen sowie des Multiplexers 18, der als Ausgangssignal ein Zeitmultiplex-Datensignal lie- fert, das den ersten Informationskanal bildet. Zur Veran- schaulichung ist die Quelle für Informationen in Fig. 2 le- diglich als Quelle lOa für Informationen für den ersten In- formationskanal dargestellt. Gemäß einem bevorzugten Aus- führungsbeispiel der vorliegenden Erfindung enthält der er- ste Informationskanal vier Bits, d. h. BitO, Bitl, Bit2 und Bit3. Per Definition wird es bevorzugt, BitO, das die erste Informationseinheit darstellt, immer gleich 1 zu setzen.

Dieses Bit gibt einem Decodierer die Information, daß über- haupt eine Einbringung von Informationen stattgefunden hat, d. h. daß das Audiosignal ein Wasserzeichen trägt. Bitl wird als Platzhalter-Bit verwendet, um mit demselben das später beschriebene Remarking-Verfahren bewerkstelligen zu können.

Bitl kann somit den Pegel-1 für einen ersten logischen Zu- stand und +1 für einen zweiten logischen Zustand sowie 0 im Falle eines Platzhalters einnehmen. Bit2 trägt gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung die Information, daß ein einmaliges Kopieren des Audiosi- gnals erlaubt ist. Es kann Pegel von-1 oder +1 haben. Bit3 schließlich bedeutet, wenn es gesetzt ist, daß ein Kopieren des Stücks generell verboten ist. Falls einem Benutzer ein einmaliges Kopieren erlaubt ist, ist Bit3 nicht gesetzt, d. h. es hat einen Wert von-1, während Bit2 gesetzt ist, d. h. es hat einen Wert von 1. Ist dagegen Bit3 gesetzt, so ist der Wert von Bit2 unerheblich. Ist dagegen Bit2 gesetzt, d. h. einmal kopieren ist erlaubt, so wird Bit3 nicht gesetzt sein.

BitO wird, wie es bereits bezugnehmend auf Fig. 1 darge- stellt worden ist, mit der ersten Datensequenz unter Verwen- dung des Multiplizieres 16a multipliziert, um eine zeitliche Spreizung desselben zu erreichen. Am Ausgang des Multipli- zieres 16a liegt eine verarbeitete erste Datensequenz vor, die eine Mehrzahl von Bits aufweist, die alle den Informa- tionsgehalt von BitO tragen. Dasselbe gilt für Bitl, das hier bevorzugterweise als Platzhalterbit dient und die zwei- te Informationseinheit darstellt. Alternativ könnten auch die Bits 2 oder 3 die zweite Informationseinheit im Sinne von Fig. 1 sein. Bei dem in Fig. 2 dargestellten Ausfüh- rungsbeispiel der vorliegenden Erfindung werden vier TDMA- Zeitschlitze bzw."Zeitkanäle"verwendet, weswegen vier Ein- richtungen zum Beaufschlagen mit Datensequenzen 16a-16d vorgesehen sind. Die Datensequenz, die in den ersten Multiplizierer 16a eingespeist wird, unterscheidet sich jedoch von der Datensequenz, die in die anderen Multiplizie- rer 16b-16d eingespeist werden. Dies erlaubt es, daß BitO, d. h. die erste Informationseinheit, immer von den anderen Informationseinheiten unterschieden werden kann.

Aufgrund der ersten Datensequenz, die zum Spreizen von BitO verwendet wird, wird BitO als Synchronisationswort verwen- det. Im Sinne einer effizienten Übertragung wird BitO jedoch ebenfalls als Datenträger eingesetzt, nämlich als Signali- sierung, daß überhaupt ein Wasserzeichen in dem betrachteten Audiosignal vorliegt. BitO erfüllt somit eine Doppelfunktion und führt insbesondere dazu, daß für den zweiten Informati- onskanal keinerlei Synchronisationswörter mehr benötigt wer- den, wodurch der zweite Informationskanal voll und ganz zur Nutzdatenübertragung eingesetzt werden kann. Dieser Vorteil wird besonders daraus ersichtlich, daß sämtliche Informatio- nen ja unter die Maskierungsschwelle versteckt werden müs- sen. So kann es sein, daß nicht besonders viel Energie ver- bleibt, um Daten einzubringen. Dies wird der Fall sein, wenn das Audiosignal sehr tonal ist. Dann werden die Daten zwar in das Audiosignal eingebracht, ihre Energie ist jedoch der- art gering, daß das vorliegende Signal/Rausch-Verhältnis nicht mehr zu einem sicheren Decodieren ausreicht. Die in das Audiosignal eingebrachten Informationseinheiten, d. h.

BitO bis Bit3, werden jedoch zyklisch ständig in das Musik- stück eincodiert, so daß zumindest die Hoffnung besteht, in jedem zweiten, dritten bzw. z. B. zehnten Zyklus die Kopier- informationen sicher decodieren zu können. Es wird bevor- zugt, daß die Kopierinformationen möglichst durchgehend während des Stücks decodierbar sind, damit auch während des gesamten Stückes ein wirksamer Urheberrechtsschutz vorge- sehen werden kann.

Gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist ein Multiplexer 18 ein bitweiser Multiplexer, der immer nach einem Bit den nächsten Eingang mit seinem Ausgang verbindet. Dies führt zu einem ersten Informations- kanal, der eine verschachtelte, d. h."interleaved"Anord- nung der Ausgangssignale der Multiplizierer 16a-16d dar- stellt. Dies wird bezugnehmend auf Fig. 6B detaillierter erläutert.

Fig. 3 zeigt das analoge Szenario für den zweiten Informa- tionskanal, der beispielsweise Daten über den autorisierten Benutzer des Musikstücks, den ISRC oder allgemein beliebige Zusatzdaten aufweisen kann. Gemäß einem bevorzugten Ausfüh- rungsbeispiel der vorliegenden Erfindung wird bei dem zwei- ten Informationskanal eine vierkanalige Zeitmultiplex- Verarbeitung bevorzugt, derart, daß die Einrichtung 20 (Fig.

1) einen zum Multiplexer 18 ähnlichen Multiplexer 21 umfaßt, der ebenfalls eine bitweise Verschachtelung der einzelnen Kanäle durchführt. Es ist jedoch zu sehen, daß zur Erhöhung der Datenrate im zweiten Informationskanal keine Multiplika- tion der Daten mit einer ersten bzw. zweiten Datensequenz durchgeführt wird. Stattdessen wird der zweite Informations- kanal ohne eine derartige Spreizung mit Daten bedient. Wie es bereits erwähnt worden ist, führt die Spreizung mit der ersten Datensequenz bzw. der zweiten Datensequenz dazu, daß der Informationsgehalt der Bits 0 bis 3 entsprechend der Länge der ersten bzw. zweiten Datensequenz mehrmals übertra- gen werden, während im Vergleich dazu die Informationen im zweiten Informationskanal ohne eine solche Spreizung dem Multiplexer 21 zugeführt werden. Der erste Informationskanal weist daher eine wesentlich höhere Fehlersicherheit gegen- über dem zweiten Informationskanal auf. Im zweiten Informa- tionskanal können dafür wesentlich mehr Nutzdaten als im er- sten Informationskanal übertragen werden. Da jedoch eine zyklische Übertragung stattfindet und ferner eine Spreizung über der Frequenz wie es bezugnehmend auf Fig. 4 erläutert wird, stattfindet, kann dennoch davon ausgegangen werden, daß mit guter Wahrscheinlichkeit auch die Daten des zweiten Informationskanals bei der überwiegenden Anzahl von Musik- stücken sicher decodiert werden kann. Die Kopierschutzinfor- mationen werden daher möglichst fehlersicher über den ersten Informationskanal übertragen, während zusätzliche Informa- tionen weniger sicher, jedoch mit höherer Datenrate über den zweiten Informationskanal übertragen werden.

Die Spreizung des ersten Informationskanals und des zweiten Informationskanals wird im Falle der Verwendung von anti- podischen Signalen mittels zweier Multiplizierer 22 bzw. 24 (Fig. 4) durchgeführt, um den gespreizten ersten Informa- tionskanal und den gespreizten zweiten Informationskanal zu erhalten. Beide Informationskanäle werden Bit für Bit ad- diert, wodurch ein Codemultiplex-Zeitsignal geschaffen wird, das beide Informationskanäle umfaßt. Die Addition der beiden Kanäle hat ferner den zusätzlichen Nebeneffekt, daß die bei- den Kanäle immer voll und ganz aufeinander sychronisiert sind, wodurch der zweite Informationskanal unter Verwendung der ersten Informationseinheit des ersten Informationskanals synchronisiert werden kann. Damit steht der zweite Informa- tionskanal voll und ganz zur Nutzdatenübertragung zur Verfü- gung.

Wie es in Fig. 5 gezeigt ist, wird das Codemultiplex-Zeitsi- gnal anschließend einer vorzugsweise in Form einer schnellen Fouriertransformation (FFT) implementierten Frequenztrans- formation unterzogen, um die spektrale Darstellung zu erzeu- gen, die mit der durch die Einrichtung 30 zum Berechnen der psychoakustischen Maskierungsschwelle berechneten Maskie- rungsschwelle gewichtet wird. Am Ausgang der Einrichtung 32 liegt eine gewichtete spektrale Darstellung des Codemulti- plex-Zeitsignals vor, die die Information des ursprünglichen Codemultiplex-Zeitsignals trägt, deren Energie jedoch durch- gehend kleiner oder gleich der psychoakustischen Maskie- rungsschwelle ist. Das Ausgangssignal der Einrichtung 32 sowie das Audiosignal werden dann in der Einrichtung 34 zum Kombinieren kombiniert. Da das Ausgangssignal der Einrich- tung 32 im Frequenzbereich vorliegt, kann eine Umsetzung der Spektraldarstellung in eine zeitliche Darstellung mittels einer inversen schnellen Fouriertransformation 34a durchge- führt werden und eine anschließende abtastwertweise Addition 34b unter Verwendung eines einfachen Addierers. Alternativ kann das Audiosignal in den Frequenzbereich transformiert werden und mit dem Ausgangssignal der Einrichtung 32 direkt addiert werden, um anschließend wieder in den Zeitbereich transformiert zu werden. Diese Möglichkeiten sind prinzi- piell als gleichwertig anzusehen. Am Ausgang der Einrichtung 34 zum Kombinieren liegt somit das Audiosignal mit einge- brachten Informationen vor.

Fig. 6A zeigt einen prinzipiellen Überblick über die Kombi- nation der TDMA-Technik und der CDMA-Technik. Fig. 6A soll zudem die Flexibilität der vorliegenden Erfindung darstel- len. Prinzipiell ist eine beliebige Anzahl N von CDMA-Kanä- len möglich. Hierzu würden dann für jeden der N Kanäle eine Vorrichtung wie in Fig. 3 gezeigt vorgesehen werden, sowie eine entsprechende Anzahl von Einrichtungen zum Spreizen der weiteren Informationskanäle mit entsprechenden weiteren Codesequenzen. Für eine Anzahl N von CDMA-Kanälen, d. h. In- formationskanälen, wird somit eine gleiche Anzahl von zu- einander vorzugsweise orthogonalen Codesequenzen benötigt.

Fig. 6A zeigt zudem den TDMA-Aspekt der vorliegenden Erfin- dung, der durch die in Fig. 2 dargestellte Kombination aus Multiplizierern 16a-16d und Multiplexer 18 implementiert wird. Bei dem in Fig. 2 gezeigten Beispiel ist die Anzahl M gleich 4, d. h. es sind vier Zeitschlitze beschrieben. Da die Länge der Zeitschlitze a priori bekannt ist, können weitere Zeitschlitze ebenfalls mit der zweiten Datensequenz gespreizt werden. Der Synchronisationsvorteil gemäß der vor- liegenden Erfindung wird für zunehmende Anzahlen von Zeit- schlitzen sowie insbesondere Informationskanälen immer größer. Für den zweiten und jeden weiteren Informationskanal werden keinerlei Synchronisationspräambeln oder ähnliches benötigt. Sämtliche Kanäle können unter Verwendung der er- sten Informationseinheit synchronisiert werden.

Im nachfolgenden wird auf Fig. 6B Bezug genommen, die das Bitformat gemäß der vorliegenden Erfindung darstellt. In der Zeile ganz oben in Fig. 6B sind die vier Bits, d. h. BitO, Bitl, Bit2 und Bit3, dargestellt, die die erste Informa- tionseinheit, die zweite Informationseinheit, die dritte Informationseinheit bzw. die vierte Informationseinheit dar- stellen (40). In der zweiten Zeile 42 ist das Bitformat vor dem Multiplexer 18 dargestellt. Bei dem in Fig. 6B betrach- teten Ausführungsbeispiel der vorliegenden Erfindung betra- gen die Längen der ersten und der zweiten Datensequenz je- weils 31 Bit. Beide Datensequenzen erstrecken sich somit von einem BitO zu einem Bit30. Die Einrichtungen 16a, 16b zum Erzeugen der ersten bzw. zweiten verarbeiteten Datensequenz führen somit zu einer 31-fachen Spreizung der Informations- einheiten Nummer 1 bis Nummer 4.

Wie es bereits dargestellt worden ist, führt der Multiplexer 18 gemäß einem bevorzugten Ausführungsbeispiel der vorlie- genden Erfindung nicht nur ein einfaches Multiplexen der verarbeiteten Datensequenzen durch, sondern auch gleichzei- tig vorzugsweise ohne zusätzliche Elemente eine Verschachte- lungsoperation. Dies ist durch die Pfeile zwischen der Zeile 42 und einer Zeile 44 dargestellt. Die Bits mit der Nummer 0 der Zeile 42 werden alle an die ersten vier Positionen der Zeile 44 geschrieben. Die Bits mit der Nummer 1 werden ana- log an die zweiten vier Positionen der Zeile 44 geschrieben.

Dies wird fortgesetzt bis zu den Bits mit der Nummer 30, die an die letzten vier Positionen der Zeile 44, die den ersten Informationskanal darstellt, geschrieben werden. Die Länge des ersten Informationskanals beträgt nun 4 x 31 = 124 Bit.

Aufgrund der ersten und der zweiten Datensequenz wurde die Bitrate des ersten Informationskanals um das 31-fache redu- ziert.

Die Spreizung des ersten Informationskanals mit der ersten Codesequenz, die bei dem hier betrachteten Ausführungsbei- spiel der vorliegenden Erfindung eine Länge von 2048"Chips" hat, ist in der letzten Zeile 46 in Fig. 6B dargestellt. Ein Chip ist, wie es im Bereich der Spreizbandtechnik bekannt ist, eine Einheit einer Spreizsequenz. Die Länge eines Chips ist allgemein frei wählbar. Für die vorliegende Erfindung wird es jedoch bevorzugt, daß die Länge eines Chips der Länge eines Audioabtastwerts entspricht, damit eine abtast- wertweise Zuordnung zwischen dem Audiosignal und dem gewich- teten Codemulitplex-Zeitsignal ohne dazwischenliegende Ab- tastumwandler etc. möglich ist.

Die Länge des ersten Informationskanals beträgt somit nach einer Spreizung sämtlicher Bits der Zeile 44 124 x 2048 253.952 Abtastwerte. Die Datenratenreduktion von der Zeile 40 bis zur Zeile 46 bezogen auf ein Bit entspricht dem Produkt der Längen der Datensequenz und der Codesequenz und umfaßt beim vorliegenden Beispiel eine Reduktion um das 63488-fache. Durch die Reduktion der Datenrate wird ein sogenannter Codiergewinn erreicht, der sich unmittelbar auf das Signal/Rausch-Verhältnis im Decodierer auswirkt. Der hohe erreichte Codiergewinn trägt dazu bei, daß die Informa- tionen trotz ihrer geringen Energie, die unterhalb der Mas- kierungsschwelle liegen muß, sicher decodiert werden können.

Im nachfolgenden wird auf ein Verfahren und eine Vorrichtung zum Ermitteln der in das Audiosignal eingebrachten Infor- mationen beschrieben. Fig. 7 zeigt ein Übersichtsdiagramm.

Das Audiosignal samt den eingebrachten Informationen wird in eine Einrichtung 70 zum Extrahieren des ersten Informations- kanals und in eine Einrichtung 72 zum Extrahieren des zwei- ten Informationskanals eingespeist. Die beiden Einrichtungen 70 und 72 sollen die durch die Einrichtungen 22,24 (Fig. 1) eingeführte Spreizung wieder rückgängig machen. Die Ein- richtung 70 wird dabei mit der ersten Codesequenz gespeist, während die Einrichtung 72 mit der zweiten Codesequenz ge- speist wird. An den Ausgängen der Einrichtungen 70 und 72 liegen dann der erste Informationskanal und der zweite In- formationskanal vor.

Im Falle einer Verschachtelung der verarbeiteten Datense- quenzen, wie sie in Fig. 6B dargestellt ist und durch den bitweise umschaltenden Multiplexer 18 (Fig. 2) bewirkt wird, wird der erste Informationskanal in einen Demultiplexer 74 eingespeist, um im allgemeinen Fall mindestens zwei Daten- ströme zu erzeugen, von denen jedoch noch nicht bekannt ist, welcher der erste verarbeitete Datenstrom ist, und welcher der zweite verarbeitete Datenstrom ist.

Die Identifikation der beiden Datenströme am Ausgang des Demultiplexers 74 wird mittels einer Einrichtung 76 zur Identifikation der Datenströme erreicht. Hierzu werden beide Datenströme einer Korrelation mit der ersten Datensequenz unterzogen. Nur der Datenstrom, der unter Verwendung der ersten Datensequenz erzeugt worden ist, wird signifikante Ausgangsspitzen bei einer derartigen Korrelation erzeugen.

Der andere Datenstrom wird aufgrund der möglichst orthogo- nalen Eigenschaften der ersten und der zweiten Datensequenz lediglich nicht bedeutsame Spitzen in der Korrelation mit der ersten Datensequenz ergeben.

Falls jedoch keine Verschachtelung der verarbeiteten Daten- sequenzen durchgeführt wird, würden in Zeile 44 von Fig. 6B immer 31 Bits entsprechend den verarbeiteten Datensequenzen hintereinander stehen. In diesem Fall muß kein Demultiplex durchgeführt werden. Stattdessen wird zur Feststellung der ersten verarbeiteten Datensequenz der erste Informationska- nal einer Korrelation mit der ersten Datensequenz unterzo- gen. Tritt eine Spitze auf, so weiß man, daß dort die verar- beitete erste Datensequenz ist, und daß dann die verarbei- tete zweite Datensequenz und nacheinander eventuelle weitere verarbeitete zweite Datensequenzen folgen. Der Einrichtung zum Feststellen könnte dann ein Demultiplexer nachgeschaltet sein, der abhängig von der Korrelationsspitze startet und immer nach 31 Bits umschaltet. Wie es jedoch bereits ausge- führt worden ist, umfaßt ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung das Verschachteln, um weitere Übertragungssicherheit gegenüber kurzen zeitlichen"Störun- gen", d. h. Bereichen mit niedriger Maskierungsschwelle, zu erhalten.

Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden im Schritt des Feststellens und im Schritt des Extrahierens der ersten Informationseinheit nicht nur eine einzige sondern voneinander unabhängige Korrelationen mit der ersten Datensequenz berechnet. Dies hat den Vorteil, daß während des Extrahierens dauernd überprüft werden kann, ob die verarbeitete Datensequenz, die für die erste verar- beitete Datensequenz gehalten wird, auch tatsächlich die verarbeitete erste Datensequenz ist. Damit kann ein Angriff, um das Wasserzeichen unlesbar zu machen, indem genau 2048 Abtastwerte des Audiosignals entfernt werden, abgewehrt wer- den.

Alternativ kann jedoch auf Kosten der Sicherheit gegenüber Angriffen, um Rechenzeit zu sparen, die Korrelation im Schritt des Feststellens nur ein einziges Mal durchgeführt werden, um dadurch die Datensequenzen für das gesamte Audio- signal festzulegen, d. h. den Demultiplexer zu initialisie- ren. Selbstverständlich könnte eine derartige Initialisie- rung des Demultiplexers auch zu bestimmten Zeitpunkten im Audiosignal, z. B. alle fünf Minuten oder immer zu Beginn eines neuen Stücks etc. durchgeführt werden.

Nachdem die beiden Datenströme in der Einrichtung 76 identi- fiziert worden sind, wird die erste Informationseinheit in einer Einrichtung 78 extrahiert, während die zweite Infor- mationseinheit in einer Einrichtung 80 extrahiert wird. Dazu wird die Einrichtung 78 mit der ersten Datensequenz gespeist und korreliert, wie es in der Technik bekannt ist. Analog dazu wird die Einrichtung 80 mit der zweiten Datensequenz gespeist, um schließlich ausgangsseitig die erste Informa- tionseinheit und die zweite Informationseinheit auszugeben.

Ein Vorteil gemäß der vorliegenden Erfindung besteht darin, daß die Ausgabe der Einrichtung 78 zum Extrahieren der er- sten Informationseinheit ebenfalls als Synchronisationssi- gnal für die Ermittlung der Informationseinheiten, die in dem zweiten Informationskanal codiert sind, verwendet wird.

Dies ist in Fig. 7 durch einen Synchronisationsausgang 82 dargestellt.

Das Synchronisationssignal an dem Ausgang 82 wird in eine Einrichtung 84 zum Ermitteln der Informationseinheiten des zweiten Informationskanals eingespeist, die mit dem Ausgang der Einrichtung 72 zum Extrahieren des zweiten Informa- tionskanals aus dem mit Informationen versehenen Audiosignal verbunden ist. Aufgrund des Synchronisationssignals von dem ersten Informationskanal weiß die Einrichtung 84 zum Ermit- teln der Informationseinheiten aus dem zweiten Informations- kanal, wann ein neuer Zyklus im zweiten Informationskanal beginnt. Dies erlaubt eine korrekte Zuordnung der Bits zu ihrer Bedeutung, d. h. daß beispielsweise eine erste Anzahl von Bits den ISRC codiert, während die daran anschließende Anzahl von Bits den Benutzer identifiziert, usw.

In Fig. 8 wird detaillierter auf den Eingangsabschnitt der in Fig. 7 gezeigten Vorrichtung eingegangen. Das Audiosignal . wird in die Einrichtungen 70 und 72 eingespeist. Die Ein- richtung 70 ist vorzugsweise als sogenanntes Matched-Filter ebenso wie die Einrichtung 72 implementiert, wobei das Matched-Filter zum Extrahieren des ersten Informationskanals eine Korrelation des Audiosignals mit der ersten Codesequenz durchführt, während das Matched-Filter eine Korrelation des Audiosignals mit der zweiten Codesequenz durchführt, um ausgangsseitig sowohl den ersten Informationskanal als auch den zweiten Informationskanal zu erzeugen.

Im nachfolgenden wird auf Fig. 9 Bezug genommen, das zur Verbesserung des Verständnisses eine schematische Darstel- lung des zeitlichen Ausgangssignals des Matched-Filters 70, d. h. des ersten Informationskanals darstellt. Ergibt die Korrelation, die durch das Filter 70 durchgeführt wird, eine Übereinstimmung zwischen der ersten Codesequenz und den emp- fangenen Audiodaten, so wird das Filter 70 einen hohen Pegel 90 ausgeben. War der Ausschnitt des Audiodatenstroms gleich- phasig zu der ersten Codesequenz, so ergibt sich eine posi- tive Spitze 90. Ist der Ausschnitt des Bitstroms dagegen ge- genphasig zu der ersten Codesequenz, so ergibt sich eine ne- gative Spitze, die beispielhaft durch das Bezugszeichen 92 bezeichnet ist. Zwischen den Spitzen 90 und 92 wird das Fil- ter ebenfalls Ausgangssignale 94 liefern, die bezüglich ih- rer Amplitude jedoch stark gegenüber den Spitzen 90 und 92 zurücktreten werden.

Im nachfolgenden wird auf Fig. 10 Bezug genommen, die eine beispielhafte Schaltung zeigt, um aus dem in Fig. 9 darge- stellten Zeitsignal ein binäres Signal zu erzeugen, wie es ganz rechts in Fig. 10 schematisch dargestellt ist. Hierzu wird beispielsweise das Ausgangssignal des Filters 70 in ei- nen Schalter 96 eingespeist, der auch als Dezimierer im Ver- hältnis 2048 : 1 aufgefaßt werden kann. Wird in einem Spitzen- synchronisationsblock 98 erfaßt, daß das aktuell anliegende Signal eine Schwelle überschreitet, so wird der Schalter kurzgeschlossen, und das aktuell anliegende Signal wird von dem Schalter 96 durchgeschaltet. Ist dagegen das Eingangs- signal in die Spitzensynchronisationsschaltung 98 geringer als eine Schwelle, so bleibt der Schalter getrennt, und es wird nichts durchgeschaltet. Wenn Fig. 9 betrachtet wird, so wird der Schalter 96 alle 2048 Taktperioden durchgeschaltet.

Ein Vorzeichenbestimmungsblock 100 mißt das Vorzeichen des Pulses und erzeugt ein positives Ausgangssignal mit einer beliebig wählbaren Amplitude im Falle einer positiven Spitze 90 (Fig. 9) oder ein negatives Ausgangssignal mit einer be- liebigen Amplitude im Falle einer negativen Spitze 92 (Fig.

9). An dieser Stelle sei angemerkt, daß durch die Vorzei- chenbildung des Blocks 100 wieder eine Unabhängigkeit von der Signalamplitude im Audiosignal erreicht wird. Das Aus- gangssignal, das ganz rechts in Fig. 7 symbolisch darge- stellt ist, hat eine Amplitude, die durch den Block 100 festgelegt ist und mit der Amplitude der in das Audiosignal eingebrachten Signale nichts mehr zu tun hat. Die bezüglich des ersten Informationskanals beschriebene Schaltung kann ohne weiteres auch für die Dezimierung und Impulsformung des zweiten Informationskanals eingesetzt werden, wie es in Fig.

10 dargestellt ist.

In Fig. 11 ist eine detailliertere Darstellung der Einrich- tung 76 zum Identifizieren der von dem Demultiplexer 74 aus- gegebenen Datenströme dargestellt. Es sei darauf hingewie- sen, daß das in Fig. 11 dargestellte Decodiererbeispiel zu dem in Fig. 2 dargestellten Codiererbeispiel analog ist und ebenfalls dem in Fig. 6B dargestellten Bitformat entspricht.

Bei dem hier dargestellten Ausführungsbeispiel wurden vier "zeitliche"Kanäle oder Zeitschlitze demultiplext, um den ersten Informationskanal 44 zu erzeugen. Der Demultiplexer 74 führt nun in Analogie zu dem Multiplexer 18 eine Demul- tiplexoperation durch, derart, daß immer ein Bit in einen Ausgang gegeben wird, und das nächste Bit in den nächsten Ausgang gegeben wird, usw. Alle vier Ausgänge des Demul- tiplexers 74 werden durchgehend einer Korrelation durch die Korrelatoren 76a-76d unterzogen. Die Korrelatoren 76a-76d werden alle mit der ersten Datensequenz gespeist. Das heißt, daß nur der Korrelator, der die erste verarbeitete Daten- sequenz erhält, ein markantes Ausgangssignal erzeugen wird, während die anderen Korrelatoren kein markantes Ausgangssi- gnal erzeugen werden, da die Kreuzkorrelation zwischen der ersten Datensequenz und der zweiten Datensequenz aufgrund der bevorzugten Orthogonalität zwischen den beiden Datense- quenzen sehr kleine Werte annehmen wird. In einem Block 76e zur Spitzenerfassung, d. h. zur Erfassung, welcher Korrela- tor Spitzen ausgibt, werden die Ausgangssignale der vier Korrelatoren 76a-76d in die Einrichtung 76e eingespeist, die ebenfalls wieder vorzugsweise unter Verwendung einer Schwellwertentscheidung den Korrelator identifiziert, der Spitzen ausgibt. Die Einrichtung 76e liefert somit eine Zu- ordnungsvorschrift zu einem Deinterleaver 76f, der vier Eingänge und vier Ausgänge aufweist, wobei jeder Eingang mit jedem Ausgang verbunden ist.

Der Ausgang des Deinterleavers 76f ist derart gesteuert, daß die Signale jedes Eingangs der vier Eingänge selektiv abge- nommen werden können, wie es durch die in Fig. 11 gezeigten gesteuerten Schalter schematisch veranschaulicht ist. Wird beispielsweise erfaßt, daß der Korrelator 76b Spitzen aus- gibt, so muß davon ausgegangen werden, daß auf dem zweiten Eingang von oben des Deinterleavers 76f die erste verarbei- tete Datensequenz anliegt. Die durch die Einrichtung 76e ausgegebene Zuordnungsvorschrift wäre dann derart gewählt, daß der Schalter, der mit dem obersten Ausgang des Deinter- leavers 76f verbunden ist, das Eingangssignal von dem zweit- obersten Eingang zu dem obersten Ausgang leiten wird. Auf- grund der im Codierer festgelegten Reihenfolge ist die Zu- ordnungsvorschrift dann derart gewählt, daß der zweite Aus- gang von oben des Deinterleavers mit dem dritten Eingang von oben verbunden wird. Der dritte Ausgang wurde dann mit dem vierten Eingang verbunden werden, während der vierte Ausgang mit dem ersten Eingang von oben verbunden wird. Am Ausgang des Deinterleavers, der dem Ausgang der Identifikationsein- richtung 76 von Fig. 7 entspricht, liegen somit vier verar- beitete Datensequenzen vor, von denen bekannt ist, daß am obersten Ausgang die erste verarbeitete Datensequenz an- liegt, in der die erste Informationseinheit enthalten ist, daß am zweiten Ausgang die zweite verarbeitete Datensequenz anliegt, in der die zweite Informationseinheit enthalten ist, und daß weitere verarbeitete Datensequenzen anliegen, in denen weitere Informationseinheiten enthalten sein konnen.

Damit ist bekannt, welcher Datenstrom welche verarbeitete Datensequenz ist. Die Einrichtung 76e zur Spitzenerfassung hat ferner einen weiteren Ausgang zum Ausgeben der Zuord- nungsvorschrift, da dieselbe ebenfalls bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung für den zwei- ten Informationskanal (Fig. 14) benötigt wird.

Fig. 12 zeigt eine detailliertere Darstellung der Einrich- tungen 78,80. Die Einrichtung 78 zum Extrahieren der ersten Informationseinheit umfaßt vorzugsweise ebenso wie die Ein- richtung 70 oder 72 ein Matched-Filter 78a, dem ein Schwel- lenentscheider 78b nachgeschaltet ist. Entsprechendes trifft für die verarbeitete zweite Datensequenz zu, d. h. die Ein- richtung 80 zum Extrahieren der zweiten Informationseinheit umfaßt ein Matched-Filter 80a sowie einen nachgeschalteten Schwellenentscheider 80b. Im Falle der hier beschriebenen Ausführungsform mit vier Zeitschlitzen sind weitere Matched-Filter und nachgeschaltete Schwellenentscheider vor- gesehen, die zu den Elementen 80a bzw. 80b identisch sein können. Der Unterschied der Matched-Filter 78a und 80a besteht darin, daß das Matched-Filter 78a auf die erste Datensequenz abgestimmt ist, während das Matched-Filter 80a auf die zweite Datensequenz abgestimmt ist.

Aufgrund der Tatsache, daß bei dem Einbringen der Informa- tionen in das Audiosignal zunächst eine 31-fache Spreizung durchgeführt worden ist, kann davon ausgegangen werden, daß das Ausgangssignal P des Matched-Filters 78a 30 mal einen relativ kleinen Wert ausgibt, wie es in Fig. 13 gezeigt ist, und dann einmal einen relativ großen Wert ausgibt, der, falls keine Bits verloren worden sind, eine relative Höhe von 31 haben wird. Selbstverständlich muß zur Decodierung der Informationseinheit das Ausgangssignal des Matched-Fil- ters nicht die relative Höhe von 31 haben, sondern es dürfte aufgrund der vozugsweise verwendeten orthogonalen Pseudo- Noise-Rauscheigenschaft auch ein deutlich geringerer Korre- lationswert ausreichen, wie beispielsweise der Wert 25. Alle 31 Perioden werden ferner die Schwellenentscheider 80b für den zweiten bis vierten Zeitschlitz ein positives bzw. nega- tives Ausgangssignal liefern, derart, daß ein Decodierer weiß, ob ein einmaliges Kopieren erlaubt ist, ob das Kopie- ren generell verboten ist, bzw. ob bereits eine Kopie durch- geführt worden ist, d. h. ob das Platzhalter-Bit gesetzt ist, wie es weiter hinten ausgeführt wird.

In Fig. 14 ist die Einrichtung 84 zum Ermitteln der Informa- tionseinheiten des zweiten Informationskanals dargestellt.

Dieselbe umfaßt in Analogie zum Codierer, der anhand von Fig. 3 dargestellt worden ist, einen Demultiplexer 84a sowie einen Deinterleaver 84b, dem schließlich eine Einrichtung 84c zum Ermitteln der Informationseinheiten des zweiten In- formationskanals nachgeschaltet ist. Die Einrichtung 84c zum Ermitteln der Informationseinheiten des zweiten Informa- tionskanals wird ausgangsseitig die Ausgangsdaten in den vier Zeitschlitzen des zweiten Informationskanals ausgeben, die beispielsweise Benutzerdaten, der ISRC sowie beliebige weitere Zusatzdaten sein können. Dazu wird der zweite Infor- mationskanal mittels eines Demultiplexers 84a, der in Analo- gie zum Demultiplexer 74 (Fig. 11) arbeitet, in vier Daten- ströme demultiplext. Aufgrund der Tatsache, daß die beiden Informationskanäle synchron zueinander codiert worden sind, muß für den zweiten Informationskanal keine eigene Identi- fikation durchgeführt werden. Stattdessen kann die Zuord- nungsvorschrift vom ersten Informationskanal verwendet wer- den, um die Eingangs/Ausgangs-Verbindungen des Deinterlea- vers 84b entsprechend einzustellen. Wurden die beiden Infor- mationskanäle genau synchron zueinander codiert, so werden die Eingangs/Ausgangs-Verbindungen identisch zum Deinterlea- ver 76f sein.

Wurde jedoch im Codierer eine feste Verzögerung um eine bestimmte Anzahl von Bits zwischen dem ersten und dem zwei- ten Informationskanal eingesetzt, so kann diese Veränderung über eine einfache Modifikation der Zuordnungsvorschrift hier berücksichtigt werden.

Am Ausgang des Deinterleavers 84b liegen somit wiederum vier Datenströme vor, von denen bekannt ist, welcher Datenstrom welche Information (DataO, Datal, Data2 bzw. Data3) trägt.

Nachdem der zweite Informationskanal keinerlei eigene Synchronisationsinformationen aufweist, um seine Nettodaten- rate möglichst groß zu halten, ist es jedoch noch nicht bekannt, wann ein Datenwort tatsächlich beginnt. Dieser Beginn wird durch das Synchronisationssignal vom ersten Informationskanal, dessen Ableitung bezugnehmend auf Fig. 12 beschrieben worden ist, signalisiert. Empfängt die Einrich- tung 84c ein Synchronisationssignal, so weiß sie, daß nun ein Datenwort beginnt. Es sei darauf hingewiesen, daß ein Datenwort am Ausgang der Einrichtung 84c bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung aus mehreren Bits bestehen wird, während die"Datenwörter"am Ausgang des D-Interleavers 76f (Fig. 11) lediglich ein einziges Bit umfassen. Bei den gewählten Längen der Datensequenzen hat ein Datenwort am Ausgang der Einrichtung 84c (Fig. 14) genau 31 Bit, bis ein neues Synchronisationssignal vom ersten Informationskanal kommt, um einen neuen Informationszyklus einzuleiten.

Wie es bereits dargestellt worden ist, ermöglicht das er- findungsgemäße Konzept die Realisierung von bezüglich Re- chenleistung und damit Kosten skalierbaren Decodierern, d. h. Vorrichtungen zum Ermitteln von in das Audiosignal ein- gebrachten Informationen. Ist ein preisgünstiger Consumer- Decoder nur an den Kopierinformationen, d. h. am ersten In- formationskanal, interessiert, so wird er die Decodierung des zweiten Informationskanals einfach unterlassen, d. h. er wird die Einrichtungen 72,84 von Fig. 7 benötigen. Dies wurde beim bevorzugten Beispiel zu einer Rechenzeitein- sparung von nahezu 50% im Vergleich zu dem Fall führen, bei dem die Informationen auf der Quelle 10 nur mittels eines einzigen Kanals in das Audiosignal eingebracht worden sind.

Wie es bereits mehrfach ausgeführt worden ist, ermöglicht das Unterteilen eines CDMA-Kanals in einzelne Zeitschlitze des nachträgliche Bearbeiten des Wasserzeichens, d. h. der eingebrachten Informationen. Dazu wird beim ersten Ein- bringen der Informationen der Wert des Bits 1 (Fig. 2) auf Null gesetzt, d. h. nicht mit Daten"aufgefüllt". Ein geeig- netes Remark-Programm kann dann nachträglich die Lücke des Platzhalter-Bits Bitl (Fig. 2) auffinden und dann das ge- wünschte Wasserzeichen setzen. Das Remark-Programm könnte beispielsweise durch einen Kopiervorgang aktiviert werden und nach einem erfolgten Kopieren das Bitl mit Informationen beaufschlagen. Es wurde dann folgendermaßen vorgehen.

Zunächst muß das Remark-Programm unter Verwendung der ersten Codesequenz den ersten Informationskanal aus dem bereits be- stehenden Wasserzeichen extrahieren. Dies wird durch die Einrichtung 70 bewerkstelligt. Daran anschließend wird das Remark-Programm die bezüglich der Fig. 8-12 beschriebenen Operationen durchführen, um das Synchronisationssignal zu eruieren. Das Remark-Programm muß wissen, wo das Platzhal- ter-Bit, d. h. Bitl (Fig. 12) ist. Nachdem das Remark-Pro- gramm festgestellt hat, wo die zeitliche Lage des Bits ist, wird es das Bitl (Fig. 2) setzen, d. h. mit einem Wert versehen, die zweite Datensequenz damit beaufschlagen, Mul- tiplexen und mit der ersten Codesequenz spreizen, um schließlich nach einer"redundaten"Addition und Transfor- mation einer Gewichtung und Kombination unterzogen zu wer- den. Im Gegensatz zum ursprünglichen Einbringen des Wasser- zeichens werden die genannten Schritte jedoch lediglich aus- schließlich mit dem zweiten Informationsbit durchgeführt, während das Remark-Programm sämtliche anderen Informations- bits des ersten Informationskanals und auch des zweiten In- formationskanals zu Null setzt bzw. überhaupt nicht behan- delt. Das Codemultiplex-Zeitsignal am Ausgang des Addierers 26 wird daher lediglich einen Verlauf haben, der der Energie aufgrund des nun gesetzten Platzhalters entspricht.

Energiemäßig betrachtet bedeutet dies, daß beim ersten Ein- bringen des Wasserzeichens in das Audiosignal die verfügbare Störenergie noch nicht voll ausgenutzt worden ist, d. h. die Energie liegt etwas unter der Maskierungsschwelle. Erst wenn dann das Remark-Programm das Platzhalterbit in das Audiosi- gnal eingebracht hat, ist die psychoakustische Störenergie bis zur Maskierungsschwelle bzw. bis zu dem gewählten Wert in der Nähe der Maskierungsschwelle aufgefüllt. Damit kann das Remark-Programm nachträgliche Änderungen des Wasserzei- chens durchführen, ohne daß die Audioqualität leidet. Dies erlaubt eine schrittweise Einbringung von Wasserzeichen wie folgt. Ein Hersteller eines Stücks könnte beispielsweise in das fertig produzierte Musikstück lediglich den ISRC sowie weitere zusätzliche Informationen im zweiten Informations- kanal ebenso wie BitO des ersten Informationskanals einbrin- gen, was zu einem vom Hersteller identifizierten Musikstück führt, das noch keinerlei Kopierinformationen hat. Ein Ver- teiler für Musikstücke, der die vom Hersteller der Musik- stücke bearbeiteten Audiosignale erhält und an einzelne Kun- den weiterverkauft, könnte dann unter Verwendung eines ge- eigneten Remark-Programms sowohl die Kopierinformationen des ersten Informationskanals als auch Benutzerinformationen über den eventuellen Käufer in das Audiosignal einmischen, ohne daß das Wasserzeichen des ursprünglichen Herstellers verändert werden muß bzw. neu verarbeitet werden muß. Der Käufer schließlich, der sich im Besitz eines autorisierten Decodierers befindet, könnte dann ebenfalls unter Verwendung eines speziell für ihn vorgesehenen Remark-Programms nach erfolgter Kopie das Kopierbit setzen und eincodieren. Es wird besonders darauf hingewiesen, daß dieses schrittweise Ergänzen des Wasserzeichens ohne Änderung des vorherigen Wasserzeichens ohne Beeinträchtigung der Audioqualität durchgeführt wird, da erst im letzten vorgesehenen Remark- Schritt die zur Verfügung stehende Energie vollständig aus- geschöpft wird. Damit ist zu sehen, daß das erfindungsgemäße Verfahren hohe Flexibilität sowohl auf der Codiererseite als auch auf der Decodiererseite ermöglicht.

Um noch größere Manipuliersicherheit zu erreichen, wird er- findungsgemäß der Fall berücksichtigt, daß ein Angreifer sämtliche Audiosignalabtastwerte um 180° invertiert. Es sei darauf hingewiesen, daß diese Invertierung zu keiner hörba- ren Störung führt, daß jedoch ein Decodierer zum Decodieren des Wasserzeichens nicht mehr korrekt arbeiten kann, wenn nicht spezielle Vorkehrungen getroffen werden. Es wurde aus- geführt, daß die erste Informationseinheit bzw. bevorzug- terweise das erste Bit, d. h., BitO immer zu Eins gesetzt wird, um zu signalisieren, daß das Audiosignal eingebrachte Informationen aufweist. Um gegenüber Phasendrehungen um 18G° immun zu sein, wird daher beispielsweise zwischen dem Matched-Filter 78a und dem Schwellenentscheider 78b in Fig.

12 eine Vorzeichenbestimmung durchgeführt. Tritt hier eine negative Spitze auf, so weiß der Decodierer per Definition, daß eine Phasenumkehrung um 180° durchgeführt worden ist, da hier nur positive Spitzen zu erwarten sind. Es wird daher eine Phasenumkehrung der Spitzen in Form einer Betragsbil- dung durchgeführt. Um jedoch die 180° Phasendrehung auch für die restlichen Zeitschlitze des ersten Informationskanals und auch für den zweiten Informationskanal zu berücksich- tigen, wird auch eine Phasenumdrehung der Ausgangssignale der entsprechenden Matched-Filter durchgeführt, die dann aktiviert wird, wenn eine negative Spitze hinter dem Matched-Filter 78a erkannt worden ist. Wenn keine negative Spitze erkannt wird, werden die Phasenumkehrungen deakti- viert, und die Signale laufen so wie sie von den jeweiligen Filtern ausgegeben werden, in die Schwellenentscheider hinein. Damit wird ein Angreifer durch eine Phasenumkehrung um 180° keinen Erfolg dabei haben, ein in ein Audiosignal eingebrachtes Wasserzeichen unlesbar zu machen. Er wird daher nach wie vor aufgrund seiner Benutzeridentifikation ermittelt werden können.

Previous Patent: RADIO SYSTEM FOR WARNING THE GENERAL POPULATION

Next Patent: PROGRAM EVALUATING DEVICE, PROGRAM EVALUATION DATA TALLYING DEVICE, PROGRAM EVALUATING METHOD, AND R...