-
TECHNISCHES GEBIET
-
Die
vorliegende Erfindung betrifft im Allgemeinen das Gebiet der Unterhaltungselektronik,
und insbesondere das Aktualisieren von Zusatzdaten, die in Audiosamples
eines Mediensignals vorgesehen sind.
-
STAND DER TECHNIK
-
Es
besteht ein Bedarf, abrufbare Zusatzinformation bereitzustellen,
die sich auf Audiosamples eines Mediensignals bezieht oder nicht.
Diese Zusatzinformation kann ein zusätzlicher Kommentar, der zum
Beispiel ein anzeigbarer Untertitel oder Text ist, ein zusätzlicher
Tonkanal, ein mehrsprachiger Sprachdienst, Karaoke oder Video sein.
Die Information kann auch Information über die Anzahl der Kopien sein,
die vom Käufer
eines Inhalts angefertigt werden dürfen.
-
WO-A-95/18523 beschreibt
die Verwendung eines verborgenen Datenkanals für derartige Zusatzdaten in
den niederwertigsten Bits von Samples von codiertem Ton. Das Dokument
beschreibt auch die Verwendung einer speziellen Verarbeitung, um
zu bestimmen, wie viele der Samples für den Datenkanal genutzt werden
können.
Dazu wird das Schallspektrum analysiert, und ein Maskierungsfehler
wird bestimmt, unter welchem der Einfluss der Information im verborgenen
Datenkanal vorzusehen ist, um nicht wahrnehmbar zu sein.
-
Diesbezüglich besteht
für den
Käufer
eines Inhalts ein Bedarf, die Zusatzdaten aktualisieren zu können. Ein
solches Beispiel ist, dass der Besitzer eines bestimmten Inhalts
berechtigt sein kann, eine Anzahl von Kopien des Inhalts anzufertigen.
Es wäre daher
vorteilhaft, wenn der Inhalt Zusatzinformation einschließen könnte, die
von einem Benutzer beeinflusst werden kann, wie das Ändern des
Werts eines Kopierzählers.
Andere Beispiele können
das Einfügen
eigener Kommentare in ein Musikstück beinhalten.
-
Bei
der Aktualisierung der Daten im verborgenen Datenkanal wird oft
eine sogenannte Tandem-Codierung des eigentlichen Audiosignals durchgeführt, was
bedeutet, dass die Samples des Mediensignals mehreren Codierungs-
und Decodierungsschritten unterzogen werden. Dabei geht die Spektralform
der Zusatzinformation verloren, was bedeutet, dass die obige Analyse
zum Einfügen
der neuen Zusatzdaten in die Samples wiederholt werden müsste, um
zu bestimmen, wie die aktualisieren Daten einzufügen sind, ohne wahrnehmbar
zu sein. Abgesehen davon, dass dies kompliziert durchzuführen ist,
würde die
dazu benötigte
Vorrichtung teuerer werden, was nachteilig ist, wenn die Vorrichtung
für einen
Verbrauchermarkt bestimmt ist.
-
Prandoni
P. und Vetterli M.: „Perceptually
hidden data transmission over audio signals", IEEE ICASSP 1998, offenbaren eine
Datenübertragungsgrundstruktur,
um Digitaldaten auf nicht oder kaum wahrnehmbare Weise in ein Audiosignal
einzubetten. Das resultierende Signal kann unverändert ohne Verlust an akustischer
Qualität
wiedergegeben werden; die eingebetteten Daten können im Decoder genau wiederhergestellt
werden. Der Übertragungsprozess nutzt
die Wahrnehmungsredundanz des Audiosignals aus, um den akustischen
Einfluss der eingebetteten Daten zu verbergen; das Codieren von
Nebeninformation wird verwendet, um den Empfänger der zeitveränderlichen
Struktur über
die Maskierungseigenschaften des Audiosignals zu informieren.
-
Demnach
besteht ein Bedarf nach einem Verfahren zum Einfügen von Daten in einen verborgenen
Datenkanal, das die Änderung
der Daten erlaubt und es ermöglicht,
diese Änderung
ohne Verschlechterung der Tonqualität durchzuführen, und ohne die Vorrichtung,
die die Änderung/den
Zusatz von Daten durchführt,
komplexer und dadurch teurer zu machen.
-
KURZDARSTELLUNG DER ERFINDUNG
-
Eine
Aufgabe der vorliegenden Erfindung ist daher die Bereitstellung
eines Verfahrens zum Ändern
der verborgenen Daten in einem verborgenen Datenkanal eines Mediensignals,
das Audiosamples umfasst, ohne das Mediensignal zur Bereitstellung eines
aktualisierten verborgenen Kanals analysieren zu müssen.
-
Nach
einem ersten Aspekt der vorliegenden Erfindung wird diese Aufgabe
durch ein Verfahren erreicht, das die Änderung von Daten in einem
verborgenen Datenkanal erlaubt, der in einem Mediensignal vorgesehen
ist, das mindestens einen Satz Audiosamples mit digitaler Audioinformation
enthält,
umfassend die Schritte des:
Vorsehens eines verborgenen Datenkanals,
der eine bestimmte Spektralform aufweist, in den Audiosamples des
Mediensignals,
Einfügens
von Nutzdaten in den verborgenen Datenkanal, und
Einfügens von
Information, die der Spektralform des verborgenen Datenkanals entspricht,
in den verborgenen Datenkanal,
wobei die Information Information über die
Zahl der Koeffizienten umfasst, die in einem Filter zu verwenden
sind, wenn die Daten des verborgenen Datenkanals aktualisiert werden.
-
Nach
einem zweiten Aspekt der vorliegenden Erfindung wird diese Aufgabe
auch durch ein Verfahren zum Ändern
von Daten erreicht, die in einem Mediensignal verborgen sind, das
mindestens einen Satz Audiosamples mit digitaler Audioinformation
enthält,
umfassend die Schritte des:
Extrahierens von Information, die
der Spektralform eines verborgenen Datenkanals entspricht, wobei dieser
Kanal Nutzdaten umfasst und in mindestens in einigen der Audiosamples
vorgesehen ist,
Aktualisierens der Nutzdaten,
Einfügens von
Daten, die die aktualisierten Nutzdaten enthalten, in mindestens
einige Audiosamples, und
Verwendens der Spektralform-Information,
um die Spektralform der Daten im verborgenen Datenkanal mit den
aktualisierten Nutzdaten zu modifizieren.
-
Nach
einem dritten Aspekt der vorliegenden Erfindung wird diese Aufgabe
ferner durch eine Vorrichtung zum Einfügen von Information erreicht,
die eine Änderung
in den Daten eines verborgenen Datenkanals erlaubt, der in einem
Mediensignal vorgesehen ist, das mindestens einen Satz digitaler
Audiosamples enthält,
umfassend:
einen Digitalmedien-Quelleingang, um mindestens einen
Satz digitaler Audiosamples zu empfangen, und
eine Dateneinfügeeinheit,
angeordnet, um:
einen verborgenen Datenkanal, der eine bestimmte Spektralform
hat, in den Audiosamples des Mediensignals vorzusehen,
Nutzdaten
in den verborgenen Datenkanal einzufügen, und
Information,
die der Spektralform des verborgenen Datenkanals entspricht, in
den verborgenen Datenkanal einzufügen,
wobei die Information
Information über
die Zahl der Koeffizienten umfasst, die in einem Filter zu verwenden
sind, wenn die Daten des verborgenen Datenkanals aktualisiert werden.
-
Nach
einem vierten Aspekt der vorliegenden Erfindung wird diese Aufgabe
auch durch eine Vorrichtung zum Ändern
von Daten erreicht, die in einem Mediensignal verborgen sind, das
mindestens einen Satz Audiosamples mit digitaler Audioinformation enthält, umfassend:
eine
Steuereinheit, angeordnet, um aus diesem verborgenen Datenkanal
Information zu extrahieren, die der Spektralform eines verborgenen
Datenkanals entspricht, wobei dieser Kanal Nutzdaten umfasst und
in mindestens in einigen der Audiosamples vorgesehen ist,
einen
Prozessor für
verborgene Daten, angeordnet, um die Nutzdaten zu aktualisieren,
und
eine Dateneinfügeeinheit,
angeordnet, um Daten, die die aktualisierten Nutzdaten enthalten,
in mindestens einige Audiosamples einzufügen, unter Verwendung der Spektralform-Information,
um die Spektralform der Daten im verborgenen Datenkanal mit den
aktualisierten Nutzdaten zu modifizieren.
-
Nach
einem fünften
Aspekt der vorliegenden Erfindung wird diese Aufgabe auch durch
ein Mediensignal erreicht, umfassend mindestens einen Satz Audiosamples
mit digitaler Audioinformation, umfassend:
einen verborgenen
Datenkanal in mindestens einem der Audiosamples, der Information
umfasst, die der Spektralform des verborgenen Datenkanals entspricht,
wobei
die Information Information über
die Zahl der Koeffizienten enthält,
die in einem Filter zu verwenden sind, wenn die Daten des verborgenen
Datenkanals aktualisiert werden.
-
Nach
einem sechsten Aspekt der vorliegenden Erfindung wird diese Aufgabe
auch durch ein beschriebenes Medium erreicht, umfassend ein Mediensignal,
das mindestens einen Satz Audiosamples mit digitaler Audioinformation
einschließt,
wobei dieses Signal umfasst:
einen verborgenen Datenkanal in
mindestens einem der Audiosamples, der Information umfasst, die
der Spektralform des verborgenen Datenkanals entspricht,
wobei
die Information Information über
die Zahl der Koeffizienten enthält,
die in einem Filter zu verwenden sind, wenn die Daten des verborgenen
Datenkanals aktualisiert werden.
-
Bevorzugte
Ausführungsformen
werden in den abhängigen
Ansprüchen
dargelegt.
-
Die
vorliegende Erfindung weist den Vorteil auf, dass sie einen weniger
komplexen und billigeren Codierer ermöglicht, wenn die Audiosamples
eines Mediensignals mit einem aktualisierten verborgenen Datenkanal
neu codiert werden.
-
Die
Grundidee hinter der Erfindung ist also, Information über die
Spektralform eines verborgenen Datenkanals bereitzustellen, die
im verborgenen Datenkanal vorgesehen ist, der in einem Mediensignal vorhanden
ist.
-
Der
Ausdruck Nutzdaten bezieht sich auf Daten, die einen Informationsinhalt
aufweisen, im Gegensatz zu Daten, die zur Steuerung des Bereitstellens
eines verborgenen Datenkanals verwendet werden.
-
Diese
und andere Aspekte der Erfindung gehen aus den im Folgenden beschriebenen
Ausführungsformen
hervor.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
Die
vorliegende Erfindung wird nun Bezug nehmend auf die beiliegenden
Zeichnungen ausführlicher
beschrieben, wobei
-
1 ein
Blockschema eines erfindungsgemäßen Systems
zeigt, das Spektralform-Information verwendet;
-
2 ein
Blockschema einer erfindungsgemäßen Vorrichtung
zum Einfügen
von Spektralform-Information in die Samples eines Mediensignals zeigt;
-
3 ein
erfindungsgemäßes Signal
mit einem Rahmen aus einer Anzahl von Audiosamples zeigt, der einem
verborgenen Datenkanal aufweist;
-
4 einen
Kopfsatz des verborgenen Datenkanals in 3 zeigt;
-
5 ein
Blockschema einer erfindungsgemäßen Vorrichtung
zum Extrahieren und Verwenden der Spektralform-Information aus dem
verborgenen Datenkanal zeigt;
-
6 ein
Flussdiagramm eines erfindungsgemäßen Verfahrens zum Einfügen der
Spektralform-Information in einen verborgenen Datenkanal zeigt;
-
7 ein
Flussdiagramm eines erfindungsgemäßen Verfahrens zum Extrahieren
und Verwenden der Spektralform-Information in Bezug auf einen verborgenen
Datenkanal zeigt;
-
8 ein
Blockschema einer erfindungsgemäßen Einheit
zum Einfügen
von Daten in einen verborgenen Datenkanal zeigt;
-
9 eine
optische Platte zeigt, auf welcher ein erfindungsgemäßes Mediensignal
gespeichert ist, das den verborgenen Datenkanal mit der Spektralform-Information aufweist.
-
AUSFÜHRLICHE
BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
-
Die
vorliegende Erfindung betrifft das Gebiet des Bereitstellens von
Zusatzinformation in digitalen Mediensignalen mit Audiosamples.
Das Mediensignal ist in der bevorzugten Ausführungsform ein Audiosignal.
Die Erfindung beschränkt
sich aber nicht auf Audio, sondern kann auf andere Mediensignale
wie zum Beispiel Video angewandt werden, wenn sie Audiosamples umfassen.
-
1 zeigt
ein Blockschema einer erfindungsgemäßen Vorrichtung. Die Vorrichtung
umfasst eine erste Vorrichtung 10 auf einer Senderseite,
um in den Audiosamples des Mediensignals Zusatzinformation bereitzustellen,
d. h., zum Einfügen
von Information, die das Ändern
von Daten in einem verborgenen Datenkanal erlaubt, und eine zweite
Vorrichtung 15 auf einer Empfängerseite, um die Zusatzinformation
in den Audiosamples des Mediensignals zu extrahieren und die im
Mediensignal verborgenen Daten zu ändern. Die erste Vorrichtung 10 umfasst
eine Audiosample-Quelle 11, die eine Anzahl von Audiosamples
in Form von PCM (Pulskodemodulation)-Samples umfasst, zum Beispiel
in einen oder mehreren Titeln, die auf einer bespielten CD vorliegen.
Die Quelle 11 ist mit einer Einheit 13 zur Hörbarkeitsbestimmung
oder Erzeugung eines maskierten Fehlerspektrums verbunden, die Hörschwellen
für Audiosamples
in einer begrenzten Samplezahl bereitstellt, wie z. B. für einen
Rahmen, der 1152 Samples enthält.
Die Einheit 13 ist mit einer Dateneinfügeeinheit 14 verbunden
und stellt die Samples S sowie die Hörschwelleninformation (durch
eine gestrichelte Linie angezeigt) bereit, die benutzt wird, um
die Größe des verborgenen
Datenkanals und die Filterkoeffizienten zum Erzeugen der Spektralform
des verborgenen Datenkanals zu bestimmen. Die Einheit 14 weist
demnach einen Eingang auf, um PCM-Samples S zu empfangen, und einen
Eingang, um die Hörschwelleninformation
zu empfangen. Die Dateneinfügeeinheit 14 ist
auch mit einer Datenbereitstellungseinheit 12 verbunden,
die der Dateneinfügeeinheit 14 Daten
D bereitstellt, nachstehend als Nutzdaten bezeichnet, die in den
PCM-Samples zu verbergen sind. Die Dateneinfügeeinheit 14 richtet
einen verborgenen Datenkanal in den Audiosamples S ein, wo die Nutzdaten
vorgesehen werden. Die Größe des Kanals
wird durch die empfangene Hörschwelleninformation
bestimmt. Die Dateneinfügeeinheit 14 stellt Samples
S' bereit, die den
verborgenen Datenkanal enthalten. Die Vorrichtung 15 empfängt die PCM-Samples
S' mit dem verborgenen
Datenkanal in einer Empfangseinheit 16. Die Nutzdaten D
im verborgenen Datenkanal werden extrahiert und dem Prozessor 17 für verborgene
Daten zugeführt.
Die empfangenen PCM-Samples S' werden
auch einem Audioprozessor 18 zugeführt, und daher bleiben die verborgenen
Daten auch für
den Audioprozessor in den Samples erhalten. Die Vorrichtung 15 umfasst auch
eine Dateneinfügeeinheit 19 grundsätzlich gleichen
Typs wie die Dateneinfügeeinheit
in der Vorrichtung 10. Diese Einheit 19 empfängt aktualisierte
Daten D', PCM-Samples
S' sowie Synchronisations- und
Zuordnungsdaten und Spektralform-Information (mit einer gestrichelten
Linie angezeigt) von der Steuereinheit 16. Die Dateneinfügeeinheit 19 stellt PCM-Samples
S'' mit einem verborgenen
Datenkanal bereit, der aktualisierte Nutzdaten D' aufweist.
-
Die
Nutzdaten D, die von der Datenbereitstellungseinheit 12 und
vom Prozessor 17 für
verborgene Daten bereitgestellt werden, können in Form von zusätzlichen
Kommentaren wie z. B. anzeigbare Untertitel oder Text, eines zusätzlichen
Tonkanals, eines mehrsprachigen Sprachdienstes, Karaoke oder Video
sein. Sie können
kann auch Information wie die Zahl der zulässigen Kopien sein, die von
einem bestimmten Inhalt angefertigt werden dürfen. Die Daten können überdies
auch Wasserzeichen umfassen, die im Fall des Prozessors 17 für verborgene
Daten geänderte
oder aktualisierte Wasserzeichen sein können.
-
2 zeigt
ein Blockschema der Dateneinfügeeinheit 14,
die einen ersten Puffer 20 zum Empfangen der in den verborgenen
Datenkanal einzufügenden
Nutzdaten D und einen zweiten Puffer 22 zum Empfangen der
PCM-Samples S umfasst. Im zweiten Puffer werden die PCM-Samples
zu Samples einer kleineren Größe quantisiert,
um Platz für Nutzdaten
D zu schaffen. Der Block umfasst auch eine Steuereinheit 24,
welche die Synchronisations- und Zuordnungsinformation für den verborgenen
Datenkanal auf der Basis der empfangenen Hörschwelleninformation bestimmt.
Die Steuereinheit 24 bestimmt auch die Spektralform des
verborgenen Datenkanals und die Filterkoeffizienten, die zu verwenden
sind, um diese Spektralform zu erzeugen. Die Steuereinheit 24 versorgt
den ersten und zweiten Puffer 20 und 22 mit Information
darüber,
wie viele Bits jedes PCM-Originalsamples S verborgene Daten zu enthalten
haben. Die Bestimmung erfolgt dynamisch für eine Anzahl von Sample-Blöcken auf
der Basis der Information von der Hörbarkeitsbestimmungseinheit.
Die Steuereinheit 24 und die zwei Puffer 20 und 22 sind
auch mit einem Kombinator 26 verbunden, in welchem die
Daten in die niederwertigsten Leerbits der aufgezeichneten PCM-Samples
eingefügt
werden. Die Steuereinheit 24 leitet auch die Synchronisations-
und Zuordnungsinformation sowie die Information über die Spektralform des verborgenen Datenkanals
zum Einfügen
in den verborgenen Datenkanal an den Kombinator 26 weiter.
Die Datenaktualisierungseinheit 19 auf der Empfängerseite
umfasst die gleichen Einheiten wie die Einheit 14 auf der Senderseite.
Dort ist die Steuereinheit aber leicht abweichend.
-
Ein
CD-Audiosignal umfasst normalerweise zwei Kanäle, einen linken und einen
rechten Kanal, in welche verborgene Daten eingefügt werden können. 3 zeigt
allgemein, wie ein verborgener Kanal in diesen beiden Kanälen vorgesehen
werden kann. Zuerst werden die Samples in Rahmen Fr unterteilt, wobei
ein Rahmen aus 1152 PCM-Samples
besteht. Jeder Rahmen Fr wird dann in drei verschiedene Unterrahmen
SF0, SF1 und SF2 unterteilt. Es ist stets möglich, die zwei niederwertigsten
Bits jedes PCM-Samples als verborgenen Datenkanal vorzusehen, und
daher können
die zwei niederwertigsten Bits stets für einen Kopfsatz vorgesehen
werden, der Zuordnungs- und Synchronisationsinformation enthält, die
verwendet wird, um die Art der verborgenen Nutzdaten anzugeben.
In 3 werden für
einen Frame Fr zwei Kanäle
gezeigt, ein rechter und ein linker Kanal R CH und L CH. In jedem
Kanal ist ein verborgener Datenkanal vorgesehen. Der rechte Kanal
R CH weist in all seinen Unterrahmen einen verborgenen Datenkanal
auf, während
der linke Kanal L CH nur im zweiten und dritten Unterrahmen SF1
und SF2 einen verborgenen Datenkanal aufweist. Die ersten Samples
von Unterrahmen, die einen verborgenen Kanal enthalten, weisen stets
ein Feld oder einen Kopfsatz 30 mit Synchronisations- und
Zuordnungsinformation auf, an dem eine CRC-Prüfung 32 angehängt ist.
Dieser Abschnitt ist im Teil des verborgenen Kanals vorgesehen,
der stets verfügbar
ist. Diese Information gibt daher an, wie groß der verborgene Datenkanal ist,
sowie ob und in welchen Samples ein verborgener Datenkanal vorgesehen
ist. Erfindungsgemäß schließt der Kopfsatz
auch Information bezüglich
der Spektralform des verborgenen Datenkanals ein. Je nach den Eigenschaften
der PCM-Samples können mehr
oder weniger Bits für
Nutzdaten 34 vorgesehen werden, wobei der rechte Kanal
R CH mit mehr Platz dafür
in den ersten und zweiten Unterrahmen SF0 und SF1 gezeigt wird,
während
der dritte Unterrahmen SF2 dieses Kanals eine noch größere Kapazität hat. Der
linke Kanal L CH weist keine Zusatzkapazität im zweiten Unterrahmen SF1
auf, während
er im dritten Unterrahmen SF2 etwas mehr Zusatzkapazität aufweist.
Die Kapazität
wird durch die oben erwähnte Hörschwelleninformation
auf einer unterrahmenweisen Basis entschieden. Die Nutzdaten 34 schließen hier
die oben genannten Daten ein, die auf der Empfängerseite zu verarbeiten sind.
Der letzte Unterrahmen ist am Ende im verborgenen Kanal mit einer CRC-Prüfung 46 versehen.
Diese CRC-Prüfung
ist zur Fehlerkorrektur der Nutzdaten vorgesehen.
-
4 zeigt
allgemein den Kopfsatz 30 mit der CRC-Prüfung 32.
Der Kopfsatz umfasst demnach ein Synchronisations- und Zuordnungsfeld 40 sowie ein
Feld 42, das Information über die Spektralform des verborgenen
Datenkanals einschließt,
wobei diese Information in digitaler Form vorliegt.
-
5 zeigt
ein Blockschema eines Empfängers
oder einer Vorrichtung zum Ändern
von Daten, die in den PCM-Samples verborgen sind. Die Empfangseinheit 16 umfasst
einen Eingabepuffer 50, wo die PCM-Samples S' empfangen werden,
eine Steuereinheit 52, welche die Synchronisations- und
Zuordnungsinformation sowie die Spektralform-Information aus dem verborgenen Datenkanal
extrahiert und dem Audioprozessor 18 alle empfangenen PCM-Samples
S' zuführt. Die
Nutzdaten werden dann in Abhängigkeit
von der Synchronisations- und Zuordnungsinformation dem Prozessor 17 für verborgene
Daten zugeführt.
Der Prozessor für
verborgene Daten aktualisiert die Nutzdaten der verborgenen Daten,
zum Beispiel, indem er einen Kopierzähler in den Nutzdaten inkrementiert
oder ein Wasserzeichen verändert,
und leitet dies an die Dateneinfügeeinheit 19 der
Empfangsvorrichtung weiter. Dementsprechend führt auch der Audioprozessor 18 der
Dateneinfügeeinheit 19 PCM-Samples
zu, vielleicht während
eines Kopiervorgangs des Inhalts oder von Audiosamples, und nachdem
mehrere Codierungs- und Decodierungsschritte durchgeführt wurden.
Die Steuereinheit 52 leitet auch die Spektralform-Information
an die Dateneinfügeeinheit
des Empfangsgeräts
weiter. Sie leitet auch die extrahierte Synchronisations- und Zuordnungsinformation
weiter. Die Dateneinfügeeinheit 19 fügt dann
unter Verwendung der Synchronisations- und Zuordnungsinformation
sowie der Spektralform-Information die aktualisierten Daten in den
verborgenen Datenkanal ein. Wie dies durchgeführt wird, wird weiter unten
ausführlicher
beschrieben. Wie oben erwähnt,
entspricht die Dateneinfügeeinheit 19 im
Wesentlichen der Einheit 14. Es gibt aber einen Unterschied.
Die Steuereinheit der Dateneinfügeeinheit 19 braucht
die Synchronisations- und Zuordnungsinformation oder die geeignete Spektralform
des verborgenen Datenkanals nicht zu bestimmen, da dies bereits
geschehen ist.
-
Die
erfindungsgemäßen Verfahren
werden nun Bezug nehmend auf 6 und 7 kurz
beschrieben, welche die Verfahrensschritte zeigen, die auf der Sender-
und Empfangerseite durchgeführt werden.
-
Zuerst
wird in den PCM-Samples des Mediensignals der verborgene Datenkanal
vorgesehen, der eine bestimmte Spektralform aufweist, Schritt 60. Der
Datenkanal wird mit einer bestimmten Spektralform so vorgesehen,
dass die Daten im verborgenen Datenkanal die Audiowahrnehmung möglichst
wenig beeinflussen. Auch die Größe des Kanals
wird wie oben beschrieben auf der Basis der Audioeigenschaften in
den Samples bestimmt. Danach werden die Synchronisations- und Zuordnungsinformation sowie
Information in Bezug auf die Spektralform des Kanals in den Kopfsatz
eingefügt,
Schritt 62. Dann werden die Nutzdaten in den Kanal eingefügt, Schritt 64.
Die Synchronisations- und Zuordnungsinformation wird auf einer unterrahmenweisen
Basis auf der Basis der Eigenschaften der PCM-Samples berechnet,
wie auch die Spektralform-Information. Die Synchronisations- und
Zuordnungsinformation, die Information bezüglich der Spektralform des
Kanals und die Nutzdaten werden hier in allen Unterrahmen jedes
Rahmens vorgesehen, der einen verborgenen Datenkanal aufweist.
-
Auf
der Empfängerseite
werden die Synchronisations- und Zuordnungsinformation sowie die
Information bezüglich
der Spektralform des Kanals aus dem verborgenen Datenkanal extrahiert,
Schritt 70. Danach werden die Nutzdaten auf der Basis dieser Information
aus dem verborgenen Datenkanal extrahiert, Schritt 72.
Die Nutzdaten werden dem Prozessor für verborgene Daten zugeführt, der
die Nutzdaten aktualisiert, Schritt 74. Zugleich verarbeitet
auch der Audioprozessor die PCM-Samples, Schritt 74, zum
Beispiel, indem er zulässige
Kopien anfertigt. Für
eine Audio-Kopie wird dann wieder in den PCM-Samples ein verborgener
Datenkanal vorgesehen, Schritt 76. In diesem Kanal wird
die zuvor extrahierte Information bezüglich der Spektralform zusammen
mit der Synchronisations- und Zuordnungsinformation verwendet, um
den Kanal vorzusehen. Danach werden die Synchronisations- und Zuordnungsinformation
und die Spektralform-Information in den Kopfsatz des neu erzeugten
verborgenen Datenkanals eingefügt,
Schritt 78. Schließlich
werden die aktualisieren Daten dann in die Nutzinformation des verborgenen
Datenkanals eingefügt,
Schritt 79.
-
In 8 wird
auf detailliertere Weise gezeigt, wie das Einfügen von Daten D durchgeführt werden kann.
Die Daten D, die für
einen verborgenen Kanal vorgesehen sind, werden durch eine Zufallsverteilungseinheit 81 mithilfe
einer Zufallsfunktion R zufällig
verteilt. Die PCM-Originalsamples S werden einer ersten Subtraktionseinheit 80 zugeführt, mit
welcher der Ausgang einer Rauschspektrum-Formungseinheit 89 mit
einer Funktion H verbunden ist. In einer Ausführungsform ist diese Rauschspektrum-Formungs einheit
ein FIR-Filter. Die erste Subtraktionseinheit 80 ist mit
einer zweiten Subtraktionseinheit 82 verbunden, mit der
auch der Ausgang der Zufallsverteilungseinheit 81 verbunden
ist. Die zweite Subtraktionseinheit 82 ist mit einer Quantisierungseinheit 84 mit
einer Quantisierungsfunktion Q verbunden, wobei der Ausgang der
Quantisierungseinheit 84 mit einer Additionseinheit 86 verbunden
ist, wobei mit dieser Additionseinheit 86 auch der Ausgang
der Zufallsverteilungseinheit 81 verbunden ist. Die Additionseinheit 86 gibt
auch ein Ausgangssignal S' aus.
Das Ausgangssignal S' wird
der Empfängerseite
zugeführt, wird
aber auch einer dritten Subtraktionseinheit 87 zugeführt, die
auch mit der ersten Subtraktionseinheit 80 verbunden ist.
Die dritte Subtraktionseinheit 87 ist zudem mit dem Eingang
der Rauschspektrum-Formungseinheit 89 verbunden.
-
Die
Arbeitsweise der Vorrichtung in
8 ist wie
folgt. Daten D für
einen verborgenen Datenkanal werden der Zufallsverteilungseinheit
81 zugeführt, die
die Daten einer reversiblen Zufallsfunktion R gemäß zufällig verteilt,
wobei diese Zusatzdaten eine Anzahl der niederwertigsten Bits des
Audiosamples ausmachen werden. Die zufällige Verteilung kann durch
eine CRC-Schaltung erfolgen, die eine angezapfte Verzögerungsleitung
und eine Anzahl von exklusives-ODER-Glieder aufweist, die exklusives-ODER-Kombinationen
an den verzögerten
Eingabedatenbits durchführen.
Diese zufällig
verteilten niederwertigsten Bits werden daher in Form eines Zittersignals
bereitgestellt und zuerst von den PCM-Samples S subtrahiert. Das
aus der Subtraktion resultierende Signal wird dann in der Quantisierungseinheit
84 so
quantisiert, dass eine Anzahl der niederwertigsten Bits von den
PCM-Samples verworfen werden. Die Zahl der verworfenen Bits wird
wie oben erwähnt
dynamisch bestimmt, indem die Hörschwelle
und in diesem Fall das maskierte Fehlerspektrum der PCM-Samples
analysiert werden. Zu diesem quantisierten Signal werden dann die
Daten D in Form der zufällig
verteilten niederwertigsten Bits oder des Zittersignals hinzugefügt, wobei
die Zahl der eingefügten
Bits auch durch dynamische Analyse des maskierten Fehlerspektrums
bestimmt wird. Das Ergebnis wird als ein Signal S' bereitgestellt,
mit den PCM-Samples, die den verborgenen Datenkanal enthalten. Die
dritte Subtraktionseinheit
87 stellt ein Fehlersignal zwischen
den Eingabe-PCM-Samples S und den Ausgabe-PCM-Samples S' bereit, das der Rauschspektrum-Formungseinheit
89 zugeführt wird.
Die Rauschspektrum-Formungseinheit
89 ist ein rauschformendes
Filter, das auf der Basis des Fehlersignals das weiße Grundrauschen
formt und es vom Eingangssignal S subtrahiert. Die Arbeitsweise
der Vorrichtung wird in
WO-A-95/18523 ausführlicher
beschrieben.
-
Die
Vorrichtung in 8 kann in beiden Dateneinfügeeinheiten
verwendet werden. Da die Filterkoeffizienten und die Zeitsteuerungs-
und Zuordnungsinformation aber bereits im Signal vorgesehen wurden,
besteht für
die Hörbarkeitsbestimmungseinheit
und ihre Funktionalität
auf der Empfängerseite keine
Notwendigkeit. Es ist auch nicht erforderlich, in der Steuereinheit
der Dateneinfügeeinheit
die Filterkoeffizienten zu bestimmen. Dies vereinfacht die Empfängerseite
erheblich und macht sie auch billiger herzustellen.
-
Was
in den Kopfsatz des verborgenen Datenkanals eingefügt wird,
ist Information über
Filterkoeffizienten, die in der Rauschspektrum-Formungseinheit 89 zu
verwenden sind. Dadurch ist es für
die Empfängerseite
nicht notwendig, ein maskiertes Fehlerspektrum zu bestimmen und
diese Koeffizienten dann auf der Basis des Spektrums zu bestimmen, sondern
sie kann diese Information direkt auf die Rauschspektrum-Formungseinheit
anwenden. Dies ist zum Beispiel notwendig, weil während des
Kopierens des Inhalts eine sogenannte Tandem-Codierung durchgeführt werden
kann, wo die PCM-Samples mehreren
Codierungs- und Decodierungsschritten unterzogen werden. In solchen
Fällen
geht die Spektralform-Information normalerweise verloren. Wenn die
Daten im verborgenen Datenkanal geändert werden sollen, d. h.,
wieder eingefügt
werden sollen, besteht eine Gefahr, dass die Audioqualität wahrnehmbar
verschlechtert wird, wenn kein weißes Grundrauschen eingefügt wird.
-
Die
Filterkoeffizienten, die im verborgenen Datenkanal vorgesehen werden,
sind eine quantisierte Version der Gleitkommaparameter, die in Form von
LOG-Area-Ratios
vorliegen. Dies erfolgt, um die Differenzen zwischen den Absolutwerten
der Parameter zu minimieren, die signifikant sein können. Diese
Differenzen können
sonst unnötige
Fehler verursachen. Es gibt auch andere Weisen, die Filterkoeffizienten
bereitzustellen. Andere Weisen bestehen darin, sie in andere Domänen wie
z. B. Reflektions- oder
Parcors-Parameter umzuwandeln. Sie können natürlich auch als direkte binäre Darstellungen
der Gleitkommaparameter vorgesehen werden.
-
Oben
wurde erwähnt,
dass die Nutzdaten mit einer Zittersignalcodierungsfunktion R codiert
wurden. Um diese Daten zu decodieren, umfasst der Prozessor für verborgene
Daten auch eine inverse Codierungsfunktion R–1,
um das Zittersignal zu decodieren. Es wird bevorzugt, den Kopfsatz
nicht mit der Codierungsfunktion R zu codieren, um die Information
leichter aufzufinden und zu decodieren. Aufgrund der geringen Größe des Kopfsatzes
wird dieser ohnehin einen vernachlässigbaren Einfluss auf die
Audiowahrnehmung haben. Es ist jedoch möglich, auch den Kopfsatz zu
codieren.
-
Die
Erfindung kann auf viele Weisen abgeändert werden. Zum Beispiel
können
die Daten im verborgenen Datenkanal ohne Verwendung der Zufallsfunktion
R bereitgestellt werden, dann besteht aber eine Gefahr, dass die
Qualität
des Audiosignals auf wahrnehmbare Weise verschlechtert wird. Es
versteht sich auch, dass jeder geeignete Übertragungskanal den Kanal
zwischen der Sender- und Empfängerseite
bilden kann. Die Steuereinheit auf der Empfängerseite muss die Nutzdaten
nicht extrahieren, um sie dem Prozessor für verborgene Daten zuzuführen. Es
ist dem Prozessor für
verborgene Daten auch möglich,
direkt neue Daten für
den verborgenen Datenkanal vorzusehen, ohne die darin enthaltenen Daten
zu empfangen.
-
Die
Spektralform-Information sowie die Synchronisationsinformation können auf
einer rahmenweisen Basis entschieden werden, statt auf einer unterrahmenweisen
Basis. Das Mediensignal kann auch auf ein Speichermedium wie eine
CD-Disk gespeichert sein, die der Empfängerseite dann auf geeignete
Weise übermittelt
werden kann, um den Kanal bereitzustellen. 9 zeigt
solch eine Disk 90. Es brauchen auch nicht zwei Kanäle mit Audiosamples vorhanden
zu sein, d. h. ein linker und rechter, sondern die Erfindung kann
auch nur mit einem Kanal Audiosamples angewandt werden. Die Empfängerseite
braucht ferner kein Audio zu verarbeiten. Die Spektralinformation
braucht auch nicht im aktualisierten verborgenen Datenkanal vorgesehen
zu werden.
-
6
- 60
- Verborgenen
Datenkanal in PCM-Samples des Mediensignals vorsehen
- 62
- Synchronisations-
und Zuordnungsinformation sowie Information, die der Spektralform
entspricht, in den Kopfsatz des verborgenen Datenkanals einfügen
- 64
- Nutzdaten
in den verborgenen Datenkanal einfügen
-
7
- 70
- Synchronisations-
und Zuordnungsinformation zusammen mit Information, die der Spektralform
entspricht, aus dem verborgenen Datenkanal extrahieren
- 72
- Nutzdaten
aus dem verborgenen Datenkanal extrahieren
- 74
- Nutzdaten
aktualisieren und PCM-Samples verarbeiten
- 76
- Verborgenen
Datenkanal in verarbeiteten PCM-Samples des Mediensignals unter
Verwendung der extrahierten Spektralform-Information vorsehen
- 78
- Synchronisations-
und Zuordnungsinformation sowie Spektralform-Information in den
Kopfsatz des verborgenen Datenkanals einfügen
- 79
- Nutzdaten
in den verborgenen Datenkanal einfügen