-
Die
vorliegende Erfindung betrifft ein Verfahren zum Betrieb eines Datenverarbeitungssystems, und
insbesondere ein Verfahren zur elektronischen Verarbeitung von Dokumentdaten
zum Schutz vor unerwünschtem
oder unerlaubtem Zugriff oder Manipulation.
-
Hintergrund
-
Bei
der Übertragung
von elektronischen Dokumenten in Netzwerken sollen diese vor unerwünschtem
Zugriff geschützt
werden. Dies betrifft den Endanwender (also denjenigen, für den ein
elektronisches Dokument bestimmt ist, nachfolgend Benutzer genannt)
ebenso wie Systemadministratoren der Rechners des Benutzers, oder "Bad Guys". Beispielsweise
soll der Benutzer daran gehindert werden, das Dokument zu drucken,
es weiterzuleiten, oder zu speichern. Systemadministratoren sollen
daran gehindert werden, trotz voller Leserechte auf dem Rechner
des Benutzers auf das Dokument zugreifen zu können. Bei "Bad Guys" kann es sich um Hacker handeln, die
sich Zugriff auf den Rechner des Benutzers verschaffen wollen, Personen,
die den Datenverkehr zwischen Klient (Rechner des Benutzers) und
Server ("Datenraum") abzuhören versuchen,
als auch Viren, Würmer
und Trojaner.
-
Zusammenfassung der Erfindung
-
Die
vorliegende Erfindung hat zur Aufgabe, sich dieser Problematik anzunehmen.
Insbesondere sollen Dokumente, die auf einem Server zum Abruf durch
Benutzer bereitgestellt werden, vor unerwünschtem Zugriff und Manipulation
geschützt
werden. Insbesondere soll dieser Schutz auf Server-Seite geschaffen
werden, so dass keine Installation von Software auf dem Rechner
des Benutzers erforderlich ist. Gleichzeitig soll der Schutz möglichst
unabhängig
vom Format des zu schützenden
Dokuments geschaffen werden.
-
Diese
Aufgabe wird durch die in den unabhängigen Ansprüchen angegebene
Erfindung gelöst. Vorteilhafte
Ausgestaltungen sind den Unteransprüchen zu entnehmen.
-
Erfindungsgemäß ist ein
Verfahren geschaffen zum Verarbeiten von Dokumentdaten mittels eines
Datenverarbeitungssystems, mit folgenden Schritten: Speichern einer
ersten elektronischen Datei, welche Dokumentdaten enthält, die
ein für
einen Benutzer anzeigbares Dokument darstellen; Umwandeln der ersten
Datei in eine Vielzahl von dritten elektronischen Dateien, die in
ihrer Gesamtheit Dokumentdaten der ersten Datei enthalten, die mindestens
einen Teil des Dokumentes darstellen; und Bereitstellen zum Abruf
der Vielzahl von dritten Dateien zur Anzeige des mindestens einen
Teiles des Dokumentes durch einen Benutzer.
-
Nach
dem erfindungsgemäßen Verfahren wird
das Dokument vor dem Bereitstellen zur Anzeige durch den Benutzer "zerstückelt". Damit wird dem Benutzer
zwar ein vollständiger
Teil (z.B. eine Seite) des Dokumentes zur Anzeige zur Verfügung gestellt; die
diesen Teil darstellenden Dokumentdaten sind jedoch über mehrere
Dateien verteilt. Der Benutzer erhält somit statt einer einzelnen
Dokumentdatei eine Vielzahl von Dateien. Dies erschwert die Verarbeitung
der Dokumentdaten. Wollte der Benutzer beispielsweise den angezeigten Dokumententeil
drucken oder speichern, so müsste
der Druck- oder Speicherbefehl auf jede der Vielzahl der Dateien
angewandt werden. Dies verhindert oder erschwert eine unerwünschte Weiterverwendung
des Dokuments. Es wird folglich eine Anzeige zumindest eines Teiles
des Dokumentes ermöglicht,
dessen Verarbeitung aber verhindert oder zumindest erschwert. Diese
Funktionalität
ist in Datenräumen
von Vorteil, in denen beispielsweise auf vertrauliche Dokumente zugegriffen
werden kann, deren Ausdruck, Speicherung oder Weiterleitung durch
den Benutzer verhindert werden soll. Gleichzeitig wird der Zugriff
von außen
(Administratoren, "Bad
Guys") erschwert,
oder aber die Verwertbarkeit von Dokumentdaten bei geschehenem Zugriff
von außen
stark gemindert.
-
Insbesondere
kann das Dokument eine oder mehrere Seiten umfassen. Der Zugriff
auf das Dokument erfolgt nach einer Ausgestaltung der Erfindung ausschließlich seitenweise.
D.h., dass wenn der Benutzer ein Dokument neu anfordert, zuerst
dritte Dateien erzeugt werden, die der ersten Seite des Dokuments
entsprechen, und diese dem Benutzer zur Anzeige der ersten Seite
zur Verfügung
gestellt werden. Fordert der Benutzer eine weitere Seite an, so
werden die dritten Dateien für
diese weitere Seite erzeugt und dem Benutzer zur Verfügung gestellt,
usw. Ein Zugriff auf das gesamte Dokument "auf einmal" ist nach dieser Ausgestaltung nicht
möglich.
-
Nach
einer Ausgestaltung der Erfindung umfasst das Verfahren folgende
weitere Schritte: Umwandeln der ersten Datei in eine Vielzahl von
zweiten elektronischen Dateien, die in ihrer Gesamtheit die Dokumentdaten
der ersten Datei enthalten, wobei jede der zweiten elektronischen
Dateien die Dokumentdaten einer Seite des Dokumentes enthält; und Umwandeln
der zweiten Dateien in die Vielzahl dritter Dateien, wobei die Dokumentdaten
jeder zweiten Datei auf mehrere der dritten Dateien verteilt sind.
-
In
dem ersten Umwandlungsschritt wird für jede Seite des Dokumentes
eine Datei erzeugt (zweite Dateien). Im zweiten Umwandlungsschritt
wird jede Seite des Dokuments einzeln "zerstückelt" und die entsprechenden Daten in den
dritten Dateien abgelegt.
-
Mit
Vorteil wird jeder Abruf durch den Benutzer protokolliert. Insbesondere
kann jeder Abruf durch den Benutzer seitenweise protokolliert werden. Das
Protokollieren kann auch die Identifikation des Benutzers beinhalten.
Damit ist es möglich,
nachzuvollziehen, welcher Benutzer wann welches Dokument oder welche
Teile des Dokuments abgerufen hat.
-
Vorzugsweise
wird jeder der Vielzahl der dritten Dateien ein anderer Name zugeordnet
und diese entsprechend abgespeichert. Dazu kann jeder Name durch
einen Zufallsgenerator ausgewählt
werden. Der Zugriff auf die dritten Dateien durch den Benutzer erfolgt
einzeln mittels dieser Namen. Die Zufälligkeit der Namen erschwert
somit einen systematischen Aufruf, Verarbeitung und Weiterverwendung
der Dokumentendaten.
-
In
einer bevorzugten Ausgestaltung umfasst das Verfahren den Schritt
des Erzeugens von Steuersignalen, die bei Abruf der dritten Dateien
durch den Benutzer vorbestimmte, dem Benutzer ansonsten zur Verfügung stehende
Funktionen deaktiviert, insbesondere Funktionen zum Drucken, Weiterleiten und/oder
Speichern des angezeigten Teiles des Dokumentes. Damit wird eine
unerwünschte
Verarbeitung oder Weiterverwendung des angezeigten Teiles des Dokuments
weiter erschwert bzw. vollständig verhindert.
-
In
einer Ausgestaltung umfasst das Verfahren folgende zusätzliche
Schritte: Empfangen einer elektronischen Datei, welche die Dokumentdaten enthält; Umwandeln
der empfangenen Datei in die erste Datei, wobei die erste Datei
ein erstes vorbestimmtes Datenformat aufweist; und Umwandeln der ersten
Datei in die Vielzahl von zweiten elektronischen Dateien, wobei
die zweiten Dateien ein zweites vorbestimmtes Datenformat aufweisen.
-
Demnach
werden die empfangenen Dokumentdaten, die beispielsweise im Word-Format
vorliegen, in ein anderes Format umgewandelt, z.B. PDF. Anschließend werden
die einzelnen Seiten des PDF-Dokumentes in jeweilige Dateien eines
weiteren Formats umgewandelt, beispielsweise das PNG-Format. Die
PNG-basierten Darstellungen der Dokumentseiten werden anschließend "zerstückelt", wie oben beschrieben,
und die resultierenden Bilddaten vorzugsweise als HTML-basierte
Darstellung dem Benutzer seitenweise zur Verfügung gestellt.
-
In
einer vorteilhaften Ausgestaltung enthält das Verfahren folgende zusätzlichen
Schritte: Erzeugen von Daten, die ein Wasserzeichen für das Dokument
darstellen; und Hinzufügen
der Daten, die das Wasserzeichen darstellen, zu der ersten Datei,
so dass der mindestens eine Teil des Dokuments bei Anzeige durch
einen Benutzer das Wasserzeichen enthält.
-
Die
Verwendung von Wasserzeichen erschwert eine unerwünschte Weiterverwendung
der abgerufenen und angezeigten Dokumente weiter und kann beispielsweise
vor einem Abfotografieren des Benutzerbildschirms schützen.
-
Erfindungsgemäß ist außerdem ein
Verfahren geschaffen mit folgenden Schritten: Empfangen durch einen
Server einer Anforderung eines Klienten der Anzeige eines auf dem
Server gespeicherten Dokumentes; Verarbeiten durch den Server der
Dokumentdaten einer Seite des auf dem Server gespeicherten Dokuments,
so dass die Dokumentdaten der Seite auf mehrere Dateien verteilt
sind; und Bereitstellen durch den Server der mehreren Dateien zur Anzeige
der Seite auf dem Klienten.
-
Vorzugsweise
umfasst das Verfahren ein Wiederholen der Schritte des Verarbeitens
und des Bereitstellens auf Anforderung des Klienten, zur seitenweisen
Anzeige des Dokumentes auf dem Klienten.
-
Darüber hinaus
sind Datenverarbeitungssysteme und ein Computerprogramm geschaffen,
die zur Ausführung
der oben beschriebenen Verfahren ausgestaltet sind.
-
Kurzbeschreibung der Zeichnungen
-
Die
Erfindung wird nun erläutert
anhand von beispielhaften Ausgestaltungen unter Bezugnahme auf die
Zeichnungen. Es zeigen
-
die 1 schematisch
die Schritte eines Verfahrens nach einer Ausgestaltung der Erfindung;
-
die 2 ein
Datenverarbeitungssystem, dass zur Implementierung des erfindungsgemäßen Verfahrens
geeignet ist;
-
die 3 und 4 Schritte
und Module eines Verfahrens bzw. einer Vorrichtung nach einer Ausgestaltung
der Erfindung; und
-
die 5 eine
weitere schematische Darstellung der Durchführung eines Verfahrens nach
einer Ausgestaltung der Erfindung.
-
Ausführliche Beschreibung eines
Ausführungsbeispiels
-
1 zeigt
schematisch den Ablauf eines Verfahrens zur Dokumentverarbeitung
gemäß einer Ausgestaltung
der Erfindung. Zu Beginn des Verfahrens erhält ein Server eine Anforderung
eines Benutzers zum Abruf eines auf dem Server gespeicherten Dokumentes.
Ist das Dokument nicht im PDF-Format gespeichert, so wird in Schritt
1 eine Umwandlung vorgenommen, und das erzeugte PDF-Dokument für spätere Zugriffe
gespeichert.
-
Optional
wird anschließend
ein Deckblatt für das
angeforderte Dokument generiert und dem Dokument als Seite 1 vorangestellt
(nicht gezeigt). Das Deckblatt kann Informationen über das
Dokument enthalten wie beispielsweise dessen Version, Urheber, etc.
-
Anschließend werden
in Schritt 2 sogenannte "Brainmark"-Informationen und
ein Overlay mit diesen Informationen erzeugt. Bei den "Brainmark"-Informationen handelt es sich um eine
eindeutige Bezeichnung des Dokumentes und/oder der Version des Dokumentes,
das durch den Benutzer angefordert worden ist. In Schritt 3 wird
das Overlay auf des PDF-Dokument übertragen und die resultierende
Datei in Schritt 4 in einem Cache gespeichert.
-
In
Schritt 5 werden Attribute des angeforderten Dokuments sowie Informationen über den
Benutzer erzeugt. Bei den Attributen kann es sich verschiedene Eigenschaften
des Dokumentes handeln, wie beispielsweise "vertraulich", "Entwurf", usw. Bei den Benutzerinformationen
kann es sich beispielsweise um den Namen oder die E-mail-Adresse
des Benutzers handeln. Aus diesen Informationen wird ein Wasserzeichen
erzeugt, dass in Schritt 6 auf jede Seite des PDF-Dokumentes (ausgenommen
das Deckblatt) übertragen
wird. Die Schrift des Wasserzeichens ist dabei derart ausgeführt, dass
das Wasserzeichen weder manuell noch technisch ohne unverhältnismäßig großem Aufwand
aus dem Dokument zu entfernen ist.
-
Im
Schritt 7 wird das PDF-Dokument seitenweise in ein Bildformat konvertiert
(z.B. PNG). Anschließend
wird die gerade angeforderte Seite "zerstückelt", d.h. in Einzelteile zerlegt, wobei
jedes Einzelteil unter einem von einem Zufallsgenerator erzeugten
Namen auf dem Server abgespeichert wird. Zur Anzeige einer solchen
zerstückelten
Seite wird eine HTML-Darstellung der einzelnen Bildteile sowie einer
Navigationsleiste zum Navigieren zwischen den Seiten erzeugt. Der
Server liefert somit die jeweils angeforderte Seite als Sammlung
von Einzelbildern und HTML-Code an den Benutzer aus. Gleichzeitig
wird der Abruf und die Anzeige der angeforderten Seite(n) auf dem
Server protokolliert. Bei Anforderung einer Folgeseite wird dieser
Vorgang entsprechend wiederholt. Die Anzeige des Dokuments erfolgt
demnach seitenweise, und nicht als Ganzes.
-
2 zeigt
schematisch ein Datenverarbeitungssystem mit einem Klienten PC,
einem Datenraum-Server, einem Datenspeicher sowie einer Datenbank
zur Implementierung des erfindungsgemäßen Verfahrens. Die durch einen
Benutzer abrufbaren Dokumente sind auf dem Datenspeicher und/oder
der Datenbank gespeichert. Der Abruf durch den Benutzer erfolgt
von dem Klienten-PC aus. Das oben beschriebene Verfahren zur Verarbeitung der
Dokumente ist auf dem Datenraum-Server implementiert. Dadurch wird
von dem Datenraum-Server aus bestimmt, in welcher Form der Benutzer
auf gespeicherte Dokumente Zugriff hat, und was er mit diesen (nicht)
tun kann.
-
Die 3 und 4 illustrieren
schematisch Verfahren und Vorrichtung nach einer Ausgestaltung der
Erfindung.
-
Das
Verfahren umfasst insbesondere folgende Schritte:
-
1.
Das Dokument wird in ein gängiges
Format konvertiert, insbesondere PDF.
-
2.
Das Dokument bekommt ein Deckblatt vorangestellt. Das Deckblatt
enthält
insbesondere Informationen über
das Dokument, und Informationen über
den Benutzer, der das Dokument herunterlädt.
-
3.
Das Dokument wird mit einem Wasserzeichen überlagert. Das Wasserzeichen
wird insbesondere gebildet durch folgende Angaben über den
Benutzer, der das Dokument herunterlädt, sowie durch ein "Brainmark" (siehe oben).
-
4.
Das Dokument wird in ein Bildformat umgewandelt, beispielsweise
PNG.
-
5.
Die das Dokument darstellenden Bildinformationen werden seitenweise
erzeugt und sind nur seitenweise abrufbar. Beim Blättern im
Dokument werden die Seiten auf der Server-Seite jeweils dynamisch
generiert. Die Zugriffe auf jede einzelne Seite werden in einer
Datenraumhistorie protokolliert.
-
6.
Jede Seite des Dokumentes wird in eine konfigurierbare Anzahl von
Einzelteilen unterteilt (Puzzle/Aktenvernichter-Analogon).
-
7.
Jedes Einzelteil einer Dokumentseite erhält einen schwer zu identifizierenden
Namen, erzeugt durch einen Zufalls-Generator. D.h. dass selbst dann,
wenn eine dazu nicht autorisierte Person Zugriff auf diese Dokumentdaten
erlangen würde
(z.B. Internet Browser Cache), wäre
es extrem aufwändig, die
Seite aus den vielen Einzelteilen wieder zusammenzusetzen.
-
8.
Die Dateien mit den Einzelteilen der Dokumentseiten werden technisch
so gekennzeichnet, dass diese auf dem Weg vom Server zum Rechner des
Benutzers nicht zwischengespeichert wird bzw. werden kann. Insbesondere
heißt
dies, dass die Dateien nicht im Internet Browser Cache gespeichert werden.
Dies gilt auch in Proxies und im Web-Server.
-
Ein
beispielhaftes Datenverarbeitungssystem zur Implementierung dieses
Verfahrens umfasst folgende Komponenten:
PDF-Konvertierungs-Modul
10;
Deckblatt Generierungs-Modul (nicht gezeigt);
Wasserzeichen-Generierungs-Modul
11;
ein Modul 12 zur seitenweisen Umwandlung des Dokumentes
im PDF-Format in
ein Bild-Format (z.B. PNG);
ein Modul 13 zur „Zerstückelung" der Bildinformation in
eine konfigurierbare Anzahl von Einzelteilen, mit einem Zufallsgenerator
zur Erzeugung von zufälligen Dateinamen
für die
Einzelteile; und
ein Modul 14 zur Auslieferung von angeforderten
Dokumentdaten an einen Benutzer, wobei das Modul nur einen seitenweisen
Abruf zulässt, "Cashing" verhindert, sowie
Zugriffe seitenweise protokolliert.
-
Der
Ablauf des Verfahrens umfasst insbesondere folgende Schritte:
-
1.
Ein Benutzer wählt
ein Dokument zum Herunterladen aus.
-
2.
Falls das Dokument noch nicht als PDF-Datei zur Verfügung steht,
wird eine Umwandlung durchgeführt
und die PDF-Datei für
spätere
Zugriffe gespeichert.
-
3.
Falls im Datenraum (Server) die Deckblatt-Funktion aktiviert ist,
wird das Deckblatt dynamisch generiert und dem Dokument als erste
Seite vorangestellt.
-
4.
Falls im Datenraum die "Watermarking"-Funktion aktiviert
ist, werden alle Seiten des eigentlichen Dokuments (nicht das Deckblatt)
mit einem Wasserzeichen überlagert.
Das Wasserzeichen ist so ausgeführt,
dass der gesamte Inhalt des Originaldokumentes lesbar ist, das Wasserzeichen
selbst jedoch nicht mit vertretbarem Aufwand aus dem Dokument entfernbar
ist (weder manuell noch technisch).
-
5.
Das Dokument wird nun seitenweise in ein Bild-Format (PNG) konvertiert.
-
6.
Die anzuzeigende (d.h. durch den Benutzer angeforderte) Seite wird
auf voreingestellte Art in eine voreingestellte Anzahl von Einzelteilen
zerteilt. Die Einzelteile werden unter durch einen Zufallsgenerator
generierten Namen gespeichert.
-
7.
Es wird eine HTML-Darstellung einer Gesamtseite erzeugt, die die
Darstellung der aktuellen Dokumentseite aus den einzelnen Bildteilen
sowie eine Navigationsleite für
die Navigation zwischen den Dokumentseiten enthält.
-
8.
Das Auslieferungsmodul liefert die jeweils angeforderte Einzelseite
als Sammlung von Einzelbildern und HTML-Code an den Benutzer aus
und protokolliert diese Vorgänge.
Das Auslieferungsmodul ist auch für die Generierung der jeweils
angeforderten Folgeseiten zuständig.
Außerdem
generiert das Auslieferungsmodul Steuersignale, die zwischen dem
Server (Datenraum) und Klienten (Benutzer) liegende Komponenten
(WebServer, Internet Browser) davon abhält, die Informationen in Caches
(Festplatten o.ä.)
physikalisch zwischenzuspeichern.
-
Die 5 illustriert
nochmals schematisch die Erzeugung des „Dokumentenpuzzles" durch einen Server.
-
Anzumerken
ist, dass die beschriebenen Ausführungsbeispiele
lediglich beispielhafter Natur ist und die Erfindung Abwandlungen
innerhalb des durch die Schutzansprüche definierten Schutzbereiches
umfasst.