DE10011664A1 - Dokumentenanalysesystem und Verfahren zum Analysieren von Dokumenten - Google Patents
Dokumentenanalysesystem und Verfahren zum Analysieren von DokumentenInfo
- Publication number
- DE10011664A1 DE10011664A1 DE10011664A DE10011664A DE10011664A1 DE 10011664 A1 DE10011664 A1 DE 10011664A1 DE 10011664 A DE10011664 A DE 10011664A DE 10011664 A DE10011664 A DE 10011664A DE 10011664 A1 DE10011664 A1 DE 10011664A1
- Authority
- DE
- Germany
- Prior art keywords
- analysis
- document
- areas
- area
- complete
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
Die vorliegende Erfindung liefert ein Dokumentenanalysesystem und ein Verfahren zum Analysieren von Dokumenten. Das Dokumentenanalysesystem umfaßt eine Zwischenanalyseeinrichtung, die konfiguriert ist, um eine Zwischendokumentenanalyse durchzuführen, um eine Anzahl von Zwischenbereichen auf einem digitalen Dokument bei einem Zwischen-PPI-Wert (PPI = Pixel-Pro-Zoll) zu identifizieren. Das Dokumentenanalysesystem umfaßt ferner eine Vollanalyseeinrichtung, die konfiguriert ist, um eine vollständige Analyse bei zumindest einem der Zwischenbereiche mit einem zweiten PPI-Wert durchzuführen, wodurch zumindest ein vollständiger Bereich aus demselben erzeugt wird. Das Dokumentenanalysesystem und das Verfahren zum Analysieren von Dokumenten liefern dem Anwender eine große Flexibilität mit mehreren Optionen bezüglich der Analyse der Bereiche von interessierenden Informationen in einem digitalen Dokument und bezüglich der Begrenzung der Analyse auf diese bevorzugten Bereiche.
Description
Die vorliegende Erfindung ist allgemein auf eine Dokumenten
analyse bezogen, und dieselbe ist insbesondere auf ein Doku
mentenanalysesystem und ein Verfahren zum Analysieren von
Dokumenten bezogen, um die Analyse eines abgetasteten Doku
ments oder einer anderen digitalen Darstellung eines Doku
ments flexibel zu steuern.
Immer mehr Dokumente werden unter Verwendung von Textverar
beitungseinrichtungen und dergleichen erzeugt und auf Spei
chervorrichtungen, wie z. B. Festplatten, Disketten, CDs (CD
= Compact Disc) oder anderen Massenspeichermedien, gespei
chert. Trotzdem werden Papier und andere entsprechende Medi
en zukünftig weiterhin noch lange verwendet werden. Folglich
wird weiterhin ein Bedarf danach bestehen, den Gegenstand,
der auf solchen Medien dargestellt ist, abzutasten, so daß
diese Informationen auf einem Computer oder einem anderen
entsprechenden Gerät bearbeitet werden können.
Das Abtasten von Papierdokumenten, um den Inhalt auf den
selben in einer digitalen Umgebung verfügbar zu machen, kann
jedoch zeitaufwendig und kostspielig sein. Insbesondere be
steht ein Problem darin, daß die Verarbeitung von verschie
denen Bereichen der abgetasteten Dokumente sehr lange dauern
kann, wobei der Anwender auf eine Analyse des gesamten Doku
ments warten muß. Für einen Anwender kann es häufig er
wünscht sein, lediglich auf einen Teil des Textes, auf eine
Graphik oder auf einen Bereich mit anderen Datentypen des
abgetasteten Dokuments und nicht auf das gesamte Dokument
zuzugreifen. Beispielsweise kann es erwünscht sein, spezifi
sche Textabsätze aus einem Dokument zu erhalten. Anwender
müssen gegenwärtig jedoch häufig gezwungenermaßen warten,
während eine Abtastumwandlertechnologie ein gesamtes Doku
ment analysiert, um die spezifischen Datentypen der ver
schiedenen Bereiche zu bestimmen, die dann letztendlich Ver
arbeitungspipelines, wie z. B. OCR-Pipelines (OCR = optical
character recognition = optische Zeichenerkennung), usw. zu
geführt werden.
Ausgehend von diesem Stand der Technik besteht die Aufgabe
der vorliegenden Erfindung darin, ein verbessertes Konzept
zur selektiven Analyse von Dokumenten zu schaffen.
Diese Aufgabe wird durch eine Vorrichtung zum Steuern einer
Dokumentenbereichanalyse gemäß Anspruch 1 und durch ein Ver
fahren zum Steuern einer Dokumentenbereichanalyse gemäß An
spruch 8 gelöst.
Die vorliegende Erfindung schafft ein Dokumentenanalysesy
stem und ein Verfahren zum Analysieren von Dokumenten. Bei
einem Ausführungsbeispiel umfaßt das Dokumentenanalysesystem
eine Softwareimplementierung auf einer Prozessorschaltung,
obwohl auch ebenso dedizierte Logikschaltungen verwendet
werden können. Das Dokumentenanalysesystem umfaßt eine Zwi
schenanalyseeinrichtung, die konfiguriert ist, um eine Zwi
schendokumentenanalyse durchzuführen, um eine Anzahl von
Zwischenbereichen auf einem Dokument bei einer PPI-Anfangs
einstellung (PPI = pixels-per-inch = Pixel-Pro-Zoll; 1 Zoll
= 2,54 cm) zu identifizieren. Das Dokumentensystem umfaßt
ferner eine Vollanalyseeinrichtung, die konfiguriert ist, um
eine vollständige Analyse bezüglich zumindest eines der Zwi
schenbereiche bei einer zweiten höheren PPI-Einstellung
durchzuführen, um dadurch zumindest einen vollständigen Be
reich aus demselben zu erzeugen. Die vorliegende Erfindung
liefert dem Anwender eine signifikante Flexibilität mit ei
ner Anzahl von Optionen bezüglich der Analyse der Bereiche
mit interessierenden Informationen in einem Dokument und be
züglich der Begrenzung der Analyse auf solche bevorzugten
Bereiche.
Die vorliegende Erfindung kann ferner dahingehend betrachtet
werden, daß dieselbe ein Verfahren zum Steuern einer Doku
mentenbereichsanalyse liefert. In dieser Hinsicht kann das
Verfahren allgemein durch die folgenden Schritte zusammenge
faßt werden: Durchführen einer Zwischendokumentenanalyse, um
eine Anzahl von Zwischenbereichen auf einem Dokument bei ei
ner PPI-Anfangseinstellung zu identifizieren; und Durchfüh
ren einer vollständigen Analyse bezüglich zumindest eines
der Zwischenbereiche mit einer zweiten, höheren PPI-Einstel
lung, wodurch zumindest ein vollständiger Bereich aus den
selben erzeugt wird.
Die vorliegende Erfindung weist zahlreiche Vorteile auf, von
denen einige im folgenden lediglich als Beispiele darge
stellt sind. Insbesondere versieht die vorliegende Erfindung
den Anwender mit einer schnellen Anzeige der verschiedenen
Bereiche von Informationen auf einem Dokument und ermög
licht, daß der Anwender eine weitere Analyse dieser Bereiche
steuern und den Typ der darin enthaltenen Informationen
identifizieren kann, bevor die Bereiche in einer geeigneten
Verarbeitungspipeline verarbeitet werden, die Algorithmen
für eine optische Zeichenerkennung usw. verwenden kann. Die
vorliegende Erfindung weist einen einfachen Entwurf auf, ist
benutzerfreundlich, robust, zuverlässig und leistungsstark
im Betrieb und kann für eine kommerzielle Massenproduktion
einfach implementiert werden.
Weitere Merkmale und Vorteile der vorliegenden Erfindung
werden einem Fachmann bei der Durchsicht der folgenden
Zeichnungen und der detaillierten Beschreibung offensicht
lich werden. Es ist beabsichtigt, daß alle diese zusätzli
chen Merkmale und Vorteile hierin in dem Schutzbereich der
vorliegenden Erfindung enthalten sind.
Die Komponenten in den Zeichnungen sind nicht notwendiger
weise maßstäblich dargestellt, wobei stattdessen die klare
Darstellung der Prinzipien der vorliegenden Erfindung betont
wird. Außerdem bezeichnen gleiche Bezugszeichen in den Figu
ren entsprechende Teile in allen unterschiedlichen Ansich
ten.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung
werden nachfolgend unter Bezugnahme auf die beiliegenden
Zeichnungen näher erläutert. Es zeigen:
Fig. 1 ein Blockdiagramm eines Dokumentenanalysesystems
gemäß einem Ausführungsbeispiel der vorliegenden
Erfindung;
Fig. 2 eine Zeichnung einer ersten Schnittstellenoberflä
che, die auf einem Anzeigebildschirm des Dokumen
tenanalysesystems von Fig. 1 gezeigt ist;
Fig. 3 eine Zeichnung einer zweiten Schnittstellenoberflä
che, die auf dem Anzeigebildschirm des Dokumenten
analysesystems von Fig. 1 gezeigt ist;
Fig. 4 ein Blockdiagramm einer Dokumentenanalyselogik, die
in dem Dokumentenanalysesystem von Fig. 1 gespei
chert und von demselben ausgeführt wird;
Fig. 5 ein Blockdiagramm einer Zwischenanalyseteilroutine
der Dokumentenanalyselogik von Fig. 4;
Fig. 6 ein Blockdiagramm einer Teilroutine für eine manu
elle Auswahl der Dokumentenanalyselogik von Fig. 4;
und
Fig. 7 ein Blockdiagramm einer Teilroutine für eine voll
ständige Bereichsanalyse der Dokumentenanalyselogik
von Fig. 4.
Bezugnehmend auf Fig. 1 ist ein Blockdiagramm eines Dokumen
tenanalysesystems 100 gemäß einem Ausführungsbeispiel der
vorliegenden Erfindung gezeigt. Das Dokumentenanalysesystem
100 umfaßt ein Computersystem 103, das einen Prozessor 106
und einen flüchtigen/nicht-flüchtigen Speicher 113 ("Spei
cher 113") aufweist, die beide mit einer lokalen Schnitt
stelle 116 gekoppelt sind. Das Computersystem 103 weist fer
ner eine Videoschnittstelle 119, eine Anzahl von Eingabe
schnittstellen 123, ein Modem 126, eine Anzahl von Ausgabe
schnittstellen 129 und eine mobile Datenspeicherungsvorrich
tung 133 auf, die auch alle mit der lokalen Schnittstelle
116 gekoppelt sind. Der Speicher 113 kann beispielsweise ei
nen Speicher mit wahlfreiem Zugriff (RAM; RAM = random ac
cess memory), einen Nur-Lese-Speicher (ROM; ROM = read only
memory), eine Festplatte und andere entsprechende Vorrich
tungen oder eine beliebige Kombination dieser Vorrichtungen
aufweisen. Es ist zu beachten, daß sich der Ausdruck flüch
tig auf Speichervorrichtungen bezieht, die die gespeicherten
Daten bei einem Stromausfall im allgemeinen verlieren, wobei
sich der Ausdruck nicht-flüchtig auf Speichervorrichtungen
bezieht, die bei einem Stromausfall keine Daten verlieren.
Das Dokumentenanalysesystem 100 umfaßt ferner eine Anzeige
vorrichtung 136, die über die Videoschnittstelle 119 mit der
lokalen Schnittstelle 116 gekoppelt ist. Das Dokumentenana
lysesystem 100 umfaßt ferner mehrere Eingabevorrichtungen,
nämlich eine Tastatur 139, eine Maus 143, ein Mikrophon 146
und einen Scanner 149, die alle über die verschiedenen Ein
gabeschnittstellen 123 mit der lokalen Schnittstelle 116 ge
koppelt sind. Zusätzlich ist das Modem 126 mit einem exter
nen Netzwerk 153 gekoppelt, wodurch ermöglicht wird, daß das
Computersystem über das externe Netzwerk 153 Daten versenden
und empfangen kann. Das externe Netzwerk 153 kann beispiels
weise das Internet, ein lokales Netzwerk (LAN; LAN = local
area network), ein weiträumiges Netzwerk (WAN; WAN = wide
area network) oder ein anderes entsprechendes Netzwerk sein.
Das Dokumentenanalysesystem 100 kann ferner Audiolautspre
cher 156, einen Drucker 159 oder andere Ausgabevorrichtungen
aufweisen, die über die Ausgabeschnittstellen 129 mit der
lokalen Schnittstelle 116 gekoppelt sind. Die mobile Daten
speichervorrichtung 133 kann eine von mehreren solcher Vor
richtungen sein, die eine Datenspeicherung auf einer mobilen
Plattform, wie z. B. einem Diskettenlaufwerk, einem CD-Lauf
werk, einem mobilen Festplattenlaufwerk, einem mobilen Fest
speicher oder einer anderen entsprechenden Datenspeichervor
richtung, ermöglichen.
Das Dokumentenanalysesystem 100 umfaßt ferner eine Dokumen
tenanalyselogik 170, die im allgemeinen zusammen mit den Da
ten 176 in dem Speicher 113 gespeichert ist. Bei einem Aus
führungsbeispiel der vorliegenden Erfindung weist der Spei
cher 113 eine Kombination aus einem RAM-Speicher, einem
ROM-Speicher und einer Festplatte auf, obwohl andere Kombi
nationen verwendet werden können. Bei diesem Ausführungsbei
spiel ist die Dokumentenanalyselogik 170 eine Software, die
auf der Festplatte gespeichert ist, wobei auch die Daten 176
auf der Festplatte gespeichert sind. Wenn sich das Dokumen
tenanalysesystem 100 im Betrieb befindet, werden relevante
Teile der Dokumentenanalyselogik 170 in den RAM-Speicher ge
laden und von dem Prozessor 106 ausgeführt. Während des Be
triebs des Dokumentenanalysesystems 100 kann die Dokumenten
analyselogik 170 auf relevante Teile der Daten 176, die auf
der Festplatte gespeichert sind, zugreifen und dieselben für
unterschiedliche Zwecke in den RAM-Speicher laden. Die Daten
176 können beispielsweise eine Bitmap-Abbildung eines abge
tasteten Dokuments, das aus dem Scanner 149 empfangen wird,
aufweisen. Auf die Daten 176 kann ferner über den mobilen
Datenspeicher 133 oder das externe Netzwerk 153 zugegriffen
werden.
Die Anzeigevorrichtung 136 wird verwendet, um eine beliebige
aus einer Anzahl von Schnittstellenanzeigen 181 anzuzeigen,
die von dem Anwender betrachtet werden. Der Anwender ist
über die Eingabevorrichtungen, wie z. B. die Tastatur 139,
die Maus 143 oder das Mikrophon 146, "schnittstellenmäßig"
mit dem Computersystem 103 verbunden. Der Anwender empfängt
eine Audioausgabe aus den Audiolautsprechern 156, und das
Computersystem 103 kann verschiedene erstellte Dokumente auf
dem Drucker 159 ausdrucken.
Es ist zu beachten, daß, obwohl die obige Implementierung
der vorliegenden Erfindung hinsichtlich einer Prozessorein
heit und Software erörtert wird, es offensichtlich sein
sollte, daß andere Ausführungsbeispiele der vorliegenden Er
findung eine dedizierte Logikschaltung, die die Funktionali
tät der Dokumentenanalyselogik 170 erfüllt, oder eine Kombi
nationsschaltung umfassen, die eine Prozessorschaltung mit
einer Software und spezifischen dedizierten Schaltungen auf
weist. Es wird offensichtlich, daß alle diese Permutationen
von verschiedenen Implementierungen hierin aufgenommen sind.
Im folgenden wenden wir uns Fig. 2 zu. Dort ist eine erste
Schnittstellenanzeige 181a gezeigt, die auf der Anzeigevor
richtung 136 erscheint. Die erste Schnittstellenanzeige 181a
weist quer über die Oberseite mehrere Knöpfe auf, ein
schließlich eines "Wiederhole"-Knopfes 203, eines Automati
sche-Analyse-Knopfes 206, eines Prioritäts-Menü-Knopfes 209,
eines Stopp/Lösche-Knopfes 213 und eines Verarbeite-Berei
che-Knopfes 216. Die erste Schnittstellenanzeige 181a weist
ferner eine Anzeigeeinrichtung 219 für eine PPI-Zwischenein
stellung 219 (PPI = pixels-per-inch = Pixel-Pro-Zoll; 1 Zoll
= 2,54 cm) auf, die einen PPI-Pulldown-Knopf 223 aufweist.
Es ist zu beachten, daß diese Knöpfe gedrückt oder aktiviert
werden können, indem mit der Maus 143 ein Zeiger an die Po
sition des Knopfes gebracht und dann eine geeignete Taste
auf der Maus 143 gedrückt wird. Die Verwendung der Maus 143
auf diese Art und Weise wird als "Anklicken" eines bestimm
ten Knopfes bezeichnet. Ferner kann auch ein Sprachbefehl,
der von dem Mikrophon 146 empfangen und durch eine geeignete
Spracherkennungssoftware interpretiert wird, verwendet wer
den, um die Knöpfe zu aktivieren oder um die Funktionen, die
den Knöpfen zugeordnet sind, auf eine andere Weise auszufüh
ren. Die erste Schnittstellenanzeige 181a weist ferner einen
Dokumentenanzeigebereich 226 auf, in dem ein digitales Doku
ment 229 angezeigt wird. In dem digitalen Dokument 229 be
finden sich mehrere Zwischenbereiche 233, die von 1 bis 6
numeriert sind. Die Zwischenbereiche 233 werden basierend
auf einer Datendatei erzeugt, die eine digitale Darstellung
eines Hardcopy-Dokuments aufweist, das von dem Scanner 149
abgetastet wurde. Das digitale Dokument kann in der Form ei
ner Bitmap-Abbildung oder in einem anderen entsprechenden
Format vorliegen.
Gemäß der vorliegenden Erfindung wird das digitale Dokument
229 durch Abtasten eines Hardcopy-Dokuments durch den Scan
ner 149 erzeugt. Daraufhin wird bezüglich des digitalen Do
kuments 229 eine Zwischenanalyse durchgeführt, um die ein
zelnen Typen von Informationen auf dem Dokument bei einem
Zwischen-PPI-Wert zu identifizieren. Die Bedeutung des Pi
xel-Pro-Zoll-Werts der Analyse des digitalen Dokuments
rechtfertigt eine weitere Erklärung.
Das digitale Dokument 229 besteht eigentlich aus zahlreichen
Pixeln, die über der Vorderseite des Dokuments in Zeilen an
geordnet sind, wie es beispielsweise bei einer Bitmap-Abbil
dung usw. der Fall ist. Die Pixel werden beispielsweise
durch die Tätigkeit des Scanners 149 erzeugt. Beim Analysie
ren des digitalen Dokuments 229 werden die Pixelzeilen mit
einer spezifizierten Auflösung einer spezifizierten Anzahl
von Pixel-Pro-Zoll genau untersucht wird, um die Grenzen von
Textbereichen oder Bereichen mit anderen Datentypen zu be
stimmen. Das heißt sozusagen, daß nicht alle der Pixel un
tersucht werden, sondern lediglich eine spezifizierte Anzahl
der Pixel pro Zoll (1 Zoll = 2,54 cm) untersucht werden. Die
Pixel, die pro Zoll untersucht werden, können schnell und
einfach aus einem Quellendokument mit einem höheren PPI-Wert
abgebildet werden. Gemäß der vorliegenden Erfindung ist der
Zwischen-PPI-Wert im allgemeinen niedriger als der PPI-Wert,
der notwendig ist, um die genaue Art der Informationen auf
dem digitalen Dokument 229 exakt zu bestimmen. Folglich wird
basierend auf der Zwischenanalyse eine Abschätzung der ge
nauen Art der Informationen auf dem digitalen Dokument 229
erhalten. Ein wesentlicher Vorteil der Zwischenanalyse be
steht darin, daß dieselbe im Vergleich zu einer vollständi
gen und genauen Analyse des digitalen Dokuments 229 schnell
ist.
Beim Durchführen der Zwischenanalyse gibt es mehrere Doku
mentenanalysealgorithmen, die verwendet werden können, die
Manhattan-Seitenformate und Nicht-Manhattan-Seitenformate
aufweisen. Der verwendete Algorithmus sollte als Merkmal ei
ne Segmentierung aufweisen, die ausreichend grob ist, um si
cherzustellen, daß Informationen eines Datentyps, der in ei
nem einzelnen Bereich enthalten ist, nicht in zwei Bereiche
aufgeteilt wird. Ein bevorzugter Algorithmus wird als "Pro
jektionsschnitt"- oder "Blocksegmentierungs"-Algorithmus be
zeichnet, der aufeinanderfolgende vertikale und horizontale
Schnitte durch das Dokument verwendet. Weitere Algorithmen
umfassen einen "Verbundene-Komponente/Unschärfe"-Algorith
mus, der in dem Artikel von Wong u. a., "Document Analysis
System", J. Res. Development, Bd. 6, S. 642-656, Nov.
1982, beschrieben ist, der hierin durch Bezugnahme aufgenom
men ist, als auch einen "Schwelle-Unschärfe-und-Verbundene-
Komponente"-Algorithmus. Eine weitere Erklärung solcher Al
gorithmen ist bei Pavlidis u. a., "Page Segmentation and
Classification", CVGIP: Graphical Models and Image Proces
sing, Bd. 54, Nr. 6, Nov. 1992, S. 484-496, zu finden, und
ist hierin durch Bezugnahme aufgenommen.
Die Zwischenanalyse untersucht das digitale Dokument 229 und
erhält die Abschätzung der Art der Informationen auf dem di
gitalen Dokument 229 durch Erfassen der Zwischenbereiche
233. Im allgemeinen weist die Fläche jedes Zwischenbereichs
223 basierend auf der Zwischenanalyse vorherrschende Charak
teristika auf, die anzeigen, daß der Inhalt des Zwischenbe
reichs 233 einen einzigen Typ aufweist, der im allgemeinen
als Text, Photos, Liniengraphik oder als ein anderer Be
reichsdatentyp klassifiziert wird. Aufgrund der Tatsache,
daß die Zwischenanalyse bei dem relativ niedrigen Zwischen-
PPI-Wert durchgeführt wird, der beispielsweise etwa gleich
30 PPI sein kann, ist es möglich, daß ein einzelner Zwi
schenbereich 233 tatsächlich einen oder mehrere konkrete Be
reiche mit einem unterschiedlichen Bereichsdatentyp enthal
ten kann. Dies tritt auf, da der relativ niedrige PPI-Wert
der Zwischenanalyse nicht zwischen Bereichen unterscheidet,
die aufgrund einer Unschärfe, einer Projektionsprofilstö
rung, einer Überlappung von verbundenen Komponenten usw.
letztendlich bei dem niedrigeren PPI-Wert ein ähnliches Aus
sehen aufweisen.
Sobald das digitale Dokument 229 erzeugt und die Zwischenbe
reiche 233 identifiziert worden sind, werden die Zwischenbe
reiche 233 auf eine Art und Weise angezeigt, um anzugeben,
daß dieselben tatsächlich Zwischenbereiche 233 sind. Die
Zwischenbereiche 233 können beispielsweise eine vorbestimmte
Grenze aufweisen, wie z. B. eine gestrichelte Linie oder ei
nen anderen Linientyp. Die Zwischenbereiche 233 können in
einer unterschiedlichen Farbe oder als ein spezifisches Pik
togramm (Icon) erscheinen. Angesichts der vorhergehenden Be
schreibung sollte es offensichtlich sein, daß die Zwischen
bereiche 233 ein Aussehen aus einer Vielzahl von Ausgestal
tungen aufweisen können, die lediglich durch die Fähigkeiten
der Anzeigevorrichtung 138 und der Treibersoftware be
schränkt sind. Alle diese Permutationen des Aussehens der
Zwischenbereiche 233 sind hierin aufgenommen.
Der Anwender kann einen beliebigen der Zwischenbereiche 233
hervorheben, um diese Bereiche auf irgendeine Art und Weise
weiter zu bearbeiten, indem (beispielsweise durch einmaliges
Anklicken mit der Maus) der gewünschte Zwischenbereich 229
ausgewählt wird. Sobald ein Zwischenbereich hervorgehoben
ist, kann der Anwender den Bereich ändern, indem die Grenzen
bewegt werden, oder der Anwender kann den hervorgehobenen
Zwischenbereich 233 vollständig löschen.
Die vorliegende Erfindung erleichtert die weitere oder voll
ständige Analyse der Zwischenbereiche 233, um den konkreten
Bereich oder die konkreten Bereiche, die darin enthalten
sind, zu ermitteln. Sobald ein bestimmter Zwischenbereich
233 der vollständigen Analyse unterzogen wurde, werden der
Inhalt des konkreten Bereichs oder der konkreten Bereiche,
der darin enthalten ist, für eine weitere Bearbeitung durch
den Anwender angezeigt. Auf diese Art und Weise werden die
Zwischenbereiche 233, die nicht der vollständigen Analyse
unterzogen wurden, von den konkreten Bereichen unterschie
den, die sich aus der vollständigen Analyse eines früheren
Zwischenbereichs 233 ergeben. Es ist zu beachten, daß die
vollständige Analyse bei einem höheren PPI-Wert als die Zwi
schenanalyse, wie z. B. bei 75-100 PPI oder höher, durchge
führt wird.
Sobald die Zwischenanalyse durchgeführt ist und die Zwi
schenbereiche 233 auf dem digitalen Dokument 229 identifi
ziert sind, sieht sich der Anwender weiteren Optionen gegen
über, um das digitale Dokument 229 zu analysieren. Insbeson
dere für den Fall, daß der Anwender findet, daß den Zwi
schenbereichen 233 eine ausreichende Detaillierung fehlt,
wie z. B. für den Fall einer wiederholten Verwendung mit ei
nem ähnlichen Dokumenttyp, kann der Anwender einen neuen
Zwischen-PPI-Wert in die Zwischen-PPI-Anzeigeeinrichtung 219
eingeben oder der PPI-Pulldown-Knopf 223 kann gedrückt wer
den, um eine Liste von möglichen Zwischen-PPI-Werten herun
terzuziehen, aus denen der Anwender eine Auswahl treffen
kann, indem der geeignete Zwischen-PPI-Wert mit der Maus 143
angeklickt wird. Daraufhin kann der Anwender auf den Wieder
hole-Knopf 203 klicken, der ein Wiederhole-Flag, das in dem
Speicher 113 gespeichert ist, auf eine logische "1" setzt,
wobei das Dokumentenanalysesystem 100 die Zwischenanalyse
bei dem neu eingegebenen Zwischen-PPI-Wert noch einmal
durchführt.
Der Anwender kann auch auf den Automatische-Analyse-Knopf
206 klicken, wobei dann das Dokumentenanalysesystem 100 eine
vollständige Analyse jedes der Zwischenbereiche 233 gemäß
einer vorbestimmten Prioritäts-Nummer beginnt, die jedem der
Zwischenbereiche 233 zugeordnet ist. Falls der Anwender
wünscht, die vollständige Analyse bezüglich eines ausgewähl
ten Zwischenbereichs 233 oder einer ausgewählten Anzahl der
Zwischenbereiche 233 durchzuführen, kann der Anwender ein
fach einen "Doppel-Klick" auf die spezifische(n) Zwischenbe
reich(e) 233 vornehmen. Der Prioritäts-Schlange-Knopf 209
bewirkt, daß eine zweite Schnittstellenanzeige (nicht ge
zeigt) auf der Anzeigevorrichtung 136 erscheint, um die Be
reiche zu bearbeiten, die in einer Zwischenbereichsanalyse
schlange enthalten sind, wie es im folgenden erörtert wird.
Der Anwender kann den Stopp/Lösche-Knopf 213 anklicken, der
bewirkt, daß die Analyse eines beliebigen ausgewählten Be
reichs beendet wird, und der Automatische-Analyse-Knopf 206
wird betätigt, falls derselbe gedrückt wird. Schließlich ist
der "Verarbeite-Bereiche"-Knopf 216 vorgesehen, der, wenn
derselbe aktiviert wird, ermöglicht, daß der Benutzer die
jenigen Bereiche, die einer vollständigen Analyse unterzogen
wurden, zu einer geeigneten Verarbeitungspipeline schicken
kann, wie z. B. einem OCR-Algorithmus (OCR = optical charac
ter recognition = optische Zeichenerkennung), einem Photo
editor, einer Textverarbeitungseinrichtung, einem Publisher,
einer Dokumentenerzeugungseinrichtung, einem Formularpaket,
einer Web-Seiten-Erstellungseinrichtung, Datenbanken, Faxge
räten, Kopiergeräten, Druckern oder anderen entsprechenden
Pipelines.
Bezugnehmend auf Fig. 3 ist eine zweite Schnittstellenanzei
ge 181b gemäß einem weiteren Ausführungsbeispiel der vorlie
genden Erfindung gezeigt. Die zweite Schnittstellenanzeige
181b umfaßt eine Zwischenbereichsprioritätsschlange 301 und
eine Liste 303 für nicht-ausgewählte Zwischenbereiche. Die
zweite Schnittstellenanzeige 181b umfaßt ferner einen Hinzu
füge-Knopf 306, einen Entferne-Knopf 309, einen Bewege-
Nach-Oben-Knopf 313 und einen Bewege-Nach-Unten-Knopf 316.
Nachdem die Zwischenanalyse durchgeführt ist, werden die
identifizierten Zwischenbereiche in der Liste 303 für die
nicht-ausgewählten Zwischenbereiche aufgelistet. Diese auf
gelisteten Zwischenbereiche 233 werden dann ausgewählt, um
auf eine beliebige Weise in der Zwischenbereichsanalyse
schlange 301 plaziert zu werden.
Ein Bereich kann beispielsweise ausgewählt werden, indem
dieser Zwischenbereich 233, der auf der Schnittstelle sicht
bar ist, doppelt angeklickt wird, wenn die erste Schnitt
stellenanzeige 181a (Fig. 2) betrachtet wird. Ferner können
alle Bereiche ausgewählt werden, indem der Automatische-Ana
lyse-Knopf 206 (Fig. 2) angeklickt wird. Schließlich kann
ein Zwischenbereich 233 hervorgehoben werden, indem dieser
Bereich in der Liste 303 für nicht-ausgewählte Zwischenbe
reiche angeklickt und daraufhin der Hinzufüge-Knopf 306 an
geklickt wird. Entsprechend kann ein Zwischenbereich 233 in
der Zwischenbereichsanalyseschlange 301 aus derselben ent
fernt werden, indem der spezielle Zwischenbereich 233 her
vorgehoben und dann der Entferne-Knopf 309 angeklickt wird.
Es ist zu beachten, daß die Zwischenbereiche 233 gemäß einer
vorbestimmten Priorität in der Zwischenbereichsanalyse
schlange 301 aufgelistet sind, wobei die höchste Priorität
dem obersten aufgelisteten Zwischenbereich 233 zugeordnet
ist. Die höchste Priorität wird basierend auf der Reihenfol
ge, mit der die Zwischenbereiche 233 ausgewählt werden, zu
gewiesen. Zusätzlich kann die Priorität der Zwischenbereiche
233 neu angeordnet werden, indem der entsprechende Bereich
hervorgehoben und der Bewege-Nach-Oben- und Bewege-Nach-Un
ten-Knopf 313 und 316 geeignet gedrückt wird. Das Endergeb
nis besteht darin, daß der hervorgehobene Bereich folglich
in der Zwischenbereichsanalyseschlange 301 nach oben oder
nach unten weitergeschoben wird. Alternativ bewirkt ein ein
zelnes Anklicken des Zwischenbereichs (im Gegensatz zu einem
Doppelklick) in der ersten Schnittstellenanzeige 181a, daß
sich dieser Bereich nach oben in der Schlange 301 bewegt.
Gemäß der vorliegenden Erfindung wird jeder Zwischenbereich
233, der in der Zwischenbereichsanalyseschlange 301 plaziert
ist und die höchste Priorität aufweist, der vollständigen
Analyse unterzogen, um die genaue Art der Informationen, die
in den fraglichen Zwischenbereichen 233 enthalten sind, zu
identifizieren.
Bezugnehmend auf Fig. 4 ist ein Flußdiagramm der Dokumenten
analyselogik 170 (Fig. 1) gemäß einem Ausführungsbeispiel
der vorliegenden Erfindung gezeigt. Die Dokumentenanalyse
logik 170 beginnt mit Block 403, bei dem ein spezifisches
digitales Dokument 229 für die Zwischenanalyse identifiziert
wird. Dies wird beispielsweise durchgeführt, indem ein Doku
ment aus einer Eingabeliste (pick list) gewählt wird, oder
ein abgetastetes Dokument kann automatisch ausgewählt wer
den. Falls ein digitales Dokument 229 vorliegt, springt die
Dokumentenanalyselogik 170 zu Block 406 weiter. Falls dies
nicht der Fall ist, springt die Dokumentenanalyselogik 170
zurück zu Block 406, bei dem dieselbe schließlich bleibt,
bis ein Dokument identifiziert wird. Bei Block 406 wird eine
Zwischenanalyseteilroutine ausgeführt, wie es im folgenden
erörtert wird.
Bei Block 409 bestimmt die Dokumentenanalyselogik 170, ob
der Automatische-Analyse-Knopf 206 (Fig. 2) gedrückt ist.
Falls der Automatische-Analyse-Knopf 206 nicht gedrückt ist,
springt die Betriebslogik zu Block 413. Falls derselbe ge
drückt ist, springt die Dokumentenanalyselogik 170 weiter zu
Block 416. Bei Block 413 wird eine Teilroutine für eine ma
nuelle Auswahl ausgeführt, wie es erörtert wird. Bei Block
416 plaziert die Dokumentenanalyselogik 170 alle nicht-aus
gewählten Zwischenbereiche 233 mit einem Flag (Merker) für
einen vollständigen Bereich, das gleich einer logischen "0"
ist, in der Zwischenbereichsanalyseschlange 301. Die
"nicht-ausgewählten" Zwischenbereiche sind diejenigen, die
nicht in der Zwischenbereichsanalyseschlange 301 plaziert
worden sind. Daraufhin springt die Dokumentenanalyselogik
170 weiter zu Block 419.
Bei Block 413 wird eine Teilroutine für eine manuelle Aus
wahl ausgeführt, die die Operation des Dokumentenanalysesy
stems 100 steuert, wenn der Automatische-Analyse-Knopf 206
(Fig. 2) nicht gedrückt ist. Daraufhin springt die Dokumen
tenanalyselogik 170 zu Block 419 weiter, bei dem eine Teil
routine 419 für eine vollständige Bereichsanalyse ausgeführt
wird. Sobald die Teilroutine 419 für eine vollständige Be
reichsanalyse ausgeführt ist, springt die Dokumentenanalyse
logik 170 zu Block 423, bei dem das Wiederhole-Flag unter
sucht wird. Falls das Wiederhole-Flag gleich einer logischen
"1" ist, springt die Dokumentenanalyselogik 170 zurück zu
Block 406, bei dem die Zwischenanalyseteilroutine noch ein
mal ausgeführt wird. Falls das Wiederhole-Flag gleich einer
logischen "0" ist, springt die Dokumentenanalyselogik zu
Block 426 weiter, bei dem bestimmt wird, ob die Dokumenten
analyselogik 170 abgeschlossen ist. Dies tritt beispiels
weise auf, wenn alle Flags für einen vollständigen Bereich
auf eine logische "1" eingestellt sind oder wenn der Anwen
der bewirkt, daß die Logik endet, indem der Verarbeite-
Bereich-Knopf 216 (Fig. 2) gedrückt wird, wodurch bewirkt
wird, daß diejenigen Bereiche mit einem Flag für einen voll
ständigen Bereich, das auf eine logische "1" eingestellt
ist, geeigneten Verarbeitungspipelines, wie z. B. OCR-Algo
rithmen usw., zugeführt werden. Ferner kann der Anwender ei
ne Abbruch-Option (Cancel-Option) auswählen, die in der er
sten Schnittstellenanzeige 181a aufgenommen ist, um die Lo
gik 170 zu beenden. Falls die Dokumentenanalyselogik 170 bei
Block 426 noch nicht beendet ist, springt die Logik 170 zu
rück zu Block 409. Falls die Logik 170 beendet ist, endet
die Dokumentenanalyselogik 170.
Im folgenden wenden wir uns Fig. 5 zu. Dort ist ein Flußdia
gramm der Zwischenanalyseteilroutine 406 gezeigt. Die Zwi
schenanalyseteilroutine 406 beginnt mit Block 433, bei dem
die Zwischenanalyse bezüglich eines identifizierten digita
len Dokuments 229 (Fig. 2) bei dem Zwischen-PPI-Wert durch
geführt wird. Es ist zu beachten, daß das dargestellte digi
tale Dokument 229 unter Verwendung des Scanners 149 (Fig. 1)
in das Dokumentenanalysesystem 110 eingescannt oder aus dem
externen Netzwerk 153 (Fig. 1) oder dem mobilen Datenspei
cher 133 (Fig. 1) usw., in den Speicher 113 geladen worden
sein kann.
Daraufhin springt die Teilroutine zu Block 436, bei dem die
erste Schnittstellenanzeige 181a (Fig. 2) auf der Anzeige
vorrichtung 136 (Fig. 1) dargestellt wird, die das digitale
Dokument 229 und die Zwischenbereiche 233 zeigt, die durch
die Zwischenanalyse von Block 433 identifiziert sind. Die
Zwischenbereiche 233 werden mit einem Zwischen-Zeichen, wie
vorher erörtert, angezeigt, um zwischen denjenigen Bereichen
zu unterscheiden, die der vollständigen Analyse unterzogen
wurden, und denjenigen, die der vollständigen Analyse nicht
unterzogen wurden. Daraufhin wird bei Block 439 eine Anzahl
von Flags für einen vollständigen Bereich auf eine logische
"0" eingestellt, wobei jedes Flag einem der Zwischenbereiche
233 zugeordnet ist. Die Flags für vollständige Bereiche kön
nen beispielsweise eine Anzahl von vordefinierten Bits in
dem Speicher 113 oder einer anderen Speicherposition sein,
auf die von dem Prozessor 106 (Fig. 1) zugegriffen werden
kann.
Die Logik der Zwischenanalyseteilroutine kann in Verbindung
mit der geeigneten Hardware des Dokumentenanalysesystems als
eine Zwischenanalyseeinrichtung betrachtet werden, die die
Zwischenbereiche 233 basierend auf dem digitalen Dokument
229 erzeugt.
Bezugnehmend auf Fig. 6 ist ein Flußdiagramm einer Teilrou
tine 413 für eine manuelle Auswahl gezeigt. Beginnend mit
Block 453 kann der Anwender einen oder mehrere der Zwischen
bereiche 233, die auf der ersten Schnittstellenanzeige 181a
angezeigt werden, verändern oder löschen. Der Anwender kann
beispielsweise einen bestimmten Zwischenbereich 233 ankli
cken, um denselben hervorzuheben und die Position der Gren
zen auf eine bekannte Abmessung gemäß bekannten Charakteri
stika des speziellen Zwischenbereichs 233 einstellen, indem
die Grenzen mit der Maus 143 (Fig. 1) manipuliert bzw. bear
beitet werden. Folglich sind die Ränder und Ecken der Zwi
schenbereiche 233 im allgemeinen aktiv, interaktiv, ein
stellbar oder verstellbar. Der Anwender kann ferner einen
Zwischenbereich löschen, indem der spezielle Zwischenbereich
angeklickt wird, um denselben hervorzuheben, und der Lö
sche-Knopf gedrückt wird, usw. Falls eine Änderung oder eine
Löschung eines bestimmten Zwischenbereichs 233 bei Block 453
erfaßt wird, springt die Teilroutine zu Block 456, bei dem
das Flag für einen vollständigen Bereich des geänderten/ge
löschten Zwischenbereichs 233 auf eine logische "1" einge
stellt wird, das anzeigt, daß der geänderte/gelöschte Zwi
schenbereich 233 nicht einer vollständigen Analyse unterzo
gen werden muß. Falls keine Änderung oder Löschung eines
Zwischenbereichs bei Block 453 auftritt, oder falls ein Flag
für einen vollständigen Bereich bei Block 456 auf eine logi
sche "1" eingestellt worden ist, springt die Teilroutine zu
Block 459 weiter.
Bei Block 459 bestimmt die Teilroutine, ob der Wiederhole-
Knopf 203 (Fig. 2) gedrückt worden ist. Falls der Wiederho
le-Knopf 203 gedrückt worden ist, springt die Teilroutine zu
Block 463 weiter, bei dem ein Wiederhole-Flag auf eine logi
sche "1" eingestellt wird. Das Wiederhole-Flag kann bei
spielsweise ein vordefiniertes Bit in dem Speicher 113 oder
einer anderen geeigneten Speicherposition sein. Falls der
Wiederhole-Knopf 203 nicht gedrückt worden ist, wie es in
Block 459 bestimmt wird, oder falls das Wiederhole-Flag bei
Block 463 auf eine logische "1" eingestellt worden ist,
springt die Teilroutine zu Block 466 weiter.
Bei Block 466 bestimmt die Teilroutine, ob der Anwender ei
nen bestimmten Zwischenbereich 233 zu der Zwischenbereichs
analyseschlange 301 (Fig. 3) hinzugefügt hat, indem entweder
der Bereich doppelt angeklickt wurde, während die erste
Schnittstellenanzeige 181a (Fig. 2) betrachtet wurde, oder
indem der Hinzufüge-Knopf 306 angeklickt wurde, um einen
speziellen hervorgehobenen Bereich 233 hinzuzufügen, während
die zweite Schnittstellenanzeige 181b betrachtet wurde.
Falls das Hinzufügen eines Zwischenbereichs 233 zu der Zwi
schenbereichsanalyseschlange 301 erfaßt worden ist, springt
die Teilroutine zu Block 469 weiter. Falls dies nicht der
Fall ist, endet die Teilroutine und springt zu dem Flußdia
gramm von Fig. 4 zurück. Bei Block 469 wird der ausgewählte
Zwischenbereich 233 in der Zwischenbereichsanalyseschlange
plaziert, falls das entsprechende Flag für einen vollständi
gen Bereich eine logische "0" ist. Daraufhin endet die Teil
routine und springt zu dem Flußdiagramm von Fig. 4 zurück.
Bezugnehmend nun auf Fig. 7 ist ein Flußdiagramm der Teil
routine 419 für eine vollständige Bereichsanalyse gezeigt.
Beginnend mit Block 503 bestimmt die Teilroutine, ob ein
Zwischenbereich 233 (Fig. 2) in der Zwischenbereichsanalyse
schlange 301 (Fig. 3) plaziert worden ist. Falls einer oder
mehrere der Zwischenbereiche 233 in der Schlange 301 pla
ziert worden ist, springt die Teilroutine 419 zu Block 506
weiter. Falls dies nicht der Fall ist, endet die Teilroutine
419 und springt zu dem Flußdiagramm von Fig. 4 zurück. Es
ist zu beachten, daß die Bereichsanalyseteilroutine 419 im
allgemeinen so lange wartet, bis zumindest ein Zwischenbe
reich 233 in der Schlange 301 plaziert worden ist, bevor ei
ne weitere Funktion durchgeführt wird.
Bei Block 506 führt die Teilroutine 419 eine vollständige
Analyse des Bereichs mit der höchsten Priorität in der
Schlange 301 durch. Die höchste Priorität wird im allgemei
nen auf der Basis bestimmt, daß der Bereich als erstes ana
lysiert wird, der als erstes ausgewählt wurde. Während die
vollständige Analyse bezüglich des Bereichs mit der höchsten
Priorität in der Schlange 301 durchgeführt wird, springt die
Teilroutine 419 dann zu Block 509 weiter und untersucht die
Schlange 301, um zu erkennen, ob sich die höchste Priorität
verändert hat, während dieselbe eine vollständige Analyse
durchgeführt hat. Falls dies der Fall ist, springt die Teil
routine 419 zu Block 513, wobei die vollständige Analyse bei
dem Bereich mit vormals höchster Priorität angehalten wird
und die Ergebnisse als die noch nicht vollständige Analyse
in dem Speicher 113 (Fig. 1) gespeichert werden, wobei die
Analyse fortgesetzt wird, wenn dieser Zwischenbereich wieder
einmal der Bereich mit der höchsten Priorität ist. Daraufhin
springt die Teilroutine 419 zurück zu Block 506, bei dem der
neue Bereich mit der höchsten Priorität einer vollständigen
Analyse unterzogen wird. Es ist zu beachten, daß die Logik
von Block 506 als eine vollständige Analyseeinrichtung be
trachtet werden kann, die eine vollständige Analyse der Zwi
schenbereiche 233 liefert, die zu derselben zugeführt wer
den.
Falls die Priorität bei Block 509 nicht geändert wurde,
springt die Teilroutine 419 zu Block 516, bei dem bestimmt
wird, ob einer der Zwischenbereiche 233 in der Schlange 301
geändert oder gelöscht worden ist, oder ob ein Zwischenbe
reich 233 die vollständige Analyse beendet hat. Falls dies
nicht der Fall ist, springt die Teilroutine zu Block 519
weiter, und falls dies der Fall ist, springt die Teilroutine
419 zu Block 523 weiter. Bei Block 523 wird das Flag für ei
nen vollständigen Bereich des geänderten/gelöschten/voll
ständigen Zwischenbereichs 233 auf eine logische "1" ein
gestellt, die anzeigt, daß der Bereich keiner vollständigen
Analyse unterzogen werden muß. Daraufhin springt die Teil
routine 419 zu Block 526, bei dem der spezielle geänder
te/gelöschte/vollständige Zwischenbereich 233 aus der
Schlange 301 entfernt wird, wobei die Teilroutine 419 ohne
den geänderten/gelöschten/vollständigen Zwischenbereich 233
wiederholt wird.
Beim Erreichen des Blocks 519 bestimmt die Teilroutine 419,
ob ein bestimmter Bereich aus der Schlange 301 durch Drücken
des Entferne-Knopfs 309 in der zweiten Schnittstellenanzeige
181b entfernt worden ist. Falls dies der Fall ist, springt
die Teilroutine 419 zu Block 524, bei dem der Automatische-
Analyse-Knopf 206 aktiviert wird, falls derselbe gedrückt
wird. Daraufhin springt die Teilroutine 419 zu Block 526 zu
rück, um den gewünschten Zwischenbereich 233 aus der Schlan
ge 301 zu entfernen. Falls kein Bereich bei Block 519 ent
fernt worden ist, springt die Teilroutine 419 zu Block 529,
bei dem bestimmt wird, ob ein Zwischenbereich 233 zu der
Schlange 301 hinzugefügt worden ist, indem entweder ein ge
wünschter Zwischenbereich 233 auf der ersten Schnittstellen
anzeige 181a (Fig. 2) doppelt angeklickt wurde, indem der
Automatische-Analyse-Knopf 206 (Fig. 2) angeklickt wurde,
oder indem der Hinzufüge-Knopf 306 in der zweiten Schnitt
stellenanzeige 181b (Fig. 3) angeklickt wurde. Falls dies
der Fall ist, springt die Teilroutine 419 zu Block 533, bei
dem der gewünschte Zwischenbereich 233 zu der Schlange 301
hinzugefügt wird, falls das entsprechende Flag für einen
vollständigen Bereich auf eine logische "0" eingestellt ist.
Für den Fall, wenn der Automatische-Analyse-Knopf 203 ge
drückt worden ist, können mehrere Bereiche gleichzeitig zu
der Schlange hinzugefügt werden, mit Ausnahme derjenigen
Bereiche, deren Flag für einen vollständigen Bereich auf
eine logische "1" eingestellt ist. Falls kein Zwischenbe
reich 233 bei Block 529 zu der Schlange 301 hinzugefügt wer
den soll oder falls der/die geeignete(n) Zwischenbereich(e)
233 bei Block 533 zu der Schlange 301 hinzugefügt worden
sind, springt die Teilroutine 419 zu Block 536 weiter.
Bei Block 536 bestimmt die Teilroutine, ob der Wiederhole-
Knopf 203 oder der Stopp/Lösche-Knopf 213 gedrückt worden
ist. Falls dies der Fall ist, springt die Teilroutine 419 zu
Block 539 weiter, bei dem die Analyse des Zwischenbereichs
233 mit der höchsten Priorität in der Schlange 301 endet,
alle Zwischenbereiche 233 aus der Schlange 301 entfernt wer
den, der Automatische-Analyse-Knopf 206 aktiviert wird, wenn
derselbe gedrückt wird, und das Wiederhole-Flag auf eine lo
gische "1" eingestellt wird, wenn der Wiederhole-Knopf 203
gedrückt worden ist. Daraufhin endet die Teilroutine 419 und
springt zu dem Flußdiagramm von Fig. 4 zurück. Falls weder
der Wiederhole-Knopf 203 noch der Stopp/Lösche-Knopf 213 bei
Block 536 gedrückt worden ist, springt die Teilroutine 419
zu Block 503 zurück.
Gemäß der Teilroutine 419 werden folglich die Zwischenberei
che 233, die in der Schlange 301 plaziert sind, kontinuier
lich verarbeitet, es sei denn, der Anwender stoppt die Ver
arbeitung durch eine bestimmte Aktion, wobei das Dokumenten
analysesystem 100 geeignet reagiert, um eine flexible Platt
form für eine Dokumentenanalyse zu liefern.
Die vorliegende Erfindung liefert dem Benutzer mehrere un
terschiedliche Vorteile beim Analysieren von Dokumenten.
Beispielsweise versieht die vorliegende Erfindung einen An
wender über die Zwischenanalyse mit einem schnellen Zugriff
auf den Inhalt eines Dokuments, wobei der Anwender ausgehend
von dieser Zwischenanalyse die Analyse weiter führen kann,
damit dieselbe auf eine wirksame Art und Weise durchgeführt
wird. Falls beispielsweise der Anwender lediglich an einem
spezifischen Datentyp des Bereichs interessiert ist, wie
z. B. Text, kann der Anwender dann mit der Kenntnis, wie das
Dokument tatsächlich aussieht, Zwischenbereiche löschen, die
ansonsten zu Graphik- oder Photoverarbeitungsanwendungen
geführt worden wären. Dies würde die Zeitdauer einsparen,
die das Dokumentenanalysesystem beim Durchführen einer voll
ständigen Analyse bezüglich der unerwünschten Graphik anson
sten aufgewendet hätte. Folglich spart die vorliegende Er
findung Zeit und Aufwand, die bei der Analyse von Dokumenten
aufgewendet werden müssen.
Zusätzlich zeigen die Flußdiagramme von Fig. 4-7 die Archi
tektur, Funktionalität und Funktionsweise einer möglichen
Implementierung der Dokumentenanalyselogik 170 (Fig. 1). In
dieser Hinsicht stellt jeder Block ein Modul, ein Segment
oder einen Teil eines Codes dar, der eine oder mehrere aus
führbare Anweisungen zum Implementieren der spezifischen lo
gischen Funktion(en) aufweist. Es sollte beachtet werden,
daß bei einigen alternativen Implementierungen die Funktio
nen, die in den Blöcken dargestellt sind, in einer anderen
als in der in Fig. 4-7 dargestellten Reihenfolge auftreten
können. Beispielsweise können zwei Blöcke, die in Fig. 4-7
aufeinanderfolgend gezeigt sind, tatsächlich im wesentlichen
gleichzeitig ausgeführt werden, oder die Blöcke können
manchmal in der umgekehrten Reihenfolge ausgeführt werden,
wobei dies im folgenden weiter klargestellt werden wird.
Die Dokumentenanalyselogik 170, die vorzugsweise eine geord
nete Auflistung von ausführbaren Anweisungen zur Implemen
tierung von Logikfunktionen aufweist, kann in einem beliebi
gen computerlesbaren Medium für eine Verwendung durch oder
in Verbindung mit einem Anweisungsausführungssystem, einer
entsprechenden Vorrichtung oder einem entsprechenden Gerät
ausgeführt sein, wie z. B. einem computerbasierten System,
einem prozessorenthaltenden System oder einem anderen Sy
stem, das die Anweisungen aus dem Anweisungsausführungssy
stem, der Vorrichtung oder dem Gerät abrufen und die Anwei
sungen ausführen kann. In dem Zusammenhang dieses Dokuments
kann ein "computerlesbares Medium" eine beliebige Einrich
tung sein, die das Programm für eine Verwendung durch oder
in Verbindung mit dem Anweisungsausführungssystem, der Vor
richtung oder dem Gerät enthalten, speichern, kommunizieren,
verbreiten oder transportieren kann. Das computerlesbare Me
dium kann beispielsweise ein elektronisches, magnetisches,
optisches, elektromagnetisches, Infrarot- oder Halbleiter
system, eine entsprechende Vorrichtung, ein entsprechendes
Gerät oder ein entsprechendes Verbreitungsmedium sein, wobei
dasselbe jedoch nicht darauf begrenzt ist. Spezifischere
Beispiele (eine nicht erschöpfende Liste) der computerlesba
ren Medien würden folgendes umfassen: eine elektrische Ver
bindung (elektronisch) mit einem oder mehreren Drähten, eine
tragbare Computerdiskette (magnetisch), einen Speicher mit
wahlfreiem Zugriff (RAM; magnetisch), einen Nur-Lese-Spei
cher (ROM; magnetisch), einen löschbaren, programmierbaren
Nur-Lese-Speicher (EPROM oder Flash-Speicher; magnetisch),
eine optische Faser (optisch) und eine tragbare CDROM (op
tisch). Es ist zu beachten, daß das computerlesbare Medium
sogar Papier oder ein anderes geeignetes Medium sein könnte,
auf dem das Programm gedruckt ist, wenn das Programm bei
spielsweise über eine optische Abtastung des Papiers oder
des anderen Mediums elektronisch erfaßt, daraufhin kompi
liert, interpretiert oder ansonsten auf eine geeignete Art
und Weise, wenn nötig, verarbeitet und dann in einem Compu
terspeicher gespeichert werden kann.
Claims (13)
1. Vorrichtung zum Steuern einer Dokumentenbereichsanalyse,
mit folgenden Merkmalen:
einer Zwischenanalyseeinrichtung, die konfiguriert ist, um eine Zwischendokumentenanalyse (433) durchzuführen, um eine Anzahl von Zwischenbereichen (233) auf einem digitalen Dokument (229) bei einem ersten PPI-Wert (PPI = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) zu identifizieren; und
einer Vollanalyseeinrichtung, die konfiguriert ist, um eine vollständige Analyse (506) bezüglich zumindest ei nes der Zwischenbereiche (233) bei einem zweiten PPI- Wert durchzuführen, wodurch zumindest ein vollständiger Bereich aus denselben erzeugt wird.
einer Zwischenanalyseeinrichtung, die konfiguriert ist, um eine Zwischendokumentenanalyse (433) durchzuführen, um eine Anzahl von Zwischenbereichen (233) auf einem digitalen Dokument (229) bei einem ersten PPI-Wert (PPI = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) zu identifizieren; und
einer Vollanalyseeinrichtung, die konfiguriert ist, um eine vollständige Analyse (506) bezüglich zumindest ei nes der Zwischenbereiche (233) bei einem zweiten PPI- Wert durchzuführen, wodurch zumindest ein vollständiger Bereich aus denselben erzeugt wird.
2. Vorrichtung gemäß Anspruch 1, die ferner eine manuelle
Auswähleinrichtung aufweist, die für eine manuelle Aus
wahl zumindest eines der Zwischenbereiche (233) für die
vollständige Analyse (506) konfiguriert ist.
3. Vorrichtung gemäß Anspruch 1 oder 2, die ferner eine au
tomatische Analyseeinrichtung aufweist, die konfiguriert
ist, um zumindest einen der Zwischenbereiche (233) für
die vollständige Analyse (506) automatisch auszuwählen.
4. Vorrichtung gemäß einem der Ansprüche 1 bis 3, die fer
ner eine Zwischenbereichsmodifiziereinrichtung aufweist,
die konfiguriert ist, um die manuelle Änderung zumindest
eines der Zwischenbereiche (233) zu erleichtern.
5. Vorrichtung gemäß einem der Ansprüche 1 bis 4, die fer
ner eine Zwischenbereichsanalyseschlange (301) aufweist,
zu der zumindest ein ausgewählter Zwischenbereich zuge
führt wird, wobei die vollständige Analyse (506) bezüg
lich desselben durchgeführt wird, wobei die Zwischenbe
reichsanalyseschlange (301) eine Analysepriorität auf
weist, gemäß der die Zwischenbereiche (233) der voll
ständigen Analyse (506) unterzogen werden.
6. Vorrichtung gemäß Anspruch 5, die ferner eine Analyse
schlangenprioritätssteuerungseinrichtung aufweist, die
konfiguriert ist, um auf die Analysepriorität der Zwi
schenbereichsanalyseschlange (301) zuzugreifen, wobei
die Zwischenbereichsanalyseschlange (301) ferner konfi
guriert ist, um die Änderung der Analysepriorität zu er
möglichen.
7. Vorrichtung gemäß einem der Ansprüche 1 bis 6, die fer
ner eine Anzeigeschnittstelle (181a) aufweist, die kon
figuriert ist, um die Zwischenbereiche (233) anzuzeigen,
wobei die Zwischenbereiche (233) mit einem Zwischen-Zei
chen identifiziert sind, und wobei die vollständigen Be
reiche mit einer Vollständig-Markierung identifiziert
sind.
8. Verfahren zum Steuern einer Dokumentenbereichanalyse,
mit folgenden Schritten:
Durchführen einer Zwischendokumentenanalyse (433), um eine Anzahl von Zwischenbereichen (233) auf einem digi talen Dokument (229) bei einem ersten PPI-Wert (PPI = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) zu identifizieren; und
Durchführen einer vollständigen Analyse (506) bezüglich zumindest eines der Zwischenbereiche (233) bei einem zweiten PPI-Wert, wodurch zumindest ein vollständiger Bereich aus denselben erzeugt wird.
Durchführen einer Zwischendokumentenanalyse (433), um eine Anzahl von Zwischenbereichen (233) auf einem digi talen Dokument (229) bei einem ersten PPI-Wert (PPI = Pixel-Pro-Zoll; 1 Zoll = 2,54 cm) zu identifizieren; und
Durchführen einer vollständigen Analyse (506) bezüglich zumindest eines der Zwischenbereiche (233) bei einem zweiten PPI-Wert, wodurch zumindest ein vollständiger Bereich aus denselben erzeugt wird.
9. Verfahren gemäß Anspruch 8, das ferner den Schritt des
manuellen Auswählens zumindest eines der Zwischenberei
che (233) für die vollständige Analyse (506) aufweist.
10. Verfahren gemäß Anspruch 8 oder 9, das ferner den
Schritt des automatischen Auswählens zumindest eines der
Zwischenbereiche (233) für die vollständige Analyse
(506) aufweist.
11. Verfahren gemäß einem der Ansprüche 8 bis 10, das ferner
den Schritt des manuellen Änderns zumindest eines der
Zwischenbereiche (233) aufweist.
12. Verfahren gemäß einem der Ansprüche 8 bis 11, das ferner
den Schritt (469) des Plazierens zumindest eines ausge
wählten Zwischenbereichs (233) in eine Zwischenbereichs
analyseschlange (301) aufweist, wobei die vollständige
Analyse (506) bezüglich desselben durchgeführt wird, wo
bei die Zwischenbereichsanalyseschlange (301) eine Ana
lysepriorität aufweist, gemäß der die Zwischenbereiche
(233) der vollständigen Analyse (506) unterzogen werden.
13. Verfahren gemäß einem der Ansprüche 8 bis 12, das ferner
den Schritt (436) des Anzeigens der Zwischenbereiche
(233) aufweist, wobei die Zwischenbereiche (233) mit ei
nem Zwischen-Zeichen identifiziert werden, und wobei die
vollständigen Bereiche mit einer Vollständig-Markierung
identifiziert werden.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US09/296,094 | 1999-04-21 | ||
| US09/296,094 US6674901B1 (en) | 1999-04-21 | 1999-04-21 | Document analysis system and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE10011664A1 true DE10011664A1 (de) | 2000-11-02 |
| DE10011664B4 DE10011664B4 (de) | 2006-04-27 |
Family
ID=23140581
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE10011664A Expired - Fee Related DE10011664B4 (de) | 1999-04-21 | 2000-03-10 | Dokumentenanalysesystem und Verfahren zum Analysieren von Dokumenten |
Country Status (3)
| Country | Link |
|---|---|
| US (2) | US6674901B1 (de) |
| DE (1) | DE10011664B4 (de) |
| TW (1) | TW463132B (de) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6880122B1 (en) * | 1999-05-13 | 2005-04-12 | Hewlett-Packard Development Company, L.P. | Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions |
| US8140357B1 (en) * | 2000-04-26 | 2012-03-20 | Boesen Peter V | Point of service billing and records system |
| US6739099B2 (en) * | 2001-06-06 | 2004-05-25 | Nippon Steel Corporation | Column-and-beam join structure |
| US7497054B2 (en) * | 2001-06-06 | 2009-03-03 | Nippon Steel Corporation | Column-and-beam join structure |
| US7499602B2 (en) * | 2001-07-12 | 2009-03-03 | International Business Machines Corporation | Efficiency and speed in verification of recognition results |
| US7721192B2 (en) * | 2002-11-27 | 2010-05-18 | Microsoft Corporation | User interface for a resource search tool |
| KR100490422B1 (ko) * | 2003-01-15 | 2005-05-17 | 삼성전자주식회사 | 프리-스캔 동작을 이용한 문서 스캐닝 방법 |
| US20050014832A1 (en) * | 2003-07-16 | 2005-01-20 | Lc Usa Llc | Treatment |
| US7424672B2 (en) * | 2003-10-03 | 2008-09-09 | Hewlett-Packard Development Company, L.P. | System and method of specifying image document layout definition |
| US20050231767A1 (en) * | 2004-04-16 | 2005-10-20 | Brake Gregory A | Touch sensitive scan area selection apparatus and method |
| US20070195378A1 (en) * | 2006-02-21 | 2007-08-23 | Brother Kogyo Kabushiki Kaisha | Image-reading device |
| US20100140355A1 (en) * | 2008-12-01 | 2010-06-10 | Egan Blake A | Systems and methods for aiding data organization related applications |
| WO2011001439A2 (en) | 2009-07-02 | 2011-01-06 | Hewlett-Packard Development Company, L.P. | Skew detection |
| CN115756331B (zh) * | 2022-11-23 | 2023-08-04 | 东土科技(宜昌)有限公司 | 充电数据的高效存储方法、装置、存储介质以及电子设备 |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2350596A2 (fr) * | 1976-05-04 | 1977-12-02 | Green James E | Procede et appareillage pour l'analyse d'un champ selon deux resolutions |
| US5191406A (en) * | 1990-04-20 | 1993-03-02 | Nikon Corporation | Method and apparatus for rapid scanning of color images |
| US5222154A (en) * | 1991-06-12 | 1993-06-22 | Hewlett-Packard Company | System and method for spot color extraction |
| NL9301004A (nl) * | 1993-06-11 | 1995-01-02 | Oce Nederland Bv | Inrichting voor het bewerken en reproduceren van digitale beeldinformatie. |
| US5987171A (en) * | 1994-11-10 | 1999-11-16 | Canon Kabushiki Kaisha | Page analysis system |
| NL1000701C2 (nl) * | 1995-06-30 | 1996-12-31 | Oce Nederland Bv | Inrichting en werkwijze voor het extraheren van artikelen uit een document. |
| JP3504054B2 (ja) * | 1995-07-17 | 2004-03-08 | 株式会社東芝 | 文書処理装置および文書処理方法 |
| US5838836A (en) * | 1995-11-06 | 1998-11-17 | Agfa Division-Bayer Corporation | Method and apparatus for rough cropping images |
| US5884014A (en) * | 1996-05-23 | 1999-03-16 | Xerox Corporation | Fontless structured document image representations for efficient rendering |
| US6295388B1 (en) * | 1996-06-10 | 2001-09-25 | Agfa Corporation | Method for selecting an area of full resolution image detail for viewing during scanning |
| US5850474A (en) * | 1996-07-26 | 1998-12-15 | Xerox Corporation | Apparatus and method for segmenting and classifying image data |
| US5862305A (en) * | 1996-09-26 | 1999-01-19 | Xerox Corporation | Logic filters for resolution conversion of digital images |
| US6453069B1 (en) * | 1996-11-20 | 2002-09-17 | Canon Kabushiki Kaisha | Method of extracting image from input image using reference image |
| US5778092A (en) * | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
| US6239882B1 (en) * | 1997-06-04 | 2001-05-29 | Agfa Corporation | Method and apparatus for scanning original images |
| US6002496A (en) * | 1997-08-06 | 1999-12-14 | Acer Pheripherals, Inc. | Sheet-fed scanner with a preview function |
| US6262749B1 (en) * | 1997-12-31 | 2001-07-17 | Acuson Corporation | Ultrasonic system and method for data transfer, storage and/or processing |
| US6289371B1 (en) * | 1998-09-30 | 2001-09-11 | Hewlett-Packard Company | Network scan server support method using a web browser |
| US6151426A (en) * | 1998-10-01 | 2000-11-21 | Hewlett-Packard Company | Click and select user interface for document scanning |
-
1999
- 1999-04-21 US US09/296,094 patent/US6674901B1/en not_active Expired - Fee Related
-
2000
- 2000-01-12 TW TW089100432A patent/TW463132B/zh not_active IP Right Cessation
- 2000-03-10 DE DE10011664A patent/DE10011664B4/de not_active Expired - Fee Related
-
2003
- 2003-09-02 US US10/654,547 patent/US7046846B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| DE10011664B4 (de) | 2006-04-27 |
| US7046846B2 (en) | 2006-05-16 |
| US20040042658A1 (en) | 2004-03-04 |
| TW463132B (en) | 2001-11-11 |
| US6674901B1 (en) | 2004-01-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69529808T2 (de) | System zur Blockanwahlaufbereitung und -überprüfung | |
| DE602004006682T2 (de) | Extraktion von Metadaten aus gekennzeichneten Bereichen eines Dokuments | |
| DE69319070T2 (de) | Verfahren und Gerät zur Verwaltung von Bilddaten | |
| DE69525243T2 (de) | System zum binden von dokumentteilen und editoren in einer mensch-maschinen-schnittstelle | |
| DE69701713T2 (de) | Editiervorrichtung für ein zusammengesetztes Bild | |
| DE69624302T2 (de) | Drehbucheditor für Multimediadaten und Vorrichtung zum Wiedergeben von Drehbüchern | |
| DE69609866T2 (de) | Flexibles system und verfahren zum verknüpfen von hyperlinks | |
| DE3411939C2 (de) | ||
| DE69323966T2 (de) | Verfahren zur Ausführung eines Kopierverfahrens und Vorrichtung zur Durchführung des Verfahrens | |
| DE69701566T2 (de) | Medieneditiersystem und verfahren mit verbesserter effektsteuerung | |
| DE68927216T2 (de) | System zur verwaltung von hierarchischen informationen in einem digitalen datenverarbeitungssystem | |
| DE3714172C2 (de) | ||
| DE69123424T2 (de) | Elektronischer Druckprozess zum Drucken zusammengesetzter Bilder | |
| DE10300149A1 (de) | Vorrichtung und Verfahren zum Entwickeln von kundenbedien-personspezifischen Softwareanwendungen | |
| DE10234137B4 (de) | System und Verfahren, um Benutzern zu ermöglichen, graphische Bilder zu editieren | |
| DE69329632T2 (de) | Bilderfassungsgerät | |
| DE3588163T2 (de) | Bildverarbeitungssystem | |
| DE69937029T2 (de) | Signalverarbeitungsverfahren und Vorrichtung für Grauskala-Videosignal in einer Matrix-Anzeigevorrichtung | |
| DE602004005216T2 (de) | Dokumentenscanner | |
| DE10011664A1 (de) | Dokumentenanalysesystem und Verfahren zum Analysieren von Dokumenten | |
| DE10105941A1 (de) | System und Verfahren zum automatischen Zuweisen eines Dateinamens zu einem gescannten Dokument | |
| DE10241400A1 (de) | Systeme und Verfahren zum Verwalten einer Prozeßsteuerung in einer graphischen Benutzerschnittstelle | |
| DE10317917A1 (de) | System und Verfahren zum Umgrenzen und Klassifizieren von Regionen innerhalb einer graphischen Abbildung | |
| DE29623701U1 (de) | Grafik Browser | |
| DE10000124A1 (de) | Verfahren zum Übertragen und Indexieren von Daten von alten Medien zu neuen Medien |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8127 | New person/name/address of the applicant |
Owner name: HEWLETT-PACKARD CO. (N.D.GES.D.STAATES DELAWARE), |
|
| 8127 | New person/name/address of the applicant |
Owner name: HEWLETT-PACKARD DEVELOPMENT CO., L.P., HOUSTON, TE |
|
| 8364 | No opposition during term of opposition | ||
| R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |