[go: up one dir, main page]

DE69604481T2 - Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern - Google Patents

Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern

Info

Publication number
DE69604481T2
DE69604481T2 DE69604481T DE69604481T DE69604481T2 DE 69604481 T2 DE69604481 T2 DE 69604481T2 DE 69604481 T DE69604481 T DE 69604481T DE 69604481 T DE69604481 T DE 69604481T DE 69604481 T2 DE69604481 T2 DE 69604481T2
Authority
DE
Germany
Prior art keywords
image
value
contrast
bin
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69604481T
Other languages
English (en)
Other versions
DE69604481D1 (de
Inventor
Izrail Gorian
Michael Moed
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
United Parcel Service of America Inc
United Parcel Service Inc
Original Assignee
United Parcel Service of America Inc
United Parcel Service Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Parcel Service of America Inc, United Parcel Service Inc filed Critical United Parcel Service of America Inc
Publication of DE69604481D1 publication Critical patent/DE69604481D1/de
Application granted granted Critical
Publication of DE69604481T2 publication Critical patent/DE69604481T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Description

    ERFINDUNGSGEBIET
  • Die vorliegende Erfindung betrifft allgemein ein Verfahren und eine Vorrichtung für die parametrisierte Schwellwertbildung von Grauwertbildern, um dem Vordergrund/Hintergrund der ursprünglichen Grauwertbilder entsprechende binäre Schwarz-Weiß-Bilder zu erzeugen, und insbesondere Grauwertbilder, die Textzeichen als Vordergrund enthalten. Die Erfindung enthält ein Verfahren und eine Vorrichtung zum Bestimmen und Wählen des Binärbildes mit der besten Qualität in Fällen, wo mehrere Mengen von Parametern verwendet worden sind, um mehrere Binärbilder zu erzeugen.
  • ALLGEMEINER STAND DER TECHNIK
  • Bei vielen Anwendungen ist es wünschenswert, mit automatischen Mitteln aus einem Bild Textinformationen zu extrahieren. So ist beispielsweise die Verwendung einer Maschine zum Lesen von Adressenetiketten ohne manuellen Eingriff eine arbeits- und kostensparende Methode. Bei einer Methode zum automatischen Lesen von Etikettenadressen wird eine Ladungsspeicherbaustein-Kamera ("CCD" = charge-coupled device) verwendet, um ein Bild des Adressenetikettgebiets zu erfassen. Das von der CCD- Kamera gelieferte n · m-Bild wird als Grauwertbild bezeichnet, da jedes der n · m Bildelemente in dem Bild einen Grauwert zwischen Null und einem größten Wert annehmen kann, wobei Null Schwarz ist, der größte Wert Weiß ist und die Zwischenwerte Grau sind. Der größte Wert wird in der Regel 255 oder 1023 betragen. Bei den meisten Anwendungen zum Lesen von Adressenetiketten muß das Grauwertbild in ein Binärbild umgewandelt werden, wobei Bildelemente nur einen von zwei Werten annehmen, 0 für Schwarz und 1 für Weiß. Bei dem Binärbild entsprechen schwarze Bildelemente dem Vordergrund, gewöhnlich Text, während weiße Bildelemente dem Hintergrund entsprechen. Der Prozeß des Umwandelns von einem Grauwertbild in ein Binärbild wird als Schwellwertbildung bezeichnet. Nachdem bei dem Bild eine Schwellwertbildung durchgeführt worden ist, kann das Etikett unter Verwendung eines Prozesses der optischen Zeichenerkennung ("OCR" = optical character recognition) automatisch gelesen werden.
  • Viele übliche Schwellwertbildungsverfahren haben jedoch aufgrund der großen Vielfalt von Etiketten große Schwierigkeiten beim Trennen des Vordergrunds vom Hintergrund auf Adressenetiketten. Etiketten können verschiedenfarbige Hintergründe, mit verschiedenen Farben gedruckten Text, verschmierte Stellen, Flecken, bandbedingte Abbrände, Filmeffekte, Text mit geringem Kontrast, Graphiken und Kunststofffenster aufweisen. Text auf Etiketten kann mit einem Matrixdrucker oder einem Laserdrucker gedruckt, mit der Schreibmaschine geschrieben oder handgeschrieben sein und eine beliebige einer Reihe von Schriften aufweisen. Die Vielfalt von Etiketten macht es für viele Schwellwertbildungsprozesse schwierig, Vordergrundtext angemessen von Hintergrundtext zu trennen und kann viele fehlerhafte Vordergrund-/Hintergrundzuordnungen bewirken. Es kommt zu einer fehlerhaften Zuordnung, wenn einem Hintergrundbildelement ein Wert von 0 (Schwarz) oder einem Vordergrundtextbildelement ein Wert von 1 (Weiß) zugeordnet wird. Im ersteren Fall wird in das resultierende Binärbild Rauschen eingeführt, und dies kann beim automatischen Lesen des Etiketts unter Verwendung von OCR zu Schwierigkeiten führen. Im letzteren Fall wird Text, der in dem Grauwertbild vorhanden war, entfernt, und der OCR- Prozeß kann wieder versagen.
  • EP-A-0326436 offenbart ein Verfahren zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, mit den Schritten des Bestimmens des Anteils von Komponenten einer vorbestimmten Größe in den beiden Bildern und des Vergleichens der beiden Anteile.
  • Zusätzlich zu der Forderung nach Genauigkeit muß eine automatische Schwellwertbildungstechnik schnell und effizient sein, um als kosteneinsparende Technik wirksam zu sein. Bei vielen Anwendungen werden von Post- und Paketlieferdiensten automatische Etikettenlesegeräte eingesetzt, wobei automatische Systeme Pakete mit einer Rate von bis zu 3600 pro Stunde befördern. Bei dieser Rate muß ein Etikett in weniger als einer Sekunde abgebildet und verarbeitet werden, damit es vollständig ist, bevor die Verarbeitung des nächsten Etiketts beginnen muß. Damit die Schwellwertbildungstechnik in Echtzeit verwendet werden kann, muß es bei dem Grauwertbild eine Schwellwertbildung in einer wesentlich unter einer Sekunde liegenden Zeit durchführen, um den OCR- Techniken Zeit zu geben, das Schwellwert-Textbild zu verarbeiten.
  • Es besteht somit ein Bedarf an einem Schwellwertbildungsverfahren und an einer Schwellwertbildungsvorrichtung, die eine Menge schneller Algorithmen zum Trennen von Vordergrundtext von Hintergrund auf eine Weise einsetzen, durch die die Anzahl der Fehlzuordnungen von Vordergrund bzw. Hintergrund auf ein Minimum reduziert wird. Weiterhin besteht ein Bedarf daran, daß das Schwellwertbildungsverfahren und die Schwellwertbildungsvorrichtung adaptierbar ist, so daß es bzw. sie sich auf die große Vielfalt von Zeichenschriftarten und anderen Unterschieden bei der Textpräsentation einstellen kann.
  • KURZE DARSTELLUNG DER ERFINDUNG
  • Bei der Erfindung handelt es sich um ein Verfahren und eine Vorrichtung zum Produzieren eines Binärbildes hoher Qualität, an dem eine Schwellwertbildung durchgeführt worden ist, aus einem Grauwertbild. Bei einer bevorzugten Ausführungsform besteht das Verfahren aus zwei Stufen. Bei der ersten Stufe wird aus dem ursprünglichen Grauwertbild eine Anzahl von Kandidatenbinäretikettenbildern erzeugt. Jedes Kandidatenbild wird erzeugt, indem eine andere Menge von Schwellwertbildungsprozeßparametern auf ein Zwischen bild (das Kontrastbild), das aus dem ursprünglichen Grauwertetikettbild durch Verwenden lokaler und globaler Kontrastinformationen konstruiert worden ist, angewendet wird. Bei der zweiten Stufe werden die Kandidatenbinärbilder verglichen, und das Binärbild mit der besten Qualität wird gewählt. Die Erfindung wird als Label Adaptive Thresholding ("LAT" = Adaptive Etikettenschwellwertbildung) bezeichnet, da sie sich auf viele verschiedene Arten von Etiketten und Zeichen auf den Etiketten einstellt.
  • Das Verfahren zum Konstruieren des Zwischenkontrastbilds entsprechend einem Grauwertbild umfaßt die Schritte: Wählen einer Position (i, j) in dem Kontrastbild, wobei i die Zeile der Position in dem Kontrastbild und j die Spalte bezeichnet; Finden des kleinsten Graustufenwerts MINij aller Grauwertbildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Zeilen- und Spaltenposition in dem Grauwertbild; Finden des größten Graustufenwert MAXij aller Grauwertbildelemente in dem gleichen rechteckigen Fenster; Berechnen des lokalen Kontrasts LCij des Grauwertbilds durch die Formel
  • LCij = C (1 - (MINij + p) / (MAXij + p)),
  • wobei C ein vorgewählter maximaler Kontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen eines Graustufenwert gleich LCij zu der (i, j)-Position des Kontrastbilds; und Wiederholen der obigen Schritte für jede Position, die einem Abschnitt des Grauwertbilds, an dem eine Schwellwertbildung durchgeführt werden soll, entspricht.
  • Als Teil des Prozesses des Erzeugens eines Kandidatenbinärbilds, an dem eine Schwellwertbildung durchgeführt worden ist, wird ein kleinster zulässiger Kontrastwert gewählt. Das Verfahren zum Wählen dieses Werts umfaßt die Schritte: Konstruieren eines Kontrasthistogramms für alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als ein vorgewählter Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch einen vorgewählten Spitzen-Breiten- Nennwert getrennt sind; Wählen der Minimaltextspitze unter den gefundenen Spitzen durch Auffinden der Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als ein vorgewählter Minimalkontrastwert; und Erhalten des kleinsten zulässigen Kontrastwerts durch Subtrahieren eines vorgewählten Text-Spitzen-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze. Die vorgewählten Werte für den Spitzen-Boden-Pegelwert, den Spitzen-Breiten-Nennwert, den Minimalkontrastwert und den Text-Spitzen-Breiten- Nennwert umfassen zusammen mit den beiden unten beschriebenen Grenzwerten eine Menge von Schwellwertbildungsprozeßparametern.
  • Schließlich wird ein Kandidatenbinärbild konstruiert, indem jedem Bildelement im Hintergrund eine 1 und jedem Bildelement im Vordergrund eine 0 zugeordnet wird. Die Bildelemente eines Grauwertbilds werden zwischen einer Hintergrundklasse und einer Vordergrundklasse durch ein Verfahren aufgeteilt, das aus den Schritten besteht: Finden des kleinsten Graustufenwerts MINij aller Bildelemente in einem rechteckigen Fenster mit der Mitte auf dem Bildelement; Finden des größten Graustufenwerts MAXij aller Bildelemente in dem rechteckigen Fenster; Berechnen des örtlichen Kontrasts LCij durch die Formel
  • LCij = C(1 - (MINij + p) / (MAXij + pf),
  • wobei C ein vorgewählter Maximalkontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen des Bildelements zu der Hintergrundklasse, wenn LCij kleiner ist als ein vorgewählter kleinster zulässiger Kontrastwert. Die vorausgegangenen Schritte sind die gleichen wie diejenigen, die zum Berechnen des Kontrastbilds erforderlich sind; wenn das Kontrastbild konstruiert worden ist, brauchen die Schritte nicht wiederholt zu werden.
  • Für durch den Vergleich des örtlichen Kontrasts mit dem kleinsten zulässigen Kontrastwert der Hintergrundklasse nicht zugeordnete Bildelemente wird die Differenz zwischen MAXij und MINij berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Maximum-Minimum-Differenz kleiner als ein vorgewählter kleinster Kontrastskalenwert ist. Wenn das Bildelement immer noch nicht der Hintergrundklasse zugeordnet wird, wird die Differenz zwischen MAXij und dem Graustufenwert des Bildelements berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Differenz Maximum zu Bildelementwert kleiner ist als ein vorgewählter Kontrastüberschuß-Nennwert. Wenn das Bildelement durch die obigen Schritte nicht der Hintergrundklasse zugeordnet wird, dann wird das Bildelement der Vordergrundklasse zugeordnet.
  • Die Erfindung sieht die Verwendung von zwei oder mehr Mengen von Schwellwertbildungsprozeßparametern, die zwei oder mehr Kandidatenbinärbilder liefern, vor. Um zwischen zwei beliebigen Kandidatenbinärbildern, die einer Schwellwertbildung unterzogen wurden, eines ursprünglichen Grauwertbilds zu wählen, verwendet die Erfindung ein Verfahren, das die Schritte umfaßt: Umwandeln der Abschnitte der Binärbilder entsprechend dem Vordergrund in ein lauflängencodiertes Bild (RLE- Bild); Bestimmen der Anzahl und Größe der Stücke (d. h. die Stückgrößenverteilung) der RLE-Bilder unter Verwendung von Stückextrahierung; Konstruieren von Histogrammen der Stückgrößenverteilungen der RLE- Bilder; und Verwendung des Histogramms für statistische oder Neuronennetzanalyse, um eines der beiden Binärbilder zu wählen. Wenn mehr als zwei Binärbilder vorliegen, wird dieses Verfahren paarweise angewendet, bis alle Binärbilder mit Ausnahme von einem eliminiert worden sind. Die Verwendung von RLE-Bildern ist fakultativ, doch wird durch ihre Verwendung die Verarbeitungszeit im Gegensatz zu der Technik, die die Stückgrößenverteilungen aus den Binärbildern in Positionsdarstellungen bestimmt, stark reduziert.
  • Die Stückgrößenverteilung eines Binärbilds ist eine Spezifikation der Anzahl von Stücken nach Größe für Stücke jedes Binärbilds mit dem einen oder dem anderen der beiden Werte des Binärbilds. Die Stückgrößenverteilung kann für einfache Vergleiche von zwei Binärbildern verwendet werden, selbst wenn es um keine Qualitätswahl geht.
  • Somit besteht eine Aufgabe der vorliegenden Erfindung in der Bereitstellung eines Verfahrens und einer Vorrichtung zur schnellen Schwellwertbildung eines Grauwertbilds.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, die Informationen über den örtlichen Kontrast in einem Grauwertbild verwendet, um Text in dem Bild eindeutig zu identifizieren.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, um unter zwei oder mehr Kandidatenbinärbildern, die durch Schwellwertbildung aus einem textenthaltenden ursprünglichen Grauwertbild gewonnen wurden, dasjenige Binärbild zu wählen, das im Vordergrund Text und im Hintergrund keinen Text am besten darstellt.
  • Eine weitere Aufgabe der vorliegenden Erfindung besteht in der automatischen Verarbeitung von Etiketten mit schlechter Lesbarkeit, um ein Binärbild hoher Qualität für die OCR-Eingabe zu erzeugen.
  • Die vorliegende Erfindung erfüllt diese Aufgaben und überwindet die Nachteile des Standes der Technik, wie aus der ausführlichen Beschreibung der nachfolgenden Ausführungsformen hervorgeht.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Fig. 1 zeigt die Hauptschritte und den Datenfluß einer Ausführungsform des Verfahrens der Erfindung.
  • Fig. 2 zeigt die Hauptschritte und den Datenfluß, die mit der Schwellwertbildungstechnik einer Ausführungsform des Verfahrens der Erfindung verbunden sind.
  • Fig. 3 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MIN-Bilds.
  • Fig. 4 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MAX-Bilds.
  • Fig. 5 veranschaulicht die Konstruktion des Kontrastbilds aus dem MIN- und MAX-Bild.
  • Fig. 6 zeigt ein typisches Kontrasthistogramm und veranschaulicht die verschiedenen, mit einer Ausführungsform des Verfahrens der Erfindung verbundenen Schwellwertbildungsprozeßparameter.
  • Fig. 7 zeigt ein beispielhaftes Binärbild, um die Reduktion bei den Repräsentationsdaten zu veranschaulichen, die sich aus der Umwandlung des Binärbilds in ein lauflängencodiertes (RLE-)Format ergibt.
  • Fig. 8 zeigt ein Grauwertbild eines beispielhaften Etiketts.
  • Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer Menge von Schwellwertbildungsparametern.
  • Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer zweiten Menge von Schwellwertbildungsparametern.
  • Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer dritten Menge von Schwellwertbildungsparametern.
  • Fig. 12 ist ein Blockschaltbild der Hauptkomponenten einer bevorzugten Ausführungsform der Vorrichtung der Erfindung.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Fig. 1 ist ein Blockschaltbild des Gesamtprozesses und des Datenflusses einer Ausführungsform der Erfindung. Fig. 2 ist ein Blockschaltbild der Hauptschritte und des Datenflusses in Stufe Eins einer Ausführungsform der Erfindung. In Block 1 von Fig. 1 beginnt Stufe Eins des Prozesses, wenn digitale Daten erfaßt werden, die ein Grauwertbild darstellen. Das Grauwertbild weist n · m Bildelemente auf, die n Zeilen und m Spalten von Bildelementen darstellen, jeweils mit einem Graustufenwert von 1 bis zu dem von der Einrichtung, die das Bild erzeugt, bereitgestellten Maximum. Bei der Einrichtung handelt es sich vorzugsweise um eine CCD-Kamera, und die Grauwerte des Bildelements variieren von 0 (Schwarz) zu 255 (Weiß). Ebenfalls in Block 1 von Fig. 1 werden aus dem Grauwertbild drei getrennte Bilder mit n · m Bildelementen konstruiert: das MIN-Bild; das MAX-Bild und das Kontrastbild. Das Bildelement in Zeile i und Spalte j in dem MIN-Bild enthält den kleinsten Graustufenwert in einem kleinen Bereich, vorzugsweise einem rechteckigen Kasten, um Zeile i und Spalte j des Grauwertbilds herum. Bei dieser Spezifikation werden Zeile i und Spalte j eines Bilds auch als die (i, j)- Position eines Bilds bezeichnet. Das MAX-Bild wird unter Verwendung von Maximalwerten anstatt Minimalwerten analog konstruiert. Das Bildelement bei der (i, j)-Position des Kontrastbilds wird aus den Werten in den (i, j)-Positionen in dem MIN- und dem MAX-Bild algebraisch berechnet. Außerdem wird ein Histogramm der Werte in dem Kontrastbild berechnet. Diese Schritte sind in den Blöcken 1 bis 4 in Fig. 2 ausführlicher gezeigt. Wie im Block 2 von Fig. 1 und Block 6 von Fig. 2 gezeigt, wird an dem Kontrasthistogramm eine Spitzenanalyse unter Verwendung einer Menge von Schwellwertbildungsparametern durchgeführt. Mit den Ergebnissen der Spitzenanalyse wird ein Minimalkontrastwert gewählt, so daß, wie im Block 7 von Fig. 2 gezeigt, an dem Kontrastbild eine Schwellwertbildung durchgeführt werden kann. Wie im Block 8 von Fig. 2 gezeigt, wird das Kontrastbild, an dem eine Schwellwertbildung durchgeführt wurde, zusammen mit dem ursprünglichen Grauwertbild, dem MIN- Bild, dem MAX-Bild und dem Kontrastbild selbst verwendet, um ein Binärbild zu liefern.
  • Fig. 2 zeigt auch den Datenfluß, der mit der Konstruktion und Verwendung der verschiedenen Zwischenkonstruktionen des Verfahrens, wie beispielsweise dem MIN-Bild, dem MAX-Bild und dem Kontrastbild und dem Kontrasthistogramm verbunden ist. Falls erforderlich, können die in einem Schritt des Verfahrens erzeugten Daten die Verarbeitung von einem Verfahrensschritt zu dem nächsten Verfahrensschritt begleiten. So ist beispielsweise die Konstruktion des MIN-Bilds, des MAX- Bilds und des Kontrastbilds erforderlich, um das Kontrasthistogramm zu bilden und die Histogrammspitzenanalyse gemäß der Erfindung durchzuführen. Jedoch werden diese drei Bilder, nachdem sie konstruiert worden sind, möglicherweise in den abschließenden Schritten der Spitzenanalyse und der Schwellwertbildung des ursprünglichen Grauwertbilds wieder verwendet. Die dicken Linien von Fig. 2 zeigen, wie die Daten für das ursprüngliche Grauwertbild, das MIN-Bild, das MAX-Bild und das Kontrastbild zur Verwendung durch spätere Schritte in dem Verfahren verfügbar gemacht werden. Das Erkennen der doppelten Verwendung dieser Zwischenbilder und des Designs des Schwellwertbildungsverfahrens zur Wiederverwendung der Zwischenbilder, anstatt sie zu rekonstruieren, stellt einen wichtigen Teil der durch die Erfindung erzielten Zeiteinsparungen und Geschwindigkeit dar.
  • Stufe Zwei der Erfindung beginnt mit den in Stufe Eins produzierten Binärbildern. Fig. 1 zeigt eine bevorzugte Betriebsart, in der drei Mengen von Schwellwertbildungsprozeßparametern verwendet werden, um drei Binärbilder zu erzeugen, an denen eine Schwellwertbildung durchgeführt wurde. Wenn gewünscht wird, zusätzliche Mengen von Prozeßparametern zu verwenden, dann würden die durch Blöcke 2 bis 5 von Fig. 1 dargestellten Schritte für jede Menge von Prozeßparametern wiederholt werden.
  • Jedes Binärbild wird in Block 3, 7 und 11 von Fig. 1 in eine lauflängencodierte Form (RLE-Form) umgewandelt. Als nächstes wird in den Blöcken 1, 8 und 12 eine Stückextrahierung durchgeführt, um Anzahl und Größe der verbundenen Komponenten zu bestimmen. In den Blöcken 5, 9 und 13 wird für jedes Bild ein Histogramm der Stückgrößenverteilung konstruiert. In Block 14 werden die Stückgrößenhistogramme und die RLE-Bilder verwendet, um das Binärbild mit der höchsten Qualität zu wählen. In Fig. 1 zeigen die dicken Linien, zusätzlich zu dem normalen Datenfluß von einem Verfahrensschritt zum nächsten, den Datenfluß, der mit dem Liefern der RLE-Daten für jedes Binärbild direkt an den letzten Schritt im Block 14 verbunden ist.
  • Für höchste Geschwindigkeit kann das Verfahren der Erfindung an einem Vektorprozessor realisiert werden. Der Vektorprozessor verwendet vorzugsweise eine Auswahl von 150/40-Verarbeitungsmodulen der Firma Imaging Technology, Inc. Die 150/40-Module können, wie in Fig. 12 gezeigt, über einen VME-Bus zusammengeschaltet sein. An den VME-Bus können auch ein oder mehrere allgemeine Prozessoren 21, 22 und 23, wie zum Beispiel der von der Firma Heurikon Corporation vertriebene Prozessor Nitro60 angeschlossen sein. Ein Bildmanager 31, wie zum Beispiel das von der Firma Imaging Technology Inc. vertriebene Modul IMA 150/40, und eine Rechenmodulsteuerung 41, wie beispielsweise das ebenfalls von der Firma Imaging Technology Inc. vertriebene Modul CMC 150/40, können ebenfalls an den VME-Bus angeschlossen sein. Das Verfahren der Erfindung kann in der Sprache C codiert werden und zur Installation auf den Nitro60-Prozessoren 21, 22 und 23 und den anderen verarbeitenden Modulen auf dem VME-Bus querkompiliert sein. Ein Nitro60-Prozessor 21 kann eine Maussteuerleitung 25 und einen R5232-Port 26 zur Bereitstellung von Bedienersteuerung über das System aufweisen. Ein Nitro60-Prozessor 21 kann auch Datenports wie zum Beispiel einen SCSI-2-Port 28 und einen Ethernet-Port 29 aufweisen. Das IMA-150/40-Modul 31 stellt vorzugsweise vier Megabyte an Speicher zum Speichern von bis zu vier 1024 · 1024 Bildern bereit und liefert die Gesamttaktsteuerung an die Pipeline- Hardware. Das IMA-150/40-Modul 31 läßt auch bis zu drei Tochterplatinen 32, 33 und 34, unten erörtert, zu. Das CMC-150/40-Modul 41 arbeitet wie ein Pipeline- Schaltmodul, läßt bis zu drei Tochterplatinen 42, 43 und 44 zu und leitet Bilder zu etwaigen Tochterplatinen und von diesen weg. Das IMA-150/40-Modul 31 und das CMC-150/40-Modul 41 sind über einen Bildelementbus 71 separat zusammengeschaltet.
  • Drei Tochterplatinen sind auf dem IMA-150/40- Modul 31 montiert. Die AMDIG-Tochterplatine 34 erhält Grauwertbilddaten von der CCD-Kamera, vorzugsweise einer Kamera KodakTM Megaplus 1.4, und leitet die Bilddaten zu einem entsprechenden Speichergebiet in dem IMA-150/40-Modul 31. Die AMDIG-Tochterplatine 34 kann die Eingangsbilddaten gegebenenfalls auch skalieren. Die DMPC-Tochterplatine 32 kann über einen hochauflösenden RGB-Monitor 61 eine Anzeige jedes beliebigen Bilds bereitstellen. Die MMP-Tochterplatine 33 ist ein morphologischer Prozessor, der automatisch das MAX- und MIN-Bild liefert, wenn ihm ein Grauwertbild und eine Rechteckkastengröße geliefert wird. Auf dem CMC-150/40-Modul 41 sind drei zusätzliche Tochterplatinen montiert. Die HF-Tochterplatine 43 ist ein Histogramm- und Merkmalsextrahierer, der, wenn ihm ein Binärbild geliefert wird, automatisch ein Histogramm aus 256 Behältern liefert. Der Merkmalsextrahierer kann auch verwendet werden, um automatisch RLE-Bilder zu erzeugen. Die CLU- Tochterplatine 44 ist ein Convolver und Logikprozessor, der automatisch das Kontrastbild liefert. Die PA- Tochterplatine 42 ist ein separater Digitalsignalprozessor, der parallel zu der Pipeline- Verarbeitung asynchron als Coprozessor arbeitet. Diese Tochterplatine wird verwendet, um das Qualitätsschätzverfahren zu liefern: Empfangen mehrerer RLE-Bilder, Wählen des besten RLE-Bilds und Liefern der Daten für das beste RLE-Bild zu einem der Nitro60- Prozessoren 21, 22 und 23 zur OCR-Verarbeitung. Die gesamte Hardwarekonfiguration in Fig. 12 arbeitet mit der Geschwindigkeit von 40 Megabildelementen pro Sekunde, was impliziert, daß ein ein Megabyte großes Bild (1024 · 1024 Bildelemente) zur Verarbeitung etwa 28 Millisekunden erfordert. Bei dieser Geschwindigkeit sind weniger als 0,5 Sekunden erforderlich, um drei parametrische Schwellwertbildungen eines einzelnen 1024 · 1024-Grauwertbilds zu konstruieren und für die OCR- Verarbeitung das Binärbild, an dem eine Schwellwertbildung durchgeführt wurde und das die beste Qualität aufweist, zu wählen.
  • Das Verfahren der Erfindung kann auch auf jedem beliebigen Digitalrechner mit ausreichend Speicher zum Aufnehmen des ursprünglichen Grauwertbilds, der Zwischenverarbeitungsbilder (das MIN-Bild, das MAX-Bild und das Kontrastbild) und mindestens zwei binärer Bilder, an denen eine Schwellwertbildung durchgeführt wurde, realisiert werden. Das Programmieren des Verfahrens auf einem Digitalrechner kann in der C- Sprache oder jeder vergleichbaren Verarbeitungssprache durchgeführt werden.
  • Aus dieser Übersicht beschreiben wir nun das gesamte Verfahren ausführlich. An einer gegebenen Stelle (i, j) in dem Grauwertetikettenbild wird durch die folgende Vorgehensweise ein örtlicher Kontrast erhalten:
  • Schritt 1. Finde den kleinsten Graupegelwert (MINij) in einem k · k-Fenster mit der Mitte bei (i, j).
  • Schritt 2. Finde den größten Graupegelwert (MAXij) in dem gleichen Fenster.
  • Schritt 3. Der örtliche Kontrast LC bei (i, j) wird berechnet als:
  • LCij - C · (1 - (MINij + p) / (MAXij + p))
  • Der Wert C wird auf der Grundlage des gewünschten größten Werts für den örtlichen Kontrast gewählt. Bei Grauwertbildern mit hohem Kontrast kann ein kleiner Wert von C möglicherweise ausreichen, um zwischen Vordergrund und Hintergrund zu differenzieren. Bei Grauwertbildern mit niedrigem Kontrast kann eine größere Differenzierung beim Kontrast notwendig sein, um zwischen Vordergrund und Hintergrund zu wählen. Für C wird ein Wert von 255 bevorzugt. Dieser Wert funktioniert bei den meisten Grauwertbildern und gestattet, die Werte des Kontrastbilds eines pro 8-Bit- Byte zu speichern. Der Wert p wird so gewählt, daß er positiv und im Vergleich zu C klein ist. Seine Hauptrolle besteht darin, vor Dividieren durch Null zu schützen, und er sollte so gewählt werden, daß er eine schnelle Berechnung des Werts des örtlichen Kontrasts erleichtert. Eins ist ein bevorzugter Wert für p.
  • Die obige Formel für örtlichen Kontrast führt zu einem großen örtlichen Kontrast LCij, wenn zwischen dem kleinsten und größten Bildelement in dem k x k- Fenster bei einem Graupegel eine große Differenz vorliegt. Der Wert des örtlichen Kontrasts kann zwischen 0 und C variieren, wobei 0 der kleinste Kontrast und C der größte Kontrast ist. Es ist nicht erforderlich, daß der größte Kontrastwert der gleiche ist wie der größtmögliche Bildelementwert in dem ursprünglichen Grauwertbild. Der bevorzugte maximale Kontrastwert beträgt jedoch 255, und dieser Wert wird im Rest der ausführlichen Beschreibung verwendet.
  • Es wird ein neues Bild erstellt, das das Kontrastbild genannt wird und das die Informationen über den örtlichen Kontrast enthält. Für jedes Grauwertbildelement bei (I, j) in dem ursprünglichen Etikettenbild wird ein entsprechendes Bildelement in dem Kontrastbild vom Wert her gleich LCij gesetzt. Jedem Bildelement in dem Kontrastbild ist auf diese Weise ein Wert zwischen null und dem größten Kontrast zugeordnet. Analog dazu werden die beiden anderen neuen Bilder erzeugt, das MIN-Bild und das MAX-Bild. Das Bildelement in der (i, j)-Position des MIN-Bilds hat den Wert MINij, und das Bildelement in der entsprechenden Position in dem MAX-Bild hat den Wert MAXij.
  • Der Fenstergrößenparameter k wird bestimmt, indem die größte zulässige Strichstärke für ein Textzeichen gefunden wird. Beispielsweise weist ein Zeichen bei einer Schrift von 8 Punkten bei 250 Punkten pro Inch eine Strichstärke von etwa 3 Bildelementen auf. Bei der gleichen Auflösung weist ein Zeichen bei einer Schrift von 18 Punkten eine Strichstärke von etwa 14 Bildelementen auf. Der Wert k wird dann geringfügig größer als diese größte zulässige Stärke eingestellt. Um beispielsweise für ein Etikett mit einer Schrift mit 18 Punkten hohe Textkontrastwerte zu haben, muß die Abmessung k des Fensters größer als 14 Bildelemente sein. Wenn die Abmessung kleiner ist als dieser Betrag, dann wird für Bildelemente, die sich in der Mitte eines Zeichenstrichs befinden, ein sehr niedriger Kontrastwert erhalten, da alle Graustufenwerte innerhalb des in der Mitte angeordneten k · k-Fensters fast gleich sein werden. Bei einigen Anwendungen bzw. Zeichenschriften kann möglicherweise die Verwendung eines rechteckigen Fensters der Größe k · j, wobei k und j verschiedene Werte aufweisen, vorzuziehen sein. Eine bevorzugte Fenstergröße ist ein Quadrat von 15 Bildelementen mal 15 Bildelementen. Diese Fenstergröße gestattet die Verarbeitung von Zeichen in jeder Drehausrichtung bis zu einer Schriftgröße von 18 Punkten.
  • In Fig. 3, 4 und 5 sind Beispiele gezeigt, die die Ableitung der Bildelementwerte für das MIN- Bild, das MAX-Bild und das Kontrastbild zeigen. In allen drei Fällen wird eine quadratische Fenstergröße verwendet, und k ist so gewählt, daß es einen Wert von 3 aufweist. In Fig. 3 werden die Bildelementwerte des ursprünglichen Grauwertbilds im oberen Abschnitt der Figur in der linken oberen Ecke gezeigt; der kleinste Bildelementwert von "3" in einem 3 · 3-Quadrat um die (2,2)-Position herum bestimmt, daß die (2,2)-Position des MIN-Bilds einen Wert von "3" aufweist. Analog dazu wird die (6,6)-Position des MIN-Bilds als "195" bestimmt. An den Rändern des Grauwertbilds enthält das Fenster Gebiete außerhalb des Grauwertbilds. Der Bildelementwert für ein beliebiges Gebiet außerhalb des ursprünglichen Bilds wird als Null angesehen.
  • In Fig. 4 ist zu sehen, daß die (2,2)-Position des MAX-Bilds einen Wert von "39" aufweist, während die (6,6)-Position einen Wert von "231" aufweist. Fig. 5 veranschaulicht, wie die Ableitung des MIN-Bilds und des MAX-Bilds durch algebraische Berechnung direkt zu dem Kontrastbild führt.
  • Um das Kontrasthistogramm zu konstruieren, wird eine Menge von 256 Behältern erzeugt, die jeweils einem der Kontrastpegel (0-255) entsprechen. Nacheinander wird jedes Bildelement in dem Kontrastbild untersucht, und der dem Bildelementwert entsprechende Behälter wird um Eins erhöht. Dies bildet das Kontrasthistogramm, das einen Zählwert der Anzahl von Bildelementen in dem Bild, die Bildelementwerte bei jedem Graupegel aufweisen, darstellt. Ein Beispiel für ein Kontrasthistogramm ist in Fig. 6 gezeigt.
  • Spitzen in dem Kontrasthistogramm entsprechen Teilen des Grauwertetikettenbilds, die ähnlichen Kontrast aufweisen. Es handelt sich im allgemeinen bei diesen Teilen bzw. Kontrastsegmenten um ähnliche Arten von Text, Graphik oder Rauschen. Die Spitzenanalyse ist der Prozeß, bei dem bestimmt wird, welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Text handelt, und welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Hintergrund oder Rauschen handelt. Das Ergebnis der Spitzenanalyse hilft bei der korrekten Zuordnung von 0 (Schwarz) für Textbildelemente und 1 (Weiß) für Hintergrund- bzw. Rauschbildelemente.
  • Bei der Spitzenanalyse lautet die zugrundeliegende Annahme, daß bei einem gegebenen Etikett der Kontrastwert für Kontrastsegmente entsprechend Hintergrundbildelementen und Rauschbildelementen im Durchschnitt kleiner ist als die Werte für die Vordergrund/Textbildelemente. Es gibt jedoch eine Reihe von Schwierigkeiten, zu denen es aufgrund der Vielfalt von Etiketten kommt. Diese Schwierigkeiten sind wie folgt aufgezählt:
  • 1. Die Anzahl der Kontrastelemente ist veränderlich. Deshalb ist die Anzahl der Kontrastspitzen in dem Kontrasthistogramm veränderlich. Dies bedeutet auch, daß es mehrere Hintergrund- oder Rauschspitzen sowie mehrere Textspitzen geben kann.
  • 2. Der durchschnittliche Kontrastwert für ein Kontrastsegment ist veränderlich. Deshalb ist die Stelle von Kontrastspitzen in dem Kontrasthistogramm veränderlich.
  • 3. Die Anzahl der Bildelemente in einem Kontrastsegment ist veränderlich. Deshalb ist die Höhe einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
  • 4. Die Verteilung von Kontrastwerten um den durchschnittlichen Kontrastwert in einem Kontrastsegment herum ist veränderlich. Deshalb ist die Breite einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
  • Bei einem gegebenen Kontrasthistogramm mit mehreren Spitzen mit verschiedenen Höhen, Breiten und Stellen besteht das Ziel der Spitzenanalyse darin, einen Kontrastwert zu finden, der als der kleinste zulässige Kontrast bezeichnet wird, so daß einem beliebigen Bildelement mit einem Kontrastwert unter diesem Wert automatisch ein Wert von 1 (Hintergrund oder Rauschen) zugeordnet wird.
  • Zur Bewältigung dieser Aufgabe wird eine Menge von Schwellwertbildungsprozeßparametern zur Analyse des Kontrasthistogramms verwendet. Diese Parameter sind: (1) Spitzen-Boden-Pegel, (2) Minimalkontrastwert, (3) Spitzen-Breiten-Nennwert und (4) Text-Spitzen-Breiten- Nennwert. Die Parameter sind in Fig. 6 veranschaulicht.
  • Der Spitzen-Boden-Pegel ist die kleinste Höhe, die eine Kontrasthistogrammspitze aufweisen kann. Etwaige Kontrasthistogrammspitzen, die unter dem Spitzen-Boden-Pegel liegen, werden als möglichen Textkontrastsegmenten nicht entsprechend betrachtet. Der Spitzen-Boden-Pegel variiert in der Regel von 800 bis 1200 und ist vorzugsweise für ein Bild mit einer Größe von 1024 · 1024 Bildelementen auf 1100 eingestellt.
  • Der Minimalkontrastwert ist der kleinste Wert, den ein Kontrastbildelement aufweisen kann und immer noch als Teil eines Textkontrastsegments betrachtet werden kann. Er hat vorzugsweise einen Wert von 25 bis 75, wenn C einen Wert von 255 aufweist.
  • Der Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden. Er weist vorzugsweise einen Wert von 50 bis 75 auf, wenn C einen Wert von 255 aufweist.
  • Der Text-Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht. Er weist vorzugsweise einen Wert von 25 bis 75 auf, wenn C einen Wert von 255 aufweist.
  • Der Prozeß der Spitzenanalyse für das Kontrasthistogramm ist ein Prozeß zur Ermöglichung der Schwellwertbildung bei dem Kontrastbild durch Bestimmen eines kleinsten zulässigen Kontrasts. Dieser Prozeß ist wie folgt:
  • Schritt 1. Spitzensuche: Finde den Kontrasthistogramm-Kontrastwert mit der größten Anzahl von Bildelementen. Dies ist die größte aktuelle Spitze.
  • Schritt 2. Spitzenbewertung: Wenn die Spitzenhöhe nicht größer ist als der Spitzen-Boden- Pegel, gehe zu Schritt 6. Die Spitze wird nicht zugelassen, da sie zu kurz ist.
  • Schritt 3. Spitzenspeicherung: Speichere den Spitzenkontrastwert.
  • Schritt 4. Spitzensperrung: Sperre die Spitzensuche innerhalb des Spitzen-Breiten-Nennwerts dieser Spitze und aller vorausgegangener Spitzen.
  • Schritt 5. Gehe zu Schritt 1.
  • Schritt 6. Spitzenwahl: Finde die gespeicherte Spitze, die sich bei dem kleinsten Kontrastwert befindet, der größer ist als der Minimalkontrastwert. Dies wird als die Minimaltextspitze bezeichnet.
  • Schritt 7. Schwellwertbestimmung: Subtrahiere den Text-Spitzen-Breiten-Nennwert von dem Kontrastwert der Minimaltextspitze. Dies ist der kleinste zulässige Kontrast.
  • Die Anwendung des Prozesses der Spitzenanalyse auf das in Fig. 6 gezeigte Kontrasthistogramm führt zu der Identifizierung von drei Textspitzen: Spitze 2, Spitze 3 und Spitze 4. Spitze 3 ist die Minimaltextspitze. Die Identifizierung von Spitze 3 gestattet die Bestimmung des kleinsten zulässigen Kontrasts, wie in Fig. 6 gezeigt.
  • Nachdem der kleinste zulässige Kontrast bestimmt worden ist, kann das ursprüngliche Grauwertbild einer Schwellwertbildung unterzogen werden. Wenn das Bildelement bei (i, j) in dem ursprünglichen Bild, seine Werte MINij, MAXjj und LCij gegeben sind, werden die folgenden Schritte unternommen, um zu bestimmen, ob es sich bei dem Bildelement um Vordergrund (Text) oder Hintergrund handelt:
  • Schritt 1. Ist LCij größer als der kleinste zulässige Kontrast? Wenn nicht, dann wird das Bildelement bei (i, j) als Hintergrund bezeichnet.
  • Schritt 2. Ist MAXij-MINij ausreichend groß? Wenn nicht, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-MIN; mit einem ersten, als Minimalkontrastskala bezeichneten Grenzwert verglichen. Wenn diese Differenz geringer ist, wird das Bildelement als Hintergrund bezeichnet. Der Minimalkontrastskala- Wert liegt vorzugsweise zwischen 20 und 32, wenn C einen Wert von 255 aufweist.
  • Schritt 3. Liegt das Bildelement bei (i, j) viel näher an MINij oder näher an MAXij? Wenn ausreichend näher an MAXij, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-(Wert des Bildelements bei (i, j)) mit einem als Kontrastüberschuß-Nennwert bezeichneten zweiten Grenzwert verglichen. Wenn diese Differenz niedriger ist, wird das Bildelement als Hintergrund bezeichnet. Der Kontrastüberschuß-Nennwert liegt vorzugsweise in der Mitte zwischen MINij und MAXij, d. h. (MINij + MAXij)/2.
  • Schritt 4. Wenn das Bildelement bei (i, j) durch keinen der obigen drei Tests als Hintergrund bezeichnet worden ist, dann wird das Bildelement als Vordergrund (Text) bezeichnet.
  • Die Schwellwertbildung des Grauwertbilds mit einer spezifischen Menge von Parametern vervollständigt die erste Stufe der Verarbeitung. Die Leistung der Stufe Eins hängt von der Wahl einer adäquaten Menge von Schwellwertbildungsprozeßparametern ab. Die oben spezifizierte Menge von Parametern führt für eine große Vielfalt von Etiketten zu zufriedenstellenden Ergebnissen. Es ist allerdings schwierig, für die ganze Vielfalt von Etiketten, die man in allen gegebenen Umfeldern möglicherweise antreffen kann, eine einzige Menge von Parametern zu finden, die zu zufriedenstellenden Ergebnissen führt. Mit einem Verfahren zum Wählen zwischen mehreren Mengen von Prozeßparametern ist es jedoch möglich, zwei oder drei Mengen von Parametern zu finden, die fast alle Möglichkeiten abdecken. Drei Mengen von Prozeßparametern sind in Tabelle 1 angegeben und werden im Zusammenhang mit dem unten erörterten Beispiel 1 verwendet.
  • Um ein gegebenes Grauwertbild mit einer Menge von Verarbeitungsparametern einer Schwellwertbildung zu unterziehen, ist es vorzuziehen, die zu verwendenden Parameterwerte vorzuwählen. Wie aus der obigen Beschreibung der Schwellwertbildungsschritte zu erkennen ist, bedeutet der Ausdruck "vorgewählt" nicht nur das Vorwählen konstanter Werte, sondern auch das Vorwählen von Formeln, die zum Bestimmen der in Frage kommenden Werte verwendet werden können.
  • Wenn ein Etikettenbild durch das LAT-Verfahren und die LAT-Vorrichtung mehrmals verarbeitet worden ist, jedesmal mit einer anderen Menge von Prozeßparametern, so ist das Ergebnis eine Menge von Etikettenbildern, an denen eine Schwellwertbildung durchgeführt worden ist. Es wird dann notwendig, automatisch zu beurteilen, welches Bild der Menge, an dem eine Schwellwertbildung durchgeführt worden ist, beste ist, das heißt zu beurteilen, welches die höchste Qualität für die OCR-Verarbeitung aufweist. Die zweite Stufe der Erfindung, nämlich die Qualitätsanalyse, ergänzt die oben beschriebene Verarbeitung in Stufe Eins und liefert das erforderliche Urteil, um das beste Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen.
  • Der Prozeß der Qualitätsanalyse weist die folgenden Hauptschritte auf:
  • Schritt 1. Erzeugen einer Schwellwertbildung unterzogene Bilder unter Verwendung von n Mengen von Prozeßparametern.
  • Schritt 2. Wandle jedes Binärbild in ein lauflängencodiertes Bild (RLE-Bild) um.
  • Schritt 3. Führe an jedem RLE-Bild eine Stückextrahierung durch und bestimme Anzahl und Größe verbundener Komponenten in dem Bild.
  • Schritt 4. Unter Verwendung statistischer Informationen, bestimme paarweise auf der Grundlage der Verteilung von Stückgrößen in jedem der beiden Bilder, welches der beiden Bilder die höhere Qualität aufweist.
  • Schritt 5. Unter Verwendung des in Schritt 4 gewählten Bilds mit einem beliebigen anderen, noch nicht verglichenen Bild, wiederhole Schritt 4. Fahre fort, bis alle Bilder verglichen worden sind, um dasjenige Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen, das die höchste Qualität aufweist.
  • In Schritt Eins wird Stufe Eins des LAT- Verfahrens n-mal durchgeführt, um n Bilder zu erzeugen, jedes mit einer anderen Menge von Prozeßparametern.
  • Jedes so erzeugte Binärbild ist lauflängencodiert. Die Lauflängencodierung (RLE) ist ein Prozeß, der ein aus binären Bildelementen bestehendes Bild in eine andere Darstellung umwandelt. Bei dieser Darstellung wird jede horizontal verbundene Gruppe von schwarzen Bildelementen, die als ein Lauf bezeichnet wird, in das RLE-Format umgewandelt, indem nur die Stelle des Anfangsbildelements für den Lauf und die Länge des Laufs beibehalten werden. Alle Läufe werden auf diese Weise umgewandelt. RLE ist eine standardmäßige Bildverarbeitungstechnik.
  • Die RLE-Umwandlung neigt dazu, die Größe des Bilds beträchtlich zu reduzieren, ohne die Qualität des Binärbilds zu reduzieren. Als Beispiel handelt es sich bei dem Bild in Fig. 7 um ein 100 · 100-Binärbild, das üblicherweise eine Speicherung von 10 000 Bit erfordert. Da es jedoch nur einen vertikalen Balken (mit einer Höhe von 100 Bildelementen und einer Stärke von 3 Bildelementen) enthält, kann es im RLE-Format durch 100 Anfangsbyte jeweils mit einem Längenbyte (mit Wert 3) dargestellt werden. Dieses Bild erfordert deshalb im RLE-Format nur eine Speicherung von 200 Byte. Es hat sich gezeigt, daß einige Algorithmen aufgrund des Charakters dieses Formats sowie der kleineren Darstellung weniger Ausführungszeit benötigen.
  • Jedes RLE-Bild wird als nächstes einer Stückextrahierung unterzogen. Die Stückextrahierung ist eine standardmäßige Bildverarbeitungstechnik, um Läufe zu finden, die verschiedene Linien der Bilder berühren. Läufe, die sich berühren, werden als verbundene Komponenten bezeichnet. Beim Zusammenbau von Gruppen von verbundenen Läufen werden Stücke gebildet. Ein Stück kann beispielsweise ein mit einer Schreibmaschine geschriebenes Zeichen oder ein Rauschfleck sein.
  • Mit den auf diese Weise zusammengetragenen statistischen Informationen kann das Bild mit der besten Qualität gewählt werden. Die Qualitätsschätzung ist ein Verfahren zum Untersuchen der Ergebnisse des LAT-Prozesses und zum Beurteilen, welcher Schwellwert der beste unter einer Gruppe von Bildern ist. Dieser Prozeß verwendet zum Schätzen der Qualität die Größe von durch den Stückextrahierungsalgorithmus erzeugten Stücken (d. h. die Anzahl von Bildelementen in einem Stück).
  • Die Stückgröße ist zum Untersuchen ein sehr nützliches Merkmal, da sie eine gute Darstellung der Qualität von auf Text basierenden Bildern wie beispielsweise Etiketten liefert. Die zugrundeliegende Annahme lautet, daß die Verteilung von Stückgrößen Informationen über die Menge an Rauschen und Text, die sich in einem Bild finden, das einer Schwellwertbildung unterzogen worden ist, liefert. Bilder mit vielen kleinen Stücken neigen dazu, verrauscht zu sein. Bilder mit vielen großen Stücken neigen dazu, Text mit hoher Qualität aufzuweisen. Bilder weisen oftmals eine gewisse Menge an Stücken mit vielen unterschiedlichen Größen auf.
  • Die Erfindung verwendet ein Histogramm der Stückgrößen als Merkmalsmenge für die Qualitätsschätzung. Der Bereich von Stückgrößen wird in b Behälter unterteilt. Jeder Behälter enthält die Anzahl von Stücken in den Bildern, die innerhalb des Größenbereichs des Behälters liegen. Ein Entscheidungstreffungsprozeß wird zum Untersuchen des Histogramms verwendet, um zu bestimmen, ob das Bild eine bessere Qualität als jedes andere der Bilder, die einer Schwellwertbildung unterzogen worden sind, aufweist. Zur Durchführung dieser Untersuchung sind zwei verschiedene Entscheidungsprozesse entwickelt worden:
  • 1. Der erste Entscheidungsprozeß verwendet ein Histogramm mit zwei Behältern. Behälter 1 (Rauschen) enthält kleine Stücke mit einer Größe zwischen 0 und 10 Bildelementen. Behälter 2 (Groß) enthält große Stücke mit einer Größe von über 100 Bildelementen. Bezeichne die Bilder so, daß das Bild mit mehr großen Stücken mit der Nummer 1 bezeichnet wird, d. h. Groß(1)> Groß(2). Der folgende Vergleich bzw. die folgende Wahl erfolgt für zwei Bilder, Bild(1) und Bild(2), die einer Schwellwertbildung unterzogen worden sind, paarweise:
  • Schritt 1. Wenn Groß(2) < 30, dann wähle Bild(1)
  • Schritt 2. Wenn Q x Groß(1)/Groß(2) > Rauschen(1)/Rauschen(2), wähle Bild(1);
  • ansonsten wähle Bild(2).
  • Der Wert Q wird so gewählt, daß er die folgenden Werte aufweist:
  • Wenn 30 &le; Groß (2) &le; 150, Q = (- 2) (Groß (2)) + 60 + 3/120
  • Wenn 150 < Groß(2), Q = 1
  • Bei mehr als zwei Bildern wird der Algorithmus solange paarweise angewendet, bis eine geeignete Wahl getroffen worden ist.
  • 2. Der zweite Entscheidungsprozeß verwendet ein Stückgrößenhistogramm von vier Behältern wie folgt:
  • Behälter 1 : 0-10.
  • Behälter 2 : 11-40.
  • Behälter 3 : 41-100.
  • Behälter 4: mehr als 100
  • Behälter 1 entspricht kleinen Stücken (Bildrauschen), und Behälter 4 entspricht großen Stücken des Bilds. Behälter 3 entspricht unzusammenhängenden großen Stücken, wie sie möglicherweise in einem Bild von Text angetroffen werden können, das von einem Matrixdrucker erzeugt worden ist.
  • Die Werte in diesen Behältern können als die Komponenten eines vierdimensionalen Vektors angesehen werden. An zwei Bildern, Bild(1) und Bild(2), kann dann mit einem neuralen Mitkopplungsnetz mit acht Eingängen eine Qualitätsanalyse durchgeführt werden. Bei den acht Eingängen handelt es sich in dieser Reihenfolge um die Werte in den vier Behältern von Bild(1) und die Werte in den vier Behältern von Bild(2). Das Netz mit den acht Eingängen erzeugt als Ausgangssignal einen Wert zwischen 0-255. Das Netz ist an einer großen Menge von Trainingsbildern unter Verwendung des Backpropagation- Algorithmus trainiert.
  • Um das Netz zu trainieren, wird die große Menge von Trainingsbildern paarweise untersucht, und das bessere Bild jedes Paars wird nach Sichtprüfung gewählt. Das neurale Netz wird trainiert, indem ein Ausgangssignal von 255 spezifiziert wird, wenn die Vektorwerte für das bessere Bild zuerst in dem 8- Komponenteneingangsvektor erscheinen, dann die beiden Vier-Komponenten-Vektoren in dem Eingangssignal vertauscht werden und ein Neuronennetzausgangssignal von 0 spezifiziert wird. Dieser Trainingsprozeß wird für eine große Anzahl von Paaren der Trainingsbilder wiederholt.
  • Nach dem Training funktioniert das Netz wie folgt: Bei einem gegebenen eingegebenen Paar von Bildern, Bild(1) und Bild(2), werden die beiden Vier- Komponenten-Vektoren von dem Stückgrößenhistogramm als Eingangssignal an das neuronale Netz geliefert. Wenn der Wert des Ausgangssignals des Netzes über 128 liegt, ist Bild(1) besser als Bild(2). Ansonsten ist Bild(2) besser. Bei mehr als zwei Bildern wird der Algorithmus paarweise solange angewendet, bis eine geeignete Wahl getroffen worden ist.
  • Unter Verwendung des Histogramms von Stückgrößen können auch andere Mechanismen zum Schätzen der Qualität eingesetzt werden. Als Beispiel verwendet ein derartiger Mechanismus einen Spitzenerfassungsalgorithmus, der dem in der ersten Stufe des LAT-Prozesses ähnlich ist, um Text- und Rauschstücksegmente zu finden. Bei einem anderen Beispiel können neuronale Netze verwendet werden, wobei nur ausgewählte Behälter der Stückgrößenhistogramme als Eingangssignale verwendet werden.
  • Beispiel
  • Die Fig. 8-11 veranschaulichen die Verwendung der Erfindung mit einem beispielhaften Etikett. Fig. 8 zeigt das ursprüngliche Grauwertbild eines Probeetiketts. Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Bilds in Fig. 8, wobei die Parameter in Spalte 1 von Tabelle 1 verwendet werden. Man beachte, daß während der ganze Hintergrund auf Weiß eingestellt worden ist, ein Teil des Textes fehlt. Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 2 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, doch ist ein Teil des Hintergrunds, der Falten in dem Etikett entspricht, auf Vordergrund-Schwarz eingestellt worden. Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 3 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, und der ganze Hintergrund ist auf Weiß eingestellt worden. Nach Sichtüberprüfung ist dieses letzte Binärbild deutlich dasjenige Bild aus den drei, in Fig. 9, 10 und 11 gezeigten Binärbildern, das die beste Qualität aufweist. Wenn diese drei Binärbilder dem ersten Verfahren der Qualitätsanalyse unterzogen wurden, wurde das Fig. 11 entsprechende letzte Bild gewählt. Tabelle 1. Prozeßparameter
  • Die Wahl des Fig. 11 entsprechenden letzten Bildes als das beste Binärbild, das einer Schwellwertbildung unterzogen worden ist, kann unter Bezugnahme auf Tabelle 2 veranschaulicht werden, die die Werte für den Behälter "Rauschen" und den Behälter "Groß" des Stückgrößenhistogramms enthält. Tabelle 2. Anzahl großer und kleiner Binärbildstücke.
  • Der Qualitätsanalyseprozeß vergleicht zunächst die Bilder A und B. Da Bild B mehr große Stücke aufweist, wird es als Bild 1 bezeichnet und Bild A wird mit 2 bezeichnet. Der Wert von Q beläuft sich in diesem Fall auf
  • Q = (-2) (Groß (2)) + 60/120 + 3 = -2 (30) + 60/120 + 3 = 3
  • Der Test hinsichtlich des Bilds mit der besseren Qualität ist
  • Q x Groß (1)/Groß (2) = 3 (70)/30 = 7
  • was nicht größer ist als Rauschen(1)/Rauschen(2) = 1884/95, so daß Bild 2 (Bild A) gewählt wird.
  • Als nächstes wird Bild A mit Bild C verglichen. In diesem Fall wird Bild C als Bild 1 bezeichnet. Der Wert Q wird wieder als 3 berechnet. Der Test hinsichtlich des Bilds mit der besseren Qualität ist somit
  • Q x Groß(1)/Groß (2) = 3(52)/30 = 5,2
  • was größer ist als Rauschen(1)/Rauschen(2) = 109/95. Somit wird Bild 1 (Bild C), das Fig. 11 entspricht, als das beste Bild der drei Bilder gewählt.
  • Diese Erfindung ist zwar unter besonderer Bezugnahme auf bevorzugte Ausführungsformen der Erfindung ausführlich beschrieben worden, dennoch versteht es sich, daß Abänderungen und Modifikationen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Schutzumfang der Erfindung, wie er hier beschrieben ist und in den beigefügten Ansprüchen definiert ist, abzuweichen.

Claims (21)

1. Verfahren zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, mit folgendem:
Wählen eines ersten der Binärbilder; Umwandeln des ersten Binärbilds in ein erstes lauflängencodiertes Bild (RLE-Bild = run-length encoded);
Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem Anwenden eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.
2. Verfahren nach Anspruch 1, bei dem der Schritt des Bestimmens von Gebietsverteilungen für die Binärbilder folgende Schritte umfaßt:
Umwandeln der Abschnitte von jedem der Binärbilder mit dem ersten von zwei Werten in ein RLE- Bild; und
Bestimmen der Gebietsverteilung von verbundenen Komponenten von jedem der RLE-Bilder unter Verwendung von Stückextrahierung.
3. Verfahren nach Anspruch 1 oder 2, bei dem der Schritt des Vergleichens der Gebietsverteilungen folgende Schritte umfaßt:
Konstruieren eines Mehr-Behälter-Histogramms jeder der Gebietsverteilungen; und
Vergleichen der Werte in ausgewählten Behältern des Mehr-Behälter-Histogramms.
4. Verfahren nach Anspruch 3, bei dem der Schritt des Vergleichens der Werte in ausgewählten Behältern des Mehr-Behälter-Histogramms folgenden Schritt umfaßt:
Vergleichen des Verhältnisses von Werten in einem ersten Behälter von jedem der Mehr-Behälter- Histogramme mit dem Verhältnis von Werten in einem zweiten Behälter von jedem der Mehr-Behälter-Histogramme; und
wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:
Wählen eines der beiden Binärbilder auf der Grundlage des Vergleichs im vorausgegangenen Schritt.
5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem der Schritt des Vergleichens des ersten und zweiten Mehr-Behälter-Histogramms folgenden Schritt umfaßt:
Liefern der Werte von ausgewählten Behältern jedes der Mehr-Behälter-Histogramme als Eingänge zu einem zuvor trainierten neuronalen Netz; und
wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:
Wählen eines der beiden Binärbilder auf der Grundlage des Ausgangswerts des zuvor trainierten neuronalen Netzes.
6. Verfahren nach Anspruch 5, bei dem die Histogramme einen kleinen verbundenen Komponenten in den Binärbildern entsprechenden ersten Behälter und einen großen verbundenen Komponenten in den Binärbildern entsprechenden zweiten Behälter aufweisen und der Schritt des Vergleichens der Werte in ausgewählten Behältern der Mehr-Behälter-Histogramme folgende Schritte umfaßt:
Berechnen eines ersten Quotienten durch Dividieren des Werts des ersten Behälters des Histogramms für ein erstes der beiden Binärbilder durch den Wert des ersten Behälters des Histogramms für ein zweites der beiden Binärbilder;
Berechnen eines zweiten Quotienten durch Dividieren des Werts des zweiten Behälters des Histogramms für ein erstes der beiden Binärbilder durch den Wert des zweiten Behälters des Histogramms für ein zweites der beiden Binärbilder; und
wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:
Wählen des ersten Binärbilds, wenn der erste Quotient kleiner ist als der zweite Quotient multipliziert mit einem Qualitätswert.
7. Verfahren nach Anspruch 6, bei dem der Qualitätswert eine vorgewählte Konstante ist.
8. Verfahren nach Anspruch 6 oder 7, bei dem der Qualitätswert aus einer vorbestimmten Formel berechnet wird, die vorgewählte Konstanten und den Wert des zweiten Behälters des Histogramms für das erste der beiden Binärbilder verwendet.
9. Verfahren nach Anspruch 6, 7 oder 8, bei dem der Qualitätswert aus einer vorbestimmten Formel berechnet wird, die vorgewählte Konstanten und den Wert des zweiten Behälters des Histogramms für das zweite der beiden Binärbilder verwendet.
10. Verfahren nach Anspruch 6, bei dem der erste Behälter des Mehr-Behälter-Histogramms den Zählwert von verbundenen Komponenten der Binärbilder mit von 0 bis etwa 10 Bildelementen aufweist.
11. Verfahren nach Anspruch 6, bei dem der zweite Behälter des Mehr-Behälter-Histogramms den Zählwert von verbundenen Komponenten der Binärbilder mit mehr als etwa 100 Bildelementen aufweist.
12. Verfahren zur Schwellwertbildung bei einem Grauwertbild, mit den folgenden Schritten:
Konstruieren eines dem Grauwertbild entsprechenden Kontrastbilds, wobei jedes Bildelement des Kontrastbilds einen Wert LCij aufweist, der gegeben ist durch die Formel
LCij = C (1 - (MINij + p) / (MAXij + p)),
wobei (i, j) die Position des Bildelements in dem Kontrastbild, C ein vorgewählter maximaler Kontrastwert, p ein vorgewählter, im Vergleich zu C kleiner positiver Wert, MINij der kleinste Graustufenwert aller Bildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Position in dem Grauwertbild und MAXij der größte Graustufenwert aller Bildelemente in dem rechteckigen Fenster ist;
Wählen einer vorbestimmten Anzahl von Mengen von Schwellwertbildungsparametern, wobei die Schwellwertbildungsparameter ein Spitzen-Boden- Pegelwert, ein Spitzen-Breiten-Nennwert, ein Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert, ein Minimalkontrastskalenwert und ein Kontrastüberschuß-Nennwert sind, wobei der Spitzen- Boden-Pegelwert die kleinste Höhe ist, die eine Kontrasthistogrammspitze aufweisen kann, der Spitzen- Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, der Text- Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht, der Minimalkontrastskalenwert ein erster Grenzwert und der Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;
für jede Menge von Schwellwertbildungsparametern, Erhalten eines Binärbilds durch Konstruieren eines Kontrasthistogramms des Kontrastbilds über alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als der vorgewählte Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch den vorgewählten Spitzen-Breiten-Nennwert getrennt sind; Wählen einer Minimaltextspitze unter den gefundenen Spitzen durch Auffinden einer Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als der vorgewählte Minimalkontrastwert; Erhalten eines kleinsten zulässigen Kontrastwerts durch Subtrahieren des vorgewählten Text-Spitze-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze; Zuordnen des Bildelements an der (i, j)-Position des Grauwertbilds zu einer Hintergrundklasse des Binärbilds, wenn LCij kleiner ist als der kleinste zulässige Kontrastwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und MINij und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Minimum-Differenz kleiner ist als der vorgewählte Minimalkontrastskalenwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und dem Graustufenwert des Bildelements und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Bildelementwert- Differenz kleiner ist als der vorgewählte Kontrastüberschuß-Nennwert; und, wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Zuordnen des Bildelements zu einer Vordergrundklasse;
Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung; und
Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem Anwenden eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.
13. Verfahren nach Anspruch 12, bei dem der Schritt des Wählens eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr-Behälter- Histogramms folgende Schritte umfaßt:
Vergleichen des Verhältnisses des Werts in einem ersten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter des zweiten Mehr-Behälter-Histogramms mit dem Verhältnis des Werts in einem zweiten Behälter des ersten Mehr-Behälter- Histogramms zu dem Wert in einem zweiten Behälter des zweiten Mehr-Behälter-Histogramms; und
Wählen eines der Binärbilder auf der Grundlage des Vergleichs der Verhältnisse.
14. Verfahren nach Anspruch 12 oder 13, bei dem der Schritt des Wählens eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgende Schritte umfaßt:
Liefern der Werte von ausgewählten Behältern jedes der Mehr-Behälter-Histogramme als Eingänge zu einem zuvor trainierten neuronalen Netz; und
Wählen eines der Binärbilder auf der Grundlage des Ausgangs des zuvor trainierten neuronalen Netzes.
15. Vorrichtung zur Schwellwertbildung bei einem Grauwertbild, mit folgendem:
Mitteln (1, Fig. 1; 3, Fig. 2) zum Konstruieren eines dem Grauwertbild entsprechenden Kontrastbilds, wobei jedes Bildelement des Kontrastbilds einen Wert LCij aufweist, der gegeben ist durch die Formel
LCij = C (1 - (MINij + p) / (MAXij + p)),
wobei (i, j) die Position des Bildelements in dem Kontrastbild, C ein vorgewählter maximaler Kontrastwert, p ein vorgewählter, im Vergleich zu C kleiner positiver Wert, MINij der kleinste Graustufenwert aller Bildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Position in dem Grauwertbild und MAXij der größte Graustufenwert aller Bildelemente in dem rechteckigen Fenster ist;
Mitteln zum Wählen einer vorbestimmten Anzahl von Mengen von Schwellwertbildungsparametern, wobei die Schwellwertbildungsparameter ein Spitzen-Boden- Pegelwert, ein Spitzen-Breiten-Nennwert, ein Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert, ein Minimalkontrastskalenwert und ein Kontrastüberschuß-Nennwert sind, wobei der Spitzen- Boden-Pegelwert die kleinste Höhe ist, die eine Kontrasthistogrammspitze aufweisen kann, der Spitzen- Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, der Text- Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht, der Minimalkontrastskalenwert ein erster Grenzwert und der Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;
Mitteln (2, 6, 10, Fig. 1) zum Erhalten eines Kandidatenbinärbilds für jede Menge von Schwellwertbildungsparametern durch Konstruieren eines Kontrasthistogramms des Kontrastbilds über alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als der vorgewählte Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch den vorgewählten Spitzen-Breiten-Nennwert getrennt sind; Wählen einer Minimaltextspitze unter den gefundenen Spitzen durch Auffinden einer Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als der Minimalkontrastwert; Erhalten eines kleinsten zulässigen Kontrastwerts durch Subtrahieren des vorgewählten Text-Spitze-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze; Zuordnen des Bildelements an der (i, j)-Position des Grauwertbilds zu einer Hintergrundklasse des Kandidatenbinärbilds, wenn LCij kleiner ist als der kleinste zulässige Kontrastwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und MINij und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Minimum-Differenz kleiner ist als der vorgewählte Minimalkontrastskalenwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und dem Graustufenwert des Bildelements und Zuordnen des Bildelements zu der Bildelement-Hintergrundklasse, wenn die Maximum- Bildelementwert-Differenz kleiner ist als der vorgewählte Kontrastüberschuß-Nennwert; und, wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Zuordnen des Bildelements zu einer Vordergrundklasse; und
Mitteln (3, 4, Fig. 1) zum Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des Binärbilds in ein zweites RLE-Bild; und
Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Mittel (5, 14, Fig. 1) zum Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem Anwenden eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.
16. Vorrichtung nach Anspruch 15, bei der das Mittel zum Wählen eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgendes umfaßt:
Mittel zum Vergleichen des Verhältnisses des Werts in einem ersten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter des zweiten Mehr-Behälter-Histogramms mit dem Verhältnis des Werts in einem zweiten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem zweiten Behälter des zweiten Mehr-Behälter-Histogramms; und
Mittel zum Wählen eines der Binärbilder auf der Grundlage des Vergleichs der Verhältnisse.
17. Vorrichtung nach Anspruch 15 oder 16, bei dem das Mittel zum Wählen eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgendes umfaßt:
Mittel zum Liefern der Werte von ausgewählten Behältern jedes der Mehr-Behälter-Histogramme als Eingänge zu einem zuvor trainierten neuronalen Netz; und
Mittel zum Wählen eines der Binärbilder auf der Grundlage des Ausgangs des zuvor trainierten neuronalen Netzes.
18. Vorrichtung nach einem der Ansprüche 15 bis 17, bei der das Mittel zum Konstruieren der Kontrastbilder eine CCD-Kamera (51) enthält.
19. Vorrichtung zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, mit folgendem:
Mitteln zum:
Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild; und
Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Mittel zum:
Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem Anwendens eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.
20. Vorrichtung nach Anspruch 19, mit einer CCD- Kamera (51) zum Erzeugen der Binärbilder.
21. Verfahren zum Betreiben einer Recheneinrichtung (21, 22, 23, 31, 41) mit ausführbaren Anweisungen zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, gemäß den folgenden Schritten:
Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist; wobei die Anweisungen gekennzeichnet sind durch:
Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem Anwenden eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.
DE69604481T 1995-01-31 1996-01-25 Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern Expired - Lifetime DE69604481T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US38073295A 1995-01-31 1995-01-31
PCT/US1996/001060 WO1996024114A2 (en) 1995-01-31 1996-01-25 Method and apparatus for separating foreground from background in images containing text

Publications (2)

Publication Number Publication Date
DE69604481D1 DE69604481D1 (de) 1999-11-04
DE69604481T2 true DE69604481T2 (de) 2000-03-30

Family

ID=23502251

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69604481T Expired - Lifetime DE69604481T2 (de) 1995-01-31 1996-01-25 Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern

Country Status (10)

Country Link
US (1) US5889885A (de)
EP (1) EP0807297B1 (de)
JP (1) JP3264932B2 (de)
AT (1) ATE185211T1 (de)
CA (1) CA2211258C (de)
DE (1) DE69604481T2 (de)
DK (1) DK0807297T3 (de)
ES (1) ES2140825T3 (de)
GR (1) GR3031478T3 (de)
WO (1) WO1996024114A2 (de)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE185211T1 (de) * 1995-01-31 1999-10-15 United Parcel Service Inc Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
JP3380831B2 (ja) * 1996-03-08 2003-02-24 シャープ株式会社 画像形成装置
FR2769733B1 (fr) * 1997-10-15 2000-01-07 Jeffrey Horace Johnson Procede d'extraction automatique d'inscriptions imprimees ou manuscrites sur un fond, dans une image numerique multiniveaux
US6411737B2 (en) * 1997-12-19 2002-06-25 Ncr Corporation Method of selecting one of a plurality of binarization programs
US6411741B1 (en) * 1998-01-14 2002-06-25 Kabushiki Kaisha Toshiba Image processing apparatus
US6507670B1 (en) * 1998-03-05 2003-01-14 Ncr Corporation System and process for removing a background pattern from a binary image
DE69822608T2 (de) * 1998-05-28 2005-01-05 International Business Machines Corp. Binarisierungsverfahren in einem Zeichenerkennungssystem
US6222642B1 (en) * 1998-08-10 2001-04-24 Xerox Corporation System and method for eliminating background pixels from a scanned image
TW429348B (en) * 1999-02-12 2001-04-11 Inst Information Industry The method of dividing an image
US6738526B1 (en) * 1999-07-30 2004-05-18 Microsoft Corporation Method and apparatus for filtering and caching data representing images
EP1226508B1 (de) * 1999-07-30 2018-10-10 Microsoft Technology Licensing, LLC Einstellung von zeichendimensionen um niedrige kontrastmerkmale der zeichen auszugleichen
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6728391B1 (en) 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
DE19958553A1 (de) 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
EP1104916B1 (de) * 1999-12-04 2011-05-11 LuraTech Imaging GmbH Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
US6652489B2 (en) * 2000-02-07 2003-11-25 Medrad, Inc. Front-loading medical injector and syringes, syringe interfaces, syringe adapters and syringe plungers for use therewith
JP2001251507A (ja) * 2000-03-03 2001-09-14 Fujitsu Ltd 画像処理装置
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
US6470094B1 (en) * 2000-03-14 2002-10-22 Intel Corporation Generalized text localization in images
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US6771804B1 (en) * 2000-05-16 2004-08-03 Siemens Aktiengesellschaft Method and apparatus for signal segmentation
KR100430273B1 (ko) * 2000-07-21 2004-05-04 엘지전자 주식회사 비정규적인 빈값 양자화된 칼라 히스토그램을 이용한멀티미디어 검색방법
WO2002047390A1 (en) * 2000-12-04 2002-06-13 Isurftv E-mail, telephone number or url within tv frame
JP2002271611A (ja) * 2001-03-14 2002-09-20 Fujitsu Ltd 画像処理装置
JP4140048B2 (ja) * 2001-08-20 2008-08-27 富士フイルム株式会社 画像管理装置、画像管理プログラム並びに画像管理方法
JP4003428B2 (ja) * 2001-10-10 2007-11-07 セイコーエプソン株式会社 小切手等処理装置及び小切手等処理方法
KR100425324B1 (ko) * 2002-02-09 2004-03-30 삼성전자주식회사 영상 신호의 콘트라스트 처리 방법
RU2251737C2 (ru) * 2002-10-18 2005-05-10 Аби Софтвер Лтд. Способ автоматического определения языка распознаваемого текста при многоязычном распознавании
US7079686B2 (en) * 2002-08-20 2006-07-18 Lexmark International, Inc. Systems and methods for content-based document image enhancement
KR100484170B1 (ko) * 2002-10-25 2005-04-19 삼성전자주식회사 디지털 화질 개선방법 및 장치
JP4118749B2 (ja) * 2002-09-05 2008-07-16 株式会社リコー 画像処理装置、画像処理プログラムおよび記憶媒体
DE10326032B4 (de) * 2003-06-10 2006-08-31 Hema Electronic Gmbh Verfahren zum Selbsttest eines Bildverarbeitungssystems
DE10326033B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Fehlererkennung auf einer inhomogenen Oberfläche
DE10326035B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Fehlererkennung auf einer strukturierten Oberfläche
DE10326031B4 (de) * 2003-06-10 2005-12-22 Hema Electronic Gmbh Verfahren zur adaptiven Kantenerkennung
JP4259949B2 (ja) * 2003-08-08 2009-04-30 株式会社リコー 画像作成装置、画像作成プログラムおよび記録媒体
US7921159B1 (en) * 2003-10-14 2011-04-05 Symantec Corporation Countering spam that uses disguised characters
US7313275B2 (en) * 2005-02-15 2007-12-25 Primax Electronics Ltd. Method of separating text and graphs in digital image data
US7492957B1 (en) * 2005-08-29 2009-02-17 Symantec Corporation Using run length encoding to detect target images
JP4215038B2 (ja) * 2005-09-16 2009-01-28 セイコーエプソン株式会社 画像処理装置、画像処理方法、およびプログラム
US7668394B2 (en) * 2005-12-21 2010-02-23 Lexmark International, Inc. Background intensity correction of a scan of a document
DE102006001075A1 (de) * 2006-01-09 2007-07-12 Carl Zeiss Ag Elektronische Sehhilfe und elektronisches Sehhilfeverfahren
US20070201743A1 (en) * 2006-02-28 2007-08-30 Sharp Laboratories Of America, Inc. Methods and systems for identifying characteristics in a digital image
US7813547B1 (en) * 2006-04-05 2010-10-12 Unisys Corporation Apparatus and method for detection and analysis of imagery
US8306336B2 (en) * 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
ATE409334T1 (de) * 2006-05-19 2008-10-15 Datasensor Spa Bildsensor für sicherheitssystem und dazugehöriges betriebsverfahren
WO2008030104A1 (en) * 2006-09-07 2008-03-13 Lumex As Relative threshold and use of edges in optical character recognition process
WO2009070032A1 (en) * 2007-11-28 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
US8351720B2 (en) * 2008-04-24 2013-01-08 Hewlett-Packard Development Company, L.P. Method and system providing edge enhanced image binarization
US8170291B2 (en) * 2008-05-09 2012-05-01 The United States Postal Service Methods and systems for analyzing the quality of digital signature confirmation images
TWI386030B (zh) * 2008-06-11 2013-02-11 Vatics Inc 一種混合式連結元件標籤演算法
US8442348B2 (en) * 2008-11-06 2013-05-14 Seiko Epson Corporation Image noise reduction for digital images using Gaussian blurring
US8675060B2 (en) 2009-08-28 2014-03-18 Indian Institute Of Science Machine vision based obstacle avoidance system
US20110149753A1 (en) * 2009-12-21 2011-06-23 Qualcomm Incorporated Switching between media broadcast streams having varying levels of quality
US8693743B1 (en) 2010-02-19 2014-04-08 Olive Tree Media, LLC Analysis and display of multiple biomarker co-expression in cells and tissues
CN101807253B (zh) * 2010-03-22 2012-07-25 南京工程学院 面向输电线路基于区域宽度信息的图像骨架提取方法
US8977629B2 (en) * 2011-05-24 2015-03-10 Ebay Inc. Image-based popularity prediction
AU2013343203B2 (en) * 2012-11-08 2019-08-15 Totalenergies Onetech Method for processing an image
JP5939154B2 (ja) * 2012-12-27 2016-06-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
CN104036498B (zh) * 2014-05-28 2017-01-11 杭州电子科技大学 一种基于逐层分级的oct图像质量快速评价方法
JP6642970B2 (ja) * 2015-03-05 2020-02-12 キヤノン株式会社 注目領域検出装置、注目領域検出方法及びプログラム
US9367899B1 (en) * 2015-05-29 2016-06-14 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method
US9710911B2 (en) * 2015-11-30 2017-07-18 Raytheon Company System and method for generating a background reference image from a series of images to facilitate moving object identification
DE102016004549A1 (de) * 2016-04-15 2017-11-02 Noventi Gmbh Verfahren zu Erkennung von gedruckten Texten auf Dokumenten
CN106775548B (zh) * 2016-11-25 2018-02-23 北京小米移动软件有限公司 页面处理方法及装置
US10242449B2 (en) 2017-01-04 2019-03-26 Cisco Technology, Inc. Automated generation of pre-labeled training data
CN111368837B (zh) * 2018-12-25 2023-12-05 中移(杭州)信息技术有限公司 一种图像质量评价方法、装置、电子设备及存储介质

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3715724A (en) * 1969-12-24 1973-02-06 Olivetti & Co Spa Apparatus for recognizing graphic symbols
US4003999A (en) * 1972-10-25 1977-01-18 A. H. Robins Company, Incorporated Aspirin-tea coprecipitates for treating inflammation
US4119947A (en) * 1977-07-20 1978-10-10 Howard Noyes Leighton Optical signal processor
DE3107521A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen
GB2103449B (en) * 1981-06-29 1985-05-30 Nippon Telegraph & Telephone Method and apparatus for gray level signal processing
JPS5960690A (ja) * 1982-09-30 1984-04-06 Toshiba Corp 2値化装置
JPS60146378A (ja) * 1984-01-11 1985-08-02 Matsushita Electric Ind Co Ltd 画像認識装置
JPS6158087A (ja) * 1984-08-29 1986-03-25 Nec Corp 画像領域分割装置
DE3650496T2 (de) * 1985-04-17 1996-10-31 Hitachi Ltd Bildverarbeitungsgerät
JPS61276080A (ja) * 1985-05-31 1986-12-06 Toshiba Corp 上下判定装置
US4837450A (en) * 1985-07-01 1989-06-06 Canon Kabushiki Kaisha Apparatus for reading a film image with controllable illumination and threshold value
US4742556A (en) * 1985-09-16 1988-05-03 Davis Jr Ray E Character recognition method
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4809308A (en) * 1986-02-20 1989-02-28 Irt Corporation Method and apparatus for performing automated circuit board solder quality inspections
CA1268547A (en) * 1986-03-31 1990-05-01 Ahmed Mostafa El-Sherbini Thresholding algorithm selection apparatus
US4794239A (en) * 1987-10-13 1988-12-27 Intermec Corporation Multitrack bar code and associated decoding method
US4924078A (en) * 1987-11-25 1990-05-08 Sant Anselmo Carl Identification symbol, system and method
JPH01137385A (ja) * 1987-11-25 1989-05-30 Matsushita Electric Ind Co Ltd 文字認識装置
JP2727549B2 (ja) * 1988-01-29 1998-03-11 日本電気株式会社 最適画質選択装置
US4929979A (en) * 1988-01-29 1990-05-29 Konica Corporation Method and apparatus for processing image
JPH0746979B2 (ja) * 1988-05-26 1995-05-24 不二製油株式会社 特殊栄養食品
DE3881392T2 (de) * 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
JPH02100575A (ja) * 1988-10-07 1990-04-12 Toshiba Corp 画像処理装置
JPH02196565A (ja) * 1989-01-25 1990-08-03 Eastman Kodatsuku Japan Kk 画像二値化方式
JPH087785B2 (ja) * 1989-05-16 1996-01-29 松下電器産業株式会社 2値化処理装置
US5048096A (en) * 1989-12-01 1991-09-10 Eastman Kodak Company Bi-tonal image non-text matter removal with run length and connected component analysis
JP2935863B2 (ja) * 1989-12-27 1999-08-16 本田技研工業株式会社 ハフ変換装置および方法
JP2768786B2 (ja) * 1990-02-20 1998-06-25 キヤノン株式会社 画像読み取り装置
US5081690A (en) * 1990-05-08 1992-01-14 Eastman Kodak Company Row-by-row segmentation and thresholding for optical character recognition
US5121224A (en) * 1990-06-01 1992-06-09 Eastman Kodak Company Reproduction apparatus with selective screening and continuous-tone discrimination
US5091965A (en) * 1990-07-16 1992-02-25 Sony Corporation Video image processing apparatus
US5086485A (en) * 1990-10-19 1992-02-04 Xerox Corporation Method and apparatus for dynamically setting a background level
JPH04268987A (ja) * 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識装置
JPH04268989A (ja) * 1991-02-25 1992-09-24 Nippon Steel Corp 文字認識方法及び装置
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5268967A (en) * 1992-06-29 1993-12-07 Eastman Kodak Company Method for automatic foreground and background detection in digital radiographic images
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
US5384864A (en) * 1993-04-19 1995-01-24 Xerox Corporation Method and apparatus for automatic determination of text line, word and character cell spatial features
US5444797A (en) * 1993-04-19 1995-08-22 Xerox Corporation Method and apparatus for automatic character script determination
JP2933801B2 (ja) * 1993-06-11 1999-08-16 富士通株式会社 文字の切り出し方法及びその装置
US5452367A (en) * 1993-11-29 1995-09-19 Arch Development Corporation Automated method and system for the segmentation of medical images
US5630037A (en) * 1994-05-18 1997-05-13 Schindler Imaging, Inc. Method and apparatus for extracting and treating digital images for seamless compositing
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
ATE185211T1 (de) * 1995-01-31 1999-10-15 United Parcel Service Inc Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern

Also Published As

Publication number Publication date
DE69604481D1 (de) 1999-11-04
ATE185211T1 (de) 1999-10-15
GR3031478T3 (en) 2000-01-31
DK0807297T3 (da) 2000-04-10
CA2211258A1 (en) 1996-08-08
CA2211258C (en) 2000-12-26
US5889885A (en) 1999-03-30
ES2140825T3 (es) 2000-03-01
WO1996024114A3 (en) 1996-11-28
JPH10506733A (ja) 1998-06-30
EP0807297B1 (de) 1999-09-29
WO1996024114A2 (en) 1996-08-08
EP0807297A2 (de) 1997-11-19
JP3264932B2 (ja) 2002-03-11

Similar Documents

Publication Publication Date Title
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE3689416T2 (de) Mustermerkmalextraktion.
DE69428293T2 (de) Gerät zur bildidentifizierung
DE3633743C2 (de)
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE69029427T2 (de) Verfahren für Objektorientierungserkennung unter Verwendung eines vorwärtsregelenden neuronalen Netzwerkes
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE3879254T2 (de) Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE19953608B4 (de) Vorrichtung und Verfahren zum Erkennen eines Fonts eines Textes in einem Dokumentenverarbeitungssystem
DE2740483A1 (de) Merkmal-detektor
DE2909153A1 (de) Einrichtung zur elektronischen verarbeitung von bild- und/oder zeichenmustern
DE19705757A1 (de) Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE4119091C2 (de) Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens
EP0523407A2 (de) Verfahren zur Klassifikation von Signalen
DE69423607T2 (de) Verfahren zum klassifizieren von bildern mit ausgabeabbildungen
BE1031719B1 (de) Elektronisches Gerät sowie Bilddatenverarbeitungsverfahren und System
DE69130535T2 (de) Schriftzeichenerkennungsverfahren und -vorrichtung zur lokalisierung und ermittlung vorbestimmter daten eines dokumentes
DE69421487T2 (de) Verfahren zum Vergleichen von Mustern basierend auf der Verwendung von Bildelementmatritzen und Bildelementvektoren
DE69529015T2 (de) Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition
EP0402868A2 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE69432544T2 (de) Verfahren und Gerät zum Wiederauffinden von dynamischen Bildern und zur Verwaltung von Bildern
DE60024535T2 (de) Verfahren zur Zeichentrennung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: STIPPL PATENTANWAELTE, 90482 NUERNBERG