DE69604481T2 - Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern - Google Patents
Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildernInfo
- Publication number
- DE69604481T2 DE69604481T2 DE69604481T DE69604481T DE69604481T2 DE 69604481 T2 DE69604481 T2 DE 69604481T2 DE 69604481 T DE69604481 T DE 69604481T DE 69604481 T DE69604481 T DE 69604481T DE 69604481 T2 DE69604481 T2 DE 69604481T2
- Authority
- DE
- Germany
- Prior art keywords
- image
- value
- contrast
- bin
- binary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Character Discrimination (AREA)
Description
- Die vorliegende Erfindung betrifft allgemein ein Verfahren und eine Vorrichtung für die parametrisierte Schwellwertbildung von Grauwertbildern, um dem Vordergrund/Hintergrund der ursprünglichen Grauwertbilder entsprechende binäre Schwarz-Weiß-Bilder zu erzeugen, und insbesondere Grauwertbilder, die Textzeichen als Vordergrund enthalten. Die Erfindung enthält ein Verfahren und eine Vorrichtung zum Bestimmen und Wählen des Binärbildes mit der besten Qualität in Fällen, wo mehrere Mengen von Parametern verwendet worden sind, um mehrere Binärbilder zu erzeugen.
- Bei vielen Anwendungen ist es wünschenswert, mit automatischen Mitteln aus einem Bild Textinformationen zu extrahieren. So ist beispielsweise die Verwendung einer Maschine zum Lesen von Adressenetiketten ohne manuellen Eingriff eine arbeits- und kostensparende Methode. Bei einer Methode zum automatischen Lesen von Etikettenadressen wird eine Ladungsspeicherbaustein-Kamera ("CCD" = charge-coupled device) verwendet, um ein Bild des Adressenetikettgebiets zu erfassen. Das von der CCD- Kamera gelieferte n · m-Bild wird als Grauwertbild bezeichnet, da jedes der n · m Bildelemente in dem Bild einen Grauwert zwischen Null und einem größten Wert annehmen kann, wobei Null Schwarz ist, der größte Wert Weiß ist und die Zwischenwerte Grau sind. Der größte Wert wird in der Regel 255 oder 1023 betragen. Bei den meisten Anwendungen zum Lesen von Adressenetiketten muß das Grauwertbild in ein Binärbild umgewandelt werden, wobei Bildelemente nur einen von zwei Werten annehmen, 0 für Schwarz und 1 für Weiß. Bei dem Binärbild entsprechen schwarze Bildelemente dem Vordergrund, gewöhnlich Text, während weiße Bildelemente dem Hintergrund entsprechen. Der Prozeß des Umwandelns von einem Grauwertbild in ein Binärbild wird als Schwellwertbildung bezeichnet. Nachdem bei dem Bild eine Schwellwertbildung durchgeführt worden ist, kann das Etikett unter Verwendung eines Prozesses der optischen Zeichenerkennung ("OCR" = optical character recognition) automatisch gelesen werden.
- Viele übliche Schwellwertbildungsverfahren haben jedoch aufgrund der großen Vielfalt von Etiketten große Schwierigkeiten beim Trennen des Vordergrunds vom Hintergrund auf Adressenetiketten. Etiketten können verschiedenfarbige Hintergründe, mit verschiedenen Farben gedruckten Text, verschmierte Stellen, Flecken, bandbedingte Abbrände, Filmeffekte, Text mit geringem Kontrast, Graphiken und Kunststofffenster aufweisen. Text auf Etiketten kann mit einem Matrixdrucker oder einem Laserdrucker gedruckt, mit der Schreibmaschine geschrieben oder handgeschrieben sein und eine beliebige einer Reihe von Schriften aufweisen. Die Vielfalt von Etiketten macht es für viele Schwellwertbildungsprozesse schwierig, Vordergrundtext angemessen von Hintergrundtext zu trennen und kann viele fehlerhafte Vordergrund-/Hintergrundzuordnungen bewirken. Es kommt zu einer fehlerhaften Zuordnung, wenn einem Hintergrundbildelement ein Wert von 0 (Schwarz) oder einem Vordergrundtextbildelement ein Wert von 1 (Weiß) zugeordnet wird. Im ersteren Fall wird in das resultierende Binärbild Rauschen eingeführt, und dies kann beim automatischen Lesen des Etiketts unter Verwendung von OCR zu Schwierigkeiten führen. Im letzteren Fall wird Text, der in dem Grauwertbild vorhanden war, entfernt, und der OCR- Prozeß kann wieder versagen.
- EP-A-0326436 offenbart ein Verfahren zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, mit den Schritten des Bestimmens des Anteils von Komponenten einer vorbestimmten Größe in den beiden Bildern und des Vergleichens der beiden Anteile.
- Zusätzlich zu der Forderung nach Genauigkeit muß eine automatische Schwellwertbildungstechnik schnell und effizient sein, um als kosteneinsparende Technik wirksam zu sein. Bei vielen Anwendungen werden von Post- und Paketlieferdiensten automatische Etikettenlesegeräte eingesetzt, wobei automatische Systeme Pakete mit einer Rate von bis zu 3600 pro Stunde befördern. Bei dieser Rate muß ein Etikett in weniger als einer Sekunde abgebildet und verarbeitet werden, damit es vollständig ist, bevor die Verarbeitung des nächsten Etiketts beginnen muß. Damit die Schwellwertbildungstechnik in Echtzeit verwendet werden kann, muß es bei dem Grauwertbild eine Schwellwertbildung in einer wesentlich unter einer Sekunde liegenden Zeit durchführen, um den OCR- Techniken Zeit zu geben, das Schwellwert-Textbild zu verarbeiten.
- Es besteht somit ein Bedarf an einem Schwellwertbildungsverfahren und an einer Schwellwertbildungsvorrichtung, die eine Menge schneller Algorithmen zum Trennen von Vordergrundtext von Hintergrund auf eine Weise einsetzen, durch die die Anzahl der Fehlzuordnungen von Vordergrund bzw. Hintergrund auf ein Minimum reduziert wird. Weiterhin besteht ein Bedarf daran, daß das Schwellwertbildungsverfahren und die Schwellwertbildungsvorrichtung adaptierbar ist, so daß es bzw. sie sich auf die große Vielfalt von Zeichenschriftarten und anderen Unterschieden bei der Textpräsentation einstellen kann.
- Bei der Erfindung handelt es sich um ein Verfahren und eine Vorrichtung zum Produzieren eines Binärbildes hoher Qualität, an dem eine Schwellwertbildung durchgeführt worden ist, aus einem Grauwertbild. Bei einer bevorzugten Ausführungsform besteht das Verfahren aus zwei Stufen. Bei der ersten Stufe wird aus dem ursprünglichen Grauwertbild eine Anzahl von Kandidatenbinäretikettenbildern erzeugt. Jedes Kandidatenbild wird erzeugt, indem eine andere Menge von Schwellwertbildungsprozeßparametern auf ein Zwischen bild (das Kontrastbild), das aus dem ursprünglichen Grauwertetikettbild durch Verwenden lokaler und globaler Kontrastinformationen konstruiert worden ist, angewendet wird. Bei der zweiten Stufe werden die Kandidatenbinärbilder verglichen, und das Binärbild mit der besten Qualität wird gewählt. Die Erfindung wird als Label Adaptive Thresholding ("LAT" = Adaptive Etikettenschwellwertbildung) bezeichnet, da sie sich auf viele verschiedene Arten von Etiketten und Zeichen auf den Etiketten einstellt.
- Das Verfahren zum Konstruieren des Zwischenkontrastbilds entsprechend einem Grauwertbild umfaßt die Schritte: Wählen einer Position (i, j) in dem Kontrastbild, wobei i die Zeile der Position in dem Kontrastbild und j die Spalte bezeichnet; Finden des kleinsten Graustufenwerts MINij aller Grauwertbildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Zeilen- und Spaltenposition in dem Grauwertbild; Finden des größten Graustufenwert MAXij aller Grauwertbildelemente in dem gleichen rechteckigen Fenster; Berechnen des lokalen Kontrasts LCij des Grauwertbilds durch die Formel
- LCij = C (1 - (MINij + p) / (MAXij + p)),
- wobei C ein vorgewählter maximaler Kontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen eines Graustufenwert gleich LCij zu der (i, j)-Position des Kontrastbilds; und Wiederholen der obigen Schritte für jede Position, die einem Abschnitt des Grauwertbilds, an dem eine Schwellwertbildung durchgeführt werden soll, entspricht.
- Als Teil des Prozesses des Erzeugens eines Kandidatenbinärbilds, an dem eine Schwellwertbildung durchgeführt worden ist, wird ein kleinster zulässiger Kontrastwert gewählt. Das Verfahren zum Wählen dieses Werts umfaßt die Schritte: Konstruieren eines Kontrasthistogramms für alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als ein vorgewählter Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch einen vorgewählten Spitzen-Breiten- Nennwert getrennt sind; Wählen der Minimaltextspitze unter den gefundenen Spitzen durch Auffinden der Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als ein vorgewählter Minimalkontrastwert; und Erhalten des kleinsten zulässigen Kontrastwerts durch Subtrahieren eines vorgewählten Text-Spitzen-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze. Die vorgewählten Werte für den Spitzen-Boden-Pegelwert, den Spitzen-Breiten-Nennwert, den Minimalkontrastwert und den Text-Spitzen-Breiten- Nennwert umfassen zusammen mit den beiden unten beschriebenen Grenzwerten eine Menge von Schwellwertbildungsprozeßparametern.
- Schließlich wird ein Kandidatenbinärbild konstruiert, indem jedem Bildelement im Hintergrund eine 1 und jedem Bildelement im Vordergrund eine 0 zugeordnet wird. Die Bildelemente eines Grauwertbilds werden zwischen einer Hintergrundklasse und einer Vordergrundklasse durch ein Verfahren aufgeteilt, das aus den Schritten besteht: Finden des kleinsten Graustufenwerts MINij aller Bildelemente in einem rechteckigen Fenster mit der Mitte auf dem Bildelement; Finden des größten Graustufenwerts MAXij aller Bildelemente in dem rechteckigen Fenster; Berechnen des örtlichen Kontrasts LCij durch die Formel
- LCij = C(1 - (MINij + p) / (MAXij + pf),
- wobei C ein vorgewählter Maximalkontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen des Bildelements zu der Hintergrundklasse, wenn LCij kleiner ist als ein vorgewählter kleinster zulässiger Kontrastwert. Die vorausgegangenen Schritte sind die gleichen wie diejenigen, die zum Berechnen des Kontrastbilds erforderlich sind; wenn das Kontrastbild konstruiert worden ist, brauchen die Schritte nicht wiederholt zu werden.
- Für durch den Vergleich des örtlichen Kontrasts mit dem kleinsten zulässigen Kontrastwert der Hintergrundklasse nicht zugeordnete Bildelemente wird die Differenz zwischen MAXij und MINij berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Maximum-Minimum-Differenz kleiner als ein vorgewählter kleinster Kontrastskalenwert ist. Wenn das Bildelement immer noch nicht der Hintergrundklasse zugeordnet wird, wird die Differenz zwischen MAXij und dem Graustufenwert des Bildelements berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Differenz Maximum zu Bildelementwert kleiner ist als ein vorgewählter Kontrastüberschuß-Nennwert. Wenn das Bildelement durch die obigen Schritte nicht der Hintergrundklasse zugeordnet wird, dann wird das Bildelement der Vordergrundklasse zugeordnet.
- Die Erfindung sieht die Verwendung von zwei oder mehr Mengen von Schwellwertbildungsprozeßparametern, die zwei oder mehr Kandidatenbinärbilder liefern, vor. Um zwischen zwei beliebigen Kandidatenbinärbildern, die einer Schwellwertbildung unterzogen wurden, eines ursprünglichen Grauwertbilds zu wählen, verwendet die Erfindung ein Verfahren, das die Schritte umfaßt: Umwandeln der Abschnitte der Binärbilder entsprechend dem Vordergrund in ein lauflängencodiertes Bild (RLE- Bild); Bestimmen der Anzahl und Größe der Stücke (d. h. die Stückgrößenverteilung) der RLE-Bilder unter Verwendung von Stückextrahierung; Konstruieren von Histogrammen der Stückgrößenverteilungen der RLE- Bilder; und Verwendung des Histogramms für statistische oder Neuronennetzanalyse, um eines der beiden Binärbilder zu wählen. Wenn mehr als zwei Binärbilder vorliegen, wird dieses Verfahren paarweise angewendet, bis alle Binärbilder mit Ausnahme von einem eliminiert worden sind. Die Verwendung von RLE-Bildern ist fakultativ, doch wird durch ihre Verwendung die Verarbeitungszeit im Gegensatz zu der Technik, die die Stückgrößenverteilungen aus den Binärbildern in Positionsdarstellungen bestimmt, stark reduziert.
- Die Stückgrößenverteilung eines Binärbilds ist eine Spezifikation der Anzahl von Stücken nach Größe für Stücke jedes Binärbilds mit dem einen oder dem anderen der beiden Werte des Binärbilds. Die Stückgrößenverteilung kann für einfache Vergleiche von zwei Binärbildern verwendet werden, selbst wenn es um keine Qualitätswahl geht.
- Somit besteht eine Aufgabe der vorliegenden Erfindung in der Bereitstellung eines Verfahrens und einer Vorrichtung zur schnellen Schwellwertbildung eines Grauwertbilds.
- Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, die Informationen über den örtlichen Kontrast in einem Grauwertbild verwendet, um Text in dem Bild eindeutig zu identifizieren.
- Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, um unter zwei oder mehr Kandidatenbinärbildern, die durch Schwellwertbildung aus einem textenthaltenden ursprünglichen Grauwertbild gewonnen wurden, dasjenige Binärbild zu wählen, das im Vordergrund Text und im Hintergrund keinen Text am besten darstellt.
- Eine weitere Aufgabe der vorliegenden Erfindung besteht in der automatischen Verarbeitung von Etiketten mit schlechter Lesbarkeit, um ein Binärbild hoher Qualität für die OCR-Eingabe zu erzeugen.
- Die vorliegende Erfindung erfüllt diese Aufgaben und überwindet die Nachteile des Standes der Technik, wie aus der ausführlichen Beschreibung der nachfolgenden Ausführungsformen hervorgeht.
- Fig. 1 zeigt die Hauptschritte und den Datenfluß einer Ausführungsform des Verfahrens der Erfindung.
- Fig. 2 zeigt die Hauptschritte und den Datenfluß, die mit der Schwellwertbildungstechnik einer Ausführungsform des Verfahrens der Erfindung verbunden sind.
- Fig. 3 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MIN-Bilds.
- Fig. 4 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MAX-Bilds.
- Fig. 5 veranschaulicht die Konstruktion des Kontrastbilds aus dem MIN- und MAX-Bild.
- Fig. 6 zeigt ein typisches Kontrasthistogramm und veranschaulicht die verschiedenen, mit einer Ausführungsform des Verfahrens der Erfindung verbundenen Schwellwertbildungsprozeßparameter.
- Fig. 7 zeigt ein beispielhaftes Binärbild, um die Reduktion bei den Repräsentationsdaten zu veranschaulichen, die sich aus der Umwandlung des Binärbilds in ein lauflängencodiertes (RLE-)Format ergibt.
- Fig. 8 zeigt ein Grauwertbild eines beispielhaften Etiketts.
- Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer Menge von Schwellwertbildungsparametern.
- Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer zweiten Menge von Schwellwertbildungsparametern.
- Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer dritten Menge von Schwellwertbildungsparametern.
- Fig. 12 ist ein Blockschaltbild der Hauptkomponenten einer bevorzugten Ausführungsform der Vorrichtung der Erfindung.
- Fig. 1 ist ein Blockschaltbild des Gesamtprozesses und des Datenflusses einer Ausführungsform der Erfindung. Fig. 2 ist ein Blockschaltbild der Hauptschritte und des Datenflusses in Stufe Eins einer Ausführungsform der Erfindung. In Block 1 von Fig. 1 beginnt Stufe Eins des Prozesses, wenn digitale Daten erfaßt werden, die ein Grauwertbild darstellen. Das Grauwertbild weist n · m Bildelemente auf, die n Zeilen und m Spalten von Bildelementen darstellen, jeweils mit einem Graustufenwert von 1 bis zu dem von der Einrichtung, die das Bild erzeugt, bereitgestellten Maximum. Bei der Einrichtung handelt es sich vorzugsweise um eine CCD-Kamera, und die Grauwerte des Bildelements variieren von 0 (Schwarz) zu 255 (Weiß). Ebenfalls in Block 1 von Fig. 1 werden aus dem Grauwertbild drei getrennte Bilder mit n · m Bildelementen konstruiert: das MIN-Bild; das MAX-Bild und das Kontrastbild. Das Bildelement in Zeile i und Spalte j in dem MIN-Bild enthält den kleinsten Graustufenwert in einem kleinen Bereich, vorzugsweise einem rechteckigen Kasten, um Zeile i und Spalte j des Grauwertbilds herum. Bei dieser Spezifikation werden Zeile i und Spalte j eines Bilds auch als die (i, j)- Position eines Bilds bezeichnet. Das MAX-Bild wird unter Verwendung von Maximalwerten anstatt Minimalwerten analog konstruiert. Das Bildelement bei der (i, j)-Position des Kontrastbilds wird aus den Werten in den (i, j)-Positionen in dem MIN- und dem MAX-Bild algebraisch berechnet. Außerdem wird ein Histogramm der Werte in dem Kontrastbild berechnet. Diese Schritte sind in den Blöcken 1 bis 4 in Fig. 2 ausführlicher gezeigt. Wie im Block 2 von Fig. 1 und Block 6 von Fig. 2 gezeigt, wird an dem Kontrasthistogramm eine Spitzenanalyse unter Verwendung einer Menge von Schwellwertbildungsparametern durchgeführt. Mit den Ergebnissen der Spitzenanalyse wird ein Minimalkontrastwert gewählt, so daß, wie im Block 7 von Fig. 2 gezeigt, an dem Kontrastbild eine Schwellwertbildung durchgeführt werden kann. Wie im Block 8 von Fig. 2 gezeigt, wird das Kontrastbild, an dem eine Schwellwertbildung durchgeführt wurde, zusammen mit dem ursprünglichen Grauwertbild, dem MIN- Bild, dem MAX-Bild und dem Kontrastbild selbst verwendet, um ein Binärbild zu liefern.
- Fig. 2 zeigt auch den Datenfluß, der mit der Konstruktion und Verwendung der verschiedenen Zwischenkonstruktionen des Verfahrens, wie beispielsweise dem MIN-Bild, dem MAX-Bild und dem Kontrastbild und dem Kontrasthistogramm verbunden ist. Falls erforderlich, können die in einem Schritt des Verfahrens erzeugten Daten die Verarbeitung von einem Verfahrensschritt zu dem nächsten Verfahrensschritt begleiten. So ist beispielsweise die Konstruktion des MIN-Bilds, des MAX- Bilds und des Kontrastbilds erforderlich, um das Kontrasthistogramm zu bilden und die Histogrammspitzenanalyse gemäß der Erfindung durchzuführen. Jedoch werden diese drei Bilder, nachdem sie konstruiert worden sind, möglicherweise in den abschließenden Schritten der Spitzenanalyse und der Schwellwertbildung des ursprünglichen Grauwertbilds wieder verwendet. Die dicken Linien von Fig. 2 zeigen, wie die Daten für das ursprüngliche Grauwertbild, das MIN-Bild, das MAX-Bild und das Kontrastbild zur Verwendung durch spätere Schritte in dem Verfahren verfügbar gemacht werden. Das Erkennen der doppelten Verwendung dieser Zwischenbilder und des Designs des Schwellwertbildungsverfahrens zur Wiederverwendung der Zwischenbilder, anstatt sie zu rekonstruieren, stellt einen wichtigen Teil der durch die Erfindung erzielten Zeiteinsparungen und Geschwindigkeit dar.
- Stufe Zwei der Erfindung beginnt mit den in Stufe Eins produzierten Binärbildern. Fig. 1 zeigt eine bevorzugte Betriebsart, in der drei Mengen von Schwellwertbildungsprozeßparametern verwendet werden, um drei Binärbilder zu erzeugen, an denen eine Schwellwertbildung durchgeführt wurde. Wenn gewünscht wird, zusätzliche Mengen von Prozeßparametern zu verwenden, dann würden die durch Blöcke 2 bis 5 von Fig. 1 dargestellten Schritte für jede Menge von Prozeßparametern wiederholt werden.
- Jedes Binärbild wird in Block 3, 7 und 11 von Fig. 1 in eine lauflängencodierte Form (RLE-Form) umgewandelt. Als nächstes wird in den Blöcken 1, 8 und 12 eine Stückextrahierung durchgeführt, um Anzahl und Größe der verbundenen Komponenten zu bestimmen. In den Blöcken 5, 9 und 13 wird für jedes Bild ein Histogramm der Stückgrößenverteilung konstruiert. In Block 14 werden die Stückgrößenhistogramme und die RLE-Bilder verwendet, um das Binärbild mit der höchsten Qualität zu wählen. In Fig. 1 zeigen die dicken Linien, zusätzlich zu dem normalen Datenfluß von einem Verfahrensschritt zum nächsten, den Datenfluß, der mit dem Liefern der RLE-Daten für jedes Binärbild direkt an den letzten Schritt im Block 14 verbunden ist.
- Für höchste Geschwindigkeit kann das Verfahren der Erfindung an einem Vektorprozessor realisiert werden. Der Vektorprozessor verwendet vorzugsweise eine Auswahl von 150/40-Verarbeitungsmodulen der Firma Imaging Technology, Inc. Die 150/40-Module können, wie in Fig. 12 gezeigt, über einen VME-Bus zusammengeschaltet sein. An den VME-Bus können auch ein oder mehrere allgemeine Prozessoren 21, 22 und 23, wie zum Beispiel der von der Firma Heurikon Corporation vertriebene Prozessor Nitro60 angeschlossen sein. Ein Bildmanager 31, wie zum Beispiel das von der Firma Imaging Technology Inc. vertriebene Modul IMA 150/40, und eine Rechenmodulsteuerung 41, wie beispielsweise das ebenfalls von der Firma Imaging Technology Inc. vertriebene Modul CMC 150/40, können ebenfalls an den VME-Bus angeschlossen sein. Das Verfahren der Erfindung kann in der Sprache C codiert werden und zur Installation auf den Nitro60-Prozessoren 21, 22 und 23 und den anderen verarbeitenden Modulen auf dem VME-Bus querkompiliert sein. Ein Nitro60-Prozessor 21 kann eine Maussteuerleitung 25 und einen R5232-Port 26 zur Bereitstellung von Bedienersteuerung über das System aufweisen. Ein Nitro60-Prozessor 21 kann auch Datenports wie zum Beispiel einen SCSI-2-Port 28 und einen Ethernet-Port 29 aufweisen. Das IMA-150/40-Modul 31 stellt vorzugsweise vier Megabyte an Speicher zum Speichern von bis zu vier 1024 · 1024 Bildern bereit und liefert die Gesamttaktsteuerung an die Pipeline- Hardware. Das IMA-150/40-Modul 31 läßt auch bis zu drei Tochterplatinen 32, 33 und 34, unten erörtert, zu. Das CMC-150/40-Modul 41 arbeitet wie ein Pipeline- Schaltmodul, läßt bis zu drei Tochterplatinen 42, 43 und 44 zu und leitet Bilder zu etwaigen Tochterplatinen und von diesen weg. Das IMA-150/40-Modul 31 und das CMC-150/40-Modul 41 sind über einen Bildelementbus 71 separat zusammengeschaltet.
- Drei Tochterplatinen sind auf dem IMA-150/40- Modul 31 montiert. Die AMDIG-Tochterplatine 34 erhält Grauwertbilddaten von der CCD-Kamera, vorzugsweise einer Kamera KodakTM Megaplus 1.4, und leitet die Bilddaten zu einem entsprechenden Speichergebiet in dem IMA-150/40-Modul 31. Die AMDIG-Tochterplatine 34 kann die Eingangsbilddaten gegebenenfalls auch skalieren. Die DMPC-Tochterplatine 32 kann über einen hochauflösenden RGB-Monitor 61 eine Anzeige jedes beliebigen Bilds bereitstellen. Die MMP-Tochterplatine 33 ist ein morphologischer Prozessor, der automatisch das MAX- und MIN-Bild liefert, wenn ihm ein Grauwertbild und eine Rechteckkastengröße geliefert wird. Auf dem CMC-150/40-Modul 41 sind drei zusätzliche Tochterplatinen montiert. Die HF-Tochterplatine 43 ist ein Histogramm- und Merkmalsextrahierer, der, wenn ihm ein Binärbild geliefert wird, automatisch ein Histogramm aus 256 Behältern liefert. Der Merkmalsextrahierer kann auch verwendet werden, um automatisch RLE-Bilder zu erzeugen. Die CLU- Tochterplatine 44 ist ein Convolver und Logikprozessor, der automatisch das Kontrastbild liefert. Die PA- Tochterplatine 42 ist ein separater Digitalsignalprozessor, der parallel zu der Pipeline- Verarbeitung asynchron als Coprozessor arbeitet. Diese Tochterplatine wird verwendet, um das Qualitätsschätzverfahren zu liefern: Empfangen mehrerer RLE-Bilder, Wählen des besten RLE-Bilds und Liefern der Daten für das beste RLE-Bild zu einem der Nitro60- Prozessoren 21, 22 und 23 zur OCR-Verarbeitung. Die gesamte Hardwarekonfiguration in Fig. 12 arbeitet mit der Geschwindigkeit von 40 Megabildelementen pro Sekunde, was impliziert, daß ein ein Megabyte großes Bild (1024 · 1024 Bildelemente) zur Verarbeitung etwa 28 Millisekunden erfordert. Bei dieser Geschwindigkeit sind weniger als 0,5 Sekunden erforderlich, um drei parametrische Schwellwertbildungen eines einzelnen 1024 · 1024-Grauwertbilds zu konstruieren und für die OCR- Verarbeitung das Binärbild, an dem eine Schwellwertbildung durchgeführt wurde und das die beste Qualität aufweist, zu wählen.
- Das Verfahren der Erfindung kann auch auf jedem beliebigen Digitalrechner mit ausreichend Speicher zum Aufnehmen des ursprünglichen Grauwertbilds, der Zwischenverarbeitungsbilder (das MIN-Bild, das MAX-Bild und das Kontrastbild) und mindestens zwei binärer Bilder, an denen eine Schwellwertbildung durchgeführt wurde, realisiert werden. Das Programmieren des Verfahrens auf einem Digitalrechner kann in der C- Sprache oder jeder vergleichbaren Verarbeitungssprache durchgeführt werden.
- Aus dieser Übersicht beschreiben wir nun das gesamte Verfahren ausführlich. An einer gegebenen Stelle (i, j) in dem Grauwertetikettenbild wird durch die folgende Vorgehensweise ein örtlicher Kontrast erhalten:
- Schritt 1. Finde den kleinsten Graupegelwert (MINij) in einem k · k-Fenster mit der Mitte bei (i, j).
- Schritt 2. Finde den größten Graupegelwert (MAXij) in dem gleichen Fenster.
- Schritt 3. Der örtliche Kontrast LC bei (i, j) wird berechnet als:
- LCij - C · (1 - (MINij + p) / (MAXij + p))
- Der Wert C wird auf der Grundlage des gewünschten größten Werts für den örtlichen Kontrast gewählt. Bei Grauwertbildern mit hohem Kontrast kann ein kleiner Wert von C möglicherweise ausreichen, um zwischen Vordergrund und Hintergrund zu differenzieren. Bei Grauwertbildern mit niedrigem Kontrast kann eine größere Differenzierung beim Kontrast notwendig sein, um zwischen Vordergrund und Hintergrund zu wählen. Für C wird ein Wert von 255 bevorzugt. Dieser Wert funktioniert bei den meisten Grauwertbildern und gestattet, die Werte des Kontrastbilds eines pro 8-Bit- Byte zu speichern. Der Wert p wird so gewählt, daß er positiv und im Vergleich zu C klein ist. Seine Hauptrolle besteht darin, vor Dividieren durch Null zu schützen, und er sollte so gewählt werden, daß er eine schnelle Berechnung des Werts des örtlichen Kontrasts erleichtert. Eins ist ein bevorzugter Wert für p.
- Die obige Formel für örtlichen Kontrast führt zu einem großen örtlichen Kontrast LCij, wenn zwischen dem kleinsten und größten Bildelement in dem k x k- Fenster bei einem Graupegel eine große Differenz vorliegt. Der Wert des örtlichen Kontrasts kann zwischen 0 und C variieren, wobei 0 der kleinste Kontrast und C der größte Kontrast ist. Es ist nicht erforderlich, daß der größte Kontrastwert der gleiche ist wie der größtmögliche Bildelementwert in dem ursprünglichen Grauwertbild. Der bevorzugte maximale Kontrastwert beträgt jedoch 255, und dieser Wert wird im Rest der ausführlichen Beschreibung verwendet.
- Es wird ein neues Bild erstellt, das das Kontrastbild genannt wird und das die Informationen über den örtlichen Kontrast enthält. Für jedes Grauwertbildelement bei (I, j) in dem ursprünglichen Etikettenbild wird ein entsprechendes Bildelement in dem Kontrastbild vom Wert her gleich LCij gesetzt. Jedem Bildelement in dem Kontrastbild ist auf diese Weise ein Wert zwischen null und dem größten Kontrast zugeordnet. Analog dazu werden die beiden anderen neuen Bilder erzeugt, das MIN-Bild und das MAX-Bild. Das Bildelement in der (i, j)-Position des MIN-Bilds hat den Wert MINij, und das Bildelement in der entsprechenden Position in dem MAX-Bild hat den Wert MAXij.
- Der Fenstergrößenparameter k wird bestimmt, indem die größte zulässige Strichstärke für ein Textzeichen gefunden wird. Beispielsweise weist ein Zeichen bei einer Schrift von 8 Punkten bei 250 Punkten pro Inch eine Strichstärke von etwa 3 Bildelementen auf. Bei der gleichen Auflösung weist ein Zeichen bei einer Schrift von 18 Punkten eine Strichstärke von etwa 14 Bildelementen auf. Der Wert k wird dann geringfügig größer als diese größte zulässige Stärke eingestellt. Um beispielsweise für ein Etikett mit einer Schrift mit 18 Punkten hohe Textkontrastwerte zu haben, muß die Abmessung k des Fensters größer als 14 Bildelemente sein. Wenn die Abmessung kleiner ist als dieser Betrag, dann wird für Bildelemente, die sich in der Mitte eines Zeichenstrichs befinden, ein sehr niedriger Kontrastwert erhalten, da alle Graustufenwerte innerhalb des in der Mitte angeordneten k · k-Fensters fast gleich sein werden. Bei einigen Anwendungen bzw. Zeichenschriften kann möglicherweise die Verwendung eines rechteckigen Fensters der Größe k · j, wobei k und j verschiedene Werte aufweisen, vorzuziehen sein. Eine bevorzugte Fenstergröße ist ein Quadrat von 15 Bildelementen mal 15 Bildelementen. Diese Fenstergröße gestattet die Verarbeitung von Zeichen in jeder Drehausrichtung bis zu einer Schriftgröße von 18 Punkten.
- In Fig. 3, 4 und 5 sind Beispiele gezeigt, die die Ableitung der Bildelementwerte für das MIN- Bild, das MAX-Bild und das Kontrastbild zeigen. In allen drei Fällen wird eine quadratische Fenstergröße verwendet, und k ist so gewählt, daß es einen Wert von 3 aufweist. In Fig. 3 werden die Bildelementwerte des ursprünglichen Grauwertbilds im oberen Abschnitt der Figur in der linken oberen Ecke gezeigt; der kleinste Bildelementwert von "3" in einem 3 · 3-Quadrat um die (2,2)-Position herum bestimmt, daß die (2,2)-Position des MIN-Bilds einen Wert von "3" aufweist. Analog dazu wird die (6,6)-Position des MIN-Bilds als "195" bestimmt. An den Rändern des Grauwertbilds enthält das Fenster Gebiete außerhalb des Grauwertbilds. Der Bildelementwert für ein beliebiges Gebiet außerhalb des ursprünglichen Bilds wird als Null angesehen.
- In Fig. 4 ist zu sehen, daß die (2,2)-Position des MAX-Bilds einen Wert von "39" aufweist, während die (6,6)-Position einen Wert von "231" aufweist. Fig. 5 veranschaulicht, wie die Ableitung des MIN-Bilds und des MAX-Bilds durch algebraische Berechnung direkt zu dem Kontrastbild führt.
- Um das Kontrasthistogramm zu konstruieren, wird eine Menge von 256 Behältern erzeugt, die jeweils einem der Kontrastpegel (0-255) entsprechen. Nacheinander wird jedes Bildelement in dem Kontrastbild untersucht, und der dem Bildelementwert entsprechende Behälter wird um Eins erhöht. Dies bildet das Kontrasthistogramm, das einen Zählwert der Anzahl von Bildelementen in dem Bild, die Bildelementwerte bei jedem Graupegel aufweisen, darstellt. Ein Beispiel für ein Kontrasthistogramm ist in Fig. 6 gezeigt.
- Spitzen in dem Kontrasthistogramm entsprechen Teilen des Grauwertetikettenbilds, die ähnlichen Kontrast aufweisen. Es handelt sich im allgemeinen bei diesen Teilen bzw. Kontrastsegmenten um ähnliche Arten von Text, Graphik oder Rauschen. Die Spitzenanalyse ist der Prozeß, bei dem bestimmt wird, welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Text handelt, und welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Hintergrund oder Rauschen handelt. Das Ergebnis der Spitzenanalyse hilft bei der korrekten Zuordnung von 0 (Schwarz) für Textbildelemente und 1 (Weiß) für Hintergrund- bzw. Rauschbildelemente.
- Bei der Spitzenanalyse lautet die zugrundeliegende Annahme, daß bei einem gegebenen Etikett der Kontrastwert für Kontrastsegmente entsprechend Hintergrundbildelementen und Rauschbildelementen im Durchschnitt kleiner ist als die Werte für die Vordergrund/Textbildelemente. Es gibt jedoch eine Reihe von Schwierigkeiten, zu denen es aufgrund der Vielfalt von Etiketten kommt. Diese Schwierigkeiten sind wie folgt aufgezählt:
- 1. Die Anzahl der Kontrastelemente ist veränderlich. Deshalb ist die Anzahl der Kontrastspitzen in dem Kontrasthistogramm veränderlich. Dies bedeutet auch, daß es mehrere Hintergrund- oder Rauschspitzen sowie mehrere Textspitzen geben kann.
- 2. Der durchschnittliche Kontrastwert für ein Kontrastsegment ist veränderlich. Deshalb ist die Stelle von Kontrastspitzen in dem Kontrasthistogramm veränderlich.
- 3. Die Anzahl der Bildelemente in einem Kontrastsegment ist veränderlich. Deshalb ist die Höhe einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
- 4. Die Verteilung von Kontrastwerten um den durchschnittlichen Kontrastwert in einem Kontrastsegment herum ist veränderlich. Deshalb ist die Breite einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
- Bei einem gegebenen Kontrasthistogramm mit mehreren Spitzen mit verschiedenen Höhen, Breiten und Stellen besteht das Ziel der Spitzenanalyse darin, einen Kontrastwert zu finden, der als der kleinste zulässige Kontrast bezeichnet wird, so daß einem beliebigen Bildelement mit einem Kontrastwert unter diesem Wert automatisch ein Wert von 1 (Hintergrund oder Rauschen) zugeordnet wird.
- Zur Bewältigung dieser Aufgabe wird eine Menge von Schwellwertbildungsprozeßparametern zur Analyse des Kontrasthistogramms verwendet. Diese Parameter sind: (1) Spitzen-Boden-Pegel, (2) Minimalkontrastwert, (3) Spitzen-Breiten-Nennwert und (4) Text-Spitzen-Breiten- Nennwert. Die Parameter sind in Fig. 6 veranschaulicht.
- Der Spitzen-Boden-Pegel ist die kleinste Höhe, die eine Kontrasthistogrammspitze aufweisen kann. Etwaige Kontrasthistogrammspitzen, die unter dem Spitzen-Boden-Pegel liegen, werden als möglichen Textkontrastsegmenten nicht entsprechend betrachtet. Der Spitzen-Boden-Pegel variiert in der Regel von 800 bis 1200 und ist vorzugsweise für ein Bild mit einer Größe von 1024 · 1024 Bildelementen auf 1100 eingestellt.
- Der Minimalkontrastwert ist der kleinste Wert, den ein Kontrastbildelement aufweisen kann und immer noch als Teil eines Textkontrastsegments betrachtet werden kann. Er hat vorzugsweise einen Wert von 25 bis 75, wenn C einen Wert von 255 aufweist.
- Der Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden. Er weist vorzugsweise einen Wert von 50 bis 75 auf, wenn C einen Wert von 255 aufweist.
- Der Text-Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht. Er weist vorzugsweise einen Wert von 25 bis 75 auf, wenn C einen Wert von 255 aufweist.
- Der Prozeß der Spitzenanalyse für das Kontrasthistogramm ist ein Prozeß zur Ermöglichung der Schwellwertbildung bei dem Kontrastbild durch Bestimmen eines kleinsten zulässigen Kontrasts. Dieser Prozeß ist wie folgt:
- Schritt 1. Spitzensuche: Finde den Kontrasthistogramm-Kontrastwert mit der größten Anzahl von Bildelementen. Dies ist die größte aktuelle Spitze.
- Schritt 2. Spitzenbewertung: Wenn die Spitzenhöhe nicht größer ist als der Spitzen-Boden- Pegel, gehe zu Schritt 6. Die Spitze wird nicht zugelassen, da sie zu kurz ist.
- Schritt 3. Spitzenspeicherung: Speichere den Spitzenkontrastwert.
- Schritt 4. Spitzensperrung: Sperre die Spitzensuche innerhalb des Spitzen-Breiten-Nennwerts dieser Spitze und aller vorausgegangener Spitzen.
- Schritt 5. Gehe zu Schritt 1.
- Schritt 6. Spitzenwahl: Finde die gespeicherte Spitze, die sich bei dem kleinsten Kontrastwert befindet, der größer ist als der Minimalkontrastwert. Dies wird als die Minimaltextspitze bezeichnet.
- Schritt 7. Schwellwertbestimmung: Subtrahiere den Text-Spitzen-Breiten-Nennwert von dem Kontrastwert der Minimaltextspitze. Dies ist der kleinste zulässige Kontrast.
- Die Anwendung des Prozesses der Spitzenanalyse auf das in Fig. 6 gezeigte Kontrasthistogramm führt zu der Identifizierung von drei Textspitzen: Spitze 2, Spitze 3 und Spitze 4. Spitze 3 ist die Minimaltextspitze. Die Identifizierung von Spitze 3 gestattet die Bestimmung des kleinsten zulässigen Kontrasts, wie in Fig. 6 gezeigt.
- Nachdem der kleinste zulässige Kontrast bestimmt worden ist, kann das ursprüngliche Grauwertbild einer Schwellwertbildung unterzogen werden. Wenn das Bildelement bei (i, j) in dem ursprünglichen Bild, seine Werte MINij, MAXjj und LCij gegeben sind, werden die folgenden Schritte unternommen, um zu bestimmen, ob es sich bei dem Bildelement um Vordergrund (Text) oder Hintergrund handelt:
- Schritt 1. Ist LCij größer als der kleinste zulässige Kontrast? Wenn nicht, dann wird das Bildelement bei (i, j) als Hintergrund bezeichnet.
- Schritt 2. Ist MAXij-MINij ausreichend groß? Wenn nicht, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-MIN; mit einem ersten, als Minimalkontrastskala bezeichneten Grenzwert verglichen. Wenn diese Differenz geringer ist, wird das Bildelement als Hintergrund bezeichnet. Der Minimalkontrastskala- Wert liegt vorzugsweise zwischen 20 und 32, wenn C einen Wert von 255 aufweist.
- Schritt 3. Liegt das Bildelement bei (i, j) viel näher an MINij oder näher an MAXij? Wenn ausreichend näher an MAXij, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-(Wert des Bildelements bei (i, j)) mit einem als Kontrastüberschuß-Nennwert bezeichneten zweiten Grenzwert verglichen. Wenn diese Differenz niedriger ist, wird das Bildelement als Hintergrund bezeichnet. Der Kontrastüberschuß-Nennwert liegt vorzugsweise in der Mitte zwischen MINij und MAXij, d. h. (MINij + MAXij)/2.
- Schritt 4. Wenn das Bildelement bei (i, j) durch keinen der obigen drei Tests als Hintergrund bezeichnet worden ist, dann wird das Bildelement als Vordergrund (Text) bezeichnet.
- Die Schwellwertbildung des Grauwertbilds mit einer spezifischen Menge von Parametern vervollständigt die erste Stufe der Verarbeitung. Die Leistung der Stufe Eins hängt von der Wahl einer adäquaten Menge von Schwellwertbildungsprozeßparametern ab. Die oben spezifizierte Menge von Parametern führt für eine große Vielfalt von Etiketten zu zufriedenstellenden Ergebnissen. Es ist allerdings schwierig, für die ganze Vielfalt von Etiketten, die man in allen gegebenen Umfeldern möglicherweise antreffen kann, eine einzige Menge von Parametern zu finden, die zu zufriedenstellenden Ergebnissen führt. Mit einem Verfahren zum Wählen zwischen mehreren Mengen von Prozeßparametern ist es jedoch möglich, zwei oder drei Mengen von Parametern zu finden, die fast alle Möglichkeiten abdecken. Drei Mengen von Prozeßparametern sind in Tabelle 1 angegeben und werden im Zusammenhang mit dem unten erörterten Beispiel 1 verwendet.
- Um ein gegebenes Grauwertbild mit einer Menge von Verarbeitungsparametern einer Schwellwertbildung zu unterziehen, ist es vorzuziehen, die zu verwendenden Parameterwerte vorzuwählen. Wie aus der obigen Beschreibung der Schwellwertbildungsschritte zu erkennen ist, bedeutet der Ausdruck "vorgewählt" nicht nur das Vorwählen konstanter Werte, sondern auch das Vorwählen von Formeln, die zum Bestimmen der in Frage kommenden Werte verwendet werden können.
- Wenn ein Etikettenbild durch das LAT-Verfahren und die LAT-Vorrichtung mehrmals verarbeitet worden ist, jedesmal mit einer anderen Menge von Prozeßparametern, so ist das Ergebnis eine Menge von Etikettenbildern, an denen eine Schwellwertbildung durchgeführt worden ist. Es wird dann notwendig, automatisch zu beurteilen, welches Bild der Menge, an dem eine Schwellwertbildung durchgeführt worden ist, beste ist, das heißt zu beurteilen, welches die höchste Qualität für die OCR-Verarbeitung aufweist. Die zweite Stufe der Erfindung, nämlich die Qualitätsanalyse, ergänzt die oben beschriebene Verarbeitung in Stufe Eins und liefert das erforderliche Urteil, um das beste Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen.
- Der Prozeß der Qualitätsanalyse weist die folgenden Hauptschritte auf:
- Schritt 1. Erzeugen einer Schwellwertbildung unterzogene Bilder unter Verwendung von n Mengen von Prozeßparametern.
- Schritt 2. Wandle jedes Binärbild in ein lauflängencodiertes Bild (RLE-Bild) um.
- Schritt 3. Führe an jedem RLE-Bild eine Stückextrahierung durch und bestimme Anzahl und Größe verbundener Komponenten in dem Bild.
- Schritt 4. Unter Verwendung statistischer Informationen, bestimme paarweise auf der Grundlage der Verteilung von Stückgrößen in jedem der beiden Bilder, welches der beiden Bilder die höhere Qualität aufweist.
- Schritt 5. Unter Verwendung des in Schritt 4 gewählten Bilds mit einem beliebigen anderen, noch nicht verglichenen Bild, wiederhole Schritt 4. Fahre fort, bis alle Bilder verglichen worden sind, um dasjenige Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen, das die höchste Qualität aufweist.
- In Schritt Eins wird Stufe Eins des LAT- Verfahrens n-mal durchgeführt, um n Bilder zu erzeugen, jedes mit einer anderen Menge von Prozeßparametern.
- Jedes so erzeugte Binärbild ist lauflängencodiert. Die Lauflängencodierung (RLE) ist ein Prozeß, der ein aus binären Bildelementen bestehendes Bild in eine andere Darstellung umwandelt. Bei dieser Darstellung wird jede horizontal verbundene Gruppe von schwarzen Bildelementen, die als ein Lauf bezeichnet wird, in das RLE-Format umgewandelt, indem nur die Stelle des Anfangsbildelements für den Lauf und die Länge des Laufs beibehalten werden. Alle Läufe werden auf diese Weise umgewandelt. RLE ist eine standardmäßige Bildverarbeitungstechnik.
- Die RLE-Umwandlung neigt dazu, die Größe des Bilds beträchtlich zu reduzieren, ohne die Qualität des Binärbilds zu reduzieren. Als Beispiel handelt es sich bei dem Bild in Fig. 7 um ein 100 · 100-Binärbild, das üblicherweise eine Speicherung von 10 000 Bit erfordert. Da es jedoch nur einen vertikalen Balken (mit einer Höhe von 100 Bildelementen und einer Stärke von 3 Bildelementen) enthält, kann es im RLE-Format durch 100 Anfangsbyte jeweils mit einem Längenbyte (mit Wert 3) dargestellt werden. Dieses Bild erfordert deshalb im RLE-Format nur eine Speicherung von 200 Byte. Es hat sich gezeigt, daß einige Algorithmen aufgrund des Charakters dieses Formats sowie der kleineren Darstellung weniger Ausführungszeit benötigen.
- Jedes RLE-Bild wird als nächstes einer Stückextrahierung unterzogen. Die Stückextrahierung ist eine standardmäßige Bildverarbeitungstechnik, um Läufe zu finden, die verschiedene Linien der Bilder berühren. Läufe, die sich berühren, werden als verbundene Komponenten bezeichnet. Beim Zusammenbau von Gruppen von verbundenen Läufen werden Stücke gebildet. Ein Stück kann beispielsweise ein mit einer Schreibmaschine geschriebenes Zeichen oder ein Rauschfleck sein.
- Mit den auf diese Weise zusammengetragenen statistischen Informationen kann das Bild mit der besten Qualität gewählt werden. Die Qualitätsschätzung ist ein Verfahren zum Untersuchen der Ergebnisse des LAT-Prozesses und zum Beurteilen, welcher Schwellwert der beste unter einer Gruppe von Bildern ist. Dieser Prozeß verwendet zum Schätzen der Qualität die Größe von durch den Stückextrahierungsalgorithmus erzeugten Stücken (d. h. die Anzahl von Bildelementen in einem Stück).
- Die Stückgröße ist zum Untersuchen ein sehr nützliches Merkmal, da sie eine gute Darstellung der Qualität von auf Text basierenden Bildern wie beispielsweise Etiketten liefert. Die zugrundeliegende Annahme lautet, daß die Verteilung von Stückgrößen Informationen über die Menge an Rauschen und Text, die sich in einem Bild finden, das einer Schwellwertbildung unterzogen worden ist, liefert. Bilder mit vielen kleinen Stücken neigen dazu, verrauscht zu sein. Bilder mit vielen großen Stücken neigen dazu, Text mit hoher Qualität aufzuweisen. Bilder weisen oftmals eine gewisse Menge an Stücken mit vielen unterschiedlichen Größen auf.
- Die Erfindung verwendet ein Histogramm der Stückgrößen als Merkmalsmenge für die Qualitätsschätzung. Der Bereich von Stückgrößen wird in b Behälter unterteilt. Jeder Behälter enthält die Anzahl von Stücken in den Bildern, die innerhalb des Größenbereichs des Behälters liegen. Ein Entscheidungstreffungsprozeß wird zum Untersuchen des Histogramms verwendet, um zu bestimmen, ob das Bild eine bessere Qualität als jedes andere der Bilder, die einer Schwellwertbildung unterzogen worden sind, aufweist. Zur Durchführung dieser Untersuchung sind zwei verschiedene Entscheidungsprozesse entwickelt worden:
- 1. Der erste Entscheidungsprozeß verwendet ein Histogramm mit zwei Behältern. Behälter 1 (Rauschen) enthält kleine Stücke mit einer Größe zwischen 0 und 10 Bildelementen. Behälter 2 (Groß) enthält große Stücke mit einer Größe von über 100 Bildelementen. Bezeichne die Bilder so, daß das Bild mit mehr großen Stücken mit der Nummer 1 bezeichnet wird, d. h. Groß(1)> Groß(2). Der folgende Vergleich bzw. die folgende Wahl erfolgt für zwei Bilder, Bild(1) und Bild(2), die einer Schwellwertbildung unterzogen worden sind, paarweise:
- Schritt 1. Wenn Groß(2) < 30, dann wähle Bild(1)
- Schritt 2. Wenn Q x Groß(1)/Groß(2) > Rauschen(1)/Rauschen(2), wähle Bild(1);
- ansonsten wähle Bild(2).
- Der Wert Q wird so gewählt, daß er die folgenden Werte aufweist:
- Wenn 30 ≤ Groß (2) ≤ 150, Q = (- 2) (Groß (2)) + 60 + 3/120
- Wenn 150 < Groß(2), Q = 1
- Bei mehr als zwei Bildern wird der Algorithmus solange paarweise angewendet, bis eine geeignete Wahl getroffen worden ist.
- 2. Der zweite Entscheidungsprozeß verwendet ein Stückgrößenhistogramm von vier Behältern wie folgt:
- Behälter 1 : 0-10.
- Behälter 2 : 11-40.
- Behälter 3 : 41-100.
- Behälter 4: mehr als 100
- Behälter 1 entspricht kleinen Stücken (Bildrauschen), und Behälter 4 entspricht großen Stücken des Bilds. Behälter 3 entspricht unzusammenhängenden großen Stücken, wie sie möglicherweise in einem Bild von Text angetroffen werden können, das von einem Matrixdrucker erzeugt worden ist.
- Die Werte in diesen Behältern können als die Komponenten eines vierdimensionalen Vektors angesehen werden. An zwei Bildern, Bild(1) und Bild(2), kann dann mit einem neuralen Mitkopplungsnetz mit acht Eingängen eine Qualitätsanalyse durchgeführt werden. Bei den acht Eingängen handelt es sich in dieser Reihenfolge um die Werte in den vier Behältern von Bild(1) und die Werte in den vier Behältern von Bild(2). Das Netz mit den acht Eingängen erzeugt als Ausgangssignal einen Wert zwischen 0-255. Das Netz ist an einer großen Menge von Trainingsbildern unter Verwendung des Backpropagation- Algorithmus trainiert.
- Um das Netz zu trainieren, wird die große Menge von Trainingsbildern paarweise untersucht, und das bessere Bild jedes Paars wird nach Sichtprüfung gewählt. Das neurale Netz wird trainiert, indem ein Ausgangssignal von 255 spezifiziert wird, wenn die Vektorwerte für das bessere Bild zuerst in dem 8- Komponenteneingangsvektor erscheinen, dann die beiden Vier-Komponenten-Vektoren in dem Eingangssignal vertauscht werden und ein Neuronennetzausgangssignal von 0 spezifiziert wird. Dieser Trainingsprozeß wird für eine große Anzahl von Paaren der Trainingsbilder wiederholt.
- Nach dem Training funktioniert das Netz wie folgt: Bei einem gegebenen eingegebenen Paar von Bildern, Bild(1) und Bild(2), werden die beiden Vier- Komponenten-Vektoren von dem Stückgrößenhistogramm als Eingangssignal an das neuronale Netz geliefert. Wenn der Wert des Ausgangssignals des Netzes über 128 liegt, ist Bild(1) besser als Bild(2). Ansonsten ist Bild(2) besser. Bei mehr als zwei Bildern wird der Algorithmus paarweise solange angewendet, bis eine geeignete Wahl getroffen worden ist.
- Unter Verwendung des Histogramms von Stückgrößen können auch andere Mechanismen zum Schätzen der Qualität eingesetzt werden. Als Beispiel verwendet ein derartiger Mechanismus einen Spitzenerfassungsalgorithmus, der dem in der ersten Stufe des LAT-Prozesses ähnlich ist, um Text- und Rauschstücksegmente zu finden. Bei einem anderen Beispiel können neuronale Netze verwendet werden, wobei nur ausgewählte Behälter der Stückgrößenhistogramme als Eingangssignale verwendet werden.
- Die Fig. 8-11 veranschaulichen die Verwendung der Erfindung mit einem beispielhaften Etikett. Fig. 8 zeigt das ursprüngliche Grauwertbild eines Probeetiketts. Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Bilds in Fig. 8, wobei die Parameter in Spalte 1 von Tabelle 1 verwendet werden. Man beachte, daß während der ganze Hintergrund auf Weiß eingestellt worden ist, ein Teil des Textes fehlt. Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 2 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, doch ist ein Teil des Hintergrunds, der Falten in dem Etikett entspricht, auf Vordergrund-Schwarz eingestellt worden. Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 3 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, und der ganze Hintergrund ist auf Weiß eingestellt worden. Nach Sichtüberprüfung ist dieses letzte Binärbild deutlich dasjenige Bild aus den drei, in Fig. 9, 10 und 11 gezeigten Binärbildern, das die beste Qualität aufweist. Wenn diese drei Binärbilder dem ersten Verfahren der Qualitätsanalyse unterzogen wurden, wurde das Fig. 11 entsprechende letzte Bild gewählt. Tabelle 1. Prozeßparameter
- Die Wahl des Fig. 11 entsprechenden letzten Bildes als das beste Binärbild, das einer Schwellwertbildung unterzogen worden ist, kann unter Bezugnahme auf Tabelle 2 veranschaulicht werden, die die Werte für den Behälter "Rauschen" und den Behälter "Groß" des Stückgrößenhistogramms enthält. Tabelle 2. Anzahl großer und kleiner Binärbildstücke.
- Der Qualitätsanalyseprozeß vergleicht zunächst die Bilder A und B. Da Bild B mehr große Stücke aufweist, wird es als Bild 1 bezeichnet und Bild A wird mit 2 bezeichnet. Der Wert von Q beläuft sich in diesem Fall auf
- Q = (-2) (Groß (2)) + 60/120 + 3 = -2 (30) + 60/120 + 3 = 3
- Der Test hinsichtlich des Bilds mit der besseren Qualität ist
- Q x Groß (1)/Groß (2) = 3 (70)/30 = 7
- was nicht größer ist als Rauschen(1)/Rauschen(2) = 1884/95, so daß Bild 2 (Bild A) gewählt wird.
- Als nächstes wird Bild A mit Bild C verglichen. In diesem Fall wird Bild C als Bild 1 bezeichnet. Der Wert Q wird wieder als 3 berechnet. Der Test hinsichtlich des Bilds mit der besseren Qualität ist somit
- Q x Groß(1)/Groß (2) = 3(52)/30 = 5,2
- was größer ist als Rauschen(1)/Rauschen(2) = 109/95. Somit wird Bild 1 (Bild C), das Fig. 11 entspricht, als das beste Bild der drei Bilder gewählt.
- Diese Erfindung ist zwar unter besonderer Bezugnahme auf bevorzugte Ausführungsformen der Erfindung ausführlich beschrieben worden, dennoch versteht es sich, daß Abänderungen und Modifikationen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Schutzumfang der Erfindung, wie er hier beschrieben ist und in den beigefügten Ansprüchen definiert ist, abzuweichen.
Claims (21)
1. Verfahren zum Wählen eines von zwei
Binärbildern entsprechend verschiedenen
Schwellwertbildungen eines Grauwertbilds, wobei jedes der
Binärbilder einen ersten von zwei Werten für Abschnitte
des Binärbilds und einen zweiten von zwei Werten für
den Rest des Binärbilds aufweist, mit folgendem:
Wählen eines ersten der Binärbilder; Umwandeln
des ersten Binärbilds in ein erstes lauflängencodiertes
Bild (RLE-Bild = run-length encoded);
Auffinden verbundener Komponenten im ersten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den
zuvor nicht gewählten Binärbildern; Umwandeln des
zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Bestimmen einer ersten Gebietsverteilung von
verbundenen Komponenten des ersten RLE-Bilds und
Konstruieren eines ersten Mehr-Behälter-Histogramms der
ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von
verbundenen Komponenten des zweiten RLE-Bilds und
Konstruieren eines zweiten Mehr-Behälter-Histogramms
der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines
Vergleichs des ersten und zweiten Mehr-Behälter-
Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem
Anwenden eines Zeichenerkennungsprozesses auf die RLE-
Bilder konstruiert werden.
2. Verfahren nach Anspruch 1, bei dem der Schritt
des Bestimmens von Gebietsverteilungen für die
Binärbilder folgende Schritte umfaßt:
Umwandeln der Abschnitte von jedem der
Binärbilder mit dem ersten von zwei Werten in ein RLE-
Bild; und
Bestimmen der Gebietsverteilung von verbundenen
Komponenten von jedem der RLE-Bilder unter Verwendung
von Stückextrahierung.
3. Verfahren nach Anspruch 1 oder 2, bei dem der
Schritt des Vergleichens der Gebietsverteilungen
folgende Schritte umfaßt:
Konstruieren eines Mehr-Behälter-Histogramms
jeder der Gebietsverteilungen; und
Vergleichen der Werte in ausgewählten Behältern
des Mehr-Behälter-Histogramms.
4. Verfahren nach Anspruch 3, bei dem der Schritt
des Vergleichens der Werte in ausgewählten Behältern
des Mehr-Behälter-Histogramms folgenden Schritt umfaßt:
Vergleichen des Verhältnisses von Werten in
einem ersten Behälter von jedem der Mehr-Behälter-
Histogramme mit dem Verhältnis von Werten in einem
zweiten Behälter von jedem der
Mehr-Behälter-Histogramme; und
wobei der Schritt des Wählens eines der Bilder
folgendes umfaßt:
Wählen eines der beiden Binärbilder auf der
Grundlage des Vergleichs im vorausgegangenen Schritt.
5. Verfahren nach einem der Ansprüche 1 bis 4, bei
dem der Schritt des Vergleichens des ersten und zweiten
Mehr-Behälter-Histogramms folgenden Schritt umfaßt:
Liefern der Werte von ausgewählten Behältern
jedes der Mehr-Behälter-Histogramme als Eingänge zu
einem zuvor trainierten neuronalen Netz; und
wobei der Schritt des Wählens eines der Bilder
folgendes umfaßt:
Wählen eines der beiden Binärbilder auf der
Grundlage des Ausgangswerts des zuvor trainierten
neuronalen Netzes.
6. Verfahren nach Anspruch 5, bei dem die
Histogramme einen kleinen verbundenen Komponenten in
den Binärbildern entsprechenden ersten Behälter und
einen großen verbundenen Komponenten in den
Binärbildern entsprechenden zweiten Behälter aufweisen
und der Schritt des Vergleichens der Werte in
ausgewählten Behältern der Mehr-Behälter-Histogramme
folgende Schritte umfaßt:
Berechnen eines ersten Quotienten durch
Dividieren des Werts des ersten Behälters des
Histogramms für ein erstes der beiden Binärbilder durch
den Wert des ersten Behälters des Histogramms für ein
zweites der beiden Binärbilder;
Berechnen eines zweiten Quotienten durch
Dividieren des Werts des zweiten Behälters des
Histogramms für ein erstes der beiden Binärbilder durch
den Wert des zweiten Behälters des Histogramms für ein
zweites der beiden Binärbilder; und
wobei der Schritt des Wählens eines der Bilder
folgendes umfaßt:
Wählen des ersten Binärbilds, wenn der erste
Quotient kleiner ist als der zweite Quotient
multipliziert mit einem Qualitätswert.
7. Verfahren nach Anspruch 6, bei dem der
Qualitätswert eine vorgewählte Konstante ist.
8. Verfahren nach Anspruch 6 oder 7, bei dem der
Qualitätswert aus einer vorbestimmten Formel berechnet
wird, die vorgewählte Konstanten und den Wert des
zweiten Behälters des Histogramms für das erste der
beiden Binärbilder verwendet.
9. Verfahren nach Anspruch 6, 7 oder 8, bei dem
der Qualitätswert aus einer vorbestimmten Formel
berechnet wird, die vorgewählte Konstanten und den Wert
des zweiten Behälters des Histogramms für das zweite
der beiden Binärbilder verwendet.
10. Verfahren nach Anspruch 6, bei dem der erste
Behälter des Mehr-Behälter-Histogramms den Zählwert von
verbundenen Komponenten der Binärbilder mit von 0 bis
etwa 10 Bildelementen aufweist.
11. Verfahren nach Anspruch 6, bei dem der zweite
Behälter des Mehr-Behälter-Histogramms den Zählwert von
verbundenen Komponenten der Binärbilder mit mehr als
etwa 100 Bildelementen aufweist.
12. Verfahren zur Schwellwertbildung bei einem
Grauwertbild, mit den folgenden Schritten:
Konstruieren eines dem Grauwertbild
entsprechenden Kontrastbilds, wobei jedes Bildelement
des Kontrastbilds einen Wert LCij aufweist, der gegeben
ist durch die Formel
LCij = C (1 - (MINij + p) / (MAXij + p)),
wobei (i, j) die Position des Bildelements in dem
Kontrastbild, C ein vorgewählter maximaler
Kontrastwert, p ein vorgewählter, im Vergleich zu C
kleiner positiver Wert, MINij der kleinste
Graustufenwert aller Bildelemente in einem rechteckigen
Fenster mit der Mitte in der entsprechenden Position in
dem Grauwertbild und MAXij der größte Graustufenwert
aller Bildelemente in dem rechteckigen Fenster ist;
Wählen einer vorbestimmten Anzahl von Mengen
von Schwellwertbildungsparametern, wobei die
Schwellwertbildungsparameter ein Spitzen-Boden-
Pegelwert, ein Spitzen-Breiten-Nennwert, ein
Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert,
ein Minimalkontrastskalenwert und ein
Kontrastüberschuß-Nennwert sind, wobei der Spitzen-
Boden-Pegelwert die kleinste Höhe ist, die eine
Kontrasthistogrammspitze aufweisen kann, der Spitzen-
Breiten-Nennwert die Anzahl unterschiedlicher
Kontrastwerte ist, die in einer nominalen
Kontrasthistogrammspitze erwartet werden, der Text-
Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher
Kontrastwerte ist, die in einer nominalen
Kontrasthistogrammspitze erwartet werden, die einem
Textkontrastsegment entspricht, der
Minimalkontrastskalenwert ein erster Grenzwert und der
Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;
für jede Menge von
Schwellwertbildungsparametern, Erhalten eines Binärbilds durch Konstruieren
eines Kontrasthistogramms des Kontrastbilds über alle
möglichen Kontrastwerte in dem Kontrastbild; Finden
aller Spitzen in dem Kontrasthistogramm, die größer
sind als der vorgewählte Spitzen-Boden-Pegelwert und
von allen höheren Spitzen durch den vorgewählten
Spitzen-Breiten-Nennwert getrennt sind; Wählen einer
Minimaltextspitze unter den gefundenen Spitzen durch
Auffinden einer Spitze, die bei dem niedrigsten
Kontrastwert auftritt, der größer ist als der
vorgewählte Minimalkontrastwert; Erhalten eines
kleinsten zulässigen Kontrastwerts durch Subtrahieren
des vorgewählten Text-Spitze-Breiten-Nennwerts von dem
Kontrastwert der Minimaltextspitze; Zuordnen des
Bildelements an der (i, j)-Position des Grauwertbilds
zu einer Hintergrundklasse des Binärbilds, wenn LCij
kleiner ist als der kleinste zulässige Kontrastwert;
wenn das Bildelement des Grauwertbilds nicht bereits
der Hintergrundklasse zugeordnet ist, Berechnen der
Differenz zwischen MAXij und MINij und Zuordnen des
Bildelements zu der Hintergrundklasse, wenn die
Maximum-Minimum-Differenz kleiner ist als der
vorgewählte Minimalkontrastskalenwert; wenn das
Bildelement des Grauwertbilds nicht bereits der
Hintergrundklasse zugeordnet ist, Berechnen der
Differenz zwischen MAXij und dem Graustufenwert des
Bildelements und Zuordnen des Bildelements zu der
Hintergrundklasse, wenn die Maximum-Bildelementwert-
Differenz kleiner ist als der vorgewählte
Kontrastüberschuß-Nennwert; und, wenn das Bildelement
des Grauwertbilds nicht bereits der Hintergrundklasse
zugeordnet ist, Zuordnen des Bildelements zu einer
Vordergrundklasse;
Wählen eines ersten der Binärbilder, Umwandeln
des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den
zuvor nicht gewählten Binärbildern; Umwandeln des
zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Bestimmen einer ersten Gebietsverteilung von
verbundenen Komponenten des ersten RLE-Bilds und
Konstruieren eines ersten Mehr-Behälter-Histogramms der
ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von
verbundenen Komponenten des zweiten RLE-Bilds und
Konstruieren eines zweiten Mehr-Behälter-Histogramms
der zweiten Gebietsverteilung; und
Wählen eines der Bilder auf der Grundlage eines
Vergleichs des ersten und zweiten Mehr-Behälter-
Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem
Anwenden eines Zeichenerkennungsprozesses auf die RLE-
Bilder konstruiert werden.
13. Verfahren nach Anspruch 12, bei dem der Schritt
des Wählens eines der Binärbilder auf der Grundlage
einer Auswertung des ersten und zweiten Mehr-Behälter-
Histogramms folgende Schritte umfaßt:
Vergleichen des Verhältnisses des Werts in
einem ersten Behälter des ersten
Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter des zweiten
Mehr-Behälter-Histogramms mit dem Verhältnis des Werts
in einem zweiten Behälter des ersten Mehr-Behälter-
Histogramms zu dem Wert in einem zweiten Behälter des
zweiten Mehr-Behälter-Histogramms; und
Wählen eines der Binärbilder auf der Grundlage
des Vergleichs der Verhältnisse.
14. Verfahren nach Anspruch 12 oder 13, bei dem der
Schritt des Wählens eines der Binärbilder auf der
Grundlage einer Auswertung des ersten und zweiten Mehr-
Behälter-Histogramms folgende Schritte umfaßt:
Liefern der Werte von ausgewählten Behältern
jedes der Mehr-Behälter-Histogramme als Eingänge zu
einem zuvor trainierten neuronalen Netz; und
Wählen eines der Binärbilder auf der Grundlage
des Ausgangs des zuvor trainierten neuronalen Netzes.
15. Vorrichtung zur Schwellwertbildung bei einem
Grauwertbild, mit folgendem:
Mitteln (1, Fig. 1; 3, Fig. 2) zum
Konstruieren eines dem Grauwertbild entsprechenden
Kontrastbilds, wobei jedes Bildelement des
Kontrastbilds einen Wert LCij aufweist, der gegeben ist
durch die Formel
LCij = C (1 - (MINij + p) / (MAXij + p)),
wobei (i, j) die Position des Bildelements in dem
Kontrastbild, C ein vorgewählter maximaler
Kontrastwert, p ein vorgewählter, im Vergleich zu C
kleiner positiver Wert, MINij der kleinste
Graustufenwert aller Bildelemente in einem rechteckigen
Fenster mit der Mitte in der entsprechenden Position in
dem Grauwertbild und MAXij der größte Graustufenwert
aller Bildelemente in dem rechteckigen Fenster ist;
Mitteln zum Wählen einer vorbestimmten Anzahl
von Mengen von Schwellwertbildungsparametern, wobei die
Schwellwertbildungsparameter ein Spitzen-Boden-
Pegelwert, ein Spitzen-Breiten-Nennwert, ein
Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert,
ein Minimalkontrastskalenwert und ein
Kontrastüberschuß-Nennwert sind, wobei der Spitzen-
Boden-Pegelwert die kleinste Höhe ist, die eine
Kontrasthistogrammspitze aufweisen kann, der Spitzen-
Breiten-Nennwert die Anzahl unterschiedlicher
Kontrastwerte ist, die in einer nominalen
Kontrasthistogrammspitze erwartet werden, der Text-
Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher
Kontrastwerte ist, die in einer nominalen
Kontrasthistogrammspitze erwartet werden, die einem
Textkontrastsegment entspricht, der
Minimalkontrastskalenwert ein erster Grenzwert und der
Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;
Mitteln (2, 6, 10, Fig. 1) zum Erhalten eines
Kandidatenbinärbilds für jede Menge von
Schwellwertbildungsparametern durch Konstruieren eines
Kontrasthistogramms des Kontrastbilds über alle
möglichen Kontrastwerte in dem Kontrastbild; Finden
aller Spitzen in dem Kontrasthistogramm, die größer
sind als der vorgewählte Spitzen-Boden-Pegelwert und
von allen höheren Spitzen durch den vorgewählten
Spitzen-Breiten-Nennwert getrennt sind; Wählen einer
Minimaltextspitze unter den gefundenen Spitzen durch
Auffinden einer Spitze, die bei dem niedrigsten
Kontrastwert auftritt, der größer ist als der
Minimalkontrastwert; Erhalten eines kleinsten
zulässigen Kontrastwerts durch Subtrahieren des
vorgewählten Text-Spitze-Breiten-Nennwerts von dem
Kontrastwert der Minimaltextspitze; Zuordnen des
Bildelements an der (i, j)-Position des Grauwertbilds
zu einer Hintergrundklasse des Kandidatenbinärbilds,
wenn LCij kleiner ist als der kleinste zulässige
Kontrastwert; wenn das Bildelement des Grauwertbilds
nicht bereits der Hintergrundklasse zugeordnet ist,
Berechnen der Differenz zwischen MAXij und MINij und
Zuordnen des Bildelements zu der Hintergrundklasse,
wenn die Maximum-Minimum-Differenz kleiner ist als der
vorgewählte Minimalkontrastskalenwert; wenn das
Bildelement des Grauwertbilds nicht bereits der
Hintergrundklasse zugeordnet ist, Berechnen der
Differenz zwischen MAXij und dem Graustufenwert des
Bildelements und Zuordnen des Bildelements zu der
Bildelement-Hintergrundklasse, wenn die Maximum-
Bildelementwert-Differenz kleiner ist als der
vorgewählte Kontrastüberschuß-Nennwert; und, wenn das
Bildelement des Grauwertbilds nicht bereits der
Hintergrundklasse zugeordnet ist, Zuordnen des
Bildelements zu einer Vordergrundklasse; und
Mitteln (3, 4, Fig. 1) zum Wählen eines ersten
der Binärbilder, Umwandeln des ersten Binärbilds in ein
erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den
zuvor nicht gewählten Binärbildern; Umwandeln des
Binärbilds in ein zweites RLE-Bild; und
Auffinden verbundener Komponenten im zweiten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Mittel (5, 14, Fig. 1) zum Bestimmen einer
ersten Gebietsverteilung von verbundenen Komponenten
des ersten RLE-Bilds und Konstruieren eines ersten
Mehr-Behälter-Histogramms der ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von
verbundenen Komponenten des zweiten RLE-Bilds und
Konstruieren eines zweiten Mehr-Behälter-Histogramms
der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines
Vergleichs des ersten und zweiten Mehr-Behälter-
Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem
Anwenden eines Zeichenerkennungsprozesses auf die RLE-
Bilder konstruiert werden.
16. Vorrichtung nach Anspruch 15, bei der das
Mittel zum Wählen eines der Binärbilder auf der
Grundlage einer Auswertung des ersten und zweiten Mehr-
Behälter-Histogramms folgendes umfaßt:
Mittel zum Vergleichen des Verhältnisses des
Werts in einem ersten Behälter des ersten
Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter
des zweiten Mehr-Behälter-Histogramms mit dem
Verhältnis des Werts in einem zweiten Behälter des
ersten Mehr-Behälter-Histogramms zu dem Wert in einem
zweiten Behälter des zweiten Mehr-Behälter-Histogramms;
und
Mittel zum Wählen eines der Binärbilder auf der
Grundlage des Vergleichs der Verhältnisse.
17. Vorrichtung nach Anspruch 15 oder 16, bei dem
das Mittel zum Wählen eines der Binärbilder auf der
Grundlage einer Auswertung des ersten und zweiten Mehr-
Behälter-Histogramms folgendes umfaßt:
Mittel zum Liefern der Werte von ausgewählten
Behältern jedes der Mehr-Behälter-Histogramme als
Eingänge zu einem zuvor trainierten neuronalen Netz;
und
Mittel zum Wählen eines der Binärbilder auf der
Grundlage des Ausgangs des zuvor trainierten neuronalen
Netzes.
18. Vorrichtung nach einem der Ansprüche 15 bis 17,
bei der das Mittel zum Konstruieren der Kontrastbilder
eine CCD-Kamera (51) enthält.
19. Vorrichtung zum Wählen eines von zwei
Binärbildern entsprechend verschiedenen
Schwellwertbildungen eines Grauwertbilds, wobei jedes
der Binärbilder einen ersten von zwei Werten für
Abschnitte des Binärbilds und einen zweiten von zwei
Werten für den Rest des Binärbilds aufweist, mit
folgendem:
Mitteln zum:
Wählen eines ersten der Binärbilder, Umwandeln
des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den
zuvor nicht gewählten Binärbildern; Umwandeln des
zweiten Binärbilds in ein zweites RLE-Bild; und
Auffinden verbundener Komponenten im zweiten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
gekennzeichnet durch:
Mittel zum:
Bestimmen einer ersten Gebietsverteilung von
verbundenen Komponenten des ersten RLE-Bilds und
Konstruieren eines ersten Mehr-Behälter-Histogramms der
ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von
verbundenen Komponenten des zweiten RLE-Bilds und
Konstruieren eines zweiten Mehr-Behälter-Histogramms
der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines
Vergleichs des ersten und zweiten Mehr-Behälter-
Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem
Anwendens eines Zeichenerkennungsprozesses auf die RLE-
Bilder konstruiert werden.
20. Vorrichtung nach Anspruch 19, mit einer CCD-
Kamera (51) zum Erzeugen der Binärbilder.
21. Verfahren zum Betreiben einer Recheneinrichtung
(21, 22, 23, 31, 41) mit ausführbaren Anweisungen zum
Wählen eines von zwei Binärbildern entsprechend
verschiedenen Schwellwertbildungen eines Grauwertbilds,
wobei jedes der Binärbilder einen ersten von zwei
Werten für Abschnitte des Binärbilds und einen zweiten
von zwei Werten für den Rest des Binärbilds aufweist,
gemäß den folgenden Schritten:
Wählen eines ersten der Binärbilder, Umwandeln
des ersten Binärbilds in ein erstes RLE-Bild;
Auffinden verbundener Komponenten im ersten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist;
Wählen des zweiten der Binärbilder unter den
zuvor nicht gewählten Binärbildern; Umwandeln des
zweiten Binärbilds in ein zweites RLE-Bild;
Auffinden verbundener Komponenten im zweiten
RLE-Bild und Bestimmen eines Gebiets von jeder der
verbundenen Komponenten, wobei das Gebiet einen der
Anzahl von Bildelementen in jeder der verbundenen
Komponenten entsprechenden Wert aufweist; wobei die
Anweisungen gekennzeichnet sind durch:
Bestimmen einer ersten Gebietsverteilung von
verbundenen Komponenten des ersten RLE-Bilds und
Konstruieren eines ersten Mehr-Behälter-Histogramms der
ersten Gebietsverteilung;
Bestimmen einer zweiten Gebietsverteilung von
verbundenen Komponenten des zweiten RLE-Bilds und
Konstruieren eines zweiten Mehr-Behälter-Histogramms
der zweiten Gebietsverteilung;
Wählen eines der Bilder auf der Grundlage eines
Vergleichs des ersten und zweiten Mehr-Behälter-
Histogramms;
wobei die Mehr-Behälter-Histogramme vor dem
Anwenden eines Zeichenerkennungsprozesses auf die RLE-
Bilder konstruiert werden.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US38073295A | 1995-01-31 | 1995-01-31 | |
| PCT/US1996/001060 WO1996024114A2 (en) | 1995-01-31 | 1996-01-25 | Method and apparatus for separating foreground from background in images containing text |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69604481D1 DE69604481D1 (de) | 1999-11-04 |
| DE69604481T2 true DE69604481T2 (de) | 2000-03-30 |
Family
ID=23502251
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69604481T Expired - Lifetime DE69604481T2 (de) | 1995-01-31 | 1996-01-25 | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US5889885A (de) |
| EP (1) | EP0807297B1 (de) |
| JP (1) | JP3264932B2 (de) |
| AT (1) | ATE185211T1 (de) |
| CA (1) | CA2211258C (de) |
| DE (1) | DE69604481T2 (de) |
| DK (1) | DK0807297T3 (de) |
| ES (1) | ES2140825T3 (de) |
| GR (1) | GR3031478T3 (de) |
| WO (1) | WO1996024114A2 (de) |
Families Citing this family (68)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ATE185211T1 (de) * | 1995-01-31 | 1999-10-15 | United Parcel Service Inc | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern |
| JP3380831B2 (ja) * | 1996-03-08 | 2003-02-24 | シャープ株式会社 | 画像形成装置 |
| FR2769733B1 (fr) * | 1997-10-15 | 2000-01-07 | Jeffrey Horace Johnson | Procede d'extraction automatique d'inscriptions imprimees ou manuscrites sur un fond, dans une image numerique multiniveaux |
| US6411737B2 (en) * | 1997-12-19 | 2002-06-25 | Ncr Corporation | Method of selecting one of a plurality of binarization programs |
| US6411741B1 (en) * | 1998-01-14 | 2002-06-25 | Kabushiki Kaisha Toshiba | Image processing apparatus |
| US6507670B1 (en) * | 1998-03-05 | 2003-01-14 | Ncr Corporation | System and process for removing a background pattern from a binary image |
| DE69822608T2 (de) * | 1998-05-28 | 2005-01-05 | International Business Machines Corp. | Binarisierungsverfahren in einem Zeichenerkennungssystem |
| US6222642B1 (en) * | 1998-08-10 | 2001-04-24 | Xerox Corporation | System and method for eliminating background pixels from a scanned image |
| TW429348B (en) * | 1999-02-12 | 2001-04-11 | Inst Information Industry | The method of dividing an image |
| US6738526B1 (en) * | 1999-07-30 | 2004-05-18 | Microsoft Corporation | Method and apparatus for filtering and caching data representing images |
| EP1226508B1 (de) * | 1999-07-30 | 2018-10-10 | Microsoft Technology Licensing, LLC | Einstellung von zeichendimensionen um niedrige kontrastmerkmale der zeichen auszugleichen |
| US6577762B1 (en) * | 1999-10-26 | 2003-06-10 | Xerox Corporation | Background surface thresholding |
| US6728391B1 (en) | 1999-12-03 | 2004-04-27 | United Parcel Service Of America, Inc. | Multi-resolution label locator |
| DE19958553A1 (de) | 1999-12-04 | 2001-06-07 | Luratech Ges Fuer Luft Und Rau | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
| EP1104916B1 (de) * | 1999-12-04 | 2011-05-11 | LuraTech Imaging GmbH | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
| US6652489B2 (en) * | 2000-02-07 | 2003-11-25 | Medrad, Inc. | Front-loading medical injector and syringes, syringe interfaces, syringe adapters and syringe plungers for use therewith |
| JP2001251507A (ja) * | 2000-03-03 | 2001-09-14 | Fujitsu Ltd | 画像処理装置 |
| US6473522B1 (en) * | 2000-03-14 | 2002-10-29 | Intel Corporation | Estimating text color and segmentation of images |
| US6470094B1 (en) * | 2000-03-14 | 2002-10-22 | Intel Corporation | Generalized text localization in images |
| US6674900B1 (en) * | 2000-03-29 | 2004-01-06 | Matsushita Electric Industrial Co., Ltd. | Method for extracting titles from digital images |
| US6771804B1 (en) * | 2000-05-16 | 2004-08-03 | Siemens Aktiengesellschaft | Method and apparatus for signal segmentation |
| KR100430273B1 (ko) * | 2000-07-21 | 2004-05-04 | 엘지전자 주식회사 | 비정규적인 빈값 양자화된 칼라 히스토그램을 이용한멀티미디어 검색방법 |
| WO2002047390A1 (en) * | 2000-12-04 | 2002-06-13 | Isurftv | E-mail, telephone number or url within tv frame |
| JP2002271611A (ja) * | 2001-03-14 | 2002-09-20 | Fujitsu Ltd | 画像処理装置 |
| JP4140048B2 (ja) * | 2001-08-20 | 2008-08-27 | 富士フイルム株式会社 | 画像管理装置、画像管理プログラム並びに画像管理方法 |
| JP4003428B2 (ja) * | 2001-10-10 | 2007-11-07 | セイコーエプソン株式会社 | 小切手等処理装置及び小切手等処理方法 |
| KR100425324B1 (ko) * | 2002-02-09 | 2004-03-30 | 삼성전자주식회사 | 영상 신호의 콘트라스트 처리 방법 |
| RU2251737C2 (ru) * | 2002-10-18 | 2005-05-10 | Аби Софтвер Лтд. | Способ автоматического определения языка распознаваемого текста при многоязычном распознавании |
| US7079686B2 (en) * | 2002-08-20 | 2006-07-18 | Lexmark International, Inc. | Systems and methods for content-based document image enhancement |
| KR100484170B1 (ko) * | 2002-10-25 | 2005-04-19 | 삼성전자주식회사 | 디지털 화질 개선방법 및 장치 |
| JP4118749B2 (ja) * | 2002-09-05 | 2008-07-16 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記憶媒体 |
| DE10326032B4 (de) * | 2003-06-10 | 2006-08-31 | Hema Electronic Gmbh | Verfahren zum Selbsttest eines Bildverarbeitungssystems |
| DE10326033B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Fehlererkennung auf einer inhomogenen Oberfläche |
| DE10326035B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Fehlererkennung auf einer strukturierten Oberfläche |
| DE10326031B4 (de) * | 2003-06-10 | 2005-12-22 | Hema Electronic Gmbh | Verfahren zur adaptiven Kantenerkennung |
| JP4259949B2 (ja) * | 2003-08-08 | 2009-04-30 | 株式会社リコー | 画像作成装置、画像作成プログラムおよび記録媒体 |
| US7921159B1 (en) * | 2003-10-14 | 2011-04-05 | Symantec Corporation | Countering spam that uses disguised characters |
| US7313275B2 (en) * | 2005-02-15 | 2007-12-25 | Primax Electronics Ltd. | Method of separating text and graphs in digital image data |
| US7492957B1 (en) * | 2005-08-29 | 2009-02-17 | Symantec Corporation | Using run length encoding to detect target images |
| JP4215038B2 (ja) * | 2005-09-16 | 2009-01-28 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
| US7668394B2 (en) * | 2005-12-21 | 2010-02-23 | Lexmark International, Inc. | Background intensity correction of a scan of a document |
| DE102006001075A1 (de) * | 2006-01-09 | 2007-07-12 | Carl Zeiss Ag | Elektronische Sehhilfe und elektronisches Sehhilfeverfahren |
| US20070201743A1 (en) * | 2006-02-28 | 2007-08-30 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying characteristics in a digital image |
| US7813547B1 (en) * | 2006-04-05 | 2010-10-12 | Unisys Corporation | Apparatus and method for detection and analysis of imagery |
| US8306336B2 (en) * | 2006-05-17 | 2012-11-06 | Qualcomm Incorporated | Line or text-based image processing tools |
| ATE409334T1 (de) * | 2006-05-19 | 2008-10-15 | Datasensor Spa | Bildsensor für sicherheitssystem und dazugehöriges betriebsverfahren |
| WO2008030104A1 (en) * | 2006-09-07 | 2008-03-13 | Lumex As | Relative threshold and use of edges in optical character recognition process |
| WO2009070032A1 (en) * | 2007-11-28 | 2009-06-04 | Lumex A/S | A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images |
| US8351720B2 (en) * | 2008-04-24 | 2013-01-08 | Hewlett-Packard Development Company, L.P. | Method and system providing edge enhanced image binarization |
| US8170291B2 (en) * | 2008-05-09 | 2012-05-01 | The United States Postal Service | Methods and systems for analyzing the quality of digital signature confirmation images |
| TWI386030B (zh) * | 2008-06-11 | 2013-02-11 | Vatics Inc | 一種混合式連結元件標籤演算法 |
| US8442348B2 (en) * | 2008-11-06 | 2013-05-14 | Seiko Epson Corporation | Image noise reduction for digital images using Gaussian blurring |
| US8675060B2 (en) | 2009-08-28 | 2014-03-18 | Indian Institute Of Science | Machine vision based obstacle avoidance system |
| US20110149753A1 (en) * | 2009-12-21 | 2011-06-23 | Qualcomm Incorporated | Switching between media broadcast streams having varying levels of quality |
| US8693743B1 (en) | 2010-02-19 | 2014-04-08 | Olive Tree Media, LLC | Analysis and display of multiple biomarker co-expression in cells and tissues |
| CN101807253B (zh) * | 2010-03-22 | 2012-07-25 | 南京工程学院 | 面向输电线路基于区域宽度信息的图像骨架提取方法 |
| US8977629B2 (en) * | 2011-05-24 | 2015-03-10 | Ebay Inc. | Image-based popularity prediction |
| AU2013343203B2 (en) * | 2012-11-08 | 2019-08-15 | Totalenergies Onetech | Method for processing an image |
| JP5939154B2 (ja) * | 2012-12-27 | 2016-06-22 | ブラザー工業株式会社 | 画像処理装置およびコンピュータプログラム |
| JP6080259B2 (ja) * | 2013-02-06 | 2017-02-15 | 日本電産サンキョー株式会社 | 文字切り出し装置及び文字切り出し方法 |
| CN104036498B (zh) * | 2014-05-28 | 2017-01-11 | 杭州电子科技大学 | 一种基于逐层分级的oct图像质量快速评价方法 |
| JP6642970B2 (ja) * | 2015-03-05 | 2020-02-12 | キヤノン株式会社 | 注目領域検出装置、注目領域検出方法及びプログラム |
| US9367899B1 (en) * | 2015-05-29 | 2016-06-14 | Konica Minolta Laboratory U.S.A., Inc. | Document image binarization method |
| US9710911B2 (en) * | 2015-11-30 | 2017-07-18 | Raytheon Company | System and method for generating a background reference image from a series of images to facilitate moving object identification |
| DE102016004549A1 (de) * | 2016-04-15 | 2017-11-02 | Noventi Gmbh | Verfahren zu Erkennung von gedruckten Texten auf Dokumenten |
| CN106775548B (zh) * | 2016-11-25 | 2018-02-23 | 北京小米移动软件有限公司 | 页面处理方法及装置 |
| US10242449B2 (en) | 2017-01-04 | 2019-03-26 | Cisco Technology, Inc. | Automated generation of pre-labeled training data |
| CN111368837B (zh) * | 2018-12-25 | 2023-12-05 | 中移(杭州)信息技术有限公司 | 一种图像质量评价方法、装置、电子设备及存储介质 |
Family Cites Families (44)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3715724A (en) * | 1969-12-24 | 1973-02-06 | Olivetti & Co Spa | Apparatus for recognizing graphic symbols |
| US4003999A (en) * | 1972-10-25 | 1977-01-18 | A. H. Robins Company, Incorporated | Aspirin-tea coprecipitates for treating inflammation |
| US4119947A (en) * | 1977-07-20 | 1978-10-10 | Howard Noyes Leighton | Optical signal processor |
| DE3107521A1 (de) * | 1981-02-27 | 1982-09-16 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von bild- und text- oder graphikbereichen auf druckvorlagen |
| GB2103449B (en) * | 1981-06-29 | 1985-05-30 | Nippon Telegraph & Telephone | Method and apparatus for gray level signal processing |
| JPS5960690A (ja) * | 1982-09-30 | 1984-04-06 | Toshiba Corp | 2値化装置 |
| JPS60146378A (ja) * | 1984-01-11 | 1985-08-02 | Matsushita Electric Ind Co Ltd | 画像認識装置 |
| JPS6158087A (ja) * | 1984-08-29 | 1986-03-25 | Nec Corp | 画像領域分割装置 |
| DE3650496T2 (de) * | 1985-04-17 | 1996-10-31 | Hitachi Ltd | Bildverarbeitungsgerät |
| JPS61276080A (ja) * | 1985-05-31 | 1986-12-06 | Toshiba Corp | 上下判定装置 |
| US4837450A (en) * | 1985-07-01 | 1989-06-06 | Canon Kabushiki Kaisha | Apparatus for reading a film image with controllable illumination and threshold value |
| US4742556A (en) * | 1985-09-16 | 1988-05-03 | Davis Jr Ray E | Character recognition method |
| US5046114A (en) * | 1985-10-01 | 1991-09-03 | The Palantir Corporation | Method and structure for separating joined patterns for use in pattern and character recognition system |
| US4809308A (en) * | 1986-02-20 | 1989-02-28 | Irt Corporation | Method and apparatus for performing automated circuit board solder quality inspections |
| CA1268547A (en) * | 1986-03-31 | 1990-05-01 | Ahmed Mostafa El-Sherbini | Thresholding algorithm selection apparatus |
| US4794239A (en) * | 1987-10-13 | 1988-12-27 | Intermec Corporation | Multitrack bar code and associated decoding method |
| US4924078A (en) * | 1987-11-25 | 1990-05-08 | Sant Anselmo Carl | Identification symbol, system and method |
| JPH01137385A (ja) * | 1987-11-25 | 1989-05-30 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
| JP2727549B2 (ja) * | 1988-01-29 | 1998-03-11 | 日本電気株式会社 | 最適画質選択装置 |
| US4929979A (en) * | 1988-01-29 | 1990-05-29 | Konica Corporation | Method and apparatus for processing image |
| JPH0746979B2 (ja) * | 1988-05-26 | 1995-05-24 | 不二製油株式会社 | 特殊栄養食品 |
| DE3881392T2 (de) * | 1988-09-12 | 1993-10-21 | Oce Nederland Bv | System und Verfahren für automatische Segmentierung. |
| JPH02100575A (ja) * | 1988-10-07 | 1990-04-12 | Toshiba Corp | 画像処理装置 |
| JPH02196565A (ja) * | 1989-01-25 | 1990-08-03 | Eastman Kodatsuku Japan Kk | 画像二値化方式 |
| JPH087785B2 (ja) * | 1989-05-16 | 1996-01-29 | 松下電器産業株式会社 | 2値化処理装置 |
| US5048096A (en) * | 1989-12-01 | 1991-09-10 | Eastman Kodak Company | Bi-tonal image non-text matter removal with run length and connected component analysis |
| JP2935863B2 (ja) * | 1989-12-27 | 1999-08-16 | 本田技研工業株式会社 | ハフ変換装置および方法 |
| JP2768786B2 (ja) * | 1990-02-20 | 1998-06-25 | キヤノン株式会社 | 画像読み取り装置 |
| US5081690A (en) * | 1990-05-08 | 1992-01-14 | Eastman Kodak Company | Row-by-row segmentation and thresholding for optical character recognition |
| US5121224A (en) * | 1990-06-01 | 1992-06-09 | Eastman Kodak Company | Reproduction apparatus with selective screening and continuous-tone discrimination |
| US5091965A (en) * | 1990-07-16 | 1992-02-25 | Sony Corporation | Video image processing apparatus |
| US5086485A (en) * | 1990-10-19 | 1992-02-04 | Xerox Corporation | Method and apparatus for dynamically setting a background level |
| JPH04268987A (ja) * | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識装置 |
| JPH04268989A (ja) * | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識方法及び装置 |
| US5179599A (en) * | 1991-06-17 | 1993-01-12 | Hewlett-Packard Company | Dynamic thresholding system for documents using structural information of the documents |
| US5268967A (en) * | 1992-06-29 | 1993-12-07 | Eastman Kodak Company | Method for automatic foreground and background detection in digital radiographic images |
| JP2951814B2 (ja) * | 1993-02-25 | 1999-09-20 | 富士通株式会社 | 画像抽出方式 |
| US5384864A (en) * | 1993-04-19 | 1995-01-24 | Xerox Corporation | Method and apparatus for automatic determination of text line, word and character cell spatial features |
| US5444797A (en) * | 1993-04-19 | 1995-08-22 | Xerox Corporation | Method and apparatus for automatic character script determination |
| JP2933801B2 (ja) * | 1993-06-11 | 1999-08-16 | 富士通株式会社 | 文字の切り出し方法及びその装置 |
| US5452367A (en) * | 1993-11-29 | 1995-09-19 | Arch Development Corporation | Automated method and system for the segmentation of medical images |
| US5630037A (en) * | 1994-05-18 | 1997-05-13 | Schindler Imaging, Inc. | Method and apparatus for extracting and treating digital images for seamless compositing |
| US5583659A (en) * | 1994-11-10 | 1996-12-10 | Eastman Kodak Company | Multi-windowing technique for thresholding an image using local image properties |
| ATE185211T1 (de) * | 1995-01-31 | 1999-10-15 | United Parcel Service Inc | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern |
-
1996
- 1996-01-25 AT AT96905228T patent/ATE185211T1/de not_active IP Right Cessation
- 1996-01-25 DK DK96905228T patent/DK0807297T3/da active
- 1996-01-25 ES ES96905228T patent/ES2140825T3/es not_active Expired - Lifetime
- 1996-01-25 EP EP96905228A patent/EP0807297B1/de not_active Expired - Lifetime
- 1996-01-25 WO PCT/US1996/001060 patent/WO1996024114A2/en not_active Ceased
- 1996-01-25 DE DE69604481T patent/DE69604481T2/de not_active Expired - Lifetime
- 1996-01-25 JP JP52363796A patent/JP3264932B2/ja not_active Expired - Fee Related
- 1996-01-25 CA CA002211258A patent/CA2211258C/en not_active Expired - Fee Related
-
1997
- 1997-04-24 US US08/847,303 patent/US5889885A/en not_active Expired - Lifetime
-
1999
- 1999-10-08 GR GR990402570T patent/GR3031478T3/el unknown
Also Published As
| Publication number | Publication date |
|---|---|
| DE69604481D1 (de) | 1999-11-04 |
| ATE185211T1 (de) | 1999-10-15 |
| GR3031478T3 (en) | 2000-01-31 |
| DK0807297T3 (da) | 2000-04-10 |
| CA2211258A1 (en) | 1996-08-08 |
| CA2211258C (en) | 2000-12-26 |
| US5889885A (en) | 1999-03-30 |
| ES2140825T3 (es) | 2000-03-01 |
| WO1996024114A3 (en) | 1996-11-28 |
| JPH10506733A (ja) | 1998-06-30 |
| EP0807297B1 (de) | 1999-09-29 |
| WO1996024114A2 (en) | 1996-08-08 |
| EP0807297A2 (de) | 1997-11-19 |
| JP3264932B2 (ja) | 2002-03-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69604481T2 (de) | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern | |
| DE3689416T2 (de) | Mustermerkmalextraktion. | |
| DE69428293T2 (de) | Gerät zur bildidentifizierung | |
| DE3633743C2 (de) | ||
| DE69715076T2 (de) | Vorrichtung zur Erzeugung eines Binärbildes | |
| DE69029427T2 (de) | Verfahren für Objektorientierungserkennung unter Verwendung eines vorwärtsregelenden neuronalen Netzwerkes | |
| DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
| DE3879254T2 (de) | Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben. | |
| DE68915950T2 (de) | Verfahren zum Trennen von Zeichen. | |
| DE60132315T2 (de) | Verbessertes verfahren zur bildbinarisierung | |
| DE19953608B4 (de) | Vorrichtung und Verfahren zum Erkennen eines Fonts eines Textes in einem Dokumentenverarbeitungssystem | |
| DE2740483A1 (de) | Merkmal-detektor | |
| DE2909153A1 (de) | Einrichtung zur elektronischen verarbeitung von bild- und/oder zeichenmustern | |
| DE19705757A1 (de) | Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems | |
| DE19956158A1 (de) | Bild-Binärisierungsverfahren auf Bereichsbasis | |
| DE4119091C2 (de) | Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens | |
| EP0523407A2 (de) | Verfahren zur Klassifikation von Signalen | |
| DE69423607T2 (de) | Verfahren zum klassifizieren von bildern mit ausgabeabbildungen | |
| BE1031719B1 (de) | Elektronisches Gerät sowie Bilddatenverarbeitungsverfahren und System | |
| DE69130535T2 (de) | Schriftzeichenerkennungsverfahren und -vorrichtung zur lokalisierung und ermittlung vorbestimmter daten eines dokumentes | |
| DE69421487T2 (de) | Verfahren zum Vergleichen von Mustern basierend auf der Verwendung von Bildelementmatritzen und Bildelementvektoren | |
| DE69529015T2 (de) | Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition | |
| EP0402868A2 (de) | Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen | |
| DE69432544T2 (de) | Verfahren und Gerät zum Wiederauffinden von dynamischen Bildern und zur Verwaltung von Bildern | |
| DE60024535T2 (de) | Verfahren zur Zeichentrennung |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8364 | No opposition during term of opposition | ||
| 8328 | Change in the person/name/address of the agent |
Representative=s name: STIPPL PATENTANWAELTE, 90482 NUERNBERG |