DE69604481T2

DE69604481T2 - Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern

Info

Publication number: DE69604481T2
Application number: DE69604481T
Authority: DE
Inventors: Izrail Gorian; Michael Moed
Original assignee: United Parcel Service of America Inc; United Parcel Service Inc
Current assignee: United Parcel Service of America Inc; United Parcel Service Inc
Priority date: 1995-01-31
Filing date: 1996-01-25
Publication date: 2000-03-30
Anticipated expiration: 2016-01-26
Also published as: DE69604481D1; ATE185211T1; GR3031478T3; DK0807297T3; CA2211258A1; CA2211258C; US5889885A; ES2140825T3; WO1996024114A3; JPH10506733A; EP0807297B1; WO1996024114A2; EP0807297A2; JP3264932B2

Description

ERFINDUNGSGEBIET

Die vorliegende Erfindung betrifft allgemein ein Verfahren und eine Vorrichtung für die parametrisierte Schwellwertbildung von Grauwertbildern, um dem Vordergrund/Hintergrund der ursprünglichen Grauwertbilder entsprechende binäre Schwarz-Weiß-Bilder zu erzeugen, und insbesondere Grauwertbilder, die Textzeichen als Vordergrund enthalten. Die Erfindung enthält ein Verfahren und eine Vorrichtung zum Bestimmen und Wählen des Binärbildes mit der besten Qualität in Fällen, wo mehrere Mengen von Parametern verwendet worden sind, um mehrere Binärbilder zu erzeugen.

ALLGEMEINER STAND DER TECHNIK

Bei vielen Anwendungen ist es wünschenswert, mit automatischen Mitteln aus einem Bild Textinformationen zu extrahieren. So ist beispielsweise die Verwendung einer Maschine zum Lesen von Adressenetiketten ohne manuellen Eingriff eine arbeits- und kostensparende Methode. Bei einer Methode zum automatischen Lesen von Etikettenadressen wird eine Ladungsspeicherbaustein-Kamera ("CCD" = charge-coupled device) verwendet, um ein Bild des Adressenetikettgebiets zu erfassen. Das von der CCD- Kamera gelieferte n · m-Bild wird als Grauwertbild bezeichnet, da jedes der n · m Bildelemente in dem Bild einen Grauwert zwischen Null und einem größten Wert annehmen kann, wobei Null Schwarz ist, der größte Wert Weiß ist und die Zwischenwerte Grau sind. Der größte Wert wird in der Regel 255 oder 1023 betragen. Bei den meisten Anwendungen zum Lesen von Adressenetiketten muß das Grauwertbild in ein Binärbild umgewandelt werden, wobei Bildelemente nur einen von zwei Werten annehmen, 0 für Schwarz und 1 für Weiß. Bei dem Binärbild entsprechen schwarze Bildelemente dem Vordergrund, gewöhnlich Text, während weiße Bildelemente dem Hintergrund entsprechen. Der Prozeß des Umwandelns von einem Grauwertbild in ein Binärbild wird als Schwellwertbildung bezeichnet. Nachdem bei dem Bild eine Schwellwertbildung durchgeführt worden ist, kann das Etikett unter Verwendung eines Prozesses der optischen Zeichenerkennung ("OCR" = optical character recognition) automatisch gelesen werden.
Viele übliche Schwellwertbildungsverfahren haben jedoch aufgrund der großen Vielfalt von Etiketten große Schwierigkeiten beim Trennen des Vordergrunds vom Hintergrund auf Adressenetiketten. Etiketten können verschiedenfarbige Hintergründe, mit verschiedenen Farben gedruckten Text, verschmierte Stellen, Flecken, bandbedingte Abbrände, Filmeffekte, Text mit geringem Kontrast, Graphiken und Kunststofffenster aufweisen. Text auf Etiketten kann mit einem Matrixdrucker oder einem Laserdrucker gedruckt, mit der Schreibmaschine geschrieben oder handgeschrieben sein und eine beliebige einer Reihe von Schriften aufweisen. Die Vielfalt von Etiketten macht es für viele Schwellwertbildungsprozesse schwierig, Vordergrundtext angemessen von Hintergrundtext zu trennen und kann viele fehlerhafte Vordergrund-/Hintergrundzuordnungen bewirken. Es kommt zu einer fehlerhaften Zuordnung, wenn einem Hintergrundbildelement ein Wert von 0 (Schwarz) oder einem Vordergrundtextbildelement ein Wert von 1 (Weiß) zugeordnet wird. Im ersteren Fall wird in das resultierende Binärbild Rauschen eingeführt, und dies kann beim automatischen Lesen des Etiketts unter Verwendung von OCR zu Schwierigkeiten führen. Im letzteren Fall wird Text, der in dem Grauwertbild vorhanden war, entfernt, und der OCR- Prozeß kann wieder versagen.
EP-A-0326436 offenbart ein Verfahren zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, mit den Schritten des Bestimmens des Anteils von Komponenten einer vorbestimmten Größe in den beiden Bildern und des Vergleichens der beiden Anteile.
Zusätzlich zu der Forderung nach Genauigkeit muß eine automatische Schwellwertbildungstechnik schnell und effizient sein, um als kosteneinsparende Technik wirksam zu sein. Bei vielen Anwendungen werden von Post- und Paketlieferdiensten automatische Etikettenlesegeräte eingesetzt, wobei automatische Systeme Pakete mit einer Rate von bis zu 3600 pro Stunde befördern. Bei dieser Rate muß ein Etikett in weniger als einer Sekunde abgebildet und verarbeitet werden, damit es vollständig ist, bevor die Verarbeitung des nächsten Etiketts beginnen muß. Damit die Schwellwertbildungstechnik in Echtzeit verwendet werden kann, muß es bei dem Grauwertbild eine Schwellwertbildung in einer wesentlich unter einer Sekunde liegenden Zeit durchführen, um den OCR- Techniken Zeit zu geben, das Schwellwert-Textbild zu verarbeiten.
Es besteht somit ein Bedarf an einem Schwellwertbildungsverfahren und an einer Schwellwertbildungsvorrichtung, die eine Menge schneller Algorithmen zum Trennen von Vordergrundtext von Hintergrund auf eine Weise einsetzen, durch die die Anzahl der Fehlzuordnungen von Vordergrund bzw. Hintergrund auf ein Minimum reduziert wird. Weiterhin besteht ein Bedarf daran, daß das Schwellwertbildungsverfahren und die Schwellwertbildungsvorrichtung adaptierbar ist, so daß es bzw. sie sich auf die große Vielfalt von Zeichenschriftarten und anderen Unterschieden bei der Textpräsentation einstellen kann.

KURZE DARSTELLUNG DER ERFINDUNG

Bei der Erfindung handelt es sich um ein Verfahren und eine Vorrichtung zum Produzieren eines Binärbildes hoher Qualität, an dem eine Schwellwertbildung durchgeführt worden ist, aus einem Grauwertbild. Bei einer bevorzugten Ausführungsform besteht das Verfahren aus zwei Stufen. Bei der ersten Stufe wird aus dem ursprünglichen Grauwertbild eine Anzahl von Kandidatenbinäretikettenbildern erzeugt. Jedes Kandidatenbild wird erzeugt, indem eine andere Menge von Schwellwertbildungsprozeßparametern auf ein Zwischen bild (das Kontrastbild), das aus dem ursprünglichen Grauwertetikettbild durch Verwenden lokaler und globaler Kontrastinformationen konstruiert worden ist, angewendet wird. Bei der zweiten Stufe werden die Kandidatenbinärbilder verglichen, und das Binärbild mit der besten Qualität wird gewählt. Die Erfindung wird als Label Adaptive Thresholding ("LAT" = Adaptive Etikettenschwellwertbildung) bezeichnet, da sie sich auf viele verschiedene Arten von Etiketten und Zeichen auf den Etiketten einstellt.
Das Verfahren zum Konstruieren des Zwischenkontrastbilds entsprechend einem Grauwertbild umfaßt die Schritte: Wählen einer Position (i, j) in dem Kontrastbild, wobei i die Zeile der Position in dem Kontrastbild und j die Spalte bezeichnet; Finden des kleinsten Graustufenwerts MINij aller Grauwertbildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Zeilen- und Spaltenposition in dem Grauwertbild; Finden des größten Graustufenwert MAXij aller Grauwertbildelemente in dem gleichen rechteckigen Fenster; Berechnen des lokalen Kontrasts LCij des Grauwertbilds durch die Formel
LCij = C (1 - (MINij + p) / (MAXij + p)),
wobei C ein vorgewählter maximaler Kontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen eines Graustufenwert gleich LCij zu der (i, j)-Position des Kontrastbilds; und Wiederholen der obigen Schritte für jede Position, die einem Abschnitt des Grauwertbilds, an dem eine Schwellwertbildung durchgeführt werden soll, entspricht.
Als Teil des Prozesses des Erzeugens eines Kandidatenbinärbilds, an dem eine Schwellwertbildung durchgeführt worden ist, wird ein kleinster zulässiger Kontrastwert gewählt. Das Verfahren zum Wählen dieses Werts umfaßt die Schritte: Konstruieren eines Kontrasthistogramms für alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als ein vorgewählter Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch einen vorgewählten Spitzen-Breiten- Nennwert getrennt sind; Wählen der Minimaltextspitze unter den gefundenen Spitzen durch Auffinden der Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als ein vorgewählter Minimalkontrastwert; und Erhalten des kleinsten zulässigen Kontrastwerts durch Subtrahieren eines vorgewählten Text-Spitzen-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze. Die vorgewählten Werte für den Spitzen-Boden-Pegelwert, den Spitzen-Breiten-Nennwert, den Minimalkontrastwert und den Text-Spitzen-Breiten- Nennwert umfassen zusammen mit den beiden unten beschriebenen Grenzwerten eine Menge von Schwellwertbildungsprozeßparametern.
Schließlich wird ein Kandidatenbinärbild konstruiert, indem jedem Bildelement im Hintergrund eine 1 und jedem Bildelement im Vordergrund eine 0 zugeordnet wird. Die Bildelemente eines Grauwertbilds werden zwischen einer Hintergrundklasse und einer Vordergrundklasse durch ein Verfahren aufgeteilt, das aus den Schritten besteht: Finden des kleinsten Graustufenwerts MINij aller Bildelemente in einem rechteckigen Fenster mit der Mitte auf dem Bildelement; Finden des größten Graustufenwerts MAXij aller Bildelemente in dem rechteckigen Fenster; Berechnen des örtlichen Kontrasts LCij durch die Formel
LCij = C(1 - (MINij + p) / (MAXij + pf),
wobei C ein vorgewählter Maximalkontrastwert und p eine vorgewählte, im Vergleich zu C kleine positive Zahl ist; und Zuordnen des Bildelements zu der Hintergrundklasse, wenn LCij kleiner ist als ein vorgewählter kleinster zulässiger Kontrastwert. Die vorausgegangenen Schritte sind die gleichen wie diejenigen, die zum Berechnen des Kontrastbilds erforderlich sind; wenn das Kontrastbild konstruiert worden ist, brauchen die Schritte nicht wiederholt zu werden.
Für durch den Vergleich des örtlichen Kontrasts mit dem kleinsten zulässigen Kontrastwert der Hintergrundklasse nicht zugeordnete Bildelemente wird die Differenz zwischen MAXij und MINij berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Maximum-Minimum-Differenz kleiner als ein vorgewählter kleinster Kontrastskalenwert ist. Wenn das Bildelement immer noch nicht der Hintergrundklasse zugeordnet wird, wird die Differenz zwischen MAXij und dem Graustufenwert des Bildelements berechnet, und das Bildelement wird der Hintergrundklasse zugeordnet, wenn die Differenz Maximum zu Bildelementwert kleiner ist als ein vorgewählter Kontrastüberschuß-Nennwert. Wenn das Bildelement durch die obigen Schritte nicht der Hintergrundklasse zugeordnet wird, dann wird das Bildelement der Vordergrundklasse zugeordnet.
Die Erfindung sieht die Verwendung von zwei oder mehr Mengen von Schwellwertbildungsprozeßparametern, die zwei oder mehr Kandidatenbinärbilder liefern, vor. Um zwischen zwei beliebigen Kandidatenbinärbildern, die einer Schwellwertbildung unterzogen wurden, eines ursprünglichen Grauwertbilds zu wählen, verwendet die Erfindung ein Verfahren, das die Schritte umfaßt: Umwandeln der Abschnitte der Binärbilder entsprechend dem Vordergrund in ein lauflängencodiertes Bild (RLE- Bild); Bestimmen der Anzahl und Größe der Stücke (d. h. die Stückgrößenverteilung) der RLE-Bilder unter Verwendung von Stückextrahierung; Konstruieren von Histogrammen der Stückgrößenverteilungen der RLE- Bilder; und Verwendung des Histogramms für statistische oder Neuronennetzanalyse, um eines der beiden Binärbilder zu wählen. Wenn mehr als zwei Binärbilder vorliegen, wird dieses Verfahren paarweise angewendet, bis alle Binärbilder mit Ausnahme von einem eliminiert worden sind. Die Verwendung von RLE-Bildern ist fakultativ, doch wird durch ihre Verwendung die Verarbeitungszeit im Gegensatz zu der Technik, die die Stückgrößenverteilungen aus den Binärbildern in Positionsdarstellungen bestimmt, stark reduziert.
Die Stückgrößenverteilung eines Binärbilds ist eine Spezifikation der Anzahl von Stücken nach Größe für Stücke jedes Binärbilds mit dem einen oder dem anderen der beiden Werte des Binärbilds. Die Stückgrößenverteilung kann für einfache Vergleiche von zwei Binärbildern verwendet werden, selbst wenn es um keine Qualitätswahl geht.
Somit besteht eine Aufgabe der vorliegenden Erfindung in der Bereitstellung eines Verfahrens und einer Vorrichtung zur schnellen Schwellwertbildung eines Grauwertbilds.
Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, die Informationen über den örtlichen Kontrast in einem Grauwertbild verwendet, um Text in dem Bild eindeutig zu identifizieren.
Eine weitere Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung eines Verfahrens und einer Vorrichtung, um unter zwei oder mehr Kandidatenbinärbildern, die durch Schwellwertbildung aus einem textenthaltenden ursprünglichen Grauwertbild gewonnen wurden, dasjenige Binärbild zu wählen, das im Vordergrund Text und im Hintergrund keinen Text am besten darstellt.
Eine weitere Aufgabe der vorliegenden Erfindung besteht in der automatischen Verarbeitung von Etiketten mit schlechter Lesbarkeit, um ein Binärbild hoher Qualität für die OCR-Eingabe zu erzeugen.
Die vorliegende Erfindung erfüllt diese Aufgaben und überwindet die Nachteile des Standes der Technik, wie aus der ausführlichen Beschreibung der nachfolgenden Ausführungsformen hervorgeht.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Fig. 1 zeigt die Hauptschritte und den Datenfluß einer Ausführungsform des Verfahrens der Erfindung.
Fig. 2 zeigt die Hauptschritte und den Datenfluß, die mit der Schwellwertbildungstechnik einer Ausführungsform des Verfahrens der Erfindung verbunden sind.
Fig. 3 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MIN-Bilds.
Fig. 4 zeigt eine beispielhafte Menge von Bildelementwerten für ein Grauwertbild und veranschaulicht die Konstruktion des MAX-Bilds.
Fig. 5 veranschaulicht die Konstruktion des Kontrastbilds aus dem MIN- und MAX-Bild.
Fig. 6 zeigt ein typisches Kontrasthistogramm und veranschaulicht die verschiedenen, mit einer Ausführungsform des Verfahrens der Erfindung verbundenen Schwellwertbildungsprozeßparameter.
Fig. 7 zeigt ein beispielhaftes Binärbild, um die Reduktion bei den Repräsentationsdaten zu veranschaulichen, die sich aus der Umwandlung des Binärbilds in ein lauflängencodiertes (RLE-)Format ergibt.
Fig. 8 zeigt ein Grauwertbild eines beispielhaften Etiketts.
Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer Menge von Schwellwertbildungsparametern.
Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer zweiten Menge von Schwellwertbildungsparametern.
Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt wurde, des Grauwertbilds in Fig. 8 unter Verwendung einer dritten Menge von Schwellwertbildungsparametern.
Fig. 12 ist ein Blockschaltbild der Hauptkomponenten einer bevorzugten Ausführungsform der Vorrichtung der Erfindung.

AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN

Fig. 1 ist ein Blockschaltbild des Gesamtprozesses und des Datenflusses einer Ausführungsform der Erfindung. Fig. 2 ist ein Blockschaltbild der Hauptschritte und des Datenflusses in Stufe Eins einer Ausführungsform der Erfindung. In Block 1 von Fig. 1 beginnt Stufe Eins des Prozesses, wenn digitale Daten erfaßt werden, die ein Grauwertbild darstellen. Das Grauwertbild weist n · m Bildelemente auf, die n Zeilen und m Spalten von Bildelementen darstellen, jeweils mit einem Graustufenwert von 1 bis zu dem von der Einrichtung, die das Bild erzeugt, bereitgestellten Maximum. Bei der Einrichtung handelt es sich vorzugsweise um eine CCD-Kamera, und die Grauwerte des Bildelements variieren von 0 (Schwarz) zu 255 (Weiß). Ebenfalls in Block 1 von Fig. 1 werden aus dem Grauwertbild drei getrennte Bilder mit n · m Bildelementen konstruiert: das MIN-Bild; das MAX-Bild und das Kontrastbild. Das Bildelement in Zeile i und Spalte j in dem MIN-Bild enthält den kleinsten Graustufenwert in einem kleinen Bereich, vorzugsweise einem rechteckigen Kasten, um Zeile i und Spalte j des Grauwertbilds herum. Bei dieser Spezifikation werden Zeile i und Spalte j eines Bilds auch als die (i, j)- Position eines Bilds bezeichnet. Das MAX-Bild wird unter Verwendung von Maximalwerten anstatt Minimalwerten analog konstruiert. Das Bildelement bei der (i, j)-Position des Kontrastbilds wird aus den Werten in den (i, j)-Positionen in dem MIN- und dem MAX-Bild algebraisch berechnet. Außerdem wird ein Histogramm der Werte in dem Kontrastbild berechnet. Diese Schritte sind in den Blöcken 1 bis 4 in Fig. 2 ausführlicher gezeigt. Wie im Block 2 von Fig. 1 und Block 6 von Fig. 2 gezeigt, wird an dem Kontrasthistogramm eine Spitzenanalyse unter Verwendung einer Menge von Schwellwertbildungsparametern durchgeführt. Mit den Ergebnissen der Spitzenanalyse wird ein Minimalkontrastwert gewählt, so daß, wie im Block 7 von Fig. 2 gezeigt, an dem Kontrastbild eine Schwellwertbildung durchgeführt werden kann. Wie im Block 8 von Fig. 2 gezeigt, wird das Kontrastbild, an dem eine Schwellwertbildung durchgeführt wurde, zusammen mit dem ursprünglichen Grauwertbild, dem MIN- Bild, dem MAX-Bild und dem Kontrastbild selbst verwendet, um ein Binärbild zu liefern.
Fig. 2 zeigt auch den Datenfluß, der mit der Konstruktion und Verwendung der verschiedenen Zwischenkonstruktionen des Verfahrens, wie beispielsweise dem MIN-Bild, dem MAX-Bild und dem Kontrastbild und dem Kontrasthistogramm verbunden ist. Falls erforderlich, können die in einem Schritt des Verfahrens erzeugten Daten die Verarbeitung von einem Verfahrensschritt zu dem nächsten Verfahrensschritt begleiten. So ist beispielsweise die Konstruktion des MIN-Bilds, des MAX- Bilds und des Kontrastbilds erforderlich, um das Kontrasthistogramm zu bilden und die Histogrammspitzenanalyse gemäß der Erfindung durchzuführen. Jedoch werden diese drei Bilder, nachdem sie konstruiert worden sind, möglicherweise in den abschließenden Schritten der Spitzenanalyse und der Schwellwertbildung des ursprünglichen Grauwertbilds wieder verwendet. Die dicken Linien von Fig. 2 zeigen, wie die Daten für das ursprüngliche Grauwertbild, das MIN-Bild, das MAX-Bild und das Kontrastbild zur Verwendung durch spätere Schritte in dem Verfahren verfügbar gemacht werden. Das Erkennen der doppelten Verwendung dieser Zwischenbilder und des Designs des Schwellwertbildungsverfahrens zur Wiederverwendung der Zwischenbilder, anstatt sie zu rekonstruieren, stellt einen wichtigen Teil der durch die Erfindung erzielten Zeiteinsparungen und Geschwindigkeit dar.
Stufe Zwei der Erfindung beginnt mit den in Stufe Eins produzierten Binärbildern. Fig. 1 zeigt eine bevorzugte Betriebsart, in der drei Mengen von Schwellwertbildungsprozeßparametern verwendet werden, um drei Binärbilder zu erzeugen, an denen eine Schwellwertbildung durchgeführt wurde. Wenn gewünscht wird, zusätzliche Mengen von Prozeßparametern zu verwenden, dann würden die durch Blöcke 2 bis 5 von Fig. 1 dargestellten Schritte für jede Menge von Prozeßparametern wiederholt werden.
Jedes Binärbild wird in Block 3, 7 und 11 von Fig. 1 in eine lauflängencodierte Form (RLE-Form) umgewandelt. Als nächstes wird in den Blöcken 1, 8 und 12 eine Stückextrahierung durchgeführt, um Anzahl und Größe der verbundenen Komponenten zu bestimmen. In den Blöcken 5, 9 und 13 wird für jedes Bild ein Histogramm der Stückgrößenverteilung konstruiert. In Block 14 werden die Stückgrößenhistogramme und die RLE-Bilder verwendet, um das Binärbild mit der höchsten Qualität zu wählen. In Fig. 1 zeigen die dicken Linien, zusätzlich zu dem normalen Datenfluß von einem Verfahrensschritt zum nächsten, den Datenfluß, der mit dem Liefern der RLE-Daten für jedes Binärbild direkt an den letzten Schritt im Block 14 verbunden ist.
Für höchste Geschwindigkeit kann das Verfahren der Erfindung an einem Vektorprozessor realisiert werden. Der Vektorprozessor verwendet vorzugsweise eine Auswahl von 150/40-Verarbeitungsmodulen der Firma Imaging Technology, Inc. Die 150/40-Module können, wie in Fig. 12 gezeigt, über einen VME-Bus zusammengeschaltet sein. An den VME-Bus können auch ein oder mehrere allgemeine Prozessoren 21, 22 und 23, wie zum Beispiel der von der Firma Heurikon Corporation vertriebene Prozessor Nitro60 angeschlossen sein. Ein Bildmanager 31, wie zum Beispiel das von der Firma Imaging Technology Inc. vertriebene Modul IMA 150/40, und eine Rechenmodulsteuerung 41, wie beispielsweise das ebenfalls von der Firma Imaging Technology Inc. vertriebene Modul CMC 150/40, können ebenfalls an den VME-Bus angeschlossen sein. Das Verfahren der Erfindung kann in der Sprache C codiert werden und zur Installation auf den Nitro60-Prozessoren 21, 22 und 23 und den anderen verarbeitenden Modulen auf dem VME-Bus querkompiliert sein. Ein Nitro60-Prozessor 21 kann eine Maussteuerleitung 25 und einen R5232-Port 26 zur Bereitstellung von Bedienersteuerung über das System aufweisen. Ein Nitro60-Prozessor 21 kann auch Datenports wie zum Beispiel einen SCSI-2-Port 28 und einen Ethernet-Port 29 aufweisen. Das IMA-150/40-Modul 31 stellt vorzugsweise vier Megabyte an Speicher zum Speichern von bis zu vier 1024 · 1024 Bildern bereit und liefert die Gesamttaktsteuerung an die Pipeline- Hardware. Das IMA-150/40-Modul 31 läßt auch bis zu drei Tochterplatinen 32, 33 und 34, unten erörtert, zu. Das CMC-150/40-Modul 41 arbeitet wie ein Pipeline- Schaltmodul, läßt bis zu drei Tochterplatinen 42, 43 und 44 zu und leitet Bilder zu etwaigen Tochterplatinen und von diesen weg. Das IMA-150/40-Modul 31 und das CMC-150/40-Modul 41 sind über einen Bildelementbus 71 separat zusammengeschaltet.
Drei Tochterplatinen sind auf dem IMA-150/40- Modul 31 montiert. Die AMDIG-Tochterplatine 34 erhält Grauwertbilddaten von der CCD-Kamera, vorzugsweise einer Kamera KodakTM Megaplus 1.4, und leitet die Bilddaten zu einem entsprechenden Speichergebiet in dem IMA-150/40-Modul 31. Die AMDIG-Tochterplatine 34 kann die Eingangsbilddaten gegebenenfalls auch skalieren. Die DMPC-Tochterplatine 32 kann über einen hochauflösenden RGB-Monitor 61 eine Anzeige jedes beliebigen Bilds bereitstellen. Die MMP-Tochterplatine 33 ist ein morphologischer Prozessor, der automatisch das MAX- und MIN-Bild liefert, wenn ihm ein Grauwertbild und eine Rechteckkastengröße geliefert wird. Auf dem CMC-150/40-Modul 41 sind drei zusätzliche Tochterplatinen montiert. Die HF-Tochterplatine 43 ist ein Histogramm- und Merkmalsextrahierer, der, wenn ihm ein Binärbild geliefert wird, automatisch ein Histogramm aus 256 Behältern liefert. Der Merkmalsextrahierer kann auch verwendet werden, um automatisch RLE-Bilder zu erzeugen. Die CLU- Tochterplatine 44 ist ein Convolver und Logikprozessor, der automatisch das Kontrastbild liefert. Die PA- Tochterplatine 42 ist ein separater Digitalsignalprozessor, der parallel zu der Pipeline- Verarbeitung asynchron als Coprozessor arbeitet. Diese Tochterplatine wird verwendet, um das Qualitätsschätzverfahren zu liefern: Empfangen mehrerer RLE-Bilder, Wählen des besten RLE-Bilds und Liefern der Daten für das beste RLE-Bild zu einem der Nitro60- Prozessoren 21, 22 und 23 zur OCR-Verarbeitung. Die gesamte Hardwarekonfiguration in Fig. 12 arbeitet mit der Geschwindigkeit von 40 Megabildelementen pro Sekunde, was impliziert, daß ein ein Megabyte großes Bild (1024 · 1024 Bildelemente) zur Verarbeitung etwa 28 Millisekunden erfordert. Bei dieser Geschwindigkeit sind weniger als 0,5 Sekunden erforderlich, um drei parametrische Schwellwertbildungen eines einzelnen 1024 · 1024-Grauwertbilds zu konstruieren und für die OCR- Verarbeitung das Binärbild, an dem eine Schwellwertbildung durchgeführt wurde und das die beste Qualität aufweist, zu wählen.
Das Verfahren der Erfindung kann auch auf jedem beliebigen Digitalrechner mit ausreichend Speicher zum Aufnehmen des ursprünglichen Grauwertbilds, der Zwischenverarbeitungsbilder (das MIN-Bild, das MAX-Bild und das Kontrastbild) und mindestens zwei binärer Bilder, an denen eine Schwellwertbildung durchgeführt wurde, realisiert werden. Das Programmieren des Verfahrens auf einem Digitalrechner kann in der C- Sprache oder jeder vergleichbaren Verarbeitungssprache durchgeführt werden.
Aus dieser Übersicht beschreiben wir nun das gesamte Verfahren ausführlich. An einer gegebenen Stelle (i, j) in dem Grauwertetikettenbild wird durch die folgende Vorgehensweise ein örtlicher Kontrast erhalten:
Schritt 1. Finde den kleinsten Graupegelwert (MINij) in einem k · k-Fenster mit der Mitte bei (i, j).
Schritt 2. Finde den größten Graupegelwert (MAXij) in dem gleichen Fenster.
Schritt 3. Der örtliche Kontrast LC bei (i, j) wird berechnet als:
LCij - C · (1 - (MINij + p) / (MAXij + p))
Der Wert C wird auf der Grundlage des gewünschten größten Werts für den örtlichen Kontrast gewählt. Bei Grauwertbildern mit hohem Kontrast kann ein kleiner Wert von C möglicherweise ausreichen, um zwischen Vordergrund und Hintergrund zu differenzieren. Bei Grauwertbildern mit niedrigem Kontrast kann eine größere Differenzierung beim Kontrast notwendig sein, um zwischen Vordergrund und Hintergrund zu wählen. Für C wird ein Wert von 255 bevorzugt. Dieser Wert funktioniert bei den meisten Grauwertbildern und gestattet, die Werte des Kontrastbilds eines pro 8-Bit- Byte zu speichern. Der Wert p wird so gewählt, daß er positiv und im Vergleich zu C klein ist. Seine Hauptrolle besteht darin, vor Dividieren durch Null zu schützen, und er sollte so gewählt werden, daß er eine schnelle Berechnung des Werts des örtlichen Kontrasts erleichtert. Eins ist ein bevorzugter Wert für p.
Die obige Formel für örtlichen Kontrast führt zu einem großen örtlichen Kontrast LCij, wenn zwischen dem kleinsten und größten Bildelement in dem k x k- Fenster bei einem Graupegel eine große Differenz vorliegt. Der Wert des örtlichen Kontrasts kann zwischen 0 und C variieren, wobei 0 der kleinste Kontrast und C der größte Kontrast ist. Es ist nicht erforderlich, daß der größte Kontrastwert der gleiche ist wie der größtmögliche Bildelementwert in dem ursprünglichen Grauwertbild. Der bevorzugte maximale Kontrastwert beträgt jedoch 255, und dieser Wert wird im Rest der ausführlichen Beschreibung verwendet.
Es wird ein neues Bild erstellt, das das Kontrastbild genannt wird und das die Informationen über den örtlichen Kontrast enthält. Für jedes Grauwertbildelement bei (I, j) in dem ursprünglichen Etikettenbild wird ein entsprechendes Bildelement in dem Kontrastbild vom Wert her gleich LCij gesetzt. Jedem Bildelement in dem Kontrastbild ist auf diese Weise ein Wert zwischen null und dem größten Kontrast zugeordnet. Analog dazu werden die beiden anderen neuen Bilder erzeugt, das MIN-Bild und das MAX-Bild. Das Bildelement in der (i, j)-Position des MIN-Bilds hat den Wert MINij, und das Bildelement in der entsprechenden Position in dem MAX-Bild hat den Wert MAXij.
Der Fenstergrößenparameter k wird bestimmt, indem die größte zulässige Strichstärke für ein Textzeichen gefunden wird. Beispielsweise weist ein Zeichen bei einer Schrift von 8 Punkten bei 250 Punkten pro Inch eine Strichstärke von etwa 3 Bildelementen auf. Bei der gleichen Auflösung weist ein Zeichen bei einer Schrift von 18 Punkten eine Strichstärke von etwa 14 Bildelementen auf. Der Wert k wird dann geringfügig größer als diese größte zulässige Stärke eingestellt. Um beispielsweise für ein Etikett mit einer Schrift mit 18 Punkten hohe Textkontrastwerte zu haben, muß die Abmessung k des Fensters größer als 14 Bildelemente sein. Wenn die Abmessung kleiner ist als dieser Betrag, dann wird für Bildelemente, die sich in der Mitte eines Zeichenstrichs befinden, ein sehr niedriger Kontrastwert erhalten, da alle Graustufenwerte innerhalb des in der Mitte angeordneten k · k-Fensters fast gleich sein werden. Bei einigen Anwendungen bzw. Zeichenschriften kann möglicherweise die Verwendung eines rechteckigen Fensters der Größe k · j, wobei k und j verschiedene Werte aufweisen, vorzuziehen sein. Eine bevorzugte Fenstergröße ist ein Quadrat von 15 Bildelementen mal 15 Bildelementen. Diese Fenstergröße gestattet die Verarbeitung von Zeichen in jeder Drehausrichtung bis zu einer Schriftgröße von 18 Punkten.
In Fig. 3, 4 und 5 sind Beispiele gezeigt, die die Ableitung der Bildelementwerte für das MIN- Bild, das MAX-Bild und das Kontrastbild zeigen. In allen drei Fällen wird eine quadratische Fenstergröße verwendet, und k ist so gewählt, daß es einen Wert von 3 aufweist. In Fig. 3 werden die Bildelementwerte des ursprünglichen Grauwertbilds im oberen Abschnitt der Figur in der linken oberen Ecke gezeigt; der kleinste Bildelementwert von "3" in einem 3 · 3-Quadrat um die (2,2)-Position herum bestimmt, daß die (2,2)-Position des MIN-Bilds einen Wert von "3" aufweist. Analog dazu wird die (6,6)-Position des MIN-Bilds als "195" bestimmt. An den Rändern des Grauwertbilds enthält das Fenster Gebiete außerhalb des Grauwertbilds. Der Bildelementwert für ein beliebiges Gebiet außerhalb des ursprünglichen Bilds wird als Null angesehen.
In Fig. 4 ist zu sehen, daß die (2,2)-Position des MAX-Bilds einen Wert von "39" aufweist, während die (6,6)-Position einen Wert von "231" aufweist. Fig. 5 veranschaulicht, wie die Ableitung des MIN-Bilds und des MAX-Bilds durch algebraische Berechnung direkt zu dem Kontrastbild führt.
Um das Kontrasthistogramm zu konstruieren, wird eine Menge von 256 Behältern erzeugt, die jeweils einem der Kontrastpegel (0-255) entsprechen. Nacheinander wird jedes Bildelement in dem Kontrastbild untersucht, und der dem Bildelementwert entsprechende Behälter wird um Eins erhöht. Dies bildet das Kontrasthistogramm, das einen Zählwert der Anzahl von Bildelementen in dem Bild, die Bildelementwerte bei jedem Graupegel aufweisen, darstellt. Ein Beispiel für ein Kontrasthistogramm ist in Fig. 6 gezeigt.
Spitzen in dem Kontrasthistogramm entsprechen Teilen des Grauwertetikettenbilds, die ähnlichen Kontrast aufweisen. Es handelt sich im allgemeinen bei diesen Teilen bzw. Kontrastsegmenten um ähnliche Arten von Text, Graphik oder Rauschen. Die Spitzenanalyse ist der Prozeß, bei dem bestimmt wird, welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Text handelt, und welche Spitzen Kontrastsegmenten entsprechen, bei denen es sich um Hintergrund oder Rauschen handelt. Das Ergebnis der Spitzenanalyse hilft bei der korrekten Zuordnung von 0 (Schwarz) für Textbildelemente und 1 (Weiß) für Hintergrund- bzw. Rauschbildelemente.
Bei der Spitzenanalyse lautet die zugrundeliegende Annahme, daß bei einem gegebenen Etikett der Kontrastwert für Kontrastsegmente entsprechend Hintergrundbildelementen und Rauschbildelementen im Durchschnitt kleiner ist als die Werte für die Vordergrund/Textbildelemente. Es gibt jedoch eine Reihe von Schwierigkeiten, zu denen es aufgrund der Vielfalt von Etiketten kommt. Diese Schwierigkeiten sind wie folgt aufgezählt:
1. Die Anzahl der Kontrastelemente ist veränderlich. Deshalb ist die Anzahl der Kontrastspitzen in dem Kontrasthistogramm veränderlich. Dies bedeutet auch, daß es mehrere Hintergrund- oder Rauschspitzen sowie mehrere Textspitzen geben kann.
2. Der durchschnittliche Kontrastwert für ein Kontrastsegment ist veränderlich. Deshalb ist die Stelle von Kontrastspitzen in dem Kontrasthistogramm veränderlich.
3. Die Anzahl der Bildelemente in einem Kontrastsegment ist veränderlich. Deshalb ist die Höhe einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
4. Die Verteilung von Kontrastwerten um den durchschnittlichen Kontrastwert in einem Kontrastsegment herum ist veränderlich. Deshalb ist die Breite einer Kontrastspitze in dem Kontrasthistogramm veränderlich.
Bei einem gegebenen Kontrasthistogramm mit mehreren Spitzen mit verschiedenen Höhen, Breiten und Stellen besteht das Ziel der Spitzenanalyse darin, einen Kontrastwert zu finden, der als der kleinste zulässige Kontrast bezeichnet wird, so daß einem beliebigen Bildelement mit einem Kontrastwert unter diesem Wert automatisch ein Wert von 1 (Hintergrund oder Rauschen) zugeordnet wird.
Zur Bewältigung dieser Aufgabe wird eine Menge von Schwellwertbildungsprozeßparametern zur Analyse des Kontrasthistogramms verwendet. Diese Parameter sind: (1) Spitzen-Boden-Pegel, (2) Minimalkontrastwert, (3) Spitzen-Breiten-Nennwert und (4) Text-Spitzen-Breiten- Nennwert. Die Parameter sind in Fig. 6 veranschaulicht.
Der Spitzen-Boden-Pegel ist die kleinste Höhe, die eine Kontrasthistogrammspitze aufweisen kann. Etwaige Kontrasthistogrammspitzen, die unter dem Spitzen-Boden-Pegel liegen, werden als möglichen Textkontrastsegmenten nicht entsprechend betrachtet. Der Spitzen-Boden-Pegel variiert in der Regel von 800 bis 1200 und ist vorzugsweise für ein Bild mit einer Größe von 1024 · 1024 Bildelementen auf 1100 eingestellt.
Der Minimalkontrastwert ist der kleinste Wert, den ein Kontrastbildelement aufweisen kann und immer noch als Teil eines Textkontrastsegments betrachtet werden kann. Er hat vorzugsweise einen Wert von 25 bis 75, wenn C einen Wert von 255 aufweist.
Der Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden. Er weist vorzugsweise einen Wert von 50 bis 75 auf, wenn C einen Wert von 255 aufweist.
Der Text-Spitzen-Breiten-Nennwert ist die Anzahl unterschiedlicher Kontrastwerte, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht. Er weist vorzugsweise einen Wert von 25 bis 75 auf, wenn C einen Wert von 255 aufweist.
Der Prozeß der Spitzenanalyse für das Kontrasthistogramm ist ein Prozeß zur Ermöglichung der Schwellwertbildung bei dem Kontrastbild durch Bestimmen eines kleinsten zulässigen Kontrasts. Dieser Prozeß ist wie folgt:
Schritt 1. Spitzensuche: Finde den Kontrasthistogramm-Kontrastwert mit der größten Anzahl von Bildelementen. Dies ist die größte aktuelle Spitze.
Schritt 2. Spitzenbewertung: Wenn die Spitzenhöhe nicht größer ist als der Spitzen-Boden- Pegel, gehe zu Schritt 6. Die Spitze wird nicht zugelassen, da sie zu kurz ist.
Schritt 3. Spitzenspeicherung: Speichere den Spitzenkontrastwert.
Schritt 4. Spitzensperrung: Sperre die Spitzensuche innerhalb des Spitzen-Breiten-Nennwerts dieser Spitze und aller vorausgegangener Spitzen.
Schritt 5. Gehe zu Schritt 1.
Schritt 6. Spitzenwahl: Finde die gespeicherte Spitze, die sich bei dem kleinsten Kontrastwert befindet, der größer ist als der Minimalkontrastwert. Dies wird als die Minimaltextspitze bezeichnet.
Schritt 7. Schwellwertbestimmung: Subtrahiere den Text-Spitzen-Breiten-Nennwert von dem Kontrastwert der Minimaltextspitze. Dies ist der kleinste zulässige Kontrast.
Die Anwendung des Prozesses der Spitzenanalyse auf das in Fig. 6 gezeigte Kontrasthistogramm führt zu der Identifizierung von drei Textspitzen: Spitze 2, Spitze 3 und Spitze 4. Spitze 3 ist die Minimaltextspitze. Die Identifizierung von Spitze 3 gestattet die Bestimmung des kleinsten zulässigen Kontrasts, wie in Fig. 6 gezeigt.
Nachdem der kleinste zulässige Kontrast bestimmt worden ist, kann das ursprüngliche Grauwertbild einer Schwellwertbildung unterzogen werden. Wenn das Bildelement bei (i, j) in dem ursprünglichen Bild, seine Werte MINij, MAXjj und LCij gegeben sind, werden die folgenden Schritte unternommen, um zu bestimmen, ob es sich bei dem Bildelement um Vordergrund (Text) oder Hintergrund handelt:
Schritt 1. Ist LCij größer als der kleinste zulässige Kontrast? Wenn nicht, dann wird das Bildelement bei (i, j) als Hintergrund bezeichnet.
Schritt 2. Ist MAXij-MINij ausreichend groß? Wenn nicht, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-MIN; mit einem ersten, als Minimalkontrastskala bezeichneten Grenzwert verglichen. Wenn diese Differenz geringer ist, wird das Bildelement als Hintergrund bezeichnet. Der Minimalkontrastskala- Wert liegt vorzugsweise zwischen 20 und 32, wenn C einen Wert von 255 aufweist.
Schritt 3. Liegt das Bildelement bei (i, j) viel näher an MINij oder näher an MAXij? Wenn ausreichend näher an MAXij, dann wird das Bildelement bei (i,j) als Hintergrund bezeichnet. Um diesen Test zu realisieren, wird die Differenz MAXij-(Wert des Bildelements bei (i, j)) mit einem als Kontrastüberschuß-Nennwert bezeichneten zweiten Grenzwert verglichen. Wenn diese Differenz niedriger ist, wird das Bildelement als Hintergrund bezeichnet. Der Kontrastüberschuß-Nennwert liegt vorzugsweise in der Mitte zwischen MINij und MAXij, d. h. (MINij + MAXij)/2.
Schritt 4. Wenn das Bildelement bei (i, j) durch keinen der obigen drei Tests als Hintergrund bezeichnet worden ist, dann wird das Bildelement als Vordergrund (Text) bezeichnet.
Die Schwellwertbildung des Grauwertbilds mit einer spezifischen Menge von Parametern vervollständigt die erste Stufe der Verarbeitung. Die Leistung der Stufe Eins hängt von der Wahl einer adäquaten Menge von Schwellwertbildungsprozeßparametern ab. Die oben spezifizierte Menge von Parametern führt für eine große Vielfalt von Etiketten zu zufriedenstellenden Ergebnissen. Es ist allerdings schwierig, für die ganze Vielfalt von Etiketten, die man in allen gegebenen Umfeldern möglicherweise antreffen kann, eine einzige Menge von Parametern zu finden, die zu zufriedenstellenden Ergebnissen führt. Mit einem Verfahren zum Wählen zwischen mehreren Mengen von Prozeßparametern ist es jedoch möglich, zwei oder drei Mengen von Parametern zu finden, die fast alle Möglichkeiten abdecken. Drei Mengen von Prozeßparametern sind in Tabelle 1 angegeben und werden im Zusammenhang mit dem unten erörterten Beispiel 1 verwendet.
Um ein gegebenes Grauwertbild mit einer Menge von Verarbeitungsparametern einer Schwellwertbildung zu unterziehen, ist es vorzuziehen, die zu verwendenden Parameterwerte vorzuwählen. Wie aus der obigen Beschreibung der Schwellwertbildungsschritte zu erkennen ist, bedeutet der Ausdruck "vorgewählt" nicht nur das Vorwählen konstanter Werte, sondern auch das Vorwählen von Formeln, die zum Bestimmen der in Frage kommenden Werte verwendet werden können.
Wenn ein Etikettenbild durch das LAT-Verfahren und die LAT-Vorrichtung mehrmals verarbeitet worden ist, jedesmal mit einer anderen Menge von Prozeßparametern, so ist das Ergebnis eine Menge von Etikettenbildern, an denen eine Schwellwertbildung durchgeführt worden ist. Es wird dann notwendig, automatisch zu beurteilen, welches Bild der Menge, an dem eine Schwellwertbildung durchgeführt worden ist, beste ist, das heißt zu beurteilen, welches die höchste Qualität für die OCR-Verarbeitung aufweist. Die zweite Stufe der Erfindung, nämlich die Qualitätsanalyse, ergänzt die oben beschriebene Verarbeitung in Stufe Eins und liefert das erforderliche Urteil, um das beste Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen.
Der Prozeß der Qualitätsanalyse weist die folgenden Hauptschritte auf:
Schritt 1. Erzeugen einer Schwellwertbildung unterzogene Bilder unter Verwendung von n Mengen von Prozeßparametern.
Schritt 2. Wandle jedes Binärbild in ein lauflängencodiertes Bild (RLE-Bild) um.
Schritt 3. Führe an jedem RLE-Bild eine Stückextrahierung durch und bestimme Anzahl und Größe verbundener Komponenten in dem Bild.
Schritt 4. Unter Verwendung statistischer Informationen, bestimme paarweise auf der Grundlage der Verteilung von Stückgrößen in jedem der beiden Bilder, welches der beiden Bilder die höhere Qualität aufweist.
Schritt 5. Unter Verwendung des in Schritt 4 gewählten Bilds mit einem beliebigen anderen, noch nicht verglichenen Bild, wiederhole Schritt 4. Fahre fort, bis alle Bilder verglichen worden sind, um dasjenige Bild, an dem eine Schwellwertbildung durchgeführt worden ist, zu wählen, das die höchste Qualität aufweist.
In Schritt Eins wird Stufe Eins des LAT- Verfahrens n-mal durchgeführt, um n Bilder zu erzeugen, jedes mit einer anderen Menge von Prozeßparametern.
Jedes so erzeugte Binärbild ist lauflängencodiert. Die Lauflängencodierung (RLE) ist ein Prozeß, der ein aus binären Bildelementen bestehendes Bild in eine andere Darstellung umwandelt. Bei dieser Darstellung wird jede horizontal verbundene Gruppe von schwarzen Bildelementen, die als ein Lauf bezeichnet wird, in das RLE-Format umgewandelt, indem nur die Stelle des Anfangsbildelements für den Lauf und die Länge des Laufs beibehalten werden. Alle Läufe werden auf diese Weise umgewandelt. RLE ist eine standardmäßige Bildverarbeitungstechnik.
Die RLE-Umwandlung neigt dazu, die Größe des Bilds beträchtlich zu reduzieren, ohne die Qualität des Binärbilds zu reduzieren. Als Beispiel handelt es sich bei dem Bild in Fig. 7 um ein 100 · 100-Binärbild, das üblicherweise eine Speicherung von 10 000 Bit erfordert. Da es jedoch nur einen vertikalen Balken (mit einer Höhe von 100 Bildelementen und einer Stärke von 3 Bildelementen) enthält, kann es im RLE-Format durch 100 Anfangsbyte jeweils mit einem Längenbyte (mit Wert 3) dargestellt werden. Dieses Bild erfordert deshalb im RLE-Format nur eine Speicherung von 200 Byte. Es hat sich gezeigt, daß einige Algorithmen aufgrund des Charakters dieses Formats sowie der kleineren Darstellung weniger Ausführungszeit benötigen.
Jedes RLE-Bild wird als nächstes einer Stückextrahierung unterzogen. Die Stückextrahierung ist eine standardmäßige Bildverarbeitungstechnik, um Läufe zu finden, die verschiedene Linien der Bilder berühren. Läufe, die sich berühren, werden als verbundene Komponenten bezeichnet. Beim Zusammenbau von Gruppen von verbundenen Läufen werden Stücke gebildet. Ein Stück kann beispielsweise ein mit einer Schreibmaschine geschriebenes Zeichen oder ein Rauschfleck sein.
Mit den auf diese Weise zusammengetragenen statistischen Informationen kann das Bild mit der besten Qualität gewählt werden. Die Qualitätsschätzung ist ein Verfahren zum Untersuchen der Ergebnisse des LAT-Prozesses und zum Beurteilen, welcher Schwellwert der beste unter einer Gruppe von Bildern ist. Dieser Prozeß verwendet zum Schätzen der Qualität die Größe von durch den Stückextrahierungsalgorithmus erzeugten Stücken (d. h. die Anzahl von Bildelementen in einem Stück).
Die Stückgröße ist zum Untersuchen ein sehr nützliches Merkmal, da sie eine gute Darstellung der Qualität von auf Text basierenden Bildern wie beispielsweise Etiketten liefert. Die zugrundeliegende Annahme lautet, daß die Verteilung von Stückgrößen Informationen über die Menge an Rauschen und Text, die sich in einem Bild finden, das einer Schwellwertbildung unterzogen worden ist, liefert. Bilder mit vielen kleinen Stücken neigen dazu, verrauscht zu sein. Bilder mit vielen großen Stücken neigen dazu, Text mit hoher Qualität aufzuweisen. Bilder weisen oftmals eine gewisse Menge an Stücken mit vielen unterschiedlichen Größen auf.
Die Erfindung verwendet ein Histogramm der Stückgrößen als Merkmalsmenge für die Qualitätsschätzung. Der Bereich von Stückgrößen wird in b Behälter unterteilt. Jeder Behälter enthält die Anzahl von Stücken in den Bildern, die innerhalb des Größenbereichs des Behälters liegen. Ein Entscheidungstreffungsprozeß wird zum Untersuchen des Histogramms verwendet, um zu bestimmen, ob das Bild eine bessere Qualität als jedes andere der Bilder, die einer Schwellwertbildung unterzogen worden sind, aufweist. Zur Durchführung dieser Untersuchung sind zwei verschiedene Entscheidungsprozesse entwickelt worden:
1. Der erste Entscheidungsprozeß verwendet ein Histogramm mit zwei Behältern. Behälter 1 (Rauschen) enthält kleine Stücke mit einer Größe zwischen 0 und 10 Bildelementen. Behälter 2 (Groß) enthält große Stücke mit einer Größe von über 100 Bildelementen. Bezeichne die Bilder so, daß das Bild mit mehr großen Stücken mit der Nummer 1 bezeichnet wird, d. h. Groß(1)> Groß(2). Der folgende Vergleich bzw. die folgende Wahl erfolgt für zwei Bilder, Bild(1) und Bild(2), die einer Schwellwertbildung unterzogen worden sind, paarweise:
Schritt 1. Wenn Groß(2) < 30, dann wähle Bild(1)
Schritt 2. Wenn Q x Groß(1)/Groß(2) > Rauschen(1)/Rauschen(2), wähle Bild(1);
ansonsten wähle Bild(2).
Der Wert Q wird so gewählt, daß er die folgenden Werte aufweist:
Wenn 30 ≤ Groß (2) ≤ 150, Q = (- 2) (Groß (2)) + 60 + 3/120
Wenn 150 < Groß(2), Q = 1
Bei mehr als zwei Bildern wird der Algorithmus solange paarweise angewendet, bis eine geeignete Wahl getroffen worden ist.
2. Der zweite Entscheidungsprozeß verwendet ein Stückgrößenhistogramm von vier Behältern wie folgt:
Behälter 1 : 0-10.
Behälter 2 : 11-40.
Behälter 3 : 41-100.
Behälter 4: mehr als 100
Behälter 1 entspricht kleinen Stücken (Bildrauschen), und Behälter 4 entspricht großen Stücken des Bilds. Behälter 3 entspricht unzusammenhängenden großen Stücken, wie sie möglicherweise in einem Bild von Text angetroffen werden können, das von einem Matrixdrucker erzeugt worden ist.
Die Werte in diesen Behältern können als die Komponenten eines vierdimensionalen Vektors angesehen werden. An zwei Bildern, Bild(1) und Bild(2), kann dann mit einem neuralen Mitkopplungsnetz mit acht Eingängen eine Qualitätsanalyse durchgeführt werden. Bei den acht Eingängen handelt es sich in dieser Reihenfolge um die Werte in den vier Behältern von Bild(1) und die Werte in den vier Behältern von Bild(2). Das Netz mit den acht Eingängen erzeugt als Ausgangssignal einen Wert zwischen 0-255. Das Netz ist an einer großen Menge von Trainingsbildern unter Verwendung des Backpropagation- Algorithmus trainiert.
Um das Netz zu trainieren, wird die große Menge von Trainingsbildern paarweise untersucht, und das bessere Bild jedes Paars wird nach Sichtprüfung gewählt. Das neurale Netz wird trainiert, indem ein Ausgangssignal von 255 spezifiziert wird, wenn die Vektorwerte für das bessere Bild zuerst in dem 8- Komponenteneingangsvektor erscheinen, dann die beiden Vier-Komponenten-Vektoren in dem Eingangssignal vertauscht werden und ein Neuronennetzausgangssignal von 0 spezifiziert wird. Dieser Trainingsprozeß wird für eine große Anzahl von Paaren der Trainingsbilder wiederholt.
Nach dem Training funktioniert das Netz wie folgt: Bei einem gegebenen eingegebenen Paar von Bildern, Bild(1) und Bild(2), werden die beiden Vier- Komponenten-Vektoren von dem Stückgrößenhistogramm als Eingangssignal an das neuronale Netz geliefert. Wenn der Wert des Ausgangssignals des Netzes über 128 liegt, ist Bild(1) besser als Bild(2). Ansonsten ist Bild(2) besser. Bei mehr als zwei Bildern wird der Algorithmus paarweise solange angewendet, bis eine geeignete Wahl getroffen worden ist.
Unter Verwendung des Histogramms von Stückgrößen können auch andere Mechanismen zum Schätzen der Qualität eingesetzt werden. Als Beispiel verwendet ein derartiger Mechanismus einen Spitzenerfassungsalgorithmus, der dem in der ersten Stufe des LAT-Prozesses ähnlich ist, um Text- und Rauschstücksegmente zu finden. Bei einem anderen Beispiel können neuronale Netze verwendet werden, wobei nur ausgewählte Behälter der Stückgrößenhistogramme als Eingangssignale verwendet werden.

Beispiel

Die Fig. 8-11 veranschaulichen die Verwendung der Erfindung mit einem beispielhaften Etikett. Fig. 8 zeigt das ursprüngliche Grauwertbild eines Probeetiketts. Fig. 9 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Bilds in Fig. 8, wobei die Parameter in Spalte 1 von Tabelle 1 verwendet werden. Man beachte, daß während der ganze Hintergrund auf Weiß eingestellt worden ist, ein Teil des Textes fehlt. Fig. 10 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 2 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, doch ist ein Teil des Hintergrunds, der Falten in dem Etikett entspricht, auf Vordergrund-Schwarz eingestellt worden. Fig. 11 zeigt ein Binärbild, an dem eine Schwellwertbildung durchgeführt worden ist, des Grauwertbilds in Fig. 8, wobei die Parameter in Spalte 3 von Tabelle 1 verwendet werden. Hier liegt der ganze Text vor, und der ganze Hintergrund ist auf Weiß eingestellt worden. Nach Sichtüberprüfung ist dieses letzte Binärbild deutlich dasjenige Bild aus den drei, in Fig. 9, 10 und 11 gezeigten Binärbildern, das die beste Qualität aufweist. Wenn diese drei Binärbilder dem ersten Verfahren der Qualitätsanalyse unterzogen wurden, wurde das Fig. 11 entsprechende letzte Bild gewählt. Tabelle 1. Prozeßparameter
Die Wahl des Fig. 11 entsprechenden letzten Bildes als das beste Binärbild, das einer Schwellwertbildung unterzogen worden ist, kann unter Bezugnahme auf Tabelle 2 veranschaulicht werden, die die Werte für den Behälter "Rauschen" und den Behälter "Groß" des Stückgrößenhistogramms enthält. Tabelle 2. Anzahl großer und kleiner Binärbildstücke.
Der Qualitätsanalyseprozeß vergleicht zunächst die Bilder A und B. Da Bild B mehr große Stücke aufweist, wird es als Bild 1 bezeichnet und Bild A wird mit 2 bezeichnet. Der Wert von Q beläuft sich in diesem Fall auf
Q = (-2) (Groß (2)) + 60/120 + 3 = -2 (30) + 60/120 + 3 = 3
Der Test hinsichtlich des Bilds mit der besseren Qualität ist
Q x Groß (1)/Groß (2) = 3 (70)/30 = 7
was nicht größer ist als Rauschen(1)/Rauschen(2) = 1884/95, so daß Bild 2 (Bild A) gewählt wird.
Als nächstes wird Bild A mit Bild C verglichen. In diesem Fall wird Bild C als Bild 1 bezeichnet. Der Wert Q wird wieder als 3 berechnet. Der Test hinsichtlich des Bilds mit der besseren Qualität ist somit
Q x Groß(1)/Groß (2) = 3(52)/30 = 5,2
was größer ist als Rauschen(1)/Rauschen(2) = 109/95. Somit wird Bild 1 (Bild C), das Fig. 11 entspricht, als das beste Bild der drei Bilder gewählt.
Diese Erfindung ist zwar unter besonderer Bezugnahme auf bevorzugte Ausführungsformen der Erfindung ausführlich beschrieben worden, dennoch versteht es sich, daß Abänderungen und Modifikationen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Schutzumfang der Erfindung, wie er hier beschrieben ist und in den beigefügten Ansprüchen definiert ist, abzuweichen.

Claims

1. Verfahren zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, mit folgendem:

Wählen eines ersten der Binärbilder; Umwandeln des ersten Binärbilds in ein erstes lauflängencodiertes Bild (RLE-Bild = run-length encoded);

Auffinden verbundener Komponenten im ersten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;

Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild;

Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist;

gekennzeichnet durch:

Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;

Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung;

Wählen eines der Bilder auf der Grundlage eines Vergleichs des ersten und zweiten Mehr-Behälter- Histogramms;

wobei die Mehr-Behälter-Histogramme vor dem Anwenden eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.

2. Verfahren nach Anspruch 1, bei dem der Schritt des Bestimmens von Gebietsverteilungen für die Binärbilder folgende Schritte umfaßt:

Umwandeln der Abschnitte von jedem der Binärbilder mit dem ersten von zwei Werten in ein RLE- Bild; und

Bestimmen der Gebietsverteilung von verbundenen Komponenten von jedem der RLE-Bilder unter Verwendung von Stückextrahierung.

3. Verfahren nach Anspruch 1 oder 2, bei dem der Schritt des Vergleichens der Gebietsverteilungen folgende Schritte umfaßt:

Konstruieren eines Mehr-Behälter-Histogramms jeder der Gebietsverteilungen; und

Vergleichen der Werte in ausgewählten Behältern des Mehr-Behälter-Histogramms.

4. Verfahren nach Anspruch 3, bei dem der Schritt des Vergleichens der Werte in ausgewählten Behältern des Mehr-Behälter-Histogramms folgenden Schritt umfaßt:

Vergleichen des Verhältnisses von Werten in einem ersten Behälter von jedem der Mehr-Behälter- Histogramme mit dem Verhältnis von Werten in einem zweiten Behälter von jedem der Mehr-Behälter-Histogramme; und

wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:

Wählen eines der beiden Binärbilder auf der Grundlage des Vergleichs im vorausgegangenen Schritt.

5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem der Schritt des Vergleichens des ersten und zweiten Mehr-Behälter-Histogramms folgenden Schritt umfaßt:

Liefern der Werte von ausgewählten Behältern jedes der Mehr-Behälter-Histogramme als Eingänge zu einem zuvor trainierten neuronalen Netz; und

wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:

Wählen eines der beiden Binärbilder auf der Grundlage des Ausgangswerts des zuvor trainierten neuronalen Netzes.

6. Verfahren nach Anspruch 5, bei dem die Histogramme einen kleinen verbundenen Komponenten in den Binärbildern entsprechenden ersten Behälter und einen großen verbundenen Komponenten in den Binärbildern entsprechenden zweiten Behälter aufweisen und der Schritt des Vergleichens der Werte in ausgewählten Behältern der Mehr-Behälter-Histogramme folgende Schritte umfaßt:

Berechnen eines ersten Quotienten durch Dividieren des Werts des ersten Behälters des Histogramms für ein erstes der beiden Binärbilder durch den Wert des ersten Behälters des Histogramms für ein zweites der beiden Binärbilder;

Berechnen eines zweiten Quotienten durch Dividieren des Werts des zweiten Behälters des Histogramms für ein erstes der beiden Binärbilder durch den Wert des zweiten Behälters des Histogramms für ein zweites der beiden Binärbilder; und

wobei der Schritt des Wählens eines der Bilder folgendes umfaßt:

Wählen des ersten Binärbilds, wenn der erste Quotient kleiner ist als der zweite Quotient multipliziert mit einem Qualitätswert.

7. Verfahren nach Anspruch 6, bei dem der Qualitätswert eine vorgewählte Konstante ist.

8. Verfahren nach Anspruch 6 oder 7, bei dem der Qualitätswert aus einer vorbestimmten Formel berechnet wird, die vorgewählte Konstanten und den Wert des zweiten Behälters des Histogramms für das erste der beiden Binärbilder verwendet.

9. Verfahren nach Anspruch 6, 7 oder 8, bei dem der Qualitätswert aus einer vorbestimmten Formel berechnet wird, die vorgewählte Konstanten und den Wert des zweiten Behälters des Histogramms für das zweite der beiden Binärbilder verwendet.

10. Verfahren nach Anspruch 6, bei dem der erste Behälter des Mehr-Behälter-Histogramms den Zählwert von verbundenen Komponenten der Binärbilder mit von 0 bis etwa 10 Bildelementen aufweist.

11. Verfahren nach Anspruch 6, bei dem der zweite Behälter des Mehr-Behälter-Histogramms den Zählwert von verbundenen Komponenten der Binärbilder mit mehr als etwa 100 Bildelementen aufweist.

12. Verfahren zur Schwellwertbildung bei einem Grauwertbild, mit den folgenden Schritten:

Konstruieren eines dem Grauwertbild entsprechenden Kontrastbilds, wobei jedes Bildelement des Kontrastbilds einen Wert LCij aufweist, der gegeben ist durch die Formel

LCij = C (1 - (MINij + p) / (MAXij + p)),

wobei (i, j) die Position des Bildelements in dem Kontrastbild, C ein vorgewählter maximaler Kontrastwert, p ein vorgewählter, im Vergleich zu C kleiner positiver Wert, MINij der kleinste Graustufenwert aller Bildelemente in einem rechteckigen Fenster mit der Mitte in der entsprechenden Position in dem Grauwertbild und MAXij der größte Graustufenwert aller Bildelemente in dem rechteckigen Fenster ist;

Wählen einer vorbestimmten Anzahl von Mengen von Schwellwertbildungsparametern, wobei die Schwellwertbildungsparameter ein Spitzen-Boden- Pegelwert, ein Spitzen-Breiten-Nennwert, ein Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert, ein Minimalkontrastskalenwert und ein Kontrastüberschuß-Nennwert sind, wobei der Spitzen- Boden-Pegelwert die kleinste Höhe ist, die eine Kontrasthistogrammspitze aufweisen kann, der Spitzen- Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, der Text- Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht, der Minimalkontrastskalenwert ein erster Grenzwert und der Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;

für jede Menge von Schwellwertbildungsparametern, Erhalten eines Binärbilds durch Konstruieren eines Kontrasthistogramms des Kontrastbilds über alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als der vorgewählte Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch den vorgewählten Spitzen-Breiten-Nennwert getrennt sind; Wählen einer Minimaltextspitze unter den gefundenen Spitzen durch Auffinden einer Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als der vorgewählte Minimalkontrastwert; Erhalten eines kleinsten zulässigen Kontrastwerts durch Subtrahieren des vorgewählten Text-Spitze-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze; Zuordnen des Bildelements an der (i, j)-Position des Grauwertbilds zu einer Hintergrundklasse des Binärbilds, wenn LCij kleiner ist als der kleinste zulässige Kontrastwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und MINij und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Minimum-Differenz kleiner ist als der vorgewählte Minimalkontrastskalenwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und dem Graustufenwert des Bildelements und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Bildelementwert- Differenz kleiner ist als der vorgewählte Kontrastüberschuß-Nennwert; und, wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Zuordnen des Bildelements zu einer Vordergrundklasse;

Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;

gekennzeichnet durch:

Bestimmen einer zweiten Gebietsverteilung von verbundenen Komponenten des zweiten RLE-Bilds und Konstruieren eines zweiten Mehr-Behälter-Histogramms der zweiten Gebietsverteilung; und

13. Verfahren nach Anspruch 12, bei dem der Schritt des Wählens eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr-Behälter- Histogramms folgende Schritte umfaßt:

Vergleichen des Verhältnisses des Werts in einem ersten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter des zweiten Mehr-Behälter-Histogramms mit dem Verhältnis des Werts in einem zweiten Behälter des ersten Mehr-Behälter- Histogramms zu dem Wert in einem zweiten Behälter des zweiten Mehr-Behälter-Histogramms; und

Wählen eines der Binärbilder auf der Grundlage des Vergleichs der Verhältnisse.

14. Verfahren nach Anspruch 12 oder 13, bei dem der Schritt des Wählens eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgende Schritte umfaßt:

Wählen eines der Binärbilder auf der Grundlage des Ausgangs des zuvor trainierten neuronalen Netzes.

15. Vorrichtung zur Schwellwertbildung bei einem Grauwertbild, mit folgendem:

Mitteln (1, Fig. 1; 3, Fig. 2) zum Konstruieren eines dem Grauwertbild entsprechenden Kontrastbilds, wobei jedes Bildelement des Kontrastbilds einen Wert LCij aufweist, der gegeben ist durch die Formel

LCij = C (1 - (MINij + p) / (MAXij + p)),

Mitteln zum Wählen einer vorbestimmten Anzahl von Mengen von Schwellwertbildungsparametern, wobei die Schwellwertbildungsparameter ein Spitzen-Boden- Pegelwert, ein Spitzen-Breiten-Nennwert, ein Minimalkontrastwert, ein Text-Spitzen-Breiten-Nennwert, ein Minimalkontrastskalenwert und ein Kontrastüberschuß-Nennwert sind, wobei der Spitzen- Boden-Pegelwert die kleinste Höhe ist, die eine Kontrasthistogrammspitze aufweisen kann, der Spitzen- Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, der Text- Spitzen-Breiten-Nennwert die Anzahl unterschiedlicher Kontrastwerte ist, die in einer nominalen Kontrasthistogrammspitze erwartet werden, die einem Textkontrastsegment entspricht, der Minimalkontrastskalenwert ein erster Grenzwert und der Kontrastüberschuß-Nennwert ein zweiter Grenzwert ist;

Mitteln (2, 6, 10, Fig. 1) zum Erhalten eines Kandidatenbinärbilds für jede Menge von Schwellwertbildungsparametern durch Konstruieren eines Kontrasthistogramms des Kontrastbilds über alle möglichen Kontrastwerte in dem Kontrastbild; Finden aller Spitzen in dem Kontrasthistogramm, die größer sind als der vorgewählte Spitzen-Boden-Pegelwert und von allen höheren Spitzen durch den vorgewählten Spitzen-Breiten-Nennwert getrennt sind; Wählen einer Minimaltextspitze unter den gefundenen Spitzen durch Auffinden einer Spitze, die bei dem niedrigsten Kontrastwert auftritt, der größer ist als der Minimalkontrastwert; Erhalten eines kleinsten zulässigen Kontrastwerts durch Subtrahieren des vorgewählten Text-Spitze-Breiten-Nennwerts von dem Kontrastwert der Minimaltextspitze; Zuordnen des Bildelements an der (i, j)-Position des Grauwertbilds zu einer Hintergrundklasse des Kandidatenbinärbilds, wenn LCij kleiner ist als der kleinste zulässige Kontrastwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und MINij und Zuordnen des Bildelements zu der Hintergrundklasse, wenn die Maximum-Minimum-Differenz kleiner ist als der vorgewählte Minimalkontrastskalenwert; wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Berechnen der Differenz zwischen MAXij und dem Graustufenwert des Bildelements und Zuordnen des Bildelements zu der Bildelement-Hintergrundklasse, wenn die Maximum- Bildelementwert-Differenz kleiner ist als der vorgewählte Kontrastüberschuß-Nennwert; und, wenn das Bildelement des Grauwertbilds nicht bereits der Hintergrundklasse zugeordnet ist, Zuordnen des Bildelements zu einer Vordergrundklasse; und

Mitteln (3, 4, Fig. 1) zum Wählen eines ersten der Binärbilder, Umwandeln des ersten Binärbilds in ein erstes RLE-Bild;

Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des Binärbilds in ein zweites RLE-Bild; und

gekennzeichnet durch:

Mittel (5, 14, Fig. 1) zum Bestimmen einer ersten Gebietsverteilung von verbundenen Komponenten des ersten RLE-Bilds und Konstruieren eines ersten Mehr-Behälter-Histogramms der ersten Gebietsverteilung;

16. Vorrichtung nach Anspruch 15, bei der das Mittel zum Wählen eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgendes umfaßt:

Mittel zum Vergleichen des Verhältnisses des Werts in einem ersten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem ersten Behälter des zweiten Mehr-Behälter-Histogramms mit dem Verhältnis des Werts in einem zweiten Behälter des ersten Mehr-Behälter-Histogramms zu dem Wert in einem zweiten Behälter des zweiten Mehr-Behälter-Histogramms; und

Mittel zum Wählen eines der Binärbilder auf der Grundlage des Vergleichs der Verhältnisse.

17. Vorrichtung nach Anspruch 15 oder 16, bei dem das Mittel zum Wählen eines der Binärbilder auf der Grundlage einer Auswertung des ersten und zweiten Mehr- Behälter-Histogramms folgendes umfaßt:

Mittel zum Liefern der Werte von ausgewählten Behältern jedes der Mehr-Behälter-Histogramme als Eingänge zu einem zuvor trainierten neuronalen Netz; und

Mittel zum Wählen eines der Binärbilder auf der Grundlage des Ausgangs des zuvor trainierten neuronalen Netzes.

18. Vorrichtung nach einem der Ansprüche 15 bis 17, bei der das Mittel zum Konstruieren der Kontrastbilder eine CCD-Kamera (51) enthält.

19. Vorrichtung zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, mit folgendem:

Mitteln zum:

Wählen des zweiten der Binärbilder unter den zuvor nicht gewählten Binärbildern; Umwandeln des zweiten Binärbilds in ein zweites RLE-Bild; und

gekennzeichnet durch:

Mittel zum:

wobei die Mehr-Behälter-Histogramme vor dem Anwendens eines Zeichenerkennungsprozesses auf die RLE- Bilder konstruiert werden.

20. Vorrichtung nach Anspruch 19, mit einer CCD- Kamera (51) zum Erzeugen der Binärbilder.

21. Verfahren zum Betreiben einer Recheneinrichtung (21, 22, 23, 31, 41) mit ausführbaren Anweisungen zum Wählen eines von zwei Binärbildern entsprechend verschiedenen Schwellwertbildungen eines Grauwertbilds, wobei jedes der Binärbilder einen ersten von zwei Werten für Abschnitte des Binärbilds und einen zweiten von zwei Werten für den Rest des Binärbilds aufweist, gemäß den folgenden Schritten:

Auffinden verbundener Komponenten im zweiten RLE-Bild und Bestimmen eines Gebiets von jeder der verbundenen Komponenten, wobei das Gebiet einen der Anzahl von Bildelementen in jeder der verbundenen Komponenten entsprechenden Wert aufweist; wobei die Anweisungen gekennzeichnet sind durch: