[go: up one dir, main page]

CN1338703A - 用于从多值图象提取划线的设备 - Google Patents

用于从多值图象提取划线的设备 Download PDF

Info

Publication number
CN1338703A
CN1338703A CN01125404A CN01125404A CN1338703A CN 1338703 A CN1338703 A CN 1338703A CN 01125404 A CN01125404 A CN 01125404A CN 01125404 A CN01125404 A CN 01125404A CN 1338703 A CN1338703 A CN 1338703A
Authority
CN
China
Prior art keywords
line
area
image
pixel
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01125404A
Other languages
English (en)
Other versions
CN1213382C (zh
Inventor
小原敦子
藤本克仁
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN1338703A publication Critical patent/CN1338703A/zh
Application granted granted Critical
Publication of CN1213382C publication Critical patent/CN1213382C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

从一个多值图象产生一个比较扩张的二值化图象和一个比较模糊的二值化图象。从该比较扩张的二值化图象提取一个划线候选区,且利用该比较模糊的二值化图象检验提取的划线候选区。

Description

用于从多值图象提取划线的设备
本发明的领域
本发明涉及一种划线提取设备,用于从诸如灰度图象、彩色图象等的多值图象提取划线,以及用于从多值图象提取任意图案的图案提取设备。
本发明的背景技术
近来,随着诸如扫描仪等的输入单元的数目的增多,大量的图象由计算机以文档的形式进行处理,且对于OCR光学文字读取器的需求大大增加。OCR是以软件或文字识别装置的形式为用户提供的。
当通过一个输入单元输入的图象是灰度图象时,需要由文字识别装置以适当的方式对该图象进行二值化。特别地,当采用了诸如上置读取器(OHR,overhead reader)的非接触式图象输入装置时,与用扫描仪获得的图象相比,所产生的图象经常具有不均匀的灰度、暗区、畸变等等。因此,需要对图象进行适当的二值化。
传统的二值化方法指的是其中整个图象都用相同的阈值进行二值化的全局二值化,以及其中对各个局部区域进行二值化的局部二值化。
然而,当从诸如图象条的包含划线的文档中的灰度图象提取一个划线时,上述的传统二值化方法具有以下的问题。
在全局二值化中,一个图象可能具有一个暗区,因而当图象的灰度部分地涨落时,二值化结果可能表示为图案的模糊、扩张等,从而不能正确地提取划线。
进一步地,在局部二值化中,黑暗部分的影响可被减小。然而,由于二值化处理是在一个目标象素周围的区域上进行的,存在这样的可能,即当在一个薄的划线附近存在有一个粗的字符时,一个划线被错误地识别为背景。进一步地,不均匀的灰度造成的噪声等可能被二值化并被识别为一个黑的图案,从而对划线提取过程产生不利的影响。
在上述二值化方法中,当划线与其背景之间的灰度差很小时,二值化结果经常表示模糊、膨胀等,因而不能正确地进行二值化处理。
因此,传统的全局和局部二值化不能始终获得没有模糊和扩张的可接受的图象。因此,当利用一种获得的二值化图象进行划线提取处理时,模糊或扩张可能阻止正确的提取处理。
在字条等中,写在反面上的以及在小册子中的划线、字符、诸如曲线图的图案等、写在下一页上的图案,可通过纸而被轻微地看到。在此情况下,输入图象会显示出来自反面或下一页的图案。因此,当从一个输入图象提取一个具体图案时,可能会提取出不希望的反面图案。
本发明的概述
本发明的第一个目的,是提供一种划线提取设备,它即使在灰度图象具有黑暗部分或划线与其背景之间的灰度差很小的情况下,也能够正确地提取划线。
本发明的第二个目的,是提供一种图案提取设备,用于当从诸如灰度图象等的多值图象提取包括划线的任意图案时正确地提取所需的图案。
在本发明的第一个方面,该划线提取设备包括一个第一二值化装置、一个第二二值化装置、一个提取装置、一个确定装置、以及一个输出装置。
该第一二值化装置对一个多值图象进行二值化,以产生一个第一二值化图象。该第二二值化装置以不同于第一二值化装置的方法的一种方法对该多值图象进行二值化,从而产生一个第二二值化图象。提取装置利用该第一二值化图象提取一个划线候选区域。确定装置利用第二二值化图象判定提取的划线是否对应于一个划线。随后,输出装置输出有关已经被识别为对应于划线的该划线候选区域的信息。
在根据本发明的第二个方面,该图案提取设备包括一个提取装置、一个确定装置以及一个输出装置。
该提取装置从一个多值图象提取一个将要被确定的区域。该确定装置根据与所要确定的区域中的图案的轮廓部分的轮廓线的切线方向垂直的方向的灰度的改变而获得一个评估值。如果该评估值等于或大于一个预定值,则判定所要确定的区域是所需的图案区。如果该评估值小于该预定值,则判定所要确定的区域是不需要的图案区。输出装置输出有关该所需图案区的信息。
附图的简要描述
图1显示了根据本发明的划线提取设备的原理;
图2是一个第一划线提取处理的流程图;
图3显示了两种类型的黑区;
图4显示了候选第一线;
图5是一个线段检验处理的流程图;
图6显示了一个灰度图象;
图7显示了一个二值化图象和一个候选线段;
图8显示了黑象素区和白象素区;
图9是第一线段综合处理和端部线段提取处理的流程图;
图10显示了包含圆角的灰度图象;
图11显示了一个第一划线图象;
图12显示了一个圆角;
图13显示了一个第二划线图象;
图14显示了包含一个阴影单元的一个灰度图象;
图15显示了一个比较扩张的二值化图象;
图16显示了一个比较模糊的二值化图象;
图17显示了第二个候选线段;
图18显示了第二线段综合处理和端部线段提取处理的流程图(1);
图19显示了第二线段综合处理和端部线段提取处理的流程图(2);
图20显示了一个右侧划线和一个反面划线;
图21显示了一个划线的轮廓部分;
图22显示了该轮廓的纵向和水平方向;
图23是第二划线提取处理的流程图;
图24显示了一个划线候选区域;
图25显示了将要确定的一个区域;
图26显示了一个目标象素和一个比较象素;
图27显示了一个候选图案的轮廓;
图28显示了该信息处理装置的配置;且
图29显示了存储介质。
最佳实施例的描述
以下结合附图详细描述本发明的实施例。
图1显示了根据本发明的划线提取处理的原理。图1所示的划线提取处理包括二值化装置11和12、提取装置13、确定装置14、以及输出装置15。
二值化装置11对一个多值图象16进行二值化,以产生一个第一二值化图象17。二值化装置12以不同于二值化装置11的方法的一种方法对该多值图象进行二值化,以产生一个第二二值化图象18。提取装置13利用二值化图象17产生一个划线候选区域。确定装置14利用二值化图象18判定提取的划线候选区域是否对应于一个划线。输出装置15输出有关已经被识别为对应于一个划线的划线候选区域的信息。
二值化装置11从输入的多值图象16产生二值化图象17,从二值化图象17能够提取所有的划线候选区域。二值化装置12从多值图象16产生二值化图象18,从二值化图象18能够正确地检验一个划线候选区域。作为二值化图象17,例如,产生包含一个扩张图案的一个比较扩张的二值化图象。作为二值化图象18,例如,产生一个比较模糊的二值化图象-其中一个薄的图案部分被忽略了。
提取装置13从比较扩张的二值化图象17提取一个划线候选区域。确定装置14利用比较模糊的二值化图象18确定该候选区域是否对应于一个实际的划线。随后,输出装置15只输出与划线对应的区域,作为提取结果。
因此,所获得的两种二值化图象,通过以两种不同的方法二值化一个多值图象,而可被用于各自的目的。随后,利用一个二值化图象提取一个划线候选区域,且该划线候选区域利用另一二值化图象而得到检验,从而正确地提取划线。
例如,图1所示的二值化装置11和12、提取装置13、以及确定装置14对应于图28所示的一个CPU(中央处理单元)101和存储器102的组合,且图1所示的输出装置15对应于图28所示的输出装置104。
进一步地,在本发明的第二个方面,图案提取设备包括一个提取装置、一个确定装置、以及一个输出装置。例如,该提取装置和确定装置对应于图28所示的CPU101和存储器102,且输出装置对应于图28所示的输出装置104。
提取装置从一个多值图象提取将要确定的一个区域。确定装置根据沿着与将要判定的区域中的图案的轮廓部分的轮廓线的切线方向垂直的方向的灰度改变而获得一个评估值。如果该评估值等于或大于一个预定的值,则判定将要确定的区域是一个所需的图案区。如果该评估值小于该预定值,则判定所要判定的区域是一个不需要的图案区。输出装置输出有关所需图案区的信息。
提取装置从该多值图象提取所要判定的区域,以判定是否包含一个所需的图案。对于包含在该区域中的图案的轮廓部分,确定装置根据沿着与轮廓线的切线方向垂直的方向的灰度的改变计算该评估值。如果该评估值等于或大于一个预定值,则判定所要判定的区域是包含一个所需图案区的一个区域。如果该评估值小于该预定值,则判定所要判定的区域是包含不需要的图案区的一个区域。随后,输出装置只输出所需的图案区,作为提取结果。
正常地,在反面上的一个图案的轮廓,与在右边的图案相比,呈现为模糊和遮蔽的形式。在反面的图案的模糊的轮廓,表明从轮廓向着图案的内部有小的灰度改变。另一方面,当轮廓清晰时,灰度的改变较大。
因此,利用与沿着与轮廓线的切线方向垂直的方向的灰度改变相对应的一个评估值,可以判定一个提取图案是被写在右边(所需的图案)还是写在反面上的图案(不需要的图案)。通过进行这样的判定,只有右边上的图案的一个图案区作为所需的图案区而被输出,不包括提取的图案区的不需要的图案被写在反面上。
根据本实施例,用两种不同的处理从一个灰度图象获得的两种二值化图象以及原始的灰度图象,根据各个处理的目的,而得到适当利用,以提取划线。这些二值化图象可以是相当模糊的二值化图象以及一个有噪声的且比较扩张的二值化图象。
首先,候选划线的位置利用一个比较扩张的二值化图象而得到探测。利用该比较扩张的二值化图象,可在不考虑模糊的影响的情况下提取一个划线候选区域。随后,利用一个比较模糊的二值化图象和一个灰度图象判定作为一个候选划线而提取的一个区域是否真的是一个划线。同时,其中二值化结果表示了为黑的区域的灰度被与其中二值化结果表示为白的区域的灰度相比较,且具有小的灰度差的区域被综合,从而提取一个划线部分。
因此,在从一个灰度图象提取划线的过程中,从一个灰度图象产生出一个比较模糊的二值化图象和一个比较扩张的二值化图象。结果,这些不同的二值化图象可根据目的而得到使用,从而正确地提取一个划线部分。
具有灰度信息的一个灰度图象将要得到处理,并包含了通过诸如扫描仪等的接触式输入装置而输入的一个图象以及通过诸如OHR等的非接触式输入装置而输入的图象。不论在一个图象上是否存在一个黑暗部分,该图象都将要得到处理,虽然划线的灰度比较薄。将要提取的划线通常被假定是用实线表示。虚线一般不被考虑。
图2是根据本发明的划线提取设备进行的处理的流程图。该划线提取设备首先输入一个灰度图象(步骤S1)、产生一个比较扩张的二值化图象(步骤S2)、并被该二值化图象设定为一个处理目标(步骤S3)。随后,进行一个提取所有候选线段的处理,且具有沿着水平和纵向方向的高黑象素密度的一个区作为一个划线候选区域而得到提取(步骤S4)。
随后,从该灰度图象产生一个比较模糊的二值化图象(步骤S5),且该二值化图象被设定为一个处理目标(步骤S6)。随后,进行一个线段检验处理,且判定在步骤S4提取的划线候选区域是否真是一条划线(步骤S7)。随后,进行一个线段综合处理(步骤S8),且进行一个端部线段提取处理(步骤S9),进行一个圆角提取处理(步骤S10),从而结束该过程。
以下结合图3至13具体说明图2所示的各个处理。
在图2所示的处理中,当从一个输入的灰度图象提取诸如字符、划线等的笔划象素(图案)时,产生了两种二值化图象,即一个比较扩张的没有模糊的二值化图象以及一个没有扩张的比较模糊的二值化图象。
在正常情况下,为了获得没有黑暗部分或不均匀灰度的稳定的二值化图象,进行NiBlack局部二值化以对利用一个预定阈值进行的二值化进行补充。NiBlack的局部二值化指的是利用各个象素的的阈值T=E+Kσ(E表示在一个目标象素的附近区域中的象素的灰度的平均值,σ表示在该目标象素附近的区域中的象素的灰度的标准偏离,且K表示一个预定的常数)对各个象素进行二值化处理的一种方法。象素的附近区域是一个N×N(N表示一个常数)的矩形区域,且目标象素位于该区域的中心。
然而,当该方法被原样采用时,附近区域中的所有象素的灰度在背景中是均匀的并在一条粗线中。因此,噪声以散布的方式发生。在本实施例中,在在先专利申请“图象处理装置和图象处理方法”(日本专利申请公开第11-335495号)中描述的通过背景鉴别进行的二值化处理被用作一种基本的二值化处理,以除去散布的噪声。
以此方法,用于根据为各个附近区域获得的信息而鉴别一个目标象素是指一个背景的背景鉴别处理与NiBlack的局部二值化一起得到进行。例如,假定利用目标象素的局部阈值T被识别为白的象素被定义为白象素,且利用阈值T被识别为黑的象素被定义为黑象素,从而利用以下公式定义平均灰度差Δg。
Δg=附近区域中的白象素的平均灰度-附近区域中的黑象素的平均灰度。
此时,如果Δg小于一个预定的阈值Δgmin,则目标象素被识别为背景,且对未被识别为背景的象素进行NiBlack局部二值化。在上述背景鉴别处理中,即使在具有一个黑暗部分的图象上,也能够获得具有成功地减小的模糊或噪声的可接受的二值化结果。
在图2所示的步骤S2,如果划线提取设备进行带有对一个灰度图象上的背景鉴别的二值化处理,且目标象素被识别为一个白象素,则对该象素进行带有背景鉴别的二值化处理。在带有背景鉴别的第二二值化处理中,包含在中心的目标象素的附近区域(局部区域)中被识别为黑象素的该象素被从处理目标中除去。
例如,当在如图3所示的划线上的一个目标象素21(标为x的象素)的一个附近区域中有具有不同的灰度的黑区23和24时,当进行了一次二值化处理时,黑区24中的目标象素21可被识别为一个白区。然而,排除了黑区23而进行的第二二值化处理能够正确地把目标象素21识别为一个黑象素。
然而,虽然黑区24比黑区23细得多,目标象素21被识别为一个黑象素。因此,在步骤S2的二值化处理中,未被预期将要被识别为一个黑象素的部分可被识别为一个黑象素。因此,一个笔划可被延伸且噪声可能增大。结果,一个获得的二值化图象是一个比较扩张的二值化图象,但几乎没有模糊。
因此,当一个目标象素由于第一局部二值化而被识别为一个白象素时,局部二值化只在目标象素的附近区域中被识别为白象素的象素上被再次进行。因此,虽然在一个细的划线附近有粗的字符图案,可防止该划线部分被错误地识别为白象素。
在此例子中,在第二二值化处理中,在第一二值化处理中被识别为黑象素的象素被排除了。与此相反地,附近区域的形式可被改变。例如,作为第二处理中的一个附近区域,采用了包含目标象素的多种区域,包括一个纵向长的区域、一个水平长的区域、一个对角区域、等等。如果这些区域的多个鉴别结果中的任何一个表明了目标象素被识别为黑象素,该目标象素被识别为一个黑象素。
因此,虽然在一个细的划线附近有一个粗的字符图案,通过改变附近区域的形式并随后再次进行局部二值化,可防止该划线部分被错误地识别为白象素。
在图2所示的步骤S5,如果划线提取设备在一个灰度图象上进行具有背景鉴别的二值化处理,且目标象素被识别为一个白象素,则目标象素的附近区域中的黑象素的平均灰度被与附近区域中的白象素的平均灰度相比较,且随后判定是否要再次进行二值化处理。如果这两个平均灰度满足了一个预定的条件,则进行具有背景鉴别的第二二值化处理。该条件可表示如下。
(1)附近区域中的平均灰度的比值等于或大于一个预定值。
(2)附近区域中的平均灰度的差等于或大于一个预定的值。
(3)附近区域中的平均灰度的差和比值等于或大于一个预定值。
例如,该平均灰度比值和平均灰度差可用以下公式定义。
平均灰度比值=白象素的平均灰度/黑象素的平均灰度
平均灰度差=白象素的平均灰度-黑象素的平均灰度
只有当这样的条件得到满足时,第二二值化处理才得到进行。在此情况下,如在步骤S2的处理中,包含在中心的目标象素的附近区域中的被识别为一个黑象素的一个象素将要被从将要处理的象素中排除掉,或者附近区域的形式得到改变以进行第二二值化处理。
如果判定该目标象素是一个白象素,且附近区域中的平均灰度比值或平均灰度差大,则在该目标象素之外有可能存在粗的黑象素。随后,为了正确地对目标象素进行二值化,在排除了目标象素之外的粗黑象素的部分之后,再次进行鉴别处理。然而,当平均灰度差的平均灰度比值小时,则不进行第二二值化处理,从而仍然保持模糊。
在根据在先专利申请的背景鉴别处理中,象素根据平均灰度差而得到处理。然而,根据本发明,“轮廓比率”的一个新的判定标准得到定义。该轮廓比率指表示中心具有目标象素的该附近区域中的黑象素的分布(图案)的复杂性的值,并用轮廓数目/黑象素数目表示。轮廓的数目指的是附近区域中接触一个黑象素的白象素的数目,且黑象素的数目指的是附近区域中形成黑象素的数目。当轮廓比率的值变为等于或大于一个预定值时,目标象素被识别为背景,且其二值化结果为白。
因此,如果轮廓比率被定义为一个鉴别标准,且它表示等于或大于一个预定值的一个值,目标象素被识别为背景,从而使背景中的噪声得到消除,且能够获得一个可接受的二值化图象。
如上所述,如果目标象素由于第一局部二值化的结果而被识别为一个白象素,则根据该附近区域中的平均灰度差和平均灰度比值中的至少一个,判定是否将要只在该目标象素的附近区域中被识别为白象素的象素上再次进行该局部二值化。
因此,虽然在一个细的划线附近有粗的字符图案,也可防止该划线部分被错误地识别为白象素并可防止二值化结果的图案发生扩张。所获得的二值化图象可包括模糊,但其他划线/字符笔划被成功地二值化。
进一步地,如果有大的可能目标象素形成一条纵向或水平线的一部分,目标象素的二值化结果可被识别为黑。
在此情况下,利用为该附近区域计算出的二值化阈值,首先判定附近区域中的各个象素是白还是黑。随后,根据该结果,设定具有预定的宽度(例如1点宽)并具有在中心的一个目标象素的一个纵向长区域和一个水平长区域。如果该纵向长区域或水平长区域包含高于或等于一个预定比率的黑象素,则目标象素被识别为可能是一条纵向线或一条水平线的一部分,从而把二值化结果识别为黑。
因此,当有包含被识别为一个白象素的目标象素的一个纵向长图案或一个水平长图案时,目标象素可通过把该目标象素当作一个黑象素而得到正确二值化,虽然一个纵向或水平分量表示了一个模糊的图象。
在图2中所示的步骤S4,划线提取设备利用在步骤S2产生的比较扩张的二值化图象进行一种所有线段的提取处理,且划线候选区域得到提取。在此例中,利用在先专利申请“图象提取系统”(日本专利申请公开第6-309498号)中描述的线段提取处理,从一个二值化图象中提取出一个线候选区域。
在这种线段提取处理中,为一个二值化图象计算一个相邻投影值,且利用矩形近似探测一个线候选区。相邻投影指的是一种投影方法,其中通过把一行或一列的黑象素的投影值加到其附近的一行或列的投影值上而获得的结果被定义为该行或该列的投影值。在这种投影方法中,在一个特定行或列周围的黑象素的分布可全局地获得。沿着一个二值化图象的纵向和水平方向均执行一种类似的处理。
一个划线候选区域的一个探测结果可用一组一或多个线段候选表示。例如,在图4所示的探测结果中,一个划线候选区域被表示为一组小的线段候选区31、32和33。通过把一个候选划线表示为一组线段,一个候选划线可得到提取,虽然一个图象由少量的倾斜。提取的候选区域的位置,利用水平坐标(X坐标)和纵向条件(Y坐标)而得到存储,并被用作将要在下一个线段检验处理中进行处理的一个区域。
在此例中,由于将要处理的二值化图象是没有模糊的比较扩张的二值化图象,一个划线候选区域只能从具有高黑象素密度的部分得到提取。如果一个图象是模糊的,则不能无法提取划线候选区域。然而,如果一个图象是一个比较扩张的二值化图象,则一个字符有可能部分地接近一个划线,或者其中字符彼此接触的一个部分可作为一个过量候选区域而得到提取的一个部分,但划线不能作为一个候选而得到提取的可能性可得到抑制。
因此,候选划线的位置可在没有模糊的影响的情况下,通过利用一个没有模糊的比较扩张的二值化图象来提取一个划线候选区域,而成功地得到探测。
随后,在步骤S7,划线提取设备进行一种线段检验处理,并确定在步骤S4中在所有候选线段提取处理中提取的候选线段是否是一个划线的一部分,或者是其他的-诸如字符的一个笔划等。在此处理中,在步骤S5产生的一个比较模糊的二值化图象、一个原始灰度图象、以及有关一个线段候选区的坐标信息,得到了采用。
首先,对于每一个线段候选区域,包含在一个比较模糊的二值化图象中的黑象素和白象素的灰度得到比较。如果差很小,则进行一种线段内插值处理,以改变白象素的部分改变成黑象素。随后,在作为线段内插值处理的结果,黑象素比率等于或大于一个预定值的情况下,则通过把一个候选区域定义为形成一个划线的部分,而进行一种线段判定。黑象素比率指的是在一个候选区域中黑象素的数目与象素的数目的比值。
因此,一个划线的模糊,通过利用一个比较模糊的二值化图象和一个灰度图象,确定作为一个候选划线而提取的一个区域是否是一个划线,而得到解决,从而把一个划线部分与一个字符部分分开,并只提取一个划线部分。
图5是上述线段检验处理的流程图。该划线提取设备首先访问在与各个候选线段相应的一个比较模糊的二值化图象中的一个区域,并检查在该区域中的一个黑象素区域的灰度图象中的灰度(步骤S11)。进一步地,在同一线段候选区域中,一个白象素区域的灰度图象中的灰度得到检查(步骤S12)。随后,判定黑象素区域的平均灰度与白象素区域的平均灰度之差是否等于或低于一个阈值(一个预定值)(步骤S13)。
如果该平均灰度差超过了该预定值,则判定线段候选区域不是一个线段(步骤S17),从而终止该处理。进一步地,如果一个平均灰度差等于或低于该预定值,该白象素区被认为是一个黑象素区,且判定该线段候选区域的黑象素比率是否等于或大于一个预定值(步骤S15)。黑象素比率可以是例如黑象素区域的长度与线段候选区域的长度的比值。
如果该黑象素比率等于或大于该预定值,该线段候选区域被识别为一个线段(步骤S16)。如果该黑象素比率小于该预定值,则该线段候选区域不被识别为一个线段(步骤S17),从而终止该处理。
例如,假定已经从图6所示的灰度图象获得了如图7所示的一个比较模糊的二值化图象,且区41、42、43和44已经作为具有水平划线的固定长度形成部分的线段候选区域而得到提取。
在图7中,区域b1、b2和b3表示线段候选区域41中的黑象素区,且区域w1和w2表示线段候选区域41中的白象素区。区b4、b5和b6表示线段候选区域43中的黑象素区,且区域w3和w4表示线段候选区域43中的白象素区。
黑象素区b1、b2和b3的范围被限制在其中黑象素如图8所示地分布的区域中,且白象素区w1和w2的范围限于两个黑象素区之间的具有相同宽度的一个区域。其他的黑象素区和白象素区也是同样的情况。
首先,为了确定线段候选区域41是否一个划线,在与区域b1、b2、b3、w1和w2相应的位置处的象素的灰度得到了检查,且获得形成各个区域的象素的平均灰度。由于区w1和w2是形成划线的一部分的部分,它们的灰度与区域b1、b2和b3的灰度类似,且区域w1和w2的象素被改变成黑象素。因此,黑象素区的长度与线段候选区域41的长度的比值变为100%,从而判定区域41是一个线段。
进一步地,区域44中的黑象素区是一个字符的一部分,且白象素区是背景。因此,一个黑象素区与一个白象素区之间的平均灰度差比较大,且白象素区的象素被判定为白象素。因此,黑象素区的长度与区域44的长度的比值小于一个预定值,且判定区域44不是一个线段。区域42没有白象素区,因而被判定为一个线段。
在区域43中,黑象素区b5和b6是字符的一部分,且白象素区w3和w4是背景的一部分。因此,象在区域44的情况那样,黑象素区与白象素区之间的平均灰度差大,且黑象素区的长度与区域43的长度的比值小于一个预定值,从而判定区域43不是线段。
然而,由于区域43部分地包含一条划线,实际的划线区包括区域41、42、以及区域43的一部分。因此,为了正确地提取划线区,进行了以下描述的一种端部线段提取处理。对一条纵向划线,还进行了与对水平划线进行的线段检验处理类似的线段检验处理。
因此,当一个线段候选区域中的黑象素区与白象素区之间的灰度差小时,白象素区的象素被识别为一个黑象素,从而解决划线的模糊的问题,并把一个划线部分从一个字符部分分离出去。另外,具有高黑象素密度的划线区,可通过把具有等于或大于一个预定值的黑象素比率的一个线段候选区域判定为一个线段,而得到提取。
随后,在图2所示的步骤S8,划线提取设备执行一种线段综合处理,综合被判定为线段的多个线段候选区域,并产生一个线区。进一步地,在图2所示的步骤S9,在综合之后,在各个线区的两端进行端部线段提取处理,从而正确地探测划线的端部。
在端部线段提取处理中,如在线段检验处理中,在步骤S5产生的比较模糊的二值化图象和原来的灰度图象得到采用,且有关综合的线段候选区域的坐标信息得到采用。首先,黑象素区的灰度被与在线区的端部处的白象素区的灰度进行比较。如果该差小,白象素被当作黑象素,且线段内插值得到进行。其中黑象素的比值等于或大于一个预定值的区域被加到该线区,作为划线的端部线段。
图9是线段综合处理和线段提取处理的流程图。在此例中,在右端的端部线段得到提取,但在左端进行类似的处理。
该划线提取设备首先综合线段候选区域中的接触或重叠区域,这些区域每一个都已经被判定为是一个线段(步骤S21),且综合的结果被当作一条线(步骤S22)。例如,在图7所示的情况下,区41和42被综合成一条线。
随后,从各个线区的右端向外具有直线的一个恒定的长度和宽度的一个矩形区得到设定,且该区被定义为一个处理范围(步骤S23)。随后,该处理范围的左端被设定为一个处理开始点(步骤S24)。随后,处理从左向右进行。
从比较模糊的二值化图象探测处理开始点的右边的最左位置处的黑象素区(步骤S25),且至黑象素区的右边的相邻白象素区得到探测(步骤S26)。随后,在黑象素区和白象素区的灰度图象中的灰度得到检查,且判定黑象素区与白象素区之间的平均灰度差是否等于或小于一个阈值(预定值)(步骤S27)。
如果该平均灰度差等于或小于该预定值,该白象素区被当作一个黑象素区,且判定从处理开始点至白象素区的右端的部分形成了划线的一部分(步骤S28)。随后,白象素区的右端被定义为一个新的处理开始点(步骤S29),且在步骤S25和在其之后的处理得到重复。
在步骤S27,如果平均灰度差超过了该预定值,则判定黑象素区的长度与从处理范围的左端至白象素区的右端的长度的比值是否等于或大于一个预定值(步骤S30)。如果该比值等于或大于该预定值,则在步骤S28和在此之后的处理得到进行。
如果黑象素区的长度的比值小于该预定值,则判定从处理范围的左端至黑象素区的右端的部分是一条划线的一部分(步骤S31)。随后,包含处理范围的左端至黑象素区的右端的矩形区被设定为一个端部线段,从而终止处理。通过以左和右端部线段区综合一个线区,而产生一个划线区。
假定图7所示的区41和42被综合成一条线。由于在线的右边上的黑象素区b4被链接到线段候选区域42的黑区,它被假定是一条划线的一部分。随后,与黑象素区b4和白象素区w3相应的灰度图象的灰度,以黑象素区b4的左端作为处理开始点,而得到检查,且该平均灰度被彼此比较。然而,由于该黑象素区b4是一条划线的一部分,该白象素区w3是背景,平均灰度差超过了一个预定值。
因此,白象素区w3仍然是白象素,且随后黑象素区b4的长度与从黑象素区b4的左端至白象素区w3的右端的部分的长度的比值得到计算。该比值被判定为小于一个预定值,且从区域b4的左端至右端的部分作为一个端部线段而得到提取。
如果区b4与w3之间的平均灰度差等于或小于一个预定值,或区b4的长度的比值等于或大于一个预定值,则判定从区域b4的左端至区w3的右端的部分是一条划线的一部分。随后,处理以区W3的右端作为一个处理开始点而继续进行。随后,一条划线的一个端部通过重复一种类似的处理而得到探测,且从区b4的左端至划线的新探测到的端部的一个区域作为一个端部线段而得到提取。
在上述处理中,允许区b4、b5和b6的位置相对于区42的Y坐标有少量的上下移动,从而允许图象有小的倾斜。在一个纵向线段候选区域上,进行了与对水平线段候选区域进行的该处理类似的一种处理。
在图2所示的划线提取处理中,对于整个灰度图象,预先产生了一种比较模糊的二值化图象。然而,可获得一种类似的处理结果,虽然产生了一个比较模糊的二值化图象,该图象它具有这样的区域,即该区域限于利用比较扩张的二值化图象而探测到的划线候选区域。因此,进行二值化处理所需的时间,通过在灰度图象与一个划线候选区域相应的区域上进行二值化处理,并通过部分地产生一个比较模糊的二值化图象,而能够得到缩短。
当一个端部线段得到提取时,划线提取设备从有关被判定为一条划线的各个区域的信息,产生一个划线图象。实际上,各个划线区中的黑象素,以及被线段检验处理和端部线段提取处理中的线段内插值识别为黑象素的象素,得到了提取,且具有提取的象素的新的二值化图象新被定义为黑象素。因此,通过有选择地地只二值化一个灰度图象中的划线部分而获得的划线图象可被获得。当只对二值化图象进行传统的划线提取处理时,划线图象可得到采用。
然而,由于划线图象是通过只选择线部分而获得的,其他部分是白象素。因此,当对频繁出现在普通的字条等中的具有圆角的图案进行处理时,一个获得的划线图象表示了用于该圆角的空白部分,由圆角连接的纵向和水平划线呈现为彼此分离。因此,在图2所示的步骤S10中,划线提取设备提取一个圆角,并正确地恢复了划线结构。
例如,如图11所示的划线图象被从具有如图10所示的圆角的一个表的灰度图象产生。图11中所示的一个区51对应于图10所示的表的左上圆角,并位于被确定为是一个水平划线部分的一个区52和被确定为是一个纵向划线部分的如图12所示的区53之间。因此,在此情况下,区51不被识别为是划线。
随后,划线区52与53沿着纵向和水平方向的端点之间的距离得到计算。如果这些值等于或小于一个预定值,则假定圆角很可能存在于区52与53之间的区51中。随后,为区51部分地产生出上述的比较模糊的二值化图象。如果获得了等于或大于一个预定尺寸的一个图案,则它作为一个圆角图案而得到提取。
通过把提取的图案添加到一个划线图象,包含圆角的一个划线图象可得到产生,如图13所示。在此,描述了提取一个圆角图案的处理,但能够以类似的处理提取任何形状的角图案。
因此,当一个纵向划线区与一个水平划线区之间的距离等于或小于一个预定值时,与该纵向和水平划线之间的区对应的灰度图象的区得到探测,且在该区上进行二值化处理以获得该角部分的一个二值化图案。只有当所获得的二值化图案的尺寸等于或大于一个预定的值时,它作为该角部分的一个图案而得到提取,从而从该划线图象中除去噪声。
在图2中显示的步骤S9中的端部线段提取处理中,一个候选划线是否一个划线只根据该候选划线的区和通过在一个划线判定通过延伸该候选划线而获得的区中的灰度改变而得到判定。因此,当有如图7所示的一条线时,线部分和字符部分可被彼此分离。
然而,对于如图14所示的包含一个阴影小区的图象,划线区的长度不正确,且可能错误地提取一个划线。在图14所示的灰度图象中,小区61有阴影。假定获得了如图15所示的比较扩张的二值化图象、如图16所示的比较模糊的二值化图象、以及如图17所示的线段候选区域。此时,在图16所示的二值化图象中,小区61的内部是一个白象素区且没有划线。
然而,如果划线部分和小区61之间的灰度差小,如果在线段候选区域62和63的左端部分上进行端部线段提取处理,则小区61被识别为一个黑象素区,从而过度地延伸了端部线段。
为了避免一个线段的过度延伸,有关其图案被全部二值化并包括噪声的一个比较扩张的二值化图象的信息得到了采用。
在图15所示的比较扩张的二值化图象中,在划线部分和小区61周围黑象素的密度很高。由于比较扩张的二值化图象是通过局部二值化而产生的,小区61的内部作为一个黑暗背景部分而得到处理,并倾向于包含比白区大的噪声。然而,它基本上具有与背景部分相同的特征。
随后,在比较扩张的二值化图象中,具有比较高的黑象素密度的区,作为其中有可能存在划线的一个区,而得到处理。在此情况下,在判定作为一个候选划线而得到提取的一个区的周围部分是否真是一个划线的处理中,只有其中比较扩张的二值化图象的黑象素的密度等于或大于一个预定值的一个部分将要得到判定。通过设定黑象素的一个阈值,一个划线可被防止延伸到小区之内,从而使阴影小区中的该区域可被从将要判定的区中除去。
当上述端部线段提取处理得到进行时,图9所示的流程图被改变成图18和19所示的流程图。图18中所示的步骤S41至S46的处理与图9中所示的步骤S21至S26所示的处理相同。图19中显示的步骤S49至S53中的处理与图9中显示的步骤S27至S31中的处理相同。
当黑象素区的右边的相邻白象素区在图18中所示的步骤S46中得到探测时,则划线提取设备把比较扩张的二值化图象中的一个相应的区引用至包含探测到的黑象素区和白象素区的区,并检查该区的黑象素的密度(图19中的步骤S47)。随后,判定所获得的黑象素的密度是否等于或大于一个预定值(步骤S48)。
如果黑象素的密度等于或大于该预定值,则该白象素区有可能是一个划线。因此,对黑象素区和白象素区进行步骤S49和其之后的处理。如果黑象素的密度小于该预定值,该白象素区被假定为一个区而不是一条划线,且步骤S53的处理得到进行。
因此,在图19所示的处理中,在步骤S49,具有其黑象素的密度小于一个预定值的比较扩张的二值化图象的该区被从将要判定的这些区中除去。然而,也可对这样一个区进行步骤S49的判定。在此情况下,当具有等于或大于一个预定值的黑象素的密度的一个区将要得到处理时,一种被允许的灰度差的阈值得到放松(设定得较大)。当具有小于一个预定值的黑象素的密度的一个区将要得到处理时,该阈值被收紧(设定得较小)。因此,如在图19所示的处理中,划线的过度延伸可得到避免。
类似地,在线段检验处理中,在一个比较扩张的二值化图象中黑象素的密度得到检查,且随后在步骤S13该阈值可根据所获得的值而得到改变。因此,划线被过度延伸的可能性被进一步减小。
写在纸条等的反面上的一个划线以及写在一个小册子的下一页上的一个划线可透过纸而被轻微地看到。在此情况下,一个输入图象也会显示透过纸而看到的反面上的划线。这样的一个划线在以下被称为反面划线。
图20显示了印在右边的一个划线和一个反面划线的一个例子。右边划线的图案由印在纸71的右边上的划线72所反射的光产生,但一个反面划线的图案由当光被印在反面上的划线73反射并通过纸71时纸71的纤维所反射和散射的光产生。因此,一个反面划线的图案具有模糊和遮蔽的轮廓,并具有比右边的划线的图案低的划线线性。
另一方面,在图2所示的划线提取处理中,提取精度得到了改善,且不只包含在一个输入图象中的粗的划线而且一个细的划线都可得到提取。因此,如果写到该纸上的信息作为一个灰度图象而得到输入,则当写在反面或下一页上的一个划线通过纸而被看到时,一个反面划线可得到提取。当粗和细的划线都得到提取时,需要判定提取的划线是被写在右边还是反面。
上述反面划线的特征可被用在判定中。即,根据有关提取的划线区的轮廓部分的灰度的改变的信息,如果灰度的改变大,则判定划线是右边划线,且如果灰度的改变小则它是一个反面划线。虽然右边划线和反面划线具有几乎相同的灰度,轮廓部分的灰度的改变中这两者之间会有一个差别,因而可以进行判定。
反面划线的一个模糊的轮廓表示灰度相对于向着图案的内部的划线的图案的轮廓有小的改变。另一方面,一个清楚的轮廓表示相对于向着图案的内部的轮廓有大的灰度改变。
考虑到沿着与划线的轮廓线垂直的方向(沿着与划线垂直的方向)的灰度改变,一个反面划线表示了灰度的小的改变,而一个右边划线表示灰度的大的改变。进一步地,由于反面划线具有一个遮蔽的轮廓,在沿着反面划线的划线的轮廓线的方向(沿着沿划线的方向)的灰度改变比沿着右边划线的方向的灰度改变大。
另外,右边划线的一个清晰的轮廓被假定是与一个划线的灰度相独立地获得的,且一个反面划线的一个模糊的轮廓也被假定是与该灰度相独立地获得的。因此,在根据划线的轮廓的清晰度的判定方法中,当一个右边划线的灰度薄时,以及当反面划线的灰度厚时,一个划线可被正确地判定。
在此例中,轮廓的灰度的改变得到评估,其中在端部线段提取处理中提取的划线区,利用(沿着与划线垂直的方向的灰度的改变/沿着与划线平行的方向的灰度的改变)被作为用于划线候选区中包含的图案的轮廓部分的评估值,而被指定为一个划线候选区。该评估值对于右边划线较大且对于反面划线较小。
图21显示了一个候选划线的一个线图案的轮廓部分。图22是图21中所示的一个区81的一个扩大图。它显示出,象素的灰度从轮廓向着图案的内部逐渐地变高。在图22中,为象素82定义了两个方向。纵向方向a对应于与划线垂直的方向,且水平方向b对应于与划线平行的方向。
因此,利用沿着与一条划线垂直的方向的灰度的改变和沿着与一条划线水平的方向的灰度的改变,判定一个候选划线的图案是否一个右边划线或一条反面划线,从而只提取所需的图象信息。
图23是这样反面判定的划线提取处理的流程图。图23中的步骤S61至步骤S69的处理与图2中所示的步骤S1至S9的处理相同。图23中所示的步骤S72的处理与图2中显示的步骤S10的处理相同。
当在图23中显示的步骤S69中判定划线区时,划线提取设备把这些区定义为新的划线候选区,分割在纵向和水平划线候选区的交点处的划线候选区,并为反面判定产生一个目标区(步骤S70)。
在此处理中,将要判定的区的单位根据划线的交点而确定。由于在形成小区的一部分的一侧上划线的类型不改变,线的类型以小区侧单位确定。即,如果一条划线得到选择,且另一条划线与该划线垂直地交叉,则这两条划线的交点被假定是一个候选点,在该候选点线的类型改变,且两个交点之间的区被定义为将要确定的区。
例如,当如图24所示的划线候选区(矩形)得到提取时,一个划线候选区91未被分割,且一个划线候选区92被分割成在交点94处的两个区。随后,交点93和94之间的一个区95是将要判定的一个区。对其他的划线候选区进行类似的分割处理。
随后,划线提取设备为将要判定的每一个区进行反面判定(步骤S71)。结果,假定将要判定为是一个反面划线的区不是一条划线,且它被从候选划线中去掉。随后,只有被判定为是右边划线的区保持为划线区,且步骤S72中的处理得到进行。在步骤S71,反面判定按照如下过程进行。
(1)对于将要判定的一个区的轮廓部分的每一个象素,沿着与划线水平的方向和沿着与划线垂直的方向的灰度改变得到计算。
在此处理中,一个目标象素得到选择,且沿着与该划线平行的方向与该目标象素相邻或距该目标象素某些点的一个象素被选择为比较象素。随后,目标象素与该比较象素之间的灰度差得到计算。所获得的值被定义为该目标象素的沿着与划线平行的方向的灰度改变的量。类似地,沿着与该划线纵向的方向,一个目标象素得到选择,且与该目标象素相邻或与该目标象素相距某些点的一个象素被选择为比较象素。该目标象素和比较象素之间的灰度差被定义为该目标象素的沿着与划线垂直的方向的灰度改变量。
例如,在图24所示的将要确定的区的情况下,图25中显示的带下的区被假定为是一个轮廓部分,且为包含在这些区中的象素计算灰度改变量。图26显示了构成了轮廓部分的一部分的一个区96的放大图。图26显示了一个3点×8点的区,以及一个目标象素97。当象素98和99被选择为比较象素时,象素97和98之间的灰度差是象素97的沿着与划线平行的方向的灰度改变量,且象素97与99之间的灰度差是象素97的沿着与划线垂直的方向的灰度改变量。
(2)为每一个象素计算(沿着与划线垂直的方向的灰度改变/沿着与划线平行的方向的灰度改变)的值。
(3)获得为将要确定的一个区中的轮廓部分的所有象素计算的值的平均值,且该获得的值被定义为将要确定的区的一个评估值。
(4)判定将要被确定的、具有大于或等于一个预定值的评估值的一个区是右边划线的一个区,且判定将要确定的、具有小于该预定值的一个评估值的一个区是一个反面划线的一个区。随后,反面划线的区被从划线区中去掉,且右边划线的区作为划线区而被输出。
因此,对于将要确定和从一个灰度图象提取的各个区,沿着与一条划线垂直的方向的灰度改变和沿着与该划线垂直的方向的灰度改变被计算出来,且根据(沿着与一条划线垂直的方向的灰度改变/沿着与一条划线平行的方向的灰度改变)的值,进行反面判定,从而正确地提取划线信息。
在上述过程中,根据沿着与划线垂直的方向的灰度改变和沿着与一条划线平行的方向的灰度改变计算一个评估值。另外,有效的反面判定也能够利用作为一个评估值的、沿着与一条划线垂直的方向的灰度改变而进行。在此情况下,如果在一个轮廓部分的至少一部分象素上该评估值等于或大于一个预定值,则判定所要判定的该区域是一个右边划线区,且将要判定的其他区是反面划线区。
除了利用一个预定的阈值进行反面划线判定之外,表示所有将要判定的区域评估值的分布的一个直方图等可被生成,每次能够获得该评估值的一个阈值-借助它将要被判定的区域能够被分割成两组,且该判定可根据所获得的阈值而进行。
在此情况下,例如,一个评估值的分布可通过应用Otsu采用的阈值选择方法(Otsu,“An Automatic Threshold Selection MethodBasedon Discriminant and Least Squares Criteria”,the Theses oftheInstitute of Electronics and Communication Engineers,“80/4Vol.J63-D No.4,pp.349-356,1980)。在此方法中,优化的阈值可根据级间分散或分散率(=级内分散/级间分散)而获得,且给定的分布可被分成两组。
随后,划线提取设备确定属于一组较大评估值的将要确定的区是一个右边划线区,且属于一组较小评估值的将要确定的区是反面划线的一个区。
在图23所示的划线提取处理中,反面确定,于在图2所示的过程中从一个灰度图象提取了一个划线区之后进行,但步骤S71的判定可被应用于用任何其他方法提取的划线区。
上述划线提取处理可被广泛地应用于一种普通线提取处理,用于不仅识别字条,而且提取图中的一行和一条划线以及一个图象中的曲线图。
进一步地,该划线提取处理中的反面判定可被应用于提取划线之外的任何图案的处理。通过应用该判定,不需要的反面图案可被从一个提取结果中除去,且只有所需的图案可被提取。
在此情况下,该图案提取设备首先从一个灰度图象中提取一个图案候选区,它是一个图案区的候选。随后,获得沿着包含在该提取图案候选区中的一个图案的该轮廓线的切线方向的灰度改变以及沿着与该切线方向垂直的方向的灰度改变。
例如,当一个图案候选区的轮廓的部分具有如图27所示的形状时,该垂直方向对应于与图案的轮廓线的切线方向垂直的方向,且该水平方向b对应于图案的轮廓线的切线方向。计算灰度改变的该方法与用于一条划线的方法相同。
随后,利用(沿着与该切线方向垂直的方向的灰度改变/沿着该切线方向的灰度改变)的值或沿着与该切线方向垂直的方向的灰度改变作为评估值,判定候选图案区是纸的右边的一个图案还是一个反面图案。随后,反面图案的区被除去,且反面图案的区作为一个提取结果而被输出。
在上述实施例中,一个灰度图象被用作多值图象的一个例子。然而,根据本实施例的划线提取处理和图案提取处理可被应用于包括灰度图象和彩色图象的任何多值图象。
进一步地,根据本实施例的划线提取设备和图案提取设备利用如图28所示的信息处理装置(计算机)而得到配置。图28所示的信息处理装置包括一个CPU(中央处理单元)101、存储器102、输入装置103、输出装置104、外部存储装置105、媒体驱动装置106、网络连接装置107、以及图象输入装置108,这些装置通过一条总线109而互连。
存储器102包括ROM(只读存储器)、RAM(随机存取存储器)等,并存储处理中采用的程序和数据。CPU101通过利用存储器102执行一个程序而进行所需的处理。
输入装置103可以是例如一个键盘、一个指向装置、一个触摸面板等等,并被用于输入来自用户的指令和信息。输出装置104可以是例如一个显示器、一个打印机、一个扬声器、等等,并且被用于输出至用户的一个询问和一个处理结果。
外部存储装置105可以是例如一个磁盘装置、一个光盘装置、一个磁-光盘装置、一个磁带装置等等。该信息处理装置把上述程序和数据存储在外部存储装置105中,并按照需要把它们装载到存储器102中以使用它们。
媒体驱动装置106驱动一个便携存储介质110,并存取所存储的内容。便携存储介质110可以是任何计算机可读取的存储介质,诸如存储卡、软盘、CD-ROM、光盘、磁-光盘等等。用户把上述程序和数据存储在该便携存储介质110中,并按照需要把它们装载到存储器102中以使用它们。
网络连接装置107与诸如LAN(局域网络)等的通信网络相连,并对数据进行转换以进行通信。该信息处理装置通过网络连接装置107从另一装置接收上述程序和数据,并根据需要把它们装载到存储器102以使用它们。
图象输入装置108可以是例如一个扫描仪、一个OHR等,且输入一个将要处理的多值图象。
图29显示了能够提供一个程序和数据的计算机可读取存储介质。存储在便携存储介质110和一个服务器111的一个数据库112中的程序和数据被装载到存储器102中。此时,服务器111为传播该程序和数据而产生一个传播信号,并通过网络中的任何发送介质把它们发送到信息处理装置。随后,CPU101利用装载的数据执行该程序,并进行所需的处理。
根据本发明,划线可为各个目的而利用从多值图象产生的两种不同类型的二值化图象而得到正确的提取,虽然在一个多值图象中有阴影,划线和背景等之间的灰度差非常小。因此,不仅可从通过扫描仪输入的图象,而且可从通过非接触式输入装置输入的图象,提取划线。
进一步地,通过把反面判定应用于从一个多值图象提取的一个候选图案区,不需要的反面图案可被除去,且只有所需的图案得到提取。

Claims (25)

1.划线提取设备,包括:
一个第一二值化装置,它通过对一个多值图象进行二值化而产生一个第一二值化图象;
一个第二二值化装置,它通过以与所述第一二值化装置的方法不同的一种方法对该多值图象进行二值化而产生一个第二二值化图象;
一个提取装置,用于利用第一二值化图象提取一个划线候选区;
一个确定装置,用于利用第二二值化图象来判定提取的划线候选区是否对应于一条划线;以及
一个输出装置,用于输出有关被确定为对应于一条划线的一个划线候选区的信息。
2.根据权利要求1的设备,其中
所述第一二值化装置产生一种比较扩张的二值化图象作为第一二值化图象,且所述第二二值化装置产生一种比较模糊的二值化图象作为第二二值化图象,且所述确定装置利用该比较模糊的二值化图象和多值图象进行确定。
3.根据权利要求2的设备,其中
所述确定装置获得划线候选区的一个范围中的比较模糊的二值化图象中的一个黑象素区与一个白象素区之间的灰度差,并当该灰度差小于一个阈值把白象素区中的一个象素视为一个黑象素。
4.根据权利要求3的设备,其中所述确定装置当在该划线候选区中的黑象素的一个比值大于一个预定值时判定该划线候选区对应于一条划线。
5.根据权利要求3的设备,其中
所述确定装置获得在与包含该黑象素区和白象素区的一个区域对应的一个比较模糊的二值化图象的一个区域中的黑象素密度,当黑象素的密度等于或配置一个预定值时把该阈值改变为一个更大的值,且当黑象素的密度小于该预定值时值该阈值改变成一个较小的值。
6.根据权利要求2的设备,其中
所述确定装置获得在该划线候选区的一个范围内的该比较模糊的二值化图象的一个黑象素区和一个白象素区,获得与包含该黑象素区和白象素区的一个区域相应的一个比较扩张的二值化图象的一个区域中的黑象素的密度,在黑象素的该密度等于或大于一个预定值的情况下获得该黑象素区和该白象素区之间的灰度差,并在该灰度差小于该预定值的情况下把该白象素区中的一个象素视为一个黑象素。
7.根据权利要求1的设备,其中
所述第二二值化装置对与该划线候选区的一个位置相应的多值图象中的一个区域进行二值化,并提供地产生该第二二值化图象。
8.根据权利要求1的设备,进一步包括
一个装置,用于当一个纵向划线候选区和一个水平划线候选区之间的距离小于一个预定值时,从该纵向划线候选区和该水平划线候选区之间的被确定为与划线对应的一个区域中的获得二值化图象提取出大于一个预定值的一个图案,其中
所述输出装置输出所提取的图案作为一个轮廓部分。
9.一种划线提取设备,包括:
一个提取装置,用于从一个多值图象提取将要被判定的一个区;
一个确定装置,用于根据沿着与该划线垂直的一个方向的灰度改变获得包含在将要确定的该区域中的一条划线的一个轮廓部分上的一个评估值,在该评估值等于或大于一个预定值的情况下判定该区域是一个必需的划线区,且在该评估值小于该预定值的情况下判定该区域是一个不必需的划线区;以及
一个输出装置,用于输出有关该必需划线区的信息。
10.一种划线提取设备,包括:
一个提取装置,用于从一个多值图象提取将要被判定的一个区域;
一个确定装置,用于根据沿着垂直和平行于该一条划线的灰度改变获得在该将要判定的区域中包含的一条划线的一个轮廓部分的一个评估值,在该评估值等于或大于一个预定值的情况下判定该区域是一个必需的划线区,并在该评估值小于该预定值的情况下判定该将要判定的区域是一个不必需的划线区;以及
一个输出装置,用于输出有关必需划线区的信息。
11.一种划线提取设备,包括:
一个提取装置,用于从一个多值图象提取多个将要判定的区域;
一个确定装置,用于根据沿着与一条划线垂直的方向的一个灰度改变而获得包含在将要被判定的各个区域中的一条划线的一个轮廓上的一个评估值,根据评估值的分布把该多个区域分成两组,判定属于较大的评估值的一组的将要判定的区域是一个必需的划线区,并判定属于较小的评估值的一组的将要判定的区域是一个不必需的划线区;以及
一个输出装置,用于输出有关该必需的划线区的信息。
12.一种图案提取设备,包括:
一个提取装置,用于从一个多值图象提取将要被判定的一个区域;
一个确定装置,用于根据沿着与一条轮廓线的切线方向垂直的方向的灰度改变获得包含在该所要判定的区域中包含的一个图案的轮廓部分上的一个评估值,在该评估值等于或大于一个预定值时判定该所要判定的区域是一个必需的图案区,且在该评估值小于该预定值的情况下判定该所要判定的区域是一个不必需的图案区;以及
输出装置,用于输出有关必需图案区的信息。
13.一种图象处理设备,包括:
一个第一二值化装置,用于对一个多值图象进行局部二值化;
一个第二二值化装置,用于当一个目标象素在所述第一二值化装置进行的局部二值化中被视为白象素时对该目标象素的一个附近区域中的被视为一个白象素的一个象素再次进行局部二值化;以及
一个输出装置,用于输出所述第二二值化装置的处理结果。
14.一种图象处理设备,包括:
一个第一二值化装置,用于在一个多值图象上进行局部二值化;
一个第二二值化装置,用于当一个目标象素在所述第一二值化装置进行的局部二值化中被视为一个白象素时通过改变该目标象素的一个附近区域的形式而再次进行局部二值化;以及
一个输出装置,用于输出所述第二二值化装置的处理结果。
15.一种图象处理设备,包括:
一个第一二值化装置,用于在一个多值图象上进行局部二值化;
一个确定装置,用于在一个目标象素在所述第一二值化装置进行的局部二值化中被视为一个白象素时,通过比较在该目标象素的一个附近区域中的黑象素与白象素之间的平均灰度,而判定是否需要再次进行局部二值化;以及
一个第二二值化装置,用于当判定需要再次进行局部二值化时对该附近区域中被视为一个白象素的一个象素进行局部二值化。
16.一种图象处理设备,包括:
一个确定装置,用于根据一个多值图象的局部二值化中的一个目标象素的一个附近区域中的一个图案的复杂性,判定在一个背景中是否有一个目标象素;
一个二值化装置,用于根据所述确定装置的判定结果进行局部二值化;以及
一个输出装置,用于输出所述二值化装置的处理结果。
17.一种图象处理设备,包括:
一个二值化装置,用于在一个多值图象上进行局部二值化;
一个确定装置,用于当一个目标象素在该局部二值化中被视为一个白象素时在该目标象素的一个附近区域中设定包含该目标象素的一个纵向长区域和一个水平长区域中的至少一个,并当该设定区域中的黑象素的比率大于一个预定值时判定该目标象素是一个黑象素;以及
一个输出装置,用于输出一个处理结果。
18.一种计算机可读取存储介质,它存储有用于使一个计算机执行一种处理的程序,所述处理包括:
通过对一个多值图象进行二值化而产生一个第一二值化图象;
通过以与所述第一二值化装置的方法不同的一种方法对该多值图象进行二值化而产生一个第二二值化图象;
利用第一二值化图象提取一个划线候选区;
利用第二二值化图象来判定提取的划线候选区是否对应于一条划线;以及
输出有关被确定为对应于一条划线的一个划线候选区的信息。
19.一种计算机可读取存储介质,它存储有用于使一个计算机执行一种处理的程序,所述处理包括:
从一个多值图象提取将要被判定的一个区;
根据沿着与该划线垂直的一个方向的灰度改变获得包含在将要确定的该区域中的一条划线的一个轮廓部分的一个评估值;
在该评估值等于或大于一个预定值的情况下判定该区域是一个必需的划线区;
在该评估值小于该预定值的情况下判定该区域是一个不必需的划线区;以及
输出有关该必需划线区的信息。
20.一种传播信号,用于传播一种程序,该程序用于使一个计算机执行一种处理,所述处理包括:
通过对一个多值图象进行二值化而产生一个第一二值化图象;
通过以与所述第一二值化装置的方法不同的一种方法对该多值图象进行二值化而产生一个第二二值化图象;
利用第一二值化图象提取一个划线候选区;
利用第二二值化图象来判定提取的划线候选区是否对应于一条干划;以及
输出有关被确定为对应于一条划线的一个划线候选区的信息。
21.一种传播信号,用于传播一种程序,该程序用于使一个计算机执行一种处理,所述处理包括:
从一个多值图象提取将要被判定的一个区;
根据沿着与该划线垂直的一个方向的灰度改变获得包含在将要确定的该区域中的一条划线的一个轮廓部分的一个评估值;
在该评估值等于或大于一个预定值的情况下判定该区域是一个必需的划线区;
在该评估值小于该预定值的情况下判定该区域是一个不必需的划线区;以及
输出有关该必需划线区的信息。
22.一种划线提取方法,包括:
通过对一个多值图象进行二值化而产生一个第一二值化图象;
通过以与所述第一二值化装置的方法不同的一种方法对该多值图象进行二值化而产生一个第二二值化图象;
利用第一二值化图象提取一个划线候选区;
利用第二二值化图象来判定提取的划线候选区是否对应于一条划线;以及
输出有关被确定为对应于一条划线的一个划线候选区的信息。
23.一种传播信号,用于传播一种程序,该程序用于使一个计算机执行一种处理,所述处理包括:
从一个多值图象提取将要被判定的一个区;
根据沿着与该划线垂直的一个方向的灰度改变获得包含在将要确定的该区域中的一条划线的一个轮廓部分的一个评估值;
在该评估值等于或大于一个预定值的情况下把该区域定义为一个必需的划线区;
在该评估值小于该预定值的情况下把该区域定义为一个不必需的划线区;以及
输出有关该必需划线区的信息。
24.一种划线提取设备,包括:
第一二值化装置,它通过对一个多值图象进行二值化而产生一个第一二值化图象;
第二二值化装置,它通过以与所述第一二值化装置的方法不同的一种方法对该多值图象进行二值化而产生一个第二二值化图象;
提取装置,用于利用第一二值化图象提取一个划线候选区;
确定装置,用于利用第二二值化图象来判定提取的划线候选区是否对应于一条干线;以及
输出装置,用于输出有关被确定为对应于一条划线的一个划线候选区的信息。
25.一种划线提取设备,包括:
提取装置,用于从一个多值图象提取将要被判定的一个区;
确定装置,用于根据沿着与该划线垂直的一个方向的灰度改变获得包含在将要确定的该区域中的一条划线的一个轮廓部分的一个评估值,在该评估值等于或大于一个预定值的情况下判定该区域是一个必需的划线区,且在该评估值小于该预定值的情况下判定该区域是一个不必需的划线区;以及
输出装置,用于输出有关该必需划线区的信息。
CNB011254041A 2000-08-15 2001-08-15 用于从多值图象提取划线的设备 Expired - Fee Related CN1213382C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2000246207 2000-08-15
JP246207/2000 2000-08-15
JP2001064194A JP3904840B2 (ja) 2000-08-15 2001-03-08 多値画像から罫線を抽出する罫線抽出装置
JP064194/2001 2001-03-08

Publications (2)

Publication Number Publication Date
CN1338703A true CN1338703A (zh) 2002-03-06
CN1213382C CN1213382C (zh) 2005-08-03

Family

ID=26597969

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011254041A Expired - Fee Related CN1213382C (zh) 2000-08-15 2001-08-15 用于从多值图象提取划线的设备

Country Status (3)

Country Link
US (2) US7164795B2 (zh)
JP (1) JP3904840B2 (zh)
CN (1) CN1213382C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1301492C (zh) * 2003-02-24 2007-02-21 佳能株式会社 图像处理装置
CN102346848A (zh) * 2010-08-03 2012-02-08 富士施乐株式会社 二值化装置、图像处理设备及二值化方法
CN101789081B (zh) * 2009-01-22 2013-03-27 佳能株式会社 模糊文档图像的二值化方法及其设备
CN111583157A (zh) * 2020-05-13 2020-08-25 杭州睿琪软件有限公司 图像处理方法、系统及计算机可读存储介质

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3574584B2 (ja) * 1998-12-16 2004-10-06 富士通株式会社 表画像処理装置及びそのプログラム記憶媒体
JP4366011B2 (ja) * 2000-12-21 2009-11-18 キヤノン株式会社 文書処理装置及び方法
JP3925112B2 (ja) 2001-06-20 2007-06-06 富士ゼロックス株式会社 画像処理装置
JP3898075B2 (ja) * 2002-03-18 2007-03-28 株式会社リコー 画像処理装置、画像処理方法及び記録媒体
WO2004081887A1 (ja) * 2003-03-14 2004-09-23 Fujitsu Limited 紙葉類識別方法及び紙葉類識別装置
US7463770B2 (en) * 2003-07-21 2008-12-09 Lockheed Martin Corporation Methods and systems for detection of repeating patterns of features
JP4250483B2 (ja) * 2003-08-25 2009-04-08 キヤノン株式会社 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
IL162878A0 (en) * 2004-07-06 2005-11-20 Hi Tech Solutions Ltd Multi-level neural network based characters identification method and system
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
JP2007156879A (ja) * 2005-12-06 2007-06-21 Sony Corp 情報処理装置および方法、並びにプログラム
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
JP4702244B2 (ja) * 2006-09-26 2011-06-15 沖電気工業株式会社 帳票読取装置
JP2008252862A (ja) * 2007-03-05 2008-10-16 Ricoh Co Ltd 画像処理装置、画像処理方法及び画像処理プログラム
US20080219561A1 (en) * 2007-03-05 2008-09-11 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product
JP5042917B2 (ja) * 2007-07-12 2012-10-03 株式会社リコー 画像処理装置およびプログラム
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image
JP4867894B2 (ja) * 2007-11-05 2012-02-01 沖電気工業株式会社 画像認識装置、画像認識方法及びプログラム
US20090214134A1 (en) * 2008-02-27 2009-08-27 Motorola, Inc. System and method for image data extraction and assembly in digital cameras
KR101330665B1 (ko) * 2008-02-29 2013-11-15 삼성전자주식회사 하프토닝 이미지의 보정장치 및 방법, 그리고 그를 이용한화상형성장치
JP5710101B2 (ja) * 2008-12-24 2015-04-30 大日本印刷株式会社 印刷物検査装置、及び印刷物検査方法
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP4940270B2 (ja) * 2009-07-06 2012-05-30 シャープ株式会社 画像形成装置
US8406554B1 (en) * 2009-12-02 2013-03-26 Jadavpur University Image binarization based on grey membership parameters of pixels
US8315426B2 (en) * 2010-03-12 2012-11-20 Mitsubishi Electric Research Laboratories, Inc. Method for handling pixel occlusions in stereo images using iterative support and decision processes
CN102375978A (zh) * 2010-08-17 2012-03-14 富士通株式会社 处理图像的方法和设备
JP5640645B2 (ja) * 2010-10-26 2014-12-17 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8942484B2 (en) * 2011-09-06 2015-01-27 Qualcomm Incorporated Text detection using image regions
KR101549495B1 (ko) 2013-12-26 2015-09-03 조선대학교산학협력단 문자 추출 장치 및 그 방법
US10262430B2 (en) 2014-04-28 2019-04-16 Eizo Corporation Annotation line determining unit, annotation line removing unit, medical display, and method therefor
CN109478240B (zh) * 2015-09-10 2021-12-14 Sync-Rx有限公司 自动图像特征移除
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP2022167414A (ja) * 2021-04-23 2022-11-04 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6073408A (ja) 1983-09-30 1985-04-25 Matsushita Electric Ind Co Ltd パタ−ン認識装置
US4718090A (en) * 1986-04-14 1988-01-05 Cooper Jr James E Method and apparatus for high-speed processing of video images
US4903316A (en) * 1986-05-16 1990-02-20 Fuji Electric Co., Ltd. Binarizing apparatus
US5125045A (en) * 1987-11-20 1992-06-23 Hitachi, Ltd. Image processing system
US5086484A (en) * 1988-08-24 1992-02-04 Canon Kabushiki Kaisha Image processing apparatus with fixed or variable threshold
US5153925A (en) * 1989-04-27 1992-10-06 Canon Kabushiki Kaisha Image processing apparatus
JP2843079B2 (ja) * 1989-12-22 1999-01-06 本田技研工業株式会社 走行路判別方法
US5200841A (en) * 1990-05-25 1993-04-06 Nikon Corporation Apparatus for binarizing images
JPH0477973A (ja) 1990-07-20 1992-03-12 Canon Inc 画像形成装置
JPH06203165A (ja) 1993-01-07 1994-07-22 Canon Inc 画像情報処理方法及び装置
JP2951814B2 (ja) 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
US5995665A (en) * 1995-05-31 1999-11-30 Canon Kabushiki Kaisha Image processing apparatus and method
KR0181129B1 (ko) * 1995-06-17 1999-05-01 김광호 화상처리장치의 화소 이치화 장치 및 방법
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
US5933525A (en) * 1996-04-10 1999-08-03 Bbn Corporation Language-independent and segmentation-free optical character recognition system and method
US5969325A (en) * 1996-06-03 1999-10-19 Accu-Sort Systems, Inc. High speed image acquisition system and method of processing and decoding barcode symbol
JP3615333B2 (ja) * 1996-12-05 2005-02-02 株式会社リコー 罫線消去装置
JP3695163B2 (ja) * 1998-07-31 2005-09-14 コニカミノルタビジネステクノロジーズ株式会社 画像形成装置
US6185329B1 (en) * 1998-10-13 2001-02-06 Hewlett-Packard Company Automatic caption text detection and processing for digital images
JP3756719B2 (ja) * 2000-01-20 2006-03-15 理想科学工業株式会社 文書修飾装置及び画像処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1301492C (zh) * 2003-02-24 2007-02-21 佳能株式会社 图像处理装置
CN101789081B (zh) * 2009-01-22 2013-03-27 佳能株式会社 模糊文档图像的二值化方法及其设备
CN102346848A (zh) * 2010-08-03 2012-02-08 富士施乐株式会社 二值化装置、图像处理设备及二值化方法
CN102346848B (zh) * 2010-08-03 2017-07-28 富士施乐株式会社 二值化装置、图像处理设备及二值化方法
CN111583157A (zh) * 2020-05-13 2020-08-25 杭州睿琪软件有限公司 图像处理方法、系统及计算机可读存储介质

Also Published As

Publication number Publication date
JP2002133426A (ja) 2002-05-10
US7164795B2 (en) 2007-01-16
US20020021840A1 (en) 2002-02-21
US7440618B2 (en) 2008-10-21
US20050031208A1 (en) 2005-02-10
JP3904840B2 (ja) 2007-04-11
CN1213382C (zh) 2005-08-03

Similar Documents

Publication Publication Date Title
CN1338703A (zh) 用于从多值图象提取划线的设备
CN1184796C (zh) 图象处理方法和设备以及图象处理系统
CN1313963C (zh) 字符识别装置和字符识别方法
CN1187952C (zh) 校正输入图象失真的设备与方法
CN1120442C (zh) 文件图象处理设备及其方法
US8849042B2 (en) Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium
CN1143239C (zh) 用来分析表格图像的方法和设备
CN1240024C (zh) 图像处理装置、图像处理方法
JP4911340B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
JP5455038B2 (ja) 画像処理装置、画像処理方法、及びプログラム
CN1818927A (zh) 指纹识别方法与系统
CN1742279A (zh) 条形码识别装置
CN1945599A (zh) 图像处理装置,图像处理方法和计算机程序产品
CN1477852A (zh) 图像处理设备、图像处理方法以及图像处理程序的存储介质
KR20120132314A (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체
CN1912932A (zh) 薄片识别设备和薄片识别方法
CN1310182C (zh) 用于增强文档图像和字符识别的方法和装置
CN1822027A (zh) 灰度字符的精确分割装置及方法
CN1757046A (zh) 图像处理装置
CN1282943C (zh) 图像处理方法及装置
CN1859541A (zh) 图像处理设备及其控制方法
CN100341028C (zh) 模式分段装置及其方法和模式识别装置及其方法
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
CN101067844A (zh) 二维条形码、信息处理设备、信息处理方法和程序
CN1790377A (zh) 反白字符识别、快速准确的块分类方法和文本行生成方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050803

Termination date: 20170815