[go: up one dir, main page]

CN102298696A - 一种字符识别方法及系统 - Google Patents

一种字符识别方法及系统 Download PDF

Info

Publication number
CN102298696A
CN102298696A CN2010102113650A CN201010211365A CN102298696A CN 102298696 A CN102298696 A CN 102298696A CN 2010102113650 A CN2010102113650 A CN 2010102113650A CN 201010211365 A CN201010211365 A CN 201010211365A CN 102298696 A CN102298696 A CN 102298696A
Authority
CN
China
Prior art keywords
character
identification
result
identification result
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010102113650A
Other languages
English (en)
Other versions
CN102298696B (zh
Inventor
赵海涛
周长岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder International Beijing Co Ltd
Original Assignee
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Beijing Co Ltd filed Critical Founder International Beijing Co Ltd
Priority to CN 201010211365 priority Critical patent/CN102298696B/zh
Publication of CN102298696A publication Critical patent/CN102298696A/zh
Application granted granted Critical
Publication of CN102298696B publication Critical patent/CN102298696B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明公开了一种字符识别方法及系统,属于文字识别技术领域。现有的文字识别方法人工的劳动强度和成本大、且质量的稳定性和准确性难以保证。本发明所述的方法首先对待识别文档进行版面分析,将分析得到的字符区域进行字符切割以获得字符图像数据;其次,利用不同的识别核心分别对字符图像数据依次进行字符识别,得到各个字符识别结果的相似度;最后,根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。本发明所述方法及系统可以利用不同识别核心的优势,对识别文字结果可以定量得计算出每个字符不同的准确度,减少后期人工修改的工作量,同时质量更加可靠。

Description

一种字符识别方法及系统
技术领域
本发明涉及文字识别技术领域,尤其涉及一种字符识别方法及系统。
背景技术
在当前数字化处理行业,印刷体汉字识别技术已经被广泛的应用。目前使用识别系统进行印刷体数字化工作,主要采用以下两种技术:
一种是采用单一的识别系统,经过识别后的文本直接交给人工进行后期修改工作。这种方法的不足是单一识别系统由于识别算法的唯一性,对图像与识别字典的匹配度计算就有局限性,从而使得某些字符在此种算法下的相似度很高,造成误识率高,后期必须做逐字校对才能满足质量要求。
另一种是将两个识别系统识别后的文本文件通过校对软件进行对比,找出不同的地方标记出来。相同的部分则视为识别准确。此方法的不足是由于各个识别系统的切分算法不一致,使得识别出来的文字并不是一一对应的,增加了校对算法的难度,有的情况甚至是不能对比的,另外是并没有利用识别系统自身的识别相似度的数据,只是机械的把各个识别系统的结果分为一致和不一致两种。
现有技术不足之处在于几乎所有的识别系统都以文字识别正确率作为主要参数,而很少提供误识率和错字定位相关信息。而后者正是海量数据加工过程中的重要信息。对于识别后的修改工作,查找一个错字的位置所用的时间远比修改它要多得多。现有处理方法中并不能大幅地削减人工后期修改的工作量,而人工修改环节是整个数字化工艺中成本最高的一个环节。同时由于没有挖掘多种识别系统的过程数据来自动判断文字的置信度,文字质量还要过多的依靠人工判别,使得质量的稳定性和准确性难以保证。
发明内容
针对现有技术中所存在的问题,本发明的目的是提供一种字符识别方法及系统。该方法及系统能够应用多个识别核心,通过加权计算不但可以提供每个字符的综合识别结果,同时提供字符识别结果的准确度,准确度达到一定标准的字符则不需要进行人工检验修改,从而提高识别结果后期编改的工作效率。
为了实现上述发明目的,本发明采用的技术方案是:一种字符识别方法,包括以下步骤:
(1)对待识别文档进行版面分析,将分析得到的字符区域进行字符切割以获得字符图像数据;
(2)利用不同的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果相似度;
(3)根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
进一步,步骤(2)中,所述的每个字符识别结果包括首选识别结果和第一备选识别结果。
进一步,步骤(2)中,所述各个字符识别结果的相似度包括每个识别核心的首选识别结果相似度和首选识别结果与第一备选识别结果相似度差值,其中:
所述识别结果相似度表示识别核心所返回的识别结果与原字符的相似度。
进一步,步骤(2)中,若每个识别核心的相似度度量单位不同,则按比例转化为相同的度量单位。
进一步,所述根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,具体步骤包括:
a.判断字符识别结果的字符类型;
b.获取识别核心所述字符类型的加权参考值;
c.利用所述字符识别结果相似度和所述加权参考值,计算得到该字符识别结果的综合置信度。
进一步,所述该识别结果的综合置信度是指首选识别结果相似度、首选识别结果与第一备选识别结果相似度差值以及识别核心字符类型的加权参考值的乘积。
进一步,所述得到最终字符识别结果及其准确度,具体包括:
i.对于同一字符图像数据,依据每个识别核心字符识别结果的综合置信度,选择综合置信度高的作为最终字符识别结果;
ii.依据每个识别核心字符识别结果的差异性,确定字符识别结果的准确度;若各个识别核心结果相同,则字符识别结果的准确度最高,若各个识别核心结果均不相同,则字符识别结果的准确度最低。
进一步,所述的首选识别结果与第一备选识别结果相似度的差值与字符识别结果的准确度成反比,其差值越大,识别核心对字符识别结果的准确度越高;其差值越小,识别核心对字符识别结果的准确度越低。
进一步,若不同识别核心的的字符识别结果存在相同情况,则计算相同结果对应的综合置信度的平均值并将其作为调整后的该字符识别结果的综合置信度。
进一步,在字符识别过程中,根据待识别文档中已得到的最终字符识别结果调整各个识别核心的加权参考值。
更进一步,所述的方法进一步包括:将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
为实现上述方法,本发明提供了一种字符识别系统,包括:
字符切割装置,用于对待识别文档进行版面分析,并将分析得到的字符区域进行字符切割以获得字符图像数据;
识别装置,用于利用不同的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果的相似度;
计算装置,用于根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
进一步,所述的计算装置包括:
字符类型判断模块,用于判断字符识别结果的字符类型;
加权参考值获取模块,用于获取识别核心所述字符类型的加权参考值;
综合置信度计算模块,用于利用字符识别结果相似度和加权参考值,计算得到识别结果的综合置信度。
更进一步,所述系统还包括:
输出装置:用于将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
本发明的效果在于:本发明通过识别过程结果的计算和对比,辅以海量测试数据的分析结果,利用不同识别核心的优势,对识别文字结果可以定量得计算出每个字符不同的准确度,使后期识别结果的修改工作可以集中在准确度较低的部分,对于准确度较高的部分则可以不用修改。所以不需要对结果逐字进行也能达到质量要求,大大的节省了人工的劳动强度和成本,同时质量更加可靠。
附图说明
图1为具体实施方式中所述一种字符识别系统的结构框图;
图2为具体实施方式中所述一种字符识别方法的流程图;
图3为具体实施方式中待识别文档;
图4为具体实施方式中待识别文档经过版面分析后的字符区域;
图5为具体实施方式中经字符切割后的字符图像数据;
图6为具体实施方式中经识别核心识别后的字符识别结果。
具体实施方式
下面结合说明书附图和具体实施方式,对本发明进行详细说明。
图1示出了具体实施方式中所述一种字符识别系统的结构框图,该系统包括:
字符切割装置11,用于对待识别文档进行版面分析,并将分析得到的字符区域进行字符切割以获得字符图像数据;
识别装置12,用于利用不同的的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果的相似度;
计算装置13,用于根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
其中,计算装置13还包括用于判断字符识别结果的字符类型的字符类型判断模块31、用于获取识别核心所述字符类型的加权参考值的加权参考值获取模块32和用于利用字符识别结果相似度和加权参考值,计算得到识别结果的综合置信度的综合置信度计算模块33。
输出装置14,用于将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
图2示出了具体实施方式中采用图1所示系统进行字符识别的一种字符识别方法,该方法包括以下步骤:
S11:对待识别文档进行版面分析,将分析得到的字符区域进行字符切割以获得字符图像数据;
首先对原始图像按照常规的方法进行二值化、纠斜和版面分析。本实施例中采用大津法进行二值化,纠斜采用投影图的方式查找连续线段最高峰,使用Hough变换搜索倾斜角度。版面分析则利用游程图采用自底向上的分析方法,将图像数据划分为具有不同符号的区域,如字符区域、图形区域、表格区域等。然后,对字符区域的水平方向和垂直方向进行投影,然后根据投影,根据投影图进行字符切割以获得每个字符图像数据。显然,也可以采用连通域法等其它字符切割方法。
本实施例中,如图3中所示为待识别文档,经版面分析后得到识别区域即字符区域,如图4所示,再经过字符切割获每个字符图像数据,如图5所示。
S12:利用不同的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果的相似度;
其中,所得到的每个字符识别结果包括首选识别结果和第一备选识别结果。
本实施例中,选用的不同的识别核心为三个,分别为ABBYY公司的识别核心、汉王公司的识别核心、文通公司的识别核心,当然也可以选择其它识别核心,识别核心的数量也可以是四个或者四个以上不同的识别核心。
本实施例中,选用ABBYY公司的识别核心、汉王公司的识别核心、文通公司的识别核心(分别用识别核心A、识别核心B和识别核心C表示)分别对字符图像数据进行字符识别。所述各个字符识别结果的相似度包括每个识别核心的首选识别结果相似度和首选识别结果与第一备选识别结果相似度差值,其中:
所述识别结果相似度表示识别核心所返回的识别结果与原字符的相似度。本实施例中引入此参数的原因为在实际数据中识别结果的准确度越高,此相似度差值越大。相反地,如果识别核心对识别结果准确度越低,此相似度差值越小。引入此参数可以放大首选识别结果相似度。
本实施例中,若每个识别核心的相似度度量单位不同(比如有的识别核心用0-10之间的数值来表示相似度,有的识别核心用0-100之间的数值来表示相似度),则按比例转化为相同的度量单位。如将相似度统一转化为0-10之间的数值。
S13:根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,具体步骤包括:
a.判断字符识别结果的字符类型;
b.获取识别核心所述字符类型的加权参考值,所述的加权参考值是根据预先大量的测试和统计得到的;
如表1所示,表1中的数值为识别核心A、识别核心B和识别核心C的各字符类型加权值:如对于识别核心A、识别核心B与识别核心C,当代简体汉字的加权参考值均为1.2;对于当代繁体汉字,识别核心A的加权参考值为0.9,识别核心B的为1.1,识别核心C的为1;可见,利用不同识别核心进行字符识别对识别文字结果可以定量计算出每个字符不同的准确度。
 识别核心A   识别核心B  识别核心C
  当代简体汉字   1.2   1.2   1.2
  当代繁体汉字   0.9   1.1   1
  非标准简化字   0.8   1.5   1.2
  英文、数字及符号   1.5   1   1
表1
c.利用所述字符识别结果相似度和所述加权参考值,计算得到该字符识别结果的综合置信度。
所述该字符识别结果的综合置信度是指首选识别结果相似度、首选识别结果与第一备选识别结果相似度差值以及识别核心字符类型的加权参考值的乘积,如公式1所示:
综合置信度=首选识别结果相似度×首选识别结果与第一备选识别结果相似度差值×识别核心加权值.......................................公式1
所述得到最终字符识别结果及其准确度,具体包括:
对于同一字符图像数据,依据每个识别核心字符识别结果的综合置信度,选择综合置信度高的作为最终字符识别结果;依据每个识别核心字符识别结果的差异性,确定字符识别结果的准确度;若各个识别核心结果相同,则字符识别结果的准确度最高,若各个识别核心结果均不相同,则字符识别结果的准确度最低。
本实施例中,通过执行上述步骤每个字符图像数据可以得到三个识别核心的字符识别结果(即不同识别核心的首选识别结果)以及识别结果综合置信度,即识别结果A,识别结果B,识别结果C和置信度A,置信度B,置信度C
本实施例中,应用上述识别核心A、识别核心B与识别核心C分别对图三中所示的字符图像数据进行字符识别处理,得到如图6中所示的三个结果。
若其中的识别结果存在相同情况,则计算相同结果综合置信度的平均值并将其作为调整后的该字符识别结果的综合置信度。
即若识别结果A=识别结果B,则调整后的置信度AB=Average(置信度A,置信度B)。
则比较调整后的置信度AB和置信度C,选择综合置信度最高的作为最终字符识别结果。若3个识别结果均不相同则准确度最低,即准确度等级为III;相反若3个识别结果均相同则准确度最高,即准确度等级为I。准确度可以采用等级表示,也可以采用数值表示,本实施例中采用等级的方式来表示准确度。
本实施例中,应用上述综合置信度公式即公式1对三个识别核心的识别结果进行计算,得到部分字符的综合置信度及准确度的等级如表2所示:
Figure BSA00000168903900081
表2
本实施例中,在字符识别过程中还可以根据待识别文档中已得到的最终字符识别结果调整各个识别核心的加权参考值,其调整过程具体如下:
本实施例中,在字符识别过程中如果经常出现某识别核心的结果是正确的却不被采用,则说明其加权值是需要调整的。我们可根据最终字符识别结果调整各个识别核心的加权参考值。粗略的计算方法如下:
假设三个识别核心对10万字识别后的正确率分别为正确率A,正确率B,正确率C,
其平均正确率为:平均正确率=(正确率A+正确率B+正确率C)/3
这样,每个识别核心的加权值的计算方法为:
Figure BSA00000168903900091
其中,L为放大倍数,其取值范围是2~10。
本实施例中,所述方法进一步包括以下步骤:
S14:将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
最终的识别结果中置信度高于设定阈值或等级的字符,则不需要人工进行检验修改。如本实施例中,对于准确度等级为I的识别结果不需要人工进行检验修改,对于准确度等级为II和等级III的识别结果则需要进行人工审核和修改。本实施例中,根据表2中所示结果,后期校对工作只需要对II级和III级的文字“,”和“o”进行人工校对即可。
本发明应用多识别核心,通过加权计算不但可以提供每个字符的综合识别结果,同时提供字符识别结果的置信度,当置信度达到一定标准的字符则不需要进行人工检验修改,所以不需要对结果逐字进行也能达到质量要求,大大的节省了人工的劳动强度和成本,同时质量更加可靠。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种字符识别方法,包括以下步骤:
(1)对待识别文档进行版面分析,将分析得到的字符区域进行字符切割以获得字符图像数据;
(2)利用不同的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果相似度;
(3)根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
2.如权利要求1所述的一种字符识别方法,其特征在于,步骤(2)中,所述的每个字符识别结果包括首选识别结果和第一备选识别结果。
3.如权利要求2所述的一种字符识别方法,其特征在于,步骤(2)中,所述各个字符识别结果的相似度包括每个识别核心的首选识别结果相似度和首选识别结果与第一备选识别结果相似度差值,其中:
所述识别结果相似度表示识别核心所返回的识别结果与原字符的相似度。
4.如权利要求1所述的一种字符识别方法,其特征在于,步骤(2)中,不同的识别核心为三个;
若不同识别核心的相似度度量单位不同,则按比例转化为相同的度量单位。
5.如权利要求1所述的一种字符识别方法,其特征在于,步骤(3)中,所述根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,具体步骤包括:
a.判断字符识别结果的字符类型;
b.获取识别核心所述字符类型的加权参考值;
c.利用所述字符识别结果相似度和所述加权参考值,计算得到该字符识别结果的综合置信度。
6.如权利要求5所述的一种字符识别方法,其特征在于,所述该识别结果的综合置信度是指首选识别结果相似度、首选识别结果与第一备选识别结果相似度差值以及识别核心字符类型的加权参考值的乘积。
7.如权利要求1所述的一种字符识别方法,其特征在于,步骤(3)中,所述得到最终字符识别结果及其准确度,具体包括:
i.对于同一字符图像数据,依据每个识别核心字符识别结果的综合置信度,选择综合置信度高的作为最终字符识别结果;
ii.依据每个识别核心字符识别结果的差异性,确定字符识别结果的准确度;若各个识别核心结果相同,则字符识别结果的准确度最高,若各个识别核心结果均不相同,则字符识别结果的准确度最低。
8.如权利要求3所述的一种字符识别方法,其特征在于,所述的首选识别结果与第一备选识别结果相似度的差值与字符识别结果的准确度成正比,其差值越大,识别核心对字符识别结果的准确度越高;其差值越小,识别核心对字符识别结果的准确度越低。
9.如权利要求7所述的一种字符识别方法,其特征在于,若不同识别核心得到的字符识别结果存在相同情况,则计算相同结果对应的综合置信度的平均值并将其作为调整后的该字符识别结果的综合置信度。
10.如权利要求7所述的一种字符识别方法,其特征在于,在字符识别过程中,根据待识别文档中已得到的最终字符识别结果调整各个识别核心的加权参考值。
11.如权利要求1至10之一所述的一种字符识别方法,其特征在于,所述方法进一步包括:
(4)将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
12.一种字符识别系统,包括:
字符切割装置,用于对待识别文档进行版面分析,并将分析得到的字符区域进行字符切割以获得字符图像数据;
识别装置,用于利用不同的识别核心分别对字符图像数据依次进行字符识别,得到每个字符识别结果和各个字符识别结果的相似度;
计算装置,用于根据识别核心加权参考值以及字符识别结果相似度对所述字符识别结果进行加权计算,得到最终字符识别结果及其准确度。
13.如权利要求12所述的一种字符识别系统,其特征在于,所述计算装置包括:
字符类型判断模块,用于判断字符识别结果的字符类型;
加权参考值获取模块,用于获取识别核心所述字符类型的加权参考值;
综合置信度模块,用于利用字符识别结果相似度和加权参考值,计算得到字符识别结果的综合置信度。
14.如权利要求12或13所述的一种字符识别系统,其特征在于,该系统还包括:
输出装置:用于将每个字符图像数据的最终字符识别结果、准确度以及文字坐标数据合成为输出文件,供后期文字修改环节使用。
CN 201010211365 2010-06-28 2010-06-28 一种字符识别方法及系统 Expired - Fee Related CN102298696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010211365 CN102298696B (zh) 2010-06-28 2010-06-28 一种字符识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010211365 CN102298696B (zh) 2010-06-28 2010-06-28 一种字符识别方法及系统

Publications (2)

Publication Number Publication Date
CN102298696A true CN102298696A (zh) 2011-12-28
CN102298696B CN102298696B (zh) 2013-07-24

Family

ID=45359106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010211365 Expired - Fee Related CN102298696B (zh) 2010-06-28 2010-06-28 一种字符识别方法及系统

Country Status (1)

Country Link
CN (1) CN102298696B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929843A (zh) * 2012-09-14 2013-02-13 《中国学术期刊(光盘版)》电子杂志社 一种文字编改系统及编改的方法
CN103257954A (zh) * 2013-06-05 2013-08-21 北京百度网讯科技有限公司 古籍中文字的校对方法、系统及校对服务器
CN103425974A (zh) * 2012-05-15 2013-12-04 富士施乐株式会社 图像处理装置和图像处理方法
CN103714316A (zh) * 2013-12-10 2014-04-09 小米科技有限责任公司 图像识别方法、装置及电子设备
CN103729636A (zh) * 2013-12-18 2014-04-16 小米科技有限责任公司 字符切割方法、装置及电子设备
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
CN105653160A (zh) * 2016-02-25 2016-06-08 努比亚技术有限公司 一种文本确定方法和终端
CN106095932A (zh) * 2016-06-13 2016-11-09 竹间智能科技(上海)有限公司 百科知识问句识别方法及装置
CN103870823B (zh) * 2012-12-07 2017-04-12 株式会社日立信息通信工程 字符识别装置及方法
CN107403130A (zh) * 2017-04-19 2017-11-28 北京粉笔未来科技有限公司 一种字符识别方法及字符识别装置
CN108875746A (zh) * 2018-05-17 2018-11-23 北京旷视科技有限公司 一种车牌识别方法、装置、系统及存储介质
CN112052852A (zh) * 2020-09-09 2020-12-08 国家气象信息中心 一种基于深度学习的手写气象档案资料的字符识别方法
CN113887375A (zh) * 2021-09-27 2022-01-04 浙江大华技术股份有限公司 一种文本识别方法、装置、设备及存储介质
CN114359677A (zh) * 2021-12-30 2022-04-15 北京超维景生物科技有限公司 处理图像序列的方法及装置
CN115552446A (zh) * 2020-05-15 2022-12-30 三菱电机楼宇解决方案株式会社 维护管理作业辅助装置以及维护管理作业便携终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567358A (zh) * 2003-06-12 2005-01-19 摩托罗拉公司 改进的电子设备中字符输入的识别
US20080131006A1 (en) * 2006-12-04 2008-06-05 Jonathan James Oliver Pure adversarial approach for identifying text content in images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567358A (zh) * 2003-06-12 2005-01-19 摩托罗拉公司 改进的电子设备中字符输入的识别
US20080131006A1 (en) * 2006-12-04 2008-06-05 Jonathan James Oliver Pure adversarial approach for identifying text content in images

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425974A (zh) * 2012-05-15 2013-12-04 富士施乐株式会社 图像处理装置和图像处理方法
CN103425974B (zh) * 2012-05-15 2017-09-15 富士施乐株式会社 图像处理装置和图像处理方法
CN102929843A (zh) * 2012-09-14 2013-02-13 《中国学术期刊(光盘版)》电子杂志社 一种文字编改系统及编改的方法
CN103870823B (zh) * 2012-12-07 2017-04-12 株式会社日立信息通信工程 字符识别装置及方法
CN103257954B (zh) * 2013-06-05 2016-08-10 北京百度网讯科技有限公司 古籍中文字的校对方法、系统及校对服务器
CN103257954A (zh) * 2013-06-05 2013-08-21 北京百度网讯科技有限公司 古籍中文字的校对方法、系统及校对服务器
CN103714316A (zh) * 2013-12-10 2014-04-09 小米科技有限责任公司 图像识别方法、装置及电子设备
CN103729636B (zh) * 2013-12-18 2017-07-25 小米科技有限责任公司 字符切割方法、装置及电子设备
CN103729636A (zh) * 2013-12-18 2014-04-16 小米科技有限责任公司 字符切割方法、装置及电子设备
CN105631393A (zh) * 2014-11-06 2016-06-01 阿里巴巴集团控股有限公司 信息识别方法及装置
US10346703B2 (en) 2014-11-06 2019-07-09 Alibaba Group Holding Limited Method and apparatus for information recognition
TWI685795B (zh) * 2014-11-06 2020-02-21 香港商阿里巴巴集團服務有限公司 資訊識別方法及裝置
CN105653160A (zh) * 2016-02-25 2016-06-08 努比亚技术有限公司 一种文本确定方法和终端
CN106095932A (zh) * 2016-06-13 2016-11-09 竹间智能科技(上海)有限公司 百科知识问句识别方法及装置
CN107403130A (zh) * 2017-04-19 2017-11-28 北京粉笔未来科技有限公司 一种字符识别方法及字符识别装置
CN108875746A (zh) * 2018-05-17 2018-11-23 北京旷视科技有限公司 一种车牌识别方法、装置、系统及存储介质
CN108875746B (zh) * 2018-05-17 2023-02-17 北京旷视科技有限公司 一种车牌识别方法、装置、系统及存储介质
CN115552446A (zh) * 2020-05-15 2022-12-30 三菱电机楼宇解决方案株式会社 维护管理作业辅助装置以及维护管理作业便携终端
CN115552446B (zh) * 2020-05-15 2023-10-31 三菱电机楼宇解决方案株式会社 维护管理作业辅助装置以及维护管理作业便携终端
CN112052852A (zh) * 2020-09-09 2020-12-08 国家气象信息中心 一种基于深度学习的手写气象档案资料的字符识别方法
CN112052852B (zh) * 2020-09-09 2023-12-29 国家气象信息中心 一种基于深度学习的手写气象档案资料的字符识别方法
CN113887375A (zh) * 2021-09-27 2022-01-04 浙江大华技术股份有限公司 一种文本识别方法、装置、设备及存储介质
CN114359677A (zh) * 2021-12-30 2022-04-15 北京超维景生物科技有限公司 处理图像序列的方法及装置
CN114359677B (zh) * 2021-12-30 2024-08-09 北京超维景生物科技有限公司 处理图像序列的方法及装置

Also Published As

Publication number Publication date
CN102298696B (zh) 2013-07-24

Similar Documents

Publication Publication Date Title
CN102298696B (zh) 一种字符识别方法及系统
US11756323B2 (en) Method of automatically recognizing and classifying design information in imaged PID drawing and method of automatically creating intelligent PID drawing using design information stored in database
CN110766014B (zh) 票据信息定位方法、系统及计算机可读存储介质
CN109658584B (zh) 一种票据信息识别方法及装置
KR20200065613A (ko) 이미지화된 pid 도면에서 설계 정보를 자동으로 인식하여 분류하는 방법
CN116704523B (zh) 一种用于出版印刷设备的文字排版图像识别系统
CN109919076B (zh) 基于深度学习的确认ocr识别结果可靠性的方法及介质
CN105913057B (zh) 一种结合投影和结构特征进行图像中数学公式检测方法
CN114463767B (zh) 信用证识别方法、装置、计算机设备和存储介质
CN110516664A (zh) 票据识别方法、装置、电子设备及存储介质
CN108280430B (zh) 一种流程图像识别方法
CN117765544A (zh) 一种文档关键要素识别方法、装置、设备及介质
CN117727056A (zh) 一种勾选框识别方法、装置、设备及介质
CN114067325A (zh) 股权结构图识别方法、系统及其设备
CN109241975A (zh) 一种基于字符中心点定位的车牌字符分割方法
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
CN116311299A (zh) 表格的结构化数据识别方法、装置及系统
CN106650719A (zh) 识别图片文字的方法及装置
CN111340000A (zh) 一种针对pdf文档表格提取优化方法及系统
CN113886582B (zh) 文档处理方法及装置、用于图像的数据提取方法及装置
CN117058694A (zh) 一种图像文本结构化提取方法及装置
CN117408240A (zh) 一种基于人工智能的标准文本生成系统
Moysset et al. On the evaluation of handwritten text line detection algorithms
CN111931018A (zh) 试题匹配及试题拆分方法、装置和计算机存储介质
CN112183458B (zh) 一种基于人工智能技术的电子单证的数据处理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130724

Termination date: 20140628

EXPY Termination of patent right or utility model