[go: up one dir, main page]

CN116403224A - 字符识别方法、装置、计算机设备、存储介质和程序产品 - Google Patents

字符识别方法、装置、计算机设备、存储介质和程序产品 Download PDF

Info

Publication number
CN116403224A
CN116403224A CN202310370391.5A CN202310370391A CN116403224A CN 116403224 A CN116403224 A CN 116403224A CN 202310370391 A CN202310370391 A CN 202310370391A CN 116403224 A CN116403224 A CN 116403224A
Authority
CN
China
Prior art keywords
sub
character image
character
feature vector
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310370391.5A
Other languages
English (en)
Other versions
CN116403224B (zh
Inventor
张俊俊
王婧
仝航
代欢欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310370391.5A priority Critical patent/CN116403224B/zh
Publication of CN116403224A publication Critical patent/CN116403224A/zh
Application granted granted Critical
Publication of CN116403224B publication Critical patent/CN116403224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本申请涉及一种字符识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:对待识别字符图像中的子字符图像进行分解得到多个子带,再根据各子带的分解系数确定子字符图像的第一特征向量,根据第一特征向量和预先构建的根据标准字符图像的各子带的分解系数确定的多个特征向量,得到待识别字符图像中的字符识别结果。采用本方法能够提高字符识别的准确率。

Description

字符识别方法、装置、计算机设备、存储介质和程序产品
技术领域
本申请涉及人工智能技术领域,特别是涉及一种字符识别方法、装置、计算机设备、存储介质和程序产品。
背景技术
字符识别是模式识别领域中一个非常活跃的分支,字符识别可以对纸上的打印字符进行识别,并将识别结果以文本的方式存储在计算机中。可以将字符识别应用于金融领域,例如,在绑定银行卡的过程中,客户需要手动输入银行卡号,并多次核对银行卡号,会给客户带来不便,使用数字图像处理的方法将银行卡的照片拍下来,基于照片识别银行卡号,并由系统自动填充好识别出来的银行卡号,能够提高客户绑卡的效率。
现如今的字符识别通常采用模板匹配的方法,即,首先对待识别字符进行预处理,使字符和模板的形状相同,再将预处理后的待识别字符与模板进行匹配,将匹配成功的待识别字符输出。
然而,当待识别字符所在的图片存在旋转、变形、缩放等干扰时,会导致识别准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高字符识别准确率的字符识别方法、装置、计算机设备、存储介质和程序产品。
第一方面,本申请提供了一种字符识别方法。该方法包括:
对待识别字符图像中的子字符图像进行分解得到多个子带;
根据各该子带的分解系数确定该子字符图像的第一特征向量;
根据该第一特征向量和预先构建的多个特征向量,得到该待识别字符图像中的字符识别结果;该特征向量为根据标准字符图像的各子带的分解系数确定的向量。
在其中一个实施例中,该根据各该子带的分解系数确定该子字符图像的第一特征向量,包括:
根据各该子带的分解系数,确定各该子带的分解系数的第一均值和第一标准差;
根据各该子带的分解系数的第一均值和第一标准差,确定该子字符图像的第一特征向量。
在其中一个实施例中,该根据各该子带的分解系数的第一均值和第一标准差,确定该子字符图像的第一特征向量,包括:
根据各该子带的分解系数的第一均值和该第一标准差,确定初始特征向量;
对该初始特征向量进行归一化处理,得到该第一特征向量。
在其中一个实施例中,该对该初始特征向量进行归一化处理,得到该第一特征向量,包括:
确定该初始特征向量中各元素的第二均值和第二标准差;
确定该初始特征向量中各该元素与该第二均值的差值;
根据各该元素与该第二均值的差值和该第二标准差,得到该第一特征向量。
在其中一个实施例中,该根据该第一特征向量和预先构建的多个特征向量,得到该待识别字符图像中的字符识别结果,包括:
根据该第一特征向量和预先构建的多个特征向量,确定该第一特征向量与各该特征向量的距离;
根据该第一特征向量与各该特征向量的距离,得到该待识别字符图像中的字符识别结果。
在其中一个实施例中,该根据该第一特征向量与各该特征向量的距离,得到该待识别字符图像中的字符识别结果,包括:
根据该第一特征向量与各该特征向量的距离,确定第二特征向量;该第二特征向量为最小的距离对应的特征向量;
根据该第二特征向量和该最小的距离,得到该待识别字符图像中的字符识别结果。
在其中一个实施例中,该根据该第二特征向量和该最小的距离,得到该待识别字符图像中的字符识别结果,包括:
若该最小的距离小于预设阈值,则根据该第二特征向量得到该子字符图像中的字符;
根据该子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对该第一新子字符图像进行分解得到多个子带的步骤,以得到该第一新子字符图像中的字符;
根据该子字符图像中的字符和各该第一新子字符图像中的字符,确定该待识别字符图像中的字符识别结果。
在其中一个实施例中,该根据所述第二特征向量和所述最小的距离,得到该待识别字符图像中的字符识别结果,包括:
若该最小的距离大于或等于预设阈值,则根据该第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对该第二新子字符图像进行分解得到多个子带的步骤,以得到该第二新子字符图像中的字符;该第二方向与该第一方向相反;
根据该第二新子字符图像中的字符的位置信息以及该第一预设截取距离,沿该第一方向确定第一新子字符图像,并返回执行对该第一新子字符图像进行分解得到多个子带的步骤,以得到该第一新子字符图像中的字符;
根据该子字符图像中的字符和各该第一新子字符图像中的字符,确定该待识别字符图像中的字符识别结果。
在其中一个实施例中,该方法还包括:
对目标图像进行灰度化处理,得到灰度化处理后的目标图像;
根据该灰度化处理后的目标图像,确定该待识别字符图像。
在其中一个实施例中,该根据该灰度化处理后的目标图像,确定该待识别字符图像,包括:
对该该灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;
确定该第一预处理图像的背景区域和目标区域;
根据该第一预处理图像的背景区域和目标区域,确定该待识别字符图像。
第二方面,本申请还提供了一种字符识别装置。该装置包括:
分解模块,用于对待识别字符图像中的子字符图像进行分解得到多个子带;
第一确定模块,用于根据各该子带的分解系数确定该子字符图像的第一特征向量;
识别模块,用于根据该第一特征向量和预先构建的多个特征向量,得到该待识别字符图像中的字符识别结果;该特征向量为根据标准字符图像的各子带的分解系数确定的向量。
第三方面,本申请还提供了一种计算机设备。该计算机设备包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现以上方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以上方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以上方法的步骤。
上述字符识别方法、装置、计算机设备、存储介质和计算机程序产品,计算机设备可以对待识别字符图像中的子字符图像进行分解得到多个子带,再根据各子带的分解系数确定子字符图像的第一特征向量,根据第一特征向量和预先构建的根据标准字符图像的各子带的分解系数确定的多个特征向量,得到待识别字符图像中的字符识别结果。传统技术中,采用模板匹配的方法,即,首先对待识别字符进行预处理,使字符和模板的形状相同,再将预处理后的待识别字符与模板进行匹配,将匹配成功的待识别字符输出。然而,当待识别字符所在的图片存在旋转、变形、缩放等干扰时,该方法会导致识别准确率较低。本申请实施例中,利用子字符图像分解得到的子带来确定第一特征向量,将第一特征向量与预先构建的多个特征向量进行对比,以得到待识别字符图像中的字符识别结果,能够提高字符识别的准确率。
附图说明
图1为本申请实施例提供的一种字符识别方法的流程示意图之一;
图2为本申请实施例提供的一种小波分解的示意图;
图3为本申请实施例提供的一种第一特征向量确定方法的流程示意图之一;
图4为本申请实施例提供的一种第一特征向量确定方法的流程示意图之二;
图5为本申请实施例提供的一种第一特征向量确定方法的流程示意图之三;
图6为本申请实施例提供的一种字符识别结果确定方法的流程示意图之一;
图7为本申请实施例提供的一种字符识别结果确定方法的流程示意图之二;
图8为本申请实施例提供的一种字符识别结果确定方法的流程示意图之三;
图9为本申请实施例提供的一种字符识别结果确定方法的流程示意图之四;
图10为本申请实施例提供的一种字符识别方法的流程示意图之二;
图11为本申请实施例提供的一种待识别字符图像确定方法的流程示意图;
图12为本申请实施例提供的一种字符识别装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
传统技术中,通常采用模板匹配的方法、人工神经网络的方法识别字符图像。利用模板匹配方法时,首先对待识别字符进行预处理,使字符和模板的形状相同,再将预处理后的待识别字符与模板进行匹配,将匹配成功的待识别字符输出,然而,当待识别字符所在的图片存在旋转、变形、缩放等干扰时,会导致识别准确率较低。而人工神经网络容易在特征提取、参数选择、网络学习与训练等方面,产生局部极值、收敛速度慢、难以确定隐层节点数等问题,也会导致字符识别的准确率低。
在一个实施例中,提供了一种字符识别方法,图1为本申请实施例提供的一种字符识别方法的流程示意图之一,参考图1,该方法包括以下步骤:
S101、对待识别字符图像中的子字符图像进行分解得到多个子带。
其中,待识别字符图像可以包括银行卡的照片;子字符图像可以通过如下方式获取:
利用滑动窗口对待识别字符图像进行截取,得到子字符图像。
在本申请实施例中,可以将一张含有字符的待识别字符图像输入至计算机设备中,计算机设备可以利用分解算法对待识别字符图像中的子字符图像进行至少一次分解,得到多个子带。
例如,可以利用滑动窗口,截取银行卡照片中预设区域大小的图像得到字符图像,利用小波分解算法中的基函数对字符图像进行四次小波分解分解,得到多个子带。图2为本申请实施例提供的一种小波分解的示意图,参考图2,展示了对字符图像进行小波分解的示意图,L表示低频,H表示高频,1和2表示为进行1层、2层分解,字符图像在每个尺度上被分解为4个子带,LL表示当前为低频子带,LH表示图像沿水平方向的高频子带,HL表示沿垂直方向的高频子带,HH表示沿对角线方向的高频子带。
需要说明的是,滑动窗口每次滑动的距离,可以根据待识别字符图像中字符与字符之间的间距确定。例如,待识别字符图像是银行卡照片,可以每次滑动50个像素值大小的距离。
S102、根据各子带的分解系数确定子字符图像的第一特征向量。
其中,各子带包含至少一个分解系数。
在本申请实施例中,计算机设备可以将各子带的分解系数分别乘以预设修正系数,得到修正后的各子带的分解系数,然后计算修正后的各子带的分解系数的均值和标准差,可以将修正后的各子带的分解系数的均值和标准差作为第一特征向量。
S103、根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果;特征向量为根据标准字符图像的各子带的分解系数确定的向量。
其中,预先构建的多个特征向量可以是利用变分模态分解、小波分解算法、矩阵分解算法中的至少一种得到预先构建的多个特征向量。
在本申请实施例中,计算机设备可以计算第一特征向量与预先构建的多个特征向量之间的距离,再根据各距离确定与第一特征向量最相近的特征向量,将与第一特征向量最相近的特征向量对应的字符输出,则识别出第一个字符;可以确定待识别字符图像中下一个需要识别的子字符图像,执行对子字符图像进行分解得到多个子带之后的步骤,以确定下一个字符,根据该方法能够不断得到新的字符,即能够得到待识别字符图像中的字符识别结果。
上述字符识别方法中,计算机设备可以对待识别字符图像中的子字符图像进行分解得到多个子带,再根据各子带的分解系数确定子字符图像的第一特征向量,根据第一特征向量和预先构建的根据标准字符图像的各子带的分解系数确定的多个特征向量,得到待识别字符图像中的字符识别结果。传统技术中,采用模板匹配的方法,即,首先对待识别字符进行预处理,使字符和模板的形状相同,再将预处理后的待识别字符与模板进行匹配,将匹配成功的待识别字符输出。然而,当待识别字符所在的图片存在旋转、变形、缩放等干扰时,该方法会导致识别准确率较低。本申请实施例中,利用子字符图像分解得到的子带来确定第一特征向量,将第一特征向量与预先构建的多个特征向量进行对比,以得到待识别字符图像中的字符识别结果,能够提高字符识别的准确率。
在一个实施例中,图3为本申请实施例提供的一种第一特征向量确定方法的流程示意图之一,本实施例涉及的是如何根据各子带的分解系数确定子字符图像的第一特征向量的一种可能的实现方式,在上述实施例的基础上,上述S102包括:
S301、根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差。
在本申请实施例中,每个利用分解算法对待识别字符图像中的子字符图像进行分解得到的子带都具有分解系数,计算机设备可以根据各子带的分解系数,计算得到各子带的分解系数的第一均值和第一标准差。
例如,可以设分解后的子带为∫i'(x,y)(M×N),i=1,2,....n,其中i为该子带小波系数的个数,(x,y)为给定卡号像素坐标,M个方向,N个尺度,则:
Figure BDA0004168389870000071
Figure BDA0004168389870000081
其中,∪i表示各子带的分解系数的第一均值,σi表示各子带的分解系数的第一标准差。
S302、根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量。
在本申请实施例中,可以将各子带的分解系数的第一均值和第一标准差分别与预设修正系数相乘,得到修正后的各子带的分解系数的第一均值和第一标准差,将修正后的各子带的分解系数的第一均值和第一标准差作为特征向量,构成子字符图像的第一特征向量。
在上述实施例中,通过根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差,根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量,能够用向量的形式表达子字符图像的特征,以便利用向量与特征库中的向量进行匹配来识别字符,提高了字符识别的准确率。
在一个实施例中,图4为本申请实施例提供的一种第一特征向量确定方法的流程示意图之二,本实施例涉及的是如何根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量的一种可能的实现方式,在上述实施例的基础上,上述S302包括:
S401、根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量。
在本申请实施例中,计算机设备可以将各子带的分解系数的第一均值和第一标准差作为特征向量,构成子字符图像的初始特征向量。
例如,子带1的分解系数的第一均值为u1,子带1的分解系数的第一标准差为σ1,子带2的分解系数的第一均值为u2,子带2的分解系数的第一均值为σ2等,可以构成子字符图像的初始特征向量T=[u1,σ1,u2,σ2]。
S402、对初始特征向量进行归一化处理,得到第一特征向量。
在本申请实施例中,计算机设备可以利用最大最小归一化法、标准分数归一化法、L1归一化法和L2归一化法中的至少一种,对初始特征向量进行归一化处理,得到归一化处理后的初始特征向量,即得到第一特征向量。该第一特征向量中各个分量被归一化到[-1,1]。
在上述实施例中,计算机设备可以根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量,再对初始特征向量进行归一化处理,得到第一特征向量。由于第一特征向量的物理意义和取值范围不同,对初始特征向量进行归一化处理,可以减小偏差。
在一个实施例中,图5为本申请实施例提供的一种第一特征向量确定方法的流程示意图之三,本实施例涉及的是如何对初始特征向量进行归一化处理,得到第一特征向量的一种可能的实现方式,在上述实施例的基础上,上述S402包括:
S501、确定初始特征向量中各元素的第二均值和第二标准差。
在本申请实施例中,可以计算得到初始特征向量中各元素的第二均值以及初始特征向量中各元素的第二标准差。
具体地,接上述举例,子字符图像的初始特征向量T=[u1,σ1,u2,σ2],根据该初始特征向量可以求得T中各元素的第一均值m和第一标准差σ。
S502、确定初始特征向量中各元素与第二均值的差值。
在本申请实施例中,将初始特征向量中各元素与第二均值做差,得到初始特征向量中各元素与第二均值的差值。
S503、根据各元素与第二均值的差值和第二标准差,得到第一特征向量。
在本申请实施例中,可以分别计算各元素与第二均值的差值与第二标准差的比值,得到的各比值可以构成第一特征向量。
例如,联合S502和S503的步骤举例,利用高斯归一化,初始特征向量为[∫1,∫2,......∫N],计算出其均值m和第一标准差σ,则有:
Figure BDA0004168389870000091
其中,第一特征向量为[F1,F2,....FN]。
在上述实施例中,确定初始特征向量中各元素的第二均值和第二标准差,确定初始特征向量中各元素与第二均值的差值,再根据各元素与第二均值的差值和第二标准差,得到第一特征向量。利用该归一化能够减小超大或超小元素对元素值分布的影响。由于第一特征向量的物理意义和取值范围不同,对初始特征向量进行归一化处理,可以减小偏差。
在一个实施例中,图6为本申请实施例提供的一种字符识别结果确定方法的流程示意图之一,本实施例涉及的是如何根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果的一种可能的实现方式,在上述实施例的基础上,上述S103包括:
S601、根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离。
其中,预先构建的多个特征向量可以是利用小波分解算法提取特征后得到的预先构建的多个特征向量。例如,可以分别对N张目标图像进行手动分割,得到多个字符图像,再将字符图像通过小波过滤器提取一个尺度四个角度的特征,然后利用主成分分析法对特征进行降维,再经过线性判别降维,得到预先构建的多个特征向量。
在本申请实施例中,计算机设备可以利用欧氏距离算法、曼哈顿距离算法、马氏距离算法中的至少一个,对第一特征向量和预先构建的多个特征向量的距离进行计算,以确定第一特征向量与各特征向量的距离。
S602、根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果。
在本申请实施例中,计算机设备可以通过计算第一特征向量与各特征向量之间的距离,确定小于预设距离阈值的距离,根据该距离对应的特征向量,得到子字符图像中的字符,通过该种方式可以得到待识别字符图像中的字符识别结果。
在上述实施例中,计算机设备可以根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离,根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果,能够提高字符识别的效率,得到更加准确的字符识别结果。
在一个实施例中,图7为本申请实施例提供的一种字符识别结果确定方法的流程示意图之二,本实施例涉及的是如何根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果的一种可能的实现方式,在上述实施例的基础上,上述S602包括:
S701、根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量。
在本申请实施例中,计算机设备可以根据第一特征向量与各特征向量的距离,确定最小距离对应的特征向量。
S702、根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果。
在本申请实施例中,可以将最小的距离与预设修正系数相乘,得到修正后的最小的距离,修正后最小的距离小于预设阈值,则认为此处有字符,则可以根据第二特征向量得到子字符图像中的字符,再对待识别图像进行截取,得到新子字符图像,对新子字符图像进行S101至S103的步骤。
需要说明的是,如果待识别图像为卡号图像,则当识别出的字符大于或等于19位时,识别结束;也可以是,当滑动窗口的当前位置与20各像素值之和大于或等于卡号图像的宽度时,识别结束。
在上述实施例中,计算机设备根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量,再根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果,能够提高字符识别的准确性。
在一个实施例中,图8为本申请实施例提供的一种字符识别结果确定方法的流程示意图之三,本实施例涉及的是如何根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果的一种可能的实现方式,在上述实施例的基础上,上述S702包括:
S801、若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符。
在本申请实施例中,如果最小的距离小于预设阈值,则将第二特征向量对应的字符作为子字符图像中的字符。
S802、根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符。
其中,第一预设截取距离可以是通过滑动窗口移动的距离。
在本申请实施例中,根据子字符图像中的字符的位置信息,确定子字符图像中的字符的当前的位置,以该当前的位置为基础位置,向第一方向移动第一预设截取距离,得到第一新子字符图像,再执行对第一新子字符图像进行分解得到多个子带的步骤,可以得到第一新子字符图像中的字符。
S803、根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在本申请实施例中,由于得到了子字符图像中的字符,以及各第一新子字符图像中的字符,则子字符图像中的字符和第一新子字符图像中的字符即为待识别字符图像中的字符。
在上述实施例中,若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符,根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符,再根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果,能够提高字符识别的效率,得到更加准确的字符识别结果。
在一个实施例中,图9为本申请实施例提供的一种字符识别结果确定方法的流程示意图之四,本实施例涉及的是如何根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果的一种可能的实现方式,在上述实施例的基础上,上述S702包括:
S901、若最小的距离大于或等于预设阈值,则根据第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对第二新子字符图像进行分解得到多个子带的步骤,以得到第二新子字符图像中的字符;第二方向与第一方向相反。
其中,第二预设截取距离可以是通过滑动窗口移动的距离,第二预设截取距离可以根据字符大小确定;例如,如果字符大小在43像素值左右,第二预设截取距离可以是40像素值。第二方向可以与第一方向相反。
在本申请实施例中,如果最小的距离大于或等于预设阈值,则认为该子字符图图像没有对应的字符,则可以利用滑动窗口在第二特征向量对应的位置上,向第二方向滑动第二预设截取距离,得到第二新子字符图像,并返回执行对第二新子字符图像进行分解得到多个子带的步骤,直至新的最小的距离小于预设阈值,则新的最小距离对应的向量表达的字符为第二新子字符图像中的字符,通过此种方法得到第二新子字符图像中的字符。
S902、根据第二新子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符。
在本申请实施例中,计算机设备可以根据第二新子字符图像中的字符的位置信息,确定第二新子字符图像中的字符的当前的位置,以该当前的位置为基础位置,向第一方向移动第一预设截取距离,得到第一新子字符图像,再执行对第一新子字符图像进行分解得到多个子带的步骤,可以得到第一新子字符图像中的字符。
S903、根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在本申请实施例中,由于得到了子字符图像中的字符,以及各第一新子字符图像中的字符,则子字符图像中的字符和第一新子字符图像中的字符即为待识别字符图像中的字符。
在上述实施例中,若最小的距离大于或等于预设阈值,则根据第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对第二新子字符图像进行分解得到多个子带的步骤,以得到第二新子字符图像中的字符,根据第二新子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符,根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果,其中,第二方向与第一方向相反。能够提高字符识别的效率,得到更加准确的字符识别结果。
在一个实施例中,图10为本申请实施例提供的一种字符识别方法的流程示意图之二,在上述实施例的基础上,该方法还包括:
S1001、对目标图像进行灰度化处理,得到灰度化处理后的目标图像。
在本申请实施例中,计算机设备可以利用OpenCV技术将对目标图像进行灰度化处理,得到灰度化处理后的目标图像。
需要说明的是,通常拍摄或保存的目标图像都是彩色图像,处理目标图像时,要分别对三种颜色分量进行处理,计算量较大,计算时间较长。灰度图像即可表示目标图像的形态特征,并且比彩色图像所占存储空间更小。
S1002、根据灰度化处理后的目标图像,确定待识别字符图像。
在本申请实施例中,计算机设备可以将灰度化处理后的目标图像直接作为待识别字符图像。
在本申请实施例中,通过对目标图像进行灰度化处理,得到灰度化处理后的目标图像,再根据灰度化处理后的目标图像,确定待识别字符图像,能够减小后续计算时间较长和存储空间的占用。
在一个实施例中,图11为本申请实施例提供的一种待识别字符图像确定方法的流程示意图,本实施例涉及的是如何根据灰度化处理后的目标图像,确定待识别字符图像的一种可能的实现方式,在上述实施例的基础上,上述S1002包括:
S1101、对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像。
在本申请实施例中,计算机设备可以利用最大类间方差算法对灰度化处理后的目标图像进行二值化处理,得到二值化处理后的图像,即得到第一预处理图像。
具体地,二值化是指将图像转换为只包含两种像素值的图像,分别用255和0表示白色和黑色。二值化的实现方式为,通过函数计算出阈值,高于阈值的像素点将其像素值设置为255,低于阈值的像素点将其像素值设置为0。可使用如下最大类间方差算法进行二值化处理。
对于阈值的选取,首先设初始二值化分类阈值为T,T将图像分为A、B两个类别;设像素总个数为N,其中A类别中像素个数为NA,B类别中像素个数为NB;设每个灰度级的像素个数为Ni,则像素灰度级为i的概率为
Figure BDA0004168389870000151
设图像总灰度级为L-1,则有
Figure BDA0004168389870000152
则有A类、B类的灰度平均值分别为
Figure BDA0004168389870000153
则整个图像的灰度平均值为M=PA×MA+PB×MB;A类与B类图像之间的类间方差为σ2=PA×(MA-M)2+PB×(MB-M)2,σ2值越大,则图像二值化分类效果越好,能够找出能使σ2值最大的阈值T,将其设置为图像二值化处理阈值。
S1102、确定第一预处理图像的背景区域和目标区域。
在本申请实施例中,计算机设备可以对第一预处理图像进行轮廓提取,以确定第一预处理图像的背景区域和目标区域。
S1103、根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。
在本申请实施例中,计算机设备可以根据第一预处理图像的背景区域和目标区域,确定待识别字符图像为目标区域。
可选的,还可以对待识别字符图像进行归一化处理,将待识别图像按一定标准转换,使其大小一致。
在上述实施例中,通过对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像,确定第一预处理图像的背景区域和目标区域,根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。能够消除目标图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,进一步的,能够提高字符识别的准确性。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的字符识别方法的字符识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个字符识别装置实施例中的具体限定可以参见上文中对于字符识别方法的限定,在此不再赘述。
在一个实施例中,提供了一种字符识别装置,图12为本申请实施例提供的一种字符识别装置的结构框图,参考图12,该字符识别装置1200包括:分解模块1201、第一确定模块1202和识别模块1203,其中:
分解模块1201,用于对待识别字符图像中的子字符图像进行分解得到多个子带。
第一确定模块1202,用于根据各子带的分解系数确定子字符图像的第一特征向量。
识别模块1203,用于根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果;特征向量为根据标准字符图像的各子带的分解系数确定的向量。
在一个实施例中,确定模块1202包括:
第一确定子模块,用于根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差。
第二确定子模块,用于根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量。
在一个实施例中,第二确定子模块包括:
第一确定单元,用于根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量。
第二确定单元,用于对初始特征向量进行归一化处理,得到第一特征向量。
在一个实施例中,第二确定单元具体用于确定初始特征向量中各元素的第二均值和第二标准差;确定初始特征向量中各元素与第二均值的差值;根据各元素与第二均值的差值和第二标准差,得到第一特征向量。
在一个实施例中,识别模块1203包括:
第三确定子模块,用于根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离。
第四确定子模块,用于根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,第四确定子模块包括:
第三确定单元,用于根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量。
第四确定单元,用于根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,第四确定单元包括:
第一确定子单元,用于若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符。
第二确定子单元,用于根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符。
第三确定子单元,用于根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,第四确定单元包括:
第四确定子单元,用于若最小的距离大于或等于预设阈值,则根据第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对第二新子字符图像进行分解得到多个子带的步骤,以得到第二新子字符图像中的字符;第二方向与第一方向相反。
第五确定子单元,用于根据第二新子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符。
第六确定子单元,用于根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,该字符识别装置1200还包括:
第二确定模块,用于对目标图像进行灰度化处理,得到灰度化处理后的目标图像。
第三确定模块,用于根据灰度化处理后的目标图像,确定待识别字符图像。
在一个实施例中,第三确定模块具体用于对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;确定第一预处理图像的背景区域和目标区域;根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。
上述字符识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种字符识别方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
对待识别字符图像中的子字符图像进行分解得到多个子带;
根据各子带的分解系数确定子字符图像的第一特征向量;
根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果;特征向量为根据标准字符图像的各子带的分解系数确定的向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差;
根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量;
对初始特征向量进行归一化处理,得到第一特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
确定初始特征向量中各元素的第二均值和第二标准差;
确定初始特征向量中各元素与第二均值的差值;
根据各元素与第二均值的差值和第二标准差,得到第一特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离;
根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量;
根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符;
根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若最小的距离大于或等于预设阈值,则根据第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对第二新子字符图像进行分解得到多个子带的步骤,以得到第二新子字符图像中的字符;第二方向与第一方向相反;
根据第二新子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对目标图像进行灰度化处理,得到灰度化处理后的目标图像;
根据灰度化处理后的目标图像,确定待识别字符图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;
确定第一预处理图像的背景区域和目标区域;
根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
对待识别字符图像中的子字符图像进行分解得到多个子带;
根据各子带的分解系数确定子字符图像的第一特征向量;
根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果;特征向量为根据标准字符图像的各子带的分解系数确定的向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差;
根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量;
对初始特征向量进行归一化处理,得到第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定初始特征向量中各元素的第二均值和第二标准差;
确定初始特征向量中各元素与第二均值的差值;
根据各元素与第二均值的差值和第二标准差,得到第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离;
根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量;
根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符;
根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符;
根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对目标图像进行灰度化处理,得到灰度化处理后的目标图像;
根据灰度化处理后的目标图像,确定待识别字符图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;
确定第一预处理图像的背景区域和目标区域;
根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
对待识别字符图像中的子字符图像进行分解得到多个子带;
根据各子带的分解系数确定子字符图像的第一特征向量;
根据第一特征向量和预先构建的多个特征向量,得到待识别字符图像中的字符识别结果;特征向量为根据标准字符图像的各子带的分解系数确定的向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各子带的分解系数,确定各子带的分解系数的第一均值和第一标准差;
根据各子带的分解系数的第一均值和第一标准差,确定子字符图像的第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据各子带的分解系数的第一均值和第一标准差,确定初始特征向量;
对初始特征向量进行归一化处理,得到第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定初始特征向量中各元素的第二均值和第二标准差;
确定初始特征向量中各元素与第二均值的差值;
根据各元素与第二均值的差值和第二标准差,得到第一特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据第一特征向量和预先构建的多个特征向量,确定第一特征向量与各特征向量的距离;
根据第一特征向量与各特征向量的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据第一特征向量与各特征向量的距离,确定第二特征向量;第二特征向量为最小的距离对应的特征向量;
根据第二特征向量和最小的距离,得到待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符;
根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若最小的距离小于预设阈值,则根据第二特征向量得到子字符图像中的字符;
根据子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对第一新子字符图像进行分解得到多个子带的步骤,以得到第一新子字符图像中的字符;
根据子字符图像中的字符和各第一新子字符图像中的字符,确定待识别字符图像中的字符识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对目标图像进行灰度化处理,得到灰度化处理后的目标图像;
根据灰度化处理后的目标图像,确定待识别字符图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;
确定第一预处理图像的背景区域和目标区域;
根据第一预处理图像的背景区域和目标区域,确定待识别字符图像。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (14)

1.一种字符识别方法,其特征在于,所述方法包括:
对待识别字符图像中的子字符图像进行分解得到多个子带;
根据各所述子带的分解系数确定所述子字符图像的第一特征向量;
根据所述第一特征向量和预先构建的多个特征向量,得到所述待识别字符图像中的字符识别结果;所述特征向量为根据标准字符图像的各子带的分解系数确定的向量。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述子带的分解系数确定所述子字符图像的第一特征向量,包括:
根据各所述子带的分解系数,确定各所述子带的分解系数的第一均值和第一标准差;
根据各所述子带的分解系数的第一均值和第一标准差,确定所述子字符图像的第一特征向量。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述子带的分解系数的第一均值和第一标准差,确定所述子字符图像的第一特征向量,包括:
根据各所述子带的分解系数的第一均值和所述第一标准差,确定初始特征向量;
对所述初始特征向量进行归一化处理,得到所述第一特征向量。
4.根据权利要求3所述的方法,其特征在于,所述对所述初始特征向量进行归一化处理,得到所述第一特征向量,包括:
确定所述初始特征向量中各元素的第二均值和第二标准差;
确定所述初始特征向量中各所述元素与所述第二均值的差值;
根据各所述元素与所述第二均值的差值和所述第二标准差,得到所述第一特征向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征向量和预先构建的多个特征向量,得到所述待识别字符图像中的字符识别结果,包括:
根据所述第一特征向量和预先构建的多个特征向量,确定所述第一特征向量与各所述特征向量的距离;
根据所述第一特征向量与各所述特征向量的距离,得到所述待识别字符图像中的字符识别结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一特征向量与各所述特征向量的距离,得到所述待识别字符图像中的字符识别结果,包括:
根据所述第一特征向量与各所述特征向量的距离,确定第二特征向量;所述第二特征向量为最小的距离对应的特征向量;
根据所述第二特征向量和所述最小的距离,得到所述待识别字符图像中的字符识别结果。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二特征向量和所述最小的距离,得到所述待识别字符图像中的字符识别结果,包括:
若所述最小的距离小于预设阈值,则根据所述第二特征向量得到所述子字符图像中的字符;
根据所述子字符图像中的字符的位置信息以及第一预设截取距离,沿第一方向确定第一新子字符图像,并返回执行对所述第一新子字符图像进行分解得到多个子带的步骤,以得到所述第一新子字符图像中的字符;
根据所述子字符图像中的字符和各所述第一新子字符图像中的字符,确定所述待识别字符图像中的字符识别结果。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第二特征向量和所述最小的距离,得到所述待识别字符图像中的字符识别结果,包括:
若所述最小的距离大于或等于预设阈值,则根据所述第二特征向量和第二预设截取距离,沿第二方向确定第二新子字符图像,并返回执行对所述第二新子字符图像进行分解得到多个子带的步骤,以得到所述第二新子字符图像中的字符;所述第二方向与所述第一方向相反;
根据所述第二新子字符图像中的字符的位置信息以及所述第一预设截取距离,沿所述第一方向确定第一新子字符图像,并返回执行对所述第一新子字符图像进行分解得到多个子带的步骤,以得到所述第一新子字符图像中的字符;
根据所述子字符图像中的字符和各所述第一新子字符图像中的字符,确定所述待识别字符图像中的字符识别结果。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对目标图像进行灰度化处理,得到灰度化处理后的目标图像;
根据所述灰度化处理后的目标图像,确定所述待识别字符图像。
10.根据权利要求9所述的方法,其特征在于,所述根据所述灰度化处理后的目标图像,确定所述待识别字符图像,包括:
对所述所述灰度化处理后的目标图像进行二值化处理,得到第一预处理图像;
确定所述第一预处理图像的背景区域和目标区域;
根据所述第一预处理图像的背景区域和目标区域,确定所述待识别字符图像。
11.一种字符识别装置,其特征在于,所述装置包括:
分解模块,用于对待识别字符图像中的子字符图像进行分解得到多个子带;
第一确定模块,用于根据各所述子带的分解系数确定所述子字符图像的第一特征向量;
识别模块,用于根据所述第一特征向量和预先构建的多个特征向量,得到所述待识别字符图像中的字符识别结果;所述特征向量为根据标准字符图像的各子带的分解系数确定的向量。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
CN202310370391.5A 2023-04-07 2023-04-07 字符识别方法、装置、计算机设备、存储介质和程序产品 Active CN116403224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310370391.5A CN116403224B (zh) 2023-04-07 2023-04-07 字符识别方法、装置、计算机设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310370391.5A CN116403224B (zh) 2023-04-07 2023-04-07 字符识别方法、装置、计算机设备、存储介质和程序产品

Publications (2)

Publication Number Publication Date
CN116403224A true CN116403224A (zh) 2023-07-07
CN116403224B CN116403224B (zh) 2025-12-16

Family

ID=87007026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310370391.5A Active CN116403224B (zh) 2023-04-07 2023-04-07 字符识别方法、装置、计算机设备、存储介质和程序产品

Country Status (1)

Country Link
CN (1) CN116403224B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591630A (zh) * 2023-11-21 2024-02-23 北京天防安全科技有限公司 一种关键词识别方法、装置和设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207999A (zh) * 2012-11-07 2013-07-17 中国矿业大学(北京) 一种基于煤岩图像特征抽取以及分类识别的煤岩分界方法和系统
CN110222687A (zh) * 2013-06-03 2019-09-10 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN110569850A (zh) * 2019-08-20 2019-12-13 北京旷视科技有限公司 字符识别模板匹配方法、装置和文本识别设备
CN110751024A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 基于手写签名的用户身份识别方法、装置及终端设备
CN111914834A (zh) * 2020-06-18 2020-11-10 绍兴埃瓦科技有限公司 图像识别方法、装置、计算机设备和存储介质
CN112801883A (zh) * 2019-11-14 2021-05-14 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN113018858A (zh) * 2021-04-12 2021-06-25 腾讯科技(深圳)有限公司 一种虚拟角色检测方法、计算机设备以及可读存储介质
CN113409181A (zh) * 2021-07-20 2021-09-17 北京沃东天骏信息技术有限公司 针对水印载体的水印处理方法及装置
CN113971792A (zh) * 2020-07-06 2022-01-25 长沙智能驾驶研究院有限公司 交通标志牌的字符识别方法、装置、设备和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207999A (zh) * 2012-11-07 2013-07-17 中国矿业大学(北京) 一种基于煤岩图像特征抽取以及分类识别的煤岩分界方法和系统
CN110222687A (zh) * 2013-06-03 2019-09-10 支付宝(中国)网络技术有限公司 复杂背景卡面信息识别方法及系统
CN110569850A (zh) * 2019-08-20 2019-12-13 北京旷视科技有限公司 字符识别模板匹配方法、装置和文本识别设备
CN110751024A (zh) * 2019-09-06 2020-02-04 平安科技(深圳)有限公司 基于手写签名的用户身份识别方法、装置及终端设备
CN112801883A (zh) * 2019-11-14 2021-05-14 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN111914834A (zh) * 2020-06-18 2020-11-10 绍兴埃瓦科技有限公司 图像识别方法、装置、计算机设备和存储介质
CN113971792A (zh) * 2020-07-06 2022-01-25 长沙智能驾驶研究院有限公司 交通标志牌的字符识别方法、装置、设备和存储介质
CN113018858A (zh) * 2021-04-12 2021-06-25 腾讯科技(深圳)有限公司 一种虚拟角色检测方法、计算机设备以及可读存储介质
CN113409181A (zh) * 2021-07-20 2021-09-17 北京沃东天骏信息技术有限公司 针对水印载体的水印处理方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117591630A (zh) * 2023-11-21 2024-02-23 北京天防安全科技有限公司 一种关键词识别方法、装置和设备
CN117591630B (zh) * 2023-11-21 2024-06-04 北京天防安全科技有限公司 一种关键词识别方法、装置和设备

Also Published As

Publication number Publication date
CN116403224B (zh) 2025-12-16

Similar Documents

Publication Publication Date Title
US11030485B2 (en) Systems and methods for feature transformation, correction and regeneration for robust sensing, transmission, computer vision, recognition and classification
US11645835B2 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
CN1459761B (zh) 基于Gabor滤波器组的字符识别技术
Cho Simple sparsification improves sparse denoising autoencoders in denoising highly corrupted images
EP4085369A1 (en) Forgery detection of face image
US20230222623A1 (en) Multi-scale transformer for image analysis
US9865037B2 (en) Method for upscaling an image and apparatus for upscaling an image
Vishwakarma et al. An efficient hybrid DWT-fuzzy filter in DCT domain based illumination normalization for face recognition
CN114998750B (zh) 一种遥感图像随机长度条带去除方法、装置、设备及介质
CN107609596A (zh) 无参数自动加权多图正则化非负矩阵分解及图像聚类方法
CN110610174A (zh) 复杂条件下银行卡号识别方法
Schmitzer et al. Modelling convex shape priors and matching based on the Gromov-Wasserstein distance
CN104881682A (zh) 一种基于保局映射与主成分分析的图像分类方法
CN114444565A (zh) 一种图像篡改检测方法、终端设备及存储介质
CN115439325A (zh) 低分辨率高光谱图像处理方法、装置、计算机程序产品
CN111488811A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
Dede et al. Wavelet‐Based Feature Extraction for Efficient High‐Resolution Image Classification
Meena et al. Effective curvelet-based facial expression recognition using graph signal processing
CN116403224B (zh) 字符识别方法、装置、计算机设备、存储介质和程序产品
Ocegueda et al. Which parts of the face give out your identity?
Hamidi et al. Local selected features of dual‐tree complex wavelet transform for single sample face recognition
CN116246285A (zh) 模型训练方法、装置、计算机设备、存储介质和程序产品
CN108898052A (zh) 遥感图像中人工地物的检测方法及设备
Memisevic et al. Improving dimensionality reduction with spectral gradient descent
Agarwal et al. Photo forgery detection using RGB color model permutations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant