[go: up one dir, main page]

CN104166474A - 信息处理装置和字符识别方法 - Google Patents

信息处理装置和字符识别方法 Download PDF

Info

Publication number
CN104166474A
CN104166474A CN201410195310.3A CN201410195310A CN104166474A CN 104166474 A CN104166474 A CN 104166474A CN 201410195310 A CN201410195310 A CN 201410195310A CN 104166474 A CN104166474 A CN 104166474A
Authority
CN
China
Prior art keywords
character
image data
input
information
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410195310.3A
Other languages
English (en)
Other versions
CN104166474B (zh
Inventor
高杉绫
星哲郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN104166474A publication Critical patent/CN104166474A/zh
Application granted granted Critical
Publication of CN104166474B publication Critical patent/CN104166474B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • G06T11/23
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)

Abstract

一种字符识别方法和信息处理装置,该信息处理装置包括:存储单元,其被配置成存储其中字符的字符代码和图像数据彼此相关联的第一信息;以及操作单元。操作单元被配置成:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第二信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第一信息来获取与所述多个字符代码相关联的多个第一图像数据;通过基于第二信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考第一信息来输出与所述第二图像数据相关联的字符的图像数据或者与该第二图像数据相关联的字符代码。

Description

信息处理装置和字符识别方法
技术领域
本文所讨论的实施方式涉及一种信息处理装置、一种字符识别方法以及一种其中存储有字符识别程序的存储介质。
背景技术
所谓的字符识别技术已投入使用。执行字符识别的装置接收由用户使用输入设备(例如触摸面板或鼠标)输入的字符的手写输入,并估计用户打算输入的字符的字符代码。当针对该字符代码存在多个候选项时,装置可以提示用户选择所述候选项中之一。字符识别技术中的问题之一在于需要提高字符的识别准确度。
例如,存在如下一种建议的方法:其中,在字符的输入区域中形成多个输入框,并将通过划分单个汉字而获得的多个部件(例如,編、旁、冠)输入到每个输入框。在所建议的技术中,将部件集与字符的对应关系预先存储在存储模块中,以对在每个输入框中输入的部件集与存储在存储模块中的部件集进行比较,从而在显示装置中显示包含在该框中输入的部件集的字符。
另外,存在如下另一种建议的方法:其中,结合针对每一个笔画先前输入的笔画数据来生成手写输入的笔画数据,针对每一个笔画先前输入的笔画数据指示在手写于手写中输入的字符时单次移动形成的线;并将该笔画数据与由预先准备的笔画数据组成的字典字符数据进行比较,以执行字符识别,同时确定手写输入的笔画数据与字典字符数据之间的相似度。当手写输入的笔画数据与字典字符数据的相似度变为零时,将通过之前的一个笔画的手写输入所生成的、手写输入的笔画数据分割为单个字符,并将包含手写输入的笔画数据的字典字符数据显示为候选字符。
例如,参见日本特开平H7-121660号公报和日本特开平H11-134437号公报。
在上述方法中,针对待识别的每个目标字符,预先准备用于与部件集或笔画数据进行比对的字典数据。然而,字符的数目庞大,因此不容易将所有字符采集到字典数据中。例如,字典数据的准备工作需要例如从多个用户提取成为每个字符的样本的多个笔画信息以及将该笔画信息登记在字典数据中的时间。因此,一些字符可能未被登记在字典数据中。例如,具有低使用频率的一些字符(如异体字或外来字)可能未被登记在字典数据中。因此,如何高准确度地识别未登记在字典数据中的字符成为问题。
本公开内容的一个方面旨在提供能够高准确度地识别未登记在字典数据中的字符的程序、信息处理装置和字符识别方法。
发明内容
根据实施方式的一个方面,信息处理装置包括:存储单元,其被配置成存储其中字符的字符代码和图像数据彼此相关联的第一信息;以及操作单元。操作单元被配置成:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第二信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第一信息来获取与所述多个字符代码相关联的多个第一图像数据;通过基于第二信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考第一信息来输出与所述第二图像数据相关联的字符的图像数据或者与该第二图像数据相关联的字符代码。
本公开内容的目的和优点将借助于权利要求中特别指出的元素和组合来实现和获取。要理解的是,以上的一般描述和以下的详细描述二者均为示例性和说明性的,并非如权利要求主张的那样限制本发明。
根据本公开内容的一个方面,可以高准确度地识别未登记在字典数据中的字符。
附图说明
图1是示出第一实施方式的信息处理装置的视图;
图2是示出第二实施方式的客户端设备的视图;
图3是示出客户端设备的硬件的示例的视图;
图4是示出客户端设备的功能的示例的视图;
图5是示出字符形状表的示例的视图;
图6是示出字典表的示例的视图;
图7是示出输入历史表的示例的视图;
图8是示出相似度历史表的示例的视图;
图9是示出组合表的示例的视图;
图10是示出字符识别过程的示例的流程图;
图11是示出字符识别过程的(延续的)示例的流程图;
图12A至图12C是示出部件字符确定的具体示例的视图;
图13A至图13D是示出部件字符确定的(延续的)具体示例的视图;
图14是示出经变形的图像数据的示例的视图;
图15A至图15C是示出经变形的图像数据的合成的示例的视图;以及
图16是示出最终结果的输出的示例的视图。
具体实施方式
[第一实施方式]
在下文中,将参照附图详细地描述本公开内容中公开的显示控制装置、系统和显示控制程序的示例性实施方式。此外,实施方式并非旨在限制所公开的技术。图1是示出第一实施方式的信息处理装置的视图。第一信息处理装置1对由用户手写输入的字符执行字符识别。例如,通过使用设置在第一信息处理装置中的输入设备,如触摸面板、触摸板或鼠标,用户可以对该第一信息处理装置执行手写输入。输入设备可以是第一信息处理装置的外部连接设备。此处,可以将针对手写输入的字符在手写中的单次移动形成的线条称为笔画。另外,可以将包含形成单个字符的笔画集或书写顺序(笔画的顺序)的信息称为笔画信息。
第一信息处理装置包括存储单元1a和操作单元1b。存储单元1a可以为:非易失性存储设备,例如随机存取存储器(RAM);或者易失性存储设备,例如硬盘驱动器(HDD)或闪速存储器。操作单元1b可以包括例如中央处理单元(CPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)。操作单元1b可以为执行程序的处理器。还可以包括多个处理器集(多处理器)作为“处理器”。
存储单元1a存储其中字符的字符代码和图像数据彼此相关联的字符形状数据2。例如,字符形状数据2包括:例如,字符代码A1与图像数据X1(其指示字符“火”)之间的关联关系;字符代码A2与图像数据X2(其指示字符“ク”)之间的关联;字符代码A3与图像数据X3(其表示字符“臼”)之间的关联;以及字符代码A4与图像数据X4(其指示字符的异体字“焔”)之间的关联。
此外,存储单元1a存储其中字符代码和参考笔画信息彼此相关联的字典数据3。例如,字典数据3包括:字符代码A1与笔画信息Px之间的关联;字符代码A2与笔画信息Py之间的关联;以及字符代码A3与笔画信息Pz之间的关联。此处,关于字符代码A4的笔画信息未登记在字典数据3中。
操作单元1b检测如下位置信息:该位置信息指示由用户通过手写输入而输入的多个字符的输入位置。例如,操作单元1b基于手写输入的笔画信息和存储在存储单元1a中的字典数据3来检测与多个输入字符相关联的多个字符代码。
例如,操作单元1b接收通过手写输入的输入数据4。输入数据4包括字符4a、4b和4c。字符4a、4b和4c中的每个字符是由通过用户输入的多个笔画形成的。操作单元1b检测字符4a、4b和4c以及指示字符4a、4b和4c中的每个字符的输入位置的位置信息。操作单元1b可以将字符4a、4b和4c中的每个字符的笔画信息与登记在字典数据3中的笔画信息Px、Py和Pz中的每个笔画信息进行比对,以检测与字符4a、4b和4c相关联的字符代码A1、A2和A3。
另外,操作单元1b可以从字符形状数据2中指定与字符4a、4b和4c相关联的图像数据,以获取用于字符4a、4b和4c的字符代码A1、A2和A3。另外,操作单元1b可以将从字符形状数据2和字典数据3获取的相应字符代码的候选项合并,以检测与字符4a、4b和4c相关联的字符代码A1、A2和A3。例如,对于字符4a,可以从字符形状数据2检测到多个字符代码的候选项,并且因此,可以从字典数据3检测到多个字符代码的候选项。在这种情况下,可以将通过字符形状数据2与字典数据3二者的比对而被确定为具有高准确度的字符代码的候选项确定为字符4a的字符代码。
操作单元1b参考字符形状数据2以获取与多个所检测到的字符代码相关联的多个第一图像数据。例如,操作单元1b参考字符形状数据2以获取用于字符代码A1、A2和A3的图像数据X1、X2和X3。
操作单元1b基于所检测到的位置信息来组合多个第一图像数据,以生成第二图像数据。例如,操作单元1b基于所检测到的字符4a、4b和4c中的每个字符的位置信息来保持输入字符4a、4b和4c之间的相对位置关系,以将图像数据X1、X2和X3设置并形成为单个图像数据来生成图像数据5。
在此情况下,操作单元1b可以分别对图像数据X1、X2和X3进行变形以生成图像数据5a、5b和5c。图像数据5a是通过对图像数据X1进行变形而获得的。图像数据5b是通过对图像数据X2进行变形而获得的。图像数据5c是通过对图像数据X3进行变形而获得的。
例如,可以基于字符4a的位置信息来指定指示字符4a的输入区域的矩形,并且可以使图像数据5a的纵横比与该矩形的纵横比相匹配。通过应用相同的规则,将图像数据X2变形为图像数据5b。将图像数据X3变形为图像数据5c。另外,可以考虑使关于图像数据X1、X2和X3中的每个图像数据所指定的每个矩形的面积比与图像数据5a、5b和5c中的每个图像数据的面积比相匹配。通过这样做,操作单元1b可以组合通过对图像数据X1、X2和X3进行变形而获得的图像数据5a、5b和5c以生成图像数据5。
操作单元1b参考字符形状数据2以输出与所生成的图像数据相关联的字符的图像数据或与该图像数据相关联的字符代码。例如,操作单元1b输出与图像数据5相关联的字符的图像数据X4或与图像数据X4相关联的字符代码A4。例如,操作单元1b可以将图像数据5与包含在字符形状数据2中的每个图像数据进行比对,以在字符形状数据2中指定与图像数据5最相似的图像数据X4。
在信息处理装置1中,操作单元1b检测:指示由用户通过手写输入所输入的字符4a、4b和4c中的每个字符的输入位置的位置信息;以及分别与字符4a、4b和4c相关联的字符代码A1、A2和A3。此外,操作单元1b参考字符形状数据2以获取与字符代码A1、A2和A3相关联的图像数据X1、X2和X3,并生成通过基于该位置信息对图像数据X1、X2和X3进行组合所获得的图像数据5。操作单元1b参考字符形状数据2以输出与图像数据5相关联的字符的图像数据X4或与图像数据X4相关联的字符代码A4。
因此,可以高准确度地识别未登记在字典数据中的字符。例如,针对待识别的每个目标字符预先准备用于与部件集或笔画信息进行比对的字典数据,以执行字符识别。然而,字符的数目是庞大的,因此不容易将所有字符采集到字典数据中。
例如,字典数据3的准备工作需要相当长的时间从而例如登记每个字符的笔画信息。例如,单个字符的笔画布置式样或书写顺序因人而异。因此,字典数据3的准备需要大量的成本来进行如下工作:例如,针对每个字符从多个用户提取样本如笔画的输入式样,并且对待登记的所提取样本进行整合和编辑。因此,可以省略将具有低使用频率的字符——例如异体字或外来字(包括传统的字符形状)——登记在字典数据3中。此外,用户自己可以准备字符以将该字符登记在字符形状数据2中。预先将由用户自己准备的字符登记在字典数据3中可能并不优选。
因此,高准确度地识别未登记在字典数据3中的字符的方法成为问题。例如,可能存在如下情况:其中,当输入用户视为未被登记在字典数据3中的字符的输入数据4时,输入数据4与登记在字符形状数据2中的每个图像数据进行比对。然而,在作为包含在输入数据4中的每个部件的字符的形状弯曲(collapse)的情况下,可能降低输入数据4的识别准确度。
信息处理装置1将输入数据4作为多个字符的组合来处理。具体地,信息处理装置1基于字典数据3来识别多个字符,以检测多个字符的字符代码。信息处理装置1从字符形状数据2中提取与多个字符代码相关联的多个图像数据并将其进行组合,以将输入数据4成形为图像数据5。此外,信息处理装置1将图像数据5与包含在字符形状数据2中的每个图像数据进行比对,以指定用于输入数据4的图像数据X4。因此,即使在与输入数据4相关联的字符未登记在字典数据3中的情况下,也可以使用登记在字典数据3中的笔画信息而适当地指定用户打算输入的字符的图像数据X4或字符代码A4。
在此情况下,如上所述,信息处理装置1可以基于由用户输入的字符4a、4b和4c的输入位置对图像数据X1、X2和X3进行变形和组合,以生成图像数据5。通过这样做,可以通过图像数据X1、X2和X3来再现作为汉字部首(例如“編”或“旁”)输入的部件以适当地在图像数据5中反映所再现的部件。
[第二实施方式]
图2为示出第二实施方式的客户端设备的视图。客户端设备100为信息处理装置,例如移动电话、平板设备或计算机。客户端设备100执行字符识别。当接收到用户的手写输入时,客户端设备100估计用户打算输入的字符的字符代码。然后客户端设备100在估计字符代码时使用字典数据。字典数据为其中字符代码和笔画信息彼此相关联的信息。
例如,用户可以通过使用手200的任意手指或触控笔在客户端设备100中设置的触摸面板上重写字符来执行手写输入。例如,用户可以通过在预定输入区域R中的手写输入来输入字符。客户端设备100可以以将输入区域R作为用于输入字符的输入区域显示在显示屏上的方式向用户呈现输入区域。在以下描述中,将朝向地面的输入区域R的左上顶点定义为坐标原点“O”。此外,将相对于坐标原点“O”在右方的坐标轴定义为X轴且将相对于坐标原点“O”在下方的坐标轴定义为Y轴。
例如,客户端设备100在显示屏上显示与所估计的字符代码相关联的字符的图像数据。例如,当在显示屏上显示的字符的图像数据为用户打算输入的数据时,用户可以确定字符的输入以用于操纵。
图3是示出了客户端设备100的硬件的示例的视图。客户端设备100包括处理器101、RAM102、闪速存储器103、无线单元104、显示屏105、触摸面板106、语音单元107和介质读出单元108。各单元均连接至客户端设备100的总线。
处理器101控制客户端设备100的信息处理。处理器101可以为例如CPU、DSP、ASIC或FPGA。处理器101也可以为多处理器。处理器101可以为两个或更多个部件(例如CPU、DSP、ASIC或FPGA)的组合。
RAM102为客户端设备100的主存储设备。RAM102暂时存储操作系统(OS)程序或由处理器101执行的应用程序的至少一部分。此外,RAM102存储用于由处理器101执行的处理的各种数据。
闪速存储器103为客户端设备100的辅助存储设备。闪速存储器103在其中存储例如OS程序、应用程序或各种数据。闪速存储器103可以为能够从客户端设备100上拆卸的便携式记录介质。
无线单元104为能够执行无线通信的接口。无线单元104可以与接入点10通信以访问接入点10所连接的网络。无线单元104可以对去往和来自连接至网络的其他计算机的程序或数据进行发送和接收。此外,客户端设备100可以设置有能够进行有线通信的接口,以替代无线单元104或者与无线单元一起工作。
显示屏105根据从处理器101发出的指令来输出图像。例如,显示屏105可以为液晶显示屏或者电致发光(EL)显示屏。
触摸面板106检测由例如用户进行的触摸操纵。用户可以使用手指或者触控笔来触摸触摸面板106。当检测到触摸操纵时,触摸面板106检测在其上手指或触控笔进行接触的位置并将该位置输出至处理器101。当通过手指或触控笔在触摸面板106上执行重写操纵时,触摸面板106继续检测在轨迹上包含的位置并将所检测到的位置输出至处理器101。
此外,触摸面板106可以为连接至客户端设备100的外部设备。此外,客户端设备100可以连接至其他定点设备,例如触摸板或鼠标,以接收使用其他定点设备进行的手写输入。
语音单元107实现呼叫功能。例如,语音单元107被设置有麦克风或扬声器。语音单元107对由麦克风输入的声音模拟信号执行信号转换处理,以生成声音数据并将该声音数据输出至处理器101。此外,语音单元107将从处理器101获取的声音数据转换成声音模拟信号并使用扬声器输出声音。
介质读出单元108可以根据从处理器101发出的指令来从便携式记录介质11读取程序或数据、或者将程序或数据记录在记录介质11上。例如,记录介质11为至介质读出单元108的可拆卸卡式记录介质(例如存储卡)。介质读出单元108将从记录介质11读取的程序或数据存储在RAM102或闪速存储器103中。介质读出单元108可以为使用例如激光来读取记录在光盘中的程序或数据的驱动设备(例如在客户端设备100为计算机的情况下)。
在这样的情况下,光盘可以被用作记录介质11。例如,可以将数字通用磁盘(DVD)、DVD-RAM、只读光盘存储器(CD-ROM)、可记录/可重写式光盘(CD-R/RW)用作光盘。例如,介质读出单元108根据从处理器101发出的指令将从光盘读取的程序或数据存储在RAM102或闪速存储器103(或者其他存储设备如HDD)中。
图4是示出客户端设备100的功能的示例的视图。客户端设备100包括例如存储单元110、字符确定单元120、部件字符组合单元130和字符比较单元140。存储单元110可以由固定在RAM102或闪速存储器103中的存储区来实现。字符确定单元120、部件字符组合单元130和字符比较单元140可以由通过处理器101执行的软件模块来实现。
存储单元110存储用于由字符确定单元120、部件字符组合单元130和字符比较单元140执行的处理的各种信息。存储在存储单元10中的信息包括字符形状表、字典表、输入历史表、相似度历史表和组合表。
字符形状表为指示字符代码与字符字体(例如表示字符形状的图像数据)之间的关联关系的表。字典表为指示字符代码与参考笔画信息之间的关联关系的表。输入历史表为存储关于笔画输入的信息的表。相似度历史表为存储手写输入的笔画与笔画信息之间的相似度的计算历史的表。组合表为用于组合图像数据的表。
字符确定单元120接收用户的手写输入。字符确定单元120将指示与由触摸面板106检测到的每个笔画相关联的轨迹的一组坐标存储到在存储单元110中存储的输入历史表中。根据在输入最后笔画之后的、其间未输入任何笔画的时间段是否持续达到预定时间,字符确定单元120指定手写输入的单个字符。
字符确定单元120基于手写输入的信息来估计输入的字符,并指定与该字符相关联的字符代码。字符确定单元120可以根据手写输入的信息、基于存储在存储单元中的字符形状表和字典表来指定字符代码。例如,对登记在字典表中的字符执行字符识别的情况。
字符确定单元120接收手写输入的单个笔画。字符确定单元120将登记在字典表中的每个笔画信息与手写输入的笔画信息进行比较,以评估笔画信息的第一相似度。此处,相似度以数值显示。此外,假设相似度随着相似度的数值的变大而变高,而不相似度随着相似度数值的变小而变高。字符确定单元120可以从字典表中提取与具有较大数值的第一相似度的笔画信息相关联的一个或多个字符代码。
此外,字符确定单元120对登记在字符形状表中的每个图像数据与手写输入的图像数据进行比较,以评估图像式样的第二相似度。例如,当字符由具有二进制值的点图形表示时,可以通过点位置或点图形之间的匹配度来计算第二相似度。字符确定单元120可以从字符形状表中提取与具有较大数值的第二相似度的图像数据相关联的一个或多个字符代码。
此外,字符确定单元120在从字符形状表和字典表中提取的字符代码中指定该手写输入的字符代码。具体地,字符确定单元120通过对作为第一相似度和第二相似度获得的结果进行综合确定来计算相似度,并指定字符代码的候选项中变为具有最大相似度的字符代码。例如,字符确定单元120可以通过对同一字符代码的第一相似度和第二相似度取平均来计算每个字符代码的综合相似度。然而,字符确定单元120可以使用仅第一相似度来指定手写输入的字符代码(可以省略第二相似度的计算)。
同时,用户可能打算输入如下字符以进行手写输入:该字符被认为是未登记在字典数据3中的字符。因此,在输入单个字符的第一笔画之后的直到输入该单个字符的最后笔画为止的时间段中,每当输入单个笔画时,字符确定单元120就计算相似度。具体地,字符确定单元120将未登记在字典表中的字符作为多个子字符的组合(例如,在下文中,可以将多个子字符称为部件字符)来处理,并针对多个部件字符中的每个部件字符执行字符识别。如以下将描述的,字符确定单元120通过检测相似度的变化来检测单个部件字符。当在单个字符的输入时期内检测到多个部件字符时,字符确定单元120将每个部件字符的每个字符代码输出至部件字符组合单元130。
部件字符组合单元130基于从字符确定单元120获取的多个部件字符的字符代码来从字符形状表中获取每个部件字符的图像数据。部件字符组合单元130基于指示每个部件字符被输入的位置的位置信息对每个所获取部件字符的图像数据进行组合。部件字符组合单元130可以根据存储在存储单元110中的笔画输入历史来指定每个部件字符的位置信息。
部件字符组合单元130基于位置信息来指定指示每个部件字符被输入的区域的矩形。部件字符组合单元130对每个部件字符的图像数据进行变形以适合于每个矩形中,从而对每个部件字符进行组合(在下文描述中,可以将变形之后的图像数据称为经变形的图像数据)。此外,部件字符组合单元130生成单个图像数据(例如,在下文中可以将单个图像数据称为合成图像数据)并将该单个图像数据作为组合结果输出至字符比较单元140。
字符比较单元140从部件字符组合单元130获取合成图像数据。字符比较单元140将存储在存储单元110中的字符形状表的每个图像数据与合成图像数据进行比对,以指定并输出与合成图像数据相关联的图像数据或与该图像数据相关联的字符代码。例如,字符比较单元140可以在显示屏105上显示与合成图像数据相关联的图像数据。此外,字符比较单元140可以将与该图像数据相关联的字符代码输出至例如在客户端设备100或者与客户端设备100通信的其他设备上运行的预定软件。
图5是示出字符形状表111的示例的视图。字符形状表111预先存储在存储单元110中。字符形状表111可以为由客户端设备100的操作系统提供的字体的信息。另外,字符形状表111可以为由字符确定单元120使用字体的信息(例如通过复制字体的信息)所准备的信息。
字符形状表111包括字符代码字段和图像数据字段。字符代码被登记在字符代码字段中。指示字体的图像数据(例如位图数据)被登记在图像数据字段中。
例如,指示字符代码为“706b”且图像数据为“G1(火)”的信息被登记在字符形状表111中。这表示针对字符代码“706b”指示字符“火”的图像数据“G1”已经被登记。
可以由用户添加登记在字符形状表111中的内容。例如,用户可以通过将异体字或外来字与未使用的字符代码相关联而将该异体字或外来字登记在字符形状表111中。此外,用户还可以准备其自己的字符的图像数据,并将该图像数据与未使用的字符代码相关联以被登记在字符形状表111中。例如,在字符形状表111中登记针对字符代码“7130”的异体字的图像数据“G7”。图像数据“G7”为字符的异体字“焔”的字体。
此外,统一码(unicode)被例示为字符代码的示例,但在第二实施方式中也可以使用其他字符代码(例如JIS码或Shift JIS码)。
图6是示出字典表112的示例的视图。字典表112预先存储在存储单元110中。字典表112包括字符代码字段和笔画信息字段。字符代码被登记在字符代码字段中。参考笔画信息被登记在笔画信息字段中。例如,对于单个字符,笔画信息可以包括多种图形,例如每个笔画的书写起始位置和书写完成位置、每个笔画的书写完成位置与下一笔画的书写起始位置之间的相对位置关系、或者形成单个字符的书写顺序。
例如,指示字符代码为“30bd”且笔画信息为“P1”的信息被登记在字典表112中。例如,关于字符的异体字“焔”的笔画信息未被登记在字典表112中。
图7是示出输入历史表113的示例的视图。输入历史表113存储在存储单元110中。输入历史表113包括顺序字段和所检测点字段。笔画的输入顺序被登记在顺序字段中。与由用户输入的笔画有关的一组坐标被登记在所检测点字段中。例如,将顺序为“1”且所检测到的点为“N1,N2,···”的信息登记在输入历史表113中。这表明关于第一笔画输入检测到坐标“N1,N2,···”。
笔画的输入顺序可以由登记在输入历史表113中的顺序来指定。此外,可以根据某一笔画的最后检测到的点和下一笔画的最先检测到的点来指定各个笔画之间的相对位置关系。登记在输入历史表113中的连续输入的多个笔画的集合形成单个字符(或者单个部件字符)。
图8是示出相似度历史表114的示例的视图。相似度历史表114存储在存储单元110中。每当用户输入单个笔画时,在相似度历史表114中添加新条目。当检测到单个部件字符时,清除在相似度历史表114中登记的内容。相似度历史表114包括输入笔画数字段、字符代码字段和相似度字段。
输入笔画数(例如每个部件字符的笔画数)被登记在输入笔画数字段中。字符代码被登记在字符代码字段中。由字符确定单元120针对用户的手写输入评估的相似度被登记在相似度字段中。在此,作为示例,最大相似度值被设定为“100”。
例如,在相似度历史表114中登记了指示输入笔画数为“1”、字符代码为“30bd”且相似度为“17”的信息。这表示对于第一笔画检测到字符代码“30bd”且此时的相似度为“17”。
此外,例如,在相似度历史表114中登记了指示输入笔画数为“2”、字符代码为“706b”且相似度为“53”的信息。这表示对于第一笔画和第二笔画的组合检测到字符代码“706b”且此时的相似度为“53”。
图9是示出组合表115的示例的视图。组合表115存储在存储单元110中。组合表115包括字符代码字段、经变形的图像数据字段、最小坐标字段和最大坐标字段。
字符代码被登记在字符代码字段中。部件字符的经变形图像数据被登记在经变形的图像数据字段中。针对部件字符所检测的X轴和Y轴的一对最小坐标(简称为最小坐标)被登记在最小坐标字段中。针对部件字符所检测的X轴和Y轴的一对最大坐标(简称为最大坐标)被登记在最大坐标字段中。
例如,在组合表115中登记了指示字符代码为“706b”、经变形的图像数据为“G11”、最小坐标为“(3,25)”且最大坐标为“(42,78)”的信息。这表明对于字符代码“706b”生成了经变形的图像数据“G11”。此外,这表明在输入与字符代码相关联的部件字符时的最小坐标为“(3,25)”且最大坐标为“(42,78)”。此外,最小坐标和最大坐标还可以被用作用于确定放置经变形的图像数据的位置的信息(例如指示与其他经变形的图像数据的相对位置关系的信息)。
图10是示出字符识别过程的示例的流程图。在下文中,将根据步骤编号来描述图10所述的过程。字符确定单元120接收用户的指示字符识别开始的操纵输入。字符确定单元120分别将数字“1”代入变量“n”,将相似度V0设定为“0”且将结束标志设定为“假”(S11)。
字符确定单元120接收由用户手写输入的单个笔画(S12)。“接收单个笔画”的表述是指检测到单个笔画的书写完成点。字符确定单元120将指示输入笔画的信息(例如指示由触摸面板106检测到的笔画的轨迹的一组坐标)存储在存储单元110中。
字符确定单元120从存储在存储单元110中的输入历史表113中提取尚未被决定为形成哪个字符的笔画集(例如,称为一组未决定的笔画)(S13)。字符确定单元120基于该组未决定的笔画以及存储在存储单元110中的字符形状表111和字典表112来计算该组未决定的笔画与每个字符之间的相似度Vn。例如,字符确定单元120将该组未决定的笔画与字典表112中的每个笔画信息进行比对,以计算该组未决定的笔画与每个字符之间的第一相似度。此外,字符确定单元120将由该组未决定的笔画表示的点图形与字符形状表111的图像数据进行比对,以计算该组未决定的笔画与每个字符之间的第二相似度。此外,字符确定单元120基于第一相似度和第二相似度来综合地确定该组未决定的笔画与每个字符之间的相似度。例如,如上所述,可以将第一相似度和第二相似度的平均值设定为该组未决定的笔画与每个字符之间的相似度。此外,将最大相似度设定为Vn并将与相似度Vn相关联的字符代码设定为字符代码Cn。字符确定单元120将输入笔画数“n”、字符代码Cn和相似度Vn登记在相似度历史表114中。
字符确定单元120判定是否在步骤S12处接收到所述笔画的输入之后的预定限制时间“T”内开始下一笔画(例如由手写过程中的单次移动形成的下一线条)的输入(S14)。“开始下一笔画的输入”的表述是指检测到下一笔画的书写开始点。当确定下一笔画是在限制时间“T”内开始时,过程进行到步骤S15。当确定下一笔画未在限制时间“T”内开始时,过程进行到步骤S19。例如,可以将限制时间“T”设定为从0.2秒到1秒的序列上的任意时间段。根据用户的输入方法,可以允许限制时间“T”将设定时间改变成时间段。
字符确定单元120判定变量“n”是否大于“1”(S15)。当确定“n”大于“1”时,则过程转至步骤S16。否则,当“n”小于等于1时,过程转至步骤S18。
字符确定单元120判定相似度Vn是否小于等于相似度Vn-1且相似度Vn-1是否大于等于阈值Q(S16)。当确定相似度Vn小于等于相似度Vn-1且相似度Vn-1大于等于阈值Q时,过程转至步骤S17。当确定相似度Vn大于相似度Vn-1并且相似度Vn-1小于阈值Q时,过程转至步骤S18。
字符确定单元120指定字符代码Cn-1作为部件字符(S17)。字符确定单元120将字符代码Cn-1登记到存储在存储单元110中的组合表115中。字符确定单元120将字符代码Cn-1输出到部件字符组合单元130中,并且过程转至图11的步骤S31。
字符确定单元120将变量“n”增加一(将“n”的值加一)(S18),并且过程转至步骤S12。符号确定单元120将结束标志设定为“真”(S19)。
字符确定单元120将字符代码Cn指定为部件字符(S20)。字符确定单元120将字符代码Cn登记在组合表115中。字符确定单元120参考组合表115来判定所获取的部件字符的数目是否为一(S21)。当确定所获取的部件字符的数目为一时,过程转至步骤S22。否则,当所获取的部件字符的数目不为一时,字符确定单元120将该字符代码Cn输出至部件字符组合单元130,并且过程转至图11的步骤S31。
字符确定单元120获取从字符形状表111输出的字符代码Cn的图像数据(其仅对应于所获取的字符代码)并将所获取的图像数据输出至显示屏105(S22)。否则,字符确定单元120可以将字符代码Cn输出到其他软件或设备。例如,用户可以浏览在显示屏105中显示的字符的图像以识别该字符是否为用户自己打算输入的字符。字符确定单元120清除每个表中的内容以用于下一字符的识别,并且还结束单个字符的识别过程。
此外,如上所述,可以通过在步骤S13处仅使用与字典表112比对的结果来获取相似度Vn和字符代码Cn。此外,字符的第一笔画的输入大多数对应于线条,例如水平线“-”或垂直线“|”,因此,该字符与字符“一”之间的相似度被计算为较大。因此,当在第二笔画中相似度极大地降低时,步骤S16的判定结果变成肯定,使得可能错误地检测到部件字符。因此,如步骤S15中在第一笔画的情况下不执行步骤S16的判定,并且因此可以减小错误地检测部件字符的可能性。
图11是示出字符识别过程的示例的流程图(从图10继续)。在下文中,将参照步骤编号来描述图11中示出的过程。部件字符组合单元130参考字符形状表111以获取与在步骤S17处获取的部件字符的字符代码Cn-1相关联的图像数据(字体图像)(S31)。否则,部件字符组合单元130获取与在步骤S20处获取的部件字符的字符代码Cn相关联的图像数据。
部件字符组合单元130关于在步骤S17或步骤S20处所检测到的部件字符来参考存储在存储单元110中的输入历史表113,以从输入的部件字符的坐标中获取最小坐标和最大坐标(S32)。部件字符组合单元130将部件字符的最小坐标和最大坐标登记在组合表115中。
部件字符组合单元130指定以在步骤S32处所获得的最小坐标和最大坐标作为一对对角相对顶点(例如未共用同一边的两个顶点)的矩形。矩形的两边与X轴平行,而其他两边与Y轴平行。部件字符组合单元130对在步骤S31处所获取的部件字符的图像数据进行变形以被装入所述矩形中,来生成经变形的图像数据。具体地,部件字符组合单元130沿X轴方向和Y轴方向改变(延伸和收缩)原图像数据的长度,使得部件字符的原图像数据的大小变成与所述矩形的大小相同的大小。也就是说,经变形的图像数据的纵横比变成与矩形的纵横比相同的比率。此外,原图像数据的大小可能不一定是相同的大小,其可以是允许如下预定裕度的大小:该预定裕度等同于在某方面比矩形的大小大或小预定比率的尺寸。此外,部件字符组合单元130确定待布置的经变形图像数据的位置,使得所生成的经变形图像数据的顶点与矩形的对应顶点相匹配(S33)。部件字符组合单元130将部件字符的经变形图像数据登记在组合表115中。
部件字符组合单元130判定结束标志是否为“真”(S34)。当判定结束标志为“真”时,过程转至步骤S37。否则,当结束标志不为“真”(即,结束标志保持为“假”)时,将过程控制转移到字符确定单元120,并且过程转至步骤S35。
字符确定单元120删除相似度历史表114中的条目(S35)。字符确定单元120将“1”代入变量“n”(S36),过程转至图10的步骤S12。也就是说,过程转至用于检测下一部件字符的处理。
部件字符组合单元130在步骤S33处所确定的位置上对存储在组合表115中的每个经变形的图像数据进行布置和组合,以生成合成图像数据。部件字符组合单元130将合成图像数据输出到字符比较单元140(S37)。
字符比较单元140参考字符形状表111以检索与所获取的合成图像数据相关联的字体的图像数据(例如字体图像)。例如,字符比较单元140可以检测包含在合成图像数据中的汉字部首,以通过汉字部首来缩减字符形状表111的图像数据。字符比较单元140计算合成图像数据与登记在字符形状表111中的每个图像数据之间的点位置或点图形的匹配度作为相似度,并指定具有最大相似度的图像数据作为与合成图像数据相关联的图像数据(S38)。
字符比较单元140将在步骤S38处所指定的图像数据输出至显示屏105(S39)。另外,字符比较单元140可以从字符形状表111获取与图像数据相关联的字符代码,以将所获取的字符代码输出到其他软件或其他设备。例如,用户可以浏览在显示屏105中显示的字符图像,以识别该字符图像是否与用户打算输入的字符相对应。字符比较单元140清除相似度历史表114和组合表115中的内容以用于下一字符的识别。然后,单个字符的识别过程结束。
此外,可以在步骤S37紧之前执行步骤S33。在此情况下,在步骤S32之后执行步骤S34,并且当在步骤S34处的判定结果为“是”时,执行步骤S33。
接下来,将描述由字符确定单元120进行的处理的具体示例。在以下描述中,例示对字符的异体字“焔”进行识别的情况。在以下描述中,当引用输入笔画数时,输入笔画数被表示为异体字整体的笔画数(例如,在以下示例中存在共12(十二)画)。此外,作为示例,相似度的阈值Q被设定为“80”。
图12A、图12B和图12C是示出部件字符确定的具体示例的视图。图12A例示针对接收到第三笔画输入的情况的相似度历史表114a。字符确定单元120将输入笔画数为“3”、字符代码为“706b(与字符“火”相关联)且相似度为“68”的条目登记在相似度历史表114a中。此处,仅表示出最新的条目而其他条目被缩写成“…”(在下文中,可以类似地进行表示)。
图12B例示针对接收到第四笔画输入的情况的相似度历史表114b。字符确定单元120将输入笔画数为“4”、字符代码为“706b”(与字符“火”相关联)且相似度为“91”的条目登记在相似度历史表114b中。
图12C例示针对接收到第五笔画输入的情况的相似度历史表114c。字符确定单元120将输入笔画数为“5”、字符代码为“72ac”(与字符“犬”相关联)且相似度为“28”的条目登记在相似度历史表114c中。此处,当将相似度历史表114b和114c彼此比较时,相似度V5=28落入等于或小于相似度V4=91的范围内。此外,相似度V4=91相当于等于或大于阈值Q=80的范围。因此,字符确定单元120将由如图12B所示的笔画输入获得的输入图像检测为单个部件字符。部件字符的字符代码为“706b”。字符确定单元120清除相似度历史表114c中的登记内容。
图13A、图13B和图13C为示出部件字符确定(自图12延续)的具体示例的图。图13A例示针对接收到图12C的第六笔画(由于相似度历史表114被清除,所以为了管理将笔画变成第一笔画)输入的情况的相似度历史表114d。字符确定单元120将输入笔画数为“1”、字符代码为“30af”(与字符“ク”相关联)且相似度为“86”的条目登记在相似度历史表114d中。
图13B例示针对接收到第七笔画输入的情况的相似度历史表114e。字符确定单元120将输入笔画数为“2”、字符代码为“ff17”(与字符“7”相关联)且相似度为“39”的条目登记在相似度历史表114e中。此处,当将相似度历史表114d和114e彼此比较时,相似度V5=39落入等于或小于相似度V4=86的范围内。此外,相似度V1=86相当于等于或大于阈值Q=80的范围。因此,字符确定单元120将由如图13A所示的笔画输入所获得的输入图像检测为单个部件字符。部件字符的字符代码为“30af”。字符确定单元120清除登记在相似度历史表114e中的内容。
图13C例示针对接收到第十一笔画输入的情况的相似度历史表114f。字符确定单元120将输入笔画数为“4”、字符代码为“81fc”(与字符“臼”相关联)且相似度为“72”的条目登记在相似度历史表114f中。
图13D例示针对接收到第十二笔画输入的情况的相似度历史表114g。字符确定单元120将输入笔画数为“5”、字符代码为“81fc”(与字符“臼”相关联)且相似度为“86”的条目登记在相似度历史表114f中。在检测到第十二笔画输入之后未开始下一个输入的情况下,字符确定单元120将由执行十二次输入获得的笔画输入所获得的输入图像检测为单个部件字符。部件字符组合单元130对由字符确定单元120检测到的每个部件字符的图像数据进行变形和组合以生成合成图像数据。接下来,将例示由部件字符组合单元130对图像数据进行的变形过程。
图14是示出经变形的图像数据的示例的视图。部件字符组合单元130参考字符形状表111以获取与部件字符(例如字符“火”)的字符代码“706b”相关联的图像数据G1。此外,部件字符组合单元130从直至图12B的第四笔画为止的输入历史获取最小坐标“(3,25)”和最大坐标“(42,78)”。此外,假设在图14的示例中的输入区域“R”中,X轴的最大值为“100”且Y轴的最大值为“100”。
部件字符组合单元130指定以最小坐标和最大坐标作为对角相对顶点的矩形“H”。矩形“H”的沿水平方向的两边与X轴平行。矩形“H”沿垂直方向的两边与Y轴平行。此外,对图像数据G1进行变形使得图像数据G1可以被布置成被装入到矩形“H”中。具体地,将图像数据G1的沿与X轴平行的方向的长度延伸和收缩成与矩形“H”的水平边的长度(例如“39”)相同。此外,将图像数据G1的沿与Y轴平行的方向的长度延伸和收缩成与矩形“H”的垂直边的长度(例如“53”)相同。因此,生成经变形的图像数据G11。
换言之,也就是说,经变形的图像数据G11的纵横比被变形为与矩形“H”的纵横比相匹配。例如,当矩形“H”的纵横比为高:宽=“2:1”的比率时,也将图像数据G1的纵横比设定为“2:1”的比率。然而,变形之后的纵横比可以在预定比率的范围内进行调节。例如,相对于矩形“H”的纵横比“2:1”,图像数据G1的纵横比可以在预定比率的范围内改变,例如“2.2:1.9”。
通过这样做,部件字符组合单元130从图像数据G1生成经变形的图像数据G11。此外,部件字符组合单元130确定输入区域“R”中的矩形“H”的每个顶点与经变形的图像数据G11的每个顶点(例如,在矩形“H”的顶点中与最小坐标相对应的顶点和在调节纵横比的情况下的经变形图像数据G11的对应顶点)被布置成彼此重叠。
图15A、图15B和图15C是示出经变形的图像数据的组合的示例的视图。图15A例示用于部件字符“ク”的经变形图像数据G21。图15B例示用于部件字符“臼”的经变形图像数据G31。部件字符组合单元130可以通过应用如图14所描述的相同方法来生成经变形的图像数据G21和G31。
图15C例示通过组合经变形的图像数据G11、G21和G31而形成的合成图像数据GX。部件字符组合单元130将经变形的图像数据G11、G21和G31中的每一个布置在预定位置上以形成单个图像数据,从而获得合成图像数据GX。经变形的图像数据G11、G21和G31以如下方式进行布置:所布置的经变形图像数据G11、G21和G31的相应顶点与指示每个部件字符的输入区域的矩形的相应顶点相匹配。因此,经变形的图像数据G11、G21和G31中的每一个的区域与每个对应矩形的区域相匹配。因此,换言之,经变形的图像数据G11、G21和G31的面积比被变形成与指示每个部件字符被输入的区域的每个矩形的面积比相匹配。例如,当指示每个部件字符被输入的区域的每个矩形的面积比为“4:3:6”的比率时,布置经变形的图像数据G11、G21和G31的区域的面积比也被设定为“4:3:6”的比率。
然而,面积比可以不必与矩形的面积比相匹配并且在对准方面可以允许一些差异。例如,当指示每个部件字符被输入的区域的每个矩形的面积比为“4:3:6”的比率时,布置经变形的图像数据G11、G21和G31的区域的面积比可以在预定比率的范围内改变,例如为“3.8:3.1:6.3”。部件字符组合单元130将合成图像数据GX输出到字符比较单元140。
图16是示出最终结果的输出的示例的视图。字符比较单元140将合成图像数据GX与登记在字符形状表111中的每个字符的图像数据进行比对。此外,字符比较单元140估计与图像数据最匹配的图像数据G7作为由用户输入的字符。字符比较单元140可以显示图像数据G7以提示用户确认图像数据G7。字符比较单元140可以从字符形状表111获取与图像数据G7相关联的字符代码,以将所获取的字符代码输出到在客户端设备100上运行的其他软件。此外,字符比较单元140可以将与图像数据G7相关联的字符代码“7130”输出到其他设备。
如上所述,客户端设备100检测包含在单个字符中的多个部件字符,并生成通过组合所述部件字符而形成的合成图像数据GX。此外,客户端设备100将合成图像数据GX与字符形状表111中的每个字符进行比对,以获得最终字符识别结果。因此,可以高精度地识别甚至未登记在字典表112中的字符。例如,当要执行字符识别时,针对要识别的每个目标字符预先准备要成为样本的笔画信息。
然而,字符的数目是庞大的,因此相对于关于所有字符的手写输入来预先采集用于字符识别的笔画信息是不容易的。例如,在登记中可能会使用异体字。一些异体字仅在非常少的登记处(例如一个登记处)中使用。例如,难以针对在数万的序列上存在的所有异体字从要测试的约十到三十人提取笔画的样本,并且即使登记了笔画但与工作成本相比效用也较低。因此,可以不将与具有较低使用频率的字符(例如异体字或外来字)有关的笔画信息登记在字典表112中。
此外,用户可以任意地将由其自己准备的字符登记在字符形状表111中。鉴于这样的字符,难以准备待用作样本的笔画信息。
因此,如何高准确度地识别未登记在字典表112中的字符成为问题。例如,还可能会存在指示手写输入的线条的组合的图像数据与登记在字符形状表111中的每个字符的图像数据进行比对的情况。然而,从作为字符的形式的角度来看,手写输入的线条可能叠并。因此,当将指示手写输入的线条的组合的图像数据与登记在字符形状表111中的每个字符的图像数据进行比对时,可能降低字符识别的准确度。
相反,客户端设备100将单个字符作为多个部件字符的组合来处理。也就是说,由打算输入单个字符的用户在输入区域R中手写输入的字符被客户端设备100检测为多个部件字符的组合。客户端设备100将基于字典表112所识别的每个部件字符的图像数据进行组合以获得合成图像数据GX。在此情况下,基于指示由用户输入的字符的位置的信息对部件字符的图像数据进行变形和组合。因此,作为汉字部首(例如“編”或“旁”)输入的部件可以通过使用登记在字符形状表111中的图像数据而再现,并且被适当地反映为合成图像数据GX。因此,与无变形地将手写输入的线条的组合与字符形状表111中的图像数据进行比对的情况相比,可以高准确度地进行识别。
此外,使用现有的笔画信息,可以容易以高准确度对甚至如下异体字或外来字执行字符识别:对于该异体字或外来字,未准备有手写的用于字符识别的笔画信息。此外,对于具有较低使用频率的异体字或外来字,可以不准备单独的笔画信息。因此,可以节约对待用作样本的笔画信息进行采集和登记工作的劳动力。此外,可以减少待登记在字典表112中的字符以抑制笔画信息的不断增加。
此外,如上所述,第一实施方式的信息处理可以通过使操作单元1b执行程序来实现。此外,第二实施方式的信息处理可以通过使处理器101执行程序来实现。程序可以被记录在计算机可读记录介质(例如、光盘、存储设备和存储卡)中。
例如,其中记录有程序的记录介质可以被分发以传播该程序。此外,程序可以在存储在其他计算机中时经由网络进行分发。客户端设备例如计算机可以将例如记录在记录介质中的程序或从其他计算机接收的程序存储(安装)在RAM或HDD中,并且从存储设备中读取该程序以执行该程序。
可知本公开涵盖了但是不限于如下技术方案:
1.一种存储有字符识别程序的计算机可读记录介质,所述字符识别程序在被执行时使计算机执行字符识别方法,所述字符识别方法包括:
检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第一信息,并且检测与所述多个字符相关联的多个字符代码;
通过参考第二信息来获取与所述多个字符代码中的每个字符代码相关联的多个第一图像数据,在所述第二信息中所述字符的字符代码与图像数据彼此相关联;
通过基于所述第一信息对所述多个第一图像数据进行组合来生成第二图像数据;以及
通过参考所述第二信息来输出与所述第二图像数据相关联的字符的图像数据或与所述第二图像数据相关联的字符代码。
2.根据方案1所述的计算机可读记录介质,其中,所述生成包括:
基于所述第一信息对所述多个第一图像数据进行变形;以及
通过对在所述变形处变形的所述多个第一图像数据进行组合来生成所述第二图像数据。
3.根据方案2所述的计算机可读记录介质,其中,所述变形包括:
基于所述第一信息来指定指示所述多个字符被输入的区域的多个矩形;以及
使在所述变形处变形的所述多个第一图像数据中的每个第一图像数据的纵横比与所述多个矩形中的每个矩形的纵横比相匹配。
4.根据方案3所述的计算机可读记录介质,其中,所述变形包括:使所述多个第一图像数据中的每个第一图像数据的面积比与所述多个矩形中的每个矩形的面积比相匹配。
5.根据方案1所述的计算机可读记录介质,其中,所述生成包括:
基于所述第一信息来指定所述多个字符的输入位置之间的相对位置关系;以及
保持所述相对位置关系以组合所述多个第一图像数据。
6.根据方案1所述的计算机可读记录介质,其中,所述检测包括:
每当接收到手写的一个笔画时,每次通过参考字典数据来将指示包含在所述字典数据中的参考笔画的信息与输入笔画中的没有被决定为用于形成字符的笔画集进行比对,在所述字典数据中登记有字符代码与指示参考笔画的信息之间的多个关联;以及
基于比对结果来依次检测所述多个字符代码中的每个字符代码。
7.根据方案6所述的计算机可读记录介质,其中,所述比对包括:
计算没有被决定为用于形成字符的所述笔画集与包含在所述字典数据中的多个参考笔画之间的相似度,以获取与具有最大相似度的参考笔画相关联的字符代码;以及
当在当前时间处的最大相似度小于或等于在先前时间处的最大相似度并且所述在先前时间处的最大相似度等于或大于阈值时,针对在没有被决定为用于形成字符的所述笔画集中的直到所述先前时间为止所输入的笔画集,决定在所述先前时间处获取的字符代码。
8.根据方案7所述的计算机可读记录介质,其中,所述比对包括:
当在接收到所述笔画的输入之后的限制时间内没有开始下一笔画的输入时,通过针对没有被决定为用于形成字符的所述笔画集决定最后获取的字符代码来检测所述多个字符代码中的最后字符代码。
9.根据方案1所述的计算机可读记录介质,其中,所述第二信息为由所述计算机预先保持的字体的信息或基于所述字体的信息而准备的信息。
本文所陈述的所有示例和条件性语言旨在教导的目的,以帮助读者理解本发明和由发明人为推进本领域而贡献的概念,并且其应被解释为不受限于这样的具体陈述的示例和条件,并且本说明书中的这样的示例的组织也不涉及示出本发明的优势和劣势。尽管已经详细描述了本发明的实施方式,但应当理解的是,在不背离本发明的精神和范围的情况下,可以对其做出各种改变、替换和变更。

Claims (10)

1.一种字符识别方法,所述字符识别方法包括:
检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第一信息,并且检测与所述多个字符相关联的多个字符代码;
通过参考第二信息来获取与所述多个字符代码中的每个字符代码相关联的多个第一图像数据,在所述第二信息中所述字符的字符代码与图像数据彼此相关联;
通过基于所述第一信息对所述多个第一图像数据进行组合来生成第二图像数据;以及
通过参考所述第二信息来输出与所述第二图像数据相关联的字符的图像数据或与所述第二图像数据相关联的字符代码。
2.根据权利要求1所述的字符识别方法,其中,所述生成包括:
基于所述第一信息对所述多个第一图像数据进行变形;以及
通过对在所述变形处变形的所述多个第一图像数据进行组合来生成所述第二图像数据。
3.根据权利要求2所述的字符识别方法,其中,所述变形包括:
基于所述第一信息来指定指示所述多个字符被输入的区域的多个矩形;以及
使在所述变形处变形的所述多个第一图像数据中的每个第一图像数据的纵横比与所述多个矩形中的每个矩形的纵横比相匹配。
4.根据权利要求3所述的字符识别方法,其中,所述变形包括:使所述多个第一图像数据中的每个第一图像数据的面积比与所述多个矩形中的每个矩形的面积比相匹配。
5.根据权利要求1所述的字符识别方法,其中,所述生成包括:
基于所述第一信息来指定所述多个字符的输入位置之间的相对位置关系;以及
保持所述相对位置关系以组合所述多个第一图像数据。
6.根据权利要求1所述的字符识别方法,其中,所述检测包括:
每当接收到手写的一个笔画时,每次通过参考字典数据来将指示包含在所述字典数据中的参考笔画的信息与输入笔画中的没有被决定为用于形成字符的笔画集进行比对,在所述字典数据中登记有字符代码与指示参考笔画的信息之间的多个关联;以及
基于比对结果来依次检测所述多个字符代码中的每个字符代码。
7.根据权利要求6所述的字符识别方法,其中,所述比对包括:
计算没有被决定为用于形成字符的所述笔画集与包含在所述字典数据中的多个参考笔画之间的相似度,以获取与具有最大相似度的参考笔画相关联的字符代码;以及
当在当前时间处的最大相似度小于或等于在先前时间处的最大相似度并且所述在先前时间处的最大相似度等于或大于阈值时,针对在没有被决定为用于形成字符的所述笔画集中的直到所述先前时间为止所输入的笔画集,决定在所述先前时间处获取的字符代码。
8.根据权利要求7所述的字符识别方法,其中,所述比对包括:
当在接收到所述笔画的输入之后的限制时间内没有开始下一笔画的输入时,通过针对没有被决定为用于形成字符的所述笔画集决定最后获取的字符代码来检测所述多个字符代码中的最后字符代码。
9.根据权利要求1所述的字符识别方法,其中,所述第二信息为由所述计算机预先保持的字体的信息或基于所述字体的信息而准备的信息。
10.一种信息处理装置,包括:
存储单元,所述存储单元被配置成存储其中字符的字符代码和图像数据彼此相关联的第一信息;以及
操作单元,
其中,所述操作单元被配置成:
检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第二信息,并且检测与所述多个字符相关联的多个字符代码;
通过参考所述第一信息来获取与所述多个字符代码相关联的多个第一图像数据;
通过基于所述第二信息对所述多个第一图像数据进行组合来生成第二图像数据;以及
通过参考所述第一信息来输出与所述第二图像数据相关联的字符的图像数据或与所述第二图像数据相关联的字符代码。
CN201410195310.3A 2013-05-16 2014-05-09 信息处理装置和字符识别方法 Expired - Fee Related CN104166474B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013104134A JP6229303B2 (ja) 2013-05-16 2013-05-16 プログラム、情報処理装置および文字認識方法
JP2013-104134 2013-05-16

Publications (2)

Publication Number Publication Date
CN104166474A true CN104166474A (zh) 2014-11-26
CN104166474B CN104166474B (zh) 2017-06-23

Family

ID=51895401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410195310.3A Expired - Fee Related CN104166474B (zh) 2013-05-16 2014-05-09 信息处理装置和字符识别方法

Country Status (4)

Country Link
US (1) US9298365B2 (zh)
JP (1) JP6229303B2 (zh)
KR (1) KR101588520B1 (zh)
CN (1) CN104166474B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886278A (zh) * 2012-12-20 2014-06-25 富士施乐株式会社 手写信息处理设备和手写信息处理方法
CN104635926A (zh) * 2015-01-22 2015-05-20 百度在线网络技术(北京)有限公司 一种用于在计算机设备中收录信息的方法和装置
CN106469132A (zh) * 2016-08-31 2017-03-01 深圳天珑无线科技有限公司 数据处理的方法及装置
CN111046684A (zh) * 2018-10-15 2020-04-21 富士通株式会社 代码信息读取装置和代码信息读取方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD705787S1 (en) * 2012-06-13 2014-05-27 Microsoft Corporation Display screen with animated graphical user interface
US9495620B2 (en) 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
US20140361983A1 (en) * 2013-06-09 2014-12-11 Apple Inc. Real-time stroke-order and stroke-direction independent handwriting recognition
US9898187B2 (en) 2013-06-09 2018-02-20 Apple Inc. Managing real-time handwriting recognition
WO2015141260A1 (ja) * 2014-03-17 2015-09-24 株式会社河合楽器製作所 手書き音楽記号認識装置およびプログラム
KR20160062565A (ko) * 2014-11-25 2016-06-02 삼성전자주식회사 디바이스 및 디바이스의 필기 컨텐트 제공 방법
DK179329B1 (en) 2016-06-12 2018-05-07 Apple Inc Handwriting keyboard for monitors
KR102257719B1 (ko) 2018-11-21 2021-05-28 오세호 작성프로그램 및 이를 탑재한 문자 입력 장치
US10748031B1 (en) 2019-05-22 2020-08-18 Read-Ink Corporation Handwriting recognition systems and methods
US11194467B2 (en) 2019-06-01 2021-12-07 Apple Inc. Keyboard management user interfaces
WO2022246834A1 (zh) * 2021-05-28 2022-12-01 京东方科技集团股份有限公司 一种交互方法、电子设备及计算机存储介质
KR20230118429A (ko) * 2022-02-04 2023-08-11 삼성전자주식회사 사용자 입력에 대한 인식 성능 개선 방법 및 전자 장치

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02105983A (ja) * 1988-10-14 1990-04-18 Canon Inc 文字認識装置
JP2989072B2 (ja) * 1992-06-24 1999-12-13 シャープ株式会社 手書き文字入力装置
JPH07121660A (ja) 1993-10-25 1995-05-12 Hitachi Ltd 手書き文字認識装置
JPH07210629A (ja) * 1994-01-13 1995-08-11 Hitachi Ltd 文字認識方式
JPH08320866A (ja) * 1995-05-24 1996-12-03 Toshiba Corp 文書作成装置および文書作成方法
JPH1055409A (ja) * 1996-08-08 1998-02-24 Sharp Corp 手書き入力情報処理装置
JPH10289290A (ja) * 1997-04-11 1998-10-27 Hitachi Ltd 情報処理装置
JPH11134437A (ja) 1997-10-31 1999-05-21 Sharp Corp 手書き文字認識装置
CN1253781C (zh) * 2004-01-20 2006-04-26 华南理工大学 汉字电子化中的拼部组字方法
CN100585623C (zh) * 2007-03-30 2010-01-27 无敌科技(西安)有限公司 一种手写输入字符辨识方法及系统
JP5123588B2 (ja) * 2007-07-17 2013-01-23 キヤノン株式会社 表示制御装置および表示制御方法
WO2011024282A1 (ja) * 2009-08-27 2011-03-03 株式会社 東芝 情報検索装置
JP5505106B2 (ja) 2010-06-11 2014-05-28 富士通株式会社 手書き文字分離装置、手書き文字分離方法及び手書き文字分離プログラム
CN103186511B (zh) * 2011-12-31 2017-03-08 北京大学 汉字造字方法和设备、构造字体库的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886278A (zh) * 2012-12-20 2014-06-25 富士施乐株式会社 手写信息处理设备和手写信息处理方法
CN103886278B (zh) * 2012-12-20 2018-09-28 富士施乐株式会社 手写信息处理设备和手写信息处理方法
CN104635926A (zh) * 2015-01-22 2015-05-20 百度在线网络技术(北京)有限公司 一种用于在计算机设备中收录信息的方法和装置
CN104635926B (zh) * 2015-01-22 2017-09-29 百度在线网络技术(北京)有限公司 一种用于在计算机设备中收录信息的方法和装置
CN106469132A (zh) * 2016-08-31 2017-03-01 深圳天珑无线科技有限公司 数据处理的方法及装置
CN111046684A (zh) * 2018-10-15 2020-04-21 富士通株式会社 代码信息读取装置和代码信息读取方法

Also Published As

Publication number Publication date
CN104166474B (zh) 2017-06-23
US20140340333A1 (en) 2014-11-20
KR101588520B1 (ko) 2016-01-25
JP2014225135A (ja) 2014-12-04
KR20140135612A (ko) 2014-11-26
JP6229303B2 (ja) 2017-11-15
US9298365B2 (en) 2016-03-29

Similar Documents

Publication Publication Date Title
CN104166474B (zh) 信息处理装置和字符识别方法
US10614265B2 (en) Apparatus, method, and computer program product for correcting speech recognition error
JP6464504B6 (ja) 電子機器、処理方法およびプログラム
JP5270027B1 (ja) 情報処理装置および手書き文書検索方法
JP5832980B2 (ja) 手書き入力支援装置、方法およびプログラム
JP5694234B2 (ja) 電子機器、手書き文書表示方法、及び表示プログラム
JP5294818B2 (ja) 情報処理装置及び情報処理方法
JP2021043478A (ja) 情報処理装置、その制御方法及びプログラム
JP6275840B2 (ja) 手書き文字の識別方法
EP2806336A1 (en) Text prediction in a text input associated with an image
JP2014106881A (ja) 情報処理装置、情報処理方法及びプログラム
JP2007265171A (ja) 入力装置およびその方法
US9384304B2 (en) Document search apparatus, document search method, and program product
US9342739B2 (en) Character recognition apparatus, non-transitory computer readable medium, and character recognition method
CN104216940B (zh) 检索设备和检索方法
JP2020095374A (ja) 文字認識システム、文字認識装置、プログラム及び文字認識方法
JP2011237993A (ja) 情報入力装置及び情報入力プログラム
JP2017062584A (ja) 電子機器及び方法
JP2013239203A (ja) 電子機器、方法、及びプログラム
JPWO2014174665A1 (ja) システムおよび筆跡検索方法
JPWO2016031016A1 (ja) 電子機器、方法及びプログラム
JP6562542B2 (ja) 文字列入力装置
JPH1185898A (ja) 文字認識装置、文字認識方法及び文字認識プログラムを記録した記録媒体
JPH1115919A (ja) 文字認識装置、文字認識方法及び文字を認識するためのプログラムを記録した媒体
JP2003308317A (ja) 文字列変換方法および文字認識方法および文字認識装置および文字認識プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170623

CF01 Termination of patent right due to non-payment of annual fee