[go: up one dir, main page]

CN1848109A - 用于编辑光学字符识别结果的方法和系统 - Google Patents

用于编辑光学字符识别结果的方法和系统 Download PDF

Info

Publication number
CN1848109A
CN1848109A CN 200510064987 CN200510064987A CN1848109A CN 1848109 A CN1848109 A CN 1848109A CN 200510064987 CN200510064987 CN 200510064987 CN 200510064987 A CN200510064987 A CN 200510064987A CN 1848109 A CN1848109 A CN 1848109A
Authority
CN
China
Prior art keywords
display screen
document image
text
ocr
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510064987
Other languages
English (en)
Inventor
镇立新
罗希平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Priority to CN 200510064987 priority Critical patent/CN1848109A/zh
Publication of CN1848109A publication Critical patent/CN1848109A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

用于在显示屏(100)上显示文件图像(110)和光学字符识别(OCR)结果的方法和系统对于编辑OCR结果是有用的。该方法包括在显示屏(100)的第一部分(105)显示包括指示一个文本区域(115)的文件图像(110)。然后在显示屏(100)的第二部分(120)显示能够由装置的用户编辑的文本信息(125)。屏幕(100)的第一部分(105)上的文件图像(110)和屏幕(100)的第二部分(120)上的文本信息(125)同时显示,并且文本信息(125)从对文件图像(110)的至少一个文本区域(115)的OCR分析得到。

Description

用于编辑光学字符识别结果的方法和系统
技术领域
本发明总的来说(但非排他地)涉及在手持电子装置中编辑光学字符识别(OCR)结果,尤其涉及用于显示可由电子装置的用户编辑的OCR结果的方法和系统。
背景技术
光学字符识别(OCR)可以被定义为将文本图像数据转换为例如ASCII的可由文字处理应用程序读取的字符代码格式。在原始文本图像数据中,文本字符由各个像素按照与其他类型的图像数据(例如图画或线条)相同的方式构成。在转换成字符代码格式后,文本字符的原始图像常常不再可用于帮助编辑和校正转换结果中的错误。因此OCR处理需要各字符的相当高质量的图像,以便将图像转换成特定的字符代码。然而,高质量图像往往是很大的、高分辨率的图像。处理高分辨率图像通常需要大量的存储和处理器资源,并且可能大大增加执行字符识别所需的时间。
对于内嵌在手持电子装置中的图像分析引擎来说,处理高分辨率图像可能尤其成问题。许多手持装置,例如移动电话、个人数字助理(PDA)和数码相机,或这些装置的组合,都包括用于识别图像中的文本的OCR部件。例如,移动电话可以包括数字摄像头,它使得用户能够捕获名片的图像,分析该图像以识别图像中的文本,然后将相关的名字和地址自动存储在电话的联系文件中。但是移动电话的有限的存储和处理器资源可能导致从名片识别名字和地址的OCR处理含有大量错误。另外,例如名片的文件经常将例如名字、地址和电话号码字段等标准字段以不同的顺序来布置或布置在名片上不同的位置,这也可能导致OCR错误,需要通过编辑处理来校正。
存在小型文本编辑器,用于校正手持电子装置的OCR结果中的错误;然而,这种现有技术编辑器常常很难用,因为它们需要在小键盘上键入各个字符。而且,这种编辑器在执行OCR错误校正时通常需要用户参考原始文件。这常常是很不方便的,因为当用户试图编辑OCR结果时很可能忘记将名片放在了什么地方并且经常找不到。
发明内容
根据本发明的一个方面,本发明是一种用于在显示屏上显示能够由电子装置的用户编辑的光学字符识别(OCR)结果的方法。该方法包括:在显示屏的第一部分上显示包括至少一个文本区域的文件图像。然后在显示屏的第二部分上显示能够由装置的用户编辑的文本信息。在屏幕的第一部分上的文件图像和在屏幕的第二部分上的文本信息同时显示,并且所述文本信息从对所述文件图像的至少一个文本区域的OCR分析得到。由于文件图像在编辑过程中再现,因此不需要用户使用诸如名片的原始硬拷贝文件。实际上,对照文件图像的文本区域,可以容易地检查OCR处理的结果。
根据本发明的另一方面,在如上所述同时显示文件图像和文本信息之后,可以选择所述文件图像的一个文本区域。然后文件图像的选择文本区域被复制和粘贴到显示屏的第一部分。然后使用OCR引擎对文件图像的选择文本区域进行处理以产生编辑的文本输出。最后,编辑的文本输出在显示屏的第一部分中显示。可以在屏幕的第一和第二部分中同时显示的文件图像和文本信息之间使用方便的拖放程序操作来对从OCR处理得到的文本信息进行校正。
根据本发明的再一方面,本发明是一种用于显示能够由用户编辑的光学字符识别(OCR)结果的系统。该系统包括电子装置的显示屏。在显示屏的第一部分显示包括至少一个文本区域的文件图像,并且与显示屏的第一部分上的文件图像的显示同时,在显示屏的第二部分上显示能够由装置的用户编辑的文本信息。所述文本信息从对所述文件图像的至少一个文本区域的OCR分析得到。
附图说明
为使本发明容易理解,并产生实际效果,将根据附图对示出的示范实施例进行说明,其中相同的参考数字指的是相同的元件,其中:
图1是示出根据本发明实施例的手持电子装置的显示屏的第一实施例的示意图;
图2是示出根据本发明实施例的手持电子装置的显示屏的第二实施例的示意图;
图3是示出根据本发明实施例的手持电子装置的显示屏的第三实施例的示意图;
图4是示出根据本发明实施例的手持电子装置的显示屏的第四实施例的示意图;
图5是示出根据本发明实施例的手持电子装置的显示屏的第五实施例的示意图;
图6是示出根据本发明实施例的手持电子装置的显示屏的第六实施例的示意图;
图7是示出根据本发明实施例的方法的流程图。
具体实施方式
参考图1,示出根据本发明实施例的手持电子装置的显示屏100的示意图。屏幕100包括显示文件图像110的第一部分105,文件图像110例如是名片的局部图像,包括至少一个文本区域115。屏幕100进一步包括显示文本信息125的第二部分120。如图1所示,在屏幕100的第一部分105上的文件图像110和在屏幕100的第二部分120上的文本信息同时显示。文本信息125通过对文件图像110的至少一个文本区域115的光学字符识别(OCR)分析来得到。因此本发明的分割屏幕100通过显示能够用于检查OCR结果准确性的文件图像110使得能够在手持装置上更有效和更方便地编辑OCR结果。
根据本发明的一个实施例,例如人名的单行文本信息125通常从单行文本区域115得到。已通过OCR分析识别的文件图像110的文本区域115可在文件图像110上用可见标记来表示。例如,图1所示的文本区域115用人名周围的黑框来表示。在编辑文件图像110的第二部分120中的OCR结果时,可见标记可能是有用的。例如,如果可见标记指示在文件图像110中只有文本行的一部分通过OCR处理被识别,或者如果由不存在可见标记而指示OCR处理完全遗漏了文件图像110中的一行文本,那么用户可以采取步骤来编辑和校正显示屏100的第二部分120中的文本信息125。可见标记可以是各种形式,例如形成围绕文本区域115的矩形的线条(如图1至4所示)。其他标记可以包括着重点以及文本区域115的颜色改变。例如,在彩色显示屏100上,在屏幕100的第一部分105中的背景文件图像110可以呈现为黑白,而已通过OCR处理识别的文本区域115可以呈现为红色。
图2是示出与图1所示相同的显示屏100的示意图;不过,在屏幕100的第一部分105中,文件图像110显示移至左侧。根据本发明的一个实施例,该特征使得本发明的用户能够相对于手持装置的小屏幕100在任意方向移动文件图像110,以便查看较大图像的多个片段。
图3和图4显示了本发明实施例的另一个特征,其中显示屏100的第一和第二部分105、120可相对于彼此调整。该特征也增加了在小显示屏100上编辑OCR结果的容易和便利,因为用户被给予了很大的灵活性来在屏幕100上仅显示当前被编辑的文件图像110的那些方面和相关的OCR结果。
本发明因此可用于各种类型的具有小显示屏100的电子装置。这种装置包括例如移动电话、个人数字助理、数码相机和一些膝上型电脑。使用这种装置编辑文本文件有时可能是一个笨拙的过程,因为这些装置通常没有连接至全尺寸键盘或鼠标。因此编辑常常需要使用小键盘或触摸屏部件,它们用手指或触笔来操作。本发明能够有助于最小化对键盘或触摸屏输入的数量,这些输入是在这种装置上编辑OCR结果所需要的,因此节省了装置的用户的时间和精力。
例如,本发明的实施例能够包括在结合有数字摄像头的移动电话中。该电话的用户可能例如收到一张新名片,并试图将名片上的信息输入到他或她的电话上的存储器中存储的个人电子地址簿中。根据本发明,用户可以简单地使用该电话对该名片进行照相,然后启动电话上的OCR处理来识别得到的图像110的文本区域115。由于文件图像110包括原始名片的完整图片,因此该用户不需要保存原始名片。该用户然后可以根据本发明在他或她方便的时候通过仅参考存储在电话上的文件图像110来编辑OCR结果。
除了能够在编辑OCR结果时参考原始文件的文件图像110以外,本发明的实施例还使得用户能够从文件图像110将文本区域复制到在显示屏100的第二部分120中显示的文本信息125的行之中。该能力能够显著降低编辑所需的时间。例如,如果屏幕100的第二部分120中的文本信息125不正确,或者如果文本信息125从屏幕100的第二部分120中完全遗漏了,那么用户可以选择从屏幕100的第一部分105选择并复制有关的文本区域,并将它粘贴到屏幕100的第二部分120的适当位置。这种复制和粘贴过程可以使用本领域技术人员熟悉的“拖放”程序来执行。然后电子装置使用OCR引擎处理选择的文本区域115,以产生文本输出,作为新文本信息125在屏幕100的第二部分120中显示。因此拖放处理促使该装置使用OCR对文件图像110的不正确的已分析过的文本区域115进行重新分析,或者在初始的OCR处理期间文本区域115被遗漏时可以促使该装置对文本区域115进行第一次分析。
本发明可以使用适于减小尺寸的电子装置的各种类型的OCR处理和系统。如本领域技术人员已知的,这种OCR系统可以包括矩阵匹配、特征提取和其他类型的OCR技术。
参考图5,提供根据本发明实施例的电子装置的显示屏100的另一个示意图。这里屏幕100仅包括图1至图4所示的屏幕100的第二部分120。因此,在用户已经通过回顾显示屏100的第一部分105中的文件图像110检查了OCR结果之后,用户能够切换到第二部分120的全屏幕形式,只显示文本信息125。下拉菜单500还可用于增加编辑诸如名片标题等标准化文本的便利。下拉菜单500可以包括默认字段名称,例如在文件图像110时名片时的“名字”、“单位”、“头衔”、“地址”、“电话号码”、“传真号码”、“电子邮件”和“网址”或其他适于特定类型文件的字段。这种下拉菜单500允许用户以最少的动作来正确标记未曾正确标记的文本信息125。
参考图6,提供根据本发明实施例的电子装置的显示屏100的另一个示意图。这里屏幕100又是仅包括图1至图4所示的屏幕100的第二部分120。还示出了触摸屏式小型键盘600,它能够被用于编辑文本信息125,包括在扩展文本框605中的文本,扩展文本框可用于显示可作为文本信息125显示的文本的概要版本之外的附加文本。
参考图7,示出用于在显示屏100上显示能够由电子装置的用户编辑的OCR结果的通用方法700的流程图。首先,在步骤705,在显示屏100的第一部分105上显示包括至少一个文本区域115的文件图像110。文件图像110可以从连接到电子装置的任何来源(例如摄像机)接收。在步骤710,在显示屏100的第二部分120上显示能够由装置的用户编辑的文本信息125。显示屏100的第一和第二部分105、120同时显示在屏幕100上,并且从对文件图像110的至少一个文本区域115的OCR分析得到文本信息125。
接下来,在步骤715,由电子装置的用户选择文件图像110的文本区域115。在步骤720,文件图像110的选择文本区域115被复制和粘贴到显示屏100的第一部分105。在步骤725,使用OCR引擎对文件图像110的选择文本区域115进行处理以产生文本输出。最后,在步骤730,文本输出作为文本信息125在显示屏100的第二部分120中显示。
总而言之,本发明是用于在电子装置的显示屏100上以允许电子装置的用户方便和快捷地编辑结果的方式来显示OCR结果的方法和系统。由于文件图像110在编辑过程中再现,因此不需要用户使用原始硬拷贝文件,例如名片。实际上,可以对照文件图像110的文本区域115来容易地检查OCR处理的结果。而且,可以在屏幕100的第一和第二部分105、120中同时显示的文件图像110和文本信息125之间使用方便的拖放程序操作来对从OCR处理得到的文本信息125进行校正。包括在本发明的一些实施例中的其他特征允许文件图像110相对于显示屏100移动,以便能够在小屏幕100上分别观看文件的多个片段,并且还包括下拉菜单500以简化编辑过程。
上面的详细描述仅提供了示范实施例,并且不是为了限制本发明的范围、应用或配置。相反,示范实施例的详细描述为本领域技术人员提供了用于实施本发明示范实施例的开放说明。应该理解,在元件和步骤的功能和配置方面可以作出各种改变,而不脱离在所附的权利要求中提出的本发明的要旨和范围。

Claims (16)

1.一种用于在显示屏上显示能够由电子装置的用户编辑的光学字符识别(OCR)结果的方法,该方法包括以下步骤:
在显示屏的第一部分上显示包括至少一个文本区域的文件图像;以及
在显示屏的第二部分上显示能够由所述装置的用户编辑的文本信息,其中,在屏幕的第一部分上的文件图像和在屏幕的第二部分上的文本信息同时显示,并且从对所述文件图像的至少一个文本区域的OCR分析得到所述文本信息。
2.如权利要求1所述的方法,进一步包括以下步骤:
在显示所述文件图像和文本信息之后选择所述文件图像的文本区域;
复制所述文件图像的选择文本区域并将它粘贴到显示屏的第一部分;
使用OCR引擎处理所述文件图像的选择文本区域以产生编辑的文本输出;
在显示屏的第一部分中显示所述编辑的文本输出。
3.如权利要求1所述的方法,进一步包括随后的步骤:
使用OCR引擎在显示屏的第二部分中处理选择的文本区域,以产生编辑的文本输出,然后在显示屏的第一部分中显示该编辑的文本输出。
4.如权利要求1所述的方法,其中,通过OCR分析已经识别的文件图像的文本区域被在所述文件图像上的可见标记指示。
5.如权利要求4所述的方法,其中,所述可见标记是从以下组中选择的:线、着重点、文本区域的颜色改变。
6.如权利要求1所述的方法,其中,所述文件图像表示名片,并且显示屏的第二部分包括能够由所述装置的用户选择和改变的默认字段名字。
7.如权利要求6所述的方法,其中,所述默认字段名字中的至少一些是从以下组中选择的:“名字”、“单位”、“头衔”、“地址”、“电话号码”、“传真号码”、“电子邮件”和“网址”。
8.如权利要求1所述的方法,其中,所述文件图像表示一个文件的片段,并且所述图像相对于显示屏是可移动的,以使用户能够观看表示文件的其他片段的其他图像。
9.如权利要求2所述的方法,其中,所述复制文件图像的选择文本区域并将它粘贴到显示屏的第一部分的步骤使用“拖放”程序来执行。
10.一种用于显示能够由用户编辑的光学字符识别(OCR)结果的系统,其包括:
电子装置的显示屏;
在显示屏的第一部分显示的包括至少一个文本区域的文件图像;和
在显示屏的第二部分上与显示屏的第一部分上的文件图像的显示同时显示的、能够由所述装置的用户编辑的文本信息,其中,所述文本信息从对所述文件图像的至少一个文本区域的OCR分析得到。
11.如权利要求10所述的系统,其中,所述电子装置从包括以下组中选择:移动电话、个人数字助理、数码相机和膝上型电脑。
12.如权利要求10所述的系统,其中,通过OCR分析已经识别的文件图像的文本区域被在所述文件图像上的可见标记指示。
13.如权利要求12所述的系统,其中,所述可见标记是从以下组中选择的:线、着重点、文本区域的颜色改变。
14.如权利要求10所述的系统,其中,所述文件图像表示名片,并且显示屏的第二部分包括能够由所述装置的用户选择和改变的默认字段名字。
15.如权利要求14所述的方法,其中,所述默认字段名字中的至少一些是从以下组中选择的:“名字”、“单位”、“头衔”、“地址”、“电话号码”、“传真号码”、“电子邮件”和“网址”。
16.如权利要求10所述的方法,其中,所述文件图像表示一个文件的片段,并且所述图像相对于显示屏是可移动的,以使用户能够观看表示文件的其他片段的其他图像。
CN 200510064987 2005-04-13 2005-04-13 用于编辑光学字符识别结果的方法和系统 Pending CN1848109A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510064987 CN1848109A (zh) 2005-04-13 2005-04-13 用于编辑光学字符识别结果的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510064987 CN1848109A (zh) 2005-04-13 2005-04-13 用于编辑光学字符识别结果的方法和系统

Publications (1)

Publication Number Publication Date
CN1848109A true CN1848109A (zh) 2006-10-18

Family

ID=37077674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510064987 Pending CN1848109A (zh) 2005-04-13 2005-04-13 用于编辑光学字符识别结果的方法和系统

Country Status (1)

Country Link
CN (1) CN1848109A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102474902A (zh) * 2009-10-05 2012-05-23 索尼公司 移动设备可视输入系统和方法
CN102547179A (zh) * 2011-12-29 2012-07-04 惠州Tcl移动通信有限公司 一种手持设备及与电视同步显示的方法
US8503784B2 (en) 2007-10-31 2013-08-06 Fujitsu Limited Image recognition apparatus, image recognition method, and storage medium recording image recognition program
CN104134057A (zh) * 2009-01-28 2014-11-05 谷歌公司 来自出版物的经ocr处理的文本和对应图像在客户端设备上的选择性显示
CN104636322A (zh) * 2015-03-03 2015-05-20 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN101833545B (zh) * 2009-03-11 2015-09-09 汉王科技股份有限公司 数字资源加工过程中的数据标引方法
CN110598186A (zh) * 2019-07-31 2019-12-20 浙江口碑网络技术有限公司 图像识别的辅助处理方法、装置及系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503784B2 (en) 2007-10-31 2013-08-06 Fujitsu Limited Image recognition apparatus, image recognition method, and storage medium recording image recognition program
CN104134057A (zh) * 2009-01-28 2014-11-05 谷歌公司 来自出版物的经ocr处理的文本和对应图像在客户端设备上的选择性显示
CN104134057B (zh) * 2009-01-28 2018-02-13 谷歌公司 来自出版物的经ocr处理的文本和对应图像在客户端设备上的选择性显示
CN101833545B (zh) * 2009-03-11 2015-09-09 汉王科技股份有限公司 数字资源加工过程中的数据标引方法
CN102474902A (zh) * 2009-10-05 2012-05-23 索尼公司 移动设备可视输入系统和方法
CN102547179A (zh) * 2011-12-29 2012-07-04 惠州Tcl移动通信有限公司 一种手持设备及与电视同步显示的方法
US8988604B2 (en) 2011-12-29 2015-03-24 Huizhou TCL Mobile Communications Co., Ltd. Handheld device and method for displaying synchronously with TV set
US9292901B2 (en) 2011-12-29 2016-03-22 Huizhou Tcl Mobile Communication Co., Ltd Handheld device and method for displaying synchronously with TV set
CN104636322A (zh) * 2015-03-03 2015-05-20 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN104636322B (zh) * 2015-03-03 2018-01-23 广东欧珀移动通信有限公司 一种文本复制的方法及装置
CN110598186A (zh) * 2019-07-31 2019-12-20 浙江口碑网络技术有限公司 图像识别的辅助处理方法、装置及系统
WO2021017458A1 (zh) * 2019-07-31 2021-02-04 浙江口碑网络技术有限公司 图像识别的辅助处理方法、装置及系统

Similar Documents

Publication Publication Date Title
US7194701B2 (en) Video thumbnail
US6332039B1 (en) Structured document preparation apparatus and structured document preparation method
JP4700423B2 (ja) 形状を使用する共通チャーティング
CN1278533C (zh) 可自动录入文字、图像的手机及其录入与处理方法
JP5361174B2 (ja) 表示制御装置、表示制御方法、およびプログラム
JP2013502861A (ja) 連絡先情報入力方法及びシステム
JP2008234658A (ja) テキスト検索エンジンにより検索されたページ番号付き文書全体を通してのコースツーファイン・ナビゲーション
JP2004001315A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
US20100302429A1 (en) Image processing apparatus and control method for image processing apparatus
CN1848109A (zh) 用于编辑光学字符识别结果的方法和系统
US20080231869A1 (en) Method and apparatus for displaying document image, and computer program product
US20080018772A1 (en) Input apparatus for image
CN100487702C (zh) 图像处理设备
US7336319B2 (en) Digital camera apparatus having a recognizing function
US20060044582A1 (en) Interface device for coupling image-processing modules
JP2006252526A (ja) 文書ファイル管理装置、文書ファイル管理方法、および文書ファイル管理プログラム
JP3773662B2 (ja) データ管理装置および該装置の利用方法
CN107885860A (zh) 一种在媒体文件上标注和展示的方法、存储介质和电子设备
CN113835598A (zh) 信息获取方法、装置及电子设备
KR20060007852A (ko) 이동통신 단말기의 효율적 이미지 검색 방법
KR20040083178A (ko) 복수 이미지 배치방법 및 장치
JP3214378B2 (ja) 画像処理装置及び画像処理方法
JPH08153104A (ja) ハイパーメディアシステムおよびハイパーメディア文書作成・編集方法
JP4712629B2 (ja) 設備仕様入力装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication