[go: up one dir, main page]

CN104767926A - 自动对焦的方法及装置 - Google Patents

自动对焦的方法及装置 Download PDF

Info

Publication number
CN104767926A
CN104767926A CN201410006852.1A CN201410006852A CN104767926A CN 104767926 A CN104767926 A CN 104767926A CN 201410006852 A CN201410006852 A CN 201410006852A CN 104767926 A CN104767926 A CN 104767926A
Authority
CN
China
Prior art keywords
text
region
focusing
lens
focus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410006852.1A
Other languages
English (en)
Inventor
陈雪峰
郭山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Original Assignee
Beijing Samsung Telecommunications Technology Research Co Ltd
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Samsung Telecommunications Technology Research Co Ltd, Samsung Electronics Co Ltd filed Critical Beijing Samsung Telecommunications Technology Research Co Ltd
Priority to CN201410006852.1A priority Critical patent/CN104767926A/zh
Publication of CN104767926A publication Critical patent/CN104767926A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Automatic Focus Adjustment (AREA)

Abstract

本发明实施例提供了一种自动对焦的方法,包括如下步骤:检测图像范围中的文本,分析并确定文本所在的区域;获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置。本发明实施例还提供了一种自动对焦的装置,包括:检测模块、对焦模块和定位模块。本发明所提供的方法及装置,实现了对文本图像的有效对焦,进而提高了从图像中获取文本内容的准确率和速率。此外,基于文本的对焦模式,能够提高拍摄文本的速度和便捷性,并可解决单文本拍摄和多文本拍摄的自动对焦问题,能够有效减少人机交互次数,提高用户使用的便捷性。

Description

自动对焦的方法及装置
技术领域
本发明涉及光学聚焦技术领域,具体而言,本发明涉及文本图像自动对焦的方法及装置。
背景技术
基于图像的图像内容获取方法中大都需要采用自动调焦技术。用于获取图像内容的自动对焦技术,是指根据被拍摄物体的远近,自动调整镜头中对焦镜群的位置,使物体清晰的成像在成像平面上,从而进一步获取成像平面上的图像内容。自动对焦技术如今已被广泛应用在相机、摄像机等图像获取装置上,相对于传统对焦技术,自动对焦技术具有简单、快捷、方便等优点。
目前,用于获取图像内容的自动对焦技术,按照其对焦时关注的区域可以分为全局对焦技术和局部对焦技术。
一方面,全局对焦技术是目前主要的一种对焦技术,其利用图像的整体信息进行对焦。目前,基于全局信息的自动对焦技术,大多是通过调节自动变焦镜头上的微调装置,使自动变焦镜头在不同的相对位置移动,并根据被测物体在CCD上成像的对比度计算AF评估值,然后将镜头在每个相对位置的AF评估值与镜头的相对位置,同时送入微型计算机进行分析,微型计算机根据这些值绘成AF评估曲线,将AF评估曲线顶点时的镜头相对位置定义为最佳焦点相对应的镜头相对位置,再将其参数送回自动变焦镜头上的微调装置,以完成自动对焦过程。
另一方面,局部感兴趣区域对焦技术则是根据拍照过程中用户所关注的重点区域进行对焦。现在应用比较广泛的是基于人脸的自动对焦技术。人脸对焦技术是指,在自动对焦过程中,首先以人脸检测技术找出被摄景物中的人脸,定位出人脸区块,再以人脸区块作为对焦的物体并进行测距。
再一方面,现有技术还提出了文本拍摄的方法,但不过是采用后处理的方式对拍摄后的文本图像进行处理,提高其清晰度,而不是在拍摄时进行调焦。
由上可见,对于目前已有的基于图像的图像内容获取方法而言,所采用的自动对焦技术主要是针对全局图像和局部人脸对图像进行自动变焦。随着图像获取装置的普及,图片拍摄应用范围越来越广泛,扩展了许多新的应用,尤其是文本拍摄。例如,文本拍摄的应用范围可以包括图书拍摄、名片拍摄、车牌拍摄或者海报拍摄等。这些获取的图像内容直接作为图片信息进行保存,或者通过文本识别软件将图片信息转换成对应的文本信息,以便进行后续编辑和保存。但是,对于已有的基于图像的图像内容获取方法而言,无论是针对图像的全局对焦技术,还是针对人脸识别的局部对焦技术,已有的自动对焦技术都不是以文本作为主要参考对象进行对焦。因而,现有的基于图像的图像内容获取方法,在处理文本拍摄过程中存在一些共同的局限性,或者称为共同缺陷,即使全图的图像对比度达到一个比较好的效果,但是用户所需的文本区域可能却并不清晰。
因此,有必要提出有效的文本图像的对焦方案,从而提高从图像中获取文本内容的准确率和速率。
发明内容
本发明的目的旨在至少解决上述技术缺陷之一,特别是提供一种自动对焦的方法及装置,用于通过获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置,以解决现有技术中无法实现有效的文本图像的对焦方案,从图像中获取文本内容的准确率低和速率低的问题。
为达到上述目的,本发明实施例一方面提供了一种自动对焦的方法,包括如下步骤:
检测图像范围中的文本,分析并确定文本所在的区域;
获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置;
根据所述区域的镜头对焦位置,确定所述图像范围中的文本的镜头对焦位置。
本发明实施例另一方面提供了一种对文本图像进行拍摄的方法,根据如上所述的自动对焦的方法对文本图像进行对焦并拍摄。
本发明实施例另一方面提供了一种自动对焦的装置,包括检测模块,对焦模块和定位模块,
所述检测模块,用于检测图像范围中的文本,分析并确定文本所在的区域;
所述对焦模块,用于获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置;
所述定位模块,用于根据所述区域的镜头对焦位置,确定所述图像范围中的文本的镜头对焦位置。
本发明实施例另一方面提供了一种拍摄设备,包括如上所述的自动对焦的装置,根据所述装置对文本图像进行对焦并拍摄。
本发明提供的实施例的有益效果包括:
在本发明提供的实施例中,通过检测图像范围中的文本,分析并确定文本所在的区域;获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置;从而实现了对文本图像的有效对焦,进而提高了从图像中获取文本内容的准确率和速率。本发明提出的上述方案,对现有系统的改动很小,不会影响系统的兼容性,而且实现简单、高效。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明自动对焦的方法一种实施例的流程图;
图2为本发明自动对焦的方法另一种实施例中的对文本所在的区域进行分析的流程图;
图3为本发明自动对焦的方法另一种实施例中的单区域的自动对焦流程图;
图4为本发明自动对焦的方法另一种实施例中的多区域自动对焦流程图;
图5为本发明自动对焦的装置一种实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(PersonalDigital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
为了实现本发明的目的,本发明实施例提出了一种自动对焦的方法,包括如下步骤:
检测图像范围中的文本,分析并确定文本所在的区域;
获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;
根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置。
在本发明的上述实施例中,通过检测图像范围中的文本,分析并确定文本所在的区域;获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置;从而实现了对文本图像的有效对焦,进而提高了从图像中获取文本内容的准确率和速率。
如图1所示,为本发明自动对焦的方法一种实施例的流程图,包括步骤S110至步骤S130,下面结合具体的实施例,对步骤S110至步骤S130进行展开说明。
S110:检测图像范围中的文本,分析并确定文本所在的区域。
作为本发明的实施例,分析并确定文本所在的区域,包括以下步骤:
判断图像范围中字符的大小,以及判断区域边界的字符和区域中心的字符的清晰度;
将图像范围中字符的大小一致的区域,以及区域边界的字符和区域中心的字符的清晰度一致的区域,划分为一个单区域。
具体而言,如图2所示,为本发明自动对焦的方法另一种实施例中的对文本所在的区域进行分析的流程图。
首先进行文本检测,对获取的文本的区域图像进行版面分析201,判断版面是否规整,根据不同的判断结果进行不同的处理。这里说的版面规整是指字符大小一致,且具有一致的字符清晰度。应当理解,本发明中的字符大小一致和字符清晰度一致,一致的含义是指相同,也就是不存在差异,或者是存在的差异较小,存在的差异在预定的门限值之内。例如,当字符之间的大小的差异在预定的门限值之内时,认为字符大小是一致的;当字符之间的清晰度的差异在预定的门限值之内时,认为字符清晰度是一致的。
这里判断版面规整的方法是,一方面,利用判断所获取的文本的区域内,字符大小的均匀程度是否一致。另一方面,判断所获取的文本的区域内,字符是否具有一致的清晰度;具体判断方法为:判断所获取的文本的区域内,边界部分的字符的清晰度和区域中心部分字符清晰度是否接近。具体地,分析并确定文本所在的区域,包括以下步骤:判断图像范围中字符的大小,以及判断区域边界的字符和区域中心的字符的清晰度;将图像范围中字符的大小一致的区域,以及区域边界的字符和区域中心的字符的清晰度一致的区域,划分为一个单区域。若上述分析结果显示:在所获取的文本的区域内,字符大小一致,且具有一致的清晰度,两者都符合,则将该文本的区域作为整体进行对焦,即单文本区域对焦。
在文本检测、版面分析的过程中,利用二值化信息或者边缘信息,可以分析得到字符的位置信息和高度信息,进而可以利用所获得的字符的位置信息和高度信息,对区域内字符大小是否一致进行判断。具体地,利用字符位置信息,在原彩色图像或灰度图像上,可以计算字符清晰度。这里可以采用对比度分析、直方图分析或者模糊度分析的方法,作为清晰度评价方法。
如果上述分析结果显示:在所获取的文本的区域内,字符大小不一致,即区域内字符大小差别较大,则将文本进行切分文本块202,也就是通过划分区域,使每一个文本块内字符大小一致;然后对划分出的不同的文本块,采用后面提到的多焦点技术进行对焦,即多文本区域对焦。
如果上述分析结果显示:在所获取的文本的区域内,字符不具有一致的清晰度,即在所获取的文本的区域内,边界区域和中心区域的字符清晰度差别较大,此时,则对所获取的文本的区域进行划分。如果文本排列的规则,则采用均匀网格进行网格切分203,如果文本在区域内排列的不规则,则依据文本块的位置和密度,采用非均匀网格对所获取的文本的区域进行划分。对区域划分出的不同的文本块,采用后面提到的多焦点技术进行对焦,即多文本区域对焦。
经过步骤S110的处理后,图像范围中的文本经过分析,文本将归属于一个或多个区域。其中,归属一个区域中的图像信息为字符大小和字符清晰度是一致的。
S120:获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置。
在步骤S120中,获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置,包括以下步骤:
获取处于单区域的多幅文本图像;
基于文本检测信息计算每一幅文本图像的质量,使用搜索算法搜索最优第一质量位置;
将最优第一质量位置确定为单区域的镜头对焦位置。
进一步而言,还包括:
确定最优第一质量位置的相邻区域;
以相邻区域上的点为焦点,基于识别和语义信息计算文本质量,利用搜索算法搜索最优第二质量位置;
将最优第二质量位置确定为单区域的镜头对焦位置。
如图3所示,为本发明自动对焦的方法另一种实施例中的单区域的自动对焦流程图,下面结合图3对本发明进行说明。
具体而言,如果只有一个文本区域,则通过调节自动变焦镜头上的微调装置,使自动变焦镜头在不同的相对位置移动,以获取不同相对位置的文本图像;对获取的多幅拍摄成像不同相对位置的文本图像,调用文本质量评估进行文本质量评估,具体地,步骤301基于文本检测信息计算文本图像质量,以得到文本质量评估结果。对输入的文本的区域图像,进行文本质量评估,具体质量评估过程为:利用计算检测文本的区域的字符数量,并计算在该检测文本的区域内字符与背景颜色的对比度;将上述字符数量以及字符与背景颜色的对比度等信息,作为评估当前文本图像质量的标准,并输出文本质量评估质量值。对所获取得不同相对位置的文本图像,采用上述不同位置的文本图像质量方法绘制相应的图像质量变化曲线图。步骤302使用搜索算法搜索最优第一质量位置,即搜索图像质量变化曲线的峰值位置所对应的镜头位置。检测是否搜索到最优质量点,若检测结果显示搜索到最优质量点,即最优第一质量位置时,则停止焦点位置搜索过程,并进行进一步的判断是否选择使用高精度对焦;若检测结果显示未搜索到最优质量点,即没找到最优第一质量位置时,则继续进入步骤303调整镜头位置,其后进入步骤304获取文本的区域图像;之后返回步骤301进行重复处理。
进一步地,判断是否选择使用高精度对焦。一方面,若判断结果显示不选择使用高精度对焦,则选择使用快速对焦,即将上述搜索到的最优质量点,即最优第一质量位置,作为最优焦点位置,并将镜头移动到该位置完成自动对焦,同时输出最优第一质量位置的信息。
另一方面,若判断结果显示选择使用高精度对焦,则选择使用高精度对焦;选择使用高精度对焦,需要进入步骤305计算二次搜索区域。这里采用在上述搜索到的最优质量点,即最优第一质量位置处,向前后两侧各取一段距离,从而形成高精度搜索区域。在该高精度搜索区域内,使用高精度文本质量评估通过二次搜索,进行文本质量评估。高精度文本质量评估在上述过程中,执行步骤306基于识别和语义信息计算文本质量,以得到文本质量评估结果。具体地,高精度文本质量评估是使用文本识别和语义技术,对文本区域内的文本进行识别,并根据语义技术,分析其识别结果的合理性,最终对其输出一个文本质量分值。在二次搜索中,可以重新得到一个文本图像质量变化曲线图,执行步骤307利用搜索算法搜索最优第二质量位置,即图像质量变化曲线的峰值位置所对应的镜头位置。如果最优质量位置尚未确定,则进入步骤308调整镜头位置,并执行步骤309获取文本的区域图像,其后继续进行步骤306的处理。检测是否搜索到最优质量点,若检测结果显示搜索到最优质量点,即最优第二质量位置时,则停止焦点位置搜索过程,并输出搜索到的最优质量点,即最优第二质量位置的信息。
显然,最优第一质量位置和最优第二质量位置可能相同,也可能不同。
S130:根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置。
作为本发明的实施例,确定图像范围中的文本的镜头对焦位置,包括:
图像范围中的文本的镜头对焦位置为一个或多个单区域镜头对焦位置。
具体而言,当图像范围中的文本就是一个整体区域,此时,图像范围中的文本的镜头对焦位置为区域的镜头对焦位置。
当图像范围中的文本被划分为多个区域时,此时,图像范围中的文本的镜头对焦位置为多个区域的镜头对焦位置,也就是输出多个焦点,如果需要对图像文字拍摄,就是对多个焦点进行拍摄,获取多个文本区域图像,可以对多张图像进行保存,也可以对多张图像利用图像融合技术,将其融合为一张最优图像。
进一步而言,当区域为两个以上的区域时,还可以将区域的镜头对焦位置进行合成,得到图像范围中的文本的镜头对焦位置。
作为本发明的实施例,图像范围中的文本的镜头对焦位置为多个单区域镜头对焦位置时,对多个焦点拟合出最优焦点平面,将焦点在最优焦点平面时的镜头的位置,作为图像范围中的文本的镜头对焦位置。
将所获取的多个最优焦点位置,分别采用两种不同的方式进行处理:
1)利用差值技术,对多个焦点获取最优焦点平面,使用焦平面的距离作为自动对焦结果,也就是对多个焦点使用拟合技术拟合出最优焦点平面,将焦点在该最优焦点平面时的镜头的位置,作为最终自动对焦焦点;
2)将多个焦点分别作为调焦焦点,进行拍摄,以获取多张图像,可以对多张图像进行保存。
如图4所示,为本发明自动对焦的方法另一种实施例中的多区域自动对焦流程图。
具体而言,如果是多文本区域,则采用多焦点文本拍摄技术进行拍摄。多焦点文本拍摄过程如下:
1)步骤401:
采用单文本区域对焦,获得每个文本区域的焦点信息。具体过程为:单独将每一个文本区域作为关注对象,采用前面描述的将该文本的区域作为整体进行对焦,即采用单文本区域对焦,获得每个文本区域的焦点信息,其中,文本区域的焦点信息包括每个文本区域的最优焦点位置及其文本区域的外边界分布范围。
2)判断是针对多幅文本图像进行拍摄,还是针对单幅文本图像进行拍摄。
3)步骤402:
如果是选择针对单幅文本图像进行拍摄,就是选择单焦点输出模式,则可以选择最小深度的焦点作为最终的自动对焦焦点,也可以采用融合焦点平面的方法,对多个焦点使用拟合技术拟合出最优焦点平面,将焦点在该最优焦点平面时的镜头的位置,作为最终自动对焦焦点,并输出该最优焦点位置的相应信息。
4)步骤403:
如果是选择针对多幅文本图像进行拍摄,就是选择多焦点输出模式,则对每个文本区域分别作为感兴趣区域,利用前面的单文本区域对焦技术输出多幅文本图像对应的焦点信息。
在本发明的上述实施例中,通过检测图像范围中的文本,分析并确定文本所在的区域;获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置;从而实现了对文本图像的有效对焦,进而提高了从图像中获取文本内容的准确率和速率。
进一步地,基于文本的对焦模式,可在拍摄过程中使得关注的文本区域获得最优的拍摄效果,从而能够有效增强文本的辨识性,或增加后续文本识别的准确性。此外,基于文本的对焦模式,能够提高拍摄文本的速度和便捷性,并可解决单文本拍摄和多文本拍摄的自动对焦问题,能够有效减少人机交互次数,提高用户使用的便捷性。
本发明实施例另一方面提供了一种对文本图像进行拍摄的方法,根据上述公开的自动对焦的方法对文本图像进行对焦,其后对文本图像进行拍摄,具体细节在此不再赘述。
图5为本发明自动对焦的装置一种实施例的结构示意图。如图5所示,本实施例自动对焦的装置500包括检测模块510,对焦模块520和定位模块530。
检测模块510,用于检测图像范围中的文本,分析并确定文本所在的区域。
具体而言,检测模块510用于分析并确定文本所在的区域,包括以下步骤:
判断图像范围中字符的大小,以及判断区域边界的字符和区域中心的字符的清晰度;
将图像范围中字符的大小一致的区域,以及区域边界的字符和区域中心的字符的清晰度一致的区域,划分为一个单区域。
对焦模块520,用于获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;
具体而言,对焦模块520用于获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置,包括以下步骤:
获取处于单区域的多幅文本图像;
基于文本检测信息计算每一幅文本图像的质量,使用搜索算法搜索最优第一质量位置;
将最优第一质量位置确定为单区域的镜头对焦位置。
进一步地,对焦模块520还用于确定单区域的镜头对焦位置,包括以下步骤:
确定最优第一质量位置的相邻区域;
以相邻区域上的点为焦点,基于识别和语义信息计算文本质量,利用搜索算法搜索最优第二质量位置;
将最优第二质量位置确定为单区域的镜头对焦位置。
定位模块530,用于根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置。具体而言,定位模块530用于确定图像范围中的文本的镜头对焦位置,包括:
图像范围中的文本的镜头对焦位置为一个或多个单区域镜头对焦位置。
进一步地,定位模块530用于对焦的图像范围中的文本的镜头对焦位置为多个单区域镜头对焦位置时,对多个焦点拟合出最优焦点平面,将焦点在最优焦点平面时的镜头的位置,作为图像范围中的文本的镜头对焦位置。
在本发明的上述实施例中,通过检测模块510检测图像范围中的文本,分析并确定文本所在的区域;对焦模块520获取处于区域的文本的多幅文本图像,确定区域的镜头对焦位置;定位模块530根据区域的镜头对焦位置,确定图像范围中的文本的镜头对焦位置;从而实现了对文本图像的有效对焦,进而提高了从图像中获取文本内容的准确率和速率。
进一步地,基于文本的对焦模式,可在拍摄过程中使得关注的文本区域获得最优的拍摄效果,从而能够有效增强文本的辨识性,或增加后续文本识别的准确性。此外,基于文本的对焦模式,能够提高拍摄文本的速度和便捷性,并可解决单文本拍摄和多文本拍摄的自动对焦问题,能够有效减少人机交互次数,提高用户使用的便捷性。
本发明实施例另一方面提供了一种拍摄设备,包括如上所述的自动对焦的装置,根据上述公开的装置对文本图像进行对焦,其后对文本图像进行拍摄,具体细节在此不再赘述。
本技术领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种自动对焦的方法,其特征在于,包括如下步骤:
检测图像范围中的文本,分析并确定文本所在的区域;
获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置;
根据所述区域的镜头对焦位置,确定所述图像范围中的文本的镜头对焦位置。
2.根据权利要求1所述的自动对焦的方法,其特征在于,分析并确定文本所在的区域,包括以下步骤:
判断图像范围中字符的大小,以及判断区域边界的字符和区域中心的字符的清晰度;
将图像范围中字符的大小一致的区域,以及区域边界的字符和区域中心的字符的清晰度一致的区域,划分为一个单区域。
3.根据权利要求2所述的自动对焦的方法,其特征在于,获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置,包括以下步骤:
获取处于所述单区域的多幅文本图像;
基于文本检测信息计算每一幅文本图像的质量,使用搜索算法搜索最优第一质量位置;
将所述最优第一质量位置确定为所述单区域的镜头对焦位置。
4.根据权利要求3所述的自动对焦的方法,其特征在于,还包括:
确定所述最优第一质量位置的相邻区域;
以所述相邻区域上的点为焦点,基于识别和语义信息计算文本质量,利用搜索算法搜索最优第二质量位置;
将所述最优第二质量位置确定为所述单区域的镜头对焦位置。
5.根据权利要求4所述的自动对焦的方法,其特征在于,确定所述图像范围中的文本的镜头对焦位置,包括:
所述图像范围中的文本的镜头对焦位置为一个或多个所述单区域镜头对焦位置。
6.根据权利要求5所述的自动对焦的方法,其特征在于,所述图像范围中的文本的镜头对焦位置为多个所述单区域镜头对焦位置时,对多个焦点拟合出最优焦点平面,将焦点在所述最优焦点平面时的镜头的位置,作为所述图像范围中的文本的镜头对焦位置。
7.一种对文本图像进行拍摄的方法,其特征在于,根据如权利要求1至6任意之一所述的方法对文本图像进行对焦并拍摄。
8.一种自动对焦的装置,其特征在于,包括检测模块,对焦模块和定位模块,
所述检测模块,用于检测图像范围中的文本,分析并确定文本所在的区域;
所述对焦模块,用于获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置;
所述定位模块,用于根据所述区域的镜头对焦位置,确定所述图像范围中的文本的镜头对焦位置。
9.根据权利要求8所述的自动对焦的装置,其特征在于,所述检测模块用于分析并确定文本所在的区域,包括以下步骤:
判断图像范围中字符的大小,以及判断区域边界的字符和区域中心的字符的清晰度;
将图像范围中字符的大小一致的区域,以及区域边界的字符和区域中心的字符的清晰度一致的区域,划分为一个单区域。
10.根据权利要求9所述的自动对焦的装置,其特征在于,所述对焦模块用于获取处于所述区域的文本的多幅文本图像,确定所述区域的镜头对焦位置,包括以下步骤:
获取处于所述单区域的多幅文本图像;
基于文本检测信息计算每一幅文本图像的质量,使用搜索算法搜索最优第一质量位置;
将所述最优第一质量位置确定为所述单区域的镜头对焦位置。
11.根据权利要求10所述的自动对焦的装置,其特征在于,所述对焦模块还用于确定单区域的镜头对焦位置,包括以下步骤:
确定所述最优第一质量位置的相邻区域;
以所述相邻区域上的点为焦点,基于识别和语义信息计算文本质量,利用搜索算法搜索最优第二质量位置;
将所述最优第二质量位置确定为所述单区域的镜头对焦位置。
12.根据权利要求11所述的自动对焦的装置,其特征在于,所述定位模块用于确定所述图像范围中的文本的镜头对焦位置,包括:
所述图像范围中的文本的镜头对焦位置为一个或多个所述单区域镜头对焦位置。
13.根据权利要求12所述的自动对焦的装置,其特征在于,所述定位模块用于对焦的所述图像范围中的文本的镜头对焦位置为多个所述单区域镜头对焦位置时,对多个焦点拟合出最优焦点平面,将焦点在所述最优焦点平面时的镜头的位置,作为所述图像范围中的文本的镜头对焦位置。
14.一种拍摄设备,其特征在于,包括如权利要求8至13任意之一所述的装置,根据所述装置对文本图像进行对焦并拍摄。
CN201410006852.1A 2014-01-07 2014-01-07 自动对焦的方法及装置 Pending CN104767926A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410006852.1A CN104767926A (zh) 2014-01-07 2014-01-07 自动对焦的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410006852.1A CN104767926A (zh) 2014-01-07 2014-01-07 自动对焦的方法及装置

Publications (1)

Publication Number Publication Date
CN104767926A true CN104767926A (zh) 2015-07-08

Family

ID=53649504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410006852.1A Pending CN104767926A (zh) 2014-01-07 2014-01-07 自动对焦的方法及装置

Country Status (1)

Country Link
CN (1) CN104767926A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678242A (zh) * 2015-12-30 2016-06-15 小米科技有限责任公司 手持证件模式下的对焦方法和装置
CN106979948A (zh) * 2017-02-21 2017-07-25 上海大学 手持便携式织物密度检测系统
WO2017167116A1 (zh) * 2016-03-28 2017-10-05 华为技术有限公司 自动对焦方法和自动对焦装置
CN109901355A (zh) * 2019-04-19 2019-06-18 深圳市当智科技有限公司 基于对比度加直方图的多元化投影仪自动对焦方法
CN116074617A (zh) * 2023-04-03 2023-05-05 常州微亿智造科技有限公司 一体化阵列相机及其成像控制方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408709A (zh) * 2007-10-10 2009-04-15 鸿富锦精密工业(深圳)有限公司 影像撷取装置及其自动对焦方法
CN101609505A (zh) * 2008-06-19 2009-12-23 三星电子株式会社 识别字符的方法和装置
CN101753846A (zh) * 2008-12-05 2010-06-23 三星电子株式会社 使用照相机自动调整字符大小的装置和方法
CN102647449A (zh) * 2012-03-20 2012-08-22 西安联客信息技术有限公司 基于云服务的智能摄影方法、装置及移动终端
CN102647450A (zh) * 2012-03-20 2012-08-22 西安联客信息技术有限公司 基于云服务的智能摄影方法及系统
US20130050668A1 (en) * 2011-08-31 2013-02-28 Asml Netherlands B.V. Method of Determining Focus Corrections, Lithographic Processing Cell and Device Manufacturing Method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408709A (zh) * 2007-10-10 2009-04-15 鸿富锦精密工业(深圳)有限公司 影像撷取装置及其自动对焦方法
CN101609505A (zh) * 2008-06-19 2009-12-23 三星电子株式会社 识别字符的方法和装置
CN101753846A (zh) * 2008-12-05 2010-06-23 三星电子株式会社 使用照相机自动调整字符大小的装置和方法
US20130050668A1 (en) * 2011-08-31 2013-02-28 Asml Netherlands B.V. Method of Determining Focus Corrections, Lithographic Processing Cell and Device Manufacturing Method
CN102647449A (zh) * 2012-03-20 2012-08-22 西安联客信息技术有限公司 基于云服务的智能摄影方法、装置及移动终端
CN102647450A (zh) * 2012-03-20 2012-08-22 西安联客信息技术有限公司 基于云服务的智能摄影方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678242A (zh) * 2015-12-30 2016-06-15 小米科技有限责任公司 手持证件模式下的对焦方法和装置
CN105678242B (zh) * 2015-12-30 2019-05-07 小米科技有限责任公司 手持证件模式下的对焦方法和装置
WO2017167116A1 (zh) * 2016-03-28 2017-10-05 华为技术有限公司 自动对焦方法和自动对焦装置
CN106979948A (zh) * 2017-02-21 2017-07-25 上海大学 手持便携式织物密度检测系统
CN106979948B (zh) * 2017-02-21 2020-05-19 上海大学 手持便携式织物密度检测系统
CN109901355A (zh) * 2019-04-19 2019-06-18 深圳市当智科技有限公司 基于对比度加直方图的多元化投影仪自动对焦方法
CN109901355B (zh) * 2019-04-19 2020-11-10 深圳市当智科技有限公司 基于对比度加直方图的多元化投影仪自动对焦方法
CN116074617A (zh) * 2023-04-03 2023-05-05 常州微亿智造科技有限公司 一体化阵列相机及其成像控制方法

Similar Documents

Publication Publication Date Title
TWI766201B (zh) 活體檢測方法、裝置以及儲存介質
CN108629354B (zh) 目标检测方法及装置
KR101990073B1 (ko) 전자장치에서 다초점 영상 촬영 및 저장 방법 및 장치
CN113837079B (zh) 显微镜的自动对焦方法、装置、计算机设备和存储介质
KR101560866B1 (ko) 피부색 영역 및 얼굴 영역에 기초한 뷰포인트 검출기
CN101799621B (zh) 一种拍摄方法和拍摄设备
CN108009588A (zh) 定位方法及装置、移动终端
CN110569835B (zh) 一种图像识别方法、装置和电子设备
KR102297217B1 (ko) 영상들 간에 객체와 객체 위치의 동일성을 식별하기 위한 방법 및 장치
CN105678242B (zh) 手持证件模式下的对焦方法和装置
CN108419009B (zh) 图像清晰度增强方法和装置
CN104639839B (zh) 拍摄方法及装置
JP2012123546A (ja) 情報表示システム、情報表示装置、情報提供装置、および、プログラム
CN104767926A (zh) 自动对焦的方法及装置
CN105354296B (zh) 一种终端定位方法和用户终端
US20160191898A1 (en) Image Processing Method and Electronic Device
CN116567418A (zh) 图像处理方法、移动检测系统、电子设备及存储介质
CN114549882B (zh) 一种图像聚档方法、装置、电子设备及存储介质
TWI740624B (zh) 圖片處理方法、設備和儲存媒體
CN110896469B (zh) 用于三摄的解像力测试方法及其应用
JP5703726B2 (ja) 情報表示システム、情報表示装置、情報提供装置、および、プログラム
CN105120153B (zh) 一种图像拍摄方法及装置
CN113011497B (zh) 图像比对方法和系统
CN111050027A (zh) 镜头畸变补偿方法、装置、设备和存储介质
JP5195885B2 (ja) 情報表示システム、情報表示装置、および、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20220429

AD01 Patent right deemed abandoned