KR100615058B1 - Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset - Google Patents
Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset Download PDFInfo
- Publication number
- KR100615058B1 KR100615058B1 KR1020040089371A KR20040089371A KR100615058B1 KR 100615058 B1 KR100615058 B1 KR 100615058B1 KR 1020040089371 A KR1020040089371 A KR 1020040089371A KR 20040089371 A KR20040089371 A KR 20040089371A KR 100615058 B1 KR100615058 B1 KR 100615058B1
- Authority
- KR
- South Korea
- Prior art keywords
- character
- image
- character recognition
- candidate word
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/0202—Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
- H04M1/026—Details of the structure or mounting of specific components
- H04M1/0264—Details of the structure or mounting of specific components for a camera module assembly
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Telephone Function (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 휴대용 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치로서 카메라가 붙은 휴대 정보 단말에 있어서 문자인식처리를 정밀도 좋게 실시하기 위해서는 화상내에서 인식 대상의 문자 열이 경사되지 않게 할 필요가 있다. 혹은, 문자의 기술 방향으로 세로 쓰기와 가로쓰기의 2방법이 있는 경우, 올바른 문자인식 결과를 얻기 위해서 각각 맞춘 문자 행방향을 지정할 필요가 있다. 이들은 모두 사용자에 의한 지정 혹은 보정의 부담이 컸다. 또, 일본어를 문자인식하여 인식 결과를 키로서 검색 하려고 했을 경우, 영어단어와 달리 문자가 단락지을 수 없기 때문에 검색 대상어를 지정하는 사용자의 부담이 크다는 문제가 있었다.The present invention provides a method of selecting a processing target in character recognition of a portable information terminal device and a character string of a recognition target in an image in order to accurately perform character recognition processing in a portable information terminal with a camera as a portable information terminal device. It is necessary to prevent it. Alternatively, if there are two methods of writing vertically and horizontally in the description direction of the characters, it is necessary to specify the character line direction to be aligned in order to obtain a correct character recognition result. All of them had a heavy burden of designation or correction by the user. In addition, when attempting to search the recognition result as a key by recognizing Japanese characters, there is a problem in that a burden on a user to designate a search target language is large because the characters cannot be separated, unlike English words.
문자행의 경사를 적절히 수정하기 위해서 문자행의 기울기를 나타내는 인디케이터를 휴대 정보 단말 장치의 화상에 표시한다. 혹은, 일본어를 문자인식 해 인식결과를 키로서 검색하기 위해서 형태소 해석 결과와 커서의 위치 정보를 이용해 검색 대상어를 지정하는 기술을 제공한다.In order to properly correct the slope of the text line, an indicator indicating the slope of the text line is displayed on the image of the portable information terminal device. Alternatively, in order to search Japanese by character recognition and search for recognition results as keys, a technique of specifying a search target language using morphological analysis results and cursor position information is provided.
Description
도 1은 본 발명의 실시예에 있어서의 휴대 정보 단말의 플로터도이다. 1 is a plotter diagram of a portable information terminal in an embodiment of the present invention.
도 2는 본 발명의 실시예에 있어서의 플로우 챠트이다.2 is a flowchart in the embodiment of the present invention.
도 3은 본 발명의 실시예에 있어서의 플로우 챠트이다.3 is a flowchart in the embodiment of the present invention.
도 4는 본 발명의 실시예에 있어서의 각도 보정의 설명도이다. 4 is an explanatory diagram of angle correction in the embodiment of the present invention.
도 5는 본 발명의 실시예에 있어서의 플로우 챠트이다.5 is a flowchart in the embodiment of the present invention.
도 6은 본 발명의 실시예에 있어서의 화면을 나타내는 도이다. 6 is a diagram illustrating a screen in an embodiment of the present invention.
도 7은 본 발명의 실시예에 있어서의 플로우 챠트이다.7 is a flow chart in the embodiment of the present invention.
도 8은 본 발명의 실시예에 있어서의 문자 열 외접 구형 생성 방식의 설명도이다. 8 is an explanatory diagram of a character string circumscribed spherical generation method in the embodiment of the present invention.
도 9는 본 발명의 실시예에 있어서의 휴대 정보 단말의 블럭도이다.9 is a block diagram of a portable information terminal according to the embodiment of the present invention.
도 10은 본 발명의 실시예에 있어서의 플로우 챠트이다.10 is a flow chart in the embodiment of the present invention.
도 11은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다.It is explanatory drawing of the spherical coordinate table in the Example of this invention.
도 12는 본 발명의 실시예에 있어서의 검색 후보어의 선택 방식 설명도이다. 12 is an explanatory diagram of a selection method of a search candidate word in the embodiment of the present invention.
도 13은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.
도 14는 본 발명의 실시예에 있어서의 선택 영역 테이블의 설명도이다. 14 is an explanatory diagram of a selection area table in the embodiment of the present invention.
도 15는 본 발명의 실시예에 있어서의 구형 좌표의 설명도이다.It is explanatory drawing of the spherical coordinate in the Example of this invention.
도 16은 본 발명의 실시예를 설명하는 도이다.16 illustrates an embodiment of the present invention.
도 17은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.
도 18은 본 발명의 실시예를 설명하는 도이다.18 is a diagram for explaining an embodiment of the present invention.
도 19는 본 발명의 실시예를 설명하는 도이다.19 is a diagram illustrating an embodiment of the present invention.
도 20은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.
도 21은 본 발명의 실시예를 설명하는 도이다.21 illustrates an embodiment of the present invention.
본 발명은 휴대 정보 단말 장치에 있어서의 광학식 문자인식을 실시할 때의 처리 대상 선택 방법에 관한 것이다.The present invention relates to a process object selection method when performing optical character recognition in a portable information terminal device.
카메라등의 화상 입력 기능을 탑재한 휴대용 전화 단말 장치 등과 같은 휴대 정보 단말 장치에 있어서 촬영한 화상에 대해서 광학식 문자인식을 실시하는 기술이 개발되고 있다. 그러나, 휴대 정보 단말의 카메라로 촬영된 화상은 손떨림등의 요인에 의해 화면에 대해서 문자 열이 기울어 촬영되는 경우가 많다. 거기서, 문자인식 결과가 잘못되어 있는(오독) 경우에는 재차 사용자에 촬영시의 각도를 조정하면서 촬영시킬지 인식 결과를 키보드등의 입력장치로 수정하고 있다.Background Art A technique for performing optical character recognition on an image photographed in a portable information terminal apparatus such as a portable telephone terminal apparatus equipped with an image input function such as a camera has been developed. However, the image photographed by the camera of the portable information terminal is often photographed with the character string tilted with respect to the screen due to factors such as camera shake. If the character recognition result is wrong (misreading), the recognition result is corrected by an input device such as a keyboard to photograph the user while adjusting the angle at the time of photographing again.
인식 처리에 앞서 인식 대상 문자 열의 기울기를 보정하는 기술로서는 인식 대상 문자 열의 기입된 용지에 미리 기재완료된 2개 이상의 표적을 검출해 지금부터 얻어진 기울기에 따라 자동적으로 회전을 실시한 후 인식하는 시도가 특허 문헌 1에 개시되고 있다.As a technique for correcting the inclination of the character string to be recognized prior to the recognition process, an attempt to recognize two or more targets already written on a sheet of paper in the character string to be recognized in advance and automatically rotate according to the inclination obtained from the present is disclosed. It is disclosed in 1.
또, 휴대 정보 단말에 있어서 영어 단어를 인식해 영일 사전을 찾는다고 하는 문자인식과 사전 검색을 결합한 사용법이 비특허 문헌 1에 개시되고 있다.In addition, Non-Patent
[특허 문헌 1] 일본국 특개평11-250179호 공보(4~7항, 제3도)[Patent Document 1] Japanese Patent Application Laid-Open No. 11-250179 (paragraphs 4-7, 3)
[비특허 문헌 1] H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, “Inbformation Capturng Camera and Developmental Issues, “ In Proc. Int. Conf. Document Analysis and recognition, ICDAR '99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208.[Non-Patent Document 1] H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, “Inbformation Capturng Camera and Developmental Issues,” In Proc. Int. Conf. Document Analysis and recognition, ICDAR '99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208.
문자인식 처리를 정밀도 좋게 실시하기 위해서는, 화상내에서 인식 대상의 문자 열이 경사하고 있지 않는 것이 중요하다. 그런데 디지탈카메라나 카메라 부착 휴대 전화 단말 장치 등의 휴대 정보 단말 장치에서 촬영한 디지털 화상의 경우, 해당 정보 단말장치를 손으로 보관 유지하는 경우가 많아 인식 대상의 문자 열이 화상내에서 기울지 않도록 하기 위해서는 촬영시에 특별한 주의가 필요하다(제 1의 과제).In order to perform the character recognition processing with high accuracy, it is important that the character string to be recognized is not inclined in the image. However, in the case of a digital image photographed by a portable information terminal device such as a digital camera or a mobile phone terminal device with a camera, the information terminal device is often held by hand, so that the character string of the object to be recognized is not tilted in the image. Special attention is required at the time of photography (first problem).
카메라 기능부착 휴대 정보 단말 장치에서 촬영된 화상에 대한 광학식 문자인식 기능에 있어서 문자 열이 기울어 촬영되었을 경우 종래 기술에서는 문자인식이 불가능, 혹은 충분한 인식 정밀도가 나오지 않는 문제가 있다. 그 때문에, 올바른 문자인식 결과를 얻기 위해서는 재차 인식 대상의 문자를 촬영해야 하는 과제가 있다.In the optical character recognition function of an image photographed by a portable information terminal device having a camera function, when a character string is photographed at an angle, the character recognition is not possible in the prior art, or sufficient recognition accuracy is not obtained. Therefore, in order to obtain a correct character recognition result, there is a problem of photographing a character to be recognized again.
특허 문헌 1에는 용지에 기재되어 있는 2개의 이상의 표적에 의해 기울기를 검출하는 취지가 기재되어 있지만 이 기술은 인식 대상의 용지에 미리 표적을 인자 혹은 기입해 둘 필요가 있고 명함등을 인식하는 경우에는 실용적이지 않다. 또, 과거에 촬영완료된 화상에 대해서 문자인식 처리를 실시하는 경우는 상기의 특별한 주위를 기울여 촬영되어 있지 않은 한, 인식 대상 문자 열이 화상내에서 경사하고 있는 경우가 있다. 이 경우는 문자인식 처리를 실시하기 전에 화상 처리 소프트웨어등을 이용해 화상의 각도 보정을 할 필요가 있다(제 2의 과제).
더욱, 문자의 기술 방향이 세로 쓰기와 가로쓰기의 2방법이 있는 경우, 화상의 각도를 조정해 인식 대상 문자 열을 추출했다고 해도, 문자인식에 해당해 인식 대상 문자 열이 세로 쓰기인가 가로쓰기인가를 설정할 필요가 있다. 명함등의 화상을 취득해 문자인식 처리를 실시하는 경우 세로쓰기와 가로쓰기의 포맷이 존재하기 때문에 그때마다 인식 모드를 설정 다시 하지 않으면 안 되는 문제가 있다. 또 신문, 잡지등 세로 쓰기 문자 열과 가로쓰기 문자 열이 혼재하고 있는 문서에 있어서도 문자의 기술 방향 변환의 부담은 크다(제 3 과제).Furthermore, if the description direction of the text has two methods of vertical writing and horizontal writing, even if the angle of the image is extracted to extract the character string to be recognized, whether the character string to be recognized corresponds to the character recognition is vertical writing or horizontal writing. You need to set In the case of acquiring an image such as a business card and performing character recognition processing, there is a problem in that the recognition mode must be set again each time since the formats of vertical writing and horizontal writing exist. In addition, even in documents in which vertical writing strings and horizontal writing strings, such as newspapers and magazines, are mixed, the burden of changing the technical direction of letters is great (third problem).
카메라부착 휴대 정보 단말 장치 등을 이용하는 경우 차량 이동중 등, 화상이 안정된 위치에서 촬영 하기 어려운 환경 아래에서의 이용을 좀 더 생각할 수 있다. 그러나, 종래 기술에서는 인식 대상 문자 열이 화상에 대해서 경사가 작게 억제 된 상태로 선택되지 않으면 문자인식 정밀도를 충분히 얻을 수 없었다. 그 때문에, 사용자는 인식 대상 화상을 촬영할 때에 각도를 조정하기 위해 특별한 주의가 필요했다 (제 4 과제).In the case of using a portable information terminal device with a camera or the like, use in an environment in which an image is difficult to shoot at a stable position, such as during a vehicle movement, can be considered. However, in the prior art, the character recognition accuracy could not be sufficiently obtained unless the character string to be recognized is selected in such a state that the inclination is suppressed small with respect to the image. Therefore, the user needed special attention to adjust the angle when photographing the recognition target image (fourth problem).
부가하여 카메라 부착 휴대 정보 단말 장치에 있어서 문자인식 한 결과를 이용해 사전 검색이나 인터넷의 검색을 실시하려고 했을 경우 영어단어의 경우는 공백에 의해 단어 단위로 나누어 지고 있으므로 검색 대상의 단어를 선택하는 것은 용이하다. 그러나, 동일한 처리를 일본어에 적용 하려고 하면 영어단어의 경우와 달리 단어간의 공백이라는 레이아웃 정보에 의한 단락이 존재하지 않기 때문에, 사용자는 검색 대상의 문자 열을 1 문자씩 선택할 필요가 있어 지정의 부담이 컸다(제 5의 과제).In addition, in case of attempting to perform dictionary search or internet search using the result of character recognition in portable information terminal device with camera, it is easy to select the word to be searched because English words are divided by word by space. Do. However, if you try to apply the same processing to Japanese, unlike the English word, there is no paragraph by layout information such as space between words, so the user needs to select the character string to be searched one by one, and the burden of designation is burdensome. It was large (fifth problem).
본 발명은 이들의 과제를 비추어 카메라 부착 휴대 정보 단말 장치에서 문자인식 대상물을 촬영할 때의 촬영자 부담을 경감하고, 또는 촬영 후의 화상을 문자인식에 매우 적합한 각도로 보정할 때의 부담을 경감하는 시스템 또는 방법을 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION In view of these problems, the present invention reduces the burden of a photographer when photographing a character recognition object in a portable information terminal apparatus with a camera, or a system for reducing the burden of correcting an image after shooting at an angle that is very suitable for character recognition, or It is an object to provide a method.
또한, 일본어 등을 문자인식 해 사전이나 인터넷의 검색을 하는 경우에도, 검색 대상의 문자 열 지정하는 사용자의 부담을 경감하는 시스템 또는 방법을 제공하는 것을 목적으로 한다.Another object of the present invention is to provide a system or method for reducing the burden on a user who designates a character string to be searched even when searching a dictionary or the Internet by recognizing Japanese characters.
상기 제 1의 과제를 해결하기 위해 인식 대상 문자 열의 화상내에서의 기울기의 정도를 리얼타임으로 촬영자에게 제시 하는 각도 인디케이터를 정보 단말장치의 화상에 표시한다. 사용자는 각도 인디케이터에 표시되는 정보를 보면서 정보 단말장치 또는 인식 대상물을 움직여 적절한 위치에서 촬영함으로써 문자인식 처리에 매우 적합한 화상을 촬영할 수가 있다.In order to solve the first problem, an angle indicator for presenting the degree of inclination in the image of the character string to be recognized to the photographer in real time is displayed on the image of the information terminal apparatus. The user can capture an image which is very suitable for the character recognition process by moving the information terminal device or the recognition object and shooting at an appropriate position while viewing the information displayed on the angle indicator.
상기 제 2의 과제를 해결하기 위해서 촬영이 끝난 화상을 회전하는 것과 동 시에 인식 대상이 될 수 있는 문자 열의 행 추출을 리얼타임으로 실시하는 기능을 제공한다. 사용자는 간단한 키 조작등에 의해 촬영이 끝난 화상을 정보 단말장치의 화상에서 회전시켜 리얼타임으로 행 추출되는 인식 대상 문자 열 후보를 확인한다. 원하는 인식 대상 문자 열이 추출된 시점에서 사용자는 회전 처리를 정지, 복수의 행이 추출되고 있는 경우는 인식하고 싶은 문자 열을 선택해 인식 처리를 실행함으로써 과거에 촬영완료의 화상에 대한 문자인식 처리의 간편화를 도모한다.In order to solve the second problem, a function of real time extracting a row of character strings that can be recognized at the same time as rotating a photographed image is provided. The user checks the recognition target character string candidate to be row-extracted in real time by rotating the captured image on the image of the information terminal apparatus by a simple key operation or the like. When the desired character string to be recognized is extracted, the user stops the rotation process, and when a plurality of rows are extracted, the user selects the character string to be recognized and executes the recognition process to execute the character recognition process for the image that has been taken in the past. We plan to simplify.
상기 제3 과제를 해결하기 위해서 상기 인식 대상 문자 열이 세로 쓰기인가 가로쓰기인지를 자동적으로 판정하는 기능을 제공한다. 상기 인식 대상 문자 열 방향의 자동 판정에는 추출된 인식 대상 문자 열의 외접 구형의 어스펙트비를 이용한다. 구체적으로는 인식 대상 문자 열의 외접 구형의 높이와 폭의 비율이 규정치와 비교해 세로 쓰기 문자 열인가 가로쓰기 문자 열인가를 판단해 인식 처리를 실시한다. 사용하는 휴대 정보 단말 장치의 화면의 방향이 가변의 경우에는 화면의 방향에 따라 세로 쓰기·가로쓰기의 변환을 자동적으로 실시해도 괜찮다.In order to solve the third problem, a function of automatically determining whether the recognition target character string is vertical writing or horizontal writing is provided. In the automatic determination of the character string direction to be recognized, the aspect ratio of the circumscribed rectangle of the extracted character string to be recognized is used. Specifically, the recognition process is performed by determining whether the ratio of the height and width of the circumscribed rectangle of the character string to be recognized is the vertical character string or the horizontal character string compared to the prescribed value. When the orientation of the screen of the portable information terminal device to be used is variable, the vertical writing and horizontal writing may be automatically converted in accordance with the orientation of the screen.
상기 제 4 과제를 해결하기 위해서 인식 대상 문자 열의 경사 각도에 추종 해 자동적으로 인식 대상 문자 열을 선택하기 위한 외접 구형을 생성하는 수단을 제공한다. 구체적으로는 인식 대상 문자 열의 경사 각도를 예를 들면 일보눅 특개평7-141465「문서 화상의 기울기 검출 방법」방법을 이용해 계측 해 인식 대상 문자 열이 가로쓰기의 경우는 화상에 대해서 수평 위치에, 세로 쓰기의 경우는 화상에 대해서 수직 위치가 되도록 회전한 화상을 작성한다. 그 후 인식 대상 문자 열의 외접 구형을 생성해 상기 회전 후 화상에 추가한 회전 외접 구형 화상을 작성한 다. 이어서 상기 회전 외접 구형 화상을 회전해 원래의 문자 열의 경사 각도로 되돌려 정보 단말장치의 표시 장치에 표시한다.In order to solve the fourth problem, a means for generating an external spherical shape for automatically selecting a character string to be recognized following the inclination angle of the character string to be recognized is provided. Specifically, the angle of inclination of the character string to be recognized is measured using, for example, the Japanese Patent Application Laid-Open No. H7-141465 "Skew Detection Method for Document Images". In the case of vertical writing, the rotated image is created so as to be perpendicular to the image. Thereafter, a circumscribed rectangle of a character string to be recognized is generated, and a circumscribed rectangle image added to the rotated image is created. The rotating circumscribed spherical image is then rotated and returned to the inclination angle of the original character string to be displayed on the display device of the information terminal apparatus.
상기 제 5의 과제를 해결하기 위해서 일본어 등을 문자인식 한 결과에 대해서 형태소 해석을 실시해 검색 대상의 문자 열 후보를 자동적으로 생성해 사용자는 그들 개개의 후보를 선택 혹은, 그들 문자 열 후보의 조합을 선택하는 수단을 제공한다. In order to solve the fifth problem, morphological analysis is performed on the result of character recognition in Japanese and the like, and the character string candidates to be searched are automatically generated, and the user selects individual candidates or a combination of the character string candidates. It provides a means to choose.
도 1 ~ 20을 이용해 본 발명에 매우 적합한 일실시 형태를 설명한다. 본 발명의 문자인식 방식은 명함등을 읽어내 인식하는 휴대 정보 시스템등에 적용할 수 있어 예를 들면 휴대전화에서의 문자인식 기능에 적용할 수 있다.An embodiment very suitable for the present invention will be described with reference to FIGS. The text recognition method of the present invention can be applied to a portable information system that reads and recognizes a business card or the like, and can be applied to, for example, a text recognition function in a mobile phone.
도 1은 본 발명을 적용한 휴대 정보 단말의 블럭도의 일례이다. 본예에서는 휴대 정보 단말 본체(100), 인식 대상이 되는 명함등을 광학적으로 입력하는 카메라나 스캐너등의 화상 입력장치(110), 인식 대상의 화상이나 문자인식 결과, 커서 (121) 등을 표시하는 CRT나 액정등의 표시 장치(120), 사용자를 조작할 수 있는 버튼(131)등을 배치한 입력장치(130), 휴대 정보 단말 전체의 제어를 실시하기 때문에 단말 본체(100)내에 탑재된 제어부(140) 및 문자행 추출(151), 문자인식 처리 (152)등을 실시하는 문자인식부(150), 문자행 기울기의 정량화 기능(161) 및 화상 회전 처리 기능(162)을 갖는 화상 처리부(160)를 가진다.1 is an example of a block diagram of a portable information terminal to which the present invention is applied. In this example, the portable information terminal
문자인식부(150)와 화상 처리부(160)는 소프트웨어의 기능으로서 제어부(140)와 동일한 회로상에서 동작해 지장이 없다. 입력장치는 버튼등의 일반적인 디 바이스로 문제 없지만 조작성의 향상을 위해서 표시 장치(120)와 입력장치(130)는 터치 패널등의 표시 장치겸 입력장치로서 실현될 수도 있다.The
도 2는, 제 1의 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 1의 실시 형태}. 사용자가 OCR 기능을 개시하면 화상 입력장치(110)로부터 입력되는 동화상이 표시 장치(120)에 표시된다(S201). 문자인식부(150)는 즉시 화상 표시 장치(120)에 표시되는 십자형등의 커서 (121)가 있는 영역에 대해서 문자행 추출 처리를 실행하고(S202), 추출된 문자행을 둘러싸는 외접 구형을 표시한다(S203).Fig. 2 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the first problem is applied (first embodiment). Input from the
동시에 화상 처리부(160)에 의해 문자업의 기울기를 정량화해 그 정량화된 값을 막대 그래프등의 형태로 각도 인디케이터(indicator, 123) 에 가시화한다(S204). 정량화한 값은 문자행과 화상의 기울기의 정도를 반영하고 있으면 무엇이라도 좋지만, 예를 들면 문자행과 화상단변이 만드는 각도 θ의 역수에 비례하는 값을 채용하면 기울기가 작을 때에 각도 인디케이터(123)에 큰 값이 나타나 사용자는 직감적으로 조작할 수 있다.At the same time, the gradient of the character-up is quantified by the
사용자가 촬영 버튼을 누를(S205) 때까지는 스텝(S201)으로 처리는 돌아오고, 이후(S201~S204)의 처리를 반복해 화면 표시를 계속 갱신한다.The process returns to step S201 until the user presses the photographing button (S205), and the subsequent processing is repeated (S201 to S204) to continuously update the screen display.
각도 인디케이터(123)를 참고에 사용자가 단말장치 또는 인식 대상물을 움직여, 적절한 촬영 위치에서 촬영 버튼을 누르(S205)면 화상 촬영(S206)을 실행한다. 계속 인식 버튼의 누르(S207)고 있으면 스텝(S203)에서 표시된 외접 구형내의 문자 열에 대해서 문자인식 처리(210)를 실행해 인식 결과를 표시한다(S211).Referring to the
촬영 버튼을 누른(S205) 후에 캔슬 버튼을 누른 경우(S208)는 촬영한 화상을 파기해 스텝(S201)에 돌아온다. 그 이외의 버튼을 누른 경우는 각각 필요한 동작으로 이행한다(S209).If the cancel button is pressed after the photographing button is pressed (S205) (S208), the photographed image is discarded and the process returns to step S201. When other buttons are pressed, the process proceeds to the required operation (S209).
도 3은, 제 2의 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 2의 실시 형태). 휴대 정보 단말의 사용자가 이전 촬영된 정지화상을 로드(S301) 하는 조작을 실시하면, 상기 정지화상이 표시 장치(120)에 표시된다(S302). 문자인식부(150)는 즉시 문자행 추출(S303), 외접 구형 표시(S304) 및 각도 인디케이터 표시(S305)를 실시한다. 이 시점에서 처리는 사용자의 키 입력 대기(S306)로 이행한다.3 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the second problem is applied (second embodiment). When the user of the portable information terminal performs an operation of loading a still picture previously taken (S301), the still picture is displayed on the display device 120 (S302). The
사용자가 인식 실행 버튼을 누른(S307) 경우는 즉시 스텝(S304)에서 표시되고 있는 외접 구형의 내부의 문자 열에 대해서 문자인식 처리를 실행(S310)해, 문자인식 결과를 표시한다(S311). 사용자가 화살표 버튼을 누른(S308) 경우는, 누른 버튼에 의해 오른쪽 또는 좌방향에 일정 각도 화상을 회전한다(S309). 이 때, 회전의 중심은 문자행 구형이 중심이지만 사용자에 의해 지정하는 화상상의 일점을 중심으로 회전 처리를 실시해도 좋다.When the user presses the recognition execution button (S307), a character recognition process is immediately performed on the internal character string of the circumscribed rectangle displayed in step S304 (S310), and the character recognition result is displayed (S311). When the user presses the arrow button (S308), the button is rotated by a predetermined angle to the right or left direction (S309). At this time, the center of rotation is the character line rectangle, but the rotation process may be performed centering on one point on the image designated by the user.
화살표 버튼을 계속 누른 경우는 화상은 연속해 회전하는 것으로 해, 그것에 따라서 외접 구형 표시도 리얼타임으로 갱신된다. 사용자의 편의를 고려해 인식 실행 버튼 누름 조작을 화살표 버튼 누름을 멈추는(버튼으로부터 손가락을 떼어 놓는다) 동작으로 대행시켜도 괜찮다.If the arrow button is kept pressed, the image is rotated continuously, and the circumscribed spherical display is updated in real time accordingly. For the convenience of the user, the operation of pressing the recognition execution button may be replaced by the operation of stopping pressing the arrow button (releases the finger from the button).
도 4는 제 1의 실시 형태 및 제2의 실시 형태로 표시부(120)에 표시되는 화 상의 일례이다. 제 1의 실시 형태에서는 화상 입력장치(110)로부터 입력된 동영상이, 제2의 실시 형태는 이전에 촬영된 정지화면이 화상(400)으로서 표시부(120)에 표시된다.4 is an example of an image displayed on the
화상(400)내의 인식 대상 문자 열(401)은 이 시점에서는 기울고 있다. 화면의 중앙에는 회전 중심이 되는 십자 커서(402)가 표시되고 있다. 문자인식부(150)는 인식 대상 문자 열(401)을 둘러싸는 외접 구형(403)을 생성, 화상에 표시한다. 각도 인디케이터에는 기울어진 인식 대상 문자 열(401)의 기울기 정도를 나타내는 막대 그래프가 표시된다(404).The
제 1의 실시 형태에서는 손으로 보관 유지하고 있는 휴대 정보 단말(카메라)을 회전(406)함으로써, 또, 제2의 실시 형태에서는 커서 키를 조작하는(405) 것에 따라 화상에 표시되는 화상을 회전한다. 화상의 회전에 따라서 인식 대상 문자 열(401)의 기울기가 작아짐에 따라, 외접 구형도 동기 해 형상이 변화한다(407).In the first embodiment, by rotating 406 the portable information terminal (camera) held by hand, in the second embodiment, the image displayed on the image is rotated by operating the cursor key (405). do. As the inclination of the
또한, 각도 인디케이터에는 인식 대상 문자열(U401)의 기울기가 작아진 것을 나타내는 큰 값이 막대 그래프로서 표시된다(408). 이용자는 화상의 회전 조작을 반복해 각도 인디케이터가 나타내는 값이 커지는 위치에서 문자인식 처리를 실행함으로써, 정밀도가 높은 문자인식 결과를 얻는 것이 가능해진다.In addition, a large value indicating that the slope of the recognition target character string U401 is smaller is displayed on the angle indicator as a bar graph (408). The user can obtain a highly accurate character recognition result by repeating the rotation operation of the image and performing the character recognition process at the position where the value indicated by the angle indicator becomes large.
도 5는, 제3 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 3 실시 형태). 스텝(S501~S506)은 스텝(S201~S209)과 같아서 설명은 생략 한다.5 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the third problem is applied (third embodiment). Steps S501 to S506 are the same as steps S201 to S209, and description is omitted.
인식 버튼 누름(S504) 시점에서 인식 대상 문자 열의 외접 구형의 어스펙트 비(높이와 폭의 비율)를 계산해 미리 규정한 값(α)과 비교한다(S507). 만약 어스펙트비가 규정치 α보다 크면 세로 쓰기 문자 열이라고 판단, 세로 쓰기 문자 열 인식용의 파라미터 설정등을 실시(S510)해 문자인식 처리를 실시(S511), 결과를 표시한다(S512).At the point of time when the recognition button is pressed (S504), the aspect ratio (ratio of height and width) of the circumscribed rectangle of the character string to be recognized is calculated and compared with a predetermined value α (S507). If the aspect ratio is larger than the prescribed value α, it is determined that it is a vertical write character string, parameters are set for recognition of the vertical write character string (S510), a character recognition process is performed (S511), and the result is displayed (S512).
동일하게 만약 어스펙트비가 규정치(α)보다 크지 않으면 계속해 어스펙트비를 규정치(β)와 비교한다(S508). 만약 어스펙트비가 규정치(β)보다 작으면 가로쓰기 문자 열이라고 판단, 가로쓰기 문자 열 인식용의 파라미터 설정등을 실시(S509)해 문자인식 처리를 실시(S511), 결과를 표시한다(S512). 어스펙트비가 α이하 또한 β이상의 범위이면 문자 열은 충분히 각도 보정되어 있지 않은 것으로 인식 처리로 이행하지 않는다.Similarly, if the aspect ratio is not greater than the prescribed value α, then the aspect ratio is compared with the prescribed value β (S508). If the aspect ratio is smaller than the prescribed value (β), it is determined that the horizontal character string is a character string, and a parameter for recognizing the character string is performed (S509), a character recognition process is performed (S511), and the result is displayed (S512). . If the aspect ratio is in the range of α or less and β or more, the character string is not sufficiently angle corrected and does not proceed to the recognition process.
도 6은 제3 실시 형태로 표시부(120)에 표시되는 화상의 일례이다. 가로쓰기의 문자 열(601)의 경우는 외접 구형의 높이(602)가 폭(603)에 대해서 작아진다. 어스펙트비를 외접 구형의 높이/외접 구형의 폭으로 정의 하면 어스펙트비가 1 보다 작은 경우는 외접 구형은 횡길이가 된다. 6 is an example of an image displayed on the
예를 들면, 어스펙트비와 비교하는 규정치(β)를 0.5로 설정했을 경우, 어스펙트비가 0.5를 밑돈 상태로 문자인식을 기동하면 가로쓰기 문자 열로서 필요한 설정을 자동적으로 실시한다. 상기와 같이 세로 쓰기 문자 열(604)의 경우는, 외접 구형의 높이(605)가 폭(606)에 대해서 커진다.For example, when the prescribed value β to be compared with the aspect ratio is set to 0.5, when the character recognition is started with the aspect ratio lower than 0.5, the necessary setting is automatically performed as the horizontal writing string. As described above, in the case of the vertical
상기와 같은 어스펙트비의 정의이면 어스펙트비가 1보다 큰 경우는 외접 구형은 종 길이가 된다. 예를 들면, 어스펙트비와 비교하는 규정치(α)를 1.5로 설정 했을 경우, 어스펙트비가 1.5를 웃돈 상태로 문자인식을 기동하면 세로 쓰기 문자 열로서 필요한 설정을 자동적으로 실시한다.In the above aspect ratio definition, when the aspect ratio is larger than 1, the circumscribed sphere is the longitudinal length. For example, when the prescribed value (α) to be compared with the aspect ratio is set to 1.5, when the character ratio is activated with the aspect ratio exceeding 1.5, the necessary setting as the vertical writing string is automatically performed.
도 7은, 제 4 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 1예이다(제 4 실시예).7 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the fourth problem is applied (fourth embodiment).
화상 입력장치(110)로부터 문자인식 대상 화상이 입력(S701)되면 화상 처리부(160)는 즉시 인식 대상 문자 열의 화상에 대한 각도를 계산해(S702), 입력된 문자인식 대상 화상을 해당 각도분 회전 보정한다. 보정 방향은 가로쓰기 문자 열이면 화면에 대해서 수평 방향으로, 세로 쓰기 문자 열이면 화면에 대해서 수직 방향이 되도록 각각 회전한다.When the character recognition target image is input from the image input apparatus 110 (S701), the
다음에, 상기 회전 후 화상에 대해서 문자 열 추출을 실시해, 상기 회전 후 화상에 외접 구형을 부가해(S704) 이 화상을 화상 버퍼에 보존한다. 화상 버퍼에 보존하는 화상은 화상 전체라도 좋고, 부가한 외접 구형 내부만 이라도 좋다.Next, character string extraction is performed on the post-rotation image, and an external spherical shape is added to the post-rotation image (S704) to store this image in the image buffer. The image to be stored in the image buffer may be the whole image, or may be only the added external spherical shape.
다음으로 상기 회전 후 화상을 스텝(S702)에서 검출한 각도분만큼 역회전해 원래의 입력 화상과 동일하게 기울어진 화상을 작성해 단말장치의 표시부(120)에 표시한다. 사용자가 특히 조작하지 않으면 스텝(S701)으로 돌아가고 새로운 입력 화상에 대해 스텝(S701~S707)의 처리를 반복한다.Next, the rotated image is reversely rotated by the angle detected in step S702, and an image inclined in the same manner as the original input image is created and displayed on the
만약 인식 버튼이 눌려지면, 이 스텝(S705)에서 화상 버퍼에 격납된 화상을 읽어내(S710), 그 화상에 대해서 문자인식 처리를 실행(S711), 문자인식 결과를 표시한다(S712).If the recognition button is pressed, the image stored in the image buffer is read out in this step S705 (S710), a character recognition process is executed for the image (S711), and the character recognition result is displayed (S712).
도 8은 제 4 실시 형태로 처리되는 화상 상태의 일례이다. 화상 입력장치 (110)로부터 입력된 인식 대상 화상(801) 상의 인식 대상 문자열(U802)은 화면에 대해서 경사진 상태이다. 화상 처리부(160)는 인식 대상 문자 열(802)이 화면의 가장자리를 이루는 각도(803)를 검출해 각도(803)만 화상을 회전, 인식 대상 문자 열이 화면에 대해서 수평이 되도록 보정해, 회전 보정 화상(804)을 작성한다.8 is an example of an image state processed in the fourth embodiment. The recognition target character string U802 on the
회전 보정 화상(804) 상의 인식 대상 문자열(U806)에 대해, 문자인식부(150)는 문자행 추출을 실시해 외접 구형(806)을 부가한다. 화상 처리부(160)는 이 회전 보정 화상(804)을 각도(803)만 역회전하여도 인식 대상 화상(801)과 동일한 각도까지 되돌린 화상(807)을 생성하고 표시 장치(120)에 표시한다.With respect to the recognition target character string U806 on the
이상의 제일부터 제 4 실시 형태는 각각 별개로 실현되어도 좋고 모두 또는 일부를 선택적으로 채용하는 형태로 실현되어도 좋다.The first to fourth embodiments may be realized separately, or may be realized in a form in which all or part of them are selectively employed.
다음에, 제 5의 과제를 해결하기 위한 제 5의 실시 형태에 대해서 도 9로부터 도 12를 이용해 설명한다. 도 9는, 제 5의 실시 형태를 적용한 휴대 정보 단말의 블럭도의 일례이다. 도 1과의 차이는 검색어 추출부(170), 전자 사전(171)이 추가된 것이다.Next, 5th Embodiment for solving 5th subject is demonstrated using FIG. 9 thru | or FIG. 9 is an example of a block diagram of a portable information terminal to which the fifth embodiment is applied. The difference from FIG. 1 is that the
도 10은, 제 5의 과제를 해결하기 위한 수단을 적용한 문자인식, 사전 검색 처리를 도 9의 장치에 있어서 실시하는 경우의 플로차트의 일례이다. 화상 입력장치(110)로부터 문자인식 대상 화상이 입력(S1001)되면 화상 처리부(160)는 적당한 화상 처리를 원화상에 대해서 실시한 후, 문자인식부(150)의 문자행 추출부(151)에서 문자행이 추출된다(S1002). 그 후, 추출된 문자행에 대해서 문자행 인식부(152)는 1 문자마다 문자를 잘라 인식한 결과를 출력 한다(S1003). 인식 결과에는 1 문 자마다의 문자 코드와 거기에 대응하는 구형 좌표가 포함된다.FIG. 10 is an example of a flowchart in the case of performing the character recognition and the dictionary search process in the apparatus of FIG. 9 to which the means for solving the fifth problem is applied. When the character recognition target image is input from the image input device 110 (S1001), the
문자인식 한 결과는 검색어 후보 추출부(170)에 입력되어 형태소 해석에 의해 연속한 문자 열을 단어등의 형태소로 분해한다(S1004). 예를 들면, 도 9의 휴대 정보 단말의 디스플레이에 표시된 바와 같은 「문법의 지식을 사용한다고」라고 하는 문자 열의 경우, 도 11에 나타나는 바와 같은 테이블(1100)이 생성된다. 형태소 해석에 의해 분해된 문자 열과 거기에 대응하는 구형 좌표가 격납된다.The result of the character recognition is input to the search word
테이블(1100)의 데이터를 이용해 휴대 정보 단말의 디스플레이에 검색 대상의 후보어를 표시한다(S1005). 예를 들면, 커서의 중심 좌표와 테이블(1100)의 후보어 구형 좌표를 비교해 커서의 중심 좌표가 포함되는 후보어의 구형 좌표를 도 12의 1200에 나타나는 바와 같은 형태로 디스플레이에 표시한다.The candidate word to be searched for is displayed on the display of the portable information terminal using the data of the table 1100 (S1005). For example, the spherical coordinates of the candidate word including the center coordinates of the cursor are displayed on the display in a form as shown in 1200 of FIG. 12 by comparing the center coordinates of the cursor with the candidate word spherical coordinates of the table 1100.
다음에 커서 이동 키(174 혹은 176)를 누르는 것으로 검색 대상어의 구형 표시를 1201과 같이 이동시켜, 검색하고 싶은 구형이 표시되었을 때에 선택 버튼(175)을 눌러 검색 대상어가 결정된다(S1006). 결정된 검색 대상어는 전자 사전부 (171)에 대해서 출력된다. 전자 사전부(171)에서는 입력된 검색 대상어를 키로서 전자 사전을 검색해(S1007) 검색 결과를 디스플레이에 표시한다(S1008).Next, by pressing the
본 실시예에서는 형태소 해석을 이용해 검색 대상의 후보어를 생성했지만, 인식 결과의 문자 열중에서 「한자」로부터 「히라가나」로 변화하는 등, 문자의 카테고리가 바뀌는 지점에서 단락지어 후보어를 생성하는 방법도 좋다. 혹은, 문자 카테고리와 공백이나 문자 사이즈의 변화하는 장소 등 기하학적인 정보에 맞춰서 판단해도 괜찮다.In this embodiment, although candidate words for search are generated by using morpheme analysis, delimiting candidate words are generated at the point where the category of the letter changes, such as changing from "Chinese character" to "Hiragana" in the character string of the recognition result. Also good. Or you may judge based on geometric information, such as a character category, a space, and the location of a change of a character size.
다음에, 제 5의 과제를 해결하기 위한 제 6의 실시 형태에 대해서 도 9, 도 10 및 도 13으로부터 도 15를 이용해 설명한다. 본 실시예에서는 「‥·의 문법 지식을 사용한다·‥」와 같이 복수의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 「문법 지식」의 문자 열의 어느 쪽에 커서를 맞춘다고 가정한다.Next, 6th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, and FIG. 13 from FIG. In the present embodiment, it is assumed that the case where there is a kanji string composed of a plurality of morphemes, such as "Use grammar knowledge of ...", is adopted and the cursor is placed on either of the character strings of "grammar knowledge".
사용자는 「문법」 혹은, 「지식」과 같이 형태소만을 검색 대상으로 하고 싶은 경우와 「문법 지식」이라고 한 복합어 전체를 검색하고 싶은 경우가 존재하므로 이들의 선택의 부담을 경감하는 처리를 이하에서 설명한다. 제 6의 실시 형태 에 있어서, 도 10의 처리 플로우 챠트에서 다른 부분은 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)이므로, 그 처리에 대해서만 설명한다.Since a user may want to search only morphemes such as "grammar" or "knowledge", and may want to search the whole compound word "grammar knowledge", the following process will reduce the burden of these selections. do. In the sixth embodiment, the other parts in the processing flowchart of FIG. 10 are candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006), and therefore only the processing will be described.
후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해, 거기에 대응하는 도 13에 나타나는 바와 같은 구형 좌표 테이블(1300)을 생성한다. 다음에, 테이블(1300)로부터 「문법」 「문법 지식」 「지식」의 각각을 선택하기 위한 영역 좌표 테이블(1400)을 생성한다. 이 테이블은 커서 중심 좌표가 해당 영역에 들어가 있으면 그것에 대응하는 후보어의 구형을 표시하기 위한 테이블이다. In candidate word extraction S1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in FIG. 13 corresponding thereto is generated. Next, the area coordinate table 1400 for selecting each of "grammar", "grammar knowledge" and "knowledge" from the table 1300 is generated. This table is used to display the rectangle of candidate words corresponding to the cursor center coordinates in the corresponding area.
본테이블의 구형 좌표의 X좌표를 모식적으로 나타낸 것이 도 15이다. 「문법」 「문법 지식」 「지식」의 각각 대응하는 선택 영역은 1500, 1501, 1502이고, 커서의 중심 좌표가 어느 영역에 포함되는가에 의해 검색 후보어로서 표시하는 구형 좌표를 테이블(1400)으로부터 선택한다. 그리고 선택된 구형 좌표를 디스플레이에 표시한다(S1005).15 schematically shows the X coordinate of the spherical coordinates of the main table. The corresponding selection areas of the "grammar", "grammar knowledge" and "knowledge" are 1500, 1501 and 1502, respectively, and the spherical coordinates which are displayed as search candidates according to which area the center coordinates of the cursor are included are included in the table 1400. Choose. Then, the selected spherical coordinates are displayed on the display (S1005).
표시된 구형의 예를 도 16에 나타낸다. (a)는 커서가 「지식」의 선택 영역에 있는 경우의 표시예, (b)는 「문법 지식」, (c)는 「문법」으로 각각 커서가 선택 영역에 있는 경우의 표시예이다. 사용자는 검색하고 싶은 후보어의 구형이 표시되어 있으면 선택 키(175)를 눌러 검색 대상어를 선택한다(S1006). 본 실시예는 1 문자 은행내의 문자 열 선택에 대해서 설명했지만 상한의 문자행에 대한 영역 좌표 테이블을 맞추는 것으로, 복수의 문자행으로 건너는 선택이 가능하게 된다.An example of the displayed sphere is shown in FIG. 16. (a) is a display example when the cursor is in the selection area of "knowledge", (b) is "grammar knowledge", and (c) is "grammar", and is a display example when the cursor is in the selection area, respectively. If the rectangle of candidate words to be searched for is displayed, the user presses a
다음에, 제 5의 과제를 해결하기 위한 제 7의 실시 형태에 대해서 도 9, 도 10, 도 13, 도 17, 도 18을 이용해 설명한다. 제 6의 실시 형태와 동이리학[ 「·‥의 문법 지식을 사용한다·‥」와 같이 복수의 형태소로 구성되는 한자열이 있는 경우를 채택해 커서는 「문법」의 부분에 위치 하고 있는 경우를 상정한다. 또, 제 6의 실시 형태와 동일하게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.Next, a seventh embodiment for solving the fifth problem will be described with reference to FIGS. 9, 10, 13, 17, and 18. The sixth embodiment adopts the case where there is a kanji string composed of a plurality of morphemes, such as "I use grammar knowledge of ... ...", and the cursor is located in the "grammar" part. Imagine. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.
후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해 거기에 대응하는 도 13에 나타나는 바와 같은 구형 좌표 테이블(1300)을 생성한다. 테이블(1300)로부터 형태소와 그 복합어 각각 대응하는 구형 좌표 테이블(1700)(도 17)을 생성한다. 테이블은 좌상점좌표로 솔트되어 있는 것으로 가정한다.In candidate word extraction S1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in FIG. 13 corresponding thereto is generated. From the table 1300, a spherical coordinate table 1700 (FIG. 17) corresponding to each of the morphemes and their compound words is generated. The table is assumed to be salted with the upper left coordinate.
후보어 표시(S1005)에서는, 도 18에 나타나는 바와 같이 커서의 중심 좌표가 그 구형 영역에 포함되는 형태소의 구형(1800)을 최초로 표시한다. 다음에 커서 키 (176)을 누를 때마다 솔트된 테이블(1700)의 구형이 표시되어 간다. 사용자는 검색 하고 싶은 구형이 표시된 시점에서 선택 키(175)를 눌러 전자 사전을 검색할 수가 있다(S1006).In candidate word display S1005, as shown in FIG. 18, the
다음에, 제 5의 과제를 해결하기 위한 제 8의 실시 형태에 대해서 도 9, 도 10, 도 13, 도 19를 이용해 설명한다. 제 6의 실시 형태와 동일하게 「·‥의 문법 지식을 사용하는‥」바와 같이, 복수의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 커서는 「문법」의 부분에 위치 하고 있는 경우를 상정한다. 또, 제 6의 실시 형태와 같게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.Next, 8th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, FIG. 13, and FIG. As in the sixth embodiment, as in the case of using grammatical knowledge of ..., the case where there is a kanji string composed of plural morphemes is assumed, and the cursor is located in the "grammar" part. do. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.
후보어 추출 1004에서는, 제 5의 실시예에 나타난 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해, 거기에 대응하는 도 13에 나타내는 것 같은 구형 좌표 테이블(1300)을 생성한다. 그리고, 커서의 중심 좌표가 포함되는 후보어 구형을 도 19의 1900과 같은 형태로 표시한다(1005).In candidate word extraction 1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in Fig. 13 corresponding thereto is generated. In operation 1005, the candidate word rectangle including the center coordinates of the cursor is displayed in the form as shown in 1900 of FIG. 19.
여기에서, 「문법지식」과 같이 복합어를 선택하고 싶은 경우는 선택범위의 시점을 지정하는 의미를 준「1」키를 누른 후 커서 이동키(176)를 눌러 1901과 같은 구형을 표시한다. 또, 커서 이동키(176)를 누르면 1902와 같은 선택영역이 확대된다. 사용자가 커서 키로 적당한 검색 대상어의 구형이 표시된 시점에서 선택 키(175)를 눌러 검색 대상어를 선택한다(S1006).In this case, when a compound word is to be selected as in "grammar knowledge", a spherical shape such as 1901 is displayed by pressing the "1" key giving the meaning of specifying the starting point of the selection range and then pressing the
다음에 제 5의 과제를 해결하기 위한 제 9의 실시 형태에 대해서 도 9, 도 10, 도 20, 도 21을 이용해 설명한다. 「···의 문법 지식 처리를·‥」라고 하도록(듯이), 3개(살) 이상의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 커서는 「지식」의 부분에 위치 하고 있는 경우를 상정한다.Next, 9th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, FIG. 20, FIG. It is assumed that there is a kanji string composed of three or more morphemes, so that "grammar knowledge processing of ..." is called, and the cursor is located in the "knowledge" part. do.
3개 이상의 형태소로부터 구성되는 한자열의 경우, 통상, 사용자는 한자열전체를 검색 대상으로 하고 싶은가, 혹은, 커서 중심 좌표가 포함되어 있는 형태소만을 검색하고 싶은가의 어느 하나의 빈도가 높다고 생각한다. 거기서, 이들의 선택의 부담을 경감하는 처리를 이하에서 설명한다. 또, 제 6의 실시 형태와 동일하게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.In the case of a kanji string composed of three or more morphemes, the user generally thinks that the frequency is high whether one wants to search the entire kanji string or only the morphemes containing the cursor center coordinates. Here, the process of reducing the burden of these selection is demonstrated below. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.
후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 봐와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성 함과 동시에 후보어에 대응하는 문자종 카테고리를 구형 좌표를 격납 한 도 20에 나타내는 바와 같은 테이블(2000)을 생성한다. 여기서 말하는 문자종 카테고리는 후보어가 「한자」에 속하고 있으면 「한자」, 「히라가나」에 속하고 있으면 「히라가나」라고 한 경우에, 문자종의 카테고리별 분류 결과를 의미한다. 그리고, 커서의 중심 좌표가 포함되는 후보어(형태소)와 동일한 문자종 카테고리를 가지는 후보어의 구형을 통합해 도 21의 2100과 같은 형태로 표시한다(S1005).In candidate word extraction (S1004), as shown in FIG. 20 in which candidate words are generated by morphological analysis by the processing as shown in the fifth embodiment, and the character type categories corresponding to the candidate words are stored in the spherical coordinates. Create the same table 2000. The character category category referred to here means a classification result for each category of character species when the candidate word belongs to "kanji" and "hiragana" if it belongs to "kanji". Then, the rectangles of candidate words having the same character type category as the candidate words (morphemes) including the center coordinates of the cursor are combined and displayed in the form as shown in 2100 of FIG. 21 (S1005).
여기서 한자열전체는 아니고 「지식」이라고 하는 후보어만을 선택하고 싶은 경우는 선택의 모드를 바꾸는 의미를 주는「#」의 키를 눌러 2101과 같은 구형을 표시한다. 게다가 「지식 처리」라고 하는 문자 열을 선택하고 싶은 경우는, 선택 범위의 시점을 지정하는 의미를 주는 「1」의 키를 누른 후, 커서 이동 키(176)를 눌러 2102와 같은 구형을 표시한다. 사용자가 이러한 키 조작으로 적당한 검색 대상어의 구형이 표시된 시점에서 선택 키(175)를 눌러 검색 대상어를 선택한다 (S1006).In this case, when only a candidate word of "knowledge" is selected instead of the entire kanji string, a square such as 2101 is displayed by pressing the key of "#" which means changing the selection mode. In addition, to select a character string called "knowledge processing", after pressing the key of "1" which designates the starting point of the selection range, the
상기 실시예에서는 문자종의 카테고리로서 「한자」 「히라가나」만을 들었지만, 그 밖에도 「카타카나」 「영문자」 「숫자」 「기호」 「외국어」 등 문자종을 분류하는 임의의 카테고리가 적용된다. 부가하여, 문자종의 카테고리 대신에 그 형태소가 속하는 품사를 이용해도 좋다.In the above embodiment, only the "Chinese character" and "Hiragana" are mentioned as the category of the character species, but any category that classifies the character species such as "katakana", "English character", "number", "symbol" and "foreign language" is applied. In addition, a part-of-speech belonging to the morpheme may be used instead of the category of the character species.
또, 상기 실시예에서는 선택 범위의 시점을 지정하거나 선택의 모드를 바꾸기 위해서 각각 「1」, 「#」을 눌렀지만 동일한 의미를 할당한 키이면 임의의 키를 할당해도 좋다.In addition, in the above embodiment, any key may be assigned as long as "1" and "#" are pressed to designate the starting point of the selection range or to change the mode of selection.
또한, 본 실시예에서는 십자표의 커서의 중심 좌표를 선택 정보로서 이용했지만, 동일한 효과를 주는 방법이면 다른 정보에서도 좋다. 예를 들면, 양괄호를 디스플레이에 표시해 그 괄호의 중심 좌표 혹은, 양괄호의 구형 좌표를 이용해도 좋다. 또한, 일본어의 선택에서는 가로쓰기에 대해서 설명했지만 동일하게 세로 쓰기에 대해서도 적용 가능하다.In the present embodiment, the center coordinates of the cursor of the cross mark are used as the selection information. However, any other information may be used as long as the method gives the same effect. For example, the parentheses may be displayed on the display and the center coordinates of the parentheses or the spherical coordinates of the parentheses may be used. In addition, although the horizontal writing was described in the Japanese selection, the same applies to the vertical writing.
또, 상기 실시예는 각각 별개에 실현하여도 좋고, 모두 또는 일부를 선택적으로 채용하는 형태로 실현하여도 좋다.The above embodiments may be realized separately, or may be realized in a form in which all or part of them are selectively employed.
인식 대상의 화상의 기울기 상태를 시각적으로 알기 쉽게 표시하는 것으로, 사용자에게 화상이 기울어 있는 것을 인지시켜 문자인식 처리에 매우 적합한 각도로 화상을 촬영하는 것이 용이하게 된다.By displaying the inclination state of the image to be recognized visually, it is easy to recognize that the image is inclined by the user and to easily take an image at an angle that is very suitable for the character recognition process.
또, 과거에 촬영된 화상에 관해서는 기울어 있는 화상을 직접 편집해 그 결 과에 대해서 문자인식 처리를 실시할 수 있기 때문에 재차 촬영을 실시하지 않아도 마무리 된다.In addition, for images captured in the past, the tilted image can be directly edited and the character recognition process can be performed on the result, so that it is not necessary to shoot again.
또, 각도 보정이 곤란한 경우에도 경사진 상태로 문자 열의 선택이 가능해지기 때문에 어느 정도 경사진 화상에 대해서도 문자인식 처리를 실행할 수 있다.In addition, even when angle correction is difficult, the character string can be selected in an inclined state, so that the character recognition process can be performed even for an image inclined to some extent.
Claims (22)
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JPJP-P-2003-00379288 | 2003-11-10 | ||
| JP2003379288A JP4443194B2 (en) | 2003-11-10 | 2003-11-10 | Processing object selection method in portable terminal character recognition and portable terminal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20050045832A KR20050045832A (en) | 2005-05-17 |
| KR100615058B1 true KR100615058B1 (en) | 2006-08-22 |
Family
ID=34689385
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020040089371A Expired - Fee Related KR100615058B1 (en) | 2003-11-10 | 2004-11-04 | Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset |
Country Status (4)
| Country | Link |
|---|---|
| JP (1) | JP4443194B2 (en) |
| KR (1) | KR100615058B1 (en) |
| CN (1) | CN1292377C (en) |
| TW (1) | TWI294100B (en) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100754656B1 (en) * | 2005-06-20 | 2007-09-03 | 삼성전자주식회사 | Method and system for providing information related to image to user and mobile communication terminal for same |
| WO2007029740A1 (en) * | 2005-09-09 | 2007-03-15 | Canon Kabushiki Kaisha | Imaging apparatus |
| JP4844142B2 (en) * | 2006-02-06 | 2011-12-28 | セイコーエプソン株式会社 | Printer |
| KR100641791B1 (en) | 2006-02-14 | 2006-11-02 | (주)올라웍스 | Tagging method and system for digital data |
| US8144989B2 (en) | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
| US8208725B2 (en) | 2007-06-21 | 2012-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
| CN101482924B (en) * | 2008-01-08 | 2012-01-04 | 华晶科技股份有限公司 | Automatic identifying and correcting method for business card display angle |
| JP2012008733A (en) * | 2010-06-23 | 2012-01-12 | King Jim Co Ltd | Card information management device |
| KR101870773B1 (en) * | 2011-08-31 | 2018-06-26 | 삼성전자 주식회사 | Method and apparatus for managing schedule using optical character reader |
| CN103377371A (en) * | 2012-04-25 | 2013-10-30 | 佳能株式会社 | Method and system for improving recognition features and optical character recognition system |
| JP5940615B2 (en) * | 2014-09-09 | 2016-06-29 | 株式会社アイエスピー | Skew logic character recognition method, program, and portable terminal device for portable terminal device |
| JP6371662B2 (en) * | 2014-10-07 | 2018-08-08 | 富士通フロンテック株式会社 | Character recognition support device, character recognition support program, and character recognition support method |
| CN104461424B (en) * | 2014-12-01 | 2017-11-03 | 上海斐讯数据通信技术有限公司 | A kind of system and method that rotation character string is shown in cell |
| KR101712391B1 (en) | 2015-06-22 | 2017-03-07 | 한국표준과학연구원 | In-situ graph analysis application for smart-phone |
| CN106325522B (en) * | 2016-09-05 | 2019-03-29 | 广东小天才科技有限公司 | Method and device for adjusting size of cursor by electronic terminal |
| KR102391068B1 (en) * | 2020-07-24 | 2022-04-28 | 엄춘호 | Document recognition system and method |
| CN112183372A (en) * | 2020-09-29 | 2021-01-05 | 深圳数联天下智能科技有限公司 | Text recognition method, apparatus, device and readable storage medium |
| CN116311263A (en) * | 2023-03-10 | 2023-06-23 | 安徽淘云科技股份有限公司 | Display method, device, handheld reader, electronic device and storage medium |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07141465A (en) * | 1993-11-18 | 1995-06-02 | Ricoh Co Ltd | Document image skew detection method |
| JPH11250179A (en) * | 1998-02-27 | 1999-09-17 | Matsushita Joho System Kk | Character reocognition device and its method |
-
2003
- 2003-11-10 JP JP2003379288A patent/JP4443194B2/en not_active Expired - Fee Related
-
2004
- 2004-10-04 TW TW093129992A patent/TWI294100B/en not_active IP Right Cessation
- 2004-11-04 KR KR1020040089371A patent/KR100615058B1/en not_active Expired - Fee Related
- 2004-11-09 CN CNB2004100889727A patent/CN1292377C/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07141465A (en) * | 1993-11-18 | 1995-06-02 | Ricoh Co Ltd | Document image skew detection method |
| JPH11250179A (en) * | 1998-02-27 | 1999-09-17 | Matsushita Joho System Kk | Character reocognition device and its method |
Also Published As
| Publication number | Publication date |
|---|---|
| TW200516509A (en) | 2005-05-16 |
| CN1617163A (en) | 2005-05-18 |
| JP4443194B2 (en) | 2010-03-31 |
| KR20050045832A (en) | 2005-05-17 |
| TWI294100B (en) | 2008-03-01 |
| JP2005141603A (en) | 2005-06-02 |
| CN1292377C (en) | 2006-12-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100615058B1 (en) | Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset | |
| CN107656922B (en) | A translation method, device, terminal and storage medium | |
| US7239747B2 (en) | Method and system for locating position in printed texts and delivering multimedia information | |
| US9019308B2 (en) | Display apparatus and computer-readable medium | |
| US9251428B2 (en) | Entering information through an OCR-enabled viewfinder | |
| KR101291195B1 (en) | Apparatus and method for recognizing characters | |
| JP2011008752A (en) | Document operation system, document operation method and program thereof | |
| CN110188365B (en) | Word-taking translation method and device | |
| KR20120069699A (en) | Real-time camera dictionary | |
| EP2806336A1 (en) | Text prediction in a text input associated with an image | |
| CN110795918B (en) | Method, device and equipment for determining reading position | |
| US9135246B2 (en) | Electronic device with a dictionary function and dictionary information display method | |
| JPH06103411A (en) | Document reader | |
| JP4474231B2 (en) | Document link information acquisition system | |
| JP2006184415A (en) | Image processing apparatus, image processing program, and image processing method | |
| JP2008225676A (en) | Dictionary search device and control program thereof | |
| JP5605208B2 (en) | Electronic device and program with dictionary function | |
| JP4291870B1 (en) | Kanji recognition program, portable terminal device, and kanji recognition method | |
| CN110543238A (en) | Desktop interaction method based on artificial intelligence | |
| JP2006048324A (en) | Document translation system | |
| JPH0562008A (en) | Character recognition method | |
| JP4431335B2 (en) | String reader | |
| KR20240111397A (en) | Learning method and system using memory tape for printed book | |
| JPH06149888A (en) | Electronic filing system | |
| JP2006119942A (en) | Character string region cutout device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| FPAY | Annual fee payment |
Payment date: 20090818 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20100817 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20100817 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |