[go: up one dir, main page]

KR100615058B1 - Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset - Google Patents

Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset Download PDF

Info

Publication number
KR100615058B1
KR100615058B1 KR1020040089371A KR20040089371A KR100615058B1 KR 100615058 B1 KR100615058 B1 KR 100615058B1 KR 1020040089371 A KR1020040089371 A KR 1020040089371A KR 20040089371 A KR20040089371 A KR 20040089371A KR 100615058 B1 KR100615058 B1 KR 100615058B1
Authority
KR
South Korea
Prior art keywords
character
image
character recognition
candidate word
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020040089371A
Other languages
Korean (ko)
Other versions
KR20050045832A (en
Inventor
사카이츠구오
히마가미츠토시
오가타히사오
Original Assignee
히타치 오므론 터미널 솔루션즈 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 히타치 오므론 터미널 솔루션즈 가부시키가이샤 filed Critical 히타치 오므론 터미널 솔루션즈 가부시키가이샤
Publication of KR20050045832A publication Critical patent/KR20050045832A/en
Application granted granted Critical
Publication of KR100615058B1 publication Critical patent/KR100615058B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • H04M1/0264Details of the structure or mounting of specific components for a camera module assembly

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Telephone Function (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 휴대용 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치로서 카메라가 붙은 휴대 정보 단말에 있어서 문자인식처리를 정밀도 좋게 실시하기 위해서는 화상내에서 인식 대상의 문자 열이 경사되지 않게 할 필요가 있다. 혹은, 문자의 기술 방향으로 세로 쓰기와 가로쓰기의 2방법이 있는 경우, 올바른 문자인식 결과를 얻기 위해서 각각 맞춘 문자 행방향을 지정할 필요가 있다. 이들은 모두 사용자에 의한 지정 혹은 보정의 부담이 컸다. 또, 일본어를 문자인식하여 인식 결과를 키로서 검색 하려고 했을 경우, 영어단어와 달리 문자가 단락지을 수 없기 때문에 검색 대상어를 지정하는 사용자의 부담이 크다는 문제가 있었다.The present invention provides a method of selecting a processing target in character recognition of a portable information terminal device and a character string of a recognition target in an image in order to accurately perform character recognition processing in a portable information terminal with a camera as a portable information terminal device. It is necessary to prevent it. Alternatively, if there are two methods of writing vertically and horizontally in the description direction of the characters, it is necessary to specify the character line direction to be aligned in order to obtain a correct character recognition result. All of them had a heavy burden of designation or correction by the user. In addition, when attempting to search the recognition result as a key by recognizing Japanese characters, there is a problem in that a burden on a user to designate a search target language is large because the characters cannot be separated, unlike English words.

문자행의 경사를 적절히 수정하기 위해서 문자행의 기울기를 나타내는 인디케이터를 휴대 정보 단말 장치의 화상에 표시한다. 혹은, 일본어를 문자인식 해 인식결과를 키로서 검색하기 위해서 형태소 해석 결과와 커서의 위치 정보를 이용해 검색 대상어를 지정하는 기술을 제공한다.In order to properly correct the slope of the text line, an indicator indicating the slope of the text line is displayed on the image of the portable information terminal device. Alternatively, in order to search Japanese by character recognition and search for recognition results as keys, a technique of specifying a search target language using morphological analysis results and cursor position information is provided.

Description

휴대 정보 단말 장치의 문자인식에 있어서의 처리 대상 선택 방법 및 휴대 정보 단말 장치{Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset}Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset

도 1은 본 발명의 실시예에 있어서의 휴대 정보 단말의 플로터도이다. 1 is a plotter diagram of a portable information terminal in an embodiment of the present invention.

도 2는 본 발명의 실시예에 있어서의 플로우 챠트이다.2 is a flowchart in the embodiment of the present invention.

도 3은 본 발명의 실시예에 있어서의 플로우 챠트이다.3 is a flowchart in the embodiment of the present invention.

도 4는 본 발명의 실시예에 있어서의 각도 보정의 설명도이다. 4 is an explanatory diagram of angle correction in the embodiment of the present invention.

도 5는 본 발명의 실시예에 있어서의 플로우 챠트이다.5 is a flowchart in the embodiment of the present invention.

도 6은 본 발명의 실시예에 있어서의 화면을 나타내는 도이다. 6 is a diagram illustrating a screen in an embodiment of the present invention.

도 7은 본 발명의 실시예에 있어서의 플로우 챠트이다.7 is a flow chart in the embodiment of the present invention.

도 8은 본 발명의 실시예에 있어서의 문자 열 외접 구형 생성 방식의 설명도이다. 8 is an explanatory diagram of a character string circumscribed spherical generation method in the embodiment of the present invention.

도 9는 본 발명의 실시예에 있어서의 휴대 정보 단말의 블럭도이다.9 is a block diagram of a portable information terminal according to the embodiment of the present invention.

도 10은 본 발명의 실시예에 있어서의 플로우 챠트이다.10 is a flow chart in the embodiment of the present invention.

도 11은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다.It is explanatory drawing of the spherical coordinate table in the Example of this invention.

도 12는 본 발명의 실시예에 있어서의 검색 후보어의 선택 방식 설명도이다. 12 is an explanatory diagram of a selection method of a search candidate word in the embodiment of the present invention.

도 13은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.

도 14는 본 발명의 실시예에 있어서의 선택 영역 테이블의 설명도이다. 14 is an explanatory diagram of a selection area table in the embodiment of the present invention.

도 15는 본 발명의 실시예에 있어서의 구형 좌표의 설명도이다.It is explanatory drawing of the spherical coordinate in the Example of this invention.

도 16은 본 발명의 실시예를 설명하는 도이다.16 illustrates an embodiment of the present invention.

도 17은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.

도 18은 본 발명의 실시예를 설명하는 도이다.18 is a diagram for explaining an embodiment of the present invention.

도 19는 본 발명의 실시예를 설명하는 도이다.19 is a diagram illustrating an embodiment of the present invention.

도 20은 본 발명의 실시예에 있어서의 구형 좌표 테이블의 설명도이다. It is explanatory drawing of the spherical coordinate table in the Example of this invention.

도 21은 본 발명의 실시예를 설명하는 도이다.21 illustrates an embodiment of the present invention.

본 발명은 휴대 정보 단말 장치에 있어서의 광학식 문자인식을 실시할 때의 처리 대상 선택 방법에 관한 것이다.The present invention relates to a process object selection method when performing optical character recognition in a portable information terminal device.

카메라등의 화상 입력 기능을 탑재한 휴대용 전화 단말 장치 등과 같은 휴대 정보 단말 장치에 있어서 촬영한 화상에 대해서 광학식 문자인식을 실시하는 기술이 개발되고 있다. 그러나, 휴대 정보 단말의 카메라로 촬영된 화상은 손떨림등의 요인에 의해 화면에 대해서 문자 열이 기울어 촬영되는 경우가 많다. 거기서, 문자인식 결과가 잘못되어 있는(오독) 경우에는 재차 사용자에 촬영시의 각도를 조정하면서 촬영시킬지 인식 결과를 키보드등의 입력장치로 수정하고 있다.Background Art A technique for performing optical character recognition on an image photographed in a portable information terminal apparatus such as a portable telephone terminal apparatus equipped with an image input function such as a camera has been developed. However, the image photographed by the camera of the portable information terminal is often photographed with the character string tilted with respect to the screen due to factors such as camera shake. If the character recognition result is wrong (misreading), the recognition result is corrected by an input device such as a keyboard to photograph the user while adjusting the angle at the time of photographing again.

인식 처리에 앞서 인식 대상 문자 열의 기울기를 보정하는 기술로서는 인식 대상 문자 열의 기입된 용지에 미리 기재완료된 2개 이상의 표적을 검출해 지금부터 얻어진 기울기에 따라 자동적으로 회전을 실시한 후 인식하는 시도가 특허 문헌 1에 개시되고 있다.As a technique for correcting the inclination of the character string to be recognized prior to the recognition process, an attempt to recognize two or more targets already written on a sheet of paper in the character string to be recognized in advance and automatically rotate according to the inclination obtained from the present is disclosed. It is disclosed in 1.

또, 휴대 정보 단말에 있어서 영어 단어를 인식해 영일 사전을 찾는다고 하는 문자인식과 사전 검색을 결합한 사용법이 비특허 문헌 1에 개시되고 있다.In addition, Non-Patent Document 1 discloses a method of combining character recognition and dictionary search, such as recognizing an English word in a portable information terminal to find an English-Japanese dictionary.

[특허 문헌 1] 일본국 특개평11-250179호 공보(4~7항, 제3도)[Patent Document 1] Japanese Patent Application Laid-Open No. 11-250179 (paragraphs 4-7, 3)

[비특허 문헌 1] H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, “Inbformation Capturng Camera and Developmental Issues, “ In Proc. Int. Conf. Document Analysis and recognition, ICDAR '99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208.[Non-Patent Document 1] H. Fujisawa, H. Sako, Y. Okada, and S-W. Lee, “Inbformation Capturng Camera and Developmental Issues,” In Proc. Int. Conf. Document Analysis and recognition, ICDAR '99, Bangalore, India, Sep. 20-22, 1999, pp. 205-208.

문자인식 처리를 정밀도 좋게 실시하기 위해서는, 화상내에서 인식 대상의 문자 열이 경사하고 있지 않는 것이 중요하다. 그런데 디지탈카메라나 카메라 부착 휴대 전화 단말 장치 등의 휴대 정보 단말 장치에서 촬영한 디지털 화상의 경우, 해당 정보 단말장치를 손으로 보관 유지하는 경우가 많아 인식 대상의 문자 열이 화상내에서 기울지 않도록 하기 위해서는 촬영시에 특별한 주의가 필요하다(제 1의 과제).In order to perform the character recognition processing with high accuracy, it is important that the character string to be recognized is not inclined in the image. However, in the case of a digital image photographed by a portable information terminal device such as a digital camera or a mobile phone terminal device with a camera, the information terminal device is often held by hand, so that the character string of the object to be recognized is not tilted in the image. Special attention is required at the time of photography (first problem).

카메라 기능부착 휴대 정보 단말 장치에서 촬영된 화상에 대한 광학식 문자인식 기능에 있어서 문자 열이 기울어 촬영되었을 경우 종래 기술에서는 문자인식이 불가능, 혹은 충분한 인식 정밀도가 나오지 않는 문제가 있다. 그 때문에, 올바른 문자인식 결과를 얻기 위해서는 재차 인식 대상의 문자를 촬영해야 하는 과제가 있다.In the optical character recognition function of an image photographed by a portable information terminal device having a camera function, when a character string is photographed at an angle, the character recognition is not possible in the prior art, or sufficient recognition accuracy is not obtained. Therefore, in order to obtain a correct character recognition result, there is a problem of photographing a character to be recognized again.

특허 문헌 1에는 용지에 기재되어 있는 2개의 이상의 표적에 의해 기울기를 검출하는 취지가 기재되어 있지만 이 기술은 인식 대상의 용지에 미리 표적을 인자 혹은 기입해 둘 필요가 있고 명함등을 인식하는 경우에는 실용적이지 않다. 또, 과거에 촬영완료된 화상에 대해서 문자인식 처리를 실시하는 경우는 상기의 특별한 주위를 기울여 촬영되어 있지 않은 한, 인식 대상 문자 열이 화상내에서 경사하고 있는 경우가 있다. 이 경우는 문자인식 처리를 실시하기 전에 화상 처리 소프트웨어등을 이용해 화상의 각도 보정을 할 필요가 있다(제 2의 과제).Patent Document 1 discloses the purpose of detecting the tilt by two or more targets described on the paper, but this technique requires that the target be printed or written on the paper to be recognized in advance. Not practical When the character recognition processing is performed on an image that has been photographed in the past, the character string to be recognized may be inclined in the image unless the image is taken with the above special circumference. In this case, it is necessary to correct the angle of the image using image processing software or the like before performing the character recognition process (second task).

더욱, 문자의 기술 방향이 세로 쓰기와 가로쓰기의 2방법이 있는 경우, 화상의 각도를 조정해 인식 대상 문자 열을 추출했다고 해도, 문자인식에 해당해 인식 대상 문자 열이 세로 쓰기인가 가로쓰기인가를 설정할 필요가 있다. 명함등의 화상을 취득해 문자인식 처리를 실시하는 경우 세로쓰기와 가로쓰기의 포맷이 존재하기 때문에 그때마다 인식 모드를 설정 다시 하지 않으면 안 되는 문제가 있다. 또 신문, 잡지등 세로 쓰기 문자 열과 가로쓰기 문자 열이 혼재하고 있는 문서에 있어서도 문자의 기술 방향 변환의 부담은 크다(제 3 과제).Furthermore, if the description direction of the text has two methods of vertical writing and horizontal writing, even if the angle of the image is extracted to extract the character string to be recognized, whether the character string to be recognized corresponds to the character recognition is vertical writing or horizontal writing. You need to set In the case of acquiring an image such as a business card and performing character recognition processing, there is a problem in that the recognition mode must be set again each time since the formats of vertical writing and horizontal writing exist. In addition, even in documents in which vertical writing strings and horizontal writing strings, such as newspapers and magazines, are mixed, the burden of changing the technical direction of letters is great (third problem).

카메라부착 휴대 정보 단말 장치 등을 이용하는 경우 차량 이동중 등, 화상이 안정된 위치에서 촬영 하기 어려운 환경 아래에서의 이용을 좀 더 생각할 수 있다. 그러나, 종래 기술에서는 인식 대상 문자 열이 화상에 대해서 경사가 작게 억제 된 상태로 선택되지 않으면 문자인식 정밀도를 충분히 얻을 수 없었다. 그 때문에, 사용자는 인식 대상 화상을 촬영할 때에 각도를 조정하기 위해 특별한 주의가 필요했다 (제 4 과제).In the case of using a portable information terminal device with a camera or the like, use in an environment in which an image is difficult to shoot at a stable position, such as during a vehicle movement, can be considered. However, in the prior art, the character recognition accuracy could not be sufficiently obtained unless the character string to be recognized is selected in such a state that the inclination is suppressed small with respect to the image. Therefore, the user needed special attention to adjust the angle when photographing the recognition target image (fourth problem).

부가하여 카메라 부착 휴대 정보 단말 장치에 있어서 문자인식 한 결과를 이용해 사전 검색이나 인터넷의 검색을 실시하려고 했을 경우 영어단어의 경우는 공백에 의해 단어 단위로 나누어 지고 있으므로 검색 대상의 단어를 선택하는 것은 용이하다. 그러나, 동일한 처리를 일본어에 적용 하려고 하면 영어단어의 경우와 달리 단어간의 공백이라는 레이아웃 정보에 의한 단락이 존재하지 않기 때문에, 사용자는 검색 대상의 문자 열을 1 문자씩 선택할 필요가 있어 지정의 부담이 컸다(제 5의 과제).In addition, in case of attempting to perform dictionary search or internet search using the result of character recognition in portable information terminal device with camera, it is easy to select the word to be searched because English words are divided by word by space. Do. However, if you try to apply the same processing to Japanese, unlike the English word, there is no paragraph by layout information such as space between words, so the user needs to select the character string to be searched one by one, and the burden of designation is burdensome. It was large (fifth problem).

본 발명은 이들의 과제를 비추어 카메라 부착 휴대 정보 단말 장치에서 문자인식 대상물을 촬영할 때의 촬영자 부담을 경감하고, 또는 촬영 후의 화상을 문자인식에 매우 적합한 각도로 보정할 때의 부담을 경감하는 시스템 또는 방법을 제공하는 것을 목적으로 한다.SUMMARY OF THE INVENTION In view of these problems, the present invention reduces the burden of a photographer when photographing a character recognition object in a portable information terminal apparatus with a camera, or a system for reducing the burden of correcting an image after shooting at an angle that is very suitable for character recognition, or It is an object to provide a method.

또한, 일본어 등을 문자인식 해 사전이나 인터넷의 검색을 하는 경우에도, 검색 대상의 문자 열 지정하는 사용자의 부담을 경감하는 시스템 또는 방법을 제공하는 것을 목적으로 한다.Another object of the present invention is to provide a system or method for reducing the burden on a user who designates a character string to be searched even when searching a dictionary or the Internet by recognizing Japanese characters.

상기 제 1의 과제를 해결하기 위해 인식 대상 문자 열의 화상내에서의 기울기의 정도를 리얼타임으로 촬영자에게 제시 하는 각도 인디케이터를 정보 단말장치의 화상에 표시한다. 사용자는 각도 인디케이터에 표시되는 정보를 보면서 정보 단말장치 또는 인식 대상물을 움직여 적절한 위치에서 촬영함으로써 문자인식 처리에 매우 적합한 화상을 촬영할 수가 있다.In order to solve the first problem, an angle indicator for presenting the degree of inclination in the image of the character string to be recognized to the photographer in real time is displayed on the image of the information terminal apparatus. The user can capture an image which is very suitable for the character recognition process by moving the information terminal device or the recognition object and shooting at an appropriate position while viewing the information displayed on the angle indicator.

상기 제 2의 과제를 해결하기 위해서 촬영이 끝난 화상을 회전하는 것과 동 시에 인식 대상이 될 수 있는 문자 열의 행 추출을 리얼타임으로 실시하는 기능을 제공한다. 사용자는 간단한 키 조작등에 의해 촬영이 끝난 화상을 정보 단말장치의 화상에서 회전시켜 리얼타임으로 행 추출되는 인식 대상 문자 열 후보를 확인한다. 원하는 인식 대상 문자 열이 추출된 시점에서 사용자는 회전 처리를 정지, 복수의 행이 추출되고 있는 경우는 인식하고 싶은 문자 열을 선택해 인식 처리를 실행함으로써 과거에 촬영완료의 화상에 대한 문자인식 처리의 간편화를 도모한다.In order to solve the second problem, a function of real time extracting a row of character strings that can be recognized at the same time as rotating a photographed image is provided. The user checks the recognition target character string candidate to be row-extracted in real time by rotating the captured image on the image of the information terminal apparatus by a simple key operation or the like. When the desired character string to be recognized is extracted, the user stops the rotation process, and when a plurality of rows are extracted, the user selects the character string to be recognized and executes the recognition process to execute the character recognition process for the image that has been taken in the past. We plan to simplify.

상기 제3 과제를 해결하기 위해서 상기 인식 대상 문자 열이 세로 쓰기인가 가로쓰기인지를 자동적으로 판정하는 기능을 제공한다. 상기 인식 대상 문자 열 방향의 자동 판정에는 추출된 인식 대상 문자 열의 외접 구형의 어스펙트비를 이용한다. 구체적으로는 인식 대상 문자 열의 외접 구형의 높이와 폭의 비율이 규정치와 비교해 세로 쓰기 문자 열인가 가로쓰기 문자 열인가를 판단해 인식 처리를 실시한다. 사용하는 휴대 정보 단말 장치의 화면의 방향이 가변의 경우에는 화면의 방향에 따라 세로 쓰기·가로쓰기의 변환을 자동적으로 실시해도 괜찮다.In order to solve the third problem, a function of automatically determining whether the recognition target character string is vertical writing or horizontal writing is provided. In the automatic determination of the character string direction to be recognized, the aspect ratio of the circumscribed rectangle of the extracted character string to be recognized is used. Specifically, the recognition process is performed by determining whether the ratio of the height and width of the circumscribed rectangle of the character string to be recognized is the vertical character string or the horizontal character string compared to the prescribed value. When the orientation of the screen of the portable information terminal device to be used is variable, the vertical writing and horizontal writing may be automatically converted in accordance with the orientation of the screen.

상기 제 4 과제를 해결하기 위해서 인식 대상 문자 열의 경사 각도에 추종 해 자동적으로 인식 대상 문자 열을 선택하기 위한 외접 구형을 생성하는 수단을 제공한다. 구체적으로는 인식 대상 문자 열의 경사 각도를 예를 들면 일보눅 특개평7-141465「문서 화상의 기울기 검출 방법」방법을 이용해 계측 해 인식 대상 문자 열이 가로쓰기의 경우는 화상에 대해서 수평 위치에, 세로 쓰기의 경우는 화상에 대해서 수직 위치가 되도록 회전한 화상을 작성한다. 그 후 인식 대상 문자 열의 외접 구형을 생성해 상기 회전 후 화상에 추가한 회전 외접 구형 화상을 작성한 다. 이어서 상기 회전 외접 구형 화상을 회전해 원래의 문자 열의 경사 각도로 되돌려 정보 단말장치의 표시 장치에 표시한다.In order to solve the fourth problem, a means for generating an external spherical shape for automatically selecting a character string to be recognized following the inclination angle of the character string to be recognized is provided. Specifically, the angle of inclination of the character string to be recognized is measured using, for example, the Japanese Patent Application Laid-Open No. H7-141465 "Skew Detection Method for Document Images". In the case of vertical writing, the rotated image is created so as to be perpendicular to the image. Thereafter, a circumscribed rectangle of a character string to be recognized is generated, and a circumscribed rectangle image added to the rotated image is created. The rotating circumscribed spherical image is then rotated and returned to the inclination angle of the original character string to be displayed on the display device of the information terminal apparatus.

상기 제 5의 과제를 해결하기 위해서 일본어 등을 문자인식 한 결과에 대해서 형태소 해석을 실시해 검색 대상의 문자 열 후보를 자동적으로 생성해 사용자는 그들 개개의 후보를 선택 혹은, 그들 문자 열 후보의 조합을 선택하는 수단을 제공한다. In order to solve the fifth problem, morphological analysis is performed on the result of character recognition in Japanese and the like, and the character string candidates to be searched are automatically generated, and the user selects individual candidates or a combination of the character string candidates. It provides a means to choose.

도 1 ~ 20을 이용해 본 발명에 매우 적합한 일실시 형태를 설명한다. 본 발명의 문자인식 방식은 명함등을 읽어내 인식하는 휴대 정보 시스템등에 적용할 수 있어 예를 들면 휴대전화에서의 문자인식 기능에 적용할 수 있다.An embodiment very suitable for the present invention will be described with reference to FIGS. The text recognition method of the present invention can be applied to a portable information system that reads and recognizes a business card or the like, and can be applied to, for example, a text recognition function in a mobile phone.

도 1은 본 발명을 적용한 휴대 정보 단말의 블럭도의 일례이다. 본예에서는 휴대 정보 단말 본체(100), 인식 대상이 되는 명함등을 광학적으로 입력하는 카메라나 스캐너등의 화상 입력장치(110), 인식 대상의 화상이나 문자인식 결과, 커서 (121) 등을 표시하는 CRT나 액정등의 표시 장치(120), 사용자를 조작할 수 있는 버튼(131)등을 배치한 입력장치(130), 휴대 정보 단말 전체의 제어를 실시하기 때문에 단말 본체(100)내에 탑재된 제어부(140) 및 문자행 추출(151), 문자인식 처리 (152)등을 실시하는 문자인식부(150), 문자행 기울기의 정량화 기능(161) 및 화상 회전 처리 기능(162)을 갖는 화상 처리부(160)를 가진다.1 is an example of a block diagram of a portable information terminal to which the present invention is applied. In this example, the portable information terminal main body 100, an image input device 110 such as a camera or scanner that optically inputs a business card to be recognized, an image or character recognition result of the recognition target, a cursor 121, or the like is displayed. The control unit mounted in the terminal main body 100 for controlling the display device 120 such as a CRT or liquid crystal, the input device 130 including the buttons 131 for operating the user, and the entire portable information terminal. An image processing unit having a character recognition unit 150 which performs 140 and character line extraction 151, character recognition processing 152, etc., a quantification function of character line inclination 161, and an image rotation processing function 162 ( 160).

문자인식부(150)와 화상 처리부(160)는 소프트웨어의 기능으로서 제어부(140)와 동일한 회로상에서 동작해 지장이 없다. 입력장치는 버튼등의 일반적인 디 바이스로 문제 없지만 조작성의 향상을 위해서 표시 장치(120)와 입력장치(130)는 터치 패널등의 표시 장치겸 입력장치로서 실현될 수도 있다.The character recognition unit 150 and the image processing unit 160 operate on the same circuit as the control unit 140 as a function of the software, and do not interfere. The input device is not a problem as a general device such as a button, but the display device 120 and the input device 130 may be implemented as a display device and an input device such as a touch panel for improving operability.

도 2는, 제 1의 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 1의 실시 형태}. 사용자가 OCR 기능을 개시하면 화상 입력장치(110)로부터 입력되는 동화상이 표시 장치(120)에 표시된다(S201). 문자인식부(150)는 즉시 화상 표시 장치(120)에 표시되는 십자형등의 커서 (121)가 있는 영역에 대해서 문자행 추출 처리를 실행하고(S202), 추출된 문자행을 둘러싸는 외접 구형을 표시한다(S203).Fig. 2 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the first problem is applied (first embodiment). Input from the image input device 110 when the user starts the OCR function. The displayed moving image is displayed on the display device 120 (S201) .The character recognition unit 150 immediately executes the character line extraction processing for the area where the cursor 121, such as a cross, is displayed on the image display device 120. (S202) and an circumscribed rectangle surrounding the extracted character line is displayed (S203).

동시에 화상 처리부(160)에 의해 문자업의 기울기를 정량화해 그 정량화된 값을 막대 그래프등의 형태로 각도 인디케이터(indicator, 123) 에 가시화한다(S204). 정량화한 값은 문자행과 화상의 기울기의 정도를 반영하고 있으면 무엇이라도 좋지만, 예를 들면 문자행과 화상단변이 만드는 각도 θ의 역수에 비례하는 값을 채용하면 기울기가 작을 때에 각도 인디케이터(123)에 큰 값이 나타나 사용자는 직감적으로 조작할 수 있다.At the same time, the gradient of the character-up is quantified by the image processing unit 160 and the quantified value is visualized on the angle indicator 123 in the form of a bar graph or the like (S204). The quantified value may be any value as long as it reflects the degree of inclination of the text line and the image. For example, the angle indicator 123 may be used when the slope is small by employing a value proportional to the inverse of the angle θ produced by the text line and the image short side. A large value appears in the display and the user can intuitively manipulate it.

사용자가 촬영 버튼을 누를(S205) 때까지는 스텝(S201)으로 처리는 돌아오고, 이후(S201~S204)의 처리를 반복해 화면 표시를 계속 갱신한다.The process returns to step S201 until the user presses the photographing button (S205), and the subsequent processing is repeated (S201 to S204) to continuously update the screen display.

각도 인디케이터(123)를 참고에 사용자가 단말장치 또는 인식 대상물을 움직여, 적절한 촬영 위치에서 촬영 버튼을 누르(S205)면 화상 촬영(S206)을 실행한다. 계속 인식 버튼의 누르(S207)고 있으면 스텝(S203)에서 표시된 외접 구형내의 문자 열에 대해서 문자인식 처리(210)를 실행해 인식 결과를 표시한다(S211).Referring to the angle indicator 123, the user moves the terminal device or the object to be recognized and presses the photographing button at an appropriate photographing position (S205) to perform image photographing (S206). If the continuous recognition button is pressed (S207), the character recognition process 210 is executed for the character string in the circumscribed rectangle displayed in step S203 to display the recognition result (S211).

촬영 버튼을 누른(S205) 후에 캔슬 버튼을 누른 경우(S208)는 촬영한 화상을 파기해 스텝(S201)에 돌아온다. 그 이외의 버튼을 누른 경우는 각각 필요한 동작으로 이행한다(S209).If the cancel button is pressed after the photographing button is pressed (S205) (S208), the photographed image is discarded and the process returns to step S201. When other buttons are pressed, the process proceeds to the required operation (S209).

도 3은, 제 2의 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 2의 실시 형태). 휴대 정보 단말의 사용자가 이전 촬영된 정지화상을 로드(S301) 하는 조작을 실시하면, 상기 정지화상이 표시 장치(120)에 표시된다(S302). 문자인식부(150)는 즉시 문자행 추출(S303), 외접 구형 표시(S304) 및 각도 인디케이터 표시(S305)를 실시한다. 이 시점에서 처리는 사용자의 키 입력 대기(S306)로 이행한다.3 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the second problem is applied (second embodiment). When the user of the portable information terminal performs an operation of loading a still picture previously taken (S301), the still picture is displayed on the display device 120 (S302). The character recognition unit 150 immediately performs character line extraction (S303), circumscribed spherical display (S304), and angle indicator display (S305). At this point, the process shifts to the user's key input wait (S306).

사용자가 인식 실행 버튼을 누른(S307) 경우는 즉시 스텝(S304)에서 표시되고 있는 외접 구형의 내부의 문자 열에 대해서 문자인식 처리를 실행(S310)해, 문자인식 결과를 표시한다(S311). 사용자가 화살표 버튼을 누른(S308) 경우는, 누른 버튼에 의해 오른쪽 또는 좌방향에 일정 각도 화상을 회전한다(S309). 이 때, 회전의 중심은 문자행 구형이 중심이지만 사용자에 의해 지정하는 화상상의 일점을 중심으로 회전 처리를 실시해도 좋다.When the user presses the recognition execution button (S307), a character recognition process is immediately performed on the internal character string of the circumscribed rectangle displayed in step S304 (S310), and the character recognition result is displayed (S311). When the user presses the arrow button (S308), the button is rotated by a predetermined angle to the right or left direction (S309). At this time, the center of rotation is the character line rectangle, but the rotation process may be performed centering on one point on the image designated by the user.

화살표 버튼을 계속 누른 경우는 화상은 연속해 회전하는 것으로 해, 그것에 따라서 외접 구형 표시도 리얼타임으로 갱신된다. 사용자의 편의를 고려해 인식 실행 버튼 누름 조작을 화살표 버튼 누름을 멈추는(버튼으로부터 손가락을 떼어 놓는다) 동작으로 대행시켜도 괜찮다.If the arrow button is kept pressed, the image is rotated continuously, and the circumscribed spherical display is updated in real time accordingly. For the convenience of the user, the operation of pressing the recognition execution button may be replaced by the operation of stopping pressing the arrow button (releases the finger from the button).

도 4는 제 1의 실시 형태 및 제2의 실시 형태로 표시부(120)에 표시되는 화 상의 일례이다. 제 1의 실시 형태에서는 화상 입력장치(110)로부터 입력된 동영상이, 제2의 실시 형태는 이전에 촬영된 정지화면이 화상(400)으로서 표시부(120)에 표시된다.4 is an example of an image displayed on the display unit 120 in the first embodiment and the second embodiment. In the first embodiment, the moving image input from the image input device 110 is displayed, and in the second embodiment, the still image photographed previously is displayed on the display unit 120 as the image 400.

화상(400)내의 인식 대상 문자 열(401)은 이 시점에서는 기울고 있다. 화면의 중앙에는 회전 중심이 되는 십자 커서(402)가 표시되고 있다. 문자인식부(150)는 인식 대상 문자 열(401)을 둘러싸는 외접 구형(403)을 생성, 화상에 표시한다. 각도 인디케이터에는 기울어진 인식 대상 문자 열(401)의 기울기 정도를 나타내는 막대 그래프가 표시된다(404).The character string 401 to be recognized in the image 400 is inclined at this point. In the center of the screen, a cross cursor 402 serving as a rotation center is displayed. The character recognition unit 150 generates a circumscribed rectangle 403 surrounding the recognized character string 401 and displays it on the image. The angle indicator displays a bar graph indicating the degree of inclination of the inclined recognition character string 401 (404).

제 1의 실시 형태에서는 손으로 보관 유지하고 있는 휴대 정보 단말(카메라)을 회전(406)함으로써, 또, 제2의 실시 형태에서는 커서 키를 조작하는(405) 것에 따라 화상에 표시되는 화상을 회전한다. 화상의 회전에 따라서 인식 대상 문자 열(401)의 기울기가 작아짐에 따라, 외접 구형도 동기 해 형상이 변화한다(407).In the first embodiment, by rotating 406 the portable information terminal (camera) held by hand, in the second embodiment, the image displayed on the image is rotated by operating the cursor key (405). do. As the inclination of the character string 401 to be recognized decreases in accordance with the rotation of the image, the shape of the circumscribed sphere is also synchronized.

또한, 각도 인디케이터에는 인식 대상 문자열(U401)의 기울기가 작아진 것을 나타내는 큰 값이 막대 그래프로서 표시된다(408). 이용자는 화상의 회전 조작을 반복해 각도 인디케이터가 나타내는 값이 커지는 위치에서 문자인식 처리를 실행함으로써, 정밀도가 높은 문자인식 결과를 얻는 것이 가능해진다.In addition, a large value indicating that the slope of the recognition target character string U401 is smaller is displayed on the angle indicator as a bar graph (408). The user can obtain a highly accurate character recognition result by repeating the rotation operation of the image and performing the character recognition process at the position where the value indicated by the angle indicator becomes large.

도 5는, 제3 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 일례이다(제 3 실시 형태). 스텝(S501~S506)은 스텝(S201~S209)과 같아서 설명은 생략 한다.5 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the third problem is applied (third embodiment). Steps S501 to S506 are the same as steps S201 to S209, and description is omitted.

인식 버튼 누름(S504) 시점에서 인식 대상 문자 열의 외접 구형의 어스펙트 비(높이와 폭의 비율)를 계산해 미리 규정한 값(α)과 비교한다(S507). 만약 어스펙트비가 규정치 α보다 크면 세로 쓰기 문자 열이라고 판단, 세로 쓰기 문자 열 인식용의 파라미터 설정등을 실시(S510)해 문자인식 처리를 실시(S511), 결과를 표시한다(S512).At the point of time when the recognition button is pressed (S504), the aspect ratio (ratio of height and width) of the circumscribed rectangle of the character string to be recognized is calculated and compared with a predetermined value α (S507). If the aspect ratio is larger than the prescribed value α, it is determined that it is a vertical write character string, parameters are set for recognition of the vertical write character string (S510), a character recognition process is performed (S511), and the result is displayed (S512).

동일하게 만약 어스펙트비가 규정치(α)보다 크지 않으면 계속해 어스펙트비를 규정치(β)와 비교한다(S508). 만약 어스펙트비가 규정치(β)보다 작으면 가로쓰기 문자 열이라고 판단, 가로쓰기 문자 열 인식용의 파라미터 설정등을 실시(S509)해 문자인식 처리를 실시(S511), 결과를 표시한다(S512). 어스펙트비가 α이하 또한 β이상의 범위이면 문자 열은 충분히 각도 보정되어 있지 않은 것으로 인식 처리로 이행하지 않는다.Similarly, if the aspect ratio is not greater than the prescribed value α, then the aspect ratio is compared with the prescribed value β (S508). If the aspect ratio is smaller than the prescribed value (β), it is determined that the horizontal character string is a character string, and a parameter for recognizing the character string is performed (S509), a character recognition process is performed (S511), and the result is displayed (S512). . If the aspect ratio is in the range of α or less and β or more, the character string is not sufficiently angle corrected and does not proceed to the recognition process.

도 6은 제3 실시 형태로 표시부(120)에 표시되는 화상의 일례이다. 가로쓰기의 문자 열(601)의 경우는 외접 구형의 높이(602)가 폭(603)에 대해서 작아진다. 어스펙트비를 외접 구형의 높이/외접 구형의 폭으로 정의 하면 어스펙트비가 1 보다 작은 경우는 외접 구형은 횡길이가 된다. 6 is an example of an image displayed on the display unit 120 in the third embodiment. In the case of the horizontal writing character string 601, the height 602 of the circumscribed rectangle becomes smaller with respect to the width 603. If the aspect ratio is defined as the height of the circumscribed rectangle / the width of the circumscribed rectangle, the lateral rectangle becomes the lateral length if the aspect ratio is less than one.

예를 들면, 어스펙트비와 비교하는 규정치(β)를 0.5로 설정했을 경우, 어스펙트비가 0.5를 밑돈 상태로 문자인식을 기동하면 가로쓰기 문자 열로서 필요한 설정을 자동적으로 실시한다. 상기와 같이 세로 쓰기 문자 열(604)의 경우는, 외접 구형의 높이(605)가 폭(606)에 대해서 커진다.For example, when the prescribed value β to be compared with the aspect ratio is set to 0.5, when the character recognition is started with the aspect ratio lower than 0.5, the necessary setting is automatically performed as the horizontal writing string. As described above, in the case of the vertical writing character string 604, the height 605 of the circumscribed rectangle increases with respect to the width 606.

상기와 같은 어스펙트비의 정의이면 어스펙트비가 1보다 큰 경우는 외접 구형은 종 길이가 된다. 예를 들면, 어스펙트비와 비교하는 규정치(α)를 1.5로 설정 했을 경우, 어스펙트비가 1.5를 웃돈 상태로 문자인식을 기동하면 세로 쓰기 문자 열로서 필요한 설정을 자동적으로 실시한다.In the above aspect ratio definition, when the aspect ratio is larger than 1, the circumscribed sphere is the longitudinal length. For example, when the prescribed value (α) to be compared with the aspect ratio is set to 1.5, when the character ratio is activated with the aspect ratio exceeding 1.5, the necessary setting as the vertical writing string is automatically performed.

도 7은, 제 4 과제를 해결하기 위한 수단을 적용한 문자인식 처리를 실시하는 경우의 플로차트의 1예이다(제 4 실시예).7 is an example of a flowchart in the case of performing a character recognition process to which the means for solving the fourth problem is applied (fourth embodiment).

화상 입력장치(110)로부터 문자인식 대상 화상이 입력(S701)되면 화상 처리부(160)는 즉시 인식 대상 문자 열의 화상에 대한 각도를 계산해(S702), 입력된 문자인식 대상 화상을 해당 각도분 회전 보정한다. 보정 방향은 가로쓰기 문자 열이면 화면에 대해서 수평 방향으로, 세로 쓰기 문자 열이면 화면에 대해서 수직 방향이 되도록 각각 회전한다.When the character recognition target image is input from the image input apparatus 110 (S701), the image processing unit 160 immediately calculates an angle with respect to the image of the character string to be recognized (S702), and corrects the input character recognition target image by the corresponding angle rotation. do. The correction direction is rotated so as to be horizontal with respect to the screen in the case of the horizontal writing string, and perpendicular to the screen in the case of the vertical writing string.

다음에, 상기 회전 후 화상에 대해서 문자 열 추출을 실시해, 상기 회전 후 화상에 외접 구형을 부가해(S704) 이 화상을 화상 버퍼에 보존한다. 화상 버퍼에 보존하는 화상은 화상 전체라도 좋고, 부가한 외접 구형 내부만 이라도 좋다.Next, character string extraction is performed on the post-rotation image, and an external spherical shape is added to the post-rotation image (S704) to store this image in the image buffer. The image to be stored in the image buffer may be the whole image, or may be only the added external spherical shape.

다음으로 상기 회전 후 화상을 스텝(S702)에서 검출한 각도분만큼 역회전해 원래의 입력 화상과 동일하게 기울어진 화상을 작성해 단말장치의 표시부(120)에 표시한다. 사용자가 특히 조작하지 않으면 스텝(S701)으로 돌아가고 새로운 입력 화상에 대해 스텝(S701~S707)의 처리를 반복한다.Next, the rotated image is reversely rotated by the angle detected in step S702, and an image inclined in the same manner as the original input image is created and displayed on the display unit 120 of the terminal device. If the user does not operate in particular, the process returns to step S701 and the processes of steps S701 to S707 are repeated for the new input image.

만약 인식 버튼이 눌려지면, 이 스텝(S705)에서 화상 버퍼에 격납된 화상을 읽어내(S710), 그 화상에 대해서 문자인식 처리를 실행(S711), 문자인식 결과를 표시한다(S712).If the recognition button is pressed, the image stored in the image buffer is read out in this step S705 (S710), a character recognition process is executed for the image (S711), and the character recognition result is displayed (S712).

도 8은 제 4 실시 형태로 처리되는 화상 상태의 일례이다. 화상 입력장치 (110)로부터 입력된 인식 대상 화상(801) 상의 인식 대상 문자열(U802)은 화면에 대해서 경사진 상태이다. 화상 처리부(160)는 인식 대상 문자 열(802)이 화면의 가장자리를 이루는 각도(803)를 검출해 각도(803)만 화상을 회전, 인식 대상 문자 열이 화면에 대해서 수평이 되도록 보정해, 회전 보정 화상(804)을 작성한다.8 is an example of an image state processed in the fourth embodiment. The recognition target character string U802 on the recognition target image 801 input from the image input device 110 is inclined with respect to the screen. The image processing unit 160 detects the angle 803 where the recognition target character string 802 forms the edge of the screen, rotates the image only by the angle 803, and corrects the recognition character string so that it is horizontal with respect to the screen. The corrected image 804 is created.

회전 보정 화상(804) 상의 인식 대상 문자열(U806)에 대해, 문자인식부(150)는 문자행 추출을 실시해 외접 구형(806)을 부가한다. 화상 처리부(160)는 이 회전 보정 화상(804)을 각도(803)만 역회전하여도 인식 대상 화상(801)과 동일한 각도까지 되돌린 화상(807)을 생성하고 표시 장치(120)에 표시한다.With respect to the recognition target character string U806 on the rotation correction image 804, the character recognition unit 150 performs character line extraction to add a circumscribed rectangle 806. FIG. The image processing unit 160 generates the image 807 returned by the rotation correction image 804 to the same angle as the recognition target image 801 even if only the angle 803 is reversely rotated, and displays it on the display device 120. .

이상의 제일부터 제 4 실시 형태는 각각 별개로 실현되어도 좋고 모두 또는 일부를 선택적으로 채용하는 형태로 실현되어도 좋다.The first to fourth embodiments may be realized separately, or may be realized in a form in which all or part of them are selectively employed.

다음에, 제 5의 과제를 해결하기 위한 제 5의 실시 형태에 대해서 도 9로부터 도 12를 이용해 설명한다. 도 9는, 제 5의 실시 형태를 적용한 휴대 정보 단말의 블럭도의 일례이다. 도 1과의 차이는 검색어 추출부(170), 전자 사전(171)이 추가된 것이다.Next, 5th Embodiment for solving 5th subject is demonstrated using FIG. 9 thru | or FIG. 9 is an example of a block diagram of a portable information terminal to which the fifth embodiment is applied. The difference from FIG. 1 is that the search word extractor 170 and the electronic dictionary 171 are added.

도 10은, 제 5의 과제를 해결하기 위한 수단을 적용한 문자인식, 사전 검색 처리를 도 9의 장치에 있어서 실시하는 경우의 플로차트의 일례이다. 화상 입력장치(110)로부터 문자인식 대상 화상이 입력(S1001)되면 화상 처리부(160)는 적당한 화상 처리를 원화상에 대해서 실시한 후, 문자인식부(150)의 문자행 추출부(151)에서 문자행이 추출된다(S1002). 그 후, 추출된 문자행에 대해서 문자행 인식부(152)는 1 문자마다 문자를 잘라 인식한 결과를 출력 한다(S1003). 인식 결과에는 1 문 자마다의 문자 코드와 거기에 대응하는 구형 좌표가 포함된다.FIG. 10 is an example of a flowchart in the case of performing the character recognition and the dictionary search process in the apparatus of FIG. 9 to which the means for solving the fifth problem is applied. When the character recognition target image is input from the image input device 110 (S1001), the image processing unit 160 performs appropriate image processing on the original image, and then the character line extracting unit 151 of the character recognition unit 150 executes the character. The row is extracted (S1002). Thereafter, the character line recognition unit 152 outputs a result of cutting and recognizing the character for each character with respect to the extracted character line (S1003). The recognition result includes the character code for each character and the corresponding spherical coordinates.

문자인식 한 결과는 검색어 후보 추출부(170)에 입력되어 형태소 해석에 의해 연속한 문자 열을 단어등의 형태소로 분해한다(S1004). 예를 들면, 도 9의 휴대 정보 단말의 디스플레이에 표시된 바와 같은 「문법의 지식을 사용한다고」라고 하는 문자 열의 경우, 도 11에 나타나는 바와 같은 테이블(1100)이 생성된다. 형태소 해석에 의해 분해된 문자 열과 거기에 대응하는 구형 좌표가 격납된다.The result of the character recognition is input to the search word candidate extraction unit 170 to decompose the continuous string of characters into morphemes such as words by morpheme analysis (S1004). For example, in the case of the character string "to use the knowledge of grammar" as displayed on the display of the portable information terminal of FIG. 9, a table 1100 as shown in FIG. 11 is generated. The string decomposed by the morphological analysis and the corresponding rectangular coordinates are stored.

테이블(1100)의 데이터를 이용해 휴대 정보 단말의 디스플레이에 검색 대상의 후보어를 표시한다(S1005). 예를 들면, 커서의 중심 좌표와 테이블(1100)의 후보어 구형 좌표를 비교해 커서의 중심 좌표가 포함되는 후보어의 구형 좌표를 도 12의 1200에 나타나는 바와 같은 형태로 디스플레이에 표시한다.The candidate word to be searched for is displayed on the display of the portable information terminal using the data of the table 1100 (S1005). For example, the spherical coordinates of the candidate word including the center coordinates of the cursor are displayed on the display in a form as shown in 1200 of FIG. 12 by comparing the center coordinates of the cursor with the candidate word spherical coordinates of the table 1100.

다음에 커서 이동 키(174 혹은 176)를 누르는 것으로 검색 대상어의 구형 표시를 1201과 같이 이동시켜, 검색하고 싶은 구형이 표시되었을 때에 선택 버튼(175)을 눌러 검색 대상어가 결정된다(S1006). 결정된 검색 대상어는 전자 사전부 (171)에 대해서 출력된다. 전자 사전부(171)에서는 입력된 검색 대상어를 키로서 전자 사전을 검색해(S1007) 검색 결과를 디스플레이에 표시한다(S1008).Next, by pressing the cursor shift key 174 or 176, the spherical display of the search target word is moved as shown in 1201. When the rectangle to be searched is displayed, the selection target button 175 is pressed to determine the search target word (S1006). The determined search target word is output to the electronic dictionary unit 171. The electronic dictionary unit 171 searches the electronic dictionary with the input search target word as a key (S1007) and displays the search result on the display (S1008).

본 실시예에서는 형태소 해석을 이용해 검색 대상의 후보어를 생성했지만, 인식 결과의 문자 열중에서 「한자」로부터 「히라가나」로 변화하는 등, 문자의 카테고리가 바뀌는 지점에서 단락지어 후보어를 생성하는 방법도 좋다. 혹은, 문자 카테고리와 공백이나 문자 사이즈의 변화하는 장소 등 기하학적인 정보에 맞춰서 판단해도 괜찮다.In this embodiment, although candidate words for search are generated by using morpheme analysis, delimiting candidate words are generated at the point where the category of the letter changes, such as changing from "Chinese character" to "Hiragana" in the character string of the recognition result. Also good. Or you may judge based on geometric information, such as a character category, a space, and the location of a change of a character size.

다음에, 제 5의 과제를 해결하기 위한 제 6의 실시 형태에 대해서 도 9, 도 10 및 도 13으로부터 도 15를 이용해 설명한다. 본 실시예에서는 「‥·의 문법 지식을 사용한다·‥」와 같이 복수의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 「문법 지식」의 문자 열의 어느 쪽에 커서를 맞춘다고 가정한다.Next, 6th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, and FIG. 13 from FIG. In the present embodiment, it is assumed that the case where there is a kanji string composed of a plurality of morphemes, such as "Use grammar knowledge of ...", is adopted and the cursor is placed on either of the character strings of "grammar knowledge".

사용자는 「문법」 혹은, 「지식」과 같이 형태소만을 검색 대상으로 하고 싶은 경우와 「문법 지식」이라고 한 복합어 전체를 검색하고 싶은 경우가 존재하므로 이들의 선택의 부담을 경감하는 처리를 이하에서 설명한다. 제 6의 실시 형태 에 있어서, 도 10의 처리 플로우 챠트에서 다른 부분은 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)이므로, 그 처리에 대해서만 설명한다.Since a user may want to search only morphemes such as "grammar" or "knowledge", and may want to search the whole compound word "grammar knowledge", the following process will reduce the burden of these selections. do. In the sixth embodiment, the other parts in the processing flowchart of FIG. 10 are candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006), and therefore only the processing will be described.

후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해, 거기에 대응하는 도 13에 나타나는 바와 같은 구형 좌표 테이블(1300)을 생성한다. 다음에, 테이블(1300)로부터 「문법」 「문법 지식」 「지식」의 각각을 선택하기 위한 영역 좌표 테이블(1400)을 생성한다. 이 테이블은 커서 중심 좌표가 해당 영역에 들어가 있으면 그것에 대응하는 후보어의 구형을 표시하기 위한 테이블이다. In candidate word extraction S1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in FIG. 13 corresponding thereto is generated. Next, the area coordinate table 1400 for selecting each of "grammar", "grammar knowledge" and "knowledge" from the table 1300 is generated. This table is used to display the rectangle of candidate words corresponding to the cursor center coordinates in the corresponding area.

본테이블의 구형 좌표의 X좌표를 모식적으로 나타낸 것이 도 15이다. 「문법」 「문법 지식」 「지식」의 각각 대응하는 선택 영역은 1500, 1501, 1502이고, 커서의 중심 좌표가 어느 영역에 포함되는가에 의해 검색 후보어로서 표시하는 구형 좌표를 테이블(1400)으로부터 선택한다. 그리고 선택된 구형 좌표를 디스플레이에 표시한다(S1005).15 schematically shows the X coordinate of the spherical coordinates of the main table. The corresponding selection areas of the "grammar", "grammar knowledge" and "knowledge" are 1500, 1501 and 1502, respectively, and the spherical coordinates which are displayed as search candidates according to which area the center coordinates of the cursor are included are included in the table 1400. Choose. Then, the selected spherical coordinates are displayed on the display (S1005).

표시된 구형의 예를 도 16에 나타낸다. (a)는 커서가 「지식」의 선택 영역에 있는 경우의 표시예, (b)는 「문법 지식」, (c)는 「문법」으로 각각 커서가 선택 영역에 있는 경우의 표시예이다. 사용자는 검색하고 싶은 후보어의 구형이 표시되어 있으면 선택 키(175)를 눌러 검색 대상어를 선택한다(S1006). 본 실시예는 1 문자 은행내의 문자 열 선택에 대해서 설명했지만 상한의 문자행에 대한 영역 좌표 테이블을 맞추는 것으로, 복수의 문자행으로 건너는 선택이 가능하게 된다.An example of the displayed sphere is shown in FIG. 16. (a) is a display example when the cursor is in the selection area of "knowledge", (b) is "grammar knowledge", and (c) is "grammar", and is a display example when the cursor is in the selection area, respectively. If the rectangle of candidate words to be searched for is displayed, the user presses a selection key 175 to select a search target word (S1006). Although the present embodiment has described the selection of character strings in a single character bank, by selecting an area coordinate table for the upper limit character row, selection to cross over a plurality of character lines becomes possible.

다음에, 제 5의 과제를 해결하기 위한 제 7의 실시 형태에 대해서 도 9, 도 10, 도 13, 도 17, 도 18을 이용해 설명한다. 제 6의 실시 형태와 동이리학[ 「·‥의 문법 지식을 사용한다·‥」와 같이 복수의 형태소로 구성되는 한자열이 있는 경우를 채택해 커서는 「문법」의 부분에 위치 하고 있는 경우를 상정한다. 또, 제 6의 실시 형태와 동일하게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.Next, a seventh embodiment for solving the fifth problem will be described with reference to FIGS. 9, 10, 13, 17, and 18. The sixth embodiment adopts the case where there is a kanji string composed of a plurality of morphemes, such as "I use grammar knowledge of ... ...", and the cursor is located in the "grammar" part. Imagine. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.

후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해 거기에 대응하는 도 13에 나타나는 바와 같은 구형 좌표 테이블(1300)을 생성한다. 테이블(1300)로부터 형태소와 그 복합어 각각 대응하는 구형 좌표 테이블(1700)(도 17)을 생성한다. 테이블은 좌상점좌표로 솔트되어 있는 것으로 가정한다.In candidate word extraction S1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in FIG. 13 corresponding thereto is generated. From the table 1300, a spherical coordinate table 1700 (FIG. 17) corresponding to each of the morphemes and their compound words is generated. The table is assumed to be salted with the upper left coordinate.

후보어 표시(S1005)에서는, 도 18에 나타나는 바와 같이 커서의 중심 좌표가 그 구형 영역에 포함되는 형태소의 구형(1800)을 최초로 표시한다. 다음에 커서 키 (176)을 누를 때마다 솔트된 테이블(1700)의 구형이 표시되어 간다. 사용자는 검색 하고 싶은 구형이 표시된 시점에서 선택 키(175)를 눌러 전자 사전을 검색할 수가 있다(S1006).In candidate word display S1005, as shown in FIG. 18, the morpheme rectangle 1800 whose center coordinates are contained in the rectangle area is displayed for the first time. Each time the cursor key 176 is pressed, the rectangle of the salted table 1700 is displayed. The user can search the electronic dictionary by pressing the selection key 175 at the time when the sphere to be searched is displayed (S1006).

다음에, 제 5의 과제를 해결하기 위한 제 8의 실시 형태에 대해서 도 9, 도 10, 도 13, 도 19를 이용해 설명한다. 제 6의 실시 형태와 동일하게 「·‥의 문법 지식을 사용하는‥」바와 같이, 복수의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 커서는 「문법」의 부분에 위치 하고 있는 경우를 상정한다. 또, 제 6의 실시 형태와 같게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.Next, 8th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, FIG. 13, and FIG. As in the sixth embodiment, as in the case of using grammatical knowledge of ..., the case where there is a kanji string composed of plural morphemes is assumed, and the cursor is located in the "grammar" part. do. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.

후보어 추출 1004에서는, 제 5의 실시예에 나타난 바와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성해, 거기에 대응하는 도 13에 나타내는 것 같은 구형 좌표 테이블(1300)을 생성한다. 그리고, 커서의 중심 좌표가 포함되는 후보어 구형을 도 19의 1900과 같은 형태로 표시한다(1005).In candidate word extraction 1004, a candidate word is generated by morphological analysis by the processing as shown in the fifth embodiment, and a spherical coordinate table 1300 as shown in Fig. 13 corresponding thereto is generated. In operation 1005, the candidate word rectangle including the center coordinates of the cursor is displayed in the form as shown in 1900 of FIG. 19.

여기에서, 「문법지식」과 같이 복합어를 선택하고 싶은 경우는 선택범위의 시점을 지정하는 의미를 준「1」키를 누른 후 커서 이동키(176)를 눌러 1901과 같은 구형을 표시한다. 또, 커서 이동키(176)를 누르면 1902와 같은 선택영역이 확대된다. 사용자가 커서 키로 적당한 검색 대상어의 구형이 표시된 시점에서 선택 키(175)를 눌러 검색 대상어를 선택한다(S1006).In this case, when a compound word is to be selected as in "grammar knowledge", a spherical shape such as 1901 is displayed by pressing the "1" key giving the meaning of specifying the starting point of the selection range and then pressing the cursor movement key 176. If the cursor movement key 176 is pressed, the selection area as shown in 1902 is expanded. When the user presses the selection key 175 at the time when the appropriate sphere of the search target word is displayed by the cursor key (S1006).

다음에 제 5의 과제를 해결하기 위한 제 9의 실시 형태에 대해서 도 9, 도 10, 도 20, 도 21을 이용해 설명한다. 「···의 문법 지식 처리를·‥」라고 하도록(듯이), 3개(살) 이상의 형태소로부터 구성되는 한자열이 있는 경우를 채택해 커서는 「지식」의 부분에 위치 하고 있는 경우를 상정한다.Next, 9th Embodiment for solving 5th subject is demonstrated using FIG. 9, FIG. 10, FIG. 20, FIG. It is assumed that there is a kanji string composed of three or more morphemes, so that "grammar knowledge processing of ..." is called, and the cursor is located in the "knowledge" part. do.

3개 이상의 형태소로부터 구성되는 한자열의 경우, 통상, 사용자는 한자열전체를 검색 대상으로 하고 싶은가, 혹은, 커서 중심 좌표가 포함되어 있는 형태소만을 검색하고 싶은가의 어느 하나의 빈도가 높다고 생각한다. 거기서, 이들의 선택의 부담을 경감하는 처리를 이하에서 설명한다. 또, 제 6의 실시 형태와 동일하게 후보어 추출(S1004)과 후보어 표시(S1005), 후보어 선택(S1006)만을 설명한다.In the case of a kanji string composed of three or more morphemes, the user generally thinks that the frequency is high whether one wants to search the entire kanji string or only the morphemes containing the cursor center coordinates. Here, the process of reducing the burden of these selection is demonstrated below. As in the sixth embodiment, only candidate word extraction (S1004), candidate word display (S1005), and candidate word selection (S1006) will be described.

후보어 추출(S1004)에서는 제 5의 실시예에 나타낸 봐와 같은 처리에 의해 형태소 해석에 의해 후보어를 생성 함과 동시에 후보어에 대응하는 문자종 카테고리를 구형 좌표를 격납 한 도 20에 나타내는 바와 같은 테이블(2000)을 생성한다. 여기서 말하는 문자종 카테고리는 후보어가 「한자」에 속하고 있으면 「한자」, 「히라가나」에 속하고 있으면 「히라가나」라고 한 경우에, 문자종의 카테고리별 분류 결과를 의미한다. 그리고, 커서의 중심 좌표가 포함되는 후보어(형태소)와 동일한 문자종 카테고리를 가지는 후보어의 구형을 통합해 도 21의 2100과 같은 형태로 표시한다(S1005).In candidate word extraction (S1004), as shown in FIG. 20 in which candidate words are generated by morphological analysis by the processing as shown in the fifth embodiment, and the character type categories corresponding to the candidate words are stored in the spherical coordinates. Create the same table 2000. The character category category referred to here means a classification result for each category of character species when the candidate word belongs to "kanji" and "hiragana" if it belongs to "kanji". Then, the rectangles of candidate words having the same character type category as the candidate words (morphemes) including the center coordinates of the cursor are combined and displayed in the form as shown in 2100 of FIG. 21 (S1005).

여기서 한자열전체는 아니고 「지식」이라고 하는 후보어만을 선택하고 싶은 경우는 선택의 모드를 바꾸는 의미를 주는「#」의 키를 눌러 2101과 같은 구형을 표시한다. 게다가 「지식 처리」라고 하는 문자 열을 선택하고 싶은 경우는, 선택 범위의 시점을 지정하는 의미를 주는 「1」의 키를 누른 후, 커서 이동 키(176)를 눌러 2102와 같은 구형을 표시한다. 사용자가 이러한 키 조작으로 적당한 검색 대상어의 구형이 표시된 시점에서 선택 키(175)를 눌러 검색 대상어를 선택한다 (S1006).In this case, when only a candidate word of "knowledge" is selected instead of the entire kanji string, a square such as 2101 is displayed by pressing the key of "#" which means changing the selection mode. In addition, to select a character string called "knowledge processing", after pressing the key of "1" which designates the starting point of the selection range, the cursor movement key 176 is pressed to display a rectangle such as 2102. . The user presses the select key 175 to select a search target word at a time when a suitable sphere of search target word is displayed by this key operation (S1006).

상기 실시예에서는 문자종의 카테고리로서 「한자」 「히라가나」만을 들었지만, 그 밖에도 「카타카나」 「영문자」 「숫자」 「기호」 「외국어」 등 문자종을 분류하는 임의의 카테고리가 적용된다. 부가하여, 문자종의 카테고리 대신에 그 형태소가 속하는 품사를 이용해도 좋다.In the above embodiment, only the "Chinese character" and "Hiragana" are mentioned as the category of the character species, but any category that classifies the character species such as "katakana", "English character", "number", "symbol" and "foreign language" is applied. In addition, a part-of-speech belonging to the morpheme may be used instead of the category of the character species.

또, 상기 실시예에서는 선택 범위의 시점을 지정하거나 선택의 모드를 바꾸기 위해서 각각 「1」, 「#」을 눌렀지만 동일한 의미를 할당한 키이면 임의의 키를 할당해도 좋다.In addition, in the above embodiment, any key may be assigned as long as "1" and "#" are pressed to designate the starting point of the selection range or to change the mode of selection.

또한, 본 실시예에서는 십자표의 커서의 중심 좌표를 선택 정보로서 이용했지만, 동일한 효과를 주는 방법이면 다른 정보에서도 좋다. 예를 들면, 양괄호를 디스플레이에 표시해 그 괄호의 중심 좌표 혹은, 양괄호의 구형 좌표를 이용해도 좋다. 또한, 일본어의 선택에서는 가로쓰기에 대해서 설명했지만 동일하게 세로 쓰기에 대해서도 적용 가능하다.In the present embodiment, the center coordinates of the cursor of the cross mark are used as the selection information. However, any other information may be used as long as the method gives the same effect. For example, the parentheses may be displayed on the display and the center coordinates of the parentheses or the spherical coordinates of the parentheses may be used. In addition, although the horizontal writing was described in the Japanese selection, the same applies to the vertical writing.

또, 상기 실시예는 각각 별개에 실현하여도 좋고, 모두 또는 일부를 선택적으로 채용하는 형태로 실현하여도 좋다.The above embodiments may be realized separately, or may be realized in a form in which all or part of them are selectively employed.

인식 대상의 화상의 기울기 상태를 시각적으로 알기 쉽게 표시하는 것으로, 사용자에게 화상이 기울어 있는 것을 인지시켜 문자인식 처리에 매우 적합한 각도로 화상을 촬영하는 것이 용이하게 된다.By displaying the inclination state of the image to be recognized visually, it is easy to recognize that the image is inclined by the user and to easily take an image at an angle that is very suitable for the character recognition process.

또, 과거에 촬영된 화상에 관해서는 기울어 있는 화상을 직접 편집해 그 결 과에 대해서 문자인식 처리를 실시할 수 있기 때문에 재차 촬영을 실시하지 않아도 마무리 된다.In addition, for images captured in the past, the tilted image can be directly edited and the character recognition process can be performed on the result, so that it is not necessary to shoot again.

또, 각도 보정이 곤란한 경우에도 경사진 상태로 문자 열의 선택이 가능해지기 때문에 어느 정도 경사진 화상에 대해서도 문자인식 처리를 실행할 수 있다.In addition, even when angle correction is difficult, the character string can be selected in an inclined state, so that the character recognition process can be performed even for an image inclined to some extent.

Claims (22)

화상을 촬영하는 화상 촬영부와,An image photographing unit which photographs an image, 화상내로부터 문자인식 대상 문자행을 추출하는 문자행 추출부와,A character line extracting unit for extracting a character line to be recognized from the image; 화상내의 문자를 인식하는 문자인식부와,Character recognition part which recognizes character in image, 상기 화상을 회전시켜 기울기를 보정하는 화상 처리부와,An image processor which rotates the image to correct tilt; 인식 대상이 되는 화상을 표시하기 위한 화상 표시부를 갖춘 휴대 전화 단말 장치로서,A mobile telephone terminal device having an image display unit for displaying an image to be recognized, 문자인식 처리에 매우 적합한 촬영 각도를 정량적으로 표시하는 각도 인디케이터를 표시하고, 매우 적합한 각도로 판정된 촬영 화상에 대해서 문자인식을 행하는 것을 특징으로 하는 휴대 전화 단말 장치.A mobile telephone terminal device characterized by displaying an angle indicator quantitatively displaying a shooting angle well suited for a character recognition process, and performing character recognition on a picked-up image determined at a very suitable angle. 촬영완료정지화상으로부터 문자인식 대상 문자행을 추출하는 문자행 추출부와 상기 화상내의 문자를 인식하는 문자인식부와,A character line extracting unit which extracts a character recognition target character line from the photographed still image, and a character recognition unit which recognizes characters in the image; 상기 화상을 회전시켜 기울기를 보정하는 화상 처리부와,An image processor which rotates the image to correct tilt; 인식 대상이 되는 화상을 표시하기 위한 화상 표시부를 갖춘 휴대 전화 단말 장치로서,A mobile telephone terminal device having an image display unit for displaying an image to be recognized, 상기 촬영완료정지화상의 회전 처리와,Rotation processing of the photographed still image, 문자인식 대상 문자 열 후보의 추출 처리와,Extraction processing of character recognition target character string candidates, 상기 추출된 문자인식 대상 문자 열 후보로부터 소망한 인식 대상 문자 열을 선택하는 선택 처리와,Selection processing for selecting a desired recognition target character string from the extracted character recognition target character string candidate; 상기 선택된 인식 대상 문자 열에 대한 문자인식 처리를 실시하는 것을 특징으로 하는 휴대 전화 단말 장치.And a character recognition process for the selected recognition target character string. 청구항 1 또는 2에 있어서,The method according to claim 1 or 2, 상기 추출된 문자행의 외접 구형의 어스펙트비에 의해, 가로쓰기 혹은 세로 쓰기의 어느 한쪽을 자동적으로 판단해 인식 모드를 절환하는 것을 특징으로 하는 휴대 전화 단말 장치.And the recognition mode is switched automatically by either the horizontal writing or the vertical writing, and the recognition mode is switched according to the extracted aspect ratio of the circumscribed rectangle. 청구항 1 에 있어서,The method according to claim 1, 화상 촬영시의 휴대 정보 단말의 표시 화면의 방향에 따라서, 가로쓰기 혹은 세로 쓰기의 어느 한쪽을 자동적으로 판단해 인식 모드를 절환하는 것을 특징으로 하는 휴대 전화 단말 장치.A portable telephone terminal device which automatically determines either horizontal writing or vertical writing according to the direction of the display screen of the portable information terminal at the time of image shooting, and switches the recognition mode. 청구항 2 에 있어서,The method according to claim 2, 상기 촬영된 화상내의 문자 열의 기울기에 추종 해, 인식 대상 문자 열 후보의 외접 구형을 자동적으로 생성, 표시하는 것을 특징으로 하는 휴대 전화 단말 장치.And a circumferential rectangle of the character string candidate to be recognized is automatically generated and displayed following the slope of the character string in the photographed image. 화상을 촬영하는 화상 촬영부와,An image photographing unit which photographs an image, 상기 화상내로부터 문자인식 대상 문자행을 추출하는 문자행 추출부와 상기 화상내의 문자를 인식하는 문자인식부와,A character line extracting unit for extracting a character recognition target character line from the image, and a character recognition unit recognizing a character in the image; 상기 문자인식부의 출력을 기본으로 검색 후보어를 생성하는 검색 후보어 생성부와 상기 검색 후보어 생성부의 출력을 화면 표시하는 화상 표시부와,A search candidate word generation unit for generating a search candidate word based on the output of the character recognition unit, and an image display unit for displaying the output of the search candidate word generation unit on a screen; 상기 화면 표시된 검색 후보어를 선택하기 위한 유저 인터페이스부를 갖추는 것을 특징으로 하는 휴대 전화 단말 장치.And a user interface unit for selecting the screen displayed search candidate word. 청구항 6에 있어서,The method according to claim 6, 상기 검색 후보어 생성부는 문자인식부의 출력에 대해서 형태소 해석을 이용해 검색 후보어를 생성하는 것을 특징으로 하는 휴대 전화 단말 장치.And the search candidate word generation unit generates a search candidate word using morphological analysis on the output of the character recognition unit. 청구항 6에 있어서,The method according to claim 6, 상기 검색 후보어 생성부는 문자인식 결과의 문자 열에 있어서의 개개의 문자 코드에 대응하는 문자 카테고리를 할당하여 문자 카테고리의 동일한 문자 코드를 하나의 검색 후보어로서 출력 하는 것을 특징으로 하는 휴대 전화 단말 장치.And the search candidate word generation unit assigns a character category corresponding to each character code in the character string of the character recognition result and outputs the same character code of the character category as one search candidate word. 청구항 6에 있어서,The method according to claim 6, 상기 검색 후보어 생성부는 문자인식의 출력에 대한 형태소 해석의 결과와 문자인식 결과의 개개의 문자 코드에 대응하는 문자 카테고리를 할당한 결과와의 양자의 정보를 이용해 검색 후보어를 출력하는 것을 특징으로 하는 휴대 전화 단말 장치.The search candidate word generation unit outputs the search candidate word using both information of the result of the morpheme analysis on the output of the character recognition and the result of assigning a character category corresponding to each character code of the character recognition result. Mobile phone terminal device. 청구항 6에 있어서,The method according to claim 6, 상기 검색 후보어 생성부는 문자인식 결과의 문자 열에 있어서의 개개의 문자 코드의 정보와 기하학 정보의 어느 하나를 이용해 검색 후보어를 생성하는 것을 특징으로 하는 휴대 전화 단말 장치.And the search candidate word generation unit generates a search candidate word using any one of the information of the individual character codes and the geometry information in the character string of the character recognition result. 청구항 6에 있어서,The method according to claim 6, 상기 검색 후보어 생성부는 문자인식의 출력에 대해서 형태소 해석을 이용해 검색 후보어를 생성해, 커서의 위치에 맞추어 형태소 및 형태소를 조합한 복합어의 어느 하나를 선택하기 위한 선택 영역 좌표를 생성하는 것을 특징으로 하는 휴대 전화 단말 장치.The search candidate word generation unit generates a search candidate word by using morpheme analysis on the output of character recognition, and generates selection region coordinates for selecting any one of compound words combining morphemes and morphemes according to the position of the cursor. A mobile phone terminal device. 촬영한 화상으로부터 추출한 문자인식 대상 문자행의 문자를 인식하는 휴대전화 단말 장치에 있어서의 문자인식 방법으로서,As a character recognition method in a mobile phone terminal device which recognizes a character in a character recognition target character line extracted from a photographed image, 화상을 촬영하는 스텝과,A step of taking an image, 상기 화상으로부터 문자인식 대상 문자행을 추출하는 스텝과,Extracting a character recognition target character line from the image; 상기 촬영한 화상을 회전시켜 기울기를 보정하는 스텝과,Rotating the photographed image to correct tilt; 인식 대상이 되는 화상을 표시하는 스텝과,A step of displaying an image to be recognized, 문자인식 처리에 매우 적합한 촬영 각도를 휴대 정보 단말 사용자에 정량적으로 표시하는 스텝과,Quantitatively displaying the shooting angle, which is very suitable for the character recognition process, to the portable information terminal user; 상기 표시된 촬영 각도에 따라서 매우 적합한 각도를 판정 하는 스텝과,Determining a very suitable angle according to the displayed shooting angle; 상기 판정된 매우 적합한 촬영 각도에서 촬영한 화상에 대해서 문자인식을 실시하는 스텝으로 이루어지는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 문자인식방법.A character recognition method in a mobile phone terminal device, characterized by comprising: a step of performing character recognition on an image photographed at the determined very suitable shooting angle. 촬영완료 화상으로부터 추출한 문자인식 대상 문자행의 문자를 인식하는 휴대 전화 단말 장치에 있어서의 문자인식방법으로서,As a character recognition method in the mobile phone terminal device which recognizes the character of the character recognition target character line extracted from the photographing completed image, 상기 화상내로부터 문자인식 대상 문자행을 추출하는 스텝과,Extracting a character recognition target character line from the image; 상기 화상을 회전시켜 기울기를 보정하는 스텝과,Rotating the image to correct tilt; 인식 대상이 되는 화상을 표시하는 스텝과,A step of displaying an image to be recognized, 상기 촬영완료화상의 회전 처리를 실시하는 스텝과,Performing a rotation process of the photographed completed image; 상기 회전 처리와 동시에 문자인식 대상 문자 열 후보를 추출하는 스텝과,Extracting a character recognition target character string candidate simultaneously with the rotation process; 상기 추출된 문자인식 대상 문자 열 후보로부터 인식 대상 문자 열을 선택하는 스텝과,Selecting a character string to be recognized from the extracted character character string candidate; 상기 선택된 인식 대상 문자 열에 대해서 문자인식을 실시하는 스텝으로 이루어지는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 문자인식방법.And a character recognition method for the selected character string to be recognized. 청구항 12 또는 13에 있어서,The method according to claim 12 or 13, 상기 문자인식을 실시하는 스텝은,The step of performing the character recognition, 추출된 문자행의 외접 구형의 어스펙트비에 의해 가로쓰기 및 세로 쓰기의 어느 한쪽을 자동적으로 판정 하는 스텝과,A step of automatically determining either horizontal writing or vertical writing based on the extracted rectangle aspect ratio aspect; 상기 판정 결과에 의거하여 인식 모드를 바꾸는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 문자인식방법.And a step of changing the recognition mode on the basis of the determination result. 청구항 12에 있어서,The method according to claim 12, 상기 문자인식을 실시하는 스텝은,The step of performing the character recognition, 화상 촬영시의 휴대 정보 단말의 표시 화면의 방향을 따라서, 가로쓰기 및 세로 쓰기의 어느 한쪽을 자동적으로 판정 하는 스텝과,Automatically determining either horizontal writing or vertical writing along the direction of the display screen of the portable information terminal at the time of image shooting; 상기 판정 결과에 의거하여 인식 모드를 바꾸는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 문자인식 방법.And a step of changing the recognition mode on the basis of the determination result. 청구항 13에 있어서, The method according to claim 13, 상기 문자인식 대상 문자 열 후보로부터 인식 대상 문자 열을 선택하는 스텝은,The step of selecting a recognition target character string from the character recognition target character string candidate, 촬영 완료 화상내의 문자 열의 기울기에 추종 해, 인식 대상 문자 열 후보의 외접 구형을 자동적으로 생성해 표시하는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 문자인식방법.And a step of automatically following the gradient of the character string in the photographed completed image and automatically generating and displaying a circumferential rectangle of the character string candidate to be recognized. 화상을 촬영하는 스텝과,A step of taking an image, 상기 화상으로부터 문자인식 대상 문자행을 추출하는 스텝과,Extracting a character recognition target character line from the image; 상기 화상내의 문자를 인식하는 스텝과,Recognizing characters in the image; 상기 문자인식된 결과를 이용해 휴대 전화 단말 장치 내외에 격납된 데이터를 검색하는 스텝으로 이루어지는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법으로서,A search target word selection method in a mobile phone terminal device comprising the step of retrieving data stored inside and outside the mobile phone terminal device using the character recognition result. 상기 문자인식된 결과를 기초로 검색 후보어를 생성하는 스텝과 상기 검색 후보어를 화면 표시하는 스텝과,Generating a search candidate word based on the character recognition result, and displaying the search candidate word on a screen; 상기 화면 표시된 검색 후보어를 선택하는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법. And selecting a search candidate word displayed on the screen. 청구항 17에 있어서,The method according to claim 17, 상기 검색 후보어를 생성하는 스텝은 상기 문자인식된 결과에 대해서 형태소 해석을 이용해 검색 후보어를 생성하는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법.The step of generating the search candidate word further comprises the step of generating a search candidate word using morphological analysis on the result of the character recognition. 청구항 17에 있어서, The method according to claim 17, 상기 검색 후보어를 생성하는 스텝은,The step of generating the search candidate word, 상기 문자인식된 결과의 문자 열에 있어서의 개개의 문자 코드에 대응하는 문자 카테고리를 할당하는 스텝과,Assigning a character category corresponding to each character code in the character string of the character recognition result; 상기 문자 카테고리의 동일한 문자 코드를 하나의 검색 후보어로서 출력 하는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법.And a step of outputting the same character code of said character category as one search candidate word. 청구항 17에 있어서, The method according to claim 17, 상기 검색 후보어를 생성하는 스텝은,The step of generating the search candidate word, 상기 문자인식결과에 대한 형태소 해석의 결과와 문자인식 결과의 개개의 문자 코드에 대응하는 문자 카테고리를 할당한 결과의 양자의 정보를 이용해 검색 후보어를 출력하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법.In a mobile phone terminal apparatus, a search candidate word is output using both information of a result of a morpheme analysis of the character recognition result and a result of assigning a character category corresponding to each character code of the character recognition result. How to select search targets for. 청구항 17에 있어서,The method according to claim 17, 상기 검색 후보어를 생성하는 스텝은,The step of generating the search candidate word, 상기 문자인식된 결과의 문자 열에 있어서의 개개의 문자 코드의 정보와 기하학 정보의 어느 하나를 이용해 검색 후보어를 생성하는 것을 특징으로 하는 휴대전화 단말 장치에 있어서의 검색 대상어 선택 방법.A method for selecting a search target word in a mobile phone terminal device, characterized in that a search candidate word is generated using either the information of each character code or the geometric information in the character string of the character recognition result. 청구항 17에 있어서,The method according to claim 17, 상기 검색 후보어를 생성하는 스텝은,The step of generating the search candidate word, 상기 문자인식된 결과에 대해서 형태소 해석을 이용해 검색 후보어를 생성하는 스텝과,Generating a search candidate word using morpheme analysis on the character recognition result; 커서의 위치에 맞추어 형태소 및 형태소를 조합한 복합어의 어느 하나를 선택하기 위한 선택 영역 좌표를 생성하는 스텝을 더 포함하는 것을 특징으로 하는 휴대 전화 단말 장치에 있어서의 검색 대상어 선택 방법.And generating a selection area coordinate for selecting one of the compound word and the compound word in combination with the position of the cursor.
KR1020040089371A 2003-11-10 2004-11-04 Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset Expired - Fee Related KR100615058B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2003-00379288 2003-11-10
JP2003379288A JP4443194B2 (en) 2003-11-10 2003-11-10 Processing object selection method in portable terminal character recognition and portable terminal

Publications (2)

Publication Number Publication Date
KR20050045832A KR20050045832A (en) 2005-05-17
KR100615058B1 true KR100615058B1 (en) 2006-08-22

Family

ID=34689385

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040089371A Expired - Fee Related KR100615058B1 (en) 2003-11-10 2004-11-04 Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset

Country Status (4)

Country Link
JP (1) JP4443194B2 (en)
KR (1) KR100615058B1 (en)
CN (1) CN1292377C (en)
TW (1) TWI294100B (en)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100754656B1 (en) * 2005-06-20 2007-09-03 삼성전자주식회사 Method and system for providing information related to image to user and mobile communication terminal for same
WO2007029740A1 (en) * 2005-09-09 2007-03-15 Canon Kabushiki Kaisha Imaging apparatus
JP4844142B2 (en) * 2006-02-06 2011-12-28 セイコーエプソン株式会社 Printer
KR100641791B1 (en) 2006-02-14 2006-11-02 (주)올라웍스 Tagging method and system for digital data
US8144989B2 (en) 2007-06-21 2012-03-27 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
US8208725B2 (en) 2007-06-21 2012-06-26 Sharp Laboratories Of America, Inc. Methods and systems for identifying text orientation in a digital image
CN101482924B (en) * 2008-01-08 2012-01-04 华晶科技股份有限公司 Automatic identifying and correcting method for business card display angle
JP2012008733A (en) * 2010-06-23 2012-01-12 King Jim Co Ltd Card information management device
KR101870773B1 (en) * 2011-08-31 2018-06-26 삼성전자 주식회사 Method and apparatus for managing schedule using optical character reader
CN103377371A (en) * 2012-04-25 2013-10-30 佳能株式会社 Method and system for improving recognition features and optical character recognition system
JP5940615B2 (en) * 2014-09-09 2016-06-29 株式会社アイエスピー Skew logic character recognition method, program, and portable terminal device for portable terminal device
JP6371662B2 (en) * 2014-10-07 2018-08-08 富士通フロンテック株式会社 Character recognition support device, character recognition support program, and character recognition support method
CN104461424B (en) * 2014-12-01 2017-11-03 上海斐讯数据通信技术有限公司 A kind of system and method that rotation character string is shown in cell
KR101712391B1 (en) 2015-06-22 2017-03-07 한국표준과학연구원 In-situ graph analysis application for smart-phone
CN106325522B (en) * 2016-09-05 2019-03-29 广东小天才科技有限公司 Method and device for adjusting size of cursor by electronic terminal
KR102391068B1 (en) * 2020-07-24 2022-04-28 엄춘호 Document recognition system and method
CN112183372A (en) * 2020-09-29 2021-01-05 深圳数联天下智能科技有限公司 Text recognition method, apparatus, device and readable storage medium
CN116311263A (en) * 2023-03-10 2023-06-23 安徽淘云科技股份有限公司 Display method, device, handheld reader, electronic device and storage medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141465A (en) * 1993-11-18 1995-06-02 Ricoh Co Ltd Document image skew detection method
JPH11250179A (en) * 1998-02-27 1999-09-17 Matsushita Joho System Kk Character reocognition device and its method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07141465A (en) * 1993-11-18 1995-06-02 Ricoh Co Ltd Document image skew detection method
JPH11250179A (en) * 1998-02-27 1999-09-17 Matsushita Joho System Kk Character reocognition device and its method

Also Published As

Publication number Publication date
TW200516509A (en) 2005-05-16
CN1617163A (en) 2005-05-18
JP4443194B2 (en) 2010-03-31
KR20050045832A (en) 2005-05-17
TWI294100B (en) 2008-03-01
JP2005141603A (en) 2005-06-02
CN1292377C (en) 2006-12-27

Similar Documents

Publication Publication Date Title
KR100615058B1 (en) Mobile handset and the method of selecting an objective area of the chatacter recognition on a mobile handset
CN107656922B (en) A translation method, device, terminal and storage medium
US7239747B2 (en) Method and system for locating position in printed texts and delivering multimedia information
US9019308B2 (en) Display apparatus and computer-readable medium
US9251428B2 (en) Entering information through an OCR-enabled viewfinder
KR101291195B1 (en) Apparatus and method for recognizing characters
JP2011008752A (en) Document operation system, document operation method and program thereof
CN110188365B (en) Word-taking translation method and device
KR20120069699A (en) Real-time camera dictionary
EP2806336A1 (en) Text prediction in a text input associated with an image
CN110795918B (en) Method, device and equipment for determining reading position
US9135246B2 (en) Electronic device with a dictionary function and dictionary information display method
JPH06103411A (en) Document reader
JP4474231B2 (en) Document link information acquisition system
JP2006184415A (en) Image processing apparatus, image processing program, and image processing method
JP2008225676A (en) Dictionary search device and control program thereof
JP5605208B2 (en) Electronic device and program with dictionary function
JP4291870B1 (en) Kanji recognition program, portable terminal device, and kanji recognition method
CN110543238A (en) Desktop interaction method based on artificial intelligence
JP2006048324A (en) Document translation system
JPH0562008A (en) Character recognition method
JP4431335B2 (en) String reader
KR20240111397A (en) Learning method and system using memory tape for printed book
JPH06149888A (en) Electronic filing system
JP2006119942A (en) Character string region cutout device

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

FPAY Annual fee payment

Payment date: 20090818

Year of fee payment: 4

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20100817

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20100817

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301