JP2000099635A - Character string prediction device and character string prediction method - Google Patents
Character string prediction device and character string prediction methodInfo
- Publication number
- JP2000099635A JP2000099635A JP10262890A JP26289098A JP2000099635A JP 2000099635 A JP2000099635 A JP 2000099635A JP 10262890 A JP10262890 A JP 10262890A JP 26289098 A JP26289098 A JP 26289098A JP 2000099635 A JP2000099635 A JP 2000099635A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- input
- base
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【課題】予測文字列の候補数を適正に制限することを可
能にする。
【解決手段】パターン認識辞書104を参照して入力さ
れた文字パターンを認識して認識候補文字を出力するパ
ターン認識部103と、少なくとも読みとそれに対応す
る見出しとを格納した単語辞書108と、単語辞書10
8を参照して基底文字列を先頭部分に持つ予測文字列を
検索する辞書検索部107と、パターン認識部103が
出力した認識候補文字を組み合わせて基底文字列を生成
し、生成した基底文字列の中で基底文字列を構成する認
識候補文字の文字種をチェックし、文字種ごとに文字数
に関して予め設定した予測開始条件を満足する基底文字
列について辞書検索部107に指示して予測文字列を検
索する予測制御部106とを具備する。
(57) [Summary] [PROBLEMS] To appropriately limit the number of candidates for a predicted character string. A pattern recognition unit (103) that recognizes an input character pattern by referring to a pattern recognition dictionary (104) and outputs recognition candidate characters, a word dictionary (108) storing at least readings and corresponding headings, Dictionary 10
8, a base character string is generated by combining a dictionary search unit 107 that searches for a predicted character string having a base character string at the beginning with a recognition candidate character output by the pattern recognition unit 103, and generates the generated base character string. Of the recognition candidate characters constituting the base character string, and instructs the dictionary search unit 107 to search for the predicted character string by instructing the dictionary search unit 107 on a base character string that satisfies a preset prediction start condition regarding the number of characters for each character type. And a prediction control unit 106.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、入力された文字列
をもとに、その文字列に続いて利用者が入力しようとす
る文字列を予測する文字列予測装置及び文字列予測方法
に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character string predicting apparatus and a character string predicting method for predicting a character string to be input by a user following the character string based on the input character string.
【0002】[0002]
【従来の技術】入力予測とは文献(第48回情報処理学
会全国大会予稿集4J−11他)で報告されているよう
な、最初の数文字が入力された時点で単語辞書等を検索
し、その数文字で始まる文字列(単語)を抽出して提示
するという文字入力方法である。この提示(表示)され
た文字列中から任意の文字列が選択されると、入力文字
列として確定して表示する。2. Description of the Related Art Input prediction refers to searching a word dictionary or the like when the first few characters are input, as reported in the literature (the 48th Information Processing Society of Japan National Convention Proceedings 4J-11 and others). Is a character input method of extracting and presenting a character string (word) starting with the several characters. When an arbitrary character string is selected from the presented (displayed) character string, the character string is determined and displayed as an input character string.
【0003】入力予測の目的は、最初の数文字を入力す
るだけで、それに続く文字列が補完されることによって
利用者が意図した文字列を全て入力する必要がなくな
り、入力操作が軽減されることにある。[0003] The purpose of input prediction is to input only the first few characters, and the subsequent character strings are complemented, so that it is not necessary to input all the character strings intended by the user, and input operations are reduced. It is in.
【0004】しかし、手書き文字認識や音声認識などパ
ターン認識による文字入力の場合には、認識時の曖昧性
(認識文字が一意に決定されず複数の認識候補文字が得
られる)のために入力文字列が確定しないため、誤認識
文字を正しい文字に訂正して入力文字列を確定する文字
訂正操作を行なわなければならないという問題が残る。However, in the case of character input by pattern recognition such as handwritten character recognition or voice recognition, the input character cannot be obtained because of ambiguity at the time of recognition (recognition characters are not uniquely determined and a plurality of recognition candidate characters are obtained). Since the column is not determined, there remains a problem that a character correction operation for correcting an erroneously recognized character to a correct character and determining an input character string must be performed.
【0005】このような問題を解決するため、入力パタ
ーンを認識した結果の認識候補文字の全ての組み合わせ
について、それらに続く文字列を予測する技術(特願平
8−243292号)がある。To solve such a problem, there is a technique (Japanese Patent Application No. 8-243292) for predicting a character string following all combinations of recognition candidate characters as a result of recognition of an input pattern.
【0006】[0006]
【発明が解決しようとする課題】しかし、従来の技術を
用いて、入力パターンを認識した結果の認識候補文字の
全ての組み合わせについて、それぞれそれらに続く文字
列を予測すると、誤認識によって入力文字列が確定しな
くても、利用者が意図した文字列が得やすくなる反面、
予測文字列の候補数が膨大になる問題が生じる。However, if the character string following each of the combinations of the candidate character as a result of recognition of the input pattern is predicted using the conventional technique, the input character string is erroneously recognized. Even if is not determined, it is easier to obtain the character string intended by the user,
There is a problem in that the number of predicted character string candidates becomes enormous.
【0007】例えば、認識結果の認識候補文字が各入力
パターン毎にn個あるとすれば、その組み合わせは入力
文字数×n通りになる。また、入力予測を開始するタイ
ミングの設定の仕方も、検索される予測文字列数が膨大
となる要因の1つである。[0007] For example, if there are n recognition candidate characters in the recognition result for each input pattern, the combinations are the number of input characters x n. Also, how to set the timing of starting the input prediction is one of the factors that causes the number of predicted character strings to be searched to be enormous.
【0008】例えば、1文字入力された時点で予測を行
なうとすると、漢字の場合では、漢字の種類が多いため
にある程度の絞り込みが行われるのでさほど問題とはな
らないが、仮名(ひらがな、カタカナ)の場合には辞書
から検索される文字列が数百、数千にもなってしまうこ
とがある。For example, if prediction is performed at the time of input of one character, in the case of kanji, there are not many problems because there are many types of kanji, so there is not much problem. In the case of, the character string searched from the dictionary may be hundreds or thousands.
【0009】本発明は前記のような事情を考慮してなさ
れたもので、予測文字列の候補数を適正に制限すること
が可能な文字列予測装置、及び文字列予測方法を提供す
ることを目的とする。The present invention has been made in view of the above circumstances, and provides a character string prediction apparatus and a character string prediction method capable of appropriately limiting the number of candidates for a predicted character string. Aim.
【0010】[0010]
【課題を解決するための手段】本発明は、パターン認識
辞書を参照して入力された文字パターンを認識すること
によって文字を入力し、入力された文字列を基底文字列
としてそれに続く文字列を単語辞書を参照して予測する
もので、認識結果の認識候補文字を組み合わせてできる
基底文字列の中で基底文字列を構成する認識候補文字の
文字種をチェックし、文字種ごとに文字数に関して予め
設定した予測開始条件を満足する基底文字列について単
語辞書から予測文字列を検索することを特徴とする。According to the present invention, a character is input by recognizing an input character pattern with reference to a pattern recognition dictionary, and the input character string is used as a base character string, and a subsequent character string is input. The prediction is performed by referring to the word dictionary, and among the base character strings formed by combining the recognition candidate characters of the recognition result, the character types of the recognition candidate characters constituting the base character string are checked, and the number of characters is preset for each character type. It is characterized in that a predicted character string is searched from a word dictionary for a base character string that satisfies a prediction start condition.
【0011】これにより、入力パターンを認識した結果
の認識候補文字の組み合わせてできる基底文字列の中
で、文字種ごとに予測を開始するための文字数に関する
条件を設定し、その条件を満たす基底文字列について文
字列を予測することによって、検索される予測文字列数
を制限し、利用者が意図した文字列をより容易に入力す
ることが可能となる。[0011] Thus, in the base character string formed by combining the recognition candidate characters as a result of recognition of the input pattern, a condition relating to the number of characters for starting prediction for each character type is set, and the base character string satisfying the condition is set. By predicting the character string for, the number of predicted character strings to be searched is limited, and the user can easily input the intended character string.
【0012】また本発明は、パターン認識辞書を参照し
て入力された文字パターンを認識することによって文字
を入力し、入力された文字列を基底文字列としてそれに
続く文字列を単語辞書を参照して予測するもので、認識
結果の認識候補文字を組み合わせてできる基底文字列ご
とに評価値を算出し、検索される予測文字列数が予め設
定した範囲内となるように評価の高い基底文字列を優先
して予測文字列を単語辞書から検索することを特徴とす
る。Further, according to the present invention, a character is input by recognizing an input character pattern with reference to a pattern recognition dictionary, and the input character string is used as a base character string, and subsequent character strings are referred to a word dictionary. The evaluation value is calculated for each base character string formed by combining the recognition candidate characters of the recognition result, and the base character string having a high evaluation so that the number of predicted character strings searched is within a preset range. In which a predicted character string is searched from the word dictionary.
【0013】これにより、入力パターンを認識した結果
の認識候補文字の組み合わせてできる基底文字列の中
で、予め設定した予測文字列数の範囲内で評価の高い基
底文字列から順にそれに続く文字列を予測することによ
って、検索される予測文字列数を制限し、利用者が意図
した文字列をより容易に入力することが可能となる。Thus, among the base character strings formed by combining the recognition candidate characters obtained as a result of recognizing the input pattern, the base character strings having the highest evaluation within the preset number of predicted character strings are successively arranged. Is predicted, the number of predicted character strings to be searched is limited, and the user can easily input the intended character string.
【0014】[0014]
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。図1は本実施形態に係わる
文字列予測装置の構成を示すブロック図である。本実施
形態における文字列予測装置は、例えばCD−ROM、
DVD、磁気ディスク等の記録媒体に記録されたプログ
ラムを読み込み、このプログラムによって動作が制御さ
れるコンピュータによって実現される。なお、本実施形
態では、パターン認識として手書き文字認識を一例とし
て取り上げて説明する。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration of a character string prediction device according to the present embodiment. The character string prediction device in the present embodiment is, for example, a CD-ROM,
It is realized by a computer which reads a program recorded on a recording medium such as a DVD or a magnetic disk and whose operation is controlled by the program. In the present embodiment, handwritten character recognition will be described as an example of pattern recognition.
【0015】本実施形態における文字列予測装置は、図
1に示すように、入力装置101、文字入力部102、
パターン認識部103、パターン認識辞書104、入力
バッファ105、予測制御部106、辞書検索部10
7、単語辞書108、候補バッファ109、出力制御部
110、出力バッファ111、及び出力装置112によ
って構成されている。As shown in FIG. 1, a character string predicting apparatus according to this embodiment includes an input device 101, a character input unit 102,
Pattern recognition unit 103, pattern recognition dictionary 104, input buffer 105, prediction control unit 106, dictionary search unit 10
7, a word dictionary 108, a candidate buffer 109, an output control unit 110, an output buffer 111, and an output device 112.
【0016】入力装置101は、文字パターンを座標デ
ータとして入力する手書きタブレットである。例えば、
タブレット面上でペン等を用いて文字が筆記入力される
ことにより文字パターンを表す座標データを入力する。The input device 101 is a handwriting tablet for inputting a character pattern as coordinate data. For example,
Character data is input by writing on the tablet surface with a pen or the like, and coordinate data representing a character pattern is input.
【0017】文字入力部102は、入力装置101によ
って入力された文字パターンを切り出し、パターン認識
部103において該文字パターンに対する文字認識を実
行させ、認識結果として得られる認識候補文字を入力バ
ッファ105に格納する。本実施形態ではパターン認識
部103による文字認識によって10個の認識候補文字
が得られるものとする。The character input unit 102 cuts out a character pattern input by the input device 101, causes the pattern recognition unit 103 to execute character recognition for the character pattern, and stores a recognition candidate character obtained as a recognition result in the input buffer 105. I do. In the present embodiment, it is assumed that ten recognition candidate characters are obtained by character recognition by the pattern recognition unit 103.
【0018】パターン認識部103は、文字入力部10
2の制御のもとで、パターン認識辞書104を参照して
入力された文字パターンを認識して、認識結果として認
識候補文字を出力する。The pattern recognition unit 103 includes the character input unit 10
Under the control of 2, the input character pattern is recognized with reference to the pattern recognition dictionary 104, and a recognition candidate character is output as a recognition result.
【0019】パターン認識辞書104は、文字とそれが
対応する文字パターンを格納したものである。予測制御
部106は、予測文字列の候補数を適正に制限するため
の制御機能を有するもので、入力バッファ105に格納
された認識候補文字を組み合わせて基底文字列を生成す
る。The pattern recognition dictionary 104 stores characters and their corresponding character patterns. The prediction control unit 106 has a control function for appropriately restricting the number of candidates for a predicted character string, and generates a base character string by combining recognition candidate characters stored in the input buffer 105.
【0020】続いて、予測制御部106は、後述する第
1実施形態の場合には、基底文字列を構成する認識候補
文字の文字種をチェックし、生成した基底文字列の中で
文字種ごとに文字数に関して予め設定した予測開始条件
を満足する基底文字列について辞書検索部107に指示
して予測文字列を検索する。例えば、第1実施形態の場
合には、認識候補文字が漢字の場合は1文字、それ以外
の文字種の場合は2文字で予測を開始するものとする。Subsequently, in the case of the first embodiment described later, the prediction control unit 106 checks the character type of the recognition candidate character constituting the base character string, and determines the number of characters for each character type in the generated base character string. The dictionary search unit 107 instructs the dictionary search unit 107 to search for a predicted character string that satisfies the prediction start condition set in advance. For example, in the case of the first embodiment, prediction is started with one character when the recognition candidate character is a kanji character, and with two characters when the recognition candidate character is any other character type.
【0021】また、予測制御部106は、後述する第2
実施形態の場合には、基底文字列ごとに評価値を設定
し、検索される予測文字列数が予め設定した範囲内とな
るように評価値の高い基底文字列から予測文字列を検索
する。例えば、第2実施形態の場合には、基底文字列の
評価値は、基底文字列を構成する認識候補文字の文字認
識時に得られる各文字に対する評価値の平均値とする。Further, the prediction control unit 106 controls a second
In the embodiment, an evaluation value is set for each base character string, and a predicted character string is searched from a base character string having a high evaluation value such that the number of predicted character strings to be searched is within a preset range. For example, in the case of the second embodiment, the evaluation value of the base character string is an average value of the evaluation values for each character obtained at the time of character recognition of the recognition candidate character forming the base character string.
【0022】予測制御部106は、辞書検索部107に
よって単語辞書108を検索することにより得られた予
測文字列を候補バッファ109に格納する。なお、本実
施形態では、検索される予測文字列数の最大数を50個
とする。The prediction control unit 106 stores a predicted character string obtained by searching the word dictionary 108 by the dictionary search unit 107 in the candidate buffer 109. In this embodiment, the maximum number of predicted character strings to be searched is set to 50.
【0023】辞書検索部107は、基底文字列を先頭部
分に持つ文字列を単語辞書108から検索し、この文字
列を予測文字列として候補バッファ109に格納する。
単語辞書108は、単語(文字列)ごとに見出しや読み
等の情報を対応付けて格納する。The dictionary search unit 107 searches the word dictionary 108 for a character string having the base character string at the beginning, and stores this character string in the candidate buffer 109 as a predicted character string.
The word dictionary 108 stores information such as headings and readings for each word (character string).
【0024】出力制御部110は、候補バッファ109
に格納された予測文字列を利用者に提示(表示)して、
入力すべき文字列を確定するための候補選択処理を行
い、利用者によって選択された予測文字列を出力バッフ
ァ111に格納する。その後、出力制御部110は、出
力バッファ111に格納された予測文字列を出力装置1
12に送り画面表示させる。The output control unit 110 controls the candidate buffer 109
Presents (displays) the predicted character string stored in
A candidate selection process for determining a character string to be input is performed, and the predicted character string selected by the user is stored in the output buffer 111. After that, the output control unit 110 outputs the predicted character string stored in the output buffer 111 to the output device 1.
12 to be displayed on the screen.
【0025】出力装置112は、CRT,LCDディス
プレイ等によって構成される画面表示装置であり、利用
者はこれらによって対話的に文字入力処理を進めること
ができる。The output device 112 is a screen display device including a CRT, an LCD display, and the like, and allows the user to interactively proceed with character input processing.
【0026】次に、第1実施形態の動作について説明す
る。図2は、第1実施形態における文字列予測装置の文
字入力から予測文字列の出力までの処理の流れを示した
フローチャートである。Next, the operation of the first embodiment will be described. FIG. 2 is a flowchart illustrating a flow of processing from character input to output of a predicted character string of the character string prediction device according to the first embodiment.
【0027】まず、入力装置101から入力された文字
パターンは、文字入力部102において1文字分毎に切
り出される。この切り出された文字パターンは、パター
ン認識部103においてパターン認識辞書104を参照
して認識され(ステップA1,A2)、認識結果の認識
候補文字が入力バッファ105に格納される(ステップ
A3)。本実施形態では認識結果の認識候補文字は10
文字とする。First, the character pattern input from the input device 101 is cut out by the character input unit 102 for each character. The cut-out character pattern is recognized by the pattern recognition unit 103 with reference to the pattern recognition dictionary 104 (steps A1 and A2), and recognition candidate characters of the recognition result are stored in the input buffer 105 (step A3). In the present embodiment, the recognition candidate character of the recognition result is 10
Characters.
【0028】文字認識が終了すると、予測制御部106
において認識候補文字を組み合わせた基底文字列が生成
される(ステップA4)。ここで、基底文字列の中で予
測開始条件を満たすものがあるかどうかチェックされる
(ステップA5)。本実施形態では、漢字の場合は1文
字が入力された時点で予測開始、それ以外の文字種の場
合には2文字が入力された時点で予測開始するという内
容の予測開始条件が設定されているものとする。基底文
字列をチェックした結果、予測開始条件を満たす基底文
字列がない場合には、文字入力処理に処理が戻る。When the character recognition is completed, the prediction control unit 106
In step A4, a base character string combining the recognition candidate characters is generated (step A4). Here, it is checked whether or not any of the base character strings satisfies the prediction start condition (step A5). In the present embodiment, the prediction start condition is set such that the prediction starts when one character is input for a kanji character, and starts when two characters are input for other character types. Shall be. As a result of checking the base character string, if there is no base character string that satisfies the prediction start condition, the process returns to the character input processing.
【0029】他方、予測開始条件を満たす基底文字列が
ある場合には、予測開始辞書検索部107において単語
辞書108を参照して予測文字列が検索され(ステップ
A6)、検索された予測文字列が候補バッファ109に
格納される(ステップA7)。On the other hand, if there is a base character string that satisfies the prediction start condition, the prediction start dictionary search unit 107 searches the predicted character string with reference to the word dictionary 108 (step A6). Is stored in the candidate buffer 109 (step A7).
【0030】これら予測文字列の検索処理は、予測開始
条件を満たす全ての基底文字列について行われる(ステ
ップA6〜A8)。予測文字列の検索が終了すると、予
測制御部106は、出力制御部110を介して出力装置
112に予測文字列を表示させ、入力された文字に対応
する予測文字列を利用者に提示して候補選択処理を行う
(ステップA9)。The search processing of these predicted character strings is performed for all base character strings that satisfy the prediction start condition (steps A6 to A8). When the search for the predicted character string is completed, the prediction control unit 106 causes the output device 112 to display the predicted character string via the output control unit 110, and presents the predicted character string corresponding to the input character to the user. A candidate selection process is performed (step A9).
【0031】この結果、予測文字列が選択されなかった
場合には、次の文字の入力を行うために、文字入力処理
に処理が戻る。他方、表示された予測文字列中から何れ
かの予測文字列が選択された場合には、出力バッファ1
11に選択された予測文字列が格納され(ステップA1
0,A11)、出力制御部110において選択された予
測文字列が画面表示される(ステップA12)。As a result, if the predicted character string has not been selected, the process returns to the character input processing to input the next character. On the other hand, if any of the displayed predicted character strings is selected, the output buffer 1
11 stores the selected predicted character string (step A1).
0, A11), the predicted character string selected by the output control unit 110 is displayed on the screen (step A12).
【0032】最後に、次の入力に備えて各バッファが初
期化される(ステップA13)。図3は、第1実施形態
における文字列予測装置の文字入力から文字列予測まで
様子を示したものである。Finally, each buffer is initialized in preparation for the next input (step A13). FIG. 3 shows a state from the character input to the character string prediction of the character string prediction device in the first embodiment.
【0033】第1実施形態では、認識結果の認識候補文
字は10個とする。また、文字種ごとの文字数に関する
予測開始条件は漢字の場合が1文字、それ以外の文字種
の場合には2文字とする。In the first embodiment, the number of recognition candidate characters in the recognition result is ten. The prediction start condition regarding the number of characters for each character type is one for kanji characters, and two for other character types.
【0034】図3に示す表示画面の例では、文字パター
ンが筆記入力される領域、入力確定された文字列が表示
される領域が設けられている。また、入力予測処理によ
って得られた文字列を表示(予測文字列表示)するため
の領域が必要に応じて設けられる。In the example of the display screen shown in FIG. 3, an area where a character pattern is input by handwriting and an area where a character string whose input is confirmed are displayed are provided. Further, an area for displaying a character string obtained by the input prediction processing (predicted character string display) is provided as necessary.
【0035】図3(a)に示すように、カタカナ「コ」
を意図する文字パターンが入力された場合に、その認識
結果が「コ、a、ユ、ュ、2、]、五、ヨ、ョ、刀」で
あったとする。1文字が入力された時点では漢字のみが
予測開始条件を満たす基底文字列となるので、この認識
候補文字の中で「五」と「刀」が予測開始条件を満たす
基底文字列となる。As shown in FIG. 3A, the katakana "ko"
It is assumed that, when a character pattern intended to be input is input, the recognition result is “ko, a, yu, u, 2], 5, yo, yo, sword”. When one character is input, only the kanji is the base character string that satisfies the prediction start condition. Therefore, among the recognition candidate characters, “5” and “sword” are the base character strings that satisfy the prediction start condition.
【0036】そこで、「五」と「刀」を基底文字列とす
る予測文字列が検索される。すなわち、「五」と「刀」
の文字を先頭部分に持つ文字列を、それぞれ単語辞書1
08を検索することにより取得する。Therefore, a predicted character string having "5" and "sword" as base character strings is searched. That is, "five" and "sword"
Character strings starting with the characters
08 by retrieving it.
【0037】この取得された予測文字列は、図3(b)
に示すように、予測文字列表示として一覧表示される。
図3(b)に示す例では、8個の予測文字列が表示され
ているが、8個を越える予測文字列が検索されている場
合には、スクロールバーに対する指示によって他の予測
文字列を表示させることができる。The obtained predicted character string is shown in FIG.
Is displayed as a list of predicted character strings.
In the example shown in FIG. 3B, eight predicted character strings are displayed. However, when more than eight predicted character strings are searched, another predicted character string is changed by an instruction to the scroll bar. Can be displayed.
【0038】続いて、カタカナ「ン」を意図する文字パ
ターンが入力された場合に、その認識結果が図3(b)
に示すように、「ニ、ン、シ、;、i、j、ら、>、
こ」であったとする。2文字が入力された時点では、仮
名2文字も予測開始条件を満たすようになり、1文字目
の認識候補文字中の仮名文字と、2文字目の認識候補文
字中の仮名文字の組み合わせて生成される基底文字列を
もとに予測文字列が検索される。Subsequently, when a character pattern intended for katakana "n" is input, the recognition result is shown in FIG.
As shown in ", d, n, si,;, i, j, et al.,>,
" When two characters are input, the two kana characters also satisfy the prediction start condition, and are generated by combining a kana character in the first candidate character and a kana character in the second candidate character. A predicted character string is searched based on the base character string to be obtained.
【0039】ここでは、図3(b)に示すような「コ
ニ」、「コン」、「コシ」の基底文字列をもとにした検
索によって予測文字列が取得されたものとする。この取
得された予測文字列は、前述と同様に図3(c)に示す
ように、予測文字列表示として一覧表示される。Here, it is assumed that a predicted character string has been obtained by a search based on the base character strings of “koni”, “kon”, and “koshi” as shown in FIG. The acquired predicted character strings are displayed in a list as a predicted character string display as shown in FIG.
【0040】なお、図3(c)の2文字を入力した時点
では、「五」や「刀」を基底文字列とする予測文字列が
候補からはずれてしまっているが、これは2文字目の認
識候補の中に「五」や「刀」と組み合わせてできる基底
文字列の中に辞書検索に成功するものがなかったためで
ある。When the two characters shown in FIG. 3C are input, a predicted character string having "5" or "sword" as a base character string is out of the candidates. This is because, among the recognition candidates for, there was no one that succeeded in the dictionary search among the base character strings formed in combination with “5” or “sword”.
【0041】このようにして、入力パターンを認識した
結果の認識候補文字の組み合わせてできる基底文字列の
中で、文字種ごとに予測を開始するための文字数に関す
る予測開始条件、例えば漢字の場合は1文字が入力され
た時点で予測開始、それ以外の文字種の場合には2文字
が入力された時点で予測開始するという内容の予測開始
条件を設定し、その条件を満たす基底文字列について文
字列を予測することによって、検索される予測文字列数
が制限されるので、利用者が意図した文字列をより容易
に入力することが可能となる。As described above, in the base character string formed by combining the recognition candidate characters obtained as a result of recognition of the input pattern, a prediction start condition relating to the number of characters for starting prediction for each character type, for example, 1 for kanji A prediction start condition is set such that prediction starts when a character is input, and in the case of other character types, prediction starts when two characters are input, and a character string is set for a base character string that satisfies the condition. By performing the prediction, the number of predicted character strings to be searched is limited, so that the user can more easily input an intended character string.
【0042】なお、前述した第1実施形態の説明では、
予測開始条件として漢字の場合は1文字、その他の文字
種については2文字が入力された時点で予測開始をする
ものとして説明しているが、これ以外の予測開始条件で
あっても勿論良い。In the above description of the first embodiment,
The description has been made assuming that the prediction start condition starts when one character is input for a kanji character and two characters are input for other character types, but other prediction start conditions may of course be used.
【0043】例えば、単語辞書108に格納されている
単語(文字列)の長さが、図3に示す例のように、2〜
4文字程度の場合には、予測開始条件を2,3文字とし
てしまうと入力予測の効果が得られなくなってしまう
が、単語辞書108に格納された文字列の長さが、より
長い場合には、何文字の入力文字に対して検索すると予
測文字列の数がどの程度絞り込みが行われるかに応じ
て、適正な文字数を予測開始条件として設定できるもの
とする。For example, the length of a word (character string) stored in the word dictionary 108 is 2 to 2 as shown in FIG.
In the case of about four characters, if the prediction start condition is set to two or three characters, the effect of input prediction cannot be obtained, but if the length of the character string stored in the word dictionary 108 is longer, It is assumed that an appropriate number of characters can be set as a prediction start condition according to how many input characters are searched and the number of predicted character strings is narrowed down.
【0044】また、漢字と、その他の文字種の2つの分
類としているが、その他にも英文字列が登録された辞書
など、他の文字種の辞書を用意して、各文字種の辞書毎
に予測開始条件を設定することができる。In addition, there are two classifications of Kanji and other character types. In addition, a dictionary of other character types such as a dictionary in which English character strings are registered is prepared, and prediction is started for each dictionary of each character type. Conditions can be set.
【0045】次に、第2実施形態の動作について説明す
る。図4は、第2実施形態における文字列予測装置の文
字入力から予測文字列の出力までの処理の流れを示した
フローチャートである。Next, the operation of the second embodiment will be described. FIG. 4 is a flowchart illustrating a flow of processing from character input to output of a predicted character string of the character string prediction device according to the second embodiment.
【0046】まず、入力装置101から入力された文字
パターンは、文字入力部102において1文字毎に切り
出される。この切り出された文字パターンは、パターン
認識部103においてパターン認識辞書104を参照し
て文字認識され(ステップB1,B2)、認識結果の認
識候補文字が入力バッファ105に格納される(ステッ
プB3)。本実施形態では認識結果の認識候補文字は1
0文字とする。また、文字認識の際にパターン認識辞書
104との照合によって得られる評価値、すなわちパタ
ーン認識辞書104に格納された標準パターンとの類似
度値(例えば256段階によって示す)も入力バッファ
105に格納されるものとする。First, the character pattern input from the input device 101 is cut out by the character input unit 102 for each character. The cut-out character pattern is subjected to character recognition in the pattern recognition unit 103 with reference to the pattern recognition dictionary 104 (steps B1 and B2), and recognition candidate characters of the recognition result are stored in the input buffer 105 (step B3). In this embodiment, the recognition candidate character of the recognition result is 1
Use 0 characters. Further, an evaluation value obtained by collation with the pattern recognition dictionary 104 at the time of character recognition, that is, a similarity value (for example, indicated by 256 levels) with a standard pattern stored in the pattern recognition dictionary 104 is also stored in the input buffer 105. Shall be.
【0047】文字認識が終了すると、予測制御部106
において認識候補文字を組み合わせた基底文字列が生成
される(ステップB4)。続いて、基底文字列を構成す
る認識候補文字の認識時の評価値(類似度値)を用い
て、各基底文字列の評価値が算出され、評価値の高い順
に基底文字列がソートされる(ステップB5)。When the character recognition is completed, the prediction control unit 106
, A base character string combining the recognition candidate characters is generated (step B4). Subsequently, the evaluation value of each base character string is calculated using the evaluation value (similarity value) at the time of recognition of the recognition candidate character constituting the base character string, and the base character strings are sorted in descending order of the evaluation value. (Step B5).
【0048】次に、高い評価値の基底文字列から順に単
語辞書108を参照して予測文字列が検索される(ステ
ップB6)。辞書検索が終了すると、検索された予測文
字列数及び候補バッファ109に格納されている予測文
字列数が、予め設定された文字列数の範囲内かどうかチ
ェックされる(ステップB7)。範囲内である場合に
は、検索された予測文字列が候補バッファ109に格納
される(ステップB8)。他方、予め設定された範囲を
超えた場合には、その時点で辞書検索処理を終了する。Next, a predicted character string is searched by referring to the word dictionary 108 in order from the base character string having the highest evaluation value (step B6). When the dictionary search is completed, it is checked whether the number of predicted character strings searched and the number of predicted character strings stored in the candidate buffer 109 are within the range of a preset number of character strings (step B7). If it is within the range, the searched predicted character string is stored in the candidate buffer 109 (step B8). On the other hand, if it exceeds the preset range, the dictionary search process is terminated at that point.
【0049】これら予測文字列の辞書検索処理は、全て
の基底文字列について検索が終るまで、または検索され
た予測文字列数が予め設定された範囲を超えるまで行わ
れる(ステップB6〜B9)。The dictionary search processing of these predicted character strings is performed until all base character strings have been searched or the number of searched predicted character strings exceeds a predetermined range (steps B6 to B9).
【0050】予測文字列の検索が終了すると、予測制御
部106は、基底文字列に基づいて得られた予測文字列
を利用者に提示して候補選択処理を行う(ステップB1
0)。When the search for the predicted character string is completed, the prediction control unit 106 presents the predicted character string obtained based on the base character string to the user and performs a candidate selection process (step B1).
0).
【0051】この結果、予測文字列が選択されなかった
場合には次の文字の入力を行うために、文字入力処理に
処理が戻る。他方、何れかの予測文字列が選択された場
合には、出力バッファ111に選択された予測文字列が
格納され(ステップB11,B12)、選択された予測
文字列が出力制御部110において画面表示される(ス
テップB13)。最後に、次の入力に備えて各バッファ
が初期化される(ステップB14)。As a result, if the predicted character string has not been selected, the process returns to the character input processing to input the next character. On the other hand, when any of the predicted character strings is selected, the selected predicted character string is stored in the output buffer 111 (steps B11 and B12), and the selected predicted character string is displayed on the screen in the output control unit 110. (Step B13). Finally, each buffer is initialized in preparation for the next input (step B14).
【0052】図5は第2実施形態における文字列予測装
置の文字入力から文字列予測までの様子を示したもので
ある。第2実施形態では、認識結果の認識候補文字は1
0個とする。また、基底文字列の評価値は基底文字列を
構成する認識候補文字の認識時に得られた評価値(類似
度値)を用いるとし、検索する最大予測文字列数は50
個とする。また、表示画面の形態は、第1実施形態にお
いて用いたものと同じとする。FIG. 5 shows a state from the character input to the character string prediction of the character string prediction device in the second embodiment. In the second embodiment, the recognition candidate character of the recognition result is 1
It is assumed to be zero. It is assumed that the evaluation value of the base character string uses an evaluation value (similarity value) obtained at the time of recognition of the recognition candidate character constituting the base character string, and the maximum number of predicted character strings to be searched is 50.
Number. The form of the display screen is the same as that used in the first embodiment.
【0053】図5(a)に示すように、「社」を意図す
る文字パターンが入力された場合に、その認識結果が
「礼、社、祉、杜、祖、祐、放、祈、紅、江」であった
とする。認識候補文字は全て漢字であるので予測文字列
を検索する基底文字列となり得るため、それぞれについ
て単語辞書108を検索することにより、各文字を先頭
に持つ予測文字列が検索される。この結果、図5(a)
に示すように、認識候補文字の中で「礼、社、祖、祐、
放、祈、紅、江」で始まる予測文字列が単語辞書108
に存在し、全ての予測候補数が予め設定されている予測
文字列の個数の50個を超えてしまうものとする。As shown in FIG. 5 (a), when a character pattern intended for "sha" is input, the recognition result is "thanks, shrine, welfare, forest, sou, yu, ho, pray, red" , Jiang ". Since the recognition candidate characters are all Chinese characters, they can be base character strings for searching for a predicted character string. Therefore, by searching the word dictionary 108 for each character, a predicted character string having each character at the head is searched. As a result, FIG.
As shown in, among the recognition candidate characters, "Rei, Sha, So, Yu,
The predicted character string starting with “radiation, prayer, red, and river” is the word dictionary 108.
, And the number of all prediction candidates exceeds the preset number of predicted character strings of 50.
【0054】この場合、図6(a)に示すように、評価
値の高い基底文字列から順に予測文字列を検索する。図
6(a)に示す例では、まず基底文字列「礼」で始まる
予測文字列だけをまず検索する。ここで検索された予測
文字列が50個に満たなかった場合には、次に評価値の
高い基底文字列「社」で始まる予測文字列を検索する。
以下、同様にして、予め設定されている予測文字列の個
数を満たすまで、評価値の高い基底文字列の順で予測文
字列を求めていく。In this case, as shown in FIG. 6A, a predicted character string is searched in order from a base character string having a high evaluation value. In the example shown in FIG. 6A, first, only the predicted character string starting with the base character string “Rei” is searched. If the number of predicted character strings searched here is less than 50, a predicted character string starting with a base character string “company” having the next highest evaluation value is searched.
Hereinafter, similarly, the predicted character strings are obtained in the order of the base character strings having the higher evaluation values until the preset number of the predicted character strings is satisfied.
【0055】この結果、図5(b)に示すように、予測
文字列表示として一覧表示される。図5(b)に示す例
では、基底文字列「礼」によって検索された予測文字列
が表示された状態を示しているが、スクロールバーに対
する指示によって、例えば評価値が次に高かった基底文
字列「社」によって得られた予測文字列を表示させるこ
とができる。As a result, as shown in FIG. 5B, a list is displayed as a predicted character string display. In the example shown in FIG. 5B, the predicted character string searched based on the base character string “Thank you” is displayed. However, in response to an instruction to the scroll bar, for example, the base character having the next highest evaluation value is displayed. The predicted character string obtained by the column "company" can be displayed.
【0056】次に、2文字目の「会」を意図する文字パ
ターンが入力された場合に、その認識結果が図5(b)
に示すように、「会、坐、全、袋、災、込、屯、公、
念、叙」であったとする。この場合、1文字目の認識候
補文字列との組み合わせにより基底文字列を生成してみ
ると、辞書検索に成功するのは「社会」「放念」とな
る。Next, when a character pattern intended for the second character "" is inputted, the recognition result is shown in FIG.
As shown in the table, "kai, sitting, whole, bag, evil, including, tun, public,
Just in case. In this case, when a base character string is generated by combining the first candidate character string with the recognition candidate character string, "society" and "don't care" succeed in dictionary search.
【0057】この場合、図6(b)に示すように、評価
値(1文字目の評価値と2文字目の評価値との平均値)
の高い基底文字列「社会」で始まる予測文字列だけをま
ず検索する。ここで検索された予測文字列が50個に満
たなかった場合には、次に評価値の高い基底文字列「放
念」で始まる予測文字列を検索する。In this case, as shown in FIG. 6B, the evaluation value (the average value of the evaluation value of the first character and the evaluation value of the second character)
First, only the predicted character string starting with the base character string “social” having a high value is searched. If the number of the predicted character strings searched here is less than 50, a predicted character string starting with the base character string “don't forget” having the next highest evaluation value is searched.
【0058】このようにして、入力パターンを認識した
結果の認識候補文字の組み合わせてできる基底文字列の
中で、予め設定した予測文字列数の範囲内で評価の高い
基底文字列から順にそれに続く文字列を予測することに
よって、検索される予測文字列数を制限し、利用者が意
図した文字列をより容易に入力することが可能となる。As described above, among the base character strings formed by combining the recognition candidate characters obtained as a result of the recognition of the input pattern, the base character strings having the highest evaluation within the preset number of predicted character strings are successively arranged. By predicting a character string, it is possible to limit the number of predicted character strings to be searched and to more easily input a character string intended by a user.
【0059】なお、前述した説明では、各認識候補文字
に対する文字認識処理の際の評価値(パターン認識辞書
104に格納された標準パターンとの類似度を示す)を
もとに基底文字列の評価値を算出しているが、認識候補
文字の候補順位をもとに基底文字列の評価値を算出する
ようにしても良い。In the above description, the evaluation of the base character string is performed based on the evaluation value (indicating the similarity with the standard pattern stored in the pattern recognition dictionary 104) at the time of character recognition processing for each recognition candidate character. Although the value is calculated, the evaluation value of the base character string may be calculated based on the candidate rank of the recognition candidate character.
【0060】例えば、本実施形態では、10個の認識候
補文字を求めるものとしているため、候補順位が第1位
の認識候補の得点を10点とし、第2位以下の認識候補
文字の得点を順次、9点、8点、…、1点とする。予測
制御部106は、認識候補文字の組み合わせによって生
成される各基底文字列の評価値を、基底文字列を構成す
る各認識候補文字に対する得点の平均値として求める。For example, in the present embodiment, since ten recognition candidate characters are obtained, the score of the recognition candidate having the first candidate rank is set to 10 points, and the score of the recognition candidate character having the second or lower rank is determined. Nine points, eight points,..., One point. The prediction control unit 106 calculates an evaluation value of each base character string generated by a combination of the recognition candidate characters as an average of scores for each recognition candidate character forming the base character string.
【0061】また、前述した第2の実施形態の説明にお
いて、基底文字列の評価値を、基底文字列を構成する認
識候補文字の文字認識時に得られる各文字に対する評価
値の平均値としているが、単語辞書108に格納された
単語(文字列)に対応する評価値をもとに基底文字列に
対する評価値を設定しても良い。単語辞書108中の単
語に対応する評価値としては、例えば認識結果として確
定された回数を示す値(使用頻度値)がある。この場
合、表示された予測文字列中から入力文字列として選択
された場合には、単語辞書108の対応する文字列の使
用頻度値を更新しているものとする。In the above description of the second embodiment, the evaluation value of the base character string is the average value of the evaluation values for each character obtained at the time of character recognition of the recognition candidate character constituting the base character string. Alternatively, an evaluation value for a base character string may be set based on an evaluation value corresponding to a word (character string) stored in the word dictionary 108. As an evaluation value corresponding to a word in the word dictionary 108, for example, there is a value indicating the number of times determined as a recognition result (use frequency value). In this case, when the input character string is selected from the displayed predicted character strings, it is assumed that the use frequency value of the corresponding character string in the word dictionary 108 has been updated.
【0062】予測制御部106は、辞書検索部107に
よって、認識候補文字をもとに生成された基底文字列に
該当する単語(文字列)を単語辞書108から検索し、
該当する文字列(完全一致する文字列)に対応する使用
頻度値を基底文字列に対する評価値とする。The prediction control unit 106 searches the word dictionary 108 for a word (character string) corresponding to the base character string generated based on the recognition candidate character by the dictionary search unit 107,
A use frequency value corresponding to the corresponding character string (a character string that completely matches) is set as an evaluation value for the base character string.
【0063】以下、前述した第2実施形態の説明と同様
にして、評価値の高い基底文字列から優先して予測文字
列を求める。この使用頻度値を評価値として用いること
により、文書作成で多く使われている単語に対する予測
文字列が優先して表示されることになるので、予測文字
列を用いた文字入力をより効率的にすることが可能とな
る。Hereinafter, in the same manner as in the description of the second embodiment described above, a predicted character string is obtained by giving priority to a base character string having a high evaluation value. By using this usage frequency value as an evaluation value, a predicted character string for a word that is frequently used in document creation is displayed with priority, so that character input using a predicted character string can be performed more efficiently. It is possible to do.
【0064】また、本発明は実施形態で説明したような
手書き文字入力に限らず、音声入力等のパターン認識機
能を有する文字入力装置においても応用可能であり、パ
ターン認識機能を有する入力一般において入力の際の入
力操作をより容易にすることができる。The present invention can be applied not only to the handwritten character input described in the embodiment but also to a character input device having a pattern recognition function such as a voice input. In this case, the input operation can be made easier.
【0065】なお、上述した各実施形態において記載し
た手法は、コンピュータに実行させることのできるプロ
グラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に提供することができる。また、通信媒体によ
り伝送して各種装置に提供することも可能である。本装
置を実現するコンピュータは、記録媒体に記録されたプ
ログラムを読み込み、または通信媒体を介してプログラ
ムを受信し、このプログラムによって動作が制御される
ことにより、上述した処理を実行する。The method described in each of the above-described embodiments is, for example, a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM,
DVD and the like, and can be written to a recording medium such as a semiconductor memory and provided to various devices. Further, it is also possible to transmit the data via a communication medium and provide it to various devices. A computer that implements the present apparatus reads the program recorded on a recording medium or receives the program via a communication medium, and executes the above-described processing by controlling the operation of the program.
【0066】[0066]
【発明の効果】以上詳述したように本発明によれば、入
力パターンを認識した結果の認識候補文字を組み合わせ
てできる基底文字列の中で、予め設定した予測文字列数
の範囲内で評価の高い基底文字列から順にそれに続く文
字列を予測する、あるいは文字種ごとに予測を開始する
ための文字数に関する条件を設定し、その条件を満たす
基底文字列について文字列を予測することによって、検
索される予測文字列数を制限し、利用者が意図した文字
列をより容易に入力することが可能となる。As described above in detail, according to the present invention, among the base character strings formed by combining the recognition candidate characters obtained as a result of recognizing the input pattern, the evaluation is performed within the preset number of predicted character strings. The search is performed by predicting the subsequent character strings in order from the base character string with the highest character, or by setting the condition regarding the number of characters to start prediction for each character type, and predicting the character string for the base character string that satisfies the condition Thus, the number of predicted character strings can be limited, and the character string intended by the user can be more easily input.
【図1】本実施形態に係わる文字列予測装置の構成を示
すブロック図。FIG. 1 is a block diagram showing a configuration of a character string prediction device according to an embodiment.
【図2】第1実施形態における文字列予測装置の文字入
力から予測文字列の出力までの処理の流れを示したフロ
ーチャート。FIG. 2 is a flowchart showing a flow of processing from character input to output of a predicted character string of the character string prediction device according to the first embodiment.
【図3】第1実施形態における文字列予測装置の文字入
力から文字列予測まで様子を示す図。FIG. 3 is a diagram showing a state from character input to character string prediction of the character string prediction device according to the first embodiment.
【図4】第2実施形態における文字列予測装置の文字入
力から予測文字列の出力までの処理の流れを示したフロ
ーチャート。FIG. 4 is a flowchart showing a flow of processing from character input to output of a predicted character string of a character string prediction device according to a second embodiment.
【図5】第2実施形態における文字列予測装置の文字入
力から文字列予測までの様子を示す図。FIG. 5 is a diagram showing a state from character input to character string prediction of a character string prediction device according to a second embodiment.
【図6】第2実施形態における予測文字列の検索につい
て説明するための図。FIG. 6 is an exemplary view for explaining a search for a predicted character string in the second embodiment.
101…入力装置 102…文字入力部 103…パターン認識部 104…パターン認識辞書 105…入力バッファ 106…予測制御部 107…辞書検索部 108…単語辞書 109…候補バッファ 110…出力制御部 111…出力バッファ 112…出力装置 101 input device 102 character input unit 103 pattern recognition unit 104 pattern recognition dictionary 105 input buffer 106 prediction control unit 107 dictionary search unit 108 word dictionary 109 candidate buffer 110 output control unit 111 output buffer 112 output device
Claims (7)
文字パターンを認識して認識候補文字を出力するパター
ン認識手段を有し、入力された文字列を基底文字列とし
てそれに続く文字列を単語辞書を参照して予測する文字
列予測装置であって、 入力された文字パターンを抽出して前記パターン認識手
段によって該文字パターンを認識して認識候補文字を出
力する文字入力手段と、 少なくとも読みとそれに対応する見出しとを格納した単
語辞書と、 前記単語辞書を参照して基底文字列を先頭部分に持つ予
測文字列を検索する辞書検索手段と、 前記文字入力手段が出力した認識候補文字を組み合わせ
て基底文字列を生成し、生成した基底文字列の中で基底
文字列を構成する認識候補文字の文字種をチェックし、
文字種ごとに文字数に関して予め設定した予測開始条件
を満足する基底文字列について前記辞書検索手段に指示
して予測文字列を検索する予測制御手段とを具備した文
字列予測装置。1. A pattern recognition unit for recognizing an input character pattern by referring to a pattern recognition dictionary and outputting recognition candidate characters, wherein the input character string is used as a base character string, A character string prediction device for predicting with reference to a dictionary, comprising: a character input unit that extracts an input character pattern, recognizes the character pattern by the pattern recognition unit, and outputs a recognition candidate character; Combining a word dictionary storing headings corresponding thereto, a dictionary search unit for searching for a predicted character string having a base character string at the beginning with reference to the word dictionary, and a recognition candidate character output by the character input unit To generate a base character string, and in the generated base character string, check the character type of the recognition candidate character constituting the base character string,
A character string prediction apparatus comprising: a prediction control unit that instructs the dictionary search unit to search for a predicted character string by instructing the dictionary search unit about a base character string that satisfies a prediction start condition preset for the number of characters for each character type.
文字パターンを認識することによって文字を入力し、入
力された文字列を基底文字列としてそれに続く文字列を
単語辞書を参照して予測する文字列予測方法であって、 認識結果の認識候補文字を組み合わせてできる基底文字
列の中で基底文字列を構成する認識候補文字の文字種を
チェックし、文字種ごとに文字数に関して予め設定した
予測開始条件を満足する基底文字列について単語辞書か
ら予測文字列を検索することを特徴とする文字列予測方
法。2. A character is input by recognizing an input character pattern with reference to a pattern recognition dictionary, and the input character string is used as a base character string to predict a subsequent character string with reference to a word dictionary. A character string prediction method, wherein a character type of a recognition candidate character forming a base character string is checked among base character strings formed by combining recognition candidate characters of a recognition result, and a prediction start condition set in advance with respect to the number of characters for each character type A character string prediction method comprising: searching a word dictionary for a predicted character string for a base character string that satisfies the following.
文字パターンを認識して認識候補文字を出力するパター
ン認識手段を有し、入力された文字列を基底字列として
それに続く文字列を単語辞書を参照して予測する文字列
予測装置であって、 入力された文字パターンを抽出して前記パターン認識手
段によって該文字パターンを認識して認識候補文字を出
力する文字入力手段と、 少なくとも読みとそれに対応する見出しとを格納した単
語辞書と、 前記単語辞書を参照して基底文字列を先頭部分に持つ予
測文字列を検索する辞書検索手段と、 前記文字入力手段が出力した認識候補文字を組み合わせ
て基底文字列を生成し、基底文字列ごとに評価値を設定
し、検索される予測文字列数が予め設定した範囲内とな
るように評価の高い基底文字列を優先して予測文字列を
検索する予測文字列制御手段とを具備した文字列予測装
置。3. A pattern recognition means for recognizing an input character pattern with reference to a pattern recognition dictionary and outputting recognition candidate characters, wherein the input character string is used as a base character string, A character string prediction device for predicting with reference to a dictionary, comprising: a character input unit that extracts an input character pattern, recognizes the character pattern by the pattern recognition unit, and outputs a recognition candidate character; Combining a word dictionary storing headings corresponding thereto, a dictionary search unit for searching for a predicted character string having a base character string at the beginning with reference to the word dictionary, and a recognition candidate character output by the character input unit To generate a base character string, set an evaluation value for each base character string, and select a base character string with a high evaluation so that the number of predicted character strings to be searched is within a preset range. Previously to string predicting apparatus and a predictive text control means for retrieving the predicted character string.
文字パターンを認識することによって文字を入力し、入
力された文字列を基底文字列としてそれに続く文字列を
単語辞書を参照して予測する文字列予測方法であって、 認識結果の認識候補文字を組み合わせてできる基底文字
列ごとに評価値を算出し、検索される予測文字列数が予
め設定した範囲内となるように評価の高い基底文字列を
優先して予測文字列を単語辞書から検索することを特徴
とする文字列予測方法。4. A character is input by recognizing an input character pattern with reference to a pattern recognition dictionary, and the input character string is used as a base character string to predict a subsequent character string with reference to a word dictionary. A character string prediction method, wherein an evaluation value is calculated for each base character string formed by combining recognition candidate characters of a recognition result, and a base having a high evaluation is set so that the number of predicted character strings to be searched is within a preset range. A character string prediction method characterized by searching for a predicted character string from a word dictionary by giving priority to a character string.
を構成する認識候補文字の認識時の評価値を用いて算出
することを特徴とする請求項3記載の文字列予測装置。5. The character string prediction device according to claim 3, wherein the evaluation value of the base character string is calculated using an evaluation value at the time of recognition of a recognition candidate character forming the base character string.
毎に評価値が設定された辞書を参照し、基底文字列と該
当する文字列に対応する評価値とすることを特徴とする
請求項1記載の文字列予測装置。6. The evaluation value of the base character string is referred to a dictionary in which an evaluation value is set for each character string in advance, and is set as an evaluation value corresponding to the base character string and the corresponding character string. The character string prediction device according to claim 1.
の認識候補文字を組み合わせてできる基底文字列ごとに
評価値を算出し、検索される予測文字列数が設定した範
囲内となるように評価の高い基底文字列を優先して予測
文字列を単語辞書から検索する処理を繰り返し行う請求
項3記載の文字列予測装置。7. Each time a character is sequentially input, an evaluation value is calculated for each base character string formed by combining recognition candidate characters of a recognition result, so that the number of predicted character strings to be searched is within a set range. 4. The character string prediction device according to claim 3, wherein a process of retrieving a predicted character string from a word dictionary by giving priority to a base character string having a high evaluation is repeatedly performed.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10262890A JP2000099635A (en) | 1998-09-17 | 1998-09-17 | Character string prediction device and character string prediction method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10262890A JP2000099635A (en) | 1998-09-17 | 1998-09-17 | Character string prediction device and character string prediction method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000099635A true JP2000099635A (en) | 2000-04-07 |
Family
ID=17382049
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10262890A Pending JP2000099635A (en) | 1998-09-17 | 1998-09-17 | Character string prediction device and character string prediction method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000099635A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004220437A (en) * | 2003-01-16 | 2004-08-05 | Renesas Technology Corp | Information recognition device |
| JP2007018290A (en) * | 2005-07-07 | 2007-01-25 | Univ Of Tokyo | Handwritten character input display support apparatus, method, and program |
| JP2008299431A (en) * | 2007-05-29 | 2008-12-11 | Casio Comput Co Ltd | Handwritten character input device and control program thereof |
-
1998
- 1998-09-17 JP JP10262890A patent/JP2000099635A/en active Pending
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004220437A (en) * | 2003-01-16 | 2004-08-05 | Renesas Technology Corp | Information recognition device |
| JP2007018290A (en) * | 2005-07-07 | 2007-01-25 | Univ Of Tokyo | Handwritten character input display support apparatus, method, and program |
| JP2008299431A (en) * | 2007-05-29 | 2008-12-11 | Casio Comput Co Ltd | Handwritten character input device and control program thereof |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7099507B2 (en) | Method and system for extracting title from document image | |
| JP4570509B2 (en) | Reading generation device, reading generation method, and computer program | |
| JP3792755B2 (en) | Character recognition method and apparatus | |
| JP3599180B2 (en) | SEARCH METHOD, SEARCH DEVICE, AND RECORDING MEDIUM | |
| JP2000099635A (en) | Character string prediction device and character string prediction method | |
| JP4302918B2 (en) | Hangul character generation method and dictionary lookup method | |
| JP2002063197A (en) | Search device, recording medium, and program | |
| JP2003331214A (en) | Character recognition error correction method, apparatus and program | |
| JP2000331023A (en) | Information search device and storage medium storing information search processing program | |
| JP3233803B2 (en) | Hard-to-read kanji search device | |
| JPH10143501A (en) | Character string prediction method and document creation device using this character string prediction method | |
| JPH05346974A (en) | Character recognition device | |
| JP3548372B2 (en) | Character recognition device | |
| JP3071745B2 (en) | Post-processing method of character recognition result | |
| JPH08190603A (en) | Character recognition device and its candidate character display method | |
| JPH11134329A (en) | Character string prediction device and character string prediction method | |
| JPH07191986A (en) | Sentence input device | |
| JP2842271B2 (en) | Handwritten character string input device | |
| JPH0991311A (en) | Information storage and retrieval device and control method thereof | |
| JPH10307839A (en) | Text search apparatus and method | |
| JPH0436885A (en) | Optical character reader | |
| JP2639314B2 (en) | Character recognition method | |
| JPH10269209A (en) | Character string prediction device and character string prediction method | |
| JPS6059487A (en) | Recognizer of handwritten character | |
| JPH08190565A (en) | Database search method |