[go: up one dir, main page]

JPH04167051A - Document editing device - Google Patents

Document editing device

Info

Publication number
JPH04167051A
JPH04167051A JP2293911A JP29391190A JPH04167051A JP H04167051 A JPH04167051 A JP H04167051A JP 2293911 A JP2293911 A JP 2293911A JP 29391190 A JP29391190 A JP 29391190A JP H04167051 A JPH04167051 A JP H04167051A
Authority
JP
Japan
Prior art keywords
editing
text information
word
information
operator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2293911A
Other languages
Japanese (ja)
Inventor
Hideki Hirakawa
秀樹 平川
Katsumi Tanaka
克己 田中
Etsuo Ito
悦雄 伊藤
Kimito Takeda
武田 公人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2293911A priority Critical patent/JPH04167051A/en
Publication of JPH04167051A publication Critical patent/JPH04167051A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To eliminate the need for similar kinds of repetitive process by an operator by comparing document information at a 1st editing point with document information at a 2nd editing point which is obtained by an operator's process and utilizing the result for subsequent editing operation. CONSTITUTION:The document editing device is equipped with a storage means 3 stored with the document information at the 1st editing point as to document information and an extracting means 4 which compares the document information at the 1st editing point with the document information at the 2nd editing point obtained by the operator's process and extracts information for converting the document information at the 1st editing point into the document information at the 2nd editing point. The device is further equipped with a storage means 3 stored with the conversion information extracted by the extracting means 4 and the extracted information is utilized for subsequent editing operation. Consequently, the repetition of similar kinds of process performed by the operator can be avoided and the efficiency of the operation is improved.

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は、文章の編集に用いられる文書編集装置に関す
るものである。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention (Field of Industrial Application) The present invention relates to a document editing device used for editing texts.

(従来の技術) 最近、コンピュータ技術の進歩は目覚ましいものがあり
、読み情報を入力することにより文書情報を出力するワ
ードプロセッサなどが広く普及している。
(Prior Art) Recently, computer technology has made remarkable progress, and word processors that output document information by inputting reading information have become widespread.

ところで、このようなワードプロセッサにより作成され
た文書について文章の訂正、削除などの編集を行うもの
として文書編集装置か用いられている。
By the way, document editing devices are used to edit documents created by such word processors, such as correcting and deleting sentences.

これまでの文書編集は、操作対象と操作コマンドを指定
することで所望する処理を実行するようにしているが、
このような処理は、それぞれ独立したものであるため、
例えば文章中に多数存在する同一単語について訂正を行
う場合には、多大の時間と手間がかかり実用的でない。
In conventional document editing, the desired process is executed by specifying the operation target and operation command.
Since each of these processes is independent,
For example, when correcting many identical words in a sentence, it takes a lot of time and effort, which is impractical.

そこで、最近のワードプロセッサには、文字列の削除、
置換などのオペレーションを記憶し、同じオペレーショ
ンを文書全体に適用するようにした「全文対象」の編集
方法が考えられている。
Therefore, recent word processors have methods such as deleting strings,
A ``full text'' editing method is being considered in which operations such as replacement are memorized and the same operation is applied to the entire document.

しかし、この方法は、1つのオペレーションの文章全体
への適用であるため、複数のオペレーションに対しては
適用できなかった。また、このような「全文対象」の編
集方法では、1つのオペレーションを文章全体に適用す
るのに適さないような処理(例えば、文字Ωを文字1に
変換する場合)には、不適切であった。
However, since this method applies one operation to the entire text, it cannot be applied to multiple operations. Furthermore, such editing methods that target the entire text are inappropriate for processing that is not suitable for applying one operation to the entire text (for example, when converting the character Ω to the character 1). Ta.

一方、このような「全文対象」の編集方法の他に、置換
対象の文字列と置換する文字列をユーザが指定し、シス
テムは文字列を検索しユーザに問い合わせるという形で
処理を進行する問い合わせ型の文字列置換による編集方
法がある。しかし、この場合にも、1つのオペレーショ
ンを適切にユーザが指定する必要があった。
On the other hand, in addition to this "full text" editing method, there is also a query method in which the user specifies the string to be replaced with the string to be replaced, and the system searches for the string and queries the user. There is an editing method that involves string replacement of the type. However, even in this case, it was necessary for the user to appropriately specify one operation.

ところが、このような編集方法を用いて、例えば機械翻
訳に利用されるOCR(光学式文字読取装置)により読
み取られた文章の校正を行う場合は、オペレータは、O
CRが読み誤りした単語を発見する度にその単語の修正
や一括修正を行う必要があった。特に、OCRの特性か
ら、仮に文字mを文字rnと読み誤るような場合には、
“systemn+を” 3y6tem”に、また、”
ttrne −を“tiIIle−に変換するように、
多くの語について同じ処理(“rn”を“m”に置き換
える)を行う必要があった。
However, when using such an editing method to proofread a text read by an OCR (optical character reader) used for machine translation, the operator must
Every time CR discovered a word that was misread, it was necessary to correct the word or make a batch correction. In particular, due to the characteristics of OCR, if the letter m is misread as the letter rn,
“systemn+” to “3y6tem”, and “
Like converting ttrne - to "tiIIle-,"
The same process (replacing "rn" with "m") had to be done for many words.

また、一部の文書編集装置には、一連のコンマド列を記
憶し、その処理を1つのコマンドにまとめるという機能
が実現されている。この種の機能は、複数の処理を一つ
にまとめ、同じ処理を繰り返し行うという場合に操作の
効率化が計られる。
Further, some document editing devices have a function of storing a series of commad strings and combining the processing into one command. This type of function can improve operational efficiency when multiple processes are combined into one and the same process is repeated.

しかしながらこの機能は、やはり、ある1つの対象に対
して一連の処理コマンドを記憶するものであるため、所
望する処理が複数個存在する場合に、複数個の操作コマ
ンドを定義する必要があり、オペレータにとってそれら
のコマンドを記憶し、適切に適用することは非常に困難
であった。特に、文章に沿って頭から編集を行って行き
たい場合には、その適用が困難であった。また、オペレ
ータは、編集コマンドの他に、その操作を適用する場合
の条件などを規定する必要があり、高度な技能を必要と
した。
However, this function still stores a series of processing commands for one object, so if there are multiple desired processes, it is necessary to define multiple operation commands, and the operator It was very difficult for people to remember those commands and apply them properly. In particular, it is difficult to apply this method when editing from the beginning according to the text. In addition, the operator had to specify not only the editing command but also the conditions for applying the operation, which required a high degree of skill.

(発明が解決しようとする課題) このように従来の文書編集装置では、オペレータが行い
たい複数個の処理を適切に記憶・利用することができな
いため、オペレータは同種の処理を何回も繰り返して行
う必要かあったり、また、文章に沿って頭から編集を行
うことも困難であった。さらに、複数のコマンドを1つ
にまとめて定義する機能を持つものにおいても、その使
用には高度な技能を必要とし、編集作業の効率が悪かっ
たり、操作が複雑になるなどの欠点があった。
(Problem to be Solved by the Invention) As described above, with conventional document editing devices, it is not possible to appropriately store and use multiple processes that the operator wants to perform, so the operator has to repeat the same type of process over and over again. It was also difficult to edit from scratch along with the text. Furthermore, even with the function of defining multiple commands in one, they require a high degree of skill to use, and have drawbacks such as inefficient editing and complicated operations. .

本発明は、上記事情に鑑みてなされたもので、オペレー
タによる操作を簡単にできるとともに、編集作業の効率
化を図ることかできる文書編集装置を提供することを目
的とする。
The present invention has been made in view of the above circumstances, and it is an object of the present invention to provide a document editing device that can be easily operated by an operator and that can improve the efficiency of editing work.

[発明の構成] (課題を解決するための手段) 本発明は、文章情報に対し編集コマンドに対応した編集
を実行する文書編集装置であって、文章情報に対する第
一の編集時点での文章情報を記憶する記憶手段、上記文
章情報に対する第一の編集時点での文章情報と第二の編
集時点の文章情報を比較するとともに第一の編集時点で
の文章情報を第二の編集時点の文章情報に変換する情報
を抽出する抽出手段、この抽出手段で抽出された変換情
報を記憶する記憶手段より構成したものである。
[Structure of the Invention] (Means for Solving the Problems) The present invention is a document editing device that executes editing corresponding to an editing command on text information, the text information at the time of first editing on the text information. A storage means for storing the above-mentioned text information, compares the text information at the first editing time and the text information at the second editing time, and converts the text information at the first editing time to the text information at the second editing time. The apparatus includes an extraction means for extracting information to be converted into an image, and a storage means for storing the conversion information extracted by the extraction means.

また、本発明は、文章情報に対し編集コマンドに対応し
た編集を実行する文書編集装置であって、文章情報に対
する第一の編集時点での文章情報を記憶する記憶手段、
文章情報に対する第一の編集時点での文章情報と第二の
編集時点の文章情報を比較するとともに第一の編集時点
での文章情報を第二の編集時点の文章情報に変換する情
報を抽出する抽出手段、この抽出手段で抽出された変換
情報を記憶する記憶手段、文章中の情報を検索可能にす
る検索手段を具備し、この検索手段により情報が検索さ
れた時点を第一の編集時点および第二の編集時点の少な
くとも一方の編集時点に設定するように構成したもので
ある。
The present invention also provides a document editing device that executes editing corresponding to an editing command on text information, comprising a storage means for storing text information at the time of first editing the text information;
The text information at the time of first editing and the text information at the time of second editing are compared, and the information for converting the text information at the time of first editing into the text information at the time of second editing is extracted. It is equipped with an extraction means, a storage means for storing the conversion information extracted by the extraction means, and a search means for making it possible to search for information in a text, and the time when the information is retrieved by the search means is defined as the first editing time and the first editing time. This is configured to be set at at least one of the second editing time points.

さらに、本発明は、文章情報に対し編集コマンドに対応
した編集を実行する文書編集装置であって、文章情報に
対する第一の編集時点での文章情報を記憶する記憶手段
、文章情報に対する第一の編集時点での文章情報と第二
の編集時点の文章情報を比較するとともに、第一の編集
時点での文章情報を第二の編集時点の文章情報に変換す
る情報を抽出する抽出手段、この抽出手段で抽出された
変換情報を記憶する記憶手段、第一の編集時点の文章情
報から第二の編集時点の文章情報への変換が適用される
文章情報を検索する検索手段とを具備し、この検索手段
で検索された文章情報の変換結果を検証可能に構成した
ものである。
Furthermore, the present invention provides a document editing device that executes editing corresponding to an editing command on text information, comprising a storage means for storing text information at the time of first editing of the text information; Extraction means for comparing text information at the time of editing with text information at a second editing time and extracting information for converting text information at the first editing time into text information at the second editing time; a storage means for storing the conversion information extracted by the means; and a search means for searching for text information to which conversion from text information at the first editing time to text information at the second editing time is applied; The system is configured to enable verification of the conversion results of text information retrieved by the search means.

(作用) この結果、本発明によれば、第一の編集時点の文章情報
を記憶しておき、その後、オペレータが処理を行った結
果得られた第二の編集時点の文章情報を第一の編集情報
と比較し、第一の編集時点の文章情報から第二の編集時
点への文章情報へ変換するための情報を抽出して、この
情報を、これ以降の編集作業において利用するようにで
きるので、オペレータが同種の処理を繰り返し行うこと
を避けることができ、作業の効率化を図ることができる
ようになる。つまり、オペレータが行った処理(複数の
コマンドを実行した結果でも良い)を、後の処理に利用
することができることから効率的な編集作業が可能とな
る。
(Operation) As a result, according to the present invention, the text information at the first editing time is stored, and then the text information at the second editing time obtained as a result of the processing by the operator is stored at the first editing time. By comparing with the editing information, information for converting text information at the first editing point to text information at the second editing point can be extracted, and this information can be used in subsequent editing work. Therefore, the operator can avoid repeatedly performing the same type of processing, and work efficiency can be improved. In other words, the processing performed by the operator (even the result of executing a plurality of commands) can be used for subsequent processing, which enables efficient editing work.

(実施例) 以下、本発明の一実施例を図面にしたがい説明する。(Example) An embodiment of the present invention will be described below with reference to the drawings.

第1図は、同実施例の構成を示すブロック図である。図
において、1はキーボードなどからなる入力部で、この
入力部1は、編集処理の対象となる文章、各種コマンド
を人力するようになっている。
FIG. 1 is a block diagram showing the configuration of the same embodiment. In the figure, reference numeral 1 denotes an input section consisting of a keyboard, etc., and this input section 1 is designed to manually input sentences and various commands to be edited.

そして、この入力部1より入力される入力データは、制
御部2に送られる。制御部2は、本装置全体を制御する
ためのもので、ここでは、制御部2は、記憶部3、検証
部4および表示制御部らに制御指令を与えるようになっ
ている。
Input data input from this input section 1 is sent to a control section 2. The control section 2 is for controlling the entire apparatus, and here, the control section 2 is configured to give control commands to the storage section 3, the verification section 4, the display control section, etc.

記憶部3は、入力部1がら入力された文章などを記憶す
るものである。検証部4は、検証処理に用いる知識を収
容したものである。そして、表示制御部5は、表示部6
での表示を制御するもので、入力部1から入力される文
章などを表示させるようにしている。
The storage unit 3 stores sentences and the like inputted from the input unit 1. The verification unit 4 stores knowledge used in verification processing. Then, the display control unit 5 controls the display unit 6
It controls the display on the input section 1, and displays sentences etc. input from the input section 1.

第2図は、入力部1に用いられるキーボードのキー配列
の一例を示す図である。
FIG. 2 is a diagram showing an example of a key arrangement of a keyboard used in the input section 1. As shown in FIG.

この場合、入力部1は、文章入力用の図示しない文字キ
ーに加えて、検索指示キー100、編集キー101〜1
04、カーソル移動キー105、カーソル拡大キー:1
06、カーソル縮小キー107、確認キー108、取り
消しキー109、終了キー110、学習開始キー111
、学習終了キー112、次候補キー113、変換キー1
14、モード変更キー115の各種キーを備えている。
In this case, the input unit 1 includes, in addition to character keys (not shown) for inputting text, a search instruction key 100 and edit keys 101 to 1.
04, Cursor movement key 105, Cursor enlargement key: 1
06, cursor reduction key 107, confirmation key 108, cancel key 109, end key 110, learning start key 111
, learning end key 112, next candidate key 113, conversion key 1
14 and a mode change key 115.

次に、このように構成した実施例の動作を説明する。Next, the operation of the embodiment configured as described above will be explained.

まず、本装置全体を制御するための制御部2ての動作を
第3図のフローチャートにしたかい説明する。
First, the operation of the control section 2 for controlling the entire apparatus will be explained using the flowchart shown in FIG.

この場合、制御部2では、ステップAI、ステップA4
.ステップA6.ステップA8.ステップA10.ステ
ップA12.ステップA14によって入力部1からのキ
ー人力の判断を行うようにしている。
In this case, in the control section 2, step AI, step A4
.. Step A6. Step A8. Step A10. Step A12. In step A14, the key input from the input section 1 is determined.

ステップA1では、第2図で示した入力部1のキーボー
ド上の図示しない文字キーが押されたかどうかの判断を
行う。ここで、文字キーが押された場合には、オペレー
タが原文の入力を行っていると判断する。そして、ステ
ップA2に進み、押された文字キーに対応する文字コー
ドを記憶部3の対応する記憶領域に記憶するとともに、
ステップA3において表示制御部5により表示部6に表
示する。
In step A1, it is determined whether a character key (not shown) on the keyboard of the input unit 1 shown in FIG. 2 has been pressed. Here, if a character key is pressed, it is determined that the operator is inputting the original text. Then, proceeding to step A2, the character code corresponding to the pressed character key is stored in the corresponding storage area of the storage unit 3, and
In step A3, the display control unit 5 displays the information on the display unit 6.

ステップA4では、入力部1のキーボード上の学習開始
キー111が入力されたかを判定する。
In step A4, it is determined whether the learning start key 111 on the keyboard of the input unit 1 has been input.

学習開始キー111が入力された場合には、ステップA
5において文章情報の保存処理を行う。文章情報の保存
処理については、後で詳細に説明する。
If the learning start key 111 is input, step A
In step 5, text information is stored. The text information storage process will be explained in detail later.

ステップA6では、学習終了キー112が入力されたか
を判定する。学習終了キー112か入力された場合には
、ステップA7において学習処理を行う。この学習処理
についても、後で詳細に説明する。
In step A6, it is determined whether the learning end key 112 has been input. When the learning end key 112 is input, learning processing is performed in step A7. This learning process will also be explained in detail later.

ここで、学習開始キー111が入力されてから、学習終
了キー112が入力されるまでの間にオペレータは、そ
の他の編集機能を使用して文章の修正などを行うように
なる。
Here, after the learning start key 111 is input until the learning end key 112 is input, the operator uses other editing functions to correct the text.

ステップA8では、入力部1のキーボード上の変換キー
114が人力されたかを判定する。変換キー114が入
力された場合には、ステップA9においては変換処理を
行う。変換処理についても、後で詳細に説明する。
In step A8, it is determined whether the conversion key 114 on the keyboard of the input unit 1 has been pressed manually. If the conversion key 114 is input, conversion processing is performed in step A9. The conversion process will also be explained in detail later.

ステップAIOでは、入力部1のキーボード上の検索指
示キー100が人力されたかを判定する。
In step AIO, it is determined whether the search instruction key 100 on the keyboard of the input unit 1 has been pressed manually.

検索指示キー100が入力された場合には、ステップA
llにおいて検索処理を行う。検索処理についても、後
で詳細に説明する。
If the search instruction key 100 is input, step A
Search processing is performed in ll. The search process will also be explained in detail later.

ステップA12では、人力部1のキーボード上の編集キ
ー101〜104が入力されたかを判定する。編集キー
101〜104が入力された場合には、ステップA13
において編集キーに対応した処理を行う。例えば、文章
入力の途中で訂正・挿入・削除などの編集が必要な場合
には、カーソル移動キー106を用いて所望の編集箇所
へカーソルを移動した後、編集キー101〜104のう
ち挿入キー(101)、削除キー(102)、バックデ
リートキー(103)などの各キーを用いて編集作業を
行うようになる。
In step A12, it is determined whether the edit keys 101 to 104 on the keyboard of the human power section 1 have been input. If the edit keys 101 to 104 are input, step A13
, performs processing corresponding to the edit key. For example, if editing such as correction, insertion, or deletion is required during text input, use the cursor movement key 106 to move the cursor to the desired editing location, and then press the insert key among the editing keys 101 to 104. 101), a delete key (102), a back delete key (103), and other keys to perform editing work.

次に、ステップA14では、編集処理を終了するかどう
かを終了キー110の入力の有無で判断する。終了キー
110が入力された場合には、ステップA15において
、ステップA1で入力された文章を記憶部3に記憶して
、編集処理を終了する。
Next, in step A14, it is determined whether or not to end the editing process based on whether or not the end key 110 is input. When the end key 110 is input, in step A15, the text input in step A1 is stored in the storage unit 3, and the editing process is ended.

その他のキー人力が行われた場合、ステップA16にお
いて、そのキーに対応した処理を行う。
If any other key is manually operated, the process corresponding to that key is performed in step A16.

なお、その他のキーとは上述したキーおよび終了キー1
10以外のものを指す。
Note that other keys include the keys mentioned above and the end key 1.
Refers to something other than 10.

次に、学習開始キー111と学習終了キー112の入力
に対する制御部2の動作を第4図および第5図のフロー
チャートにしたがい説明する。
Next, the operation of the control unit 2 in response to inputs from the learning start key 111 and the learning end key 112 will be explained according to the flowcharts of FIGS. 4 and 5.

まず、第4図は、第3図に示すステップA5、すなわち
文章情報保存処理のフローチャートを示すものである。
First, FIG. 4 shows a flowchart of step A5 shown in FIG. 3, that is, text information storage processing.

この場合、ステップB1では、学習開始キー111が入
力された時点におけるカーソル位置の前後の文字列をX
文字ずつとり、それを充交字列領域に記憶する。このX
の値は適当な文字列長である。ステップB2では、学習
開始キー111が入力された時点におけるカーソルの位
置情報を元カーソル位置保持領域に保存する。
In this case, in step B1, the character strings before and after the cursor position at the time when the learning start key 111 is input are
Take each character and store them in the consummation string area. This X
The value of is an appropriate string length. In step B2, the cursor position information at the time when the learning start key 111 is input is stored in the original cursor position holding area.

これにより、カーソルの示していた文字/単語の文書中
の位置を固定することができる。
Thereby, the position of the character/word indicated by the cursor in the document can be fixed.

また、第5図は、第3図に示すステップA7、すなわち
学習処理のフローチャートを示すものである。この場合
、ステップC1では、学習終了キー112が入力された
時点の文書を対象に、第4図のステップB2で設定され
た元カーソル位置保持領域に格納されている位置(学習
開始キー111が入力された時点のカーソル位置に対応
する文書中の位置)の前後X文字分のストリングを現文
字列領域に記憶する。ステップC2では、第4図のステ
ップB1で記憶された充交字列領域中の文字列から元単
語リストを作成するとともに、ステップC1で記憶され
た現文字列領域中の文字列から現単語リストを作成する
Further, FIG. 5 shows a flowchart of step A7 shown in FIG. 3, that is, the learning process. In this case, in step C1, the position stored in the original cursor position holding area set in step B2 in FIG. A string of X characters before and after the position in the document corresponding to the cursor position at the time of the cursor position) is stored in the current character string area. In step C2, an original word list is created from the character strings in the fill-and-cross character string area stored in step B1 of FIG. 4, and a current word list is created from the character strings in the current character string area stored in step C1. Create.

ここで、単語リストの作成について説明する。Here, creation of a word list will be explained.

第6図は、文字列から単語列リストを作成する例を示し
ている。第6図(a)は、英文のストリンク例で、この
英文のストリングに基づいて、第6図(b)に示すよう
な単語リストが作成される。
FIG. 6 shows an example of creating a word string list from character strings. FIG. 6(a) is an example of an English sentence string, and based on this English sentence string, a word list as shown in FIG. 6(b) is created.

ここで、英文の場合は、単語の区切り文字(ブランク、
タブ、改・行など)を基に単語の抽出を行う。
For English text, use the word delimiter (blank,
Words are extracted based on tabs, breaks, lines, etc.).

一方、第6図(C)は、日本語文のストリングの例を示
している。この場合も第6図(d)に示すような単語リ
ストが作成される。この日本語文の場合は、文字の字種
情報(漢字、平仮名、片仮名、記号など)を基に単語の
抽出を行う。もちろん、日本語の形態素解析を行って単
語の抽出を行うことも可能であるが、本実施例では、単
純な方法の例を用いる。
On the other hand, FIG. 6(C) shows an example of a string of Japanese sentences. In this case as well, a word list as shown in FIG. 6(d) is created. In the case of this Japanese text, words are extracted based on character type information (kanji, hiragana, katakana, symbols, etc.). Of course, it is also possible to perform morphological analysis of Japanese to extract words, but in this embodiment, an example of a simple method is used.

再び、第5図に戻って、ステップc3で、元単語リスト
と現単語リストの両者を比較し、元単語群と現単語群を
抽出する。ここで、元単語群と現単語群は、元単語リス
トと現単語リストとの差を示し、元単語リストの元単語
群を現単語群に置き換えると、その結果は、現単語リス
トになるという性質を持っている。
Returning to FIG. 5 again, in step c3, both the original word list and the current word list are compared, and the original word group and the current word group are extracted. Here, the source word group and the current word group indicate the difference between the source word list and the current word list, and when the original word group in the source word list is replaced with the current word group, the result is the current word list. have characteristics.

第7図は、元単語リストと現単語リストの例を示したも
のである。この場合、元単語リストの第3番目の要素は
“5ystern ”であるが、現単語リストでは“s
ystem”となっている。この場合に、元単語群は“
5ystern”であり、現単語群は“system”
である。
FIG. 7 shows an example of the original word list and the current word list. In this case, the third element in the original word list is “5ystern”, but in the current word list, “s
system”.In this case, the original word group is “
5system” and the current word group is “system”
It is.

また、第8図は、元単語群と現単語群の抽出方法を説明
するためのフローチャートチアル。コノ場合、ステップ
D1では、元単語群と現単語群を先頭より比較し、異な
り単語が見付った位置を異なり語開始位置として記憶す
る。この際、元単語群および現単語群の先頭から単純に
比較するのではなく、交互に単語の比較位置をずらしな
がら単語の一致開始点を検索する。例えば、元単語群が
、r 1:ese、2:runetional、3:d
escription。
Further, FIG. 8 is a flowchart for explaining a method for extracting the original word group and the current word group. In this case, in step D1, the original word group and the current word group are compared from the beginning, and the position where a different word is found is stored as a different word start position. At this time, instead of simply comparing the original word group and the current word group from the beginning, the word matching starting point is searched for while alternately shifting the word comparison positions. For example, if the original word group is r 1:ese, 2:runational, 3:d
description.

4:Ianguage、lであり、現単語群が、rL:
nction&1.2:descriptiOn、3:
Ianguage、、 Jである場合には、元単語群の
1番目の単語と現単語群中の単語、現単語群の1番目の
単語と元単語群中の単語、元単語群の2番目の単語と現
単語群中の単語、現単語群の2番目の単語と元単語群中
の単語というように単語の一致点を検索して、元単語の
3番目の単語“deseription′と現単語群の
2番目の単語“description″が単語一致の
開始点として認識される。その後、“descrtpt
ton ”以下の単語で、元単語群と現単語群で初めて
異なっている単語の位置がそれぞれの異なり語開始位置
になる。
4: Language, l, and the current word group is rL:
nction&1.2: descriptionOn, 3:
Language,, J, the first word of the source word group and the word in the current word group, the first word of the current word group and the word in the source word group, the second word of the source word group and the word in the current word group, the second word in the current word group, and the word in the source word group, and so on. The second word “description” is recognized as the starting point for word matching. Then “descrtpt
ton'', the position of the word that differs for the first time between the original word group and the current word group becomes the start position of each different word.

そして、ステップD2において、ステップD1で単語の
一致点が発見できたが否がを判定する。
Then, in step D2, it is determined whether or not a word matching point was found in step D1.

ここで、単語の一致点が発見できながった場合は、抽出
処理失敗として終了する。一方、−散点が発見できた場
合は、ステップD3に進み、元単語群と現単語群を後方
より比較し、異なり単語が見付った位置を異なり語終了
位置として記憶する。ここの処理でもステップD1と同
様に単語群の最後から単純に比較するのではなく、交互
に単語の比較位置をずらしながら単語の一致開始点を検
索する。そして、ステップD4に進む。
Here, if a word match cannot be found, the extraction process ends as a failure. On the other hand, if a -scattering point is found, the process proceeds to step D3, where the original word group and the current word group are compared backwards, and the position where the different word is found is stored as the different word end position. In this process, as in step D1, instead of simply comparing from the end of the word group, the word matching starting point is searched for while alternately shifting the comparison position of the words. Then, the process advances to step D4.

ステップD4では、元単語群の異なり語開始位置から異
なり語終了位置までの文字列を死文字列領域に記憶する
。また、現単語群の異なり語開始位置から異なり語終了
位置までの文字列を現文字列領域に記憶する。
In step D4, the character string from the different word start position to the different word end position of the original word group is stored in the dead character string area. Furthermore, the character string from the different word start position to the different word end position of the current word group is stored in the current character string area.

このような一連の処理により、例えば元単語群か、r 
l:Th1s、2:operating、3:5yst
ern、4:has。
Through this series of processing, for example, the original word group or r
l:Th1s, 2:operating, 3:5yst
ern, 4:has.

5:multilevel、6:tirne、7:sh
aring、8:mode Jであり、現単語群か、r
 1:Th1s、2:operating、3:sys
tem 、 4: has 、 5 :1ult i 
1evel 、 6 :tirne、 7 :shar
ing。
5: multilevel, 6: tirne, 7: sh
aring, 8: mode J, current word group, r
1: Th1s, 2: operating, 3: sys
tem, 4:has, 5:1ulti
1 level, 6: tirne, 7: shar
ing.

8 : modelである場合には、充交字列領域には
、“5ystern ”が記憶され、現文字列領域には
、“system″が記憶される。そして、ステ・ツブ
D4の処理が終わると抽出成功として、処理を終了する
8: In the case of model, "5ystern" is stored in the confluence string area, and "system" is stored in the current character string area. When the process of step D4 is completed, the extraction is deemed successful and the process ends.

再び、第5図の説明に戻って、ステ・ツブC4で、死文
字列と現文字列の抽出が成功したか否かを判定する。こ
こで、抽出に失敗した場合には処理を終了する。一方、
成功した場合には、ステ・ツブC5に進み、死文字列と
現文字列を基にして学習領域への登録を行う。
Returning to the explanation of FIG. 5 again, in step C4 it is determined whether the extraction of the dead character string and the current character string was successful. Here, if the extraction fails, the process ends. on the other hand,
If successful, the process advances to Step C5 and registration in the learning area is performed based on the dead character string and the current character string.

第9図は、学習領域のデータ構造を示す図である。FIG. 9 is a diagram showing the data structure of the learning area.

この場合、学習領域は、マツチング文字列、ターゲット
文字列、規則タイプ、適用条件の4つの要素を1組とし
て構成される項目の集合よりなっている。
In this case, the learning area is made up of a set of items consisting of a set of four elements: a matching character string, a target character string, a rule type, and an application condition.

ここで、マツチング文字列は、置き換えの対象となる文
字列である。ターゲット文字列は、置き換えの目標とな
る文字列である。規則タイプは、規則のタイプを示して
おり、例えば、“Word”、“char”、“chc
t”の3つの値を取る。“word”は、単語の置き換
え規則である事を表し、“char”は、部分文字列の
置き換え規則である事を表し、“chet”は、部分文
脈付きの部分文字列の置き換え規則である事を表す。そ
して、適用条件は、” query″ ” auto”
の2つの値を取るO”query”は、その規則を適用
した結果の実行(単語の置き換え)をオペレータに問い
合わせる形のものであり、“auto″は問い合わせず
自動的に行ってしまうものである。規則タイプ、適用条
件については後で説明を加える。
Here, the matching character string is a character string to be replaced. The target string is the string to be replaced. The rule type indicates the type of the rule, for example, “Word”, “char”, “chc
t” takes three values. “word” represents a word replacement rule, “char” represents a partial string replacement rule, and “chet” represents a partial string replacement rule. Indicates that it is a substring replacement rule.The applicable condition is "query""auto"
O"query", which takes two values, queries the operator about the execution (word replacement) of the result of applying the rule, and "auto" automatically executes the result without asking. . The rule type and application conditions will be explained later.

次に、第10図は、第5図で述べたステ・ツブC5での
処理を詳細に説明するフローチャートである。
Next, FIG. 10 is a flowchart illustrating in detail the processing in step C5 described in FIG.

この場合、ステップE1では、死文字列をマ・ソチング
文字列とし、現文字列をタープ・ソト文字列とし、規則
タイプを“word”とし、適用条件を“query”
として学習辞書に登録する。ここで、既に学習辞書にあ
る場合には、重複登録は行わない。死文字列が“5ys
tern”であり、現文字列か“system”である
場合には、第9図の第一番目の項目が登録される。
In this case, in step E1, the dead string is a ma soting string, the current string is a tarp sot string, the rule type is "word", and the application condition is "query".
Register as a learning dictionary. Here, if it is already in the learning dictionary, duplicate registration will not be performed. Death string is “5ys”
tern" and the current character string is "system", the first item in FIG. 9 is registered.

次に、ステップE2では、死文字列と現文字列の前文脈
部分文字列置換規則の抽出ができるか否かをチエツクす
る。これは死文字列と現文字列の比較を行い、死文字列
を現文字列に変換するのに必要な文字列の置き換えが1
文字であった場合に、かつ、その文字の前の文字が存在
する(空白でない)場合に、その前の文字と置換文字と
を含めてマツチング文字列、ターゲット文字列とするも
のである。例えば、死文字列が“culture”であ
り、現文字列が“culture”であった場合に、死
文字列の“1“を“l”に変換することにより現文字列
を得ることができる。この時、前文脈文字列は、“u1
″となり、前文脈部分文字列変換規則は、第9図の第4
番目の項目となる。しかし、例えば、死文字列が“vt
ility ”であり、現文字列が“utility”
であった場合には、置き換えるべき文字“V”の前に文
字が存在しないため、前文脈文字列変換規則は抽出でき
ない。
Next, in step E2, it is checked whether the previous context partial string replacement rule for the dead string and the current string can be extracted. This compares the dead string and the current string, and the string replacement required to convert the dead string to the current string is 1
If the character is a character, and the character before that character exists (is not blank), the character before that character and the replacement character are included in the matching character string and the target character string. For example, if the dead character string is "culture" and the current character string is "culture", the current character string can be obtained by converting "1" in the dead character string to "l". At this time, the previous context string is “u1
'', and the pre-context substring conversion rule is as shown in Figure 4 in Figure 9.
This is the second item. However, for example, if the death string is “vt
” and the current string is “utility”.
In this case, since there is no character before the character “V” to be replaced, the previous context character string conversion rule cannot be extracted.

つまり、ステップE2で、前文脈部分文字列変換規則が
抽出できる場合には、ステップE3に進み、その学習辞
書への登録を行う。一方、抽出できない場合には、ステ
ップE4に進んで、後文脈文字列変換規則が抽出できる
か否かをチエツクし、抽出可能な場合は、ステップE5
で登録する。前文脈部分文字列変換規則の例に対応する
後文脈部分文字列変換規則は、第9図の第5番目の項目
となる。
That is, if the previous context partial character string conversion rule can be extracted in step E2, the process proceeds to step E3, where it is registered in the learning dictionary. On the other hand, if extraction is not possible, proceed to step E4, and check whether or not the post-context string conversion rule can be extracted; if extraction is possible, step E5
Register with. The post-context sub-character string conversion rule corresponding to the example of the pre-context sub-character string conversion rule is the fifth item in FIG.

そして、ステップE6で、死文字列を現文字列に変換す
るのに必要な部分文字列の置き換え規則を抽出し、それ
を学習辞書に登録する。必要な置き換えが1文字の場合
は、規則タイプを“char”とし、そうでない場合は
“chct”とする。また、置き換えか単語全体となる
場合は、登録は行わない。
Then, in step E6, a partial character string replacement rule necessary for converting the dead character string to the current character string is extracted and registered in the learning dictionary. If the required replacement is one character, set the rule type to "char"; otherwise, set it to "chct". Also, if it is a replacement or an entire word, registration is not performed.

再び、第5図に戻って、ステップC5の登録処理が終了
すると、学習終了キー112に対する処理が終了する。
Returning to FIG. 5 again, when the registration process in step C5 is finished, the process for the learning end key 112 is finished.

次に、第3図に示すステップA9の変換処理(変換キー
114が入力された場合の処理)について説明する。
Next, the conversion process (process when the conversion key 114 is input) in step A9 shown in FIG. 3 will be explained.

第11図は、ステップA9の変換処理を説明するための
フローチャートを示すものである。ステップF1では、
変換キー114が入力された時点のカーソル位置からの
文字列を対象文字列として取り出す。次いで、ステップ
F2では、文字列に対して、学習辞書の規則タイプwo
rdの規則のマツチング文字列とマツチングを行い、マ
ツチする場合には、その規則のターゲット文字列を候補
リストに設定する。
FIG. 11 shows a flowchart for explaining the conversion process in step A9. In step F1,
The character string from the cursor position at the time when the conversion key 114 is input is extracted as the target character string. Next, in step F2, the rule type wo of the learning dictionary is applied to the character string.
Matching is performed with the matching character string of the rule rd, and if a match is found, the target character string of that rule is set in the candidate list.

ステップF3では、候補リストに要素かあるか否かを判
定し、候補が存在する場合には、ステップF4へ進む。
In step F3, it is determined whether or not there is an element in the candidate list, and if there is a candidate, the process advances to step F4.

ステップF4では、候補リストの要素を生成した学習辞
書中の変換項目の適用条件を調べる。適用条件がaut
oである要素が1つだけ存在する場合以外は、ステップ
F5に進む。
In step F4, the application conditions of the conversion items in the learning dictionary that generated the elements of the candidate list are checked. Applicable conditions are out
Unless there is only one element that is o, the process proceeds to step F5.

ステップF5では、候補リストの要素をオペレータに提
示し、適切な要素を1つ選択させる。そして、ステップ
F6で、ステップF5で選択された要素あるいは、ステ
ップF4で認識された適用条件がautoの要素を、文
章中の対象文字列の部分と置換する。
In step F5, the elements of the candidate list are presented to the operator, and the operator is asked to select one appropriate element. Then, in step F6, the element selected in step F5 or the element whose application condition is auto recognized in step F4 is replaced with the target character string in the text.

これにより、学習辞書に登録された変換知識を用いて文
章中の文字列を別の文字列に変換することが行われる。
Thereby, a character string in a sentence is converted into another character string using the conversion knowledge registered in the learning dictionary.

一方、ステップF3で、候補リストの要素が存在しない
場合には、ステップF7へ進む。ステップF7では、学
習辞書の規則タイプchct、 charの項目を対象
文字列に適用する。例えば、対象文字列が“tirne
”であった場合、第9図の2番目の規則が適用可能であ
り、“rn”が“m”に置き換えられ、“tiIIle
”が生成される。その他、適用可能な規則かあった場合
には、それが適用され、“tia+e”以外の候補も生
成される。これらの候補は候補リストに設定される。
On the other hand, if it is determined in step F3 that there is no element in the candidate list, the process advances to step F7. In step F7, the items of rule types chct and char in the learning dictionary are applied to the target character string. For example, if the target string is “tirne”
”, the second rule in Figure 9 is applicable, replacing “rn” with “m” and “tiIIle
” is generated. If there are any other applicable rules, they are applied, and candidates other than “tia+e” are also generated. These candidates are set in the candidate list.

ステップF8では、検証処理を行うモードか否かを判定
する。これはオペレータにより決定されるものであり、
オペレータはコマンドにより検証処理を行う/行わない
の設定ができる。検証処理を行う場合には、ステップF
9に進む。ステップF9では、候補リストの中の要素に
対して検証を行い、不適格な要素を候補リストから削除
する。
In step F8, it is determined whether the mode is for performing verification processing. This is determined by the operator and
The operator can set whether or not to perform the verification process using a command. When performing verification processing, step F
Proceed to step 9. In step F9, the elements in the candidate list are verified and unqualified elements are deleted from the candidate list.

検証処理は、任意の検証でよいが、ここでは候補リスト
中の要素に対する辞書チエツクを例として挙げる。すな
わち、記憶部に記憶された辞書を参照に行き、候補リス
ト中の要素が辞書にあればよしとする。これは通常のス
ベリグチニックに用いられている手法で実現可能である
The verification process may be any verification, but here, a dictionary check for elements in the candidate list will be taken as an example. That is, the dictionary stored in the storage unit is referred to, and it is assumed that the dictionary contains the elements in the candidate list. This can be achieved by the method used for ordinary subrigcinics.

ステップF10では、候補リスト中の要素が存在するか
いなかを判定する。候補が存在する場合は、ステップF
4へ進み、そうでない場合は、変換候補が存在しなかっ
た旨をオペレータにしらせるためステップF11でベル
音を発し、処理を終了する。
In step F10, it is determined whether the element in the candidate list exists. If there are candidates, step F
If not, a bell sound is emitted in step F11 to let the operator know that no conversion candidate exists, and the process ends.

以上の処理により、例えば、学習辞書の内容が第9図の
ようであった場合に、オペレータがttrne ’にカ
ーソルを移動し、変換キー114を入力すると“tir
ne″を“time”に変換することが可能となる。
Through the above processing, for example, when the contents of the learning dictionary are as shown in FIG. 9, when the operator moves the cursor to ttrne' and inputs the conversion key
It becomes possible to convert "ne" into "time".

次に、第3図のステップAllの検索処理について説明
する。
Next, the search process in step All in FIG. 3 will be explained.

ここでの検索処理は、置き換え対象を文章中で順次検索
し、検索された置き換え対象に上記の学習辞書を利用し
て置き換え候補を指示/選択するという処理を行う。置
き換え対象の検索には、任意の手段・条件を用いて構わ
ないが、本実施例では、検索対象として未知語(既存の
単語辞書に登録されていない単語)および学習辞書の項
目のマツチング文字列(ただし、規則タイプがword
である項目)を用いている。
In this search process, replacement targets are sequentially searched for in the text, and replacement candidates are designated/selected for the searched replacement targets using the above-mentioned learning dictionary. Any method or condition may be used to search for replacement targets, but in this example, matching character strings of unknown words (words not registered in existing word dictionaries) and learning dictionary items are used as search targets. (However, if the rule type is word
items) are used.

第12図は、ステップAllの検索処理のフローチャー
トを示すものである。この場合、ステップG1では、検
索キー100が入力された時点のカーソルの示す文章中
の位置を位置ポインタに設定する。次いで、ステップG
2で、文章の終りか否かを判定する。
FIG. 12 shows a flowchart of the search process in step All. In this case, in step G1, the position in the text indicated by the cursor at the time when the search key 100 is input is set as a position pointer. Then step G
In step 2, it is determined whether or not the sentence has ended.

ここで、文章の終りに到達している場合には、ステップ
G3で「検索終了」の旨をオペレータに提示し、処理を
終了する。そうでない場合は、ステップG4で、位置ポ
インタの示す位置の単語が未知語であるか否かを、記憶
部に記憶された辞書を利用して判定し、未知語でない場
合は、位置ポインタの示す位置からの文章文字列と学習
辞書の項目のマツチング文字列(ただし、規則タイプが
wordである項目)とのマツチングを行う。
Here, if the end of the sentence has been reached, the operator is presented with "end of search" in step G3, and the process is ended. If not, in step G4, it is determined whether or not the word at the position indicated by the position pointer is an unknown word using the dictionary stored in the storage unit. Matching is performed between the sentence character string from the position and the matching character string of the item in the learning dictionary (items whose rule type is word).

未知語でもなく、かつ、マツチングにも失敗した場合は
、ステップG5に進み、位置ポインタを次の単語の位置
に進め、ステップG2へみ戻る。
If the word is not an unknown word and the matching fails, the process advances to step G5, advances the position pointer to the next word position, and returns to step G2.

未知語あるいは学習辞書の項目のマツチング文字列との
マツチングに成功した場合は、ステップG6において、
すでに説明した学習終了処理、変換処理、学習開始処理
を行う。この処理により、ステップG6に入った時点で
、その時点以前に行われたオペレータの操作(複数のコ
マンドの結果でもよい)の結果より抽出される学習情報
が記憶され、また、その時点での文章の状態が学習開始
処理により保存される。また、変換処理により、変換候
補の提示/選択などが行われる。
If the matching character string of the unknown word or the learning dictionary item is successfully matched, in step G6,
The learning end process, conversion process, and learning start process that have already been explained are performed. Through this process, when entering step G6, the learning information extracted from the results of operator operations (which may be the result of multiple commands) performed before that point is stored, and the text at that point is stored. The state of is saved by the learning start process. Furthermore, the conversion process performs presentation/selection of conversion candidates, etc.

この後、ステップG7へ進む。ステップG7では、ステ
ップG6で適用された変換規則(学習辞書の項目)の適
用条件がautoかいなかをチエツクする。これがau
toであった場合は、51205E進む。そうでない場
合は、81208へ進む。
After this, the process advances to step G7. In step G7, it is checked whether the application condition of the conversion rule (item of the learning dictionary) applied in step G6 is auto. This is au
If it is to, proceed to 51205E. If not, proceed to 81208.

51208で、オペレータがモード変更キー115を入
力したか否かを判定し、そうである場合には、ステップ
G9へ進む。ステップG9では、ステップG6で適用さ
れ、オペレータによりその変換結果が選択された学習辞
書項目の適用条件をautoに設定する。これにより、
以降の処理においては、その規則の適用はオペレータに
問い合わせることなく自動的に行われる。以上で処理を
終了する。
At 51208, it is determined whether the operator has inputted the mode change key 115, and if so, the process advances to step G9. In step G9, the application condition of the learning dictionary item applied in step G6 and whose conversion result was selected by the operator is set to auto. This results in
In subsequent processing, the rules are automatically applied without asking the operator. This completes the process.

次に、本発明を英語文章に適用した場合の具体例を図面
を使って説明する。
Next, a specific example in which the present invention is applied to English sentences will be described with reference to the drawings.

第13図(a)は、初期の画面である。カーソルは、“
Th1s”の位置にある。学習辞書には、何も登録され
ていない。この状態でオペレータが検索キー100を入
力すると、未知語が検索される。
FIG. 13(a) is an initial screen. The cursor is “
Th1s". Nothing is registered in the learning dictionary. When the operator inputs the search key 100 in this state, an unknown word is searched.

最初の未知語は、“5ystern”であるので同図(
b)のようにカーソルは“5ystern″の位置に移
動する。
The first unknown word is “5ystern”, so the same figure (
The cursor moves to the "5ystern" position as shown in b).

ここで、第12図で述べたステップG6で、学習終了処
理が行われるが、元来字列領域には何も設定されていな
いため、学習辞書には何も登録されない。また、学習開
始処理により、その時点のカーソルの前後の文字列が元
来字列領域に保存される。この場合、“Th1s is
 a 5ystern foroffice vork
、The 5ystern provides var
ious’が記憶される。また、“5ystern”の
位置も記憶される。変換処理では、学習辞書が空である
ので変換候補は、生成されない。オペレータが通常の編
集コマンドを用いて、”5ystern ’を“sys
tem”に変換する。
Here, in step G6 described in FIG. 12, learning completion processing is performed, but since nothing is originally set in the character string area, nothing is registered in the learning dictionary. Furthermore, by the learning start process, the character strings before and after the cursor at that time are originally stored in the character string area. In this case, “Th1s is
a 5ystern foroffice vork
, The 5ystern provides var.
ius' is stored. The position of "5ystern" is also stored. In the conversion process, since the learning dictionary is empty, no conversion candidates are generated. The operator uses normal editing commands to change "5ystern' to "sys
Convert to "tem".

その後、再度検索キー100を入力すると、次の未知語
“5ystern”が検索され、カーソルは、第13図
(c)のように第2番目の“5ystern“に移動す
る。この時、第12図で述べたステップG6で、学習終
了処理が行われる。元来字列領域には〜”Th1s i
s a 5ystern for of’fice w
ork。
Thereafter, when the search key 100 is input again, the next unknown word "5ystern" is searched, and the cursor moves to the second "5ystern" as shown in FIG. 13(c). At this time, learning completion processing is performed in step G6 described in FIG. 12. Originally in the character string area ~”Th1s i
s a 5ystern for of'fice w
ork.

The 5ystern provides varj
ous’がある・ここで、記憶されていた元のカーソル
位置から現文字列を抽出すると、”Th1s is a
 system foroffice vork、Th
e 5ystern provides variou
s ’が得られる。充交字列と現文字列から、第5図、
第8図、第11図の処理により、学習辞書には、第9図
の第1番目、第2番目の項目が登録される。
The 5ystern provides varj
ous'. Here, if you extract the current string from the original memorized cursor position, "Th1s is a
system foroffice vork, Th
e 5ystern provides various
s' is obtained. From the filled intersection string and the current string, Figure 5,
Through the processes shown in FIGS. 8 and 11, the first and second items shown in FIG. 9 are registered in the learning dictionary.

第12図のステップG6の変換処理では、学習辞書の第
1番目の変換規則が適用可能であり、オペレータに“s
ystem“を変換候補として提示する(第11図のス
テップF5)。オペレータがこれを選択すると画面は第
13図(d)のようになる。
In the conversion process of step G6 in FIG. 12, the first conversion rule of the learning dictionary can be applied, and the operator can
system" is presented as a conversion candidate (step F5 in FIG. 11). When the operator selects this, the screen becomes as shown in FIG. 13(d).

この時点で、オペレータが、モード変更キー115を入
力すると、第12図のステップG8で判定され、ステッ
プG9の処理が行われる。
At this point, when the operator inputs the mode change key 115, a determination is made in step G8 in FIG. 12, and the process in step G9 is performed.

この結果、学習辞書の第1番目の項目の適用条件がau
toに設定される。この状態でオペレータが検索キーを
入力すると、未知語が検索される。次の未知語は、“d
ocurnents”であるので、第13図(e)のよ
うにカーソルは“docurn’ents”の位置に移
動する。第12図のステップF6の変換処理では、こん
どは学習辞書の第2番目の項目により、部分文字列の変
換規則の適用により、“ctocuments”が候補
としてオペレータに提示される。オペレータがこれを選
択し、再度検索キーを入力すると、次の未知語を検索し
“5ystern”を検出する。この時点で、学習辞書
には、“docurnents”を”docun+en
ts ’に変換する項目が登録され、また、変換処理に
より、“5ystern″が“system”に変換さ
れる。この際、適用する変換規則の適用条件autoで
あるので、オペレータに問い合わせることなく次の未知
語の検索に入り、第13図(f)に示すような状態とな
る。
As a result, the application condition for the first item in the learning dictionary is au
is set to. When the operator inputs a search key in this state, an unknown word is searched. The next unknown word is “d
Therefore, the cursor moves to the position of "docurn'ents" as shown in FIG. 13(e). In the conversion process in step F6 of FIG. , by applying the substring conversion rules, "ctocuments" is presented to the operator as a candidate. When the operator selects this and enters the search key again, the next unknown word is searched and "5ystern" is detected. At this point, the learning dictionary should include “documents” as “docun+en”.
An item to be converted to ts' is registered, and "5ystern" is converted to "system" by the conversion process. At this time, since the application condition of the conversion rule to be applied is AUTO, the search for the next unknown word is started without inquiring the operator, resulting in a state as shown in FIG. 13(f).

次に、本発明を日本語文章に適用した場合の具体例を図
面を使って説明する。
Next, a specific example in which the present invention is applied to Japanese text will be described with reference to the drawings.

この場合、第14図(a)は、初期の画面である。カー
ソルは、”自然”の位置にある。この文書は、「自然言
語処理は、形態素解析、構文解析、意味解析、文脈解析
を含む。このうち、文脈解析は、知識を使った推論と最
も密接な関係にある。」という文書を日本語OCRで入
力されたものである。日本語OCRは、読み取った文字
の妥当性を表す情報を計算しており、その中で妥当性の
低い文字または文字列に対して「不確実」 (サスビシ
ヤス)という情報をつけている。ここでは、検索の対象
を、この「不確実」な文字または文字列とする。もちろ
ん、英語の文章で扱ったように、日本語に対しても未知
語を検索対象とする(あるいは、「不確実」な文字また
は文字列と未知語の両者を検索対象とする)ことも可能
である。この例では、「形態素解析」の「折」、第1文
目の「文脈解析」の「折」、第2文目の「文脈解析」の
「折」がそれぞれ「不確実」な文字であるという情報が
付与されている。初期の状態、第14図(a)では、学
習辞書には、何も登録されていない。
In this case, FIG. 14(a) is the initial screen. The cursor is in its "natural" position. This document states, "Natural language processing includes morphological analysis, syntactic analysis, semantic analysis, and context analysis. Of these, context analysis is most closely related to reasoning using knowledge." It was input using OCR. Japanese OCR calculates information indicating the validity of the characters it reads, and attaches the information ``uncertain'' to characters or character strings with low validity. Here, the search target is this "uncertain" character or character string. Of course, it is also possible to search for unknown words in Japanese (or search for both "uncertain" characters or character strings and unknown words), just as we did for English sentences. It is. In this example, "ori" in "morphological analysis", "ori" in "context analysis" in the first sentence, and "ori" in "context analysis" in the second sentence are each "uncertain" characters. The information is given. In the initial state, shown in FIG. 14(a), nothing is registered in the learning dictionary.

この状態で、オペレータが検索キー100を人力すると
、不確実文字が検索される。最初の不確実文字は、「形
態素解析」の「折」であるので、第14図(b)のよう
にカーソルは「折」の位置に移動する。この場合、第1
2図のステップG6で、学習終了処理が行われるが、死
文字列領域には何も設定されていないため、学習辞書に
は何も登録されない。また、学習開始処理により、その
時点のカーソルの前後の文字列が死文字列領域に保存さ
れる。この場合、「自然言語処理は、形態素解析、構文
解析、意味解析、文脈解析を含む。」が記憶される。ま
た、「折」の位置も記憶される。
In this state, when the operator manually presses the search key 100, an uncertain character is searched. Since the first uncertain character is "ori" in "morphological analysis", the cursor moves to the position of "ori" as shown in FIG. 14(b). In this case, the first
In step G6 of FIG. 2, learning completion processing is performed, but since nothing is set in the dead character string area, nothing is registered in the learning dictionary. Also, by the learning start process, the character strings before and after the cursor at that point are saved in the dead character string area. In this case, "natural language processing includes morphological analysis, syntactic analysis, semantic analysis, and context analysis" is stored. The position of the "fold" is also stored.

第12図のステップG6の変換処理では、学習辞書が空
であるので変換候補は、生成されない。
In the conversion process of step G6 in FIG. 12, no conversion candidates are generated because the learning dictionary is empty.

オペレータが通常の編集コマンドを用いて、「折」を「
析」に変換し、第14図(C)の状態となる。その後、
再度検索キー100を入力すると、次の不確実文字、す
なわち第1文目の「文脈解析」の「折」が検索され、カ
ーソルは、第14図(d)に示すように第2番目の「折
」に移動する。この時、第12図のステップG6で、学
習終了処理が行われる。
The operator uses normal editing commands to change the "fold" to "
The state shown in FIG. 14(C) is obtained. after that,
When the search key 100 is input again, the next uncertain character, that is, "fold" of "context analysis" in the first sentence, is searched, and the cursor moves to the second "fold" as shown in FIG. 14(d). Move to ``Fold''. At this time, learning end processing is performed in step G6 of FIG. 12.

死文字列領域には、「自然言語処理は、形態素解析、構
文解析、意味解析、文脈解析を含む。」がある。記憶さ
れていた元のカーソル位置から現文字列を抽出すると、
「自然言語処理は、形態素解析、構文解析、意味解析、
文脈解析を含む。」が得られる。
The dead string area includes "Natural language processing includes morphological analysis, syntactic analysis, semantic analysis, and context analysis." Extracting the current string from the original memorized cursor position,
“Natural language processing consists of morphological analysis, syntactic analysis, semantic analysis,
Includes contextual analysis. ” is obtained.

そして、死文字列と現文字列から、上述した第5図、第
8図、第11図の処理により、学習辞書には、第15図
の項目が登録される。この場合、第15図に示す第一番
目の項目は、第6図に示された単語リストの項目に関す
る変換規則である。
Then, from the dead character string and the current character string, the items shown in FIG. 15 are registered in the learning dictionary through the processes shown in FIGS. 5, 8, and 11 described above. In this case, the first item shown in FIG. 15 is a conversion rule for the word list item shown in FIG.

第2番目の項目は、「折」を「折」に変換する部分変換
規則である。また、第3番目の項目は、前文脈部分変換
規則である。第12図のステップG6での変換処理では
、学習辞書の第2番目および第3番目の変換規則が適用
可能である。これらの規則は同じ結果を生成するので、
オペレータに「析」を変換候補として提示する。オペレ
ータかこれを選択すると、画面は第14図(e)のよう
になる。この時点で、オペレータが、モード変更キー1
15を入力すると、第12図のステップG8で判定され
、ステップG9の処理が行われる。
The second item is a partial conversion rule for converting "ori" into "ori". Further, the third item is a pre-context partial conversion rule. In the conversion process in step G6 of FIG. 12, the second and third conversion rules of the learning dictionary can be applied. These rules produce the same result, so
Present "analysis" to the operator as a conversion candidate. When the operator selects this, the screen appears as shown in FIG. 14(e). At this point, the operator presses the mode change key 1.
If 15 is input, a determination is made in step G8 of FIG. 12, and the process of step G9 is performed.

この結果、適用条件のきつい規則、すなわち、前文脈変
換規則(第15図の学習辞書の第3番目の項目)の適用
条件がautoに設定される。この状態でオペレータが
検索キー100を入力すると、次の不確実文字が検索さ
れる。次の不確実文字は、第2文目の「文脈解析」の「
折」であるので、第14図f)のようにカーソルは、第
2文目の「文脈解析」の「折」の位置に移動する。第1
2図のステップG6の変換処理では、前と同様、部分文
字列の変換規則の適用により、「折」が「析」に変換さ
れる。この際、適用する変換規則の適用条件は、以前の
処理によりautoであるので、オペレータに問い合わ
せることなく「折」を「析」に変換し、次の不確実語の
検索に入ることになる。
As a result, the application condition of the rule with the strictest application condition, that is, the previous context conversion rule (the third item in the learning dictionary in FIG. 15) is set to auto. When the operator inputs the search key 100 in this state, the next uncertain character is searched. The next uncertain character is "context analysis" in the second sentence.
Therefore, the cursor moves to the position of "fold" in the second sentence "context analysis" as shown in Figure 14 f). 1st
In the conversion process at step G6 in FIG. 2, "Ori" is converted to "Ai" by applying the partial character string conversion rule as before. At this time, since the application condition of the conversion rule to be applied is auto due to the previous processing, "ori" is converted to "analysis" without asking the operator, and the search for the next uncertain word is started.

なお、本発明は、上記実施例にのみ限定されず、要旨を
変更しない範囲で適宜変形して実施できる。
Note that the present invention is not limited to the above-mentioned embodiments, but can be implemented with appropriate modifications within the scope without changing the gist.

例えば、上述した実施例では、英藷および日本語の文章
に本発明の適用した例を述べたが、これら以外の言語の
文章にも適用することかできる。
For example, in the above-described embodiment, the present invention is applied to texts in English and Japanese, but it can also be applied to texts in languages other than these.

[発明の効果] 本発明の文書編集装置によれば、第一の編集時点の文章
情報を記憶しておき、その後、オペレータが処理を行っ
た結果得られた第二の編集時点の文章情報を第一の編集
情報と比較し、第一の編集時点の文章情報から第二の編
集時点への文章情報へ変換するための情報を抽出して、
この情報を、これ以降の編集作業において利用するよう
にできるので、オペレータが同種の処理を繰り返し行う
ことを避けることができ、編集作業の効、重化を図るこ
とができるようになる。つまり、オペレータが行った処
理(複数のコマンドを実行した結果でも良い)を、後の
処理に利用することができることから効率的な編集作業
が可能となる。特に、OCR入力した文章の修正処理な
どにおいて、同種の繰り返し編集処理を行う場合に効果
的である。
[Effects of the Invention] According to the document editing device of the present invention, the text information at the first editing time is stored, and then the text information at the second editing time obtained as a result of processing by the operator is stored. Compare with the first editing information, extract information for converting text information at the first editing time to text information at the second editing time,
Since this information can be used in subsequent editing operations, it is possible to avoid the operator from repeatedly performing the same type of processing, and it becomes possible to increase the effectiveness and complexity of the editing operations. In other words, the processing performed by the operator (even the result of executing a plurality of commands) can be used for subsequent processing, which enables efficient editing work. This is particularly effective when the same type of repetitive editing processing is performed, such as in correction processing of OCR-input texts.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明の一実施例の構成を示すブロック図、
第2図は、同実施例に用いられる入力部のキー配列の一
例を示す図、第3図は、同実施例の制御部の動作の概要
を説明するためのフローチャート、第4図は、同実施例
の文章情報保存処理の流れを示すフローチャート、第5
図は、同実施例の学習処理の流れを示すフローチャート
、第6図は、同実施例の文字列・単語列リストの例を示
す図、第7図は、同実施例の元単語リスト・現単語リス
トの例を示す図、第8図は、同実施例の死文字列と現文
字列を抽出する処理の例を示すフローチャート、第9図
は、同実施例の学習辞書の例を示した図、第10図は、
同実施例の学習辞書への登録処理の例を示すフローチャ
ート、第11図は同実施例の、変換処理の流れの例を示
すフローチャート、第12図は、同実施例の検索処理の
流れの1例を示すフローチャート、第13図および第1
4図は、それぞれ同実施例の動作を説明するための画面
例を示す図、第15図は、第14図の説明に用いられる
学習辞書の例を示す図である。 1・・・入力部、2・・・制御部、3・・・記憶部、4
・・・検証部、5・・・表示制御部、6・・・表示部。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第4図 第5図 第7図 第8図 第9図 第10図 ffl 第13図
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention;
FIG. 2 is a diagram showing an example of the key arrangement of the input unit used in the same embodiment, FIG. 3 is a flowchart for explaining an overview of the operation of the control unit in the same embodiment, and FIG. Flowchart showing the flow of text information storage processing in the embodiment, No. 5
Fig. 6 is a flowchart showing the flow of learning processing in the same embodiment, Fig. 6 is a diagram showing an example of a character string/word string list in the same embodiment, and Fig. 7 shows an original word list/current word list in the same embodiment. A diagram showing an example of a word list, FIG. 8 is a flowchart showing an example of processing for extracting dead character strings and current character strings in the same embodiment, and FIG. 9 shows an example of a learning dictionary in the same embodiment. Figure 10 is
FIG. 11 is a flowchart showing an example of the flow of the conversion process in the same embodiment. FIG. 12 is a flowchart showing an example of the flow of the search process in the same embodiment. Flowcharts showing examples, Figures 13 and 1
FIG. 4 is a diagram showing an example of a screen for explaining the operation of the same embodiment, and FIG. 15 is a diagram showing an example of a learning dictionary used for explaining FIG. 14. 1... Input section, 2... Control section, 3... Storage section, 4
... Verification section, 5... Display control section, 6... Display section. Applicant's Representative Patent Attorney Takehiko Suzue Figure 1 Figure 2 Figure 4 Figure 5 Figure 7 Figure 8 Figure 9 Figure 10 ffl Figure 13

Claims (3)

【特許請求の範囲】[Claims] (1)文章情報に対し編集コマンドに対応した編集を実
行する文書編集装置において、 上記文章情報に対する第一の編集時点での文章情報を記
憶する記憶手段と、 上記文章情報に対する第一の編集時点の文章情報と第二
の編集時点の文章情報を比較するとともに第一の編集時
点での文章情報を第二の編集時点の文章情報に変換する
情報を抽出する抽出手段と、この抽出手段で抽出された
変換情報を記憶する記憶手段とを具備したことを特徴と
する文書編集装置。
(1) In a document editing device that executes editing corresponding to an editing command on text information, a storage means for storing text information at a first editing time point for the text information; and a storage means for storing text information at a first editing time point for the text information; an extraction means for extracting information that compares the text information at the second editing time with the text information at the second editing time and converts the text information at the first editing time into text information at the second editing time; 1. A document editing device comprising: storage means for storing converted information.
(2)文章情報に対し編集コマンドに対応した編集を実
行する文書編集装置において、 上記文章情報に対する第一の編集時点での文章情報を記
憶する記憶手段と、 上記文章情報に対する第一の編集時点の文章情報と第二
の編集時点の文章情報を比較するとともに第一の編集時
点での文章情報を第二の編集時点の文章情報に変換する
情報を抽出する抽出手段と、この抽出手段で抽出された
変換情報を記憶する記憶手段と、 上記文章情報を検索可能にする検索手段とを具備し、 該検索手段により検索された時点を第一の編集時点およ
び第二の編集時点の少なくとも一方の編集時点に設定す
ることを特徴とする文書編集装置。
(2) In a document editing device that executes editing corresponding to an editing command on text information, a storage means for storing text information at a first editing time point for the text information; and a storage means for storing text information at a first editing time point for the text information; an extraction means for extracting information that compares the text information at the second editing time with the text information at the second editing time and converts the text information at the first editing time into text information at the second editing time; a storage means for storing converted information, and a search means for making the text information searchable; A document editing device characterized in that settings are made at the time of editing.
(3)文章情報に対し編集コマンドに対応した編集を実
行する文書編集装置において、 上記文章情報に対する第一の編集時点での文章情報を記
憶する記憶手段と、 上記文章情報に対する第一の編集時点の文章情報と第二
の編集時点の文章情報を比較するとともに第一の編集時
点での文章情報を第二の編集時点の文章情報に変換する
情報を抽出する抽出手段と、この抽出手段で抽出された
変換情報を記憶する記憶手段と、 上記第一の編集時点の文章情報から第二の編集時点の文
章情報への変換が適用される文章情報を検索する検索手
段とを具備し、 この検索手段で検索された文章情報の変換結果を検証可
能としたことを特徴とする文書編集装置。
(3) In a document editing device that executes editing corresponding to an editing command on text information, a storage means for storing text information at a first editing time point for the text information; and a storage means for storing text information at a first editing time point for the text information; an extraction means for extracting information that compares the text information at the second editing time with the text information at the second editing time and converts the text information at the first editing time into text information at the second editing time; a storage means for storing converted information; and a search means for searching for text information to which the conversion from the text information at the first editing time to the text information at the second editing time is applied; A document editing device characterized in that it is possible to verify the conversion result of text information retrieved by means.
JP2293911A 1990-10-31 1990-10-31 Document editing device Pending JPH04167051A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2293911A JPH04167051A (en) 1990-10-31 1990-10-31 Document editing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2293911A JPH04167051A (en) 1990-10-31 1990-10-31 Document editing device

Publications (1)

Publication Number Publication Date
JPH04167051A true JPH04167051A (en) 1992-06-15

Family

ID=17800750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2293911A Pending JPH04167051A (en) 1990-10-31 1990-10-31 Document editing device

Country Status (1)

Country Link
JP (1) JPH04167051A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514304A (en) 1999-11-05 2003-04-15 マイクロソフト コーポレイション A linguistic input architecture that converts from one text format to another and is resistant to spelling, typing, and conversion errors

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514304A (en) 1999-11-05 2003-04-15 マイクロソフト コーポレイション A linguistic input architecture that converts from one text format to another and is resistant to spelling, typing, and conversion errors

Similar Documents

Publication Publication Date Title
JP2726568B2 (en) Character recognition method and device
US5899989A (en) On-demand interface device
JP2633824B2 (en) Kana-Kanji conversion device
JPH04167051A (en) Document editing device
JP3666066B2 (en) Multilingual document registration and retrieval device
JPS59229683A (en) Recognition processor
JPH08190561A (en) Document correction device
JP2874815B2 (en) Japanese character reader
JPH04673A (en) Collocation registration method and device
JPH05282361A (en) Data base production back-up device and mechanical translating device
JP2893239B2 (en) Translation support dictionary search and display system
JPH08185401A (en) Document search device
JPH0492973A (en) Image information registration/retrieval device
JP3340124B2 (en) Kana-Kanji conversion device
JPS62282364A (en) Character string retrieval system
JPH0785026A (en) Dictionary rehabilitation method and device
JPS5827268A (en) Japanese word processing device
JPS60207983A (en) Production system of dictionary for recognizing character
JPH1063665A (en) Text translation method and apparatus
JPS6349930A (en) Keyword extraction device
JPH08339365A (en) Document creating apparatus and document creating method
JPH08305699A (en) Document creating apparatus and document creating method
JPH09212510A (en) Machine translation system
JPH0458381A (en) Optical character reader
JPS62202258A (en) document processing device