JPH09223146A - Translating method - Google Patents
Translating methodInfo
- Publication number
- JPH09223146A JPH09223146A JP8029092A JP2909296A JPH09223146A JP H09223146 A JPH09223146 A JP H09223146A JP 8029092 A JP8029092 A JP 8029092A JP 2909296 A JP2909296 A JP 2909296A JP H09223146 A JPH09223146 A JP H09223146A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- learning
- word
- selection
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 54
- 238000013519 translation Methods 0.000 claims abstract description 298
- 230000008094 contradictory effect Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000014616 translation Effects 0.000 description 277
- 238000012545 processing Methods 0.000 description 42
- 230000008569 process Effects 0.000 description 41
- 230000006870 function Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 230000010485 coping Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
Description
【発明の属する技術分野】この発明は、第1言語の文を
第2言語の文に翻訳する機械翻訳方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation method for translating a sentence in a first language into a sentence in a second language.
【従来の技術】機械翻訳とは、コンピュータを利用して
ある言語による文章を自動的に別の言語の文章に変換す
る技術である。そして、コンピュータ技術を含め電子技
術や半導体技術の目覚ましい発展に伴い、手軽に誰でも
がコンピュータを利用することが可能になり、また、自
然言語処理技術の向上、計算機能力の向上など機械翻訳
技術の分野を取り巻く環境の一層の進展に伴って、高い
品質の訳文を提供することが可能になり、近年、機械翻
訳システムに対する注目が高まっている。ところで、機
械翻訳に求められることは、速く、しかも、原文の内容
を正しく反映して言語としておかしくない訳文を生成す
ることである。しかしながら、原文書には様々な種類が
あり、様々な表現があって全てのユーザの全ての原文の
訳文を満足のゆくように訳出させるほどに充実した大量
の知識を翻訳辞書として提供するには至っていない。現
状では、これに対処するための手段として、各種専門用
語辞書、ユーザ辞書を利用可能にしたり、訳語学習機能
を提供する程度にとどまっている。専門用語辞書は、原
文書にしたためられた内容を訳出するにあたり、その現
文書が対象としている分野に依存した訳語を訳文に反映
するためのものであり、その分野独特の表現を踏襲する
ために用いる辞書である。また、ユーザ辞書は、ユーザ
固有の表現・語句を見出し語として定義し、その訳語を
指定するためのものである。また、訳語学習機能は、そ
の他の一般的な語に対して、文書に応じてユーザの所望
する訳語を学習させ、以降の翻訳においてその学習内容
を反映させることで、再度ユーザが訳語の選択をする必
要を省くように機能するものであり、ユーザの好みを訳
文に自然に反映させることができるようにするために、
重要な機能である。訳語学習機能においては、同じ見出
し語に対して、異なる箇所で、異なる訳語を選択した場
合、基本的に最後の選択結果が学習される。しかし、実
際には、このように異なる箇所で、異なる訳語を選択す
るといった相反する選択が行われた場合、最新の選択に
よる訳語が学習結果に反映されて、その後の翻訳に影響
を与えるようにすることが好ましいとは限らない。つま
り、個々の文における単語の使われ方によって、訳語を
そこだけ変えたいというようなケースは多々あり、この
ような場合に、最新の選択を次の翻訳に反映させてしま
うと、その部分でユーザは再選択をしなければならない
ことになり、使いにくいものとなる。また、以降の翻訳
には反映させる必要のない(学習の必要がない)、その
一文にのみ妥当な選択であることもある。そのため、機
械翻訳システムにおいては、学習の要・不要について
は、これまではユーザが意識的に指定するか、あるい
は、学習不要な語については訳語学習機能の使用を避け
るいったことを行う必要があった。2. Description of the Related Art Machine translation is a technique for automatically converting a sentence in one language into a sentence in another language using a computer. With the remarkable development of electronic technology and semiconductor technology including computer technology, anyone can easily use the computer, and also the machine translation technology such as the improvement of natural language processing technology and the improvement of calculation function can be achieved. With the further development of the environment surrounding the field, it has become possible to provide translated texts of high quality, and in recent years, machine translation systems have attracted attention. By the way, what is required for machine translation is to generate a translated sentence which is not strange as a language by reflecting the contents of the original sentence correctly and quickly. However, there are various types of original documents, and there are various expressions to provide a translation dictionary with a large amount of knowledge that is sufficient to translate all original sentences of all users in a satisfactory manner. I haven't arrived. At present, as a means for coping with this, various technical term dictionaries and user dictionaries are made available, and a translation learning function is provided only. The technical term dictionary is used for translating the contents of the original document, and for reflecting the translated words that depend on the subject field of the current document in the translated text. This is the dictionary to use. The user dictionary is for defining expressions and phrases unique to the user as headwords and designating translations thereof. In addition, the translated word learning function allows the user to select the translated word again by learning the translated word desired by the user for other general words according to the document and reflecting the learning content in the subsequent translations. Function so that the user's preferences can be naturally reflected in the translated text.
This is an important function. In the translated word learning function, when different translated words are selected in different places for the same headword, basically the last selection result is learned. However, in reality, when contradictory selections such as selecting different translations are made in different places like this, the translation of the latest selection is reflected in the learning result, and it affects the subsequent translation. It is not always preferable to do this. In other words, there are many cases where you want to change the translated word only depending on how the word is used in each sentence.In such a case, if you reflect the latest selection in the next translation, that part will be changed. The user will have to make a reselection, which is difficult to use. In addition, it may not be reflected in the subsequent translation (no need for learning), and it may be a valid selection only for the one sentence. Therefore, in the machine translation system, it is necessary for the user to consciously specify whether learning is necessary or unnecessary, or to avoid using the translation learning function for words that do not require learning. there were.
【発明が解決しようとする課題】上記のように、機械翻
訳システムにおいては、ユーザの満足のゆく訳文を、全
てのユーザに提供できる程、充実した大量の知識を翻訳
辞書として提供するには至っていないことから、現状で
は、これに対処するための手段として、各種専門用語辞
書、ユーザ辞書を利用可能にしたり、訳語学習機能を持
たせたりしている。そして、専門用語辞書、ユーザ辞書
を利用可能にすることで、分野対応の、あるいはユーザ
の好みに適合する訳出を可能にしている。また、ユーザ
の訳語利用傾向を反映させてユーザ気に入らない訳をで
きるだけ避けるようにするために、あるのが訳語学習機
能であるが、しかし、従来の訳語学習機能では、−般的
に、時間的により新しい選択結果を学習し、後の翻訳に
反映するような構成になっている。そのため、ユーザが
意識しないで訳語選択を行うことにより、ある一文だけ
に有効で後の文に反映させる必要のない学習が行われて
しまったり、学習が必要か否かを判断して、コマンドを
使い分ける必要がある、など使い勝手の悪い一面を残し
ているという問題があった。また、語と語の共起の仕方
によって、同じ見出し悟に対して、異なる訳語を学習し
わけたくてもできず、後の学習が先の学習を打ち消して
しまうという問題もあった。そこで、この発明の目的と
するところはは、上記問題点に対処するため、相反する
学習内容も生かし、後の翻訳において最も期待値の高い
訳語を反映でき、結果としてユーザの訳語選択・後編集
の手間を軽減することができるようにした機械翻訳方法
を提供することにある。As described above, in the machine translation system, it is difficult to provide a large amount of knowledge as a translation dictionary so that the translated texts satisfying the users can be provided to all the users. Therefore, at present, various technical term dictionaries and user dictionaries are made available or a translation word learning function is provided as a means for coping with this. Then, by making the technical term dictionary and the user dictionary available, it is possible to perform translation corresponding to the field or according to the user's preference. Also, in order to reflect the user's translation usage tendency and to avoid translations that the user does not like as much as possible, there is a translation learning function, but with the conventional translation learning function, in general, it is time-based. Is designed to learn new selection results and reflect them in subsequent translations. Therefore, if the user selects a translation without being aware of it, learning may be performed that is valid only for one sentence and does not need to be reflected in the subsequent sentence, or if learning is necessary, the command is There was a problem that one side that was inconvenient was left, such as having to use properly. There is also a problem that it is not possible to learn different translated words for the same heading Satoru depending on the co-occurrence of words, and the later learning cancels the previous learning. Therefore, an object of the present invention is to cope with the above-mentioned problems, by making use of conflicting learning contents, it is possible to reflect the translated word with the highest expected value in the subsequent translation, and as a result, the user can select / post-edit the translated word. It is to provide a machine translation method capable of reducing the trouble of.
【課題を解決するための手段】上記目的を達成するた
め、本発明はつぎのようにする。すなわち、本発明は、
文字を入力するための入力ステップと、学習情報を保持
する学習辞書を含み、前記入力された第1言語による自
然言語文を第2の言語に変換するための知識情報を保持
する辞書手段の知識情報を用いて第1言語の単語列を前
記第2の言語の単語列に変換する翻訳ステップと、前記
翻訳ステップにおける翻訳結果を出力する出力ステップ
と、訳語の選択をするための訳語選択ステップと、この
訳語選択ステップによる訳語選択の内容に基づいて見出
し語と訳語の関係が相反する複数の選択内容、および1
つの見出し語に対する最後の選択以前の選択内容を学習
可能とすると共に、以後の翻訳において有効とすべく前
記辞書手段の学習辞書内容を制御する学習制御ステップ
とを具備する。そして、入力ステップにより第1言語に
よる自然言語文を入力すると、翻訳ステップにおいては
この入力された第1言語による自然言語文を第2の言語
に変換するための知識情報を保持する辞書手段の知識情
報を用いて第1言語の単語列を前記第2の言語の単語列
に変換する。そして、出力ステップにより前記翻訳ステ
ップにおける翻訳結果が出力される。翻訳結果を見て修
正したい訳語があった場合、訳語選択ステップではその
選択をするための候補を一覧表示し、訳語選択操作指示
すると訳語選択ができる。そして、学習制御ステップで
はこの訳語選択ステップによる訳語選択の内容に基づい
て見出し語と訳語の関係が相反する複数の選択内容、お
よび1つの見出し語に対する最後の選択以前の選択内容
を学習可能とすると共に、以後の翻訳において有効とす
べく前記辞書手段の学習辞書内容を制御する。これらに
より、また、さらに翻訳ステップにおいては、第1言語
の単語列を前記第2の言語の単語列に変換するにあた
り、前記学習辞書の内容を用いて、ある文のある語に対
する最も期待値の高い学習内容を反映させるようにする
と、相反する学習内容も生かし、後の翻訳において最も
期待値の高い訳語を反映できるようになり、結果として
ユーザの訳語選択・後編集の手間を軽減することができ
るようになる。また、システム構成としては、文字を入
力するための入力手段と、入力された第1言語による自
然言語文を第2の言語に変換するための知識情報を保持
する辞書手段と、前記辞書手段の知識情報を用いて第1
言語の単語列を前記第2の言語の単語列に変換する翻訳
手段と、前記翻訳手段が出力する翻訳結果を出力する出
力手段と、訳語の選択をするための訳語選択手段と、こ
の訳語選択手段を介して行なわれた訳語選択の内容に基
づいて見出し語と訳語の関係が相反する複数の選択内
容、および1つの見出し語に対する最後の選択以前の選
択内容を学習可能とすると共に、以後の翻訳において有
効とすべく前記辞書手段の学習辞書内容を制御する学習
制御手段とを具備する。本システムは、入力手段より第
1言語である自然言語の文および単語列が入力されると
制御手段に送られ、制御手段はその入力データを翻訳手
段に送る。翻訳手段は、辞書手段内の知識を用いて翻訳
処理を行ない、制御手段を介して出力手段に訳文を出力
する。翻訳結果に対し、ユーザにより訳語選択手段を介
して訳語選択が行なわれるとその内容は一旦、制御手段
へ送られる。制御手段は選択内容に沿って出力手段に訳
語の置換表示の命令を送り、訳語の置換が行なわれる。
一方、選択内容は学習制御手段へも送られる。学習制御
手段では過去の訳語選択内容を学習辞書に記録する。同
じ見出し語に対して異なる選択が行なわれる度に、選択
内容が記録され、かつ、その時点までに翻訳処理・後編
集処理を終えた文の範囲内に生起する当該見出し語に関
して、訳語の種類毎の頻度も記録される。この頻度を元
に、以後の翻訳処理における学習訳語群中からデフォル
ト訳語を選定し、学習辞書に記録する。翻訳手段におけ
る翻訳処理では訳語を決定する際に、学習辞書を参照す
る。新規に翻訳する文が、学習辞書に記録された訳語選
択条件群のいずれかにマッチするものであれば、その条
件時に選択された訳語をその文の訳語として決定する。
見出し語は一致するが共起語が一致しない場合は、デフ
ォルト訳語を訳語として決定する。このように作用する
ことにより、1つの見出し語に対して相反する訳語が選
択されても、一方が無効になることなく、共起語を条件
にすることにより、すべてを学習知識として、以後の翻
訳に生かすことができる。かつ、過去の生かされた訳語
の頻度を元に、後の翻訳において最も期待値の高い訳語
を推定し、デフォルト訳語として記憶することにより、
ユーザの後編集作業を軽減することができるようにな
る。In order to achieve the above object, the present invention is as follows. That is, the present invention
Knowledge of dictionary means including an input step for inputting characters and a learning dictionary holding learning information, and holding knowledge information for converting the inputted natural language sentence in the first language into a second language A translation step of converting a word string of a first language into a word string of the second language using information, an output step of outputting a translation result in the translation step, and a translation word selection step for selecting a translation word. , A plurality of selection contents in which the relation between the headword and the translation word is contradictory based on the contents of the translation word selection in this translation word selection step, and 1
And a learning control step of controlling the contents of the learning dictionary of the dictionary means so that the contents selected before the last selection for one headword can be learned and the contents are effective in the subsequent translation. Then, when the natural language sentence in the first language is input in the input step, the knowledge of the dictionary means holding the knowledge information for converting the input natural language sentence in the first language into the second language in the translation step. The information is used to convert a word string in the first language into a word string in the second language. Then, in the output step, the translation result in the translation step is output. When there is a translation word to be corrected by looking at the translation result, the translation word selection step displays a list of candidates for the selection, and the translation word selection operation instruction can be performed to select the translation word. Then, in the learning control step, it is possible to learn a plurality of selection contents in which the relationship between the headword and the target word is contradictory, and the selection contents before the last selection for one headword, based on the contents of the target word selection in the target word selection step. At the same time, the learning dictionary contents of the dictionary means are controlled so as to be effective in the subsequent translation. By these, and further, in the translation step, in converting the word string of the first language into the word string of the second language, the contents of the learning dictionary are used to obtain the most expected value for a word in a sentence. By reflecting the high learning content, it is possible to make use of the contradictory learning content and reflect the translated word with the highest expected value in the subsequent translation, and as a result, the user's labor for selecting the translated word and post-editing can be reduced. become able to. The system configuration includes an input unit for inputting characters, a dictionary unit for holding knowledge information for converting an input natural language sentence in the first language into a second language, and the dictionary unit. First using knowledge information
A translation means for converting a word string of a language into a word string of the second language, an output means for outputting a translation result output by the translation means, a translation word selection means for selecting a translation word, and this translation word selection Based on the contents of the translation word selection made through the means, it becomes possible to learn a plurality of selection contents in which the relationship between the headword and the translation word is contradictory, and the selection contents before the last selection for one headword, and Learning control means for controlling the contents of the learning dictionary of the dictionary means to be effective in translation is provided. In this system, when a sentence and a word string in the first language, which is a natural language, are input from the input unit, the system sends the sentence and the word string to the control unit. The translation means performs translation processing using the knowledge in the dictionary means, and outputs the translated text to the output means via the control means. When the user selects a translated word with respect to the translation result via the translated word selecting means, the content is once sent to the control means. The control means sends a translation word replacement display command to the output means according to the selected content, and the translation word is replaced.
On the other hand, the selected content is also sent to the learning control means. The learning control means records past translation word selection contents in the learning dictionary. Each time a different selection is made for the same headword, the selected content is recorded, and the type of translation word for the relevant headword that occurs within the range of the sentence that has been translated / post-edited by that point The frequency of each is also recorded. Based on this frequency, a default translation word is selected from the learning translation word group in the subsequent translation processing and recorded in the learning dictionary. In the translation process in the translation means, the learning dictionary is referenced when determining the translated word. If the newly translated sentence matches any of the translated word selection condition groups recorded in the learning dictionary, the translated word selected under the condition is determined as the translated word of the sentence.
If the headword matches but the co-occurrence words do not match, the default translation is determined as the translation. By operating in this way, even if contradictory translations are selected for one headword, one is not invalidated, and by using the co-occurrence as a condition, all learning knowledge Can be used for translation. And, based on the frequency of the translated word that was used in the past, by estimating the translated word with the highest expected value in the later translation and storing it as the default translated word,
The post-editing work of the user can be reduced.
【発明の実施の形態】以下、図面を参照しながら、本発
明の具体例の説明をする。図1は、本発明の一具体例と
しての機械翻訳システムの構成を示したブロック図であ
る。図において、1は入力部、2は訳語選択部、3は学
習制御部、4は出力部、5は制御部、6は翻訳部、7は
辞書部である。入力部1は翻訳対象となる文の入力や各
種コマンドの入力を行なうためのものであって、制御部
5に対し、翻訳対象となる文の入力や各種コマンドの入
力を行なうためのものである。入力部1としては、通
常、キーボード、マウスなどが用いられる。翻訳対象文
の入力には、キーボードによる場合の他、OCR(光学
式文字読取装置)、フロッピディスク、磁気テープ、磁
気ディスク、光磁気ディスクなどからの読み込みも考え
られる。出力部4は、翻訳部6の出力である翻訳結果を
出力したり、入力部1や訳語選択部2から制御部5への
各種命令に対する制御部5からの応答を表示するための
ものである。出力部4としては表示手段、例えば、CR
T表示装置や液晶表示装置、プラズマディスプレイなど
の如き画像表示用ディスプレイなどが通常使用されるこ
とになるが、翻訳結果の出力には、印刷機(プリンタ)
などの印字手段、あるいは直接、フロッピディスク、磁
気テープ、磁気ディスクなどの記録媒体ヘ出力する場合
や他のメディアヘ送信する送信手段(通信手段)を適用
することもできる。制御部5はシステム全体の制御の中
枢であって、システム全体の動きを制御するためのもの
である。訳語選択部2は、編集モード時に訳語の選択を
するためのものであり、編集モード時において入力部1
からの操作により制御部5を介して与えられるユーザの
指示対応に訳語選択を行うものである。学習制御部3
は、訳語選択部2を介して行なわれた訳語選択の内容に
基づいて、見出し語と訳語の関係が相反する複数の選択
内容、および一つの見出し語に対する最後の選択以前の
選択内容などの学習制御を行って辞書部7における学習
辞書部7bの学習辞書情報の記録や更新などの制御を行
うと共に、翻訳部6での翻訳において有効な学習情報を
与えることのできるように学習辞書部7bの学習辞書内
容を制御するものである。翻訳部6は入力部1から入力
され、制御部5を介して与えられた原文(第1言語の文
書)を、辞書部7の持つ各種の情報(知識)を参照して
翻訳する処理を実施する部分であり、最も期待値の高い
訳語の決定を行う学習内容選択手段6aを有している。
翻訳部6は翻訳処理にあたっては辞書部7の持つ知識を
用いて翻訳を実施する。辞書部7は、翻訳処理に必要な
各種の辞書情報や規則を保持するものであり、語彙部7
a、学習辞書部7b、形態素解析規則7c、構文・意味
解析規則7d、変換規則7e、生成規則7f、形態素生
成規則7gからなる。これらのうち、語彙部7aとは語
彙の情報を集めた辞書部分であり、学習辞書部7bとは
ユーザの訳語選択により学習された学習内容を収納する
辞書である。また、形態素解析規則7cは入力文書を形
態素に分けるための解析規則情報を保持した部分であ
り、構文・意味解析規則7dは入力文書を構文解析し、
意味解析するための規則情報を保持した部分であり、変
換規則7eは第1言語から第2言語への変換のための規
則情報を保持した部分である。また、生成規則7fは第
2言語を生成するための規則情報を保持した部分であ
り、形態素生成規則7gは第2言語の形態素を生成する
ための規則情報を保持した部分である。次に、上記構成
の本システムの作用を説明する。入力部1より処理対象
の原文が入力されると、この原文は制御部5へ送られ
る。そして、制御部5はこの原文のデータを翻訳部6へ
送って翻訳処理させることになる。原文のデータを受
け、ユーザから翻訳指示が与えられると翻訳部6は、辞
書部7の知識・規則を利用してこの入力原文に対して、
第2言語の文、あるいは第1言語の文字列を含んだ第2
言語の文への翻訳処理を行う。翻訳処理にあたり、ある
見出し語に対する訳語を決定する際には、学習辞書部7
bを参照し、学習内容選択手段6aを用いて、最も期待
値の高い訳語の決定を行う。入力原文に対する翻訳処理
を終了すると、翻訳部6はその翻訳結果を制御部5に渡
し、制御部5はこの翻訳結果を出力部4へ送って出力さ
せ、一通りの処理を終える。翻訳結果をみてユーザが修
正の必要があると判断すると、ユーザがそのための操作
を入力部1から行なうが、当該操作により編集のモード
に入ることになる。すなわち、編集のモードは、ある文
の翻訳結果が得られた状態で、ユーザが入力部1を操作
して制御部5に、ある語に対する訳語選択機能起動の命
令を与えることで移行する。そして、この訳語選択機能
起動の命令が与えられると、制御部5は、訳語選択部2
へ訳語選択開始の信号を送る。訳語選択部2は、この訳
語選択開始の信号を受け取ると、ユーザに訳語選択を促
すための画面を出力部1へ表示させるための信号を制御
部5へ送る。一方、制御部5は翻訳部6に指令を与えて
画面のカーソル位置にある語についてその訳語候補を辞
書部から取得させる。翻訳部6はこの取得した訳語候補
を制御部5に渡し、制御部5ではそれを訳語選択部2へ
渡すので、訳語選択部2は候補一覧とし、この一覧から
目的の語を選択できるような画面にして制御部5に渡
し、さらに制御部5はこれを出力部4の画面上に表示さ
せるようにする。これにより、出力部1には選択をガイ
ドする訳語候補一覧と操作ボタンなどが画面表示される
ことになり、この画面を見てユーザが訳語選択の操作を
入力部1から行うと、その内容は制御部5に与えられ、
制御部5は当該選択内容に沿った表示命令を出力部4へ
与えて表示させると共に、選択内容に沿った指令(選択
指示)を訳語選択部2に与える。訳語選択部2は当該指
令をさらに学習制御部3に送ると共に、制御部5を介し
て翻訳部6にも送る。この指令を受け取ることにより、
置き換え指令が出され、また、一方、学習制御部3では
辞書部7における学習辞書部7bの内容と今回の選択内
容などから学習辞書部7bの該当部分の学習内容の更新
を行ない、以降の翻訳処理に反映されることになる。翻
訳結果に対し、必要な箇所について、上述の編集のモー
ドによる上述のような処理を行なうことで、必要箇所で
の所望の訳語を指定しての翻訳結果が得られ、また、学
習情報が辞書部7に学習されることになる。以上は大ま
かな処理動作の説明であり、本システムでは個々の文に
おける単語の使われ方に応じて特定の訳語か望ましい、
特定の訳語を学習させたいという場合に、その学習がそ
の後の翻訳に影響を与えないように工夫しており、この
点に特徴があるので、以下その詳細を具体的に説明す
る。 <制御部3での対話的翻訳処理>制御部3における対話
的な翻訳処理の流れを図2に示す。編集部5は、入力部
1から何等かのキー入力があると、それぞれのキー・コ
マンドに応じた処理を行なう。入力部1より終了命令が
入力されると(ステップS201)全ての処理を終了す
る。入力部1より翻訳指示命令を受けた場合には(ステ
ップS202)、ステップS207へ進み、指示対象文
に対する翻訳処理開始命令を翻訳部6へ送る。翻訳部6
における翻訳処理の流れについては別の図を用いて後に
説明する。翻訳処理が終了するとステップS208へ進
み、出力部4に対して訳文を表示する命令を送る。入力
部1より文字キーの入力があった場合には(ステップS
203)、ステップS209へ進み、原文の文字列とし
て出力部4へ表示命令を送る。入力部1より編集キーの
入力があった場合には(ステップS204)、ステップ
S210へ進み、編集処理を行なう。入力部1より訳語
選択の命令が入力された場合には(ステップS20
5)、ステップS206へ進み、訳語選択部2に対して
訳語選択を起動する命令を送り、訳語選択機能が起動さ
れる。入力部1より入力されたのがその他のキー・命令
の場合は、ステップS211に進み、その入力に応じた
処理を行う。 <訳語選択部2での処理>続いて、訳語選択部2におけ
る処理の流れを図3に示す。制御部5より、訳語選択機
能起動の命令が送られてくると、訳語選択部2は、制御
部5を通じて表示部4へ、訳語候補の一覧と共にユーザ
に選択を促す画面の表示命令を送る(ステップS30
1)。図4は、その画面表示の一例である。この例は、
英日翻訳において見出し語“number”の訳語選択
を促す画面である。図に示すように、この画面には“n
umber”に対する種々の訳語(例では、“数”、
“数字”、“数詞”、“番号”、“号”)と“適用ボタ
ン”、“取消しボタン”が表示され、例えば、マウスカ
ーソルにより、いずれかの訳語を指定し、“適用ボタ
ン”あるいは“取消しボタン”を指定してマウスのボタ
ンを操作するとそれを選択、あるいは指示することがで
きる。訳語の左側の四角が黒く表示されているのは、現
在、訳文中に生成されている訳語である。その後、ユー
ザにより取り消しボタンが押された場合には(ステップ
S302)、そのまま処理を終了する。適用ボタンを押
された場合には(ステップS303)、ステップS30
7へ進み、学習制御部3へ選択に関係する諸データを送
付する。学習されるのは、画面上で、黒四角でマークさ
れている訳語である。これを受けた学習制御部3は、学
習辞書部7bの更新を行う(ステップS308)。この
更新処理の詳細については、後に別の図を用いて説明す
る。ユーザにより訳語のクリックが行われた場合には
(ステップS304)、ステップS305へ進み、クリ
ックされた訳語横の四角を黒色表示し、代わりにそれま
で黒色表示していた項目は白色表示するよう、制御部5
を通じて表示部4へ信号を送る。ユーザが選択したい訳
語をクリックし黒色表示に変えることで、学習したい訳
語を示したことになる。通常の処理の流れとしては、訳
語候補をディスプレイに表示させた後(ステップS30
1)、ユーザがこの表示されている訳語候補中の望む訳
語を例えば、マウスカーソルで指し示してマウスの操作
ボタンをクリックすると(ステップS304)、これに
よりディスプレイ上では当該訳語がマーキング表示され
るように表示制御される(ステップS305)。その
後、ユーザによって適用ボタンが押されて(ステップS
303)学習内容が決定される。ユーザにより上記以外
のコマンド・キーが入力された場合は(ステップS30
6)、ステップS307へ進み、警告音を発するよう、
制御部5を通じて出力部4へ信号を送る。 <学習辞書部7bでの学習内容の構成>学習辞書部7b
に記憶される学習内容の構成を図5を用いて説明する。
学習内容は、ある一つの見出し語毎に、学習なしでの訳
語、学習デフォルト訳語、共起学習情報とを有してい
る。共起とは、ある表現・文において一緒に用いられる
ことになる複数の単語の関係をいい、このような関係の
単語と文との関係の情報を学習した情報が共起学習情報
である。「学習なしでの訳語」とは、ある見出し語に対
して訳語選択が全く行われていない状態で訳語として出
力されていた訳語のことで、その見出し語に対して代表
として初期設定した訳語のことをいう。全く学習されて
いない状態での語は、それが参照された場合には初期設
定されたその代表の訳語が翻訳の際の訳語として採用さ
れる。共起学習情報欄は、訳語毎に区別するための項目
番号が順に“[1]”、“[2]”、…“[n]”の如
く付されて訳語毎に別れて記述され、登録されている。
項目番号“[1]”、“[2]”、…“[n]”の中は
さらに、例えば、“[1]”は枝番号を“[1,
1]”、“[1,2]”、…“[1,m]”、
“[2]”は“[2,1]”、“[2,2]”、…
“[2,m]”の如く付して、細分化させている。そし
て、例えば、枝番号“[1,1]”、…“[2,
1]”、“[3,1]”、…[n,1]には、当該訳語
が選択された原文、あるいは当該訳語が生成されている
状態でユーザが「それでよし」として別段、訳語選択操
作をしなかった原文における共起条件とその頻度が記述
される。これら共起学習情報が更新されるタイミング、
更新データの対象とする文については、後に別の図を用
いて説明する。本システムでは、見出し語の品詞毎に、
条件として記憶すべきパターンを別に定義してある。そ
して、原文がそのパターンに適合するものでない場合
は、“X”が“[m]”の最大値とすると、“[1,
X]”、“[2,X]”などの“[?,X]”(但し、
?は1,2,3,4,…)の欄にその他項目としてまと
められて頻度のみが記憶される。その頻度の記憶場所は
訳語毎に対応して設定した計数変数に対してである。ま
た、訳語毎に計数変数として「頻度計」を持ち、ここに
は枝番号“[?,1]”から“[?,X]”までの頻度
の合計値を記憶する。英日翻訳システムとして例示した
本具体例において、見出し語の品詞毎に定義している共
起条件として記憶するパターンの一覧を以下に示す。記
述方法欄内の“????”に、該当する単語を記述す
る。複数ある場合は、コンマで区切って列挙するものと
する。 (1)名詞 (a) 名詞に前置修飾する名詞・形容詞があるとき 記述方法:(前置修飾“WORD”) WORD:前置修飾する名詞あるいは形容詞 (b) (a)以外で、後置修飾前置詞句があるとき 記述方法:(後置修飾“PRE_NOUN”) PRE:前置詞 NOUN:前置詞が従える名詞句のへッド名詞 (2)形容詞 (a) 限定用法(名詞を連体修飾しているとき) 記述方法:(限定“NOUN”) NOUN:修飾先の名詞 (b) 叙述用法で主語があるとき 記述方法:(叙述“NOUN”) NOUN:主語の名詞句のヘッド名詞 (3) 動詞 (a) 目的語(受動態の時は主語)があるとき 記述方法:(目的語“NOUN”) NOUN:目的語の名詞句のヘッド名詞 (4) 副詞 (a)動詞あるいは形容詞を修飾しているとき 記述方法:(修飾先“WORD”) WORD:修飾先の動詞あるいは形容詞 本具体例において、見出し語の品詞毎に定義している共
起条件として記憶するパターンは、例えば、このような
ものである。 <翻訳部6における翻訳処理>次に、翻訳部6における
翻訳処理の詳細を説明する。図6は、翻訳部6における
翻訳処理の流れを示すフローチャートである。図6に従
って翻訳部6での翻訳処理を説明すると、まず、入力文
が翻訳部6に送られてくることにより、当該翻訳部6で
はこの入力文に対して辞書部7中の語彙部7aの情報と
形態素解析規則7cの規則情報を用いて、形態素解析・
辞書引き処理を行い、その品詞と訳語など、翻訳処理に
必要な各種情報を求める(ステップS601)。次に、
翻訳部6は辞書部7中の構文・意味解析規則7dの情報
を用いて構文・意味解析処理を行い(ステップS60
2)、続いて、ステップS603において、変換規則7
eを用いて解析結果から第2言語の構造への変換を行
う。この時点では、辞書部7中の学習辞書部7bにある
学習辞書は参照せず、システムの持つ知識のみから、各
見出し語に対する訳語を決定している。その後、ステッ
プS604に進み、翻訳部6は辞書部7中の学習辞書部
7bを参照し、当該原文の見出し語に付与された訳語の
うち、学習辞書部7bの内容を反映すべき訳語をチェッ
クし、必要なものに対して訳語の置き換え処理を行う。
この際の、学習辞書部7bの学習辞書との照合処理や、
置き換える訳語を決定する処理については、図7により
後述する。ステップS604での処理を終えた段階で、
訳文側の構造が完成する。その後、ステップS605に
進み、翻訳部6は辞書部7中の構文生成規則7fの情報
を用いて訳文側の一次元的構造の生成を行い、続いてス
テップS606で形態素の生成を行い、一通りの翻訳処
理を終了する。 <学習内容を反映させるための照合処理>図7は、翻訳
部6での照合処理の流れを示すフローチャートであり、
翻訳部6の持つ学習内容選択手段6aの機能により、学
習辞書部7bの内容を参照しながら学習内容を反映させ
るようにする際での学習辞書部7bとの照合処理の流れ
を示す図である。当該照合処理は基本的には、一原文内
の各語について文頭から順番に、学習辞書部7bとの照
合を行っていく。但し、図7に示した流れは、一つの見
出し語に対する処理の流れである。学習内容を反映する
には、以下の条件が前提となる。従って、この条件が成
立するかを最初に判定する(ステップS701、S70
2)。この前提が成り立たない場合は、学習内容を反映
する対象ではないので、照合処理を終了する。学習内容
を反映するための条件は、 (1)見出し語が一致すること (2)学習辞書を使わない状態で生成されている訳語が
“学習なしでの訳語”と一致すること である。そして、この前提条件が成り立っている場合
は、共起学習情報の中から、当該原文の状況に適合する
ものを選ぶことになる。“[1,1]” -->“[1,
2]” --> ……“[1,n]” -->“[2,1]” -
->“[2,2]” -->“[2,n]” --> ……
“[m,n]”という順番に個々の共起情報と照合を進
めていく。この個々の共起情報の照合順序を制御してい
るのが、図中の“i”と“j”の数値制御である。
“i”を順番に繰り上げていき(インクリメント)、
“[i]”という情報がなくなれば(ステップS70
4)、ステップS706へ進み、“学習デフォルト訳
語”に置換することに決定する。ある枝番号“[i,
j]”の条件が当該原文の状況に適合すれば(ステップ
S709)、ステップS710に進み、項目番号
“[i]”の登録訳語を置換訳語と決定する。ステップ
S706、S710のいずれかを経て、置換する訳語が
決定したら、照合処理を終える。以上が、学習内容を反
映させるようにする際での学習辞書部7bとの照合処理
の詳細である。 <学習辞書部7bの更新処理>次に、ユーザがシステム
と対話的に、原文書の頭から適宜訳語選択・後編集を行
いながら翻訳処理を行う際の、学習制御部3による学習
辞書部7bの更新処理について説明する。図8は、訳語
選択が行われた時点での、訳語選択対象語の選択結果を
もとにした学習辞書部7bの更新の処理の流れを示して
いる。図8に沿って当該更新処理を説明する。訳語選択
部2から、訳語選択結果として送られてくるのは、見出
し語、学習がない状態での訳語、学習させたい訳語、お
よび、当該原文における共起情報の4種類である。これ
らが学習制御部3へ送られてくると、最初にステップS
801で、当該訳語および学習なしでの訳語との組み合
わせで、既に学習辞書部7bに記憶されているかをチェ
ックする。その結果、登録されていない組み合わせな
ら、ステップS803へ進み、この組み合わせで学習項
目を新規に登録し、学習させたい訳語を学習デフォルト
訳語として登録する。続いて、ステップS805へ進
み、当該原文の共起情報を元に、“[1]”を登録す
る。当該原文の共起情報が、別に定義した品詞・共起条
件と一致する場合には“[1,1]”を登録し、それ以
外の場合には“[1,X]”を登録する。但し、“X”
は“[1,m]”の“m”の最大値を示す。以下の説明
における「X」の扱いも同様である。いずれにしても、
ある見出し語の項目番号“[1]”の「頻度計」の値は
最初は“1”である。当該訳語と学習なしでの訳語の組
み合わせが既に登録されている場合は、ステップS80
2へ進む。ここで、特定品詞(別に定義した品詞群のい
ずれか)、すなわち名詞、動詞、形容詞、副詞のいずれ
かと一致するかどうかを判定する。その判定の結果、特
定品詞以外である場合は、ステップS804へ進む。こ
こで、共起学習情報内に登録されている学習情報のう
ち、学習させたい訳語と一致する“[i]”を見つけ、
“[i,X]”の「頻度」を加算し、“[i]”の「頻
度計」を加算する。一方、学習させたい訳語と一致する
“[i]”がない場合は、新規の“[i]”を追加し、
“[i,X]”の「頻度」と“[i]”の「頻度計」の
値を加算する。ステップS802で、特定品詞と一致す
ると判定された場合は、ステップS806へ進む。ここ
では、学習させたい訳語に関する共起学習情報がすでに
登録されているかどうかをチェックする。まだ登録がな
い場合は、ステップS807へ進み、当該原文の共起情
報が別に定義した共起条件に該当するものならば、ステ
ップS809において、新規に項目番号“[i]”と枝
番号“[i,1]”を登録し、「頻度計」の置数内容を
“1”と設定する。当該原文の共起条件が特定条件以外
なら、ステップS811において、新しい項目番号
“[i]”と枝番号“[i,X]”を登録し、その「頻
度計」の置数内容を“1”と設定する。ステップS80
6で学習させたい訳語に関する共起学習情報が未登録で
あると判定された場合は、ステップS808へ進む。こ
のステップS808では、当該原文の共起情報が別に定
義した共起条件に該当するかどうかをチェックする。そ
の結果、特定条件以外なら、ステップS813へ進み、
同じ訳語に関する“[i]”の“[i,X]”を更新
し、“[i]”の「頻度計」を加算する。ステップS8
08でのチェックの結果、当該原文の共起情報が別に定
義した共起条件に該当すると判定された場合は、ステッ
プS810へ進む。ここで、当該項目番号“[i]”の
項に記述されている任意の枝番号“[i,j]”の共起
情報が、当該原文の共起情報と一致するかどうかを判定
する。その結果、一致すると判定された場合はステップ
S812へ進み、一致した枝番号“[i,j]”の共起
情報内容を更新する。具体的には、見出し語が名詞であ
れば、“前置修飾”、“後置修飾”などの単語記載欄に
当該原文の共起情報として送られてきた単語を追加し
(すでに含まれていれば追加しない)、「頻度」の値を
加算する(インクリメントする)。一方、当該項目番号
“[i]”に記述されている任意の枝番号“[i,
j]”の共起条件と一致しない場合は、ステップS81
5へ進み、新しい枝番号“[i,j]”を登録し、項目
番号“[i]”の「頻度計」を加算する(インクリメン
トする)。いずれかの“[i]”の「頻度計」が加算さ
れた場合、すなわち、ステップS813、S804、S
815を経た場合は、各“[i]”の「頻度計」を比較
し、その値が最大である「頻度計」を持つ項目番号
“[i]”を見付ける。そして、その見付けた項目番号
“[i]”の登録訳語が「学習デフォルト訳語」と異な
る場合はその見出し語における「学習デフォルト訳語」
を、「頻度計」の値最大の項目番号“[i]”の登録訳
語の訳語と置き換えて、新しい「学習デフォルト訳語」
とし、学習辞書部7bの更新処理を終了する。「頻度
計」の値最大の項目番号“[i]”の登録訳語が複数あ
る時は、時間的に新しい選択結果、すなわち、今回選択
された訳語の方を「学習デフォルト訳語」として更新登
録する。訳語選択対象文に対して学習辞書部7bを更新
したあと、学習制御部3はさらに、前回同じ見出し語、
学習なしでの訳語に対して訳語選択をした文以降から現
在の文の間において、今回の学習と同じ見出し語、学習
なしでの訳語に関する学習結果が反映されている箇所を
検出し、その各々について、図8での説明と同様の処理
を行い、対応する項目番号“[i]”の「頻度計」の更
新、学習デフォルト訳語の更新を行う。この時、これま
でに同じ見出し語、学習なしでの訳語に対しては訳語選
択が行われていない場合は、文書の第1文目から現在の
処理文の間において上記の処理を行う。ただし、これま
でに作業者が編集作業を済ませた分の中で、最も文書末
に近い箇所より後方(より文書頭側)へ作業者の編集箇
所の対象点が移動し、そこで訳語選択を行った場合に
は、当該選択結果のみに基づき学習辞書部7bを更新
し、上記の後方箇所を元にした学習辞書部7bの更新処
理は行わない。つまり、訳語選択操作をした最新時点で
の文書位置より前の文書位置で、訳語選択操作をしなか
った部分の訳語の学習は行なわない。上記では、対話的
に翻訳処理を行なっていく上で訳語選択に基づき学習辞
書部7bが自動更新され、以降の文で出力される訳語の
適切度合の期待値を高めることにより、以降の文の翻訳
における後処理作業の手間が軽減されることについて説
明してきた。このような対話的翻訳処理に対比する翻訳
作業の進め方として、最初に一括的に翻訳を行ない、そ
の後で、対話的に後編集を行なうという方法がある。こ
の作業方法でも、訳語選択に基づく学習辞書部7bの更
新処理の流れは共通である。こうすることにより、「学
習デフォルト訳語」には、頻度的にみて最も期待値の高
い訳語が設定されることになり、以降の翻訳での訳語決
定に反映される。しかも、特定の共起条件のもとで訳語
が学習されたものは、別個に記憶されるため、相反する
訳語選択がされても、前の選択結果が、後の選択結果に
打ち消されることはない。例えば、入力原文のある行
に、“the number of computer
terminals”という文字列があり、その後方
の行に“identification numbe
r”という文字列があったとする。そして、学習辞書部
7bにおける見出し語“number”に関しての学習
辞書内容として、例えば、“identificati
on number”という原文文字列に対して、見出
し語“number”における図5の項目番号
“[1]”の登録内容の如き共起情報と共に、訳語とし
て“番号”という語が学習されて保持されており、その
後出現した、“the number of comp
uter terminals”という文字列に対して
図5の項目番号“[2]”の登録内容の如き共起情報と
共に訳語として“数”という語が学習されて保持された
とした場合、「頻度計」の値の大きい方の訳語である
“番号”という語が「学習デフォルト訳語」に設定され
ていても、再度原文中に生起する“thenumber
of terminals”における“the nu
mber”に対しては、その訳語として“数”という言
葉が出力されることが保証される。本具体例では、共起
学習情報として、選択時の原文の単語の用いられ方を記
憶することにより、デフォルト学習訳語が変化しても過
去の選択結果の効果は保証するようにしている。この際
に、本具体例では、処理を簡単にするために、予め単語
の用いられ方(他の単語との共起状況)として記憶すべ
きパターンを限定している。このように限定すること
も、また限定したパターンの種類も、単に本発明のー実
施形態にすぎないので、処理速度、学習辞書としての記
憶容量に応じて、様々な形態で実施可能である。また、
本具体例では、一つの原文書全体を一つの範囲として、
頻度を計上したが、“原文書の章の別れ”、“節の別
れ”などで区切りを設け、頻度計上を調整することも可
能である。こうすることにより、例えば、“章によって
内容が異なり望ましい訳語も異なる”、というような場
合には効果がある。以上、本システムは、入力された自
然言語による第1言語の原文を第2言語へ変換するため
の知識情報を有する辞書部の知識情報を用い、翻訳部に
より、前記原文の単語列を前記第2言語の単語列に変換
する翻訳処理を行うようにした翻訳装置において、前記
辞書部にはその知識情報として、第1言語の見出し語別
に設けられる初期設定の訳語(学習なし状態での最優先
採用となる訳語)および利用実績が最高となる訳語であ
る学習デフォルト訳語および訳語別に登録される共起情
報および頻度情報とを含む更新可能な学習辞書をさらに
保持させて構成し、また、前記翻訳部の翻訳結果を出力
するための出力部と、学習辞書内容に基づき前記出力部
に出力される訳語候補中の所望訳語に対し、選択指示操
作するとその選択指示内容に基づき前記翻訳部での翻訳
に使用する訳語を選択指示する訳語選択部と、この訳語
選択指示の内容に基づいて、見出し語における訳語別の
共起情報および頻度情報を含む学習情報を更新し、頻度
情報最多の訳語は学習デフォルト訳語として更新する学
習制御部とを具備して構成したものである。そして、入
力部より第1言語である自然言語の文および単語列を入
力するとその入力データは翻訳部に送られ、翻訳部は辞
書部内の知識を用いて翻訳処理を行い、その翻訳結果を
出力部へ出力する。翻訳結果に対しての編集処理に入る
と、訳語選択部は編集のため学習辞書から訳語候補を得
て出力部に表示させ、ユーザが入力部によりこの候補中
から訳語選択操作を行なうと、翻訳文に対しては、訳語
置換が行なわれる。一方、訳語選択操作に基づく選択内
容は訳語選択部から学習制御部へも送られ、学習制御部
では、今回の訳語選択内容の他、翻訳文に生成されてい
る訳語でよしとしてユーザが訳語を選択しなかった文に
ついての情報を学習辞書に記録する。記録する内容は、
基本的に見出し語、学習内容が空の場合に出力されるは
ずの訳語、選択された訳語、および、原文中で共起する
語(品詞・構文により対象は定義する)の4種類であ
る。同じ見出し語に対して異なる選択が行われる度に、
選択内容が記録され、かつ、その時点までに翻訳処理・
編集処理を終えた文書の範囲内に生起する当該見出し語
に関して、訳語の種類毎の頻度も記録され、この頻度を
元に当該見出し語における学習訳語群中から1つの訳語
を選定し、学習デフォルト訳語として学習辞書に記録す
る。翻訳部における翻訳処理では、訳語を決定する際
に、学習辞書を参照するが、新規に翻訳する文が、学習
辞書に記録された、訳語選択条件群のいずれかにマッチ
するものであれば、その条件時に選択された訳語をその
文の訳語として決定し、見出し語は一致するが共起語が
一致しない場合は、学習デフォルト訳語を訳語として決
定する。このような処理を施すようにした結果、一つの
見出し語に対して相反する訳語が選択されても、一方が
無効になることなく、共起語を条件にすることにより、
すべてを学習知識として以降の翻訳に生かすことができ
る。さらにまた、単語の使われ方が学習辞書中の共起情
報に一致しない新たな文の中の訳語については、過去の
生かされた訳語の頻度情報を元に、後の翻訳において最
も期待値の高い訳語を推定し、これをデフォルト訳語と
して記憶するようにすることにより、ユーザ所望の翻訳
結果が得られる確率が高くなり、ユーザの後編集作業を
軽減することができるようになる。DETAILED DESCRIPTION OF THE INVENTION The present invention will now be described with reference to the drawings.
A concrete example of Ming will be described. FIG. 1 shows an example of the present invention.
Is a block diagram showing the configuration of a machine translation system
You. In the figure, 1 is an input unit, 2 is a translation selection unit, and 3 is a learning unit.
Learning control section, 4 output section, 5 control section, 6 translation section, 7
It is a dictionary section. The input unit 1 is used to input sentences to be translated and
Control unit for inputting seed commands
For 5, enter the sentence to be translated and enter various commands.
It is for doing power. As the input unit 1,
Usually, a keyboard and a mouse are used. Translation target sentence
In addition to using the keyboard, OCR (optical
Type character reader), floppy disk, magnetic tape, magnet
Consider reading from a magnetic disk, magneto-optical disk, etc.
Can be The output unit 4 outputs the translation result output from the translation unit 6.
Output or output from the input unit 1 or the translated word selection unit 2 to the control unit 5
For displaying responses from the control unit 5 to various commands
Things. The output unit 4 is a display means, for example, CR
T display device, liquid crystal display device, plasma display, etc.
Such as a display for image display is usually used.
However, the translation result is output by a printing machine (printer).
Printing means such as, or directly, floppy disk, magnetic
When outputting to a recording medium such as a magnetic tape or magnetic disk
And transmission means (communication means) for transmitting to other media
You can also. The control unit 5 controls the entire system.
Pivotal, for controlling the movement of the entire system
It is. The translation word selection unit 2 selects translation words in the edit mode.
Input section 1 in the edit mode.
Of the user who is given via the control unit 5 by the operation from
The translation word is selected according to the instruction. Learning control unit 3
Is the content of the translation selection made via the translation selection unit 2.
Based on multiple choices with conflicting headword and target terms
Content and before the last choice for one headword
Learning in the dictionary unit 7 by controlling learning of selection contents
Controls recording and updating of the learning dictionary information in the dictionary section 7b.
At the same time, provide effective learning information for translation in the translation unit 6.
In the learning dictionary of the learning dictionary unit 7b so that it can be given
It controls the content. The translation unit 6 is input from the input unit 1.
And the original text (text in the first language) given via the control unit 5
Referring to various information (knowledge) held by the dictionary unit 7
This is the part that performs the process of translating, and has the highest expected value.
The learning content selection means 6a for determining a translated word is provided.
The translation unit 6 uses the knowledge of the dictionary unit 7 in the translation process.
Use to perform translation. The dictionary unit 7 is necessary for translation processing.
It holds various dictionary information and rules, and the vocabulary section 7
a, learning dictionary unit 7b, morphological analysis rule 7c, syntax / meaning
Analysis rule 7d, conversion rule 7e, production rule 7f, morphomorphism
It consists of 7g of rules. Of these, the vocabulary section 7a is a word
This is a dictionary part that collects vocabulary information, and the learning dictionary part 7b is
Store the learning content learned by the user's translation selection
It is a dictionary. In addition, the morphological analysis rule 7c defines the input document
A part that holds the analysis rule information for dividing into
The syntax / semantic analysis rule 7d parses the input document,
This is the part that holds the rule information for semantic analysis.
The conversion rule 7e is a rule for conversion from the first language to the second language.
This is the part that holds the rule information. In addition, the production rule 7f is
A part that holds the rule information for generating two languages
Therefore, the morpheme generation rule 7g generates a morpheme of the second language.
This is the part that holds the rule information for. Next, the above configuration
The operation of the present system will be described. Processing target from input unit 1
When the original text of is input, this original text is sent to the control unit 5.
You. Then, the control unit 5 sends the original text data to the translation unit 6.
It will be sent and translated. Accept original text data
When the translation instruction is given by the user, the translation unit 6
Using the knowledge and rules of the writing department 7, for this input source text,
Second language sentence or second language containing first language character string
Translates the language into sentences. There is a translation process
When determining a translation for an entry word, the learning dictionary unit 7
b, and using the learning content selection means 6a, the most expected
Determine a translation with a high value. Translation processing for input source text
When the translation is completed, the translation unit 6 passes the translation result to the control unit 5.
Then, the control unit 5 sends this translation result to the output unit 4 and outputs it.
And complete the general processing. See the translation result
If the user determines that there is a need for a positive
Is performed from the input section 1, but the editing mode
Will enter. That is, the editing mode is
The user operates the input unit 1 with the translation result of
Then, the control unit 5 is instructed to activate the translated word selection function for a certain word.
It shifts by giving an order. And this translation selection function
When the activation command is given, the control unit 5 causes the translation word selection unit 2
A signal to start selecting a translated word is sent to. The translation word selection unit 2
When the signal to start word selection is received, the user is prompted to select a translated word.
Control the signal to display the screen for output on the output unit 1.
Send to Part 5. On the other hand, the control unit 5 gives a command to the translation unit 6.
For the word at the cursor position on the screen,
Get it from the writing department. The translation unit 6 obtains the acquired translation word candidates
Is passed to the control unit 5, and the control unit 5 sends it to the translated word selection unit 2.
Since it is passed, the translation word selection unit 2 makes a candidate list, and from this list
Display the screen on which you can select the target word and pass it to the control unit 5.
In addition, the control unit 5 displays this on the screen of the output unit 4.
To make it work. As a result, the output section 1 is guided to select.
A list of translation candidates to be displayed and operation buttons are displayed on the screen.
By looking at this screen, the user can select the translation
When performed from the input unit 1, the contents are given to the control unit 5,
The control unit 5 sends a display command according to the selected content to the output unit 4.
It is given and displayed, and the command (selection according to the selection
Instruction) to the translation word selection unit 2. The translation selection unit 2 is the finger
The instruction is further sent to the learning control unit 3 and also via the control unit 5.
And send it to the translation unit 6. By receiving this command,
A replacement command is issued, and on the other hand, the learning control unit 3
The contents of the learning dictionary 7b in the dictionary 7 and the current selection
Update learning contents of the relevant part of the learning dictionary unit 7b from contents etc.
Will be reflected in the subsequent translation process. Transliteration
For the translation results, edit the above-mentioned
By performing the processing described above by
You can obtain the translation result by specifying the desired translation word of
The learning information is learned by the dictionary unit 7. The above is roughly
This is an explanation of the kana processing operation.
Depending on how the word is used, a specific translation is desirable,
If you want to learn a specific translation, that learning
It is designed so as not to affect the translation after
Since it is characterized by these points, the details will be described in detail below.
You. <Interactive translation processing in control unit 3> Dialogue in control unit 3
The flow of a typical translation process is shown in FIG. The editing unit 5 is an input unit
If there is any key input from 1, each key
Perform processing according to the command. The end command from the input section 1
When input (step S201), all processing is terminated
You. If a translation instruction command is received from the input unit 1,
S202), the process proceeds to step S207, and the target sentence
And sends a translation processing start command to the translation unit 6. Translation department 6
For the flow of translation processing in
explain. When the translation process is completed, the process proceeds to step S208.
Then, a command for displaying the translated sentence is sent to the output unit 4. input
If a character key is input from copy 1 (step S
203), the process proceeds to step S209, and the original text character string is set.
And sends a display command to the output unit 4. From the input section 1
If there is an input (step S204), step
The process proceeds to S210, and editing processing is performed. Translated from input section 1
When the selection command is input (step S20)
5) proceeds to step S206, and the translation word selection unit 2
Send the command to activate the target word selection, and the target word selection function is activated.
Be done. Other keys / commands input from the input unit 1
In the case of, it progresses to step S211 and responds to the input.
Perform processing. <Processing in translated word selection unit 2>
FIG. 3 shows the flow of processing according to the above. From the control unit 5, a translation word selection machine
When the command to activate Noh is sent, the translated word selection unit 2 controls
Display unit 4 through unit 5 to display unit 4 together with a list of candidate words
To send a screen display command prompting selection (step S30
1). FIG. 4 is an example of the screen display. This example
Selecting a translation for the entry word "number" in English-Japanese translation
This is a screen for prompting. As shown in the figure, this screen displays "n
various translations for "number" (in the example, "number",
"Number", "Numerical", "Number", "No.") and "Apply button"
“Cancel button” and “Cancel button” are displayed.
Cursor, specify one of the translated words and click "Apply button".
Button or mouse button with the "Cancel button" specified
Operation, you can select or instruct it.
Wear. The black square on the left side of the translated word is the current
Currently, it is the translated word generated in the translated text. Then you
If the cancel button is pressed by the
(S302), the process is ended as it is. Press the apply button
When it is done (step S303), step S30
7 and sends various data related to selection to the learning control unit 3.
Attached. What you will learn is marked on the screen with a black square
It is a translated word. Upon receiving this, the learning control unit 3
The learning dictionary unit 7b is updated (step S308). this
Details of the update process will be described later using another figure.
You. If the user clicks on a translation
(Step S304), Step S305
The square next to the translated word is displayed in black and
Items that were displayed in black with are displayed in white.
To send a signal to the display unit 4. What the user wants to select
Translation you want to learn by clicking on a word and turning it into black
It means that the word is shown. The normal processing flow is
After displaying the word candidates on the display (step S30
1), the desired translation in the translation candidates displayed by the user
Mouse operation by pointing a word, for example, with the mouse cursor
Click the button (step S304)
The relevant word is marked on the display.
Display control is performed as described above (step S305). That
Then, the user presses the apply button (step S
303) The content of learning is determined. Other than the above depending on the user
If the command key of is input (step S30
6), go to step S307, and make a warning sound.
A signal is sent to the output unit 4 through the control unit 5. <Structure of learning contents in learning dictionary unit 7b> Learning dictionary unit 7b
The configuration of the learning content stored in will be described with reference to FIG.
The learning content is translated without learning for each one headword.
Words, learning default translations, and co-occurrence learning information
You. Co-occurrence is used together in an expression / sentence
The relationship between multiple words
Co-occurrence learning information is information obtained by learning information about the relationship between words and sentences
It is. "Translation without learning" refers to a certain headword.
Then, the translated words are output as translated words when no translated words are selected.
The translated word that was used to represent the headword
It means the translated word initially set as. Totally learned
A word that is not in the initial state is the default when it is referenced.
The translated word of the representative is adopted as the translated word during translation.
Be done. The co-occurrence learning information column is an item for distinguishing each translated word.
If the numbers are "[1]", "[2]", ... "[n]"
It is attached and described separately for each translated word, and is registered.
Item numbers "[1]", "[2]", ... "[n]"
Further, for example, "[1]" has a branch number of "[1,
1] ”,“ [1,2] ”, ...“ [1, m] ”,
"[2]" is "[2,1]", "[2,2]", ...
It is subdivided by adding it as "[2, m]". Soshi
For example, branch number “[1,1]”, ... “[2
1] ”,“ [3,1] ”, ... [n, 1]
The selected source text or the corresponding translation has been generated
In this state, the user selects "Translation"
Describe the co-occurrence condition and its frequency in the original text that did not work
Is done. When these co-occurrence learning information is updated,
For the target sentence of the update data, use another diagram later.
Will be described. In this system, for each part of speech of a headword,
The pattern to be stored as a condition is defined separately. So
And the source text does not match the pattern
If “X” is the maximum value of “[m]”, then “[1,
"X?", "[2, X]" and other "[? , X] ”(however,
? Is 1, 2, 3, 4, ...)
Only the frequency is remembered. The memory location for that frequency is
This is for the counting variable set corresponding to each translated word. Ma
In addition, each translated word has a "frequency meter" as a counting variable,
Is the frequency from branch number "[?, 1]" to "[?, X]"
The total value of is stored. Illustrated as an English-Japanese translation system
In this example, the common words defined for each part of speech
The following is a list of patterns stored as trigger conditions. Record
Enter the corresponding word in “????” in the description column.
You. If there are multiple items, separate them with commas
I do. (1) Noun (a) When a noun has a noun or an adjective for prefix modification Description method: (prefix "WORD") WORD: a noun or adjective for prefix modification (b) A suffix other than (a) When there is a modified prepositional phrase Description method: (Postfixed "PRE_NOUN") PRE: Preposition NOUN: Head noun of a noun phrase followed by a preposition (2) Adjective (a) Limited usage (when a noun is adnominal modified ) Writing method: (Limited "NOUN") NOUN: Noun to be modified (b) When there is a subject in narrative usage Writing method: (Narrative "NOUN") NOUN: Head noun of subject noun phrase (3) Verb (a) ) When there is an object (subject when passive) Description method: (object "NOUN") NOUN: Head noun of noun phrase of object (4) Adverb (a) When verb or adjective is modified Description method: (Modification destination “WORD”) WORD: Modification target verb or adjective
The pattern stored as the trigger condition is, for example,
Things. <Translation Processing in Translation Unit 6> Next, in the translation unit 6,
The details of the translation process will be described. FIG. 6 shows the translation unit 6
It is a flowchart which shows the flow of a translation process. According to Figure 6
Explaining the translation process in the translation unit 6, first, the input sentence
Is sent to the translation unit 6,
Is the information of the vocabulary part 7a in the dictionary part 7 for this input sentence
Using the rule information of the morphological analysis rule 7c, the morphological analysis /
Performs a dictionary lookup process and translates the part of speech and translation
Various necessary information is obtained (step S601). next,
The translation unit 6 is information on the syntax / semantic analysis rule 7d in the dictionary unit 7.
Is used to perform a syntax / semantic analysis process (step S60
2), and subsequently, in step S603, conversion rule 7
Use e to convert the analysis results to the structure of the second language.
U. At this point, it is in the learning dictionary unit 7b of the dictionary unit 7.
The learning dictionary is not referenced, and each
The translation for the headword is determined. Then,
In step S604, the translation unit 6 determines the learning dictionary unit in the dictionary unit 7.
7b, refer to the translated word assigned to the entry word of the original sentence.
Check the translated words that should reflect the contents of the learning dictionary section 7b.
Then, the translation of the necessary words is replaced.
At this time, collation processing with the learning dictionary of the learning dictionary unit 7b,
For the process of determining the translation to replace, refer to FIG.
It will be described later. When the processing in step S604 is completed,
The structure on the translation side is completed. After that, in step S605
Then, the translation unit 6 sends information about the syntax generation rule 7f in the dictionary unit 7.
Is used to generate the one-dimensional structure of the translated sentence, and
The morpheme is generated in step S606, and a general translation process is performed.
End the process. <Collation process for reflecting learning content>
9 is a flowchart showing a flow of a matching process in the unit 6,
With the function of the learning content selection means 6a of the translation unit 6, learning
Reflect the learning contents while referring to the contents of the learning dictionary section 7b.
Flow of collation processing with the learning dictionary unit 7b
FIG. Basically, the matching process is within one original sentence.
For each word of the, refer to the learning dictionary unit 7b in order from the beginning of the sentence.
Go together. However, the flow shown in FIG.
This is the flow of processing for the word output. Reflect learning content
The following conditions are the prerequisites. Therefore, this condition is met.
First, it is determined whether to stand (steps S701 and S70).
2). If this assumption does not hold, reflect learning content
Since it is not the target to be processed, the collation processing is ended. content of study
The conditions for reflecting are: (1) the headwords match (2) the translated words generated without using the learning dictionary
It is the same as the “translation without learning”. And if this precondition is met
Matches the situation of the original text from the co-occurrence learning information
You will choose one. "[1,1]"->"[1,
2] ”-> ……“ [1, n] ”->“ [2,1] ”-
->“[2,2]”-> “[2, n]”-> ……
Proceed with individual co-occurrence information and collation in the order of "[m, n]".
I will try. It controls the collation order of this individual co-occurrence information.
This is the numerical control of "i" and "j" in the figure.
"I" is moved up in order (increment),
If the information “[i]” is lost (step S70)
4), go to step S706, "Learning default translation
It is decided to replace with the word "." A branch number "[i,
j] ”matches the situation of the original text (step
S709), the process proceeds to step S710, and the item number
The registered translation of "[i]" is determined as the replacement translation. Steps
After either S706 or S710, the replacement word is
When the determination is made, the collation process ends. The above is the opposite of the learning content
Collation processing with the learning dictionary unit 7b when displaying
It is the details of. <Processing for updating the learning dictionary unit 7b>
Interactively select the translated word from the beginning of the original document and edit it appropriately.
Learning by learning control unit 3 when performing translation processing while
The update process of the dictionary unit 7b will be described. Figure 8 is the translation
The selection result of the translation target word at the time when the selection is made
Show the flow of the process of updating the learning dictionary unit 7b based on
I have. The update process will be described with reference to FIG. Select word
The part that is sent as the translation selection result from Part 2 is the
Words, translated words without learning, translated words you want to learn,
And four types of co-occurrence information in the original text. this
When they are sent to the learning control unit 3, first, step S
In 801 the combination of the translation and the translation without learning
In addition, check whether it is already stored in the learning dictionary unit 7b.
Click. As a result, the unregistered combination
Then, the process proceeds to step S803, and the learning term
Register new eyes and learn the translation you want to learn Default
Register as a translation. Then, proceed to step S805.
Register "[1]" based on the co-occurrence information of the original text.
You. The co-occurrence information of the original text is a separately defined part-of-speech / co-occurrence clause.
If the number matches, register "[1,1]"
If outside, "[1, X]" is registered. However, "X"
Indicates the maximum value of "m" of "[1, m]". Explanation below
The same applies to the treatment of "X" in. In any case,
The value of the "frequency meter" of the item number "[1]" of a certain headword is
The first is "1". A set of the translation and the translation without learning
If the combination has already been registered, step S80.
Proceed to 2. Here, the specific part-of-speech (the part-of-speech group defined separately
I.e., noun, verb, adjective, adverb
It is determined whether or not As a result of the judgment,
If it is other than the fixed part of speech, the process proceeds to step S804. This
Here, the learning information registered in the co-occurrence learning information
Then, find "[i]" that matches the translated word you want to learn,
The "frequency" of "[i, X]" is added, and the "frequency" of "[i]" is added.
Add a "Pedometer". On the other hand, it matches the translated word you want to learn
If there is no "[i]", add a new "[i]",
“Frequency” of “[i, X]” and “Frequency meter” of “[i]”
Add values. In step S802, if it matches the specific part of speech
If it is determined that there is, the process proceeds to step S806. here
Now, the co-occurrence learning information about the translated word you want to learn is already
Check if it is registered. Not registered yet
If not, the process proceeds to step S807, and the co-occurrence information of the original text
If the report meets the co-occurrence conditions defined separately,
In step S809, a new item number “[i]” and a branch are added.
Register the number "[i, 1]" and enter the number of "frequency meter"
Set it to "1". The co-occurrence condition of the original text is not a specific condition
Then, in step S811, the new item number
Register "[i]" and branch number "[i, X]", and
Set "1" as the registered content of "Meter". Step S80
The co-occurrence learning information about the translated word you want to learn in 6 is not registered
If it is determined that there is one, the process proceeds to step S808. This
In step S808, the co-occurrence information of the original text is separately determined.
Check whether the co-occurrence conditions that you have defined are met. So
As a result, if it is not the specific condition, the process proceeds to step S813,
Update "[i, X]" of "[i]" for the same translation
Then, the “frequency meter” of “[i]” is added. Step S8
As a result of the check in 08, the co-occurrence information of the original text is determined separately.
If it is determined that the defined co-occurrence conditions are met, the step
Go to step S810. Here, the item number “[i]”
Co-occurrence of any branch number "[i, j]" described in Section
Determine if the information matches the co-occurrence information in the original text
I do. As a result, if it is determined that they match, the step
Proceed to S812, and co-occur with the matching branch number "[i, j]".
Update information content. Specifically, the headword is a noun
Then, in the word entry fields such as "Prefix" and "Postfix"
Add the word sent as co-occurrence information of the original text
(Do not add if already included), set the value of "Frequency"
Add (increment). On the other hand, the item number
Any branch number "[i," described in "[i]"
j] ”does not match the co-occurrence condition, step S81
5 and register a new branch number “[i, j]”,
Add the "frequency meter" of the number "[i]" (increment
To). The "frequency meter" of either "[i]" is added
If it is determined that is, that is, steps S813, S804, S
After 815, compare “frequency meter” of each “[i]”
And the item number that has the "frequency meter" whose value is the maximum
Find "[i]". And the item number found
The registered translation of “[i]” is different from the “learning default translation”
"Learn default translation" in the entry
Is the registered translation of the item number “[i]” with the maximum value of “frequency meter”.
New "learning default translation" by replacing the translation of the word
Then, the update processing of the learning dictionary unit 7b ends. "frequency
There are multiple registered translations for the item number “[i]” with the maximum value of “total”.
Time, new selection result in time, that is, this time selection
The translated words are updated and registered as "learning default translations".
Record. Update the learning dictionary 7b for the target sentence
After that, the learning control unit 3 further adds the same headword last time,
The current sentence is selected from the sentence after selecting the translation for the translation without learning.
Between the current sentence, the same headword and learning as this learning
Where the learning results for the translated word without
Detection, and for each of them, the same processing as described in FIG.
And then update the “frequency meter” of the corresponding item number “[i]”.
New, update the default translation of learning. At this time, this
For the same headword in, and translation without learning
If no selection has been made, the first sentence of the document
The above processing is performed between processing statements. However, this
The most documented part of the work done by
From behind the part close to (more document head side)
When the target point of the place moves and the translation is selected there,
Updates the learning dictionary unit 7b based only on the selection result.
Then, the update processing of the learning dictionary unit 7b based on the above backward part
There is no reason. In other words, at the latest time when the translation selection operation was performed
Do not perform the translation selection operation at the document position before the document position of
It does not learn the translated words of the part that has been set. Above is interactive
When performing the translation process on the
The writing part 7b is automatically updated, and the translated words output in the following sentences
Translation of subsequent sentences by increasing the expected value of appropriateness
The labor of post-processing work in
I have revealed. Translation in contrast to such interactive translation processing
In order to proceed with the work, first do a batch translation and then
After, there is a method of interactive post-editing. This
Also, the learning dictionary unit 7b is updated based on the translated word selection.
The flow of new processing is common. By doing this,
The "Xi default translation" has the highest expected value in terms of frequency.
A new translation will be set, and the translation will be determined in subsequent translations.
Will be reflected in the default. Moreover, the translation word is translated under certain co-occurrence conditions.
That are learned are stored separately, so conflicting
Even if the target word is selected, the previous selection result becomes the latter selection result.
It cannot be canceled. For example, the line containing the source text
To the "the number of computer
There is a character string "Terminals" and behind it
In the line of "identification number
Suppose there is a character string "r". And the learning dictionary section
Learning about the entry word "number" in 7b
As the contents of the dictionary, for example, "identificati
found for the text string "on number"
Item number of FIG. 5 in the word "number"
With the co-occurrence information such as the registered content of "[1]",
The word "number" has been learned and retained.
"The number of comp, which appeared later
For the character string "uter terminals"
Co-occurrence information such as the registered content of item number “[2]” in FIG.
The word "number" was both learned and retained as a translation.
, It is the translation with the larger value of “frequency meter”
The word “number” is set as the “learning default translation”
"The numberer that occurs in the original text again
"the nu" in "of terminals"
The word "number" is used as a translation for "mber".
It is guaranteed that the leaves will be output. In this example, co-occurrence
As learning information, describe the usage of the original word at the time of selection.
By remembering, even if the default learning translation changes
We try to guarantee the effect of the last choice. On this occasion
In this specific example, in order to simplify the process, the word
Should be memorized as the usage (co-occurrence with other words)
The patterns are limited. Be limited in this way
Also, the types of patterns that have been limited are merely examples of the present invention.
Since it is only an embodiment, it is described as processing speed and learning dictionary.
It can be implemented in various forms depending on the storage capacity. Also,
In this example, the entire original document is treated as one range,
The frequency was counted, but it was "parting chapters of original document" and "parting sections".
It is also possible to adjust the frequency recording by setting a delimiter such as "re"
Noh. By doing this, for example,
If the content is different and the desired translation is different, "
Is effective when As described above, this system is
To convert the original text of the first language in natural language into the second language
Using the knowledge information of the dictionary section that has the knowledge information of
To convert the original sentence word string to the second language word string
In the translation device adapted to perform the translation process,
In the dictionary part, as knowledge information, for each headword of the first language
Default translations provided in (the highest priority without learning)
(Translated word) and translated word with the highest usage record
Learning default translation and co-occurrence information registered by translation
More updatable learning dictionaries containing news and frequency information
Configured by holding and output the translation result of the translation unit
And an output unit based on the contents of the learning dictionary
Select and operate the desired translation word in the translation word candidate output to
When you make it, the translation in the translation section based on the selection instruction content
The translation selection part that selects and indicates the translation to be used for
Based on the content of the selection instruction,
Update learning information including co-occurrence information and frequency information
The translation with the most information is updated as the learning default translation.
The learning control unit is provided. And enter
Enter the sentence and word string of the natural language which is the first language from Rikibu
If you type, the input data will be sent to the translation department, which will
The translation result is processed using the knowledge in the writing department and the translation result is
Output to the output section. Start editing process for translation result
The translation word selection unit obtains translation word candidates from the learning dictionary for editing.
Displayed in the output section, and the user selects this candidate from the input section.
When you select the target word from the
The replacement is done. On the other hand, within the selection based on the translation selection operation
The content is also sent from the translated word selection unit to the learning control unit, and the learning control unit
Then, in addition to the translation selection contents this time, it is generated in the translated sentence.
If the user did not select a translation,
Record information about the learning dictionary. The content to record is
Basically, if the entry word and learning contents are empty,
Co-occurrence, selected translation, and co-occur in source text
There are four types of words (the target is defined by the part of speech / syntax)
You. Each time a different selection is made for the same headword,
Your selections will be recorded and the translation process will be
The relevant headword that occurs within the range of the document that has been edited
Regarding, the frequency for each type of translation is also recorded.
Originally one translated word from the learning translation group for the relevant headword
Is selected and recorded as a learning default translation in the learning dictionary.
You. In the translation process in the translation section, when determining the translation word
, Refer to the learning dictionary, but the sentence to be newly translated is
Match any of the translation condition selection conditions recorded in the dictionary
If it does, the translation selected under that condition
Determined as the translation of the sentence, the headwords match, but the co-occurrence
If they do not match, the learning default translation is determined as the translation.
Set. As a result of applying such processing,
Even if a translation word that conflicts with the headword is selected,
By making the co-occurrence a condition without being invalidated,
All can be used as learning knowledge for subsequent translations
You. Furthermore, the usage of words depends on the co-occurrence information in the learning dictionary.
For translations in new sentences that do not match the
Based on the translated word frequency information, the
Also estimated the translated word with a high expected value and used this as the default translated word.
The user's desired translation can be stored
Probability of getting results is high
It will be possible to reduce.
【発明の効果】上述したように、本発明は、原文を所望
言語の文章に翻訳するにあたり、共起学習情報として、
選択時の原文の単語の用いられ方を記憶することによ
り、デフォルト学習訳語が変化しても過去の選択結果の
効果は保証されるようにしたので、ユーザが訳語選択を
重ねることにより、相反する内容の選択がされても、時
間的に前の選択結果が無効になることもなく、過去の選
択結果は、後の翻訳においても保証される。かつ、特に
原文の単語の使われ方が過去の学習結果に一致しないと
きには、頻度的にもっとも期待値の高い訳語を学習結果
として反映するため、ユーザの後編集作業を軽減するこ
とができる。また、従来は、ユーザがとくに考慮せずに
行った「訳語選択」による学習結果が、別の文で悪い影
響をするということがあったが、本発明によれば、その
影響をいちいち考慮して使わなければいけないという煩
わしさからも開放される。従って、本発明によれば、相
反する学習内容も生かし、後の翻訳において最も期待値
の高い訳語を反映でき、結果としてユーザの訳語選択・
後編集の手間を軽減することができるようにした機械翻
訳方法を提供することができる。As described above, according to the present invention, when translating an original sentence into a sentence in a desired language, as co-occurrence learning information,
By storing the usage of the original word at the time of selection, even if the default learning translation changes, the effect of the past selection result is guaranteed, so that the user repeats the translation selection Even if the contents are selected, the previous selection result is not invalidated in time, and the past selection result is guaranteed in the later translation. Moreover, especially when the usage of the word in the original sentence does not match the past learning result, the translated word having the highest expected value is reflected as the learning result in frequency, so that the post-editing work of the user can be reduced. Further, conventionally, the learning result by “translated word selection” performed by the user without particular consideration may have a bad influence on another sentence, but according to the present invention, the influence is considered one by one. It also frees you from the hassle of having to use it. Therefore, according to the present invention, the contradictory learning content can be used, and the translated word with the highest expected value can be reflected in the subsequent translation, and as a result, the user can select the translated word.
It is possible to provide a machine translation method capable of reducing the trouble of post-editing.
【図1】本発明の一具体例にかかわる機械翻訳システム
の全体構成を示すブロック図。FIG. 1 is a block diagram showing the overall configuration of a machine translation system according to a specific example of the present invention.
【図2】図1の構成の機械翻訳システムの制御部での対
話翻訳時の処理の流れを示すフローチャート。FIG. 2 is a flowchart showing the flow of processing during dialogue translation in the control unit of the machine translation system configured as shown in FIG.
【図3】図1の構成の機械翻訳システムの訳語選択部に
おける処理の流れを示すフローチャート。FIG. 3 is a flowchart showing a processing flow in a translation word selection unit of the machine translation system configured as shown in FIG.
【図4】図1の構成の機械翻訳システムにおいてユーザ
の訳語選択処理をガイドする画面の一例を示す図。FIG. 4 is a diagram showing an example of a screen which guides a user's translation word selection processing in the machine translation system configured as shown in FIG.
【図5】図1の構成の機械翻訳システムの学習辞書部の
保持情報内容の一例を示す図。FIG. 5 is a diagram showing an example of contents of information held in a learning dictionary section of the machine translation system having the configuration of FIG. 1.
【図6】図1の構成の機械翻訳システムの翻訳部におけ
る翻訳処理の流れを示すフローチャート。6 is a flowchart showing a flow of translation processing in a translation unit of the machine translation system having the configuration of FIG.
【図7】図1の構成の機械翻訳システムの翻訳部におけ
る学習辞書部との照合処理の流れを示すフローチャー
ト。FIG. 7 is a flowchart showing the flow of collation processing with the learning dictionary unit in the translation unit of the machine translation system configured as shown in FIG.
【図8】図1の構成の機械翻訳システムの翻訳部におけ
る学習辞書部の更新の処理の流れを示すフローチャー
ト。8 is a flowchart showing the flow of processing for updating the learning dictionary unit in the translation unit of the machine translation system configured as shown in FIG.
1…入力部 2…訳語選択部 3…学習制御部 4…出力部 5…制御部 6…翻訳部 6a…学習内容選択手段 7…辞書部 7a…語粟部 7b…学習辞書部 7c…形態素解析規則 7d…構文・意味解析規則 7e…変換規則 7f…構文生成規則 7g…形態素生成規則。 DESCRIPTION OF SYMBOLS 1 ... Input part 2 ... Translation selection part 3 ... Learning control part 4 ... Output part 5 ... Control part 6 ... Translation part 6a ... Learning content selection means 7 ... Dictionary part 7a ... Word graze part 7b ... Learning dictionary part 7c ... Morphological analysis Rule 7d ... Syntax / semantic analysis rule 7e ... Conversion rule 7f ... Syntax generation rule 7g ... Morphological generation rule.
Claims (2)
1言語による自然言語文を第2の言語に変換するための
知識情報を保持する辞書手段の知識情報を用いて第1言
語の単語列を前記第2の言語の単語列に変換する翻訳ス
テップと、 前記翻訳ステップにおける翻訳結果を出力する出力ステ
ップと、 訳語の選択をするための訳語選択ステップと、 この訳語選択ステップによる訳語選択の内容に基づいて
見出し語と訳語の関係が相反する複数の選択内容、およ
び1つの見出し語に対する最後の選択以前の選択内容を
学習可能とすると共に、以後の翻訳において有効とすべ
く前記辞書手段の学習辞書内容を制御する学習制御ステ
ップと、を具備することを特徴とする翻訳方法。1. An input step for inputting characters, and a learning dictionary for holding learning information, and holding knowledge information for converting the input natural language sentence in the first language into a second language. A translation step of converting the word string of the first language into the word string of the second language by using the knowledge information of the dictionary means, an output step of outputting the translation result in the translation step, and selecting a translated word It is possible to learn the translation word selection step of, and a plurality of selection contents in which the relationship between the headword and the translation word is contradictory based on the content of the translation word selection in this translation word selection step, and the selection content before the last selection for one headword. And a learning control step of controlling the contents of the learning dictionary of the dictionary means so as to be effective in the subsequent translation.
1言語による自然言語文を第2の言語に変換するための
知識情報を保持する辞書手段の知識情報を用いて第1言
語の単語列を前記第2の言語の単語列に変換すると共
に、この変換には前記学習辞書の内容を用いて、ある文
のある語に対する最も期待値の高い学習内容を反映させ
るようにした翻訳ステップと、 前記翻訳ステップにおける翻訳結果を出力する出力ステ
ップと、 訳語の選択をするための訳語選択ステップと、 この訳語選択ステップによる訳語選択の内容に基づいて
見出し語と訳語の関係が相反する複数の選択内容、およ
び1つの見出し語に対する最後の選択以前の選択内容を
学習可能とすると共に、以後の翻訳において有効とすべ
く前記辞書手段の学習辞書内容を制御する学習制御ステ
ップと、を具備することを特徴とする翻訳方法。2. An input step for inputting characters, and a learning dictionary for holding learning information, and holding knowledge information for converting the input natural language sentence in the first language into a second language. The word information of the first language is converted into the word string of the second language by using the knowledge information of the dictionary means, and the content of the learning dictionary is used for this conversion, and the most expected word for a sentence is expected. A translation step that reflects the learning content with a high value, an output step that outputs the translation result in the translation step, a translation word selection step for selecting translation words, and a translation word selection content by this translation word selection step. Based on this, it is possible to learn a plurality of selection contents in which the relationship between the headword and the translated word is contradictory, and the selection contents before the last selection for one headword, and in the subsequent translation. In order to an effective translation method characterized by comprising a learning control step for controlling the learning dictionary contents of said dictionary means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02909296A JP3657338B2 (en) | 1996-02-16 | 1996-02-16 | Translation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02909296A JP3657338B2 (en) | 1996-02-16 | 1996-02-16 | Translation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09223146A true JPH09223146A (en) | 1997-08-26 |
JP3657338B2 JP3657338B2 (en) | 2005-06-08 |
Family
ID=12266719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02909296A Expired - Lifetime JP3657338B2 (en) | 1996-02-16 | 1996-02-16 | Translation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3657338B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008226115A (en) * | 2007-03-15 | 2008-09-25 | Toshiba Corp | Machine translation device |
JP2013065222A (en) * | 2011-09-19 | 2013-04-11 | Nec Corp | Selection candidate learning device, translation learning device, selection candidate learning method, and computer program |
JP2014238772A (en) * | 2013-06-10 | 2014-12-18 | 株式会社バイトルヒクマ | Translation system, translation program, and translation method |
JP2014238808A (en) * | 2013-11-22 | 2014-12-18 | 株式会社バイトルヒクマ | Translation system, translation program, and translation method |
JP2019061655A (en) * | 2017-09-25 | 2019-04-18 | 三星電子株式会社Samsung Electronics Co.,Ltd. | Text generation method, device and computer program |
JPWO2021015117A1 (en) * | 2019-07-25 | 2021-01-28 |
-
1996
- 1996-02-16 JP JP02909296A patent/JP3657338B2/en not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008226115A (en) * | 2007-03-15 | 2008-09-25 | Toshiba Corp | Machine translation device |
JP2013065222A (en) * | 2011-09-19 | 2013-04-11 | Nec Corp | Selection candidate learning device, translation learning device, selection candidate learning method, and computer program |
JP2014238772A (en) * | 2013-06-10 | 2014-12-18 | 株式会社バイトルヒクマ | Translation system, translation program, and translation method |
JP2014238808A (en) * | 2013-11-22 | 2014-12-18 | 株式会社バイトルヒクマ | Translation system, translation program, and translation method |
JP2019061655A (en) * | 2017-09-25 | 2019-04-18 | 三星電子株式会社Samsung Electronics Co.,Ltd. | Text generation method, device and computer program |
JPWO2021015117A1 (en) * | 2019-07-25 | 2021-01-28 | ||
WO2021015117A1 (en) * | 2019-07-25 | 2021-01-28 | 京セラドキュメントソリューションズ株式会社 | Data processing system and data processing method |
Also Published As
Publication number | Publication date |
---|---|
JP3657338B2 (en) | 2005-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5826220A (en) | Translation word learning scheme for machine translation | |
EP0692765B1 (en) | Text preparing system using knowledge base and method therefor | |
US5140522A (en) | Method and apparatus for machine translation utilizing previously translated documents | |
US5721938A (en) | Method and device for parsing and analyzing natural language sentences and text | |
EP0247395B2 (en) | Machine translation system | |
CN111144093B (en) | Intelligent text processing method and device, electronic equipment and storage medium | |
JPH09223146A (en) | Translating method | |
JPS58192173A (en) | System for selecting word used in translation in machine translation | |
CN100390784C (en) | Information processing apparatus and method, and recording medium containing information processing program stored therein | |
JPH07325826A (en) | Japanese language processing system | |
JP2838984B2 (en) | General-purpose reference device | |
JPH06348751A (en) | Language converter | |
JPS61260366A (en) | Mechanical translating system having learning function | |
JP4043176B2 (en) | Natural language processing device | |
JP3034295B2 (en) | Machine translation method and machine translation device | |
JPH0916597A (en) | Sentence elaboration device and method therefor | |
JPH0821038B2 (en) | Electronic dictionary search device | |
JP2000222407A (en) | Device and method for machine translation | |
JP2002183134A (en) | Translating device | |
JP2000057135A (en) | Documentation device | |
JPH0696114A (en) | Machine translation system and document editor | |
Schwall et al. | From METAL to T1: systems and components for machine translation applications | |
JPH0773185A (en) | Machine translation system and method therefor | |
JPH07191995A (en) | Machine translation device | |
JPH0225973A (en) | machine translation device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040323 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050309 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080318 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090318 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100318 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100318 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110318 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120318 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130318 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140318 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |