JP2004062726A - Translation device, translation method, program and recording medium - Google Patents
Translation device, translation method, program and recording medium Download PDFInfo
- Publication number
- JP2004062726A JP2004062726A JP2002222772A JP2002222772A JP2004062726A JP 2004062726 A JP2004062726 A JP 2004062726A JP 2002222772 A JP2002222772 A JP 2002222772A JP 2002222772 A JP2002222772 A JP 2002222772A JP 2004062726 A JP2004062726 A JP 2004062726A
- Authority
- JP
- Japan
- Prior art keywords
- expression
- translation
- source language
- semantic distance
- bilingual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 339
- 238000000034 method Methods 0.000 title claims description 83
- 230000014509 gene expression Effects 0.000 claims abstract description 605
- 238000012545 processing Methods 0.000 claims description 24
- 230000014616 translation Effects 0.000 description 235
- 238000010586 diagram Methods 0.000 description 13
- 241000700159 Rattus Species 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 241000282326 Felis catus Species 0.000 description 5
- 238000010411 cooking Methods 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 2
- 101100181396 Mus musculus Laptm5 gene Proteins 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000004886 process control Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、入力された翻訳元言語である原言語による文を、翻訳先言語である目的言語による文に翻訳して出力する機械翻訳や、入力された原言語のキーワードから目的言語のドキュメントを検索する言語間検索システムなど、ある言語から別の言語への語句の翻訳を、機械的に実行する翻訳装置に関する。
【0002】
【従来の技術】
従来、原言語による表現を入力とし、目的言語による表現に機械的に翻訳して出力する機械翻訳の方式として、原言語表現の形態素解析、構文解析などの意味解析の結果に対して、翻訳の仕方を定めた翻訳規則を蓄積し、翻訳規則に基づいて入力文の翻訳を行う規則ベース翻訳方式(以下、「第一の従来例」という)が知られている。
【0003】
第一の従来例の動作を簡単に説明すると、原言語の入力文が入力されると、まず、形態素解析、構文解析などの言語解析が行われ、次に、意味解析の結果に対して、翻訳規則が適用されて、目的言語に置き換えられる。
【0004】
最後に、置き換え結果を、目的言語の文として生成して出力する。
【0005】
しかしながら、翻訳規則は、適用可能範囲が翻訳規則の適用条件によって限定されているため、入力される表現に網羅的に対応するには、入力される表現を網羅する膨大な翻訳規則が必要であった。
【0006】
そこで、機械翻訳の方式として、原言語表現と、該原言語表現に対応する予め人手などによって作成された、目的言語表現の訳の組を用例として蓄積し、入力に完全に一致する用例が存在する場合には、対応する訳を出力し、入力に完全一致する用例が存在しない場合でも、入力に類似する用例を特定し、該特定された用例を参照して、入力の翻訳を行う翻訳方式が提案されている。
【0007】
この種の従来の翻訳方式に関する刊行物として、例えば特許第2609173号(以下、「第二の従来例」という)が参照される。図14は、第二の従来例の構成を示す図である。図14を参照すると、第二の従来例は、原言語の入力表現を入力する入力部121と、原言語表現と、その翻訳である目的言語表現の組を蓄積した用例記憶部122と、原言語表現間の意味距離を計算する原言語意味距離計算部123と、原言語意味距離計算部123を利用して入力に最も意味距離が近い用例を類似用例として特定する類似用例特定部124と、特定された類似用例を用いて翻訳を行う翻訳部125と、翻訳された目的言語表現を出力する出力部126と、を備える。
【0008】
次に、図14を参照して、第二の従来例の動作について説明する。以下では、日本語の文を英語に翻訳する場合について説明する。
【0009】
入力部121に、「東京での会議」が入力されたとする。
【0010】
すると、類似用例特定部124が、原言語意味距離計算部(原言語シソーラス)123を参照して、用例記憶部122から、入力文(「東京での会議」)に類似する、原言語表現に対する用例を選択する。
【0011】
例えば、用例に、
「京都での滞在→stay in Kyoto」(入力との類似度0.4)、
「京都での会議→conference in Kyoto」(入力との類似度1.0)
がある場合、
より類似度の高い
「京都での会議→conference in Kyoto」
が選択される。
【0012】
次に、「京都での会議」に対する訳”conference in Kyoto”を利用して、入力に対する翻訳として”conference in Tokyo”を出力する。
【0013】
【発明が解決しようとする課題】
しかしながら、上記第二の従来例では、翻訳時に類似用例を参照するため、以下のような翻訳誤りが生じる可能性がある。
【0014】
上記第二の従来例では、類似用例からは訳語が決定されない入力表現中の一部分に関し、誤った訳語が選択される可能性がある。まず、以下の用例が存在しているとする。
【0015】
E0: I serve the master → 私は主人に仕える
E1: I serve a pie → 私はパイを出す
【0016】
また、”dish”の訳語としては「皿」(第一訳語)、「料理」(第二訳語)があるとする。
【0017】
ここで、以下の英語表現を日本語に翻訳する場合について説明する。
【0018】
I1: I serve a dish.
【0019】
上記第二の従来例では、原言語シソーラスを使って入力に最も意味距離の近い原言語表現に対する用例を求めている。シソーラスとは、単語を意味的に分類して木構造にしたもので、具体例を図10に示す。シソーラスを用いた単語間の意味距離とはおよそ、意味距離を求める各単語がシソーラス上で属するノード間の距離である。
【0020】
ここで、意味距離計算に、図10のシソーラスを参照すると、(01)(02)いずれかの”dish”と、(04)の”master”の意味距離よりも、(01)の”dish”と(03)の”pie”の意味距離の方が短いため、参照する用例としては、E1が選ばれる。
【0021】
次に、入力の”I served 〜”の部分に関しては、この用例E1から「私は〜を出す」と訳を求めることが出来るが、複数の訳語を持つ”dish”の訳語選択時には、用例E1は用いられず、例えば、この訳語選択に第一訳語を利用するならば、”dish”の訳語として「皿」が選択され、「私は皿を出す」と、誤った翻訳を行ってしまう問題がある。
【0022】
また、上記第二の従来例では、用例の原言語表現の取りうる意味が複数あった場合、誤った用例が参照される可能性がある、という問題もある。
【0023】
まず、以下の用例が存在していたとする、
【0024】
E2: I keep a mouse → 私はネズミを飼っている
E3: I keep a knife → 私はナイフを持っている
【0025】
また、”mouse”には、ネズミ(動物)の意味と、マウス(パソコン周辺機器)の意味があるとする。
【0026】
ここで、以下の英語表現を日本語に翻訳する場合について説明する。
【0027】
I2: I keep a keyboard.
【0028】
図10の原言語シソーラスを参照すると、”mouse”は動物の意味の位置(05)とパソコン周辺機器の意味の位置(06)の複数箇所に表れる。
【0029】
上記第二の従来例では、(05)(06)のいずれかの”mouse”と”knife”(08)の距離よりも、パソコン周辺機器としての”mouse”(06)と”keyboard”(09)の距離の方が近いため、用例E2が入力と意味的に近いと誤って判定され、上記入力が「私はキーボードを飼っている」と翻訳されてしまう、という問題がある。
【0030】
一方、上記第一の従来例の問題点に対する別のアプローチとしては、翻訳規則から意味的に類似する翻訳規則を自動生成する方法が考えられる。しかしながら、この方法において、上記第二の従来例と同様に、単純に原言語の意味距離を用いて類似規則を生成したとすると、誤った類似規則を生成する可能性がある。例えば、英語から日本語への以下に示されるような翻訳規則から類似規則を生成することを考える。
【0031】
R1: (feed (OBJ mouse))→(餌を与える (に ネズミ))
【0032】
R1は、”feed”という単語のOBJECT(オブジェクト)のスロットに、”mouse”という単語が存在するとき、”feed”を「餌を与える」、”mouse”を「ネズミ」と変換し、単語「ネズミ」に助詞の「に」をつける、という翻訳規則である。
【0033】
図10のシソーラスを参照すると、”mouse”には動物の意味(05)とパソコン周辺機器の意味(06)があり、各々の意味に対して類義語が存在する。もし、パソコン周辺機器の意味(06)の類義語により類似規則を生成すると、以下のような誤った規則が生成されてしまう(”×”は、不可(NG)を表す)。
【0034】
×(feed (OBJ keyboard))→(餌を与える (に キーボード))
×(feed (OBJ modem))→(餌を与える (に モデム))
【0035】
更に、正しく動物の意味(05)で類似規則を生成したとしても、元となる翻訳規則R1の”mouse”の置き換え先の単語に対する訳語を選択する必要があるが、その訳語選択に失敗する可能性がある。
【0036】
規則R1の”mouse”を以下のように同じく動物の”seal”(アザラシ)に置き換えた場合について説明する。「???」は訳語が未決定であることを示す。
R1’: (feed (OBJ seal))→(餌を与える (に ???))
【0037】
ここで、”seal”には「印章」(第一訳語)「アザラシ」(第二訳語)の二つの訳語が存在する。類似規則R1’の”seal”の訳語選択に、例えば第一訳語を選択するならば、以下のような誤った類似規則が生成される。
【0038】
× (feed (OBJ seal))→(餌を与える (に 印章))
【0039】
したがって、本発明は、上記問題点に鑑みて創案されたものであって、その主たる目的は、より高い精度で翻訳を行うことの出来る、翻訳装置及び方法とプログラム並びに記録媒体を提供することにある。
【0040】
【課題を解決するための手段】
上記課題を解決するための手段を提供する本発明は、原言語の表現を入力し目的言語の表現に変換して出力する翻訳処理において、目的言語側の意味距離を用いることを特徴としている。
【0041】
本発明の一つのアスペクトに係る装置は、原言語の表現(「原言語表現」と略記される)を入力し目的言語の表現(「目的言語表現」と略記される)に変換して出力する翻訳装置において、原言語表現と前記原言語表現に対応する目的言語表現の組からなる対訳表現を格納した対訳表現記憶手段と、原言語表現間の意味距離を計算する原言語意味距離計算手段と、目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、前記原言語意味距離計算手段を制御して、入力表現に最も類似する対訳表現を特定する類似対訳表現特定手段と、特定された対訳表現を用いて、前記入力表現の翻訳を行う対訳表現適用手段と、前記目的言語意味距離計算手段を制御して、前記対訳表現適用手段で訳語が決定しない部分の訳語を選択する追加訳語選択手段と、を備えている。
【0042】
本発明の別のアスペクトに係る装置は、原言語表現を入力し目的言語表現に変換して出力する翻訳装置において、原言語表現間の意味距離を計算する原言語意味距離計算手段と、目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、原言語表現と対応する目的言語表現が与えられた時、前記原言語意味距離計算手段と前記目的言語意味距離計算手段とを用いて、前記原言語表現の意味の曖昧性を解消する意味特定手段と、を備えている。
【0043】
本発明の別のアスペクトに係る装置は、原言語表現を目的言語表現に変換する翻訳装置において、原言語表現と対応する目的言語表現の組からなる対訳表現を格納した対訳表現記憶手段と、原言語表現間の意味距離を計算する原言語意味距離計算手段と、目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、対訳表現中の原言語表現と対応する目的言語表現から、前記原言語意味距離計算手段と前記目的言語意味距離計算手段とを用いて、対訳表現の原言語表現の意味の曖昧性を解消する規則意味特定手段と、前記原言語意味距離計算手段を制御して、前記規則意味特定手段により特定された対訳表現の原言語表現の意味に基づいて、入力表現に最も類似する対訳表現を特定する対訳表現特定手段と、前記対訳表現特定手段で特定された対訳表現を用いて、入力表現の翻訳を行う翻訳手段と、を備えている。
【0044】
本発明の別のアスペクトに係る装置は、原言語表現を入力し目的言語表現に変換して出力する翻訳装置において、原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶手段と、原言語表現間の意味距離を計算する原言語意味距離計算手段と、目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、前記原言語意味距離計算手段と前記目的言語意味距離計算手段を制御して、前記対訳表現記憶手段中の各対訳表現の原言語表現の意味の曖昧性を解消する対訳表現意味特定手段と、前記原言語意味距離計算手段を制御して、入力表現に最も類似する対訳表現を特定する類似対訳表現特定手段と、特定された対訳表現を基に入力表現の翻訳を行う翻訳手段と、変換された目的言語表現を出力する出力手段と、を備えている。
【0045】
上記課題を解決する本発明に係る方法は、その1つのアスペクトにおいて、原言語の表現を入力し目的言語の表現に変換して出力する翻訳処理を、入力部と出力部を含むコンピュータを用いて行う翻訳方法において、前記入力部から原言語の表現を入力するステップと、原言語表現間の意味距離を計算する処理を制御して、原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶部から、前記入力された表現に最も類似する原言語表現に対する対訳表現を特定するステップと、前記特定された対訳表現を用いて入力された前記原言語の表現の翻訳を行うステップと、目的言語表現間の意味距離を計算する処理を制御して、前記翻訳を行うステップで訳が決定されなかった入力表現中の単語の訳を決定するステップと、翻訳結果を前記出力部から出力するステップと、を含む。
【0046】
上記課題を解決する本発明に係るプログラムは、その1つのアスペクトにおいて、原言語の表現を入力し目的言語の表現に変換して出力する翻訳処理を、入力部と出力部を含むコンピュータに実行させるプログラムにおいて、前記入力部から原言語の表現を入力する処理と、原言語表現間の意味距離を計算する処理と、目的言語表現間の意味距離を計算する処理と、前記原言語表現間の意味距離を計算する処理を制御して、原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶部から、前記入力された表現に最も類似する原言語の表現に対する対訳表現を特定する処理と、前記特定された対訳表現を用いて前記入力表現の翻訳を行う処理と、前記目的言語表現間の意味距離を計算する処理を制御して、前記入力表現の翻訳を行う処理で訳が決定されなかった入力表現中の単語の訳を決定する処理と、翻訳結果を前記出力部から出力する処理と、を前記コンピュータに実行させるプログラムよりなる。前記プログラムは記録媒体に格納される。
【0047】
本発明は、目的言語表現間の意味距離計算によって対訳表現の原言語表現の意味の曖昧性を解消して類似対訳表現の特定をより正しく行う機構や、選択された対訳表現の原言語表現に与えられた訳に意味的に近くなるように入力文の訳を選択する機構を備えることを特徴とする。これにより、より高い精度で翻訳処理を行えるようになるという作用効果が得られる。
【0048】
【発明の実施の形態】
本発明の実施の形態について図面を参照して説明する。
【0049】
[実施の形態1]
本発明の第1の実施の形態について説明する。図1は、本発明の第1の実施の形態の構成を示す図である。図1を参照すると、本発明の第1の実施の形態の装置は、原言語の入力文を入力する入力部11と、原言語の表現(単に「原言語表現」という)と原言語表現に対応する、目的言語の表現(単に「目的言語表現」という)の対を記憶した対訳表現記憶部12と、原言語表現間の意味距離を計算する原言語意味距離計算部13と、原言語意味距離計算部13を利用して入力に最も類似する原言語表現に対する対訳表現を特定する類似対訳表現特定部14と、目的言語表現間の意味距離を計算する目的言語意味距離計算部15と、特定された対訳表現を基に、入力文の翻訳を行う翻訳部16と、変換された目的言語表現を出力する出力部17と、を備える。
【0050】
翻訳部16は、特定された対訳表現から決定できる訳を決定する対訳表現適用部161と、対訳表現適用部で決定されなかった入力中の部分の訳語を目的言語意味距離計算部15を利用して決定する追加訳語選択部162と、を含む。
【0051】
上記構成において、入力部11、対訳表現記憶部12、原言語意味距離計算部13、類似対訳表現特定部14に関しては、第一の従来例で用いられている入力部121、用例記憶部122、原言語意味距離計算部123、類似用例特定部124と同様の構成の公知のものが用いられる。また、対訳表現適用部161は、従来の翻訳部と同様の公知の構成とされる。
【0052】
目的言語意味距離計算部15は、目的言語の単語同士の意味距離を計算する。
【0053】
追加訳語選択部162は、対訳表現適用部161で、訳が決定されなかった入力表現中の単語の訳語を、目的言語意味距離計算部15を利用して選択する。追加訳語選択部162では、例えば、前記単語の各訳語候補のうち、前記単語に対応する前記対訳表現中の単語に割り振られた訳と、目的言語の意味距離が近くなる訳語を選択する。
【0054】
次に、図2は、本発明の第1の実施の形態の動作を説明するためのフローチャートである。図1及び図2を参照して、本発明の第1の実施の形態の動作について説明する。
【0055】
まず、入力部11に入力表現が入力されると(ステップ201)、類似対訳表現特定部14が原言語意味距離計算部13を制御して対訳表現記憶部12から入力表現に最も類似する原言語表現に対する対訳表現を特定する(ステップ202)。
【0056】
次に、対訳表現適用部161が特定された対訳表現を用いて、原言語の入力表現の翻訳を行う(ステップ203)。
【0057】
追加訳語選択部162は目的言語意味距離計算部15を制御して、対訳表現適用部161では、訳が決定されなかった、原言語の入力表現中の単語の訳を決定する(ステップ204)。
【0058】
最後に、翻訳結果を出力部から出力する(ステップ205)。
【0059】
この実施の形態において、原言語意味距離計算部13と、類似対訳表現特定部14と、目的言語意味距離計算部15と、翻訳部16の各処理と、入力部11と出力部17の入出力制御は、好ましくは、コンピュータで実行されるプログラムにより実現される。この場合、該コンピュータにおいて、該プログラムを記憶したコンピュータで機械読み出し可能な記憶媒体から該プログラムを読み出して該コンピュータの主記憶にロードして実行するか、該プログラムをネットワークを介してコンピュータにダウンロードし実行することで、本発明の第1の実施の形態の装置が実現される。以下の実施の形態でも同様である。
【0060】
[実施例1]
次に、上記した本発明の第1の実施の形態についてさらに詳細に説明すべく、具体例(実施例)に即してその動作を説明する。なお、本実施例の構成は、前記第1の実施の形態と同一である。以下では、英語から日本語への翻訳について説明する。
【0061】
図1の対訳表現記憶部12には以下の対訳表現が存在しているとする。
【0062】
E0: I serve the master → 私は主人に仕える
E1: I serve a pie → 私はパイを出す
【0063】
また、”dish”の訳語としては、
「皿」(第一訳語)、
「料理」(第二訳語)
があるとする。
【0064】
ここで、入力表現としては、以下が与えられたとする。
【0065】
I1: I serve a dish.
【0066】
入力部11から、英語表現I1が入力されると、類似対訳表現特定部14が、原言語意味距離計算部13を制御して、対訳表現記憶部12から、入力表現I1に意味的に近い原言語に対する対訳表現を特定する。
【0067】
図10に例示したシソーラスを参照すると、(01)(02)いずれかの”dish”と”master”(04)の距離より、”dish”(01)と”pie”(03)の距離の方が近いため、参照する対訳表現としては、E1が選択される。
【0068】
次に、対訳表現適用部161において、入力表現中の”I serve 〜”の部分に対しては、従来の翻訳装置と同様に対訳表現E1を参照して、「私は〜を出す」と訳が特定される。
【0069】
次に、対訳表現E1からは訳語が決定されなかった入力表現中の単語の”dish”の訳語を選択する。”dish”は訳語として、「皿」と「料理」を持つが、追加訳語選択部162が、目的言語意味距離計算部15を制御して、入力表現I1の”dish”に対応する対訳表現E1中の単語である”pie”に対する訳語の「パイ」と”dish”の各訳語の意味距離を計算する。
【0070】
図11のシソーラスを参照すると、「パイ」(01)と皿(03)の距離より「パイ」(01)と料理(02)の距離の方が近いため、訳語「料理」が選択される。最後に、翻訳部において、上記特定された対訳表現と、上記選択された”dish”の訳語を用いて、入力に対する翻訳として以下を生成し、出力部17から出力する。
私は料理を出す。
【0071】
原言語意味距離計算部13、目的言語意味距離計算部15に関して、本実施例ではシソーラスを用いたが、大規模コーパスから得られる言語情報、例えば単純な単語共起頻度情報、または相互情報量などの統計計算の情報、それらの組み合わせ、およびその他の言語情報を用いても良い。
【0072】
また対訳表現とは、[従来の技術]で説明した上記第一の従来例における用例のように、原言語の文・句・単語と、対応する目的言語の文・句・単語の組でもよいし、[従来の技術]で説明した上記第二の従来例における翻訳規則でもよいし、または原言語表現に対して何らかの意味解析を行った結果と、対応する目的言語表現に対して何らかの意味解析を行った結果の組でもよい。
【0073】
以上説明したように、本実施例においては、上記第一の従来例では正しく決定されなかった可能性のある、対訳表現からは直接に訳語が決定されない入力表現中の一部分に関して、目的言語の意味距離を用いた制約により、より正確に訳語の決定が行われる、という作用効果を持つ。
【0074】
[実施の形態2]
図3を参照して、本発明の第2の実施の形態について説明する。本発明の第2の実施の形態は、原言語の入力表現を入力する入力部31と、原言語表現とその翻訳である目的言語表現の対を記憶した対訳表現記憶部32と、原言語表現間の意味距離を計算する原言語意味距離計算部33と、目的言語表現間の意味距離を計算する目的言語意味距離計算部34と、原言語意味距離計算部33、目的言語意味距離計算部34を利用して、対訳表現記憶部32中の各対訳表現の原言語表現の意味の曖昧性を解消する対訳表現意味特定部35と、各対訳表現中の特定された原言語表現の意味に基づいて入力に最も類似する原言語表現に対する対訳表現を特定する類似対訳表現特定部36と、特定された対訳表現を基に入力表現の翻訳を行う翻訳部37と、変換された目的言語表現を出力する出力部38と、を備える。
【0075】
上記構成において、入力部31、対訳表現記憶部32、原言語意味距離計算部33、類似対訳表現特定部36、出力部38は、前記第1の発明の実施の形態における入力部11、対訳表現記憶部12、原言語意味距離計算部13、類似対訳表現特定部14、出力部17と同様である。翻訳部37は、本発明の第1の発明の実施の形態と同様に、対訳表現適用部(図1の161)と、追加訳語選択部(図1の162)を含んでも良い。あるいは、翻訳部37は、上記した第一の従来例の翻訳部と同様であっても良い。
【0076】
対訳表現意味特定部35は、対訳表現記憶部32中の各対訳表現について、原言語表現に意味の曖昧性がある場合は、原言語表現に与えられた訳から、原言語意味距離計算手段33、目的言語意味距離計算手段34を用いて意味の特定を行う。
【0077】
次に図4、図5は、本発明の第2の実施の形態の動作を説明するためのフローチャートである。図3乃至図5を参照して、本発明の第2の実施の形態の動作について説明する。
【0078】
まず、予め対訳表現記憶部32中の各対訳表現について、原言語表現に意味の曖昧性のある場合は、対訳表現意味特定部35において、原言語意味距離計算部33、目的言語意味距離計算部34を用いて、原言語表現に与えられた訳から意味の曖昧性を解消しておく(ステップ401)。
【0079】
図5は、ステップ401の詳細を説明するためのフローチャートである。
【0080】
各対訳表現に対し(ステップ501)、原言語表現中で意味を複数持つ単語WEを特定し(ステップ502)、原言語意味距離計算部33を利用して単語WEの各意味miに対する前記単語の類義語を求め、集合S1iを作る(ステップ503)。
【0081】
次に各iに対し、S1i中の各単語の訳語を求め、集合S2iを作る(ステップ504)。
【0082】
次に、注目している対訳表現で単語WEに与えられた訳語WJと集合S2iとの意味距離を求め(ステップ505)、WJと最も距離の近い集合に対応する意味がこの対訳表現での単語WEの意味となる。
【0083】
その後、入力部に入力表現が入力されると(ステップ402)、類似対訳表現特定部36が、原言語意味距離計算部33を制御して、対訳表現記憶部32から入力表現に最も類似する原言語に対する対訳表現を特定する(ステップ403)。
【0084】
ここでは、予め対訳表現意味特定部によって対訳表現の原言語表現の意味の曖昧性が解消されているため、意味的に入力表現と食い違った対訳表現が特定されることはない。
【0085】
次にステップ403で特定された対訳表現から入力表現を翻訳する(ステップ404)。
【0086】
最後に、翻訳結果を出力部から出力する(ステップ405)。
【0087】
この実施の形態において、原言語意味距離計算部33と、目的言語意味距離計算部34と、対訳表現意味特定部35と、類似対訳表現特定部36と、翻訳部37の各処理と、入力部31と出力部38の処理制御は、好ましくは、コンピュータで実行されるプログラムによって実現される。
【0088】
[実施例2]
次に、具体的な動作例(実施例2)を参照して説明する。以下では、第2の実施の形態において、英語から日本語への翻訳について説明する。
【0089】
本発明の第2の実施例では、予め、図3の対訳表現記憶部32中の各対訳表現の原言語表現の意味の曖昧性解消を行う。以下では原言語意味距離計算部33での処理に、図10に例示したシソーラスを用い、目的言語意味距離計算部34での処理に、図11に例示したシソーラスを用いるものとする。
【0090】
例として、以下の対訳表現を挙げる。
【0091】
E2: I keep a mouse → 私はネズミを飼っている。
【0092】
”mouse”には、動物のネズミの意味(m1,図10での(05))と、パソコン周辺機器のマウスの意味(m2,図10での(06))がある (ステップ502)。
【0093】
原言語意味距離計算部を利用して、これら2つの意味それぞれの類義語を求め、集合S1iを作る(ステップ503)。
【0094】
S11:(dog, cat, cow, rat)
S12:(keyboard, display, modem)
【0095】
次に、各S1iについて、S1i中の各単語の訳語を求め、集合S2iを作る(ステップ504)
【0096】
S21:(犬,猫,牛,ラット)
S22:(キーボード,ディスプレー,モデム)
【0097】
最後に、対訳表現中で”mouse”に振られた訳「ネズミ」と各集合S21,S22との意味距離を求める(ステップ505)。
【0098】
目的言語W1,W2の意味距離を、dist(W1,W2)と表すと、”mouse”とS21,S22の意味距離は図11のシソーラスを用いて以下のようになる。
【0099】
【0100】
【0101】
この結果、S21との距離の方が近いため、S21に対応する意味である動物のネズミの意味(04)が、この対訳表現における”mouse”の意味となる。
【0102】
ここで、用例記憶部32には、以下の対訳表現が存在したとする。
【0103】
E2: I keep a mouse → 私はネズミを飼っている
E3: I keep a knife → 私はナイフを持っている
【0104】
また入力表現として、以下が与えられたとする。
【0105】
I2: I keep a keyboard.
【0106】
入力部31から英語表現I2が入力されると、類似対訳表現特定部36が対訳表現記憶部32から最も入力に類似した原言語に対する対訳表現を特定する。
【0107】
この際、上記の対訳表現E2中の原言語表現の”mouse”は動物のネズミの意味(図10における(05))であることが分かっており、しかも”keyboard”(09)と動物の”mouse”(05)の距離は、”keyboard”(09)と”knife”(08)の距離より遠いため、第一の従来例と異なり参照する対訳表現として対訳表現E3が選ばれる。よってI2の翻訳に対訳表現E2を参照して、誤って「私はキーボードを飼っている」と翻訳せずに、対訳表現E3を参照して「私はナイフを持っている」と翻訳できるようになる。
【0108】
対訳表現の意味の特定は、入力表現が与えられた後に行っても、予め行っておいても良い。
【0109】
以上説明したように、本実施例においては、目的言語側の意味距離計算を行って予め各対訳表現の原言語表現の意味の曖昧性を解消しておくことで、第一の従来例では正しく類似対訳表現が特定できなかった場合に関しても、より正確に類似対訳表現を特定できるようになる、という作用効果を有する。
【0110】
[実施の形態3]
本発明は、規則ベース翻訳方式において、翻訳規則から予め類似規則を生成して、入力表現に対する翻訳規則のカバー率を上げる場合にも応用可能である。
【0111】
図6は、本発明の第3の実施の形態の構成を示す図である。図6を参照して、本発明の第3の実施の形態について説明する。本発明の第3の実施の形態は、翻訳規則を入力する翻訳規則入力部61と、原言語表現間の意味距離を計算する原言語意味距離計算部62と、目的言語表現間の意味距離を計算する目的言語意味距離計算部63と、原言語意味距離計算部62、目的言語意味距離計算部63を利用して、入力された翻訳規則の適用条件の原言語表現の意味の曖昧性を解消する規則意味特定部64と、特定された原言語表現の意味に基づいて類似する原言語表現を求め、入力された翻訳規則を前記類似する原言語表現によって置き換えて類似規則を生成する類似規則生成部65と、置き換えた原言語表現に対する訳語を選択する規則中訳語選択部66と、生成された類似規則を出力する出力部67とを備える。
【0112】
上記構成において、原言語意味距離計算部62、目的言語意味距離計算部63は発明の実施の形態2における原言語意味距離計算部33、目的言語意味距離計算部34と同様である。
【0113】
翻訳規則入力部61は、入力された原言語表現が特定の構造を持つ場合、その構造の目的言語への訳し方を定めた翻訳規則を入力する。
【0114】
図7に、原言語が英語、目的言語が日本語の場合の翻訳規則の一例を示す。
【0115】
規則意味特定部64は、発明の実施の形態2における対訳表現意味特定部35と同様の働きを持ち、入力された翻訳規則の適用条件中の原言語表現に意味の曖昧性がある場合は、その翻訳規則で原言語表現に与えられた訳から、原言語意味距離計算手段62、目的言語意味距離計算手段63を用いて意味の特定を行う。
【0116】
類似規則生成部65は、規則意味特定部64によって特定された原言語の意味に基づいて、適用条件の原言語表現を類似表現に置き換えた規則を生成する。
【0117】
図8に、置き換え規則の一例を示す。
【0118】
規則中訳語選択部66は、前記第1の発明の実施の形態における追加訳語選択部162と同様の働きを持ち、置き換えられた類似規則の適用条件中の原言語表現の訳語を、目的言語意味距離計算部63を利用して選択する。ここでは、追加訳語選択部162と同様の方法で、前記原言語表現の各訳語のうち、前記表現に対応する類似規則生成元翻訳規則の適用条件中の表現に振られた訳語と目的言語意味距離が近くなる訳語を選択する。
【0119】
次に、図9は、本発明の第3の実施の形態の動作を説明するためのフローチャートである。図9を参照して、本実施の形態の動作について説明する。
【0120】
まず、翻訳規則入力部61から翻訳規則を入力し(ステップ901)、入力された翻訳規則の適用条件の原言語表現に意味の曖昧性のある場合は、規則意味特定部64において、原言語意味距離計算部62、目的言語意味距離計算部63を用いて、翻訳規則で原言語の表現に与えられた訳から意味の曖昧性を解消する(ステップ902)。
【0121】
意味の曖昧性を解消するステップ902の詳細は、図5のフローチャートと同様であるため、説明の詳細は省略する。
【0122】
次に、類似規則生成部65において、原言語意味距離計算部62を利用して、入力された翻訳規則の適用条件中の原言語表現を意味的に類似した原言語表現に置き換えた類似規則を生成して出力する(ステップ903)。
【0123】
規則中訳語選択部66において、類似規則を受け取り、目的言語意味距離計算部63を利用して、類似規則中の置き換えられた原言語表現に対する訳語を決定する(ステップ904)。
【0124】
最後に、翻訳結果を出力部67から出力する(ステップ905)。
【0125】
この実施の形態において、翻訳規則入力部61と、原言語意味距離計算部62と、目的言語意味距離計算部63と、規則意味特定部64と、類似規則生成部65と、規則中訳語選択部66の各処理と、出力部67の処理制御は、好ましくは、コンピュータで実行されるプログラムによって実現される。
【0126】
[実施例3]
次に、具体的な動作例(実施例3)について説明する。この第3の実施例では、前記第3の実施の形態において、英語から日本語への翻訳規則を入力とし、また、図8の翻訳規則の構造を以下のように簡略に表現することにする。
【0127】
R1: (feed (OBJ mouse))→(餌を与える (に ネズミ))
【0128】
図6の翻訳規則入力部61にR1が入力されると、まず、R1の適用条件中の原言語表現”mouse”がマウス(パソコン周辺機器)とネズミ(動物)という意味の曖昧性を持つため、規則意味特定部64において、図3の対訳表現意味特定部35と同様の曖昧性解消を行い、この翻訳規則における”mouse”の意味が動物のネズミの意味(図10での(05))であると特定する。次に、動物の意味の”mouse”の類似表現を原言語意味距離計算部62を用いて求め、入力された翻訳規則の適用条件中の原言語表現を置き換える。
【0129】
(feed (OBJ mouse))→(餌を与える (に ネズミ))
⇒(feed (OBJ cat))→(餌を与える (に ???))
⇒(feed (OBJ pig))→(餌を与える (に ???))
⇒(feed (OBJ seal))→(餌を与える (に ???))
・・・
【0130】
この時、図6の規則意味特定部64による意味の特定により、”mouse”のもう一つの意味であるパソコン周辺機器のマウス(図10における(06))を用いて以下のような誤った類似規則が生成されるのを防いでいる。
【0131】
×(feed (OBJ keyboard))→(餌を与える (に ???))
×(feed (OBJ modem))→(餌を与える (に ???))
【0132】
次に、翻訳規則の適用条件中の置き換えた原言語表現に対応する訳語を選択する。選択方法は、発明の実施例2の追加訳語選択部162と同様に、元となる翻訳規則の置き換え部(”mouse”)に与えられた訳語(「ネズミ」)と、目的言語の意味距離が近くなるような訳語を選択する。
【0133】
例えば、”seal”に置き換えられた類似規則について考えると、”seal”は「印章」と「アザラシ」という2つの訳語を持つが、例えば図11のシソーラスを参照すると、ネズミ(04)と印章(06)の距離よりネズミ(04)とアザラシ(05)の方が距離が近いため、「アザラシ」が訳語として選択される。
【0134】
(feed (OBJ mouse))→(餌を与える (に ネズミ))
⇒(feed (OBJ cat))→(餌を与える (に ネコ))
⇒(feed (OBJ pig))→(餌を与える (に ブタ))
⇒(feed (OBJ seal))→(餌を与える (に アザラシ))
・・・
【0135】
なお、本実施例において、規則意味特定部64と規則中訳語選択部66のどちらか一方のみを持つ構成としても良い。
【0136】
以上説明したように、本実施例においては、翻訳実行時または翻訳実行前に前処理として翻訳規則の類似規則を自動生成する場合に、目的言語側の意味距離計算を行って予め各規則の原言語表現の意味の曖昧性を解消しておくことで、誤った類似規則が生成されることを抑制し、また、類似規則生成時に元となる翻訳規則から置き換えられた原言語表現の訳語をより正確に選択できるようになる、という作用効果を有する。
【0137】
[実施の形態4]
本発明の第4の実施の形態について説明する。本発明は、規則主導型翻訳方式において、入力表現に適用条件が合致する翻訳規則が存在しない場合に、類似の翻訳規則を実行時に動的に生成する場合にも応用可能である。この実施の形態は、本発明の第1、第2の実施の形態における対訳表現として翻訳規則を用いるのに相当する。
【0138】
図12は、本発明の第4の実施の形態の構成を示す図である。図12を参照して、本発明の第4の実施の形態について説明する。本発明の第4の実施の形態は、原言語の入力表現を入力する入力部131と、翻訳規則を記憶する規則記憶部132と、原言語表現間の意味距離を計算する原言語意味距離計算部133と、目的言語表現間の意味距離を計算する目的言語意味距離計算部134と、原言語意味距離計算部133、目的言語意味距離計算部134を利用して、翻訳規則記憶部132中の各翻訳規則の適用条件の原言語表現の意味の曖昧性を解消する規則意味特定部135と、特定された意味に基づいて、入力表現に類似する規則の特定を行う類似規則特定部136と、翻訳を行う翻訳部137と、変換された目的言語表現を出力する出力部138とを備える。翻訳部137は更に、特定された類似規則により翻訳を行う規則適用部1371と、規則適用部1371で訳が決定しなかった部分の訳語を選択する追加訳語選択部1372を含む。
【0139】
上記構成において、入力部131、原言語意味距離計算部133、目的言語意味距離計算部134、出力部138は、前記第1の実施の形態1における入力部11、原言語意味距離計算部13、目的言語意味距離計算部15、出力部17と同様である。
【0140】
規則意味特定部135は、前記第3の実施の形態における規則意味特定部64と同様である。
【0141】
翻訳規則記憶部132は、原言語表現が特定の統語構造を持つ場合のその構造の目的言語での訳し方を定めた翻訳規則を記憶する。
【0142】
図7には、原言語が英語、目的言語が日本語の場合の翻訳規則の例が示されている。
【0143】
類似規則特定部136は、第1の実施の形態における類似対訳表現特定部14に対応し、規則意味特定手段135において翻訳規則の適用条件中の原言語表現の特定された意味に基づいて、入力表現に類似する原言語表現に対して適用可能な翻訳規則を特定する。
【0144】
規則適用部1371は、第1の発明の実施の形態における対訳表現適用部161に対応し、特定された翻訳規則により翻訳を行う。
【0145】
追加訳語選択部1372は、第1の発明の実施の形態における追加訳語選択部162に対応し、規則適用部1371で訳が決定されなかった部分の訳語を選択する。ここでは、追加訳語選択部162と同様の方法で、前記部分の各訳語のうち、前記部分に対応する類似規則生成元翻訳規則の適用条件中の表現に振られた訳語と目的言語意味距離が近くなる訳語を選択する。
【0146】
図13は、本発明の第4の実施の形態の動作を説明するためのフローチャートである。図12及び図13を参照して、本発明の第4の実施の形態の動作について説明する。
【0147】
予め規則記憶部132中の各翻訳規則について、適用条件中の原言語表現に意味の曖昧性のある場合は、規則意味特定部135において、原言語意味距離計算部133、目的言語意味距離計算部134を用いて、原言語表現に与えられた訳から意味の曖昧性を解消しておく(ステップ1401)。
【0148】
ステップ1401の詳細は、前記第3の発明の実施の形態におけるステップ902(図9参照)と同様であるため、詳細は省略する。
【0149】
その後、入力部に入力表現が入力されると(ステップ1402)、類似規則特定部136が、原言語意味距離計算部133を制御して、規則記憶部132から入力表現に類似する原言語表現に適用可能な対訳表現を特定する(ステップ1403)。ここでは、予め規則意味特定部136によって規則の適用条件中の原言語表現の意味の曖昧性が解消されているため、意味的に入力表現と食い違った原言語表現に適用される規則が特定されることはない。
【0150】
次にステップ1403で特定された対訳表現から入力表現を翻訳し(ステップ1404)、最後に、翻訳結果を出力部から出力する(ステップ1406)。
【0151】
この実施の形態において、原言語意味距離計算部133と、目的言語意味距離計算部134と、規則意味特定部135と、類似規則特定部136と、規則適用部1371と、追加訳語選択部1372の各処理と、入力部131と出力部138の処理制御は、好ましくは、コンピュータで実行されるプログラムによって実現される。
【0152】
[実施例4]
次に、具体的な動作例(実施例4)について説明する。この第4の実施例では、前記第4の実施の形態において、英語から日本語への翻訳動作について説明する。
【0153】
本発明の第4の実施例では、予め、規則記憶部132中の各規則の適用条件中の原言語表現の意味の曖昧性解消を行う。
【0154】
例として、以下の規則を挙げる。
【0155】
R2: (keep (OBJ mouse)) → (飼う (を ネズミ))
【0156】
”mouse”には、動物のネズミの意味(m1)と、パソコン周辺機器のマウスの意味(m2)があるが、R2においては”mouse”の訳語としてネズミが与えられているため、発明の実施例2のステップ502からステップ505と同様の方法で、R2の”mouse”の意味が動物の「ネズミ」の意味(図10での(05))であることが分かる。
【0157】
ここで、規則記憶部132には以下の翻訳規則が存在したとする。
【0158】
R2: (keep (OBJ mouse)) → (飼う (を ネズミ))
R3: (keep (OBJ knife)) → (持つ (を ナイフ))
【0159】
また入力表現として、以下が与えられたとする。
【0160】
I2: I keep a keyboard
【0161】
入力部131から英語表現I2が入力されると、類似規則特定部136が規則記憶部132から入力に類似した原言語表現に対して適用可能な翻訳規則のうち、最も類似度の高い翻訳規則を特定する。この際、上記の規則R1中の原言語表現の”mouse”は動物のネズミの意味(図10の(05))であることが分かっており、”mouse”(05)と”keyboard”(09)の距離は、”knife”(08)と”keyboard”(09)の距離より遠くなる。
【0162】
よって、
誤ってR2が利用されて、
「私はキーボードを飼っている」とは翻訳はされず、
R3が利用されて、
「私はキーボードを持っている」
と翻訳される。
【0163】
また、入力表現として、以下が与えられたとする。
【0164】
I1: I serve a dish
【0165】
入力部131から上記英語表現が入力されたとき、類似規則特定部136は上記の方法と同様に以下の規則を特定する。
【0166】
R4: (serve (OBJ pie)) → (出す (を パイ))
【0167】
規則適用部1371において、規則R3から「serve 〜」の部分に関しては、「〜を出す」と訳が定まる。
【0168】
”dish”の訳語として、「皿」「料理」の2つの訳語があった場合、追加訳語選択部1372において、第1の実施の形態における追加訳語選択部162(図1参照)と同様にして、訳語の選択を行う。訳語として、「料理」を選択する。
【0169】
更に、別の翻訳規則や単語辞書から、「I」の訳を「私は」と定める。この結果、出力部138から、
「私は料理を出す」
という翻訳結果が出力される。
【0170】
本実施例において、翻訳規則の適用条件中の原言語表現の意味の特定は、入力表現が与えられた後に行っても、あるいは、予め行っておいても良い。また、本実施例において、規則意味特定部135と追加訳語選択部1372のいずれか一方のみを持つ構成としても良い。
【0171】
以上説明したように、本実施例においては、入力に対し適用可能な翻訳規則がなく、類似の翻訳規則で代用することを考えた場合に、目的言語側の意味距離計算を行って予め各規則の適用条件中の原言語表現の意味の曖昧性を解消しておくことで、誤った翻訳規則が利用されることを抑制し、また、利用された元の翻訳規則から置き換えられた部分の原言語表現の訳語をより正確に選択できるようになる、という作用効果を持つ。
【0172】
以上本発明を上記各実施の形態に即して説明したが、本発明は、上記実施の形態の構成にのみ限定されるものではなく、特許請求の範囲の各請求項の発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
【0173】
【発明の効果】
以上説明したように、本発明によれば、[従来の技術]で説明した上記第一の従来例では正しく決定されなかった可能性のある、対訳表現からは直接に訳語が決定されない入力表現中の一部分に関して、目的言語の意味距離を用いた制約を設けることで、より正確に訳語の決定を行うことができる、という効果を奏する。
【0174】
本発明によれば、目的言語側の意味距離計算を行って、予め各対訳表現の原言語表現の意味の曖昧性を解消しておくことにより、上記第一の従来例では正しく類似対訳表現が特定できなかった場合に関しても、より正確に、類似対訳表現を特定することができる、という効果を奏する。
【0175】
本発明によれば、翻訳実行時または翻訳実行前に前処理として、翻訳規則の類似規則を自動生成する場合に、目的言語側の意味距離計算を行って、予め各規則の原言語表現の意味の曖昧性を解消しておくことにより、誤った類似規則が生成されることを抑制し、類似規則生成時に元となる翻訳規則から置き換えられた原言語表現の訳語を、より正確に選択することができる、という効果を奏する。
【0176】
本発明によれば、入力に対し適用可能な翻訳規則がなく、類似の翻訳規則で代用する場合、目的言語側の意味距離計算を行って予め各規則の適用条件中の原言語表現の意味の曖昧性を解消しておくことで、誤った翻訳規則が利用されることを抑制し、利用された元の翻訳規則から置き換えられた部分の原言語表現の訳語をより正確に選択することができる、という効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成を示す図である。
【図2】本発明の第1の実施の形態における機械翻訳の処理手順を示すフローチャートである。
【図3】本発明の第2の実施の形態の構成を示す図である。
【図4】本発明の第2の実施の形態における機械翻訳の処理手順を示すフローチャートである。
【図5】図4のステップ401(サブルーチン)の処理手順を示すフローチャートである。
【図6】本発明の第3の実施の形態をなす類似規則生成装置の構成を示す図である。
【図7】翻訳規則の一例を示す図である。
【図8】翻訳規則からの類似規則生成の一例を示す図である。
【図9】本発明の第3の実施の形態における類似規則生成の処理手順を示すフローチャートである。
【図10】英語から日本語への翻訳時の原言語の英語シソーラスの一例を示す図である。
【図11】英語から日本語への翻訳時の目的言語の日本語シソーラスの一例を示す図である。
【図12】本発明の第4の実施形態の構成を示す図である。
【図13】本発明の第4の実施の形態における機械翻訳の処理手順を示すフローチャートである。
【図14】従来の機械翻訳装置の構成を示す図である。
【符号の説明】
11 入力部
12 対訳表現記憶部
13 原言語意味距離計算部
14 類似対訳表現特定部
15 目的言語意味距離計算部
16 翻訳部
161 対訳表現適用部
162 追加訳語選択部
17 出力部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention translates a sentence in an input source language, a source language, into a sentence in a target language, a target language, and outputs it. The present invention relates to a translation apparatus that mechanically executes translation of a phrase from one language to another, such as an inter-language search system for searching.
[0002]
[Prior art]
Conventionally, as a machine translation method that takes an expression in the source language as input, mechanically translates it into an expression in the target language, and outputs it, the result of semantic analysis such as morphological analysis and syntax analysis of the source language expression 2. Description of the Related Art There is known a rule-based translation method (hereinafter, referred to as a “first conventional example”) that accumulates translation rules defining a method and translates an input sentence based on the translation rules.
[0003]
To briefly explain the operation of the first conventional example, when an input sentence of the source language is input, first, morphological analysis, language analysis such as syntax analysis is performed, and then, the result of the semantic analysis is The translation rules are applied and replaced with the target language.
[0004]
Finally, a replacement result is generated and output as a sentence in the target language.
[0005]
However, since the applicable range of a translation rule is limited by the applicable conditions of the translation rule, a large number of translation rules covering the input expression are required to comprehensively correspond to the input expression. Was.
[0006]
Therefore, as a machine translation method, there is an example in which a source language expression and a set of translations of the target language expression corresponding to the source language expression, which are created by hand or the like in advance, are stored as an example, and the input completely matches the input. In the case where the translation is performed, the corresponding translation is output, and even if there is no example that exactly matches the input, an example similar to the input is specified, and the input is translated with reference to the specified example. Has been proposed.
[0007]
As a publication related to this type of conventional translation system, for example, Japanese Patent No. 2609173 (hereinafter, referred to as “second conventional example”) is referred to. FIG. 14 is a diagram showing the configuration of the second conventional example. Referring to FIG. 14, in a second conventional example, an
[0008]
Next, the operation of the second conventional example will be described with reference to FIG. Hereinafter, a case where a Japanese sentence is translated into English will be described.
[0009]
It is assumed that “meeting in Tokyo” is input to the
[0010]
Then, the similar
[0011]
For example, in an example,
“Stay in Kyoto → stay in Kyoto” (similarity to input 0.4),
"Meeting in Kyoto → conference in Kyoto" (similarity to input 1.0)
If there is
More similar
"Conference in Kyoto → Conference in Kyoto"
Is selected.
[0012]
Next, using the translation “conference in Kyoto” for “meeting in Kyoto”, “conference in Tokyo” is output as a translation for the input.
[0013]
[Problems to be solved by the invention]
However, in the second conventional example, since the similar example is referred to at the time of translation, the following translation error may occur.
[0014]
In the second conventional example, an erroneous translation may be selected for a part of the input expression for which a translation is not determined from the similar example. First, it is assumed that the following example exists.
[0015]
E0: I serve the master → I serve my master
E1: I serve a pie → I serve pie
[0016]
Further, it is assumed that the translations of “dish” include “dish” (first translation) and “cooking” (second translation).
[0017]
Here, a case where the following English expression is translated into Japanese will be described.
[0018]
I1: I serve a dish.
[0019]
In the second conventional example, an example for a source language expression having the closest meaning distance to an input is obtained using a source language thesaurus. The thesaurus is a word that is semantically classified into a tree structure, and a specific example is shown in FIG. The semantic distance between words using the thesaurus is approximately the distance between nodes to which each word for which the semantic distance is to be determined belongs on the thesaurus.
[0020]
Here, referring to the thesaurus of FIG. 10 for the calculation of the semantic distance, the “dish” of (01) is larger than the “dish” of (01) or (02) and the “master” of (04). Since the meaning distance between “pie” and (03) is shorter, E1 is selected as a reference example.
[0021]
Next, with respect to the portion of "I reserved ~" of the input, a translation can be obtained from the example E1 as "I will issue ~". When the translation of "dish" having a plurality of translations is selected, the example E1 is used. Is not used. For example, if the first translation is used for this translation selection, "dish" is selected as the translation for "dish", and the translation is incorrect, such as "I will put out the plate". There is.
[0022]
Further, in the second conventional example, there is also a problem that an erroneous example may be referred to when the source language expression of the example has a plurality of possible meanings.
[0023]
First, assume that the following example exists,
[0024]
E2: I keep a mouse → I have a mouse
E3: I keep a knife → I have a knife
[0025]
It is also assumed that “mouse” has the meaning of a mouse (animal) and the meaning of a mouse (personal computer peripheral device).
[0026]
Here, a case where the following English expression is translated into Japanese will be described.
[0027]
I2: I keep a keyboard.
[0028]
Referring to the source language thesaurus shown in FIG. 10, "mouse" appears at a plurality of positions of an animal meaning position (05) and a personal computer peripheral device meaning position (06).
[0029]
In the second conventional example, the "mouse" (06) and the "keyboard" (09) as personal computer peripherals are longer than the distance between any of "mouse" and "knife" (08) in (05) and (06). ), The example E2 is erroneously determined to be semantically close to the input, and the input is translated as “I have a keyboard”.
[0030]
On the other hand, as another approach to the problem of the first conventional example, a method of automatically generating a semantically similar translation rule from the translation rule can be considered. However, in this method, similar to the second conventional example, if a similar rule is simply generated using the semantic distance of the source language, an erroneous similar rule may be generated. For example, consider generating a similar rule from the following translation rule from English to Japanese.
[0031]
R1: (feed (OBJ mouse)) → (feeding (in rats))
[0032]
When the word “mouse” exists in the slot of the OBJECT (object) of the word “feed”, R1 converts “feed” to “feed” and “mouse” to “mouse”, and converts the word “mouse” to “mouse”. The translation rule is to attach the particle “ni” to “rat”.
[0033]
Referring to the thesaurus of FIG. 10, "mouse" has the meaning of an animal (05) and the meaning of a personal computer peripheral device (06), and there is a synonym for each meaning. If a similar rule is generated using a synonym of the meaning (06) of the personal computer peripheral device, the following erroneous rule will be generated (“×” indicates impossible (NG)).
[0034]
× (feed (OBJ keyboard)) → (feeding (keyboard))
× (feed (OBJ modem)) → (feeding (modem))
[0035]
Furthermore, even if a similar rule is correctly generated with the meaning of an animal (05), it is necessary to select a translation for the word to which "mouse" is replaced in the original translation rule R1, but the translation may fail to be selected. There is.
[0036]
A case in which "mouse" in rule R1 is replaced with "seal" (seal) of an animal in the following manner will be described. "???" indicates that the translation is undecided.
R1 ': (feed (OBJ seal)) → (Feed (Ni ???))
[0037]
Here, "seal" has two translations of "seal" (first translation) and "seal" (second translation). If, for example, the first translation is selected for selecting the translation of "seal" of the similar rule R1 ', the following erroneous similar rule is generated.
[0038]
× (feed (OBJ seal)) → (feeding (sealed seal))
[0039]
Accordingly, the present invention has been made in view of the above problems, and a main object of the present invention is to provide a translation device, a method, a program, and a recording medium that can perform translation with higher accuracy. is there.
[0040]
[Means for Solving the Problems]
The present invention, which provides means for solving the above problems, is characterized by using a semantic distance of a target language in a translation process of inputting a source language expression, converting the expression into a target language expression, and outputting the converted expression.
[0041]
An apparatus according to one aspect of the present invention inputs a source language expression (abbreviated as “source language expression”), converts it into a target language expression (abbreviated as “target language expression”), and outputs it. A translation device, wherein a bilingual expression storage means storing a bilingual expression comprising a set of a source language expression and a target language expression corresponding to the source language expression, and a source language semantic distance calculating means for calculating a semantic distance between the source language expressions. A target language semantic distance calculating means for calculating a semantic distance between target language expressions, a similar bilingual expression specifying means for controlling the source language semantic distance calculating means to specify a bilingual expression most similar to the input expression, Using the selected bilingual expression, the bilingual expression applying means for translating the input expression and the target language semantic distance calculating means, and selecting a translated word of a part where the translated word is not determined by the bilingual expression applying means Translation It includes a selecting means.
[0042]
According to another aspect of the present invention, there is provided a translation apparatus that inputs a source language expression, converts the source language expression into a target language expression, and outputs the target language expression. A target language semantic distance calculating means for calculating a semantic distance between the expressions, and, when a target language expression corresponding to the source language expression is given, using the source language semantic distance calculating means and the target language semantic distance calculating means. And meaning specifying means for resolving the ambiguity of the meaning of the source language expression.
[0043]
According to another aspect of the present invention, there is provided a translation apparatus for converting a source language expression into a target language expression, comprising: a bilingual expression storage unit storing a bilingual expression including a set of the target language expression corresponding to the source language expression; From a source language semantic distance calculating means for calculating a semantic distance between linguistic expressions, a target language semantic distance calculating means for calculating a semantic distance between the target linguistic expressions, and a target language expression corresponding to the source language expression in the bilingual expression, Using the source language semantic distance calculating means and the target language semantic distance calculating means, controlling the rule semantic specifying means for resolving the ambiguity of the meaning of the source language expression of the bilingual expression, and controlling the source language semantic distance calculating means. A bilingual expression specifying unit that specifies a bilingual expression most similar to the input expression based on the meaning of the source language expression of the bilingual expression specified by the rule semantic specifying unit; Using a constant has been translated expression, and a, a translation means for performing translation of the input expression.
[0044]
According to another aspect of the present invention, there is provided a translation apparatus that inputs a source language expression, converts the source language expression into a target language expression, and outputs the target language expression. The translation device includes a source language expression and a target language expression corresponding to the source language expression. A bilingual expression storage unit that stores a bilingual expression, a source language semantic distance calculating unit that calculates a semantic distance between source language expressions, a target language semantic distance calculating unit that calculates a semantic distance between target language expressions, A bilingual expression semantic identifying unit for controlling the linguistic semantic distance calculating unit and the target language semantic distance calculating unit to eliminate ambiguity of the meaning of the source language expression of each bilingual expression in the bilingual expression storage unit; A similar bilingual expression specifying means for controlling the semantic distance calculating means to specify the bilingual expression most similar to the input expression, a translating means for translating the input expression based on the specified bilingual expression, and a converted target language table And a, and output means for outputting.
[0045]
In one aspect, the method according to the present invention solves the above-described problem. In one aspect, a translation process of inputting an expression in a source language, converting the expression into an expression in a target language, and outputting the translated expression is performed using a computer including an input unit and an output unit. In the translation method to be performed, a step of inputting a source language expression from the input unit and a process of calculating a semantic distance between the source language expressions are controlled so that a source language expression and a target language corresponding to the source language expression are controlled. Specifying a bilingual expression for a source language expression that is most similar to the input expression from a bilingual expression storage unit storing a bilingual expression composed of a set of expressions, and inputting the bilingual expression using the specified bilingual expression. Translating the expression in the source language, and controlling the process of calculating the semantic distance between the target language expressions, and controlling the translation of the words in the input expression for which the translation was not determined in the translating step. And determining a, and outputting the translation result from the output unit.
[0046]
A program according to the present invention that solves the above-described problem causes a computer including an input unit and an output unit to execute a translation process of inputting a source language expression, converting the source language expression into a target language expression, and outputting the target language expression. A program for inputting a source language expression from the input unit, a process for calculating a semantic distance between the source language expressions, a process for calculating a semantic distance between the target language expressions, By controlling the process of calculating the distance, the most similar to the input expression is obtained from a bilingual expression storage unit storing a bilingual expression comprising a set of a source language expression and a target language expression corresponding to the source language expression. Specifying the bilingual expression for the source language expression to be translated, translating the input expression using the specified bilingual expression, and calculating the semantic distance between the target language expressions And causing the computer to execute a process of determining a translation of a word in the input expression whose translation has not been determined in the process of translating the input expression, and a process of outputting a translation result from the output unit. Consists of a program. The program is stored on a recording medium.
[0047]
The present invention provides a mechanism for resolving the ambiguity of the meaning of the source language expression of the bilingual expression by calculating the semantic distance between the target language expressions and specifying the similar bilingual expression more correctly. It is characterized by having a mechanism for selecting a translation of the input sentence so as to be semantically close to the given translation. As a result, an operation and effect that translation processing can be performed with higher accuracy can be obtained.
[0048]
BEST MODE FOR CARRYING OUT THE INVENTION
An embodiment of the present invention will be described with reference to the drawings.
[0049]
[Embodiment 1]
A first embodiment of the present invention will be described. FIG. 1 is a diagram showing a configuration of the first exemplary embodiment of the present invention. Referring to FIG. 1, an apparatus according to a first embodiment of the present invention includes an
[0050]
The translation unit 16 uses the bilingual expression application unit 161 that determines a translation that can be determined from the specified bilingual expression, and the target language semantic
[0051]
In the above configuration, regarding the
[0052]
The target language
[0053]
The additional translation
[0054]
Next, FIG. 2 is a flowchart for explaining the operation of the first embodiment of the present invention. The operation of the first embodiment of the present invention will be described with reference to FIGS.
[0055]
First, when an input expression is input to the input unit 11 (step 201), the similar bilingual
[0056]
Next, the bilingual expression application unit 161 translates the input expression in the source language using the specified bilingual expression (step 203).
[0057]
The additional translation
[0058]
Finally, the translation result is output from the output unit (Step 205).
[0059]
In this embodiment, the processing of the source language semantic
[0060]
[Example 1]
Next, in order to describe the above-described first embodiment of the present invention in more detail, the operation of the first embodiment will be described with reference to a specific example (example). The configuration of the present embodiment is the same as that of the first embodiment. In the following, the translation from English to Japanese will be described.
[0061]
It is assumed that the following bilingual expressions exist in the bilingual
[0062]
E0: I serve the master → I serve my master
E1: I serve a pie → I serve pie
[0063]
Also, as a translation of "dish",
"Dish" (first translation),
"Cooking" (second translation)
Suppose there is.
[0064]
Here, it is assumed that the following is given as an input expression.
[0065]
I1: I serve a dish.
[0066]
When the English expression I1 is input from the
[0067]
Referring to the thesaurus illustrated in FIG. 10, the distance between “dish” (01) and “pie” (03) is greater than the distance between any of “dish” and “master” (04). Are close, E1 is selected as the bilingual expression to be referred to.
[0068]
Next, in the bilingual expression application unit 161, the part “I serve” in the input expression is referred to as the bilingual expression E1 in the same manner as in the conventional translating apparatus, and is translated as “I will output ~”. Is specified.
[0069]
Next, from the bilingual expression E1, a translation of "dish" of the word in the input expression for which no translation is determined is selected. “Dish” has “dish” and “dish” as translated words, but the additional translated
[0070]
Referring to the thesaurus of FIG. 11, since the distance between “pie” (01) and the dish (02) is shorter than the distance between “pie” (01) and the plate (03), the translated word “dish” is selected. Finally, the translation unit generates the following as a translation for the input using the specified bilingual expression and the selected translation of “dish”, and outputs the translation from the
I serve.
[0071]
In this embodiment, a thesaurus is used for the source language semantic
[0072]
The bilingual expression may be a set of sentences, phrases, and words in the source language and corresponding sentences, phrases, and words in the target language, as in the example of the first conventional example described in [Prior Art]. Then, the translation rule in the second conventional example described in [Prior Art] may be used, or a result of performing some semantic analysis on the source language expression and some semantic analysis on the corresponding target language expression May be a set of the results of the above.
[0073]
As described above, in the present embodiment, the meaning of the target language is used for a part of the input expression in which the translation is not directly determined from the bilingual expression, which may not have been correctly determined in the first conventional example. Due to the restriction using the distance, the translation word can be determined more accurately.
[0074]
[Embodiment 2]
A second embodiment of the present invention will be described with reference to FIG. In the second embodiment of the present invention, an
[0075]
In the above configuration, the
[0076]
When the source language expression has ambiguity in the source language expression, the source language semantic distance calculating means 33 calculates the source language semantic distance from the source language expression. Then, the meaning is specified using the target language meaning distance calculating means 34.
[0077]
Next, FIGS. 4 and 5 are flowcharts for explaining the operation of the second embodiment of the present invention. The operation of the second embodiment of the present invention will be described with reference to FIGS.
[0078]
First, for each bilingual expression in the bilingual
[0079]
FIG. 5 is a flowchart for explaining the details of
[0080]
For each bilingual expression (step 501), a word WE having a plurality of meanings in the source language expression is specified (step 502), and the word WE for each meaning mi of the word WE is determined using the source language semantic
[0081]
Next, for each i, a translation of each word in S1i is obtained, and a set S2i is created (step 504).
[0082]
Next, the semantic distance between the translated word WJ given to the word WE in the bilingual expression of interest and the set S2i is determined (step 505), and the meaning corresponding to the set closest to WJ is the word in this bilingual expression. It means WE.
[0083]
Thereafter, when an input expression is input to the input unit (step 402), the similar bilingual
[0084]
Here, since the ambiguity of the meaning of the source language expression of the bilingual expression has been eliminated by the bilingual expression meaning specifying unit in advance, a bilingual expression that is semantically different from the input expression is not specified.
[0085]
Next, the input expression is translated from the bilingual expression specified in step 403 (step 404).
[0086]
Finally, the translation result is output from the output unit (step 405).
[0087]
In this embodiment, each processing of the source language semantic
[0088]
[Example 2]
Next, a description will be given with reference to a specific operation example (Example 2). Hereinafter, the translation from English to Japanese in the second embodiment will be described.
[0089]
In the second embodiment of the present invention, the ambiguity of the meaning of the source language expression of each bilingual expression in the bilingual
[0090]
As an example, the following parallel expression is given.
[0091]
E2: I keep a mouse → I have a mouse.
[0092]
"Mouse" has the meaning of an animal mouse (m1, (05) in FIG. 10) and the meaning of a mouse of a personal computer peripheral device (m2, (06) in FIG. 10) (step 502).
[0093]
Using the source language semantic distance calculation unit, synonyms of these two meanings are obtained, and a set S1i is created (step 503).
[0094]
S11: (dog, cat, cow, rat)
S12: (keyboard, display, modem)
[0095]
Next, for each S1i, a translation of each word in S1i is obtained, and a set S2i is created (step 504).
[0096]
S21: (dog, cat, cow, rat)
S22: (Keyboard, display, modem)
[0097]
Finally, the semantic distance between the translation "rat" assigned to "mouse" in the bilingual expression and each of the sets S21 and S22 is determined (step 505).
[0098]
If the semantic distance between the target languages W1 and W2 is expressed as dist (W1, W2), the semantic distance between "mouse" and S21 and S22 is as follows using the thesaurus of FIG.
[0099]
[0100]
[0101]
As a result, since the distance from S21 is shorter, the meaning (04) of the animal rat, which is the meaning corresponding to S21, becomes the meaning of "mouse" in the bilingual expression.
[0102]
Here, it is assumed that the following bilingual expressions exist in the
[0103]
E2: I keep a mouse → I have a mouse
E3: I keep a knife → I have a knife
[0104]
It is also assumed that the following is given as an input expression.
[0105]
I2: I keep a keyboard.
[0106]
When the English expression I2 is input from the
[0107]
At this time, it is known that "mouse" of the source language expression in the bilingual expression E2 has the meaning of an animal mouse ((05) in FIG. 10), and "keyboard" (09) and "mouse" Since the distance of “mouse” (05) is longer than the distance of “keyboard” (09) and “knife” (08), the bilingual expression E3 is selected as the bilingual expression to be referred to unlike the first conventional example. Therefore, the translation of I2 can be translated as "I have a knife" by referring to the bilingual expression E3 without incorrectly translating "I have a keyboard" by referring to the bilingual expression E2. become.
[0108]
The specification of the meaning of the bilingual expression may be performed after the input expression is given, or may be performed in advance.
[0109]
As described above, in the present embodiment, by performing the semantic distance calculation on the target language side and previously eliminating the ambiguity of the meaning of the source language expression of each bilingual expression, the first conventional example correctly Even when the similar bilingual expression cannot be specified, there is an operational effect that the similar bilingual expression can be specified more accurately.
[0110]
[Embodiment 3]
The present invention is also applicable to a case where a similar rule is generated in advance from a translation rule in a rule-based translation method to increase the coverage of a translation rule for an input expression.
[0111]
FIG. 6 is a diagram showing a configuration of the third exemplary embodiment of the present invention. The third embodiment of the present invention will be described with reference to FIG. In the third embodiment of the present invention, a translation
[0112]
In the above configuration, the source language
[0113]
When the input source language expression has a specific structure, the translation
[0114]
FIG. 7 shows an example of a translation rule when the source language is English and the target language is Japanese.
[0115]
The rule
[0116]
The similar
[0117]
FIG. 8 shows an example of the replacement rule.
[0118]
The rule translation
[0119]
Next, FIG. 9 is a flowchart for explaining the operation of the third embodiment of the present invention. The operation of the present embodiment will be described with reference to FIG.
[0120]
First, a translation rule is input from the translation rule input unit 61 (step 901). If the source language expression of the application condition of the input translation rule has an ambiguity in the meaning, the rule
[0121]
The details of
[0122]
Next, the similar
[0123]
The rule translation
[0124]
Finally, the translation result is output from the output unit 67 (step 905).
[0125]
In this embodiment, a translation
[0126]
[Example 3]
Next, a specific operation example (third embodiment) will be described. In the third embodiment, in the third embodiment, a translation rule from English to Japanese is input, and the structure of the translation rule in FIG. 8 is simply represented as follows. .
[0127]
R1: (feed (OBJ mouse)) → (feeding (in rats))
[0128]
When R1 is input to the translation
[0129]
(Feed (OBJ mouse)) → (feeding (in rats))
⇒ (feed (OBJ cat)) → (Feed (Ni ???))
⇒ (feed (OBJ pig)) → (Feed (Ni ???))
⇒ (feed (OBJ seal)) → (Feed (Ni ???))
...
[0130]
At this time, by specifying the meaning by the rule
[0131]
× (feed (OBJ keyboard)) → (Feed (Ni ???))
× (feed (OBJ modem)) → (Feed (Ni ???))
[0132]
Next, a translated word corresponding to the replaced source language expression in the application conditions of the translation rule is selected. The selection method is similar to the additional translation
[0133]
For example, considering the similar rule replaced with "seal", "seal" has two translations, "seal" and "seal". For example, referring to the thesaurus in FIG. 11, a mouse (04) and a seal ( Since the distance between the mouse (04) and the seal (05) is shorter than the distance at 06), "seal" is selected as a translation.
[0134]
(Feed (OBJ mouse)) → (feeding (in rats))
⇒ (feed (OBJ cat)) → (feeding (cat))
⇒ (feed (OBJ pig)) → (Feed (Pig)
⇒ (feed (OBJ seal)) → (Feed food (to seal))
...
[0135]
In this embodiment, a configuration having only one of the rule
[0136]
As described above, in the present embodiment, when a rule similar to a translation rule is automatically generated as a pre-process at the time of performing translation or before performing translation, the semantic distance calculation on the target language side is performed and the source of each rule is determined in advance. By eliminating the ambiguity of the meaning of the linguistic expressions, it is possible to suppress the generation of erroneous similar rules, and to improve the translation of the source language expressions that have been replaced from the original translation rules when the similar rules were generated. It has the effect of being able to select accurately.
[0137]
[Embodiment 4]
A fourth embodiment of the present invention will be described. The present invention is also applicable to a case where a similar translation rule is dynamically generated at the time of execution when there is no translation rule whose application condition matches the input expression in the rule-driven translation system. This embodiment corresponds to using a translation rule as a bilingual expression in the first and second embodiments of the present invention.
[0138]
FIG. 12 is a diagram showing a configuration of the fourth exemplary embodiment of the present invention. A fourth embodiment of the present invention will be described with reference to FIG. The fourth embodiment of the present invention includes an
[0139]
In the above configuration, the
[0140]
The rule
[0141]
When the source language expression has a specific syntactic structure, the translation
[0142]
FIG. 7 shows an example of a translation rule when the source language is English and the target language is Japanese.
[0143]
The similarity
[0144]
The
[0145]
The additional translation
[0146]
FIG. 13 is a flowchart for explaining the operation of the fourth embodiment of the present invention. The operation of the fourth exemplary embodiment of the present invention will be described with reference to FIGS.
[0147]
For each translation rule in the
[0148]
The details of step 1401 are the same as those of step 902 (see FIG. 9) in the third embodiment of the present invention, and thus the details will be omitted.
[0149]
Thereafter, when the input expression is input to the input unit (step 1402), the similar
[0150]
Next, the input expression is translated from the bilingual expression specified in step 1403 (step 1404), and finally, the translation result is output from the output unit (step 1406).
[0151]
In this embodiment, the source language semantic
[0152]
[Example 4]
Next, a specific operation example (Example 4) will be described. In the fourth embodiment, an operation of translating from English into Japanese in the fourth embodiment will be described.
[0153]
In the fourth embodiment of the present invention, the ambiguity of the meaning of the source language expression in the application condition of each rule in the
[0154]
As an example, the following rules are given.
[0155]
R2: (keep (OBJ mouse)) → (Keep (the mouse))
[0156]
“Mouse” has the meaning of an animal mouse (m1) and the meaning of a mouse of a personal computer peripheral device (m2). In R2, since the mouse is given as a translation of “mouse”, the present invention is practiced. In the same manner as in
[0157]
Here, it is assumed that the following translation rules exist in the
[0158]
R2: (keep (OBJ mouse)) → (Keep (the mouse))
R3: (keep (OBJ knife)) → (has (knife))
[0159]
It is also assumed that the following is given as an input expression.
[0160]
I2: I keep a keyboard
[0161]
When the English expression I2 is input from the
[0162]
Therefore,
R2 is used by mistake,
"I have a keyboard" is not translated,
R3 is used,
"I have a keyboard"
Is translated.
[0163]
It is also assumed that the following is given as an input expression.
[0164]
I1: I serve a dish
[0165]
When the English expression is input from the
[0166]
R4: (serve (OBJ pie)) → (put out (pie))
[0167]
In the
[0168]
When there are two translations of “dish” as “translation” of “dish”, the additional
[0169]
Further, the translation of "I" is determined as "I" from another translation rule or word dictionary. As a result, from the
"I serve food"
Is output.
[0170]
In the present embodiment, the meaning of the source language expression in the application condition of the translation rule may be specified after the input expression is given, or may be specified in advance. Further, in this embodiment, a configuration having only one of the rule
[0171]
As described above, in the present embodiment, when there is no translation rule applicable to the input, and when a similar translation rule is used instead, the semantic distance calculation on the target language side is performed and each rule is determined in advance. By eliminating the ambiguity of the meaning of the source language expression in the application conditions of, the use of incorrect translation rules is suppressed, and the original translation rules replaced by the original translation rules are used. This has the effect that the translation of the linguistic expression can be selected more accurately.
[0172]
Although the present invention has been described with reference to each of the above embodiments, the present invention is not limited only to the configuration of the above embodiment, but falls within the scope of the claims of the present invention. Needless to say, various changes and modifications that can be made by those skilled in the art are included.
[0173]
【The invention's effect】
As described above, according to the present invention, in an input expression in which a translation is not directly determined from a bilingual expression, which may not have been correctly determined in the first conventional example described in [Prior Art]. By providing a constraint using the semantic distance of the target language with respect to a part of the target language, it is possible to determine translation words more accurately.
[0174]
According to the present invention, by calculating the semantic distance on the target language side and eliminating the ambiguity of the meaning of the source language expression of each bilingual expression in advance, the similar bilingual expression can be correctly corrected in the first conventional example. In the case where the similar bilingual expression cannot be specified, the similar bilingual expression can be specified more accurately.
[0175]
According to the present invention, when a similar rule of a translation rule is automatically generated as a pre-process at the time of performing translation or before performing translation, a semantic distance calculation is performed on the target language side, and the meaning of the source language expression of each rule is determined in advance. By eliminating the ambiguity of, the generation of erroneous similar rules is suppressed, and the translation of the source language expression replaced from the original translation rule at the time of generating similar rules is more accurately selected. The effect is that it can be done.
[0176]
According to the present invention, when there is no translation rule applicable to the input and a similar translation rule is used instead, a semantic distance calculation on the target language side is performed to determine in advance the meaning of the source language expression in the application condition of each rule. By eliminating ambiguity, it is possible to suppress the use of incorrect translation rules, and to more accurately select the translated word of the source language expression of the part replaced from the original translation rule used The effect is as follows.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a first exemplary embodiment of the present invention.
FIG. 2 is a flowchart illustrating a machine translation processing procedure according to the first embodiment of the present invention.
FIG. 3 is a diagram showing a configuration of a second exemplary embodiment of the present invention.
FIG. 4 is a flowchart illustrating a machine translation processing procedure according to the second embodiment of the present invention.
FIG. 5 is a flowchart showing a processing procedure of step 401 (subroutine) in FIG. 4;
FIG. 6 is a diagram illustrating a configuration of a similar rule generation device according to a third embodiment of the present invention.
FIG. 7 is a diagram illustrating an example of a translation rule.
FIG. 8 is a diagram illustrating an example of generation of a similar rule from a translation rule.
FIG. 9 is a flowchart illustrating a procedure for generating a similar rule according to the third embodiment of the present invention.
FIG. 10 is a diagram showing an example of a source language English thesaurus when translating from English to Japanese.
FIG. 11 is a diagram showing an example of a Japanese thesaurus of a target language when translating from English to Japanese.
FIG. 12 is a diagram showing a configuration of a fourth embodiment of the present invention.
FIG. 13 is a flowchart illustrating a machine translation processing procedure according to the fourth embodiment of the present invention.
FIG. 14 is a diagram showing a configuration of a conventional machine translation device.
[Explanation of symbols]
11 Input section
12 Bilingual expression storage
13 Source language semantic distance calculator
14 Similar bilingual expression specifying unit
15 Target language semantic distance calculator
16 Translator
161 Bilingual expression application section
162 Additional translation word selection section
17 Output section
Claims (20)
前記目的言語表現間の意味距離を計算する目的言語意味距離計算手段を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
A translation device, comprising: a target language semantic distance calculation unit configured to calculate a semantic distance between the target language expressions.
原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶手段と、
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
前記原言語意味距離計算手段を制御して、入力表現に最も類似する対訳表現を特定する類似対訳表現特定手段と、
前記類似対訳表現特定手段で特定された対訳表現を用いて、前記入力表現の翻訳を行う対訳表現適用手段と、
前記目的言語意味距離計算手段を制御して、前記対訳表現適用手段で訳語が決定しない部分の訳語を選択する追加訳語選択手段と、
を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
A bilingual expression storage unit storing a bilingual expression composed of a set of a source language expression and a target language expression corresponding to the source language expression;
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
Controlling the source language semantic distance calculation means, and specifying a bilingual expression most similar to the input expression;
Using a bilingual expression specified by the similar bilingual expression specifying means, a bilingual expression applying means for translating the input expression,
Controlling the target language semantic distance calculation means, an additional translation word selection means for selecting a translation word of a part whose translation is not determined by the bilingual expression application means,
A translation device, comprising:
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
原言語の表現と前記原言語の表現に対応する目的言語の表現とが与えられた場合、前記原言語意味距離計算手段と、前記目的言語意味距離計算手段とを用いて、前記原言語の表現の意味の曖昧性を解消する意味特定手段と、
を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
Given a source language expression and a target language expression corresponding to the source language expression, the source language expression is calculated using the source language semantic distance calculation means and the target language semantic distance calculation means. Means for resolving ambiguity in the meaning of
A translation device, comprising:
原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶手段と、
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
前記対訳表現記憶手段に記憶されている対訳表現中の原言語表現と対応する目的言語表現から、前記原言語意味距離計算手段と前記目的言語意味距離計算手段とを用いて、前記対訳表現の原言語表現の意味の曖昧性を解消する規則意味特定手段と、
前記原言語意味距離計算手段を制御して、前記規則意味特定手段によって特定された対訳表現の原言語表現の意味に基づいて、入力表現に最も類似する対訳表現を特定する対訳表現特定手段と、
前記対訳表現特定手段で特定された対訳表現を用いて、入力表現の翻訳を行う翻訳手段と、
を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
A bilingual expression storage unit storing a bilingual expression composed of a set of a source language expression and a target language expression corresponding to the source language expression;
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
From the target language expression corresponding to the source language expression in the bilingual expression stored in the bilingual expression storage means, the source language semantic distance calculating means and the target language semantic distance calculating means are used to calculate the source of the bilingual expression. A rule semantic identification means for resolving the ambiguity of the meaning of the linguistic expression,
Controlling the source language semantic distance calculation means, based on the meaning of the source language expression of the bilingual expression specified by the rule meaning specifying means, a bilingual expression specifying means for specifying a bilingual expression most similar to the input expression,
Using the bilingual expression specified by the bilingual expression specifying means, translating means for translating the input expression,
A translation device, comprising:
原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶手段と、
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
前記原言語意味距離計算手段と前記目的言語意味距離計算手段とを制御して、前記対訳表現記憶手段に記憶されている各対訳表現の原言語表現の意味の曖昧性を解消する対訳表現意味特定手段と、
前記原言語意味距離計算手段を制御して、入力された前記原言語の表現に最も類似する対訳表現を特定する類似対訳表現特定手段と、
前記類似対訳表現特定手段で特定された対訳表現を基に入力表現の翻訳を行う翻訳手段と、
変換された目的言語表現を出力する出力手段と、
を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
A bilingual expression storage unit storing a bilingual expression composed of a set of a source language expression and a target language expression corresponding to the source language expression;
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
Controlling the source language semantic distance calculating means and the target language semantic distance calculating means to resolve the ambiguity of the meaning of the source language expression of each bilingual expression stored in the bilingual expression storage means; Means,
Controlling the source language semantic distance calculation means, and specifying a bilingual expression most similar to the input expression of the source language;
Translation means for translating the input expression based on the bilingual expression specified by the similar bilingual expression specifying means,
Output means for outputting the converted target language expression;
A translation device, comprising:
入力された原言語の表現が予め定められた特定の構造を持つ場合、前記構造の目的言語への訳し方を定めた翻訳規則を入力する翻訳規則入力手段と、
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
前記翻訳規則入力手段より入力された翻訳規則の適用条件中の原言語表現に意味の曖昧性がある場合には、前記翻訳規則で原言語表現に与えられた訳から、前記原言語意味距離計算手段と前記目的言語意味距離計算手段とを用いて、意味の特定を行い、入力された翻訳規則の適用条件の原言語表現の意味の曖昧性を解消する規則意味特定手段と、
前記規則意味特定手段で特定された原言語表現の意味に基づいて類似する原言語表現を求め、入力された翻訳規則を前記類似する原言語表現によって置き換えて類似規則を生成する類似規則生成手段と、
前記置き換えられた原言語表現に対する訳語を選択する規則中訳語選択手段と、
生成された類似規則を出力する出力手段と、
を備えている、ことを特徴とする翻訳装置。In a translation device that inputs a source language expression, converts it into a target language expression, and outputs it,
When the input source language expression has a predetermined specific structure, translation rule input means for inputting a translation rule that determines how to translate the structure into the target language,
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
If the source language expression in the application condition of the translation rule input from the translation rule input means has ambiguity in meaning, the source language semantic distance calculation is performed based on the translation given to the source language expression in the translation rule. Using the means and the target language semantic distance calculating means, to specify the meaning, and rule meaning specifying means for eliminating the ambiguity of the meaning of the source language expression of the application condition of the input translation rule,
A similar rule generation means for obtaining a similar source language expression based on the meaning of the source language expression specified by the rule meaning specifying means, and replacing the input translation rule with the similar source language expression to generate a similar rule; ,
Rule translation word selection means for selecting a translation word for the replaced source language expression,
Output means for outputting the generated similarity rule;
A translation device, comprising:
翻訳規則を記憶する規則記憶手段と、
原言語表現間の意味距離を計算する原言語意味距離計算手段と、
目的言語表現間の意味距離を計算する目的言語意味距離計算手段と、
前記原言語意味距離計算手段と、前記目的言語意味距離計算手段とを用いて、前記規則記憶手段に記憶されている各翻訳規則の適用条件の原言語表現の意味の曖昧性を解消する規則意味特定手段と、
前記規則意味特定手段で特定された意味に基づいて、入力された原言語の表現に類似する規則の特定を行う類似規則特定手段と、
前記類似規則特定手段で特定された類似規則にしたがって翻訳を行う規則適用手段と、前記類似規則適用手段で訳が決定しなかった部分の訳語を選択する追加訳語選択手段と、を含む翻訳手段と、
翻訳結果を出力する出力手段と、
を備えている、ことを特徴とする翻訳装置。Input means for inputting a source language expression;
Rule storage means for storing translation rules,
Source language semantic distance calculation means for calculating the semantic distance between the source language expressions,
A target language semantic distance calculating means for calculating a semantic distance between the target language expressions,
A rule meaning for eliminating the ambiguity of the meaning of the source language expression of the application condition of each translation rule stored in the rule storage means, using the source language semantic distance calculation means and the target language semantic distance calculation means; Identification means,
Based on the meaning specified by the rule meaning specifying means, similar rule specifying means for specifying a rule similar to the input source language expression,
A translation unit including a rule application unit that performs translation in accordance with the similar rule specified by the similar rule identification unit, and an additional translation word selection unit that selects a translation word of a part whose translation has not been determined by the similar rule application unit. ,
Output means for outputting a translation result;
A translation device, comprising:
前記対訳表現記憶部より対訳表現を入力する手段と、
前記対訳表現の原言語表現中で意味を複数有する単語を特定する手段と、
前記原言語表現間意味距離計算手段を用いて、原言語表現中で意味を複数有する前記単語の各意味のそれぞれに対して前記単語の類義語を求め第1の集合を作成する手段と、
複数の前記第1の集合中の各単語の訳語を求め、第2の集合を作成する手段と、
注目している対訳表現で単語に与えられた訳語と前記第2の集合との意味距離を求める手段と、
前記訳語と最も距離の小さい前記第2の集合に対応する意味を、前記対訳表現での単語の意味とする手段と、
を含む、ことを特徴とする請求項5に記載の翻訳装置。The bilingual expression meaning specifying means,
Means for inputting a bilingual expression from the bilingual expression storage unit,
Means for identifying words having a plurality of meanings in the source language expression of the bilingual expression;
Means for obtaining a synonym of the word for each meaning of the word having a plurality of meanings in the source language expression, using the means for calculating the semantic distance between the source language expressions, and creating a first set;
Means for determining a translation of each word in the plurality of first sets and creating a second set;
Means for determining a semantic distance between the translated word given to the word in the bilingual expression of interest and the second set;
Means for taking the meaning corresponding to the second set having the smallest distance from the translated word as the meaning of the word in the bilingual expression;
The translation device according to claim 5, comprising:
前記入力部から原言語の表現を入力するステップと、
原言語表現間の意味距離を計算する処理を制御して、原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶部から、前記入力された表現に最も類似する原言語表現に対する対訳表現を特定するステップと、
前記特定された対訳表現を用いて入力された前記原言語の表現の翻訳を行うステップと、
目的言語表現間の意味距離を計算する処理を制御して、前記翻訳を行うステップで訳が決定されなかった入力表現中の単語の訳を決定するステップと、
翻訳結果を前記出力部から出力するステップと、
を含む、ことを特徴とする翻訳方法。In a translation method in which a translation process of inputting a source language expression, converting it into a target language expression and outputting the same using a computer including an input unit and an output unit,
Inputting a source language expression from the input unit;
By controlling the process of calculating the semantic distance between the source language expressions, the input from the bilingual expression storage unit storing a bilingual expression consisting of a set of the source language expression and the target language expression corresponding to the source language expression, Identifying a bilingual expression for the source language expression that is most similar to the rendered expression;
Translating the input expression in the source language using the specified bilingual expression;
Controlling the process of calculating the semantic distance between the target language expressions, and determining the translation of the word in the input expression whose translation was not determined in the step of performing the translation;
Outputting a translation result from the output unit;
A translation method, comprising:
原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶部を参照し、前記対訳表現記憶部に記憶されている各対訳表現について、原言語の表現に意味の曖昧性がある場合に、原言語表現間の意味距離を計算する処理と、目的言語表現間の意味距離を計算する処理とを用いて、原言語の表現に与えられた訳から意味の曖昧性を予め解消しておくステップと、
前記入力部より原言語の表現を入力するステップと、
原言語表現間の意味距離を計算する処理を制御して、前記対訳表現記憶部から、前記入力表現に最も類似する原言語の表現に対する対訳表現(「最類似対訳表現」という)を特定するステップと、
特定された前記最類似対訳表現を用いて、前記入力された原言語の表現の翻訳を行うステップと、
翻訳結果を前記出力部から出力するステップと、
を含む、ことを特徴とする翻訳方法。In a translation method in which a translation process of inputting a source language expression, converting it into a target language expression and outputting the same using a computer including an input unit and an output unit,
Referring to a bilingual expression storage unit storing a bilingual expression composed of a set of a source language expression and a target language expression corresponding to the source language expression, for each bilingual expression stored in the bilingual expression storage unit, When there is ambiguity in the meaning of the linguistic expression, the processing is performed on the semantic distance between the source language expressions and the processing on the semantic distance between the target language expressions. A step of previously eliminating the ambiguity of the meaning from the translation;
Inputting a source language expression from the input unit;
Controlling a process of calculating a semantic distance between source language expressions, and specifying a bilingual expression (hereinafter, referred to as “most similar bilingual expression”) for the source language expression most similar to the input expression from the bilingual expression storage unit When,
Translating the input source language expression using the identified most similar bilingual expression;
Outputting a translation result from the output unit;
A translation method, comprising:
原言語の表現が予め定められた特定の構造を持つ場合に、前記構造の目的言語への訳し方を定めた翻訳規則を入力するステップと、
入力された前記翻訳規則の適用条件の原言語表現に意味の曖昧性のある場合には、原言語表現間の意味距離を計算する処理と、目的言語表現間の意味距離を計算する処理とを用いて、前記翻訳規則で原言語の表現に与えられた訳から意味の曖昧性を解消するステップと、
原言語表現間の意味距離を計算する処理を用いて、入力された前記翻訳規則の適用条件中の原言語表現を、意味的に類似した原言語表現に置き換えた類似規則を生成するステップと、
類似規則中の置き換えられた原言語の表現に対する訳語を決定するステップと、
翻訳結果を出力部から出力するステップと、
を含む、ことを特徴とする翻訳方法。In a translation method in which a translation process of inputting a source language expression, converting it into a target language expression and outputting the same using a computer including an input unit and an output unit,
When the source language expression has a predetermined specific structure, a step of inputting a translation rule that defines how to translate the structure into the target language;
When there is ambiguity of meaning in the source language expression of the application condition of the input translation rule, a process of calculating a semantic distance between the source language expressions and a process of calculating a semantic distance between the target language expressions are performed. Using the translation rules to resolve the ambiguity of meaning from the translation given to the source language expression,
Using a process of calculating a semantic distance between source language expressions, generating a similar rule in which the source language expression in the application condition of the input translation rule is replaced with a semantically similar source language expression,
Determining a translation for the replaced source language expression in the similarity rules;
Outputting a translation result from an output unit;
A translation method, comprising:
各翻訳規則について、適用条件中の原言語表現に意味の曖昧性のある場合には、原言語表現間の意味距離を計算する処理、目的言語表現間の意味距離を計算する処理を用いて、原言語表現に与えられた訳から意味の曖昧性を解消しておくステップと、
前記入力部から原言語の表現を入力するステップと、
原言語表現間の意味距離を計算する処理を制御して、規則記憶部から入力表現に類似する原言語表現に適用可能な対訳表現を特定するステップと、
特定された対訳表現から入力表現を翻訳するステップと、
翻訳結果を前記出力部から出力するステップと、
を含む、ことを特徴とする翻訳方法。In a translation method in which a translation process of inputting a source language expression, converting it into a target language expression and outputting the same using a computer including an input unit and an output unit,
For each translation rule, if there is ambiguity in the meaning of the source language expressions in the applicable conditions, a process of calculating the semantic distance between the source language expressions and a process of calculating the semantic distance between the target language expressions are used. Disambiguating the meaning from the translation given to the source language expression;
Inputting a source language expression from the input unit;
Controlling the process of calculating the semantic distance between the source language expressions, and identifying a bilingual expression applicable to the source language expression similar to the input expression from the rule storage unit;
Translating the input expression from the identified bilingual expression;
Outputting a translation result from the output unit;
A translation method, comprising:
前記対訳表現記憶部より対訳表現を入力するステップと、
前記対訳表現の原言語表現中で意味を複数有する単語を特定するステップと、
原言語表現間の意味距離を計算する処理を用いて、原言語表現中で意味を複数有する前記単語の各意味のそれぞれに対して、前記単語の類義語を求め、第1の集合を作成するステップと、
複数の前記第1の集合中の各単語の訳語を求め、第2の集合を作成するステップと、
注目している対訳表現で単語に与えられた訳語と前記第2の集合との意味距離を求めるステップと、
前記訳語と最も距離の小さい前記第2の集合に対応する意味を、前記対訳表現での単語の意味とするステップと、
を含む、ことを特徴とする請求項11に記載の翻訳方法。The step of eliminating the ambiguity of the meaning in advance,
Inputting a bilingual expression from the bilingual expression storage unit;
Identifying words having a plurality of meanings in the source language expression of the bilingual expression;
Generating a first set of synonyms of the word for each of the meanings of the word having a plurality of meanings in the source language expression by using a process of calculating a semantic distance between the source language expressions; When,
Determining a translation for each word in the plurality of first sets and creating a second set;
Calculating a semantic distance between the translated word given to the word in the bilingual expression of interest and the second set;
Making the meaning corresponding to the second set having the smallest distance from the translation word the meaning of the word in the bilingual expression;
The translation method according to claim 11, comprising:
前記入力部から原言語の表現を入力する処理と、
原言語表現間の意味距離を計算する処理と、
目的言語表現間の意味距離を計算する処理と、
前記原言語表現間の意味距離を計算する処理を制御して、原言語の表現と前記原言語の表現に対応する目的言語の表現の組からなる対訳表現を格納した対訳表現記憶部から、前記入力された表現に最も類似する原言語の表現に対する対訳表現を特定する処理と、
前記特定された対訳表現を用いて前記入力表現の翻訳を行う処理と、
前記目的言語表現間の意味距離を計算する処理を制御して、前記入力表現の翻訳を行う処理で訳が決定されなかった入力表現中の単語の訳を決定する処理と、
翻訳結果を前記出力部から出力する処理と、
を前記コンピュータに実行させるプログラム。In a program that causes a computer including an input unit and an output unit to execute a translation process of inputting a source language expression, converting the input language expression into a target language expression, and outputting
Inputting a source language expression from the input unit;
Processing for calculating the semantic distance between the source language expressions;
Processing for calculating the semantic distance between the target language expressions;
By controlling the process of calculating the semantic distance between the source language expressions, a bilingual expression storage unit storing a bilingual expression consisting of a set of a source language expression and a target language expression corresponding to the source language expression, A process of identifying a bilingual expression for a source language expression most similar to the input expression;
A process of translating the input expression using the specified bilingual expression;
Controlling a process of calculating a semantic distance between the target language expressions, and determining a translation of a word in the input expression whose translation has not been determined in the process of translating the input expression;
Outputting a translation result from the output unit;
For causing the computer to execute.
原言語表現間の意味距離を計算する処理と、
目的言語表現間の意味距離を計算する処理と、
原言語の表現と前記原言語の表現に対応する目的言語表現の組からなる対訳表現を格納した対訳表現記憶部を参照し、前記対訳表現記憶部に記憶されている各対訳表現について、原言語の表現に意味の曖昧性がある場合に、前記原言語表現間の意味距離を計算する処理と、前記目的言語表現間の意味距離を計算する処理とを用いて、原言語の表現に与えられた訳から意味の曖昧性を予め解消しておく処理と、
前記入力部より原言語の表現を入力する処理と、
前記原言語表現間の意味距離を計算する処理を制御して、前記対訳表現記憶部から、前記入力された表現に最も類似する原言語表現に対する対訳表現(「最類似対訳表現」という)を特定する処理と、
特定された前記最類似対訳表現を用いて、入力された前記原言語の表現の翻訳を行う処理と、
翻訳結果を前記出力部から出力する処理と、
を前記コンピュータに実行させるプログラム。In a program that causes a computer including an input unit and an output unit to execute a translation process of inputting a source language expression, converting the input language expression into a target language expression, and outputting
Processing for calculating the semantic distance between the source language expressions;
Processing for calculating the semantic distance between the target language expressions;
Referring to a bilingual expression storage unit storing a bilingual expression composed of a set of a source language expression and a target language expression corresponding to the source language expression, for each bilingual expression stored in the bilingual expression storage unit, When there is ambiguity in the meaning of the expression of the source language expression, the process of calculating the semantic distance between the source language expressions and the process of calculating the semantic distance between the target language expressions are applied to the source language expression. Processing to resolve the ambiguity of the meaning from the translation in advance,
Inputting a source language expression from the input unit;
By controlling the processing of calculating the semantic distance between the source language expressions, a bilingual expression (hereinafter referred to as “most similar bilingual expression”) for the source language expression most similar to the input expression is specified from the bilingual expression storage unit. Processing,
Using the specified most similar bilingual expression, a process of translating the input source language expression,
Outputting a translation result from the output unit;
For causing the computer to execute.
原言語表現間の意味距離を計算する処理と、
目的言語表現間の意味距離を計算する処理と、
原言語の表現が予め定められた特定の構造を持つ場合に、前記構造の目的言語への訳し方を定めた翻訳規則を入力する処理と、
入力された前記翻訳規則の適用条件の原言語表現に意味の曖昧性のある場合には、前記原言語表現間の意味距離を計算する処理と、前記目的言語表現間の意味距離を計算する処理とを用いて、前記翻訳規則で原言語の表現に与えられた訳から意味の曖昧性を解消する処理と、
前記原言語表現間の意味距離を計算する処理を用いて、入力された前記翻訳規則の適用条件中の原言語の表現を、意味的に類似した原言語の表現に置き換えた類似規則を生成する処理と、
類似規則中の置き換えられた原言語の表現に対する訳語を決定する処理と、
翻訳結果を出力部から出力する処理と、
を前記コンピュータに実行させるプログラム。In a program that causes a computer including an input unit and an output unit to execute a translation process of inputting a source language expression, converting the input language expression into a target language expression, and outputting
Processing for calculating the semantic distance between the source language expressions;
Processing for calculating the semantic distance between the target language expressions;
When the source language expression has a predetermined specific structure, a process of inputting a translation rule that defines how to translate the structure into the target language;
When the source language expressions of the application conditions of the input translation rules have ambiguity in meaning, a process of calculating a semantic distance between the source language expressions and a process of calculating a semantic distance between the target language expressions Processing to remove the ambiguity of the meaning from the translation given to the source language expression by the translation rule, and
Using a process of calculating a semantic distance between the source language expressions, generating a similar rule in which the source language expressions in the application conditions of the input translation rules are replaced with semantically similar source language expressions. Processing,
Determining a translation for the replaced source language expression in the similarity rules;
A process of outputting a translation result from an output unit;
For causing the computer to execute.
翻訳規則について、適用条件中の原言語の表現に意味の曖昧性のある場合には、原言語表現間の意味距離を計算する処理、目的言語表現間の意味距離を計算する処理を用いて、原言語の表現に与えられた訳から意味の曖昧性を解消しておく処理と、
前記入力部から原言語の表現を入力する処理と、
原言語表現間の意味距離を計算する処理を制御して、規則記憶部から、入力表現に類似する原言語の表現に適用可能な対訳表現を特定する処理と、
特定された対訳表現から、入力された原言語の表現を翻訳する処理と、
翻訳結果を前記出力部から出力する処理と
を前記コンピュータに実行させるプログラム。In a program that causes a computer including an input unit and an output unit to execute a translation process of inputting a source language expression, converting the input language expression into a target language expression, and outputting
Regarding the translation rules, when there is ambiguity in the meaning of the source language expressions in the applicable conditions, the process of calculating the semantic distance between the source language expressions and the process of calculating the semantic distance between the target language expressions are used. Processing to resolve meaning ambiguity from the translation given to the source language expression,
Inputting a source language expression from the input unit;
A process of controlling a process of calculating a semantic distance between source language expressions, and specifying a bilingual expression applicable to a source language expression similar to the input expression from the rule storage unit;
Translating the input source language expression from the specified bilingual expression;
Outputting the translation result from the output unit to the computer.
前記意味の曖昧性を予め解消しておく処理が、
前記対訳表現記憶部対訳表現を入力する処理と、
前記対訳表現の原言語表現中で意味を複数有する単語を特定する処理と、
原言語表現間の意味距離を計算する処理を用いて、原言語表現中で意味を複数有する前記単語の各意味のそれぞれに対して、前記単語の類義語を求め、第1の集合を作成する処理と、
複数の前記第1の集合中の各単語の訳語を求め、第2の集合を作成する処理と、
注目している対訳表現で単語に与えられた訳語と前記第2の集合との意味距離を求める処理と、
前記訳語と最も距離の小さい前記第2の集合に対応する意味を、前記対訳表現での単語の意味とする処理と、
を前記コンピュータに実行させるプログラム。The program according to claim 16,
The process of eliminating the ambiguity of the meaning in advance,
Inputting the bilingual expression storage unit bilingual expression;
A process of specifying a word having a plurality of meanings in the source language expression of the bilingual expression;
A process of calculating a synonym of the word for each of the meanings of the word having a plurality of meanings in the source language expression by using a process of calculating a semantic distance between the source language expressions, and creating a first set When,
A process of obtaining a translation of each word in the plurality of first sets and creating a second set;
A process of calculating a semantic distance between a translated word given to a word in the bilingual expression of interest and the second set;
A process of setting the meaning corresponding to the second set having the smallest distance to the translated word as the meaning of the word in the bilingual expression;
For causing the computer to execute.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002222772A JP4239505B2 (en) | 2002-07-31 | 2002-07-31 | Translation apparatus, translation method, program, and recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002222772A JP4239505B2 (en) | 2002-07-31 | 2002-07-31 | Translation apparatus, translation method, program, and recording medium |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004062726A true JP2004062726A (en) | 2004-02-26 |
| JP4239505B2 JP4239505B2 (en) | 2009-03-18 |
Family
ID=31942711
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002222772A Expired - Fee Related JP4239505B2 (en) | 2002-07-31 | 2002-07-31 | Translation apparatus, translation method, program, and recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4239505B2 (en) |
Cited By (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008234645A (en) * | 2007-03-21 | 2008-10-02 | Toshiba Corp | Translation generation method and apparatus and machine translation |
| WO2009107456A1 (en) * | 2008-02-29 | 2009-09-03 | シャープ株式会社 | Information processing device, method, and program |
| JP2009217367A (en) * | 2008-03-07 | 2009-09-24 | Fujifilm Corp | Relevant word dictionary creating method and apparatus, and relevant word dictionary creating program |
| US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
| US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
| US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
| WO2014104944A1 (en) * | 2012-12-27 | 2014-07-03 | Abbyy Development Llc | Dictionary markup method |
| US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
| US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
| US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
| US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
| US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
| US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
| US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
| US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
| US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
| US9772995B2 (en) | 2012-12-27 | 2017-09-26 | Abbyy Development Llc | Finding an appropriate meaning of an entry in a text |
| US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
| US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
| CN111859998A (en) * | 2020-06-18 | 2020-10-30 | 北京百度网讯科技有限公司 | Method, apparatus, electronic device and readable storage medium for text translation |
| US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
-
2002
- 2002-07-31 JP JP2002222772A patent/JP4239505B2/en not_active Expired - Fee Related
Cited By (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
| US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
| US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
| US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
| US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
| JP2008234645A (en) * | 2007-03-21 | 2008-10-02 | Toshiba Corp | Translation generation method and apparatus and machine translation |
| US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
| US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
| US8407040B2 (en) | 2008-02-29 | 2013-03-26 | Sharp Kabushiki Kaisha | Information processing device, method and program |
| JP5319655B2 (en) * | 2008-02-29 | 2013-10-16 | シャープ株式会社 | Information processing apparatus, information processing method, program, and computer-readable recording medium recording the program |
| WO2009107456A1 (en) * | 2008-02-29 | 2009-09-03 | シャープ株式会社 | Information processing device, method, and program |
| JP2009217367A (en) * | 2008-03-07 | 2009-09-24 | Fujifilm Corp | Relevant word dictionary creating method and apparatus, and relevant word dictionary creating program |
| US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
| US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
| US10984429B2 (en) | 2010-03-09 | 2021-04-20 | Sdl Inc. | Systems and methods for translating textual content |
| US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
| US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
| US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
| US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
| US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US10402498B2 (en) | 2012-05-25 | 2019-09-03 | Sdl Inc. | Method and system for automatic management of reputation of translators |
| US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
| US9772995B2 (en) | 2012-12-27 | 2017-09-26 | Abbyy Development Llc | Finding an appropriate meaning of an entry in a text |
| WO2014104944A1 (en) * | 2012-12-27 | 2014-07-03 | Abbyy Development Llc | Dictionary markup method |
| US20140188456A1 (en) * | 2012-12-27 | 2014-07-03 | Abbyy Development Llc | Dictionary Markup System and Method |
| US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
| CN111859998A (en) * | 2020-06-18 | 2020-10-30 | 北京百度网讯科技有限公司 | Method, apparatus, electronic device and readable storage medium for text translation |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4239505B2 (en) | 2009-03-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4239505B2 (en) | Translation apparatus, translation method, program, and recording medium | |
| JP4694121B2 (en) | Statistical method and apparatus for learning translation relationships between phrases | |
| US7565281B2 (en) | Machine translation | |
| US7496496B2 (en) | System and method for machine learning a confidence metric for machine translation | |
| US20040255281A1 (en) | Method and apparatus for improving translation knowledge of machine translation | |
| US20040254781A1 (en) | Machine translation | |
| US20090326913A1 (en) | Means and method for automatic post-editing of translations | |
| US20050171757A1 (en) | Machine translation | |
| CN101320366A (en) | Apparatus and method for machine translation | |
| US20050137853A1 (en) | Machine translation | |
| KR100530154B1 (en) | Method and Apparatus for developing a transfer dictionary used in transfer-based machine translation system | |
| JP2006012168A (en) | How to improve coverage and quality in a translation memory system | |
| JP2008262587A (en) | Example based machine translation system | |
| Kumar et al. | Factored Statistical Machine Translation System for English to Tamil Language. | |
| Ive et al. | Reassessing the proper place of man and machine in translation: a pre-translation scenario | |
| JP4869281B2 (en) | Machine translation apparatus, program and method | |
| Tambouratzis | Conditional Random Fields versus template-matching in MT phrasing tasks involving sparse training data | |
| Collins et al. | An example-based approach to machine translation | |
| Rikters et al. | Combining machine translated sentence chunks from multiple MT systems | |
| JP2006024114A (en) | Machine translation apparatus and machine translation computer program | |
| Rikters | K-Translate-Interactive Multi-system Machine Translation | |
| Simov et al. | Factored models for deep machine translation | |
| Jusoh et al. | Automated translation machines: Challenges and a proposed solution | |
| JP5207016B2 (en) | Machine translation evaluation apparatus and method | |
| JP3388393B2 (en) | Translation device for tense, aspect or modality using database |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050615 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080310 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080401 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080430 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080530 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20080508 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080604 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080611 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080819 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081020 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081202 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081215 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4239505 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |