JPH05197752A - Machine translation system - Google Patents
Machine translation systemInfo
- Publication number
- JPH05197752A JPH05197752A JP4031628A JP3162892A JPH05197752A JP H05197752 A JPH05197752 A JP H05197752A JP 4031628 A JP4031628 A JP 4031628A JP 3162892 A JP3162892 A JP 3162892A JP H05197752 A JPH05197752 A JP H05197752A
- Authority
- JP
- Japan
- Prior art keywords
- original
- original sentence
- morpheme
- translation
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 abstract description 19
- 235000016496 Panda oleosa Nutrition 0.000 abstract 2
- 240000000220 Panda oleosa Species 0.000 abstract 2
- 230000014509 gene expression Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 5
- 206010023497 kuru Diseases 0.000 description 4
- 239000000284 extract Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、機械翻訳装置に係り、
特に原文中の形態素を修正し,その修正された原文を再
翻訳することができるシステム,または原文中の形態素
を分割する(すなわち語切りを指定する)ことができる
機械翻訳装置に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device,
In particular, the present invention relates to a system that can correct a morpheme in an original sentence and retranslate the corrected original sentence, or a machine translation device that can divide a morpheme in the original sentence (that is, specify word segmentation).
【0002】[0002]
【従来の技術】機械翻訳においては、システムが語切り
を間違えたり、利用者の意図したものと異なる語切りを
したりする場合がある。これは、特にひらがな表記の多
い原文の翻訳の時に起こりやすい。そこで、翻訳処理で
語切りを間違えた場合や翻訳する前に、利用者が語切り
を指定することができるような機械翻訳装置が提案され
ている。この機械翻訳装置では、その語切り情報を含ん
だ原文が画面に表示され、利用者が意識的に語切りをし
たい部分を指定した後で、再翻訳することにより正しい
訳文を得ることが可能となる。2. Description of the Related Art In machine translation, a system sometimes makes a mistake in word segmentation or makes a segmentation different from the one intended by a user. This is especially likely to occur when translating an original text that has many Hiragana notations. Therefore, there has been proposed a machine translation device that allows a user to specify a word cut when the word cut is incorrect in the translation process or before translation. With this machine translation device, the original sentence containing the word cut information is displayed on the screen, and after the user consciously specifies the part to cut the word, the correct translation can be obtained by retranslating. Become.
【0003】[0003]
【発明が解決しようとする課題】しかし、このような従
来例においては、語切りをしてもその形態素がひらがな
表記の場合には、辞書にひらがな表記の見出しで登録さ
れていないことが多く、もし登録されていてもあいまい
であるため、語切りの指定の他に、そのひらがな表記を
漢字表記に改めるか、又は辞書にそのひらがな表記の見
出しで登録することが必要であった。つまり、ひらがな
表記の多い原文に対して、利用者が語切りの指定をする
ことが比較的多いのに、語切りだけではなかなか正しい
訳文が得られないという非効率的操作となっていた。However, in such a conventional example, when the morpheme is in Hiragana notation even if the word is cut, it is often not registered in the dictionary in Hiragana notation, Since it is ambiguous even if it is registered, it was necessary to change the hiragana notation to kanji notation, or to register it in the dictionary with the heading of the hiragana notation, in addition to specifying the word break. In other words, it is an inefficient operation that the user often specifies the word segmentation for the original sentence with many hiragana notations, but it is difficult to obtain the correct translated sentence only with the word segmentation.
【0004】[0004]
【発明の目的】本発明は、かかる従来例に有する不都合
を改善し、とくに、効率敵により正しい訳文を得ること
を可能とした機械翻訳装置を提供することを、その目的
とする。SUMMARY OF THE INVENTION It is an object of the present invention to provide a machine translation device which is capable of improving the disadvantages of the conventional example and, in particular, being able to obtain a correct translated sentence by an efficiency opponent.
【0005】[0005]
【課題を解決するための手段】本発明では、日本語から
他の言語に翻訳する時に語切り指定を受け入れると共に
原文を修正した後で再翻訳する機能を備えた機械翻訳シ
ステムにおいて、原文を入力する入力部と、辞書を参照
して翻訳処理を行う翻訳処理部とを備え、未翻訳の時に
は原文を,また翻訳処理の後にはその語切り情報を含ん
だ原文をそれぞれ画面に表示し,原文中のひらがな表記
の形態素に対し利用者の指定により、辞書にある見出し
語とそのひらがな表記との対応テーブルを参照して適切
な漢字表記に変換させるとともに,語切りを指定するこ
とができる原文形態素変換部を装備すると共に、翻訳処
理部によって得られる訳文を出力する出力部とを備え
る、という構成を採っている。これによって前述した目
的を達成しようとするものである。According to the present invention, an original sentence is input in a machine translation system having a function of accepting a word cut specification when translating from Japanese into another language and correcting the original sentence and then retranslating it. Input unit and a translation processing unit that performs a translation process by referring to a dictionary. When the translation process is not performed, the original sentence is displayed, and after the translation process, the original sentence including the word segmentation information is displayed on the screen. A morpheme in the text that allows the user to specify a morpheme in Hiragana notation and convert it to an appropriate Kanji notation by referring to the correspondence table between the entry word and its Hiragana notation in the dictionary, according to the user's specification. The configuration is such that the conversion unit is provided and an output unit that outputs a translated sentence obtained by the translation processing unit is provided. This aims to achieve the above-mentioned object.
【0006】[0006]
【実施例】以下、本発明について図面を参照して実施例
に従って説明する。図1は本発明の構成、図2は本発明
の一実施例の具体例を示す構成図、図3は本発明の一実
施例において参照される辞書にある「見出し語とそのひ
らがな表記との対応テーブル」の一部分を示す説明図で
ある。図中、符号11は入力部、符号12は制御部、符
号13は翻訳処理部、符号14は原文形態素変換部、符
号15は出力部、符号21は入力部、符号22は制御
部、符号23は翻訳処理部、符号24は原文形態素変換
部、符号25は出力部を各々示す。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below with reference to the drawings in accordance with embodiments. FIG. 1 is a configuration of the present invention, FIG. 2 is a configuration diagram showing a specific example of one embodiment of the present invention, and FIG. 3 is a diagram showing “headwords and their hiragana notation” in a dictionary referred to in one embodiment of the present invention. It is explanatory drawing which shows a part of "correspondence table." In the figure, reference numeral 11 is an input section, reference numeral 12 is a control section, reference numeral 13 is a translation processing section, reference numeral 14 is an original morphological conversion section, reference numeral 15 is an output section, reference numeral 21 is an input section, reference numeral 22 is a control section, reference numeral 23. Is a translation processing unit, reference numeral 24 is an original sentence morpheme conversion unit, and reference numeral 25 is an output unit.
【0007】入力部11は、例えばキーボードからの原
文の入力の処理を行うものである。制御部12は、以下
の五つの機能を持つ。入力部11から原文を読み込
み、翻訳処理部13へ渡す。翻訳処理部13から語切
り情報を含んだ原文を読み込み、原文形態素変換部14
へ渡す。未翻訳の時には、入力部11から原文を読み
込み、原文形態素変換部14へ渡す。原文形態素変換
部14から原文中の形態素を変換した修正済原文を読み
込み、翻訳処理部13へ渡す。翻訳処理部13で翻訳
処理終了後、訳文を取り出し、出力部15へ渡す。The input unit 11 is for processing the input of an original sentence from a keyboard, for example. The control unit 12 has the following five functions. The original sentence is read from the input unit 11 and passed to the translation processing unit 13. The original sentence including the word segmentation information is read from the translation processing unit 13, and the original sentence morpheme converting unit 14 is read.
Hand over to. When untranslated, the original sentence is read from the input unit 11 and passed to the original sentence morpheme conversion unit 14. The corrected original sentence obtained by converting the morphemes in the original sentence is read from the original sentence morpheme converting unit 14 and passed to the translation processing unit 13. After the translation processing is completed by the translation processing unit 13, the translated text is taken out and passed to the output unit 15.
【0008】翻訳処理部13は、入力部11から与えら
れる原文や、原文形態素変換部14から与えられる修正
済原文を翻訳し、語切り指定を考慮して訳文を生成する
ものである。原文形態素変換部14は、未翻訳の時には
原文を、翻訳処理の後にはその語切り情報を含んだ原文
をそれぞれ画面に表示して、利用者の指定によりひらが
な表記の原文形態素を適切な漢字表記に変換する処理を
行うとともに、その原文形態素に語切り指定の情報を与
えるものである。また出力部15は、翻訳処理部13の
翻訳結果である訳文を、例えば画面に表示するものであ
る。The translation processing unit 13 translates the original sentence provided from the input unit 11 and the corrected original sentence provided from the original sentence morpheme conversion unit 14 to generate a translated sentence in consideration of word segmentation. The source sentence morpheme conversion unit 14 displays the original sentence on the screen when it is not translated, and displays the original sentence including the word segmentation information after the translation process. In addition to performing the process of converting to, the original sentence morpheme is given the information for specifying the word segmentation. Further, the output unit 15 displays a translated sentence, which is a translation result of the translation processing unit 13, on a screen, for example.
【0009】次に、図2および図3を用いて本実施例の
動作を示す。ここで、図2は一度原文を翻訳してから、
その語切り情報を含む原文を原文形態素変換部において
修正する動作を示している。利用者の指定による修正
は、例えば以下のようにして行う。まず、制御部22
は、入力部21から原文「彼がくるまで待つ。」を読み
込み、翻訳処理部23へ渡す。さらに、翻訳処理が終了
後、制御部22は翻訳処理部23から語切り情報を含む
原文を取り出し、原文形態素変換部24へ送る。原文形
態素変換部24は語切り情報を含む原文を画面に表示
し、利用者の指定を受け付ける。語切り情報を含んだ原
文は、語切りを明確にするために、語切りされた形態素
の間に空白を挿入して表示される。したがって、翻訳処
理により、「彼」「が」「くるま」「で」「待つ」のよ
うに語切りが行われたとすると、図2のように「彼 が
くるま で 待つ。」と表示される。Next, the operation of this embodiment will be described with reference to FIGS. Here, in Figure 2, once the original text has been translated,
The operation of correcting the original sentence including the word segmentation information in the original sentence morpheme conversion unit is shown. The correction specified by the user is performed as follows, for example. First, the control unit 22
Reads the original sentence "Wait until he comes." From the input unit 21 and passes it to the translation processing unit 23. Further, after the translation processing is completed, the control unit 22 extracts the original sentence including the word segmentation information from the translation processing unit 23 and sends it to the original sentence morpheme conversion unit 24. The original sentence morpheme conversion unit 24 displays the original sentence including the word segmentation information on the screen and receives the user's designation. The original sentence including the word segmentation information is displayed by inserting a space between the segmented morphemes in order to clarify the word segmentation. Therefore, if the translation process cuts words such as "he", "ga", "car", "de", and "wait", "He waits for car" is displayed as shown in FIG.
【0010】さて、原文「彼がくるまで待つ。」は、
「彼が来るまで待つ。」と「彼が車で待つ。」の二通
りの解釈が考えられる。ここでは、「彼が来るまで待
つ。」を採用することにして、ひらがな表記の形態素
「くる」を漢字表記の形態素「来る」に変換する操作を
示す。利用者が画面上で、原文中のひらがな表記の形態
素「くる」をマウス等で指示すると、辞書中にひらがな
読みで「くる」となる見出し語が検索され、その条件に
合う語が変換候補として表示される。Now, the original sentence "Wait until he comes."
There are two possible interpretations: "Wait until he comes." And "Wait by car." Here, by adopting "wait until he comes.", The operation of converting the morpheme "Kuru" in Hiragana notation to the morpheme "Kuru" in Kanji notation is shown. When the user indicates on the screen the morpheme "Kuru" of the Hiragana notation in the original text with a mouse etc., the dictionary will search for the entry word "Kuru" in Hiragana reading and the words that match that condition will be selected as conversion candidates. Is displayed.
【0011】ここで、見出し語を検索する方法として、
図3に示した、辞書にある見出し語とそのひらがな表記
との対応テーブルを参照することにより、容易に候補を
検索できる。図3のテーブルより、「来る」、「繰
る」、「刳る」の三種類が候補として表示される。利用
者が、その候補の中から適切な見出し語(「来る」)を
何等かの操作によって選択することにより、その形態素
は自動的に漢字表記に変換され、原文の修正結果は「彼
が来るまで待つ。」となる。さらに、マウス等で指示さ
れた形態素「来る」が語切り指定されたことになる。続
いて、制御部22は原文形態素変換部24から修正済原
文を取り出し、語切り指定を受け入れる翻訳処理部23
へ渡す。翻訳処理部23は原文形態素変換部24におい
て変換された形態素とその語切り指定を反映するように
訳文を生成する。最後に、制御部22は翻訳処理部23
から訳文を取り出し、出力部25へ渡す。Here, as a method for searching for a headword,
Candidates can be easily searched by referring to the correspondence table of headwords and their hiragana notation in the dictionary shown in FIG. From the table of FIG. 3, three types of “come”, “roll”, and “cure” are displayed as candidates. When the user selects an appropriate headword (“come”) from the candidates by some operation, the morpheme is automatically converted into kanji notation, and the correction result of the original text is “He comes Wait until. " Further, the morpheme "come" designated by the mouse or the like is designated as a word break. Subsequently, the control unit 22 takes out the corrected original sentence from the original sentence morpheme conversion unit 24 and receives the word segmentation designation.
Hand over to. The translation processing unit 23 generates a translated sentence so as to reflect the morpheme converted by the original sentence morpheme converting unit 24 and the word segmentation designation. Finally, the control unit 22 uses the translation processing unit 23.
The translated text is taken out from and passed to the output unit 25.
【0012】また、「彼が車で待つ。」を採用する場
合には、利用者は画面上で原文中のひらがな表記の形態
素「くるま」を指示する。すると、図3のテーブルによ
り、辞書中にひらがな読みで「くるま」となる見出し語
が検索され、その条件に合う語「車」が変換候補として
表示される。それ以降の操作は、を採用する場合と同
様である。Further, in the case of adopting "He waits in the car.", The user indicates on the screen the morpheme "car" of the Hiragana notation in the original text. Then, the table of FIG. 3 is searched for a headword in the dictionary, which is “car” in hiragana reading, and the word “car” that meets the condition is displayed as a conversion candidate. Subsequent operations are the same as when adopting.
【0013】[0013]
【発明の効果】以上説明したように本発明によれば、日
本語から他の言語に翻訳する時に語切り指定を受け入れ
ることができ、原文を修正した後で再翻訳することがで
きる機械翻訳システムにおいて、原文中のひらがな表記
の形態素に対して、検索方法の一例として、辞書にある
見出し語とそのひらがな表記との対応テーブルを参照す
ることにより、対応する漢字表記の形態素の候補の中か
ら利用者によって選択された適切な漢字表記に変換し、
さらにその形態素が語切り指定されたとして再翻訳する
ことにより、効率的に正しい訳文を得ることができると
いう従来にない優れた機械翻訳装置を提供することがで
きる。As described above, according to the present invention, it is possible to accept a word cut specification when translating from Japanese into another language, and to retranslate after correcting the original sentence. For the morpheme of Hiragana notation in the original sentence, as an example of the search method, by referring to the correspondence table of the entry word in the dictionary and its Hiragana notation, it is used from the corresponding morpheme of Kanji notation Converted to the appropriate Kanji notation selected by the person
Further, by retranslating the morpheme with the word segmentation designated, it is possible to provide an excellent machine translation device that does not exist in the related art in which a correct translated sentence can be efficiently obtained.
【図1】本発明の一実施例を示す構成図である。FIG. 1 is a configuration diagram showing an embodiment of the present invention.
【図2】本発明の一実施例の構成及び動作を示す説明図
である。FIG. 2 is an explanatory diagram showing the configuration and operation of one embodiment of the present invention.
【図3】本発明の一実施例において参照される辞書にあ
る見出し語とそのひらがな表記との対応テーブルの一部
分を示す説明図である。FIG. 3 is an explanatory diagram showing a part of a correspondence table of headwords and their hiragana notation in a dictionary referred to in an embodiment of the present invention.
11,21 入力部 12,22 制御部 13,23 翻訳処理部 14,24 原文形態素変換部 15,25 出力部 11,21 Input unit 12,22 Control unit 13,23 Translation processing unit 14,24 Original sentence morpheme conversion unit 15,25 Output unit
Claims (1)
り指定を受け入れると共に原文を修正した後で再翻訳す
る機能を備えた機械翻訳システムにおいて、原文を入力
する入力部と、辞書を参照して翻訳処理を行う翻訳処理
部とを備え、未翻訳の時には原文を,また翻訳処理の後
にはその語切り情報を含んだ原文をそれぞれ画面に表示
し,原文中のひらがな表記の形態素に対し利用者の指定
により、辞書にある見出し語とそのひらがな表記との対
応テーブルを参照して適切な漢字表記に変換させるとと
もに,語切りを指定することができる原文形態素変換部
を装備すると共に、前記翻訳処理部によって得られる訳
文を出力する出力部とを備えたことを特徴とする機械翻
訳装置。1. In a machine translation system having a function of accepting a word cut specification when translating from Japanese into another language and retranslating after correcting the original sentence, refer to an input unit for inputting the original sentence and a dictionary. It has a translation processing unit that performs translation processing, and displays the original sentence when it is not translated and the original sentence that includes the word break information after the translation process, respectively, for the morphemes in Hiragana notation in the original sentence. According to the user's designation, the corresponding table of the headword in the dictionary and its hiragana notation is referred to and converted into an appropriate Kanji notation, and the original sentence morpheme conversion unit capable of designating the word cut is equipped and A machine translation device, comprising: an output unit that outputs a translated text obtained by the translation processing unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4031628A JP2894064B2 (en) | 1992-01-22 | 1992-01-22 | Machine translation equipment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4031628A JP2894064B2 (en) | 1992-01-22 | 1992-01-22 | Machine translation equipment |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05197752A true JPH05197752A (en) | 1993-08-06 |
JP2894064B2 JP2894064B2 (en) | 1999-05-24 |
Family
ID=12336480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4031628A Expired - Fee Related JP2894064B2 (en) | 1992-01-22 | 1992-01-22 | Machine translation equipment |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2894064B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563645A (en) * | 2018-04-24 | 2018-09-21 | 成都智信电子技术有限公司 | The metadata interpretation method and device of HIS systems |
-
1992
- 1992-01-22 JP JP4031628A patent/JP2894064B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108563645A (en) * | 2018-04-24 | 2018-09-21 | 成都智信电子技术有限公司 | The metadata interpretation method and device of HIS systems |
CN108563645B (en) * | 2018-04-24 | 2022-03-22 | 成都智信电子技术有限公司 | Metadata translation method and device of HIS (hardware-in-the-system) |
Also Published As
Publication number | Publication date |
---|---|
JP2894064B2 (en) | 1999-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5587902A (en) | Translating system for processing text with markup signs | |
JP2654001B2 (en) | Machine translation method | |
JPH02140868A (en) | Machine translating system | |
US5075851A (en) | System for translating a source language word with a prefix into a target language word with multiple forms | |
JPH0332106B2 (en) | ||
JPH05197752A (en) | Machine translation system | |
JP3244286B2 (en) | Translation processing device | |
JP4054353B2 (en) | Machine translation apparatus and machine translation program | |
JP2719453B2 (en) | Machine translation equipment | |
JP3197110B2 (en) | Natural language analyzer and machine translator | |
JPH07200605A (en) | Translation device | |
JPH06162071A (en) | Machine translation device | |
JP2947554B2 (en) | Machine translation equipment | |
JPS5995672A (en) | Translating and editing system | |
JPH09185629A (en) | Machine translation method | |
JPH10269221A (en) | Unregistered word processing method | |
JP3253311B2 (en) | Language processing apparatus and language processing method | |
JPS63136264A (en) | machine translation device | |
JPH07122876B2 (en) | Machine translation device | |
JPH09101960A (en) | Machine translation equipment | |
JPH03225468A (en) | Machine translation device | |
JPH0444981B2 (en) | ||
JPH0635955A (en) | Machine translation device | |
JPH02110771A (en) | Telegraph machine | |
JPH0251764A (en) | Index production system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990202 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080305 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090305 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090305 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100305 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |