JP2009289219A - 翻訳メモリ翻訳装置および翻訳プログラム - Google Patents
翻訳メモリ翻訳装置および翻訳プログラム Download PDFInfo
- Publication number
- JP2009289219A JP2009289219A JP2008143939A JP2008143939A JP2009289219A JP 2009289219 A JP2009289219 A JP 2009289219A JP 2008143939 A JP2008143939 A JP 2008143939A JP 2008143939 A JP2008143939 A JP 2008143939A JP 2009289219 A JP2009289219 A JP 2009289219A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- language
- example sentence
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 305
- 230000014616 translation Effects 0.000 claims abstract description 313
- 238000006243 chemical reaction Methods 0.000 claims description 69
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000013507 mapping Methods 0.000 claims description 19
- 238000003780 insertion Methods 0.000 claims description 15
- 230000037431 insertion Effects 0.000 claims description 15
- 238000006467 substitution reaction Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 27
- 230000000877 morphologic effect Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 108091028140 FREP Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】 翻訳メモリ翻訳装置100は、例文対訳辞書128を参照し、入力文と完全に一致する第1言語の例文を検索する検索手段と、検索手段により一致する例文が検索されないとき、入力文と第1言語の例文との差分に基づき入力文に類似する第1言語の例文候補を選択する例文選択部142と、例文候補の対訳となる第2言語の例文の中から差分に対応する文字列を識別し、入力文と第2言語の例文の対応関係を求める単語アライメント部144と、識別された文字列を差分に基づき変換することで入力文の第2言語の訳文を生成する訳文生成部148とを有する。
【選択図】 図4
Description
さらに本発明は、例文対訳辞書を利用して完全に照合しない入力文であっても精度良く翻訳することができる翻訳メモリ翻訳装置および翻訳プログラムを提供することを目的とする。
例文CSのSim(c,j)≠1の各単語cについて、訳文JSのSim(w,j)≠1の任意の単語jに対して、単語と訳語間の相関度Assを計算する。
14:翻訳メモリ装置 16:例文パターンベース翻訳装置
18:単語直訳翻訳装置 20:目的言語テキスト出力部
22:翻訳不適切文自動回収部 24:学習装置
26c:例文パターン対訳辞書 26a:単語対訳辞書
26b:例文対訳辞書 26:形態素解析部
26:翻訳辞書 100:翻訳メモリ翻訳装置
106:形態素解析部 108:例文ベース翻訳部
120:翻訳モデル部 122:生成モデル部
124:単語/チャンク対訳辞書 140:第1のマッチング変換部
142:例文選択部 144:単語アライメント部
146:第2のマッチング変換部 148:訳文生成部
700:入力装置 702:表示装置
704:主記憶装置 706:記憶装置
708:中央処理装置(CPU) 710:バス
Claims (11)
- 第1言語の入力文を入力する入力手段と、
第1言語の例文と当該第1の例文の対訳となる第2言語の例文を記憶する例文対訳辞書と、
前記例文対訳辞書を参照し、前記入力文と完全に一致する第1言語の例文を検索する検索手段と、
前記検索手段により一致する例文が検索されないとき、前記入力文と第1言語の例文との差分に基づき前記入力文に類似する第1言語の例文候補を選択する例文候補選択手段と、
前記例文候補の対訳となる第2言語の例文の中から前記差分に対応する文字列を識別し、前記入力文と第2言語の例文の対応関係を求める手段と、
前記識別された文字列を前記差分に基づき変換することで前記入力文の第2言語の訳文を生成する生成手段と、
を有する翻訳メモリ翻訳装置 - 前記例文候補選択手段は、前記入力文の文字列と第1言語の例文の文字列間の編集距離が最小となる変換写像を行うことにより前記差分を求める、請求項1に記載の翻訳メモリ翻訳装置。
- 前記差分は、前記入力文の文字列と第1言語の例文の文字列の重みが非ゼロの置換および第1言語の例文の文字列の挿入の少なくとも一方を含む、請求項2に記載の翻訳メモリ翻訳装置。
- 前記例文候補選択手段は、前記置換、および前記挿入の数が予め決められた条件を満足する例文を例文候補として選択する、請求項3に記載の翻訳メモリ翻訳装置。
- 前記生成手段は、前記差分が置換であるとき、前記識別された文字列を対応する第2言語の文字列に変換し、前記差分が挿入であるとき、前記識別された文字列を削除する変換を行う、請求項3に記載の翻訳メモリ翻訳装置。
- 前記入力手段は、入力文を複数の文字列に形態素解析する解析手段を含む、請求項1に記載の翻訳メモリ翻訳装置。
- 第1言語の例文と当該第1の例文の対訳となる第2の言語の例文を記憶する例文対訳辞書を参照して訳文を生成する翻訳メモリ翻訳装置が実行する翻訳プログラムであって、
第1言語の入力文と一致する第1言語の例文が前記例文対訳辞書に含まれているか否かを検索し、一致する例文が含まれていないとき、前記入力文と第1言語の例文との差分に基づき前記入力文に類似する第1言語の例文候補を選択するステップと、
前記例文候補の対訳となる第2言語の例文の中から前記差分に対応する文字列を識別し、前記入力文と第2言語の例文の対応関係を求めるステップと、
前記識別された文字列を前記差分に基づき変換することで前記入力文の第2言語の訳文を生成するステップと、
を有する翻訳プログラム。 - 前記選択するステップは、前記入力文の文字列と第1言語の例文の文字列間の編集距離が最小となる変換写像を行うことにより前記差分を求める、請求項7に記載の翻訳プログラム。
- 前記差分は、前記入力文の文字列と第1言語の例文の文字列の重みが非ゼロの置換および第1言語の例文の文字列の挿入の少なくとも一方を含む、請求項8に記載の翻訳プログラム。
- 前記選択するステップは、前記置換および前記挿入の数が予め決められた条件を満足する例文を例文候補として選択する、請求項9に記載の翻訳プログラム。
- 前記生成するステップは、前記差分が置換であるとき、前記識別された文字列を対応する第2言語の文字列に変換し、前記差分が挿入であるとき、前記識別された文字列を削除する変換を行う、請求項8に記載の翻訳プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008143939A JP5386855B2 (ja) | 2008-05-30 | 2008-05-30 | 翻訳メモリ翻訳装置および翻訳プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008143939A JP5386855B2 (ja) | 2008-05-30 | 2008-05-30 | 翻訳メモリ翻訳装置および翻訳プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2009289219A true JP2009289219A (ja) | 2009-12-10 |
| JP5386855B2 JP5386855B2 (ja) | 2014-01-15 |
Family
ID=41458341
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008143939A Expired - Fee Related JP5386855B2 (ja) | 2008-05-30 | 2008-05-30 | 翻訳メモリ翻訳装置および翻訳プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5386855B2 (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011197713A (ja) * | 2010-03-17 | 2011-10-06 | Fuji Xerox Co Ltd | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム |
| JP2011197716A (ja) * | 2010-03-17 | 2011-10-06 | Fuji Xerox Co Ltd | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム |
| KR101731016B1 (ko) * | 2015-09-14 | 2017-04-27 | 네이버 주식회사 | 상황 인지 기반 번역 제공 방법 및 이를 위한 장치 |
| JP2018032324A (ja) * | 2016-08-26 | 2018-03-01 | 株式会社エヌ・ティ・ティ・データ | 対訳文抽出装置、対訳文抽出方法およびプログラム |
| CN112633015A (zh) * | 2020-12-30 | 2021-04-09 | 语联网(武汉)信息技术有限公司 | 文档翻译方法、装置、电子设备及存储介质 |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10116286A (ja) * | 1996-10-09 | 1998-05-06 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語翻訳方法及び装置 |
| JP2000250913A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体 |
| JP2003006193A (ja) * | 2001-06-20 | 2003-01-10 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 機械翻訳装置および方法 |
| JP2005234800A (ja) * | 2004-02-18 | 2005-09-02 | Advanced Telecommunication Research Institute International | 用例機械翻訳装置及び用例翻訳コンピュータプログラム、並びに用例検索装置及び用例検索コンピュータプログラム |
| JP2006004366A (ja) * | 2004-06-21 | 2006-01-05 | Advanced Telecommunication Research Institute International | 機械翻訳システム及びそのためのコンピュータプログラム |
| JP2007149109A (ja) * | 2006-12-22 | 2007-06-14 | Fujitsu Ltd | 翻訳支援装置 |
| JP2007199793A (ja) * | 2006-01-23 | 2007-08-09 | Fuji Xerox Co Ltd | 単語アライメント例文対訳辞書学習装置と訳語抽出装置 |
-
2008
- 2008-05-30 JP JP2008143939A patent/JP5386855B2/ja not_active Expired - Fee Related
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10116286A (ja) * | 1996-10-09 | 1998-05-06 | Nippon Telegr & Teleph Corp <Ntt> | 自然言語翻訳方法及び装置 |
| JP2000250913A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体 |
| JP2003006193A (ja) * | 2001-06-20 | 2003-01-10 | Atr Onsei Gengo Tsushin Kenkyusho:Kk | 機械翻訳装置および方法 |
| JP2005234800A (ja) * | 2004-02-18 | 2005-09-02 | Advanced Telecommunication Research Institute International | 用例機械翻訳装置及び用例翻訳コンピュータプログラム、並びに用例検索装置及び用例検索コンピュータプログラム |
| JP2006004366A (ja) * | 2004-06-21 | 2006-01-05 | Advanced Telecommunication Research Institute International | 機械翻訳システム及びそのためのコンピュータプログラム |
| JP2007199793A (ja) * | 2006-01-23 | 2007-08-09 | Fuji Xerox Co Ltd | 単語アライメント例文対訳辞書学習装置と訳語抽出装置 |
| JP2007149109A (ja) * | 2006-12-22 | 2007-06-14 | Fujitsu Ltd | 翻訳支援装置 |
Non-Patent Citations (2)
| Title |
|---|
| CSNG200500558015; 土居 誉生、隅田 英一郎、山本 博史: '編集距離を使った用例翻訳の高速検索方式と翻訳性能評価' 情報処理学会論文誌 第45巻 第6号 第45巻 第6号, 20040615, p.1681-p.1695, 社団法人情報処理学会 * |
| JPN6012060759; 土居 誉生、隅田 英一郎、山本 博史: '編集距離を使った用例翻訳の高速検索方式と翻訳性能評価' 情報処理学会論文誌 第45巻 第6号 第45巻 第6号, 20040615, p.1681-p.1695, 社団法人情報処理学会 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011197713A (ja) * | 2010-03-17 | 2011-10-06 | Fuji Xerox Co Ltd | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム |
| JP2011197716A (ja) * | 2010-03-17 | 2011-10-06 | Fuji Xerox Co Ltd | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム |
| KR101731016B1 (ko) * | 2015-09-14 | 2017-04-27 | 네이버 주식회사 | 상황 인지 기반 번역 제공 방법 및 이를 위한 장치 |
| JP2018032324A (ja) * | 2016-08-26 | 2018-03-01 | 株式会社エヌ・ティ・ティ・データ | 対訳文抽出装置、対訳文抽出方法およびプログラム |
| CN112633015A (zh) * | 2020-12-30 | 2021-04-09 | 语联网(武汉)信息技术有限公司 | 文档翻译方法、装置、电子设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5386855B2 (ja) | 2014-01-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4961755B2 (ja) | 単語アライメント装置、単語アライメント方法、単語アライメントプログラム | |
| JP5011751B2 (ja) | 訳語情報出力処理プログラム,処理方法および処理装置 | |
| US8311799B2 (en) | Example-based translation using common and uncommon portions of an input sentence | |
| KR101266361B1 (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
| JP5915326B2 (ja) | 機械翻訳装置、機械翻訳方法及び機械翻訳プログラム | |
| JP2006252428A (ja) | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム | |
| CN101320366A (zh) | 用于机器翻译的装置和方法 | |
| JP2008065395A (ja) | 翻訳装置、翻訳方法および翻訳プログラム | |
| Prabhakar et al. | Machine transliteration and transliterated text retrieval: a survey | |
| JP5386855B2 (ja) | 翻訳メモリ翻訳装置および翻訳プログラム | |
| JP3831357B2 (ja) | 対訳情報作成装置及び対訳情報検索装置 | |
| Rapp et al. | Recent advances in machine translation using comparable corpora | |
| JP5439776B2 (ja) | 単語アライメント装置及び単語アライメントプログラム | |
| JP5025603B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
| JP5298834B2 (ja) | 例文マッチング翻訳装置、およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
| JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
| JP4266222B2 (ja) | 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体 | |
| JP5194920B2 (ja) | 例文集合ベース翻訳装置、方法およびプログラム、並びに翻訳装置を含んで構成された句翻訳装置 | |
| JP3628580B2 (ja) | 類似文検索方法、装置、および類似文検索プログラムを記録した記録媒体 | |
| JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
| JP5428199B2 (ja) | 対訳文抽出装置及び対訳文抽出方法 | |
| JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
| Le et al. | Data augmentation with large language models for Vietnamese abstractive text summarization | |
| JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
| JP2011048499A (ja) | 認識結果修正装置、画像処理装置、及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110421 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130219 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130411 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130910 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130923 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5386855 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |