JP2018045686A - 機械翻訳装置及び機械翻訳方法 - Google Patents
機械翻訳装置及び機械翻訳方法 Download PDFInfo
- Publication number
- JP2018045686A JP2018045686A JP2017165926A JP2017165926A JP2018045686A JP 2018045686 A JP2018045686 A JP 2018045686A JP 2017165926 A JP2017165926 A JP 2017165926A JP 2017165926 A JP2017165926 A JP 2017165926A JP 2018045686 A JP2018045686 A JP 2018045686A
- Authority
- JP
- Japan
- Prior art keywords
- translation
- score
- hypothesis
- unit
- phrases
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
Description
図1は本発明の1実施形態に係る、機械翻訳方法のフローチャートである。図1に示すように、先ずステップS101において、第1言語文を入力する。
図5は同じ発明概念下での、本発明の他の実施形態に係る、機械翻訳装置500のブロック図である。次に、図を参照して本実施形態を説明する。前記実施形態と同じ部分については説明を省略する。
20・・・ユーザ履歴句ペア
500、600・・・機械翻訳装置
501、601・・・入力部
505、605・・・セグメンテーション部
510・・・翻訳オプション探索部
515、615・・・選択部
520・・・組み合せ部
525・・・翻訳仮説探索部
530・・・増加部
610・・・第1翻訳オプション探索部
620・・・第2翻訳オプション探索部
Claims (14)
- 第1言語文を入力するための入力部と、
前記第1言語文をセグメントして複数句を生成するセグメンテーション部と、
前記複数句の夫々に対応した第2言語の翻訳オプションについて、翻訳モデルを探索する翻訳オプション探索部と、
前記複数句の夫々に対して、前記翻訳モデルから、第2言語文生成用の高確率を有する上位N個(Nは1以上の整数)の翻訳オプションを選択する選択部と、
前記複数句の夫々に対して、前記上位N個の翻訳オプションを組み合わせることにより、複数の翻訳仮説を生成する組み合せ部と、
前記翻訳仮説についてユーザ履歴句ペアを探索する翻訳仮説探索部と、
前記ユーザ履歴句ペアに存在する前記翻訳仮説のスコアを増加させる増加部と、
を有することを特徴とする機械翻訳装置。 - 前記増加部は、前記翻訳仮説の長さが長いほど、前記翻訳仮説のスコアをより増加させるものである、
請求項1に記載の機械翻訳装置。 - 前記増加部は、下記の式(1)に基づいて前記翻訳仮説のスコアを増加させるものである、
Score(TH):前記翻訳仮説を増加させた後のスコア
Score_before(TH):前記翻訳仮説を増加させる前のスコア
Length(TH):前記翻訳仮説の長さ
請求項2に記載の機械翻訳装置。 - 前記増加部は、前記翻訳仮説の長さと、前記ユーザ履歴句ペアに存在する翻訳仮説のスコアに基づいて、前記翻訳仮説のスコアを増加させるものである、
請求項1に記載の機械翻訳装置。 - 前記増加部は、下記の式(2)に基づいて前記翻訳仮説のスコアを増加させるものである、
Score(TH):前記翻訳仮説の増加後のスコア
Score_before(TH):前記翻訳仮説の増加前のスコア
Length(TH):前記翻訳仮説の長さ
Score_in_UHP(TH):前記ユーザ履歴句ペアに存在する翻訳仮説のスコア
請求項4に記載の機械翻訳装置。 - 第1言語文を入力するための入力部と、
前記第1言語文をセグメントして複数句を生成するセグメンテーション部と、
前記複数句の夫々に対応した第2言語の翻訳オプションについて、翻訳モデルを探索する第1翻訳オプション探索部と、
前記複数句の夫々に対して、前記翻訳モデルから、第2言語文生成用の高確率を有する上位N個(Nは1以上の整数)の翻訳オプションを選択する選択部と、
前記上位N個の翻訳オプションとは異なるM個(Mは1以上の整数)の翻訳オプションをユーザ履歴句ペアから探索する第2翻訳オプション探索部と、
を有することを特徴とする音声翻訳装置。 - 前記複数句の夫々に対して、上位N個の翻訳オプションとM個の翻訳オプションを組み合わせることにより、複数の翻訳仮説を生成する組み合せ部と、
前記翻訳仮説について前記ユーザ履歴句ペアを探索する翻訳仮説探索部と、
前記ユーザ履歴句ペアに存在する前記翻訳仮説のスコアを増加させる増加部と、
を更に備える請求項6に記載の機械翻訳装置。 - 前記第2翻訳オプション探索部は、前記ユーザ履歴句ペアと、前記翻訳モデルから選択されなかった翻訳オプションとの間の共通句を求めるものである、
請求項6に記載の機械翻訳装置。 - 前記増加部は、前記翻訳仮説の長さが長いほど、前記翻訳仮説のスコアをより増加させるものである、
請求項7に記載の機械翻訳装置。 - 前記増加部は、下記の式(1)に基づいて前記翻訳仮説のスコアを増加させるものである、
Score(TH):前記翻訳仮説の増加後のスコア
Score_before(TH):前記翻訳仮説の増加前のスコア
Length(TH):前記翻訳仮説の長さ
請求項9に記載の機械翻訳装置。 - 前記増加部は、前記翻訳仮説の長さと、前記ユーザ履歴句ペアに存在する翻訳仮説のスコアに基づいて、前記翻訳仮説のスコアを増加させるものである、
請求項7に記載の機械翻訳装置。 - 前記増加部は、下記の式(2)に基づいて前記翻訳仮説のスコアを増加させるものである、
Score(TH):前記翻訳仮説の増加後のスコア
Score_before(TH):前記翻訳仮説の増加前のスコア
Length(TH):前記翻訳仮説の長さ
Score_in_UHP(TH):前記ユーザ履歴句ペアに存在する翻訳仮説のスコア
請求項11に記載の機械翻訳装置。 - 第1言語文を入力するステップと、
前記第1言語文をセグメントして複数句を生成するステップと、
前記複数句の夫々に対応した第2言語の翻訳オプションについて、翻訳モデルを探索するステップと、
前記複数句の夫々に対して、前記翻訳モデルから、第2言語文生成用の高確率を有する上位N個(Nは1以上の整数)の翻訳オプションを選択するステップと、
前記複数句の夫々に対して、前記上位N個の翻訳オプションを組み合わせることにより、複数の翻訳仮説を生成するステップと、
前記翻訳仮説についてユーザ履歴句ペアを探索するステップと、
前記ユーザ履歴句ペアに存在する前記翻訳仮説のスコアを増加させるステップと、
を備えたことを特徴とする機械翻訳方法。 - 第1言語文を入力するステップと、
前記第1言語文をセグメントして複数句を生成するステップと、
前記複数句の夫々に対応した第2言語の翻訳オプションについて、翻訳モデルを探索するステップと、
前記複数句の夫々に対して、前記翻訳モデルから、第2言語文生成用の高確率を有する上位N個(Nは1以上の整数)の翻訳オプションを選択するステップと、
前記上位N個の翻訳オプションとは異なるM個(Mは1以上の整数)の翻訳オプションをユーザ履歴句ペアから探索するステップと、
を備えたことを特徴とする機械翻訳方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201610819758.7A CN107818086B (zh) | 2016-09-13 | 2016-09-13 | 机器翻译方法和装置 |
| CN201610819758.7 | 2016-09-13 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018045686A true JP2018045686A (ja) | 2018-03-22 |
| JP6523388B2 JP6523388B2 (ja) | 2019-05-29 |
Family
ID=61560046
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017165926A Expired - Fee Related JP6523388B2 (ja) | 2016-09-13 | 2017-08-30 | 機械翻訳装置及び機械翻訳方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US10496758B2 (ja) |
| JP (1) | JP6523388B2 (ja) |
| CN (1) | CN107818086B (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110489761B (zh) * | 2018-05-15 | 2021-02-02 | 科大讯飞股份有限公司 | 一种篇章级文本翻译方法及装置 |
| CN109327614B (zh) * | 2018-10-17 | 2021-01-26 | 永德利硅橡胶科技(深圳)有限公司 | 全球同声传译手机及方法 |
| CN109088995B (zh) * | 2018-10-17 | 2020-11-13 | 永德利硅橡胶科技(深圳)有限公司 | 支持全球语言翻译的方法及手机 |
| CN114139560B (zh) * | 2021-12-03 | 2022-12-09 | 山东诗语信息科技有限公司 | 基于人工智能翻译系统 |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007004446A (ja) * | 2005-06-23 | 2007-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 機械翻訳装置、その方法およびプログラム |
| JP2007052307A (ja) * | 2005-08-19 | 2007-03-01 | Advanced Telecommunication Research Institute International | 音声認識結果の検査装置及びコンピュータプログラム |
| JP2007226729A (ja) * | 2006-02-27 | 2007-09-06 | Fujitsu Ltd | 訳語情報出力処理プログラム,処理方法および処理装置 |
| US20090281789A1 (en) * | 2008-04-15 | 2009-11-12 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
| US20090326912A1 (en) * | 2006-08-18 | 2009-12-31 | Nicola Ueffing | Means and a method for training a statistical machine translation system |
| JP2010033418A (ja) * | 2008-07-30 | 2010-02-12 | Sharp Corp | 携帯型翻訳装置およびそれを用いた翻訳文の出力方法 |
| JP2011524991A (ja) * | 2008-04-15 | 2011-09-08 | モバイル テクノロジーズ,エルエルシー | 現場にて音声−音声翻訳をメンテナンスするシステム及び方法 |
| US20140006003A1 (en) * | 2005-06-17 | 2014-01-02 | Radu Soricut | Trust scoring for language translation systems |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2480398C (en) * | 2002-03-27 | 2011-06-14 | University Of Southern California | Phrase-based joint probability model for statistical machine translation |
| US7353165B2 (en) * | 2002-06-28 | 2008-04-01 | Microsoft Corporation | Example based machine translation system |
| US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
| US7552053B2 (en) * | 2005-08-22 | 2009-06-23 | International Business Machines Corporation | Techniques for aiding speech-to-speech translation |
| US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
| JP5082374B2 (ja) | 2006-10-19 | 2012-11-28 | 富士通株式会社 | フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 |
| CN101271451A (zh) * | 2007-03-20 | 2008-09-24 | 株式会社东芝 | 计算机辅助翻译的方法和装置 |
| JP5100445B2 (ja) * | 2008-02-28 | 2012-12-19 | 株式会社東芝 | 機械翻訳する装置および方法 |
| KR101762866B1 (ko) * | 2010-11-05 | 2017-08-16 | 에스케이플래닛 주식회사 | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 |
| US9323746B2 (en) * | 2011-12-06 | 2016-04-26 | At&T Intellectual Property I, L.P. | System and method for collaborative language translation |
| JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
| US10025778B2 (en) * | 2013-06-09 | 2018-07-17 | Microsoft Technology Licensing, Llc | Training markov random field-based translation models using gradient ascent |
| JP2015060095A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
| US20150347397A1 (en) * | 2014-06-03 | 2015-12-03 | Xerox Corporation | Methods and systems for enriching statistical machine translation models |
| CN105068998B (zh) * | 2015-07-29 | 2017-12-15 | 百度在线网络技术(北京)有限公司 | 基于神经网络模型的翻译方法及装置 |
-
2016
- 2016-09-13 CN CN201610819758.7A patent/CN107818086B/zh not_active Expired - Fee Related
-
2017
- 2017-08-30 JP JP2017165926A patent/JP6523388B2/ja not_active Expired - Fee Related
- 2017-08-31 US US15/692,756 patent/US10496758B2/en not_active Expired - Fee Related
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140006003A1 (en) * | 2005-06-17 | 2014-01-02 | Radu Soricut | Trust scoring for language translation systems |
| JP2007004446A (ja) * | 2005-06-23 | 2007-01-11 | Nippon Telegr & Teleph Corp <Ntt> | 機械翻訳装置、その方法およびプログラム |
| JP2007052307A (ja) * | 2005-08-19 | 2007-03-01 | Advanced Telecommunication Research Institute International | 音声認識結果の検査装置及びコンピュータプログラム |
| JP2007226729A (ja) * | 2006-02-27 | 2007-09-06 | Fujitsu Ltd | 訳語情報出力処理プログラム,処理方法および処理装置 |
| US20090326912A1 (en) * | 2006-08-18 | 2009-12-31 | Nicola Ueffing | Means and a method for training a statistical machine translation system |
| US20090281789A1 (en) * | 2008-04-15 | 2009-11-12 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
| JP2011524991A (ja) * | 2008-04-15 | 2011-09-08 | モバイル テクノロジーズ,エルエルシー | 現場にて音声−音声翻訳をメンテナンスするシステム及び方法 |
| JP2010033418A (ja) * | 2008-07-30 | 2010-02-12 | Sharp Corp | 携帯型翻訳装置およびそれを用いた翻訳文の出力方法 |
Non-Patent Citations (2)
| Title |
|---|
| 安田隆浩 外3名: "Khafra:語順並べ替えモデルに対応した動的計画法に基づくSMTデコーダ", 言語処理学会第16回年次大会発表論文集, JPN6018034304, 8 March 2010 (2010-03-08), JP, pages 625 - 628, ISSN: 0003871193 * |
| 青木 優,山本 和英: "個人適応による英日翻訳での訳語候補の順位付け", 言語処理学会第12回年次大会発表論文集, JPN6018034306, 13 March 2006 (2006-03-13), JP, pages 260 - 263, ISSN: 0003871194 * |
Also Published As
| Publication number | Publication date |
|---|---|
| US20180075022A1 (en) | 2018-03-15 |
| JP6523388B2 (ja) | 2019-05-29 |
| CN107818086B (zh) | 2021-08-10 |
| CN107818086A (zh) | 2018-03-20 |
| US10496758B2 (en) | 2019-12-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN107870901B (zh) | 从翻译源原文生成相似文的方法、记录介质、装置以及系统 | |
| Hagen et al. | Webis: An ensemble for twitter sentiment detection | |
| US10679014B2 (en) | Method for providing translation information, non-transitory computer-readable recording medium, and translation information providing apparatus | |
| US20140163951A1 (en) | Hybrid adaptation of named entity recognition | |
| US20160321239A1 (en) | System and method for inputting text into electronic devices | |
| US20130144592A1 (en) | Automatic Spelling Correction for Machine Translation | |
| CN110678868B (zh) | 翻译支持系统、装置和方法以及计算机可读介质 | |
| JP6523388B2 (ja) | 機械翻訳装置及び機械翻訳方法 | |
| US10853569B2 (en) | Construction of a lexicon for a selected context | |
| JP2016532916A (ja) | 単語訳取得方法 | |
| JP6817556B2 (ja) | 類似文生成方法、類似文生成プログラム、類似文生成装置及び類似文生成システム | |
| CN107861937B (zh) | 对译语料库的更新方法、更新装置以及记录介质 | |
| US11227116B2 (en) | Translation device, translation method, and program | |
| Tran et al. | A Character Level Based and Word Level Based Approach for Chinese‐Vietnamese Machine Translation | |
| US10055404B2 (en) | Translation apparatus | |
| JP2014194668A (ja) | 翻訳支援装置、翻訳支援システムおよび翻訳支援プログラム | |
| Finch et al. | Transliteration using a phrase-based statistical machine translation system to re-score the output of a joint multigram model | |
| Das et al. | A study of attention-based neural machine translation model on Indian languages | |
| Singh et al. | Urdu to Punjabi machine translation: an incremental training approach | |
| JP6478382B2 (ja) | 翻訳装置 | |
| CN112541062A (zh) | 平行语料对齐方法、装置、存储介质及电子设备 | |
| Liu et al. | A hybrid ranking approach to Chinese spelling check | |
| JPWO2020003928A1 (ja) | エンティティ特定システム | |
| JP2016189154A (ja) | 翻訳方法、装置、及びプログラム | |
| Tran et al. | Handling organization name unknown word in Chinese-Vietnamese machine translation. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180726 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180907 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181005 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181107 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190326 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190425 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6523388 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| LAPS | Cancellation because of no payment of annual fees |