JP2008102794A - フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 - Google Patents
フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 Download PDFInfo
- Publication number
- JP2008102794A JP2008102794A JP2006285540A JP2006285540A JP2008102794A JP 2008102794 A JP2008102794 A JP 2008102794A JP 2006285540 A JP2006285540 A JP 2006285540A JP 2006285540 A JP2006285540 A JP 2006285540A JP 2008102794 A JP2008102794 A JP 2008102794A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- translation
- merge
- evaluation value
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】フレーズアラインメントの指標を総合評価値算出部30が算出する場合に、コーパスベース統計評価値算出部41が算出する単語間翻訳確率、辞書情報対応部42が算出する辞書対応情報、および構文構造評価値算出部31が算出する構文構造情報を定量的に結合して総合的評価基準を求める。これにより、単語間翻訳確率が有効に活かせるだけではなく、構文解析情報や辞書情報などの言語学的に裏付けられた情報が定量的に組み込まれるため、フレーズアラインメントを優位度情報付きで進めることが可能となる。
【選択図】 図1
Description
フレーズの優位度はフレーズ自体のコーパス中での出現頻度のみから算出され、汎用性の高い対訳フレーズを抽出するのが難しかった。
第1言語文:
To strengthen counter measures for abnormal operating conditions, extend the lifetime of equipment and reduce the power consumption by detecting and informing various kinds of abnormal operating conditions of air conditioners in advance.
と、第2言語文:
空調機の各種異常を前もって検出して報知することにより、異常対応の強化を図ると共に、機器類の長寿命化及び消費電力の低減などを図る。
の対を対訳文として入力された場合について考える。
第1言語文:
To strengthen counter measures for abnormal operating conditions, extend the lifetime of equipment and reduce the power consumption by detecting and informing various kinds of abnormal operating conditions of air conditioners in advance.
第2言語文:
空調機 の 各種 異常 を 前 もって 検出 し て 報知 する ことに より, 異常 対応の 強化 を 図 る と共に , 機器 類 の 長寿命 化 及び 消費電力 の 低減 など を 図 る .
となる。
第1言語文:
To strengthen counter measures for abnormal operating conditions, extend the lifetime of equipment and reduce the power consumption by detecting and informing various kinds of abnormal operating conditions of air conditioners in advance.
第2言語文:
[空調機 の] [各種 異常 を] [前 もって] [検出 し て] [報知 する] [ことに より], [異常 対応の] [強化 を] [図 る と共に] , [機器 類 の] [長寿命 化 及び] [消費電力 の] [低減 など を] [図 る] .
第1言語文:
To strengthen [counter measures] for [abnormal operating conditions], extend [the lifetime] of equipment and reduce [the power consumption] by [detecting and informing] [various kinds] of [abnormal operating conditions] of [air conditioners] [in advance].
第2言語文:
[空調機 の] [各種 異常 を] [前 もって] [検出 し て] [報知 する] [ことに より], [異常 対応の] [強化 を] [図 る と共に] , [機器 類 の] [長寿命 化 及び] [消費電力 の] [低減 など を] [図 る] .
Σj ΣtP(t|w(i) ) P(t appears in v(j) ) = 1 ------ (1)
ここで、tはw(i)の翻訳候補、P(t| w(i) )は与えられた対訳文内において、w(i)がtに翻訳される翻訳確率、P(t appears in v(j) )はtがv(j)中に出現する確率を表す。
P(t|w(i))=λPc(t|w(i)) ------(2)
ここでλはある定数。
λΣj ΣtPc(t|w(i))P(t appears in v(j) ) = 1
上記C(i , j)の定義より、
ΣtPc(t|w(i) ) P(t appears in v(j) ) = C(i , j )/100
λΣj C(i , j )/100 = 1
λ = 100 / [Σj C(i , j )]
P(t|w(i) ) = 100*Pc(t|w(i) ) / [Σj C(i , j )]
となる。
P(v(j)|w(i) ) = Σt P(t|w(i) ) P(t appears in v(j) )
= Σt 100* P(t appears in v(j) )*Pc(t|w(i) ) / [Σj C(i , j )]
= C(i , j ) / [Σj C(i , j )] ------(3)
と求まる。従って、単語w(i)の訳語がフレーズv(j)中に出現する確率P(v(j)|w(i)) は、C(i, j)の値を行マージンで割った値(行内相対値)として求まる。
Pt (w(i) | v(j) ) = C(i , j ) / [Σi C(i , j )] ------(4)
H(i) = −Σj P(v(j)|w(i) ) log2 P(v(j)|w(i) ) ------(5)
で与えられる。
H(i) = 0 と解釈することにする。
第1言語側(行)のエントロピーはそれぞれ
H(1) = - (100/100) log2 (100/100) = 0
H(2) = - (10/100) log2 (10/100) - (90/100) log2 (90/100) = 0.468995593589281
H(3) = - (95/100) log2 (95/100) - (5/100) log2 (5/100) = 0.286396957115956
H(4) = - (90/100) log2 (90/100) - (10/100) log2 (10/100) = 0.468995593589281
であり、第1言語側(行側)のトータルのエントロピーは以下のように求められる。
H_tot = (100 * H(1) + 100*H(2) + 100*H(3) + 100*H(4) ) / 400 = 0.3060970360736295
Ht(1) = - (100/100) log2 (100/100) = 0
H(2) = - (10/195) log2 (10/195) - (95/195) log2 (95/195) - (90/195) log2 (90/195) = 1.24003625010867
Ht(3) = - (90/105) log2 (90/105) - (5/105) log2 (5/105) - (10/105) log2 (10/105) = 0.722857897732969
Ht_tot = (100*Ht(1) + 195*Ht(2) + 105*Ht(3))/(100+195+105) = 0.7942678700828809875
H = (H_tot + Ht_tot)/2 = 0.55018245307825524375
H_tot = 0.616346837918725
第2言語側(列側)のトータルのエントロピーは
Ht_tot = 0.604517671927974
第1言語側(行)と第2言語側(列側)の平均のエントロピーは
H = 0.61043225492335
と求まる。
H_tot = 0.309404670460569
第2言語側(列側)のトータルのエントロピーは
Ht_tot = 0.297575504469818
第1言語側(行)と第2言語側(列側)の平均のエントロピーは
H = 0.303490087465193
と求まる。
To strengthen counter measures for abnormal operating conditions ,と「異常対応の強化を図ると共に」
extend the lifetimeと「長寿命化及び」
of equipmentと「機器類の」
and reduceと「低減などを図る」
the power consumptionと「消費電力の」
by detectingと「検出して」
and informingと「報知することにより、」
various kinds of abnormal operating conditions of air conditioners と「機器類の各種異常を」
in advanceと「前もって」
とがそれぞれ対のフレーズとして出力されている。
1 0 10
20 2 1
0 30 0
である場合には、各行の最大要素はそれぞれ
1 0 10 ⇒ 10
20 2 1 ⇒ 20
0 30 0 ⇒ 30
となるので、計は 10+20+30 = 60 である。
1 + 0 + 10 +
20 + 2 + 1 +
0 + 30 + 0
= 64 。
60/64 = 0.9375
となる。
1 0 10
20 2 1
0 30 0
↓ ↓ ↓
20 30 10
60/64 = 0.9375
となる。
(0.9375+0.9375) /2 = 0.9375
である。
0 0 10
20 0 0
0 30 0
の場合では、許容係数は1.0 となる。
p(e|j ) = p(j|e )・p(e )/p(j) ――――(6)
すなわち、
e* =argmaxe p(e|j ) = argmaxe p(j|e )・p(e )/p(j)
e* =argmaxe p(j|e )・p(e ) ――――(7)
となる。p(j|e )を導出するモデルを翻訳モデル、p(e )を導出するモデルを言語モデルと呼ぶ。
WC = ωlength(e) ――――(8)
ωは定数で、1より大きい場合は長い出力文に対して優位に働く。また、入力言語のフレーズの順序に対して、出力言語のフレーズの順序が大きくばらつくのを防ぐためにディストーションコストを導入しても良いが、日英翻訳の場合順序の制約が返って最適解を阻害する場合も多いので、ここでは省略する。
e* =argmaxe p(e|j ) = argmaxe p(j|e )・pLM(e )・ωlength(e)
ここで、pLM(e )は言語モデルであり、翻訳モデルp(j|e )は以下のように各フレーズの翻訳確率の積で与えられる。
p(j|e ) = p(j'1-I |e'i-I ) = IΠi=1 p(j'1|e'i)
従って、入力文jに対して最適な翻訳文e* を求めるための評価値Vは(9)で与えられる。
V = IΠi=1 p(j'1|e'i)・pLM(e )・ωlength(e) ――――(9)
互いに翻訳関係にある第1言語文と第2言語文との対としてなる入力対訳文を受け付ける対訳文受付ステップ、
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理ステップ、
前記フレーズマージ処理ステップによって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出ステップ、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索ステップ、
前記マージペア探索ステップで探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力ステップ、
を実行させるための翻訳プログラム。
入力文である第1言語文を受け付ける入力文受付ステップ、
前記対訳フレーズを蓄積した対訳フレーズ蓄積手段からフレーズ翻訳確率を求めるフレーズ翻訳確率算出ステップ、
前記蓄積された対訳フレーズと前記入力文を照合して、前記入力文中の単語列の一部である部分単語列を、当該部分単語列と一致する前記フレーズ蓄積手段内のフレーズの対訳のうちの第2言語側表現で置換するフレーズ置換翻訳処理ステップ、
前記フレーズ置換の履歴から現時点までの部分翻訳を構築する部分翻訳構築ステップ、
前記フレーズ置換された入力文、前記部分翻訳、および現時点までにフレーズ置換されたフレーズのフレーズ翻訳確率から、現時点でのフレーズ置換履歴、フレーズ置換された入力文、部分翻訳の3つ組みにおける総合的な状態の優位度を示す状態評価値を算出する状態評価値算出ステップ、
前記状態評価値に従って状態の優位度を順序付ける状態序列ステップ、
状態序列順にフレーズ置換翻訳処理ステップへと遷移させる状態遷移ステップ、
を実行させるための付記1〜7のいずれか一つに記載の翻訳プログラム。
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理手段と、
前記フレーズマージ処理手段によって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出手段と、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索手段と、
前記マージペア探索手段で探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力手段と、
を備えたことを特徴とする翻訳装置。
前記対訳フレーズを蓄積した対訳フレーズ蓄積手段からフレーズ翻訳確率を求めるフレーズ翻訳確率算出手段と、
前記蓄積された対訳フレーズと前記入力文を照合して、前記入力文中の単語列の一部である部分単語列を、当該部分単語列と一致する前記フレーズ蓄積手段内のフレーズの対訳のうちの第2言語側表現で置換するフレーズ置換翻訳処理手段と、
前記フレーズ置換の履歴から現時点までの部分翻訳を構築する部分翻訳構築手段と、
前記フレーズ置換された入力文、前記部分翻訳、および現時点までにフレーズ置換されたフレーズのフレーズ翻訳確率から、現時点でのフレーズ置換履歴、フレーズ置換された入力文、部分翻訳の3つ組みにおける総合的な状態の優位度を示す状態評価値を算出する状態評価値算出手段と、
前記状態評価値に従って状態の優位度を順序付ける状態序列手段と、
状態序列順にフレーズ置換翻訳処理手段へと遷移させる状態遷移手段と、
を備えたことを特徴とする付記12に記載の翻訳装置。
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理工程と、
前記フレーズマージ処理工程によって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出工程と、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索工程と、
前記マージペア探索工程で探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力工程と、
を含んだことを特徴とする翻訳方法。
前記対訳フレーズを蓄積した対訳フレーズ蓄積手段からフレーズ翻訳確率を求めるフレーズ翻訳確率算出工程と、
前記蓄積された対訳フレーズと前記入力文を照合して、前記入力文中の単語列の一部である部分単語列を、当該部分単語列と一致する前記フレーズ蓄積手段内のフレーズの対訳のうちの第2言語側表現で置換するフレーズ置換翻訳処理工程と、
前記フレーズ置換の履歴から現時点までの部分翻訳を構築する部分翻訳構築工程と、
前記フレーズ置換された入力文、前記部分翻訳、および現時点までにフレーズ置換されたフレーズのフレーズ翻訳確率から、現時点でのフレーズ置換履歴、フレーズ置換された入力文、部分翻訳の3つ組みにおける総合的な状態の優位度を示す状態評価値を算出する状態評価値算出工程と、
前記状態評価値に従って状態の優位度を順序付ける状態序列工程と、
状態序列順にフレーズ置換翻訳処理工程へと遷移させる状態遷移工程と、
を含んだことを特徴とする付記14に記載の翻訳方法。
11 対訳文受付部
12 ベースフレーズ抽出部
20 フレーズマージ処理部
21 マージペア探索部
22 マージ実行部
23 対訳フレーズ出力部
30 総合評価値算出部
31 構文構造評価値算出部
32 句構造文法ルール
33 総合評価値出力部
40 統計評価値算出部
41 コーパスベース統計評価値算出部
42 辞書情報対応部
43 統計評価値評価部
44 統計評価値出力部
100 翻訳装置
101 入力受付部
102 初期状態設定部
103 フレーズ置換翻訳処理部
103a 翻訳履歴蓄積部
104 部分翻訳構築部
105 状態繊維部
106 状態評価値出力部
107 状態記憶部
108 状態序列部
110 対訳フレーズ蓄積部
111 フレーズ翻訳確率算出部
112 確率付フレーズ翻訳テーブル
113 言語モデル記憶部
Claims (10)
- コンピュータに、
互いに翻訳関係にある第1言語文と第2言語文との対としてなる入力対訳文を受け付ける対訳文受付ステップ、
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理ステップ、
前記フレーズマージ処理ステップによって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出ステップ、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索ステップ、
前記マージペア探索ステップで探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力ステップ、
を実行させるための翻訳プログラム。 - 前記総合評価値として、前記第1言語文中のフレーズと前記第2言語文中のフレーズとの間の総合的なフレーズ対応度を示す総合フレーズ対応度の、マージ前後での変化量として求められる評価値を用いることを特徴とする請求項1に記載の翻訳プログラム。
- 前記総合フレーズ対応度として、フレーズ間対応に関する不確からしさを示すエントロピーを用いることを特徴とする請求項2に記載の翻訳プログラム。
- 前記総合評価値は、前記総合フレーズ対応度と、2つのフレーズのマージによって生成される新しいフレーズが当該フレーズを含む文の構文構造上、Constituentと見なせるか否かを評価するための構文構造評価値と、を合成して求められることを特徴とする請求項2または3に記載の翻訳プログラム。
- 前記対訳文受付ステップと前記フレーズマージ処理ステップとの間に、名詞句、句動詞、もしくは任意の意味的に一塊と見なせるベースフレーズを抽出するベースフレーズ抽出ステップをさらにコンピュータに実行させることを特徴とする請求項1〜4のいずれか一つに記載の翻訳プログラム。
- 前記統計評価値算出ステップ中に、前記第1言語文中のフレーズと前記第2言語文中のフレーズとの間の翻訳確率を統計翻訳モデルを用いて対訳コーパスから統計的に求めるコーパスベース統計評価値算出ステップと、対訳辞書、類義語辞典、シソーラス、もしくは任意の辞書データを基にフレーズ間対応を求める辞書情報対応ステップと、をさらにコンピュータに実行させることを特徴とする請求項1〜5のいずれか一つに記載の翻訳プログラム。
- 前記統計評価値算出ステップの中に、ストップワード検出ステップを含み、フレーズ間対応に関する不確からしさを示すエントロピーのマージ前後での変化量を求める際に、出現頻度が極めて高くかつ意味的に役割を担わない機能語、もしくは任意のストップワードの出現確率をエントロピーの算出において除外することを特徴とする請求項2〜6のいずれか一つに記載の翻訳プログラム。
- コンピュータに、
入力文である第1言語文を受け付ける入力文受付ステップ、
前記対訳フレーズを蓄積した対訳フレーズ蓄積手段からフレーズ翻訳確率を求めるフレーズ翻訳確率算出ステップ、
前記蓄積された対訳フレーズと前記入力文を照合して、前記入力文中の単語列の一部である部分単語列を、当該部分単語列と一致する前記フレーズ蓄積手段内のフレーズの対訳のうちの第2言語側表現で置換するフレーズ置換翻訳処理ステップ、
前記フレーズ置換の履歴から現時点までの部分翻訳を構築する部分翻訳構築ステップ、
前記フレーズ置換された入力文、前記部分翻訳、および現時点までにフレーズ置換されたフレーズのフレーズ翻訳確率から、現時点でのフレーズ置換履歴、フレーズ置換された入力文、部分翻訳の3つ組みにおける総合的な状態の優位度を示す状態評価値を算出する状態評価値算出ステップ、
前記状態評価値に従って状態の優位度を順序付ける状態序列ステップ、
状態序列順にフレーズ置換翻訳処理ステップへと遷移させる状態遷移ステップ、
を実行させるための請求項1〜7のいずれか一つに記載の翻訳プログラム。 - 互いに翻訳関係にある第1言語文と第2言語文との対としてなる入力対訳文を受け付ける対訳文受付手段と、
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理手段と、
前記フレーズマージ処理手段によって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出手段と、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索手段と、
前記マージペア探索手段で探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力手段と、
を備えたことを特徴とする翻訳装置。 - 互いに翻訳関係にある第1言語文と第2言語文との対としてなる入力対訳文を受け付ける対訳文受付工程と、
前記第1言語文内および/または前記第2言語文内において隣接する2つのフレーズをマージして、当該マージによって形成された1つの新しいフレーズに置換するフレーズマージ処理を階層的に繰り返すフレーズマージ処理工程と、
前記フレーズマージ処理工程によって得られたマージペアの適切さを判定するための総合評価値を算出する総合評価値算出工程と、
前記総合評価値に基づいて他のマージペアに比して適切性の高い1つあるいは複数個のマージペアを探索するマージペア探索工程と、
前記マージペア探索工程で探索されたマージペアを対訳フレーズとして出力する対訳フレーズ出力工程と、
を含んだことを特徴とする翻訳方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006285540A JP5082374B2 (ja) | 2006-10-19 | 2006-10-19 | フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 |
| US11/796,784 US8630839B2 (en) | 2006-10-19 | 2007-04-30 | Computer product for phrase alignment and translation, phrase alignment device, and phrase alignment method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006285540A JP5082374B2 (ja) | 2006-10-19 | 2006-10-19 | フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008102794A true JP2008102794A (ja) | 2008-05-01 |
| JP5082374B2 JP5082374B2 (ja) | 2012-11-28 |
Family
ID=39319141
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006285540A Expired - Fee Related JP5082374B2 (ja) | 2006-10-19 | 2006-10-19 | フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US8630839B2 (ja) |
| JP (1) | JP5082374B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012141879A (ja) * | 2011-01-05 | 2012-07-26 | Fuji Xerox Co Ltd | 対訳情報検索装置、翻訳装置及びプログラム |
Families Citing this family (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9176952B2 (en) * | 2008-09-25 | 2015-11-03 | Microsoft Technology Licensing, Llc | Computerized statistical machine translation with phrasal decoder |
| KR101266361B1 (ko) * | 2009-09-10 | 2013-05-22 | 한국전자통신연구원 | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 |
| US9576570B2 (en) | 2010-07-30 | 2017-02-21 | Sri International | Method and apparatus for adding new vocabulary to interactive translation and dialogue systems |
| US8527270B2 (en) * | 2010-07-30 | 2013-09-03 | Sri International | Method and apparatus for conducting an interactive dialogue |
| KR101356417B1 (ko) * | 2010-11-05 | 2014-01-28 | 고려대학교 산학협력단 | 병렬 말뭉치를 이용한 동사구 번역 패턴 구축 장치 및 그 방법 |
| US9471565B2 (en) * | 2011-07-29 | 2016-10-18 | At&T Intellectual Property I, L.P. | System and method for locating bilingual web sites |
| JP2013073282A (ja) * | 2011-09-26 | 2013-04-22 | Fuji Xerox Co Ltd | 情報処理装置およびプログラム |
| KR101449551B1 (ko) * | 2011-10-19 | 2014-10-14 | 한국전자통신연구원 | 유사문장 검색 장치 및 방법, 유사문장 검색 방법을 실행시키기 위한 프로그램이 기록된 기록매체 |
| CN103186522B (zh) * | 2011-12-29 | 2018-01-26 | 富泰华工业(深圳)有限公司 | 电子设备及其自然语言分析方法 |
| CN103186523B (zh) * | 2011-12-30 | 2017-05-10 | 富泰华工业(深圳)有限公司 | 电子设备及其自然语言分析方法 |
| SG11201404225WA (en) * | 2012-01-27 | 2014-08-28 | Nec Corp | Term translation acquisition method and term translation acquisition apparatus |
| US10031967B2 (en) | 2016-02-29 | 2018-07-24 | Rovi Guides, Inc. | Systems and methods for using a trained model for determining whether a query comprising multiple segments relates to an individual query or several queries |
| US10133735B2 (en) * | 2016-02-29 | 2018-11-20 | Rovi Guides, Inc. | Systems and methods for training a model to determine whether a query with multiple segments comprises multiple distinct commands or a combined command |
| KR101861006B1 (ko) * | 2016-08-18 | 2018-05-28 | 주식회사 하이퍼커넥트 | 통역 장치 및 방법 |
| CN107818086B (zh) | 2016-09-13 | 2021-08-10 | 株式会社东芝 | 机器翻译方法和装置 |
| CN106598959B (zh) * | 2016-12-23 | 2021-03-19 | 北京金山办公软件股份有限公司 | 一种确定双语语句对互译关系方法及系统 |
| JP7251181B2 (ja) * | 2019-02-05 | 2023-04-04 | 富士通株式会社 | 対訳処理方法および対訳処理プログラム |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003345797A (ja) * | 1998-06-04 | 2003-12-05 | Matsushita Electric Ind Co Ltd | 言語変換装置及びプログラム記録媒体 |
| JP2006178536A (ja) * | 2004-12-20 | 2006-07-06 | Oki Electric Ind Co Ltd | 対訳表現抽出装置 |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7072826B1 (en) | 1998-06-04 | 2006-07-04 | Matsushita Electric Industrial Co., Ltd. | Language conversion rule preparing device, language conversion device and program recording medium |
| US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
| EP1352338A2 (en) * | 2000-05-11 | 2003-10-15 | University Of Southern California | Machine translation techniques |
| US7054803B2 (en) * | 2000-12-19 | 2006-05-30 | Xerox Corporation | Extracting sentence translations from translated documents |
| US7191115B2 (en) * | 2001-06-20 | 2007-03-13 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among words |
| CN1647068A (zh) * | 2002-03-28 | 2005-07-27 | 南加利福尼亚大学 | 统计机器翻译 |
| US20030236658A1 (en) * | 2002-06-24 | 2003-12-25 | Lloyd Yam | System, method and computer program product for translating information |
| US7353165B2 (en) * | 2002-06-28 | 2008-04-01 | Microsoft Corporation | Example based machine translation system |
| US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases |
| JP2005025474A (ja) | 2003-07-01 | 2005-01-27 | Advanced Telecommunication Research Institute International | 機械翻訳装置、コンピュータプログラム及びコンピュータ |
| US7412385B2 (en) * | 2003-11-12 | 2008-08-12 | Microsoft Corporation | System for identifying paraphrases using machine translation |
| US7672830B2 (en) * | 2005-02-22 | 2010-03-02 | Xerox Corporation | Apparatus and methods for aligning words in bilingual sentences |
| US20070083357A1 (en) * | 2005-10-03 | 2007-04-12 | Moore Robert C | Weighted linear model |
| US7813919B2 (en) * | 2005-12-20 | 2010-10-12 | Xerox Corporation | Class description generation for clustering and categorization |
| US7536295B2 (en) * | 2005-12-22 | 2009-05-19 | Xerox Corporation | Machine translation using non-contiguous fragments of text |
-
2006
- 2006-10-19 JP JP2006285540A patent/JP5082374B2/ja not_active Expired - Fee Related
-
2007
- 2007-04-30 US US11/796,784 patent/US8630839B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003345797A (ja) * | 1998-06-04 | 2003-12-05 | Matsushita Electric Ind Co Ltd | 言語変換装置及びプログラム記録媒体 |
| JP2006178536A (ja) * | 2004-12-20 | 2006-07-06 | Oki Electric Ind Co Ltd | 対訳表現抽出装置 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012141879A (ja) * | 2011-01-05 | 2012-07-26 | Fuji Xerox Co Ltd | 対訳情報検索装置、翻訳装置及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20080097742A1 (en) | 2008-04-24 |
| JP5082374B2 (ja) | 2012-11-28 |
| US8630839B2 (en) | 2014-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5082374B2 (ja) | フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法 | |
| US8185377B2 (en) | Diagnostic evaluation of machine translators | |
| US9575955B2 (en) | Method of detecting grammatical error, error detecting apparatus for the method, and computer-readable recording medium storing the method | |
| KR102268875B1 (ko) | 전자 장치에 텍스트를 입력하는 시스템 및 방법 | |
| KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
| US9600469B2 (en) | Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon | |
| US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
| Briscoe et al. | Evaluating the accuracy of an unlexicalized statistical parser on the PARC DepBank | |
| KR101573854B1 (ko) | 관계어 기반 확률추정 방법을 이용한 통계적 문맥의존 철자오류 교정 장치 및 방법 | |
| Goutte | Learning machine translation | |
| CN101131706A (zh) | 一种查询修正方法及系统 | |
| US20130262077A1 (en) | Machine translation device, machine translation method, and recording medium storing machine translation program | |
| JP6108212B2 (ja) | 同義語抽出システム、方法およびプログラム | |
| Luong et al. | Towards accurate predictors of word quality for machine translation: Lessons learned on french–english and english–spanish systems | |
| JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
| Allkivi-Metsoja et al. | Spelling correction for Estonian learner language | |
| Gadde et al. | Adapting a WSJ trained part-of-speech tagger to noisy text: preliminary results | |
| Flickinger et al. | ParDeepBank: Multiple parallel deep treebanking | |
| Wu | Research on English-Chinese translation of long and difficult sentences by generalized logistic regression parsing algorithm based on neural network | |
| Cherry et al. | Discriminative substring decoding for transliteration | |
| JP6221339B2 (ja) | 翻訳装置及び翻訳方法 | |
| JP5182954B2 (ja) | 穴埋問題生成装置及びそのプログラム | |
| Ohno et al. | Dependency parsing of Japanese spoken monologue based on clause boundaries | |
| Delisle et al. | Extraction of predicate-argument structures from texts | |
| Köprü | An efficient part-of-speech tagger for arabic |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090710 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120228 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120425 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120820 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5082374 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |