[go: up one dir, main page]

JP2008152760A - マシンアシスト翻訳ツール - Google Patents

マシンアシスト翻訳ツール Download PDF

Info

Publication number
JP2008152760A
JP2008152760A JP2007282902A JP2007282902A JP2008152760A JP 2008152760 A JP2008152760 A JP 2008152760A JP 2007282902 A JP2007282902 A JP 2007282902A JP 2007282902 A JP2007282902 A JP 2007282902A JP 2008152760 A JP2008152760 A JP 2008152760A
Authority
JP
Japan
Prior art keywords
playable
source information
processing
translation
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007282902A
Other languages
English (en)
Inventor
Jochen Hummel
ヨヒェン・フンメル
Iko Knyphausen
イコ・ナイファウゼン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Trados Inc
Original Assignee
Trados Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Trados Inc filed Critical Trados Inc
Publication of JP2008152760A publication Critical patent/JP2008152760A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Nonmetallic Welding Materials (AREA)

Abstract

【課題】ソース言語をターゲット言語に変換するための改良された方法および装置を提供する。
【解決手段】高速化のために、プレーサブル(例えば、固有名詞、敬称および名前、日付、時間、単位および測定値、数、フォーマット情報、タグまたはエスケープシーケンス、スタイル、グラフ、ハイパーリンク)を使用し、翻訳される必要のない情報を再度タイプする必要をなくし、必要な場合にはターゲット地域へ変換することによって、翻訳者を助けることができる。
【選択図】図4

Description

本発明は、テキストおよび言語のマシン処理に関し、特に、マシンアシストの翻訳または機械翻訳のためのソフトウエア実行を含む方法および装置に関する。
1つの言語から別の言語へのテキストの翻訳は,しばしば熟練した翻訳者の努力を必要とする面倒な作業である。コンピュータの出現後間もなく、研究者は自然言語の翻訳の補助としてコンピュータを使用し始めた。初期の機械翻訳(MT)システムは大きな2言語用の辞書に依存しており、その辞書ではソース言語(SL)のワードの入力に対して1以上のターゲット言語(TL)中のそれと等価なワードを与える。この方法は、シンタックスおよび文法に対する辞書のルールが非常に複雑であり、熟練者でも機械翻訳を記述するルールの総合的なセットを開発することはできないことが直ぐに明らかになり、放棄された。
世界中で多数の人々の多言語交換および多国間取引のために翻訳サービスに対する要求が増加している。商業的および技術的文献の翻訳に対する需要は翻訳市場の大きい、成長する領域となっている。そのような文献の例としては契約書、指令マニュアル、フォーム、およびコンピュータソフトウエアがある。製品又はサービスが新しい市場に対して“局地化”されるとき、大量の文献が翻訳されなければならないことがしばしばであり、経済的な翻訳に必要性が生じて来る。商業的および技術的情報は詳細で正確なものであることが多いから、正確な翻訳が継続的に望まれている。
機械翻訳(MT)システムは通常は直接法、転送ベース、またはインターリンガ(国際語)ベースのいずれかに分類される。直接法では、ソース言語とターゲット言語との中間的な表現はない。ソース言語テキストはそれをターゲットテキストに翻訳するために“直接”処理される。この処理は本質的に、調整を含むワードからワードへの翻訳である。この方法は、文章の内部構造の全ての観点について知らないことに起因する認識された弱点によって現在ではMTシステムでは使用されていない。
転送ベースの方法では、ソーステキストからの解析の種々の段階からの情報がターゲットテキストの発生の対応する段階へ転送される。例えば、転送は語句レベル、文法レベル、または文法により構築された構造のレベル等々で対応を設定することによって行われる。転送方法は言語の特別の対においてのみ動作し、それ故、言語の各対に対して特別に、苦労して生成されなければならない。
インターリンガベースの方法は、適切な中間表現を定義し、ソーステキストを中間表現にマップし、中間表現をターゲットテキストにマップできるとの仮定に依存している。原理的にこの方法は明らかに魅力的であり、それは転送ベースの方法とは異なり、言語の各対に対して別々の転送プログラムを作成する必要がないからである。しかしながら、真に言語と無関係の中間表現を考えることができるか否かは明らかではない。現在のインターリンガベースのシステムは、中間表現の一般性に対してのクレームについてはるかに望みが少ない。高い品質の翻訳に対しては、ソース言語とターゲット言語の特別の観点にアクセスする必要がしばしばある。
転送ベースの方法では、最近いくつかの進歩があった。文法の数学および計算モデルの発達で、構造を語句アイテムと関連付けることによって、シンタックスおよびセマンティクス情報を語句アイテムと直接に置き、これらのオブジェクトを組み立てる動作を定義することを重視することが増えている。この観点から、言語に特有の全ての情報は語句のアイテムおよびそれらと関連する構造中にカプセル化される。異なった言語はこのレベルで区別されるが、全ての言語に対して同じであるこれらの構造を構成するための動作に関係しない。そのアイディアはその後このレベルにおいて全てのバイリンガル対応を規定する。この方法が異なった種々の言語間で実行されることができるか否かを観察することが残されている。
既存のいくつかのMTシステムは文書が高度に制限されたテキストに書かれることを要求している。そのようなシステムは異なった言語のマニュアルを作成するために有効である。そのシステムは1つの自然言語で書かれたマニュアルを実際に他の自然言語のセットに翻訳するのではなく、高度に制限されたテキストからマルチリンガルテキストを発生し、それによりに通常のMTにおける多くの問題を回避するものである。
最近の研究は、自動的に翻訳を行うのではなく、人間の翻訳者の補助を行う装置を使用する方法に焦点が絞られている。この方法はマシンアシストされた人間の翻訳(MAHT)と呼ばれている。それらのシステムは人間の翻訳者によって行われた翻訳と予め翻訳された断片的部分を使用してビジネス対応の高品質の翻訳を生成するために利用できる。マシンアシストされた翻訳ツールの1例は翻訳メモリ(TM)システムである。翻訳メモリシステムは翻訳者に創造的な作業を残すが、それらは翻訳者から学習することができ、それらは既存の翻訳および用語を自動的に示唆することによって翻訳処理を支援する。翻訳メモリは、行われた翻訳を、ソース言語の等価のものと共に集めるデータベースである。多数の翻訳が行われて翻訳メモリに記憶された後、翻訳メモリにアクセスして、新しい翻訳を助けることができる。その場合に、新しい翻訳は翻訳メモリ中に含まれている同一または類似のソース言語テキストを含んでいる。
このようなシステムの利点は、それが理論的に既存のMT技術を利用して人間の翻訳者によって行われる伝統的な正確さを犠牲にすることなく遥かに効率的に翻訳を行うことができることである。このシステムは翻訳者が同じソーステキストを2回翻訳することを確実になくすことによって翻訳をより効率的にする。翻訳者が作業しているとき、翻訳メモリは学習したもとの文章およびその対応する翻訳を基礎として動作する。この処理において、このデータはニューラルネットワークにリンクされる。その後、翻訳メモリは、新しい翻訳を作成するために、迅速に同一または類似の文章を発見し、作業ベースでそれらを自動的に表示する。したがって、翻訳メモリはセンテンスが2回翻訳される必要を確実に避けることを可能にする。
翻訳メモリは、同一の整合の位置を決めることができるときのみならず、近似的な、或いは“ファジイな整合”の位置を決めることができるときにも最も有効である。ファジイな整合はワードの順序、語形、格、スペル等に僅かな相違があるテキストの検索を容易にする。近似的な整合は自然言語テキストにおける大きな多様性の可能性のために必要である。類似した内容の文章を発見するためのファジイな整合はニューラルネットワーク技術の構成により完全にされた性能を示す。翻訳者はメモリにより自動的に示唆されたものに加えて別の翻訳間の選択をする選択肢を有する。ソース文章とその翻訳と共に、各翻訳装置はまた、ユーザ、日付、使用の頻度、および属性とテキストフィールドの分類についての情報を記憶することができる。この情報は翻訳メモリの保守を容易にすることができ、それは当然時間の経過と共に大きくなる。
用語索引は翻訳者により通常使用される別のツールである。電子用語索引はテキストストリング、すなわちワード、フレーズ、またはセンテンスを有するファイルであり、それはワードが特定の文書中に現れた文脈と整合される。翻訳者が特定のワードにより与えられる意味が確かでないとき、用語索引はワードがいくつかの異なった文脈でどのように使用されるかを説明することができる。この情報は、ソース言語文書の意味を正確に反映するために翻訳のより適切な選択を可能にする。電子用語索引は、所望のワードまたはフレーズを含むライブラリ中の全てのテキストストリングを翻訳者が抽出することを可能にするテキスト検索ソフトウエアを含んでいる。抽出されたテキストストリングは迅速に検査されてどのように特定のワードまたはフレーズが文脈中で使用されるかのよりよい理解を与える。
マルチリンガルの自然言語の処理は、国際的な商業および通信の分野で必要性および機会が増加している。マシンアシスト翻訳ツールは文書の翻訳をより効率的で廉価なものとするために必要とされる。さらにマシンアシスト翻訳ツールは予め翻訳された商業的および技術的文書として利用できる記憶された大量の知識を効率的に利用することを必要とされている。特に、言語に無関係に、正確で、迅速に予め翻訳された材料のファジイな検索を行う翻訳メモリツールに対する必要性が存在する。
現在まで、プレーサブルであると考えられたテキストは翻訳者によって翻訳されて手作業で入力されなければならなかった。プレーサブルはしばしば翻訳されたテキストまたは変換された形態で“そのままで”再使用される。そのようなプレーサブルの例は、固有名詞、敬称および名前、日付、時間、単位および測定値、数や番号、フォーマット情報、タグまたはエスケープシーケンス、スタイル、グラフ、ハイパーリンク、クロスリファレンス、テキスト中の自動フィールド、或いはその他の翻訳されないが、文脈についての知識なしに変換される任意の情報である。プレーサブルの翻訳は時間がかかり、通貨、例えばドルから円へ変換する場合および速度、例えばマイル/時間をキロメータ/時間へ変換する場合のような変換が行われる場合にエラーを生じる。プレーサブルであると考えられるテキストを識別して、必要な変換を行い、そのプレーサブルをターゲットテキスト中に挿入するプログラムが必要とされている。
本発明は、ソース言語をターゲット言語に翻訳するための改良された方法および装置を提供する。本発明はプレーサブルを使用し、ターゲット言語中にプレーサブルを自動的または半自動的に配置することを容易にし、ターゲット地域(locale)、例えば“ドイツ−標準方式”に従って必要な変換を行うことによって翻訳者を支援する。ここで使用される用語“プレーサブル”とはターゲット言語に翻訳する必要のないデータ、または場合によっては半自動的に置換するのに特に適しているデータ(例えば、固有名詞、敬称および名前、フォーマット情報、タグまたはエスケープシーケンス、スタイル、グラフ)、またはデータの文脈を変更しない翻訳を必要とするデータ(例えば、物理単位および通貨単位、時間範囲、日付のフォーマット、ハイパーリンク等)を意味する用語である。さらに、プレーサブルはもっと複雑で進歩したものでもよい。例えばプレーサブルは特別の辞書および/または翻訳のために指定された全体の情報の文脈または環境情報、例えば化学環境、自動車環境、音楽リリック、法律環境におけるデータによって決定されることができる。文脈または環境情報はある用語がどのように翻訳されるかを決定する。ソースプレーサブル識別子が使用されてプレーサブルの文脈または環境に関するソースの用語索引に基づいてソース情報、例えばソース地域を識別してもよい。翻訳メモリにおいてプレーサブルは言語に関係のないフォーマット、例えばメタ表現に変換されることもできる。言語に関係のないフォーマットは、フォーマットが全ての地域に共通であるため、翻訳メモリが任意のターゲット言語にプレーサブルを変換することを可能にする。無関係のフォーマットに変換した後、プレーサブルは自動的または半自動的にターゲット翻訳中に位置させることができる。ターゲットプレーサブルコンバータが使用されてプレーサブルの文脈または環境に関連するターゲットの用語索引に基づいてプレーサブルをターゲット情報、例えばターゲット地域に変換する。
本発明によるシステムは、プレーサブルを識別し、プレーサブルの次の処理を容易にするために、典型的には、プレーサブルの位置の決定、変換、または翻訳を容易にするために、そのタイプを決定する。プレーサブルの識別およびそのタイプの決定は、規則にしたがったプロセスによって行われることができる。さらに、識別および決定プロセスは、検索表機能または文字毎の決定のような有限状態マシンの援助により行われることができる。
本発明を使用するデータベース駆動TMでは、プレーサブル情報と共にテンプレートまたはスケルトンのようなユニットを記憶することにより、ソースユニットとターゲットユニットとを対で記憶するのに必要とされる記憶スペースの量を減少させる高い可能性を有する。
本発明の目的は、プレーサブルをターゲット情報に挿入し、ターゲットプレーサブルコンバータによって任意所望の変換を行うことを可能にすることによって、プレーサブルを手入力でタイプするか、または訳文に移動する必要を無くすことによって、ソース情報をターゲット情報に翻訳するために翻訳者に要求されている努力を減少させることである。
本発明の別の目的は、自動的にプレーサブル、例えば日付、測定単位をターゲットテキストに挿入するために変換することによりソーステキストを翻訳するために必要な時間量また努力を減少させることである。
本発明の別の目的は、翻訳者が自動的なプレーサブルデータの変換によりソーステキスト中の測定単位を手作業でターゲットテキストに変換する時に生じるエラーを減少させることである。
本発明の別の目的は、自動的にフォーマットコードを識別してそのコードをターゲットテキストに挿入することによりソーステキストを翻訳するために必要な時間量また努力を減少させることである。
本発明の別の目的は、自動的にハイパーテキストリンクを翻訳することによりソーステキストをターゲットテキストに翻訳するために必要な時間量また努力を減少させることである。
本発明の別の目的は、プレーサブルを言語に無関係のフォーマットに変換させることである。
本発明の別の目的は、適当であれば、例えば、測定単位、データフォーマット、通貨値および単位、敬称および名前等を変換することによりプレーサブルエレメントの出現を自動的に変化させることである。
本発明のさらに別の目的は、ソース情報を翻訳するとき、ユーザとの対話において、例えば1以上のキーストロークにおいて、または1以上の音声命令において、またはマウスのクリックにおいてなどでプレーサブルエレメントをターゲットテキストのユーザの定めた位置に半自動的に挿入することである。
本発明の目的は、参照材料その他のマシンで計算可能な情報の助けにより、ユーザとの対話なしに機械が挿入位置を決定することが許容されるプレーサブルエレメントを自動的に挿入することである。
本発明の目的は、手動翻訳により、または翻訳メモリにより使用できることである。
本発明は商業的に利用可能な種々の言語翻訳コンピュータソフトウエアプログラムによって実行可能である。本発明は翻訳メモリを用いて動作することができるが、それは不可欠ではない。システムは少なくとも2つの言語を支援する利点を有している
まず、システムはテキストデータまたは音声データのような入力ソース翻訳情報を受信することができ、それは種々の方法で入力または検索することができる(例えばデータファイル、走査されたデータ、音声記録、音声口述等)。プログラムはソース翻訳情報を言語形式またはデータ翻訳ユニットに分割することができる。これはソース翻訳情報をワード、センテンス、またはパラグラフにセグメント化することにより行われる。このプロセスはシステム指定またはユーザ指定されることができる。
[手動翻訳]
図1は翻訳者が翻訳メモリを使用しない時の本発明によるプロセスを示すフローチャートである。最初に、入力ソース翻訳情報はセンテンスのようなセグメントに分割されることができる。セグメントのエレメントはステップ110でプロセッサに与えられる。システムはエレメントがプレーサブルであるか否かを決定する(ステップ 120)。テキストの翻訳中、システムはデータエレメントがプレーサブルであり、翻訳者がこのプレーサブルをターゲットテキスト中に挿入することが可能であることを翻訳者に教える(ステップ 130)。この時点で、システムはまた翻訳者を補助するためにプレーサブルのタイプを決定する。このタイプ情報は任意の適当なフォーマット、例えば、指導信号、色、フォント変化等で翻訳者に与えられることがでる。この方法では、翻訳者はプレーサブルをどこに挿入するかを、例えば、1回以上のキー操作、1回以上の言葉による命令、マウスのクリック等により決定することができる。プレーサブルがターゲット情報に変換することが必要な場合には、このシステムは、ユーザがターゲットテキスト中にプレーサブルをドロップすることを選択したときタイプに基づいてそのプレーサブルを自動的に変換するように設定することができる(ステップ 140)。この変換はターゲット出力の位置情報(例えば、ターゲットの地域、ターゲットの環境または内容に基づいたターゲット辞書)にしたがってターゲットプレーサブルコンバータによって行われる。手動翻訳はウインドウズ環境で行われることができる。
[翻訳メモリ]
翻訳メモリは情報が翻訳されるときに参照の目的で使用される。図2は翻訳メモリを使用するときに翻訳のための参照材料を管理するための市販のソフトウエアプログラムを示している。参照材料は通常2以上の言語のテキストの集合体であり、前に翻訳されたソーステキストユニットはターゲットテキストユニットと関連される。翻訳に指定された入力はソース翻訳情報と呼ばれる。上述のように翻訳メモリは同一の整合の位置を定めるだけでなく、近似的な、“ファジイな整合”の位置を定めることができるので最も有効である。ファジイな整合はソース翻訳情報と僅かに異なっているテキストの検索を容易にする。翻訳メモリは検索された示唆された情報がソース翻訳情報とどのような近似で整合するかを示す情報を翻訳者に与えることができる。この情報はパーセンテージのような数値の形態で与えられることができる。翻訳されるべきテキスト(すなわちソース翻訳情報)のユニットが、翻訳メモリ中で得られた以前に正確に翻訳されているソーステキストのユニットと同一であるか、または非常に類似している場合には、検索システムはターゲットテキストとして翻訳メモリ中に記憶されている翻訳を参照として示すことができる。翻訳者はこの参照のユニットをコピーし、それを修正して新しいソース翻訳情報に適合させることができる。従来のシステムにおいては、プレーサブルが翻訳されるテキスト中に存在し、翻訳メモリソーステキストの対応するエレメントとは異なる場合には、翻訳者が手作業で転送して、必要な場合には、プレーサブルデータをターゲット情報に翻訳または変換する必要がある。
翻訳ソフトウエアのユーザインターフェースは、翻訳者に対して異なったアイテムを表示するためにプログラムウインドウ(200)を提供する。この特定の例では、翻訳ソフトウエアプログラムウインドウ(210)およびワードプロセッサのプログラムウインドウ(240)を同時に示し、それによりユーザは全体のソース翻訳情報或いは関心のあるそれより小さいユニットを翻訳プロセス中に観察することができる。アイテム(240)はまた翻訳プロセス中に最終的なターゲット情報、例えば翻訳されたテキストを表示するように構成されることができる。アイテム(210)は翻訳に対して指定されたソース翻訳情報の言語形式またはデータ翻訳ユニットを表示することのできる区域(220)を示している。さらに、ウインドウ(210)は翻訳メモリツール(230)を使用するとき、言語形式に対していくつかの提案の翻訳を表示する。
図3および5は、翻訳者が翻訳メモリを使用するときの本発明を示している。最初に、ソース翻訳情報の言語ユニットはさらにトークンまたはソースエレメントに分割される。ソースエレメントがプレーサブルとして識別されたとき(ステップ 310)、そのタイプ(すなわち、日付、時間、リンク等)が決定され(ステップ 330)、プレーサブルがメタ表現のような言語に関係のないフォーマットに変換されることができ(ステップ 340)、或いは直接ターゲット言語または地域に変換されることができる。メタ表現(420, 520)はシステムがプレーサブルを任意のターゲット言語に変換することを可能にする。その理由はフォーマット(メタ表現)が全ての地域に共通しているからである。メタ表現は任意のターゲット地域に応じて変換され、ターゲットプレーサブルを生成することができる(ステップ 360)。この時点で、プレーサブルはターゲット言語中に挿入され、任意の変換が自動的または半自動的に行われることができる。
次のような文章“A man , called Mr. Miller, left his apartment on the 25th of January in a car that is capable of driving at speeds above 160mph”について検討する。機械翻訳プログラムは“A man called Mr. Miller on the phone(ある人(a man)がミラー氏(Mr.Miller)を電話で呼んだ(called))”か、または“A man”が“Mr. Miller”と同一人物かを決定するのは困難である。この疑問は文脈を評価しなければ答えることがでない。換言すれば、もしもワード“called”だけを見る場合には文章を正確に翻訳することはほぼ不可能である。しかしながら、“A man , called Mr. Miller”の全体のトークン(410)を考慮すれば、翻訳者(または翻訳装置)は意味のある翻訳をすることができる。図3は本発明がこの文章をどのように処理するか、プレーサブルが最初に識別されたときどのように処理されるかを示している。識別された3つのプレーサブルは、Mr. Miller 、25th of January および160mphである。

識別された 分類および言語に無関係 ターゲットテキスト
プレーサブル のフォーマット に挿入される翻訳
Mr. Miller プレーサブル/ Herr. Miller
名前および敬称
25th of January プレーサブル/日付−長い形態 25. Januar
160mph プレーサブル/数値および単位 260km/h
システムが翻訳されるべきテキストの入力(例えばソース翻訳情報)の一部として前のテキストを提示されるとき、システムはまずテキストをセグメント化し、好ましくはセンテンスに分割する。前のセンテンスはその場合有効にトークン化処理されることができる。本発明の1実施形態によれば、ソース翻訳センテンス中のワードまたはフレーズに対応したエレメントにトークン化処理される。トークン化処理は、エレメントがルールベースの照会にしたがって、および検索表のような有限状態ツールを使用しての少なくとも一方で、プレーサブルとして識別され得るか否かを考慮する。次にプレーサブルとして識別されたエレメントのタイプが決定される。この決定はまたルールベースの照会によって、および表によるような有限状態プロセスを使用しての少なくとも一方で行われることができる。トークン装置の出力はプレーサブルでないエレメントと、任意のプレーサブルエレメントのタイプの指示とを含んでいる。この出力は前に翻訳された同一または類似のセグメントの位置を決定するために翻訳メモリに対して与えられる。システムは翻訳メモリ中にある前に翻訳されたターゲットテキストに基づいた翻訳を提案し、直接プレーサブルエレメントを変換し、または変換せずに位置させることができる。システムはパーソナルコンピュータのような汎用コンピュータにおけるソフトウエアによって構成されることが有利である。
プレーサブルの決定は、ルールベースのシステムまたは有限状態システムを使用する1または2ステップの方法である。1ステップの方法はまた全体のトークンを観察するルールベースのシステムを使用してタイプを決定することにより行われる。たとえば、このトークンは日付であるか、このトークンは固有名詞であるか、このトークンはハイパーリンクであるか?等である。2ステップの方法は最初にトークンがプレーサブルであるか否かが決定され、次にそのタイプが決定される。これは決定に到達するまで一度に1つのトークンの各文字を検査する有限状態プロセスを使用して行われることができる。
プレーサブルの識別特徴の1つはその意味が文脈により変化する可能性がほとんどないことである。そのようなプレーサブルはたとえば数値またはグラフの翻訳に直接使用されるタイプを含んでいてもよい。プレーサブルの別のタイプは単位と結合されている数のように変換後に使用されるものである。例えば、“毎時62マイル”として現れたプレーサブルは“毎時100キロメートル”に変換されることもある。そのような変換はその公式的な性質により翻訳とは区別される。公式的な変換は内容がほとんど翻訳に影響しない状態において適している。
以下の例は別のソーステキスト中に類似したプレーサブルを含んでいるテキストの翻訳を示している。翻訳メモリシステムは以下のソーステキストユニットプラス参照ファイルからのその翻訳を含んでいる。
翻訳メモリソーステキストユニット:“A man , called Mr. Smith, left his apartment on the1st of April in a car that is capable of driving at speeds above 100mph.”
翻訳メモリターゲットテキストユニット(ドイツ語):“Ein Mann , namens Herr Smith, verliess sein Apartment am 1. April in einem Auto, das schneller als 160km/h fahren kann.”
翻訳されるべき新しいテキストユニット:“A man , called Mr. Miller, left his apartment on the 25th of January in a car that is capable of driving at speeds above 160mph.”
図5に示されるように、新しいソーステキストユニットはエレメント(510)に分割される。プレーサブルはそれから分類され、言語に関係のないフォーマット(520)に変換される。ソフトウエアが翻訳メモリソーステキストユニットおよび翻訳される新しいテキストの両者におけるプレーサブルと、翻訳メモリターゲットテキストユニットの3つのプレーサブルとを相関させることができるとき、本発明を使用する翻訳メモリシステムは自動的に、すなわちユーザが介入することなくプレーサブルを挿入する位置を決定し提案することができる。上記の例では、システムは次のようなことを決定することができる。
I.テキストユニット(翻訳されるべきもの)と翻訳メモリソーステキストユニット(前に翻訳された類似するテキスト)との差が3つのトークンのみで発見される。
II.3つのトークン全てがプレーサブルである。
III.プレーサブルトークンのタイプ(すなわち、日付、速度、名前)が翻訳メモリソーステキストユニットと翻訳されるべきテキストにおいて同じである。
IV.古いターゲットテキストユニットでは、プレーサブルトークンの正確に同じ数およびタイプが発見できる。翻訳システムは前の翻訳(翻訳メモリターゲットテキストユニット)を再使用し、プレーサブルトークンを新しい名前(=Mr. Miller)、新しい日付(=25th January)、および新しい速度(=160mph)で置換することを提案することができる。
V.ソフトウエアはタイプに応じてプレーサブルのある部分を変換することができる。この例では“Herr Miller ”,“25. Januar”,“280km/h”である(ステップ330)。
[プレーサブルの記憶]
今日市場には2つのタイプの翻訳メモリシステムが存在する。すなわち、参照ファイルで駆動されるTMとデータベースで駆動されるTMである。参照ファイルで駆動されるTMはソーステキストとターゲットテキストとを2つの異なった位置に維持して互いの基準ポインタのリストを維持することによって両者を整列させる。参照ファイルで駆動されるシステムでは、今まで書き込まれた(またはそれでなければ生成された)全てのソーステキストユニットおよびその全ての翻訳が物理的にファイルに記憶されて維持される。本発明で使用するデータベースで駆動されるTMではテンプレートまたはスケルトンのようなテキストユニットを単に記憶することによってデータ記憶スペースを節約する高い潜在性がある。
本発明の1実施形態のフロー図。 本発明の別の実施形態の概略図。 本発明の別の実施形態のフロー図。 本発明の別の実施形態の説明図。 本発明の別の実施形態の説明図。

Claims (21)

  1. エレメントへ入力ソース情報をパースするステップと、
    予め定められた基準によってプレーサブルエレメントを識別するステップと、
    タイプにより前記プレーサブルエレメントを指定するステップを含んでいることを特徴とするソース情報の処理方法。
  2. さらに、ソース地域を決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  3. さらに、ソースプレーサブル識別子を適用して、前記エレメントの前記タイプを決定するステップを含んでいる請求項2記載のソース情報の処理方法。
  4. さらに、ターゲット地域を決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  5. さらに、ターゲットプレーサブルコンバータを適用して、前記エレメントの前記タイプを変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  6. さらに、前記ソース地域を適用して、タイプにより前記エレメントを決定するステップを含んでいる請求項2記載のソース情報の処理方法。
  7. さらに、前記エレメントを言語に無関係のフォーマットに変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  8. さらに、前記プレーサブルが固有名詞であるか否かを決定するステップと、
    前記プレーサブルを直接ターゲット出力に位置させるステップを含んでいる請求項1記載のソース情報の処理方法。
  9. さらに、前記プレーサブルが日付であるか否かを決定するステップと、
    前記日付をターゲット地域情報にしたがってターゲット情報に変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  10. さらに、前記プレーサブルが固有名詞であるか否かを決定するステップと、
    前記プレーサブルを言語に無関係なフォーマットに変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  11. さらに、前記プレーサブルが固有名詞であるか否かを決定するステップと、
    前記プレーサブルをメタ表現に変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  12. さらに、前記プレーサブルが日付であるか否かを決定するステップと、
    前記プレーサブルを言語に無関係なフォーマットに変換するステップを含んでいる請求項1記載のソース情報の処理方法。
  13. さらに、前記プレーサブルが変換を要求するか否かを決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  14. さらに、前記プレーサブルが固有名詞であるか否かを決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  15. さらに、前記プレーサブルが日付であるか否かを決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  16. さらに、変換の出力要求を決定するステップを含んでいる請求項1記載のソース情報の処理方法。
  17. パーサと、
    前記パーサの出力に接続されているエレメント識別装置と、
    前記エレメント識別装置の出力に接続されているタイプ指定装置とを具備していることを特徴とするソース情報を処理するためのコンピュータ駆動言語処理システム。
  18. ソース情報をエレメントにパースするパーサと、
    予め定められた基準によってプレーサブルエレメントを識別するエレメント識別装置と、
    前記プレーサブルエレメントをタイプにより指定するタイプ指定装置とを具備していることを特徴とするソース情報を処理するためのコンピュータ駆動言語処理システム。
  19. 入力ソース情報をエレメントへセグメント化するステップと、
    予め定められた基準によってプレーサブルエレメントを識別するステップと、
    タイプにより前記プレーサブルエレメントを指定するステップを含んでいることを特徴とするソース情報の処理方法。
  20. さらに、前記プレーサブルエレメントをデータセットと比較するステップを含んでいる請求項8記載のソース情報の処理方法。
  21. さらに、前記プレーサブルエレメントをデータセットとタイプによって比較するステップを含んでいる請求項8記載のソース情報の処理方法。
JP2007282902A 1998-05-04 2007-10-31 マシンアシスト翻訳ツール Pending JP2008152760A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09/071,900 US7020601B1 (en) 1998-05-04 1998-05-04 Method and apparatus for processing source information based on source placeable elements

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000547557A Division JP2002513970A (ja) 1998-05-04 1999-04-30 マシンアシスト翻訳ツール

Publications (1)

Publication Number Publication Date
JP2008152760A true JP2008152760A (ja) 2008-07-03

Family

ID=22104320

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000547557A Pending JP2002513970A (ja) 1998-05-04 1999-04-30 マシンアシスト翻訳ツール
JP2007282902A Pending JP2008152760A (ja) 1998-05-04 2007-10-31 マシンアシスト翻訳ツール

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2000547557A Pending JP2002513970A (ja) 1998-05-04 1999-04-30 マシンアシスト翻訳ツール

Country Status (10)

Country Link
US (1) US7020601B1 (ja)
EP (1) EP1076861B1 (ja)
JP (2) JP2002513970A (ja)
CN (1) CN1179289C (ja)
AT (1) ATE298111T1 (ja)
AU (1) AU761311B2 (ja)
CA (1) CA2331184C (ja)
DE (1) DE69925831T2 (ja)
MX (1) MXPA00010835A (ja)
WO (1) WO1999057651A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Families Citing this family (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1266313A2 (en) * 1999-03-19 2002-12-18 Trados GmbH Workflow management system
US7346488B2 (en) 2000-07-10 2008-03-18 Fujitsu Limited Automatic translator and computer-readable storage medium having automatic translation program recorded thereon
FR2812102B1 (fr) * 2000-07-18 2005-02-04 Tradweb Procede et systeme pour la traduction linguistique
JP2002189627A (ja) * 2000-12-21 2002-07-05 Tsubasa System Co Ltd 文書データの変換方法
AUPR329501A0 (en) * 2001-02-22 2001-03-22 Worldlingo, Inc Translation information segment
US7191115B2 (en) * 2001-06-20 2007-03-13 Microsoft Corporation Statistical method and apparatus for learning translation relationships among words
US20080300856A1 (en) * 2001-09-21 2008-12-04 Talkflow Systems, Llc System and method for structuring information
EP1351159A3 (en) * 2002-02-08 2003-10-22 Hewlett Packard Company, a Delaware Corporation Improvements relating to the content of the electronic documents
US7110937B1 (en) * 2002-06-20 2006-09-19 Siebel Systems, Inc. Translation leveraging
US7249012B2 (en) * 2002-11-20 2007-07-24 Microsoft Corporation Statistical method and apparatus for learning translation relationships among phrases
US7627479B2 (en) * 2003-02-21 2009-12-01 Motionpoint Corporation Automation tool for web site content language translation
US7356457B2 (en) * 2003-02-28 2008-04-08 Microsoft Corporation Machine translation using learned word associations without referring to a multi-lingual human authored dictionary of content words
JP3987533B2 (ja) 2003-03-14 2007-10-10 富士通株式会社 翻訳支援装置
US8050906B1 (en) * 2003-06-01 2011-11-01 Sajan, Inc. Systems and methods for translating text
US8135575B1 (en) * 2003-08-21 2012-03-13 Google Inc. Cross-lingual indexing and information retrieval
WO2005043370A1 (en) * 2003-10-17 2005-05-12 King Abdulaziz & His Companion Foundation For The Gifted Method for operating an output device
WO2005088471A2 (de) 2004-03-16 2005-09-22 Star Ag Computergestütztes hilfsmittel für ein verfahren zur erstellung von fremdsprachigen dokumenten
US20050216256A1 (en) * 2004-03-29 2005-09-29 Mitra Imaging Inc. Configurable formatting system and method
EP1733304A2 (de) 2004-04-02 2006-12-20 Star AG Computergestütztes hilfsmittel (dynamic linking) für ein verfahren zur erstellung von fremdsprachigen dokumenten
DE202005021922U1 (de) 2004-04-03 2011-08-17 Star Ag Computergestütztes Hilfsmittel für ein Verfahren zur Erstellung von Dokumenten
GB2415518A (en) 2004-06-24 2005-12-28 Sharp Kk Method and apparatus for translation based on a repository of existing translations
GB2417103A (en) * 2004-08-11 2006-02-15 Sdl Plc Natural language translation system
US8335688B2 (en) * 2004-08-20 2012-12-18 Multimodal Technologies, Llc Document transcription system training
US8412521B2 (en) * 2004-08-20 2013-04-02 Multimodal Technologies, Llc Discriminative training of document transcription system
US7577561B2 (en) * 2004-11-09 2009-08-18 Sony Online Entertainment Llc System and method for generating a target language markup language text template
US7827026B2 (en) 2004-12-21 2010-11-02 Xerox Corporation Bilingual authoring assistant for the “tip of the tongue” problem
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
CN100392649C (zh) * 2004-12-31 2008-06-04 北京联动在线通讯科技有限公司 对屏幕显示的特定匹配词语实现快速链接的方法
US8126702B2 (en) * 2005-08-01 2012-02-28 Sap Ag Translating data objects
US8549492B2 (en) * 2006-04-21 2013-10-01 Microsoft Corporation Machine declarative language for formatted data processing
US7831423B2 (en) * 2006-05-25 2010-11-09 Multimodal Technologies, Inc. Replacing text representing a concept with an alternate written form of the concept
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US8046233B2 (en) * 2006-11-21 2011-10-25 Lionbridge Technologies, Inc. Methods and systems for local, computer-aided translation using remotely-generated translation predictions
US8335679B2 (en) 2006-11-21 2012-12-18 Lionbridge Technologies, Inc. Methods and systems for local, computer-aided translation incorporating translator revisions to remotely-generated translation predictions
US8494834B2 (en) * 2006-11-21 2013-07-23 Lionbridge Technologies, Inc. Methods and systems for using and updating remotely-generated translation predictions during local, computer-aided translation
US20080177623A1 (en) * 2007-01-24 2008-07-24 Juergen Fritsch Monitoring User Interactions With A Document Editing System
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
CN101034394B (zh) * 2007-03-30 2010-05-26 传神联合(北京)信息技术有限公司 一种提高翻译效率的系统及方法
US20080312928A1 (en) * 2007-06-12 2008-12-18 Robert Patrick Goebel Natural language speech recognition calculator
US20080313208A1 (en) * 2007-06-14 2008-12-18 International Business Machines Corporation Apparatus, system, and method for automated context-sensitive message organization
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
JP5186154B2 (ja) * 2007-08-21 2013-04-17 インターナショナル・ビジネス・マシーンズ・コーポレーション プログラムが表示するメッセージの修正を支援する技術
CN101419759B (zh) * 2007-10-26 2011-02-09 英业达股份有限公司 一种应用于全文翻译的语言学习方法及其系统
US9529820B2 (en) * 2008-05-23 2016-12-27 International Business Machines Corporation Automated content tracking and conversion
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
US20100049752A1 (en) * 2008-08-22 2010-02-25 Inventec Corporation Dynamic word translation system and method thereof
US20100125446A1 (en) * 2008-11-20 2010-05-20 Wathen Dana L Method for modifying document in data processing device
US8719002B2 (en) 2009-01-15 2014-05-06 International Business Machines Corporation Revising content translations using shared translation databases
KR101542136B1 (ko) 2009-03-31 2015-08-05 삼성전자 주식회사 문자 메시지 작성 방법 및 이를 이용한 휴대 단말기
GB2474839A (en) 2009-10-27 2011-05-04 Sdl Plc In-context exact matching of lookup segment to translation memory source text
WO2012009441A2 (en) 2010-07-13 2012-01-19 Motionpoint Corporation Dynamic language translation of web site content
US8515977B2 (en) 2010-09-10 2013-08-20 International Business Machines Corporation Delta language translation
US8670973B2 (en) 2010-09-16 2014-03-11 International Business Machines Corporation Language translation reuse in different systems
WO2012079257A1 (zh) * 2010-12-17 2012-06-21 北京交通大学 机器翻译装置和方法
US9244902B2 (en) * 2011-10-20 2016-01-26 Zynga, Inc. Localization framework for dynamic text
US8983825B2 (en) * 2011-11-14 2015-03-17 Amadou Sarr Collaborative language translation system
US9613026B2 (en) * 2011-12-28 2017-04-04 Bloomberg Finance L.P. System and method for interactive automatic translation
US9292498B2 (en) 2012-03-21 2016-03-22 Paypal, Inc. Device orientation based translation system
US9141606B2 (en) 2012-03-29 2015-09-22 Lionbridge Technologies, Inc. Methods and systems for multi-engine machine translation
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
KR20140011073A (ko) * 2012-07-17 2014-01-28 삼성전자주식회사 텍스트 추천 방법 및 장치
US9361646B2 (en) * 2012-09-25 2016-06-07 Mx Technologies, Inc. Aggregation source routing
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
CN103455477B (zh) * 2013-09-09 2016-04-06 高晋愚 一种用于辅助翻译的术语统一方法
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
US9692815B2 (en) 2015-11-12 2017-06-27 Mx Technologies, Inc. Distributed, decentralized data aggregation
US9959272B1 (en) * 2017-07-21 2018-05-01 Memsource a.s. Automatic classification and translation of written segments
US20190050376A1 (en) * 2017-08-10 2019-02-14 Sap Se Automatic value formatting based on intrinsic structural semantics
CN107391500A (zh) * 2017-08-21 2017-11-24 阿里巴巴集团控股有限公司 文本翻译方法、装置及设备
US10803257B2 (en) * 2018-03-22 2020-10-13 Microsoft Technology Licensing, Llc Machine translation locking using sequence-based lock/unlock classification
CN108763228A (zh) * 2018-05-21 2018-11-06 王伟宙 一种自然语言辅助处理系统
CN111310481B (zh) * 2020-01-19 2021-05-18 百度在线网络技术(北京)有限公司 语音翻译方法、装置、计算机设备和存储介质
CN113836947B (zh) * 2020-10-14 2024-04-16 北京中科凡语科技有限公司 机器翻译译后的术语翻译方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135095A (ja) * 1991-11-12 1993-06-01 Toshiba Corp 翻訳システム
JPH05197746A (ja) * 1992-01-22 1993-08-06 Nec Corp 翻訳支援装置
JPH0635962A (ja) * 1992-07-21 1994-02-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH1097530A (ja) * 1996-07-22 1998-04-14 Fujitsu Ltd 日付変換方法および日付変換機能を備えた文書処理装置並びに文書処理プログラムを記録した記録媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2047494T3 (es) * 1986-10-03 1994-03-01 British Telecomm Sistema de traduccion de lenguas.
US5224040A (en) * 1991-03-12 1993-06-29 Tou Julius T Method for translating chinese sentences
NZ314657A (en) * 1992-09-04 1997-06-24 Caterpillar Inc Linguistic analysis of document with portions tagged to indicate special translation requirements
EP0668558B1 (en) * 1994-01-14 2002-04-17 Sun Microsystems, Inc. Method and apparatus for automating the localization of a computer program
US6139201A (en) * 1994-12-22 2000-10-31 Caterpillar Inc. Integrated authoring and translation system
JPH09259126A (ja) * 1996-03-21 1997-10-03 Sharp Corp データ処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135095A (ja) * 1991-11-12 1993-06-01 Toshiba Corp 翻訳システム
JPH05197746A (ja) * 1992-01-22 1993-08-06 Nec Corp 翻訳支援装置
JPH0635962A (ja) * 1992-07-21 1994-02-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH1097530A (ja) * 1996-07-22 1998-04-14 Fujitsu Ltd 日付変換方法および日付変換機能を備えた文書処理装置並びに文書処理プログラムを記録した記録媒体

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9600472B2 (en) 1999-09-17 2017-03-21 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10216731B2 (en) 1999-09-17 2019-02-26 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10198438B2 (en) 1999-09-17 2019-02-05 Sdl Inc. E-services translation utilizing machine translation and translation memory
US10248650B2 (en) 2004-03-05 2019-04-02 Sdl Inc. In-context exact (ICE) matching
US9342506B2 (en) 2004-03-05 2016-05-17 Sdl Inc. In-context exact (ICE) matching
US9400786B2 (en) 2006-09-21 2016-07-26 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US8935148B2 (en) 2009-03-02 2015-01-13 Sdl Plc Computer-assisted natural language translation
US8935150B2 (en) 2009-03-02 2015-01-13 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US11321540B2 (en) 2017-10-30 2022-05-03 Sdl Inc. Systems and methods of adaptive automated translation utilizing fine-grained alignment
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11475227B2 (en) 2017-12-27 2022-10-18 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Also Published As

Publication number Publication date
AU3825999A (en) 1999-11-23
US7020601B1 (en) 2006-03-28
CA2331184A1 (en) 1999-11-11
EP1076861B1 (en) 2005-06-15
CN1179289C (zh) 2004-12-08
JP2002513970A (ja) 2002-05-14
DE69925831D1 (de) 2005-07-21
MXPA00010835A (es) 2002-05-07
EP1076861A1 (en) 2001-02-21
WO1999057651A1 (en) 1999-11-11
CN1308748A (zh) 2001-08-15
CA2331184C (en) 2009-07-14
DE69925831T2 (de) 2005-10-27
ATE298111T1 (de) 2005-07-15
AU761311B2 (en) 2003-06-05

Similar Documents

Publication Publication Date Title
US7020601B1 (en) Method and apparatus for processing source information based on source placeable elements
US5646840A (en) Language conversion system and text creating system using such
US5850561A (en) Glossary construction tool
US6910004B2 (en) Method and computer system for part-of-speech tagging of incomplete sentences
JP4504555B2 (ja) 翻訳支援システム
JP3220560B2 (ja) 機械翻訳装置
EP0361464A2 (en) Method and apparatus for producing an abstract of a document
CN101019113A (zh) 用于翻译系统的计算机实现的方法
JP2002229981A (ja) 文字列の正規化表示を生成するシステム
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
Underwood et al. Translatability checker: A tool to help decide whether to use MT
EP1655674A2 (en) THIRD LANGUAGE TEXT GENERATING ALGORITHM BY MULTI−LINGUAL TEXT INPUTTING AND DEVICE AND PROGRAM THEREFOR
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
Ahmad et al. Terminology management: a corpus-based approach
JP2838984B2 (ja) 汎用参照装置
Moshagen et al. The GiellaLT infrastructure–A Multilingual Infrastructure for Rulebased NLP
JPH06348751A (ja) 言語変換装置
Bernth et al. Terminology extraction for global content management
Boitet Gradable quality translations through mutualization of human translation and revision, and UNL-based MT and coedition
JP2000029882A (ja) 要約文作成装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
Ibragimovna Establishment of a national corpus the uzbek language is a requirement of a new ERA
Schwall et al. From METAL to T1: systems and components for machine translation applications
McCarthy Word Sense Disambiguation: The Case for Combinations of Knowledge Sources, by Mark Stevenson. CLSI, 2003. ISBN: 1-57586-390-1, US67. 50 (hardback), xvi+ 175 pages
JPH05225232A (ja) テキスト自動前編集装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100330

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100630

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100930

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110315