JP2000268034A - テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体 - Google Patents
テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体Info
- Publication number
- JP2000268034A JP2000268034A JP11070312A JP7031299A JP2000268034A JP 2000268034 A JP2000268034 A JP 2000268034A JP 11070312 A JP11070312 A JP 11070312A JP 7031299 A JP7031299 A JP 7031299A JP 2000268034 A JP2000268034 A JP 2000268034A
- Authority
- JP
- Japan
- Prior art keywords
- text
- editing
- identification
- type
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 自然言語で記述されたテキストの前編集処理
において、テキストの種類の識別と、そのテキストの種
類に応じた前編集規則及び標準表記の選択を自動化す
る。 【解決手段】 テキストに関連する単語、品詞情報、形
態素情報を記憶した辞書テーブルと、テキストの種類を
識別するための識別規則を記憶した識別規則テーブル
と、テキストを前編集するための前編集規則及び標準表
記をテキストの種類別に記憶した前編集規則テーブル
と、テキストを入力する入力部と、辞書テーブルを参照
し、入力テキストの各単語について形態素解析して品詞
情報、形態素情報を抽出する形態素解析部と、識別規則
テーブルを参照し、抽出された品詞情報、形態素情報か
らテキストの種類を識別する識別部と、前編集規則テー
ブルを参照し、識別された種類に対応する編集規則から
テキストの前編集対象部分の単語を検出し、その単語を
標準表記に書き換える前編集部とから構成される。
において、テキストの種類の識別と、そのテキストの種
類に応じた前編集規則及び標準表記の選択を自動化す
る。 【解決手段】 テキストに関連する単語、品詞情報、形
態素情報を記憶した辞書テーブルと、テキストの種類を
識別するための識別規則を記憶した識別規則テーブル
と、テキストを前編集するための前編集規則及び標準表
記をテキストの種類別に記憶した前編集規則テーブル
と、テキストを入力する入力部と、辞書テーブルを参照
し、入力テキストの各単語について形態素解析して品詞
情報、形態素情報を抽出する形態素解析部と、識別規則
テーブルを参照し、抽出された品詞情報、形態素情報か
らテキストの種類を識別する識別部と、前編集規則テー
ブルを参照し、識別された種類に対応する編集規則から
テキストの前編集対象部分の単語を検出し、その単語を
標準表記に書き換える前編集部とから構成される。
Description
【0001】
【発明の属する技術分野】本発明は、自然言語処理シス
テムの機械翻訳装置などに適用され、自然言語で記述さ
れたテキストをその意味を変えない範囲で前編集するこ
とによって機械翻訳などの自然言語処理精度の向上を図
るテキスト前編集装置及び方法並びにこれに利用される
記憶媒体に関する。
テムの機械翻訳装置などに適用され、自然言語で記述さ
れたテキストをその意味を変えない範囲で前編集するこ
とによって機械翻訳などの自然言語処理精度の向上を図
るテキスト前編集装置及び方法並びにこれに利用される
記憶媒体に関する。
【0002】
【従来の技術】従来、機械翻訳装置などの自然言語処理
システムは、通常、科学技術論文、特許明細書、機器の
取り扱い説明書、報道記事など様々な種類のテキストを
処理対象としている
システムは、通常、科学技術論文、特許明細書、機器の
取り扱い説明書、報道記事など様々な種類のテキストを
処理対象としている
【0003】しかしながら、従来の機械翻訳装置では、
テキストを構文解析するための規則が、標準的な表現に
対応しているため、テキストの分野や種類によっては、
特殊な表現が多用されるので、特殊な表現形式のテキス
トの構文解析が適切に行えない。このため、既存の構文
解析規則を用いた翻訳装置では、特殊な表現形式のテキ
ストを適切に翻訳することは困難であり、例え、翻訳さ
れても非常に長い翻訳時間を要し、翻訳結果も好ましい
ものにならない。したがって、一般には、特殊な表現形
式のテキストが扱えるように構文解析規則を拡張すると
いう対応策が取られている。
テキストを構文解析するための規則が、標準的な表現に
対応しているため、テキストの分野や種類によっては、
特殊な表現が多用されるので、特殊な表現形式のテキス
トの構文解析が適切に行えない。このため、既存の構文
解析規則を用いた翻訳装置では、特殊な表現形式のテキ
ストを適切に翻訳することは困難であり、例え、翻訳さ
れても非常に長い翻訳時間を要し、翻訳結果も好ましい
ものにならない。したがって、一般には、特殊な表現形
式のテキストが扱えるように構文解析規則を拡張すると
いう対応策が取られている。
【0004】一方、機械翻訳の精度を高め、かつユーザ
の介入を最小限に抑えながら機械翻訳装置にテキストを
入力するに先立って前編集処理する従来技術として、特
開平6−139274号公報の記載によれば、入力テキ
ストを予め形態素解析して前編集規則を適用すべき箇所
を検出し、機械翻訳しやすい形に自動的に前編集するテ
キスト自動前編集装置が提案されている。
の介入を最小限に抑えながら機械翻訳装置にテキストを
入力するに先立って前編集処理する従来技術として、特
開平6−139274号公報の記載によれば、入力テキ
ストを予め形態素解析して前編集規則を適用すべき箇所
を検出し、機械翻訳しやすい形に自動的に前編集するテ
キスト自動前編集装置が提案されている。
【0005】
【発明が解決しようとする課題】しかしながら、特殊な
表現形式のテキストの翻訳が扱えるように既存の構文解
析規則を拡張した従来の機械翻訳装置は、例えば、下記
の問題がある。 (1)構文解析規則の規模が非常に大きくなるため、既
存規則との整合性を保ちながら新たな規則を追加するこ
とは、実用システムでは容易ではない。 (2)特殊な表現形式のテキストを扱うための規則と、
標準的な表現形式のテキストを扱うための規則とを混在
させると、既存規則の汎用性が損なわれる。
表現形式のテキストの翻訳が扱えるように既存の構文解
析規則を拡張した従来の機械翻訳装置は、例えば、下記
の問題がある。 (1)構文解析規則の規模が非常に大きくなるため、既
存規則との整合性を保ちながら新たな規則を追加するこ
とは、実用システムでは容易ではない。 (2)特殊な表現形式のテキストを扱うための規則と、
標準的な表現形式のテキストを扱うための規則とを混在
させると、既存規則の汎用性が損なわれる。
【0006】また、特開平6−139274号公報に記
載のテキスト前編集装置では、特殊な表現形式のテキス
トを標準的な表現形式のテキストに前編集する際、多種
多様のテキストの種類に応じた前編集規則群の選択処理
が自動化されておらず、テキストの種類に応じた前編集
規則群の選択をユーザが行わなければならないため、ユ
ーザの負担になる問題がある。
載のテキスト前編集装置では、特殊な表現形式のテキス
トを標準的な表現形式のテキストに前編集する際、多種
多様のテキストの種類に応じた前編集規則群の選択処理
が自動化されておらず、テキストの種類に応じた前編集
規則群の選択をユーザが行わなければならないため、ユ
ーザの負担になる問題がある。
【0007】本発明は以上の事情を考慮してなされたも
のであり、例えば、自然言語で記述されたテキストの前
編集処理において、テキストの種類の識別と、そのテキ
ストの種類に応じた前編集規則及び標準表記の選択を自
動化し、その自動選択された前編集規則に基づいて検出
したテキストの前編集対象部分の単語を標準表記に書き
換えるテキスト自動前編集装置及び方法並びにこれに利
用される記憶媒体を提供する。
のであり、例えば、自然言語で記述されたテキストの前
編集処理において、テキストの種類の識別と、そのテキ
ストの種類に応じた前編集規則及び標準表記の選択を自
動化し、その自動選択された前編集規則に基づいて検出
したテキストの前編集対象部分の単語を標準表記に書き
換えるテキスト自動前編集装置及び方法並びにこれに利
用される記憶媒体を提供する。
【0008】
【課題を解決するための手段】本発明は、自然言語で記
述されたテキストに関連する単語、品詞情報、形態素情
報を記憶した辞書テーブルとテキストの種類を識別する
ための識別規則を記憶した識別規則テーブルとテキスト
を前編集するための前編集規則及び標準表記をテキスト
の種類別に記憶した前編集規則テーブルとからなるテー
ブルメモリと、テキストを入力する入力部と、辞書テー
ブルを参照し、入力テキストの各単語について形態素解
析して品詞情報、形態素情報を抽出する形態素解析部
と、識別規則テーブルを参照し、抽出された品詞情報、
形態素情報からテキストの種類を識別する識別部と、前
編集規則テーブルを参照し、識別された種類に対応する
編集規則からテキストの前編集対象部分の単語を検出
し、その単語を標準表記に書き換える前編集部とを備え
たことを特徴とするテキスト自動前編集装置である。
述されたテキストに関連する単語、品詞情報、形態素情
報を記憶した辞書テーブルとテキストの種類を識別する
ための識別規則を記憶した識別規則テーブルとテキスト
を前編集するための前編集規則及び標準表記をテキスト
の種類別に記憶した前編集規則テーブルとからなるテー
ブルメモリと、テキストを入力する入力部と、辞書テー
ブルを参照し、入力テキストの各単語について形態素解
析して品詞情報、形態素情報を抽出する形態素解析部
と、識別規則テーブルを参照し、抽出された品詞情報、
形態素情報からテキストの種類を識別する識別部と、前
編集規則テーブルを参照し、識別された種類に対応する
編集規則からテキストの前編集対象部分の単語を検出
し、その単語を標準表記に書き換える前編集部とを備え
たことを特徴とするテキスト自動前編集装置である。
【0009】本発明によれば、自然言語で記述されたテ
キストの前編集処理において、テキストの種類の識別
と、そのテキストの種類に応じた前編集規則及び標準表
記の選択を自動化したので、ユーザの負担を軽減するこ
とができる。また、その自動選択された前編集規則に基
づいて検出したテキストの前編集対象部分の単語を標準
表記に書き換えるテキスト自動前編集装置を提供するこ
とができる。
キストの前編集処理において、テキストの種類の識別
と、そのテキストの種類に応じた前編集規則及び標準表
記の選択を自動化したので、ユーザの負担を軽減するこ
とができる。また、その自動選択された前編集規則に基
づいて検出したテキストの前編集対象部分の単語を標準
表記に書き換えるテキスト自動前編集装置を提供するこ
とができる。
【0010】
【発明の実施の形態】本発明の構成において、(1)既
存規則は変更せず、特殊な表現を扱うための規則群を、
標準的な表現を扱うための既存規則群から独立させた形
式で保持した前編集規則テーブルと、既存規則による処
理を行う前に、既存規則でも適切に処理できるように特
殊な形式の表現を標準的な表現に書き換える前編集部を
設ける。(2)対象テキストに含まれる様々な種類の情
報を、識別規則テーブルに基づいてテキストの種類を自
動的に識別し、その識別結果に従って適切な前編集規則
群を前編集規則テーブルから自動的に選択する。
存規則は変更せず、特殊な表現を扱うための規則群を、
標準的な表現を扱うための既存規則群から独立させた形
式で保持した前編集規則テーブルと、既存規則による処
理を行う前に、既存規則でも適切に処理できるように特
殊な形式の表現を標準的な表現に書き換える前編集部を
設ける。(2)対象テキストに含まれる様々な種類の情
報を、識別規則テーブルに基づいてテキストの種類を自
動的に識別し、その識別結果に従って適切な前編集規則
群を前編集規則テーブルから自動的に選択する。
【0011】なお、本発明において、辞書テーブル、識
別規則テーブル、前編集規則テーブルは、例えば、本体
と分離可能な磁気テープやカセットテープ等のテープ
系、フロッピー(登録商標)ディスクやハードディスク
等の磁気ディスクやCD−ROM/MO/MD/DVD
等の光ディスクのディスク系、ICカード(メモリカー
ドも含む)/光カード等のカード系、あるいはマスクR
OM、EPROM、EEPROM、フラッシュROM等
による半導体メモリを含めた固定的にプログラムを担持
する記憶媒体で構成してもよい。入力部は、キーボー
ド、マウス、ペン、タブレット、スキャナ、文字認識装
置記憶媒体読取装置などの入力装置で構成してもよい。
識別部、前編集部は、例えば、CPU、ROM、RA
M、I/Oポートからなるコンピュータ、CPUを含む
ASICなどで構成してもよい。
別規則テーブル、前編集規則テーブルは、例えば、本体
と分離可能な磁気テープやカセットテープ等のテープ
系、フロッピー(登録商標)ディスクやハードディスク
等の磁気ディスクやCD−ROM/MO/MD/DVD
等の光ディスクのディスク系、ICカード(メモリカー
ドも含む)/光カード等のカード系、あるいはマスクR
OM、EPROM、EEPROM、フラッシュROM等
による半導体メモリを含めた固定的にプログラムを担持
する記憶媒体で構成してもよい。入力部は、キーボー
ド、マウス、ペン、タブレット、スキャナ、文字認識装
置記憶媒体読取装置などの入力装置で構成してもよい。
識別部、前編集部は、例えば、CPU、ROM、RA
M、I/Oポートからなるコンピュータ、CPUを含む
ASICなどで構成してもよい。
【0012】前記前編集部は、前編集規則テーブルを参
照し、前記識別部により識別されたテキストの種類に対
応する編集規則を選択する選択部と、選択された編集規
則に対応するテキストの前編集対象部分の単語を検索す
る検索部と、検索された単語を標準表記に書き換える書
換部とをさらに備えた構成にしてもよい。この構成にお
いて、選択部、検索部、書換部は、例えば、CPU、R
OM、RAM、I/Oポートからなるコンピュータ、C
PUを含むASICなどで構成してもよい。
照し、前記識別部により識別されたテキストの種類に対
応する編集規則を選択する選択部と、選択された編集規
則に対応するテキストの前編集対象部分の単語を検索す
る検索部と、検索された単語を標準表記に書き換える書
換部とをさらに備えた構成にしてもよい。この構成にお
いて、選択部、検索部、書換部は、例えば、CPU、R
OM、RAM、I/Oポートからなるコンピュータ、C
PUを含むASICなどで構成してもよい。
【0013】前記識別規則テーブルは、テキストの種類
が科学技術論文、特許明細書、機器の取り扱い説明書ま
たは報道記事であるか否かを識別するための識別規則を
分野別に記憶した構成にしてもよい。
が科学技術論文、特許明細書、機器の取り扱い説明書ま
たは報道記事であるか否かを識別するための識別規則を
分野別に記憶した構成にしてもよい。
【0014】この構成によれば、異なる言語間の機械翻
訳を行う機械翻訳装置が本発明のテキスト自動前編集装
置を用いて翻訳の前編集処理を行う機械翻訳システムが
提供される。また、自然言語装置を接続と自然言語で記
述されたテキストの転送を制御するインターフェイスが
本発明のテキスト自動前編集装置を用いてテキストの前
編集処理を行う自然言語インターフェイスが提供され
る。また、自然言語で記述されたテキストを自動要約す
るテキスト要約装置が本発明のテキスト自動前編集装置
を用いてテキストを前編集処理を行うテキスト要約シス
テムが提供される。
訳を行う機械翻訳装置が本発明のテキスト自動前編集装
置を用いて翻訳の前編集処理を行う機械翻訳システムが
提供される。また、自然言語装置を接続と自然言語で記
述されたテキストの転送を制御するインターフェイスが
本発明のテキスト自動前編集装置を用いてテキストの前
編集処理を行う自然言語インターフェイスが提供され
る。また、自然言語で記述されたテキストを自動要約す
るテキスト要約装置が本発明のテキスト自動前編集装置
を用いてテキストを前編集処理を行うテキスト要約シス
テムが提供される。
【0015】以下、図に示す実施例に基づいて本発明を
詳述する。なお、これによって本発明は限定されること
はない。
詳述する。なお、これによって本発明は限定されること
はない。
【0016】図1は本発明の一実施例であるテキスト自
動前編集装置の構成を示すブロック図である。図1にお
いて、1はコピュータのCPU(中央処理装置)からな
る制御部を示し、制御部1は、プログラムメモリに記憶
された制御プログラムにより各部を制御する。
動前編集装置の構成を示すブロック図である。図1にお
いて、1はコピュータのCPU(中央処理装置)からな
る制御部を示し、制御部1は、プログラムメモリに記憶
された制御プログラムにより各部を制御する。
【0017】2はキーボード、マウス、ペン、タブレッ
ト、スキャナ、文字認識装置などの入力装置や、通信回
線と接続されている通信装置、記憶媒体読取装置などか
らなる入力部を示し、入力部2は自然言語で記述された
テキストの入力、前編集処理の指示、テキストの通信、
制御プログラムのインストールなどを行う。
ト、スキャナ、文字認識装置などの入力装置や、通信回
線と接続されている通信装置、記憶媒体読取装置などか
らなる入力部を示し、入力部2は自然言語で記述された
テキストの入力、前編集処理の指示、テキストの通信、
制御プログラムのインストールなどを行う。
【0018】3はCRT(陰極線管)ディスプレイ、L
CD(液晶ディスプレイ)、PD(プラズマディスプレ
イ)などからなる表示装置3aや、サーマルプリンタ、
レーザプリンタなどからなる印字装置、または通信回線
と接続されている通信装置3cで構成される出力部を示
し、出力部3は、入力部2による入力結果、制御部1の
制御により翻訳結果を表示装置3aに表示したり、印字
装置3bを介して印字したり、通信装置3cを介して送
信する。
CD(液晶ディスプレイ)、PD(プラズマディスプレ
イ)などからなる表示装置3aや、サーマルプリンタ、
レーザプリンタなどからなる印字装置、または通信回線
と接続されている通信装置3cで構成される出力部を示
し、出力部3は、入力部2による入力結果、制御部1の
制御により翻訳結果を表示装置3aに表示したり、印字
装置3bを介して印字したり、通信装置3cを介して送
信する。
【0019】4はマスクROM、EPROM、EEPR
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた記憶媒体からなるテーブルメモリを
示し、テーブルメモリ4は、単語、品詞情報、形態素情
報を記憶した辞書テーブル4a、テキストの種類を識別
するための識別規則を記憶した識別規則テーブル4b、
テキストを前編集するための新聞記事の見出し用前編集
規則、特許明細書用前編集規則、取り扱い説明書用前編
集規則などの前編集規則及び標準表記をテキストの種類
別に記憶した前編集規則テーブル4cとして機能する。
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた記憶媒体からなるテーブルメモリを
示し、テーブルメモリ4は、単語、品詞情報、形態素情
報を記憶した辞書テーブル4a、テキストの種類を識別
するための識別規則を記憶した識別規則テーブル4b、
テキストを前編集するための新聞記事の見出し用前編集
規則、特許明細書用前編集規則、取り扱い説明書用前編
集規則などの前編集規則及び標準表記をテキストの種類
別に記憶した前編集規則テーブル4cとして機能する。
【0020】5はマスクROM、EPROM、EEPR
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた記憶媒体からなるプログラムメモリ
を示し、プログラムメモリ5は、辞書テーブル4aを参
照し、入力テキストの各単語について形態素解析して品
詞情報、形態素情報を抽出する形態素解析部5a、識別
規則テーブル4bを参照し、形態素解析部5aによって
抽出された単語の品詞情報、形態素情報からテキストの
種類を識別する識別部5b、前編集規則テーブル4cを
参照し、識別された種類に対応する編集規則からテキス
トの前編集対象部分の単語を検出し、その単語を標準表
記に書き換える前編集部5cとして機能する各制御プロ
グラムを記憶している。
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた記憶媒体からなるプログラムメモリ
を示し、プログラムメモリ5は、辞書テーブル4aを参
照し、入力テキストの各単語について形態素解析して品
詞情報、形態素情報を抽出する形態素解析部5a、識別
規則テーブル4bを参照し、形態素解析部5aによって
抽出された単語の品詞情報、形態素情報からテキストの
種類を識別する識別部5b、前編集規則テーブル4cを
参照し、識別された種類に対応する編集規則からテキス
トの前編集対象部分の単語を検出し、その単語を標準表
記に書き換える前編集部5cとして機能する各制御プロ
グラムを記憶している。
【0021】前編集部5cは、識別部5bにより識別さ
れたテキストの種類に対応する編集規則を前編集規則テ
ーブルから選択する選択部5c-1と、選択された編集規
則に対応するテキストの前編集対象部分の単語を検索す
る検索部5c-2と、検索された単語を標準表記に書き換
える書換部5c-3として機能する。
れたテキストの種類に対応する編集規則を前編集規則テ
ーブルから選択する選択部5c-1と、選択された編集規
則に対応するテキストの前編集対象部分の単語を検索す
る検索部5c-2と、検索された単語を標準表記に書き換
える書換部5c-3として機能する。
【0022】6はRAM、EEPROM、フラッシュR
OM等による半導体メモリ、あるいは磁気テープやカセ
ットテープ等のテープ系、フロッピーディスクやハード
ディスク等の磁気ディスクやCD−ROM/MO/MD
/DVD等の光ディスクのディスク系、ICカード(メ
モリカードも含む)/光カード等のカード系等を含めた
記憶媒体からなるバッファメモリを示し、バッファメモ
リ6は、入力テキストを記憶するテキストバッファ6
a、形態素解析部5aで形態素解析された単語、品詞情
報、形態素情報を記憶する形態素解析結果バッファ6
b、識別部5bで識別された種類を記憶する識別結果バ
ッファ6c、選択部5c-1で選択された標準表記を記憶
する選択結果バッファ6d、書換部5c-3で書き換えら
れたテキストを記憶する書換テキストバッファ6eとし
て機能する領域に備えている。
OM等による半導体メモリ、あるいは磁気テープやカセ
ットテープ等のテープ系、フロッピーディスクやハード
ディスク等の磁気ディスクやCD−ROM/MO/MD
/DVD等の光ディスクのディスク系、ICカード(メ
モリカードも含む)/光カード等のカード系等を含めた
記憶媒体からなるバッファメモリを示し、バッファメモ
リ6は、入力テキストを記憶するテキストバッファ6
a、形態素解析部5aで形態素解析された単語、品詞情
報、形態素情報を記憶する形態素解析結果バッファ6
b、識別部5bで識別された種類を記憶する識別結果バ
ッファ6c、選択部5c-1で選択された標準表記を記憶
する選択結果バッファ6d、書換部5c-3で書き換えら
れたテキストを記憶する書換テキストバッファ6eとし
て機能する領域に備えている。
【0023】制御部1は、識別規則とのマッチング処理
したデータや前編集規則とのマッチング処理したデータ
を各バッファに記憶する。7はバスラインを示し、制御
プログラムデータ及びアドレスデータが転送される。制
御部1は、バスライン7を会してプログラムメモリ4か
ら制御プログラムを読み出して各部を制御することによ
り本発明のテキスト前編集装置を実現する。
したデータや前編集規則とのマッチング処理したデータ
を各バッファに記憶する。7はバスラインを示し、制御
プログラムデータ及びアドレスデータが転送される。制
御部1は、バスライン7を会してプログラムメモリ4か
ら制御プログラムを読み出して各部を制御することによ
り本発明のテキスト前編集装置を実現する。
【0024】8はマスクROM、EPROM、EEPR
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた本体と分離可能なメディアで構成し
た固定的にプログラムを担持する記憶媒体を示し、記憶
媒体8に本発明のテキスト前編集プログラムを記憶し、
入力部2の記憶媒体読取装置を介してバッファメモリ6
の予備領域にテキスト前編集プログラムをインストール
することにより本発明のテキスト前編集機能を実現して
もよい。また、この記憶媒体は、本テキスト前編集装置
がインターネットを含めた外部の通信ネットワークとの
接続可能な通信装置を備えている場合には、その通信装
置を介して通信ネットワークからプログラムをダウンロ
ードするように流動的にプログラムを担持する媒体であ
ってもよい。なお、このように通信ネットワークからプ
ログラムをダウンロードする場合には、そのダウンロー
ド用プログラムは予め本体装置に格納しておくか、ある
いは別な記憶媒体からインストールされるものであって
もよい。なお、記憶媒体に格納されている内容としては
プログラムに限定されず、データであってもよい。
OM、フラッシュROM等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやCD−
ROM/MO/MD/DVD等の光ディスクのディスク
系、ICカード(メモリカードも含む)/光カード等の
カード系等を含めた本体と分離可能なメディアで構成し
た固定的にプログラムを担持する記憶媒体を示し、記憶
媒体8に本発明のテキスト前編集プログラムを記憶し、
入力部2の記憶媒体読取装置を介してバッファメモリ6
の予備領域にテキスト前編集プログラムをインストール
することにより本発明のテキスト前編集機能を実現して
もよい。また、この記憶媒体は、本テキスト前編集装置
がインターネットを含めた外部の通信ネットワークとの
接続可能な通信装置を備えている場合には、その通信装
置を介して通信ネットワークからプログラムをダウンロ
ードするように流動的にプログラムを担持する媒体であ
ってもよい。なお、このように通信ネットワークからプ
ログラムをダウンロードする場合には、そのダウンロー
ド用プログラムは予め本体装置に格納しておくか、ある
いは別な記憶媒体からインストールされるものであって
もよい。なお、記憶媒体に格納されている内容としては
プログラムに限定されず、データであってもよい。
【0025】本発明の別の観点によれば、自然言語で記
述されたテキストに関連する単語、品詞情報、形態素情
報を記憶した辞書テーブル4aとテキストの種類を識別
するための識別規則を記憶した識別規則テーブル4bと
テキストを前編集するための前編集規則及び標準表記を
テキストの種類別に記憶した前編集規則テーブル4cと
からなるテーブルメモリ4と、テキストを入力する入力
部とを備えたテキスト自動前編集装置に用いられ、コン
ピュータ1によって読み取り可能なテキスト自動前編集
プログラムを記憶した記憶媒体8であって、前記コンピ
ュータ1に、辞書テーブル4aを参照し、入力テキスト
を形態素解析して品詞情報、形態素情報を抽出させ、識
別規則テーブル4bを参照し、抽出された品詞情報、形
態素情報からテキストの種類を識別させ、前編集規則テ
ーブル4cを参照し、識別された種類に対応する編集規
則からテキストの前編集対象部分の単語を検出させ、そ
の単語を標準表記に書き換えさせることができる。
述されたテキストに関連する単語、品詞情報、形態素情
報を記憶した辞書テーブル4aとテキストの種類を識別
するための識別規則を記憶した識別規則テーブル4bと
テキストを前編集するための前編集規則及び標準表記を
テキストの種類別に記憶した前編集規則テーブル4cと
からなるテーブルメモリ4と、テキストを入力する入力
部とを備えたテキスト自動前編集装置に用いられ、コン
ピュータ1によって読み取り可能なテキスト自動前編集
プログラムを記憶した記憶媒体8であって、前記コンピ
ュータ1に、辞書テーブル4aを参照し、入力テキスト
を形態素解析して品詞情報、形態素情報を抽出させ、識
別規則テーブル4bを参照し、抽出された品詞情報、形
態素情報からテキストの種類を識別させ、前編集規則テ
ーブル4cを参照し、識別された種類に対応する編集規
則からテキストの前編集対象部分の単語を検出させ、そ
の単語を標準表記に書き換えさせることができる。
【0026】図2は本実施例のテキスト自動前編集処理
の手順を示すフローチャートである。以下、図3〜図5
を用いて、英日機械翻訳システムで翻訳されるテキスト
の前編集処理について説明する。図3は本実施例の入力
テキストの一例を示す図である。図3に示すように、英
日機械翻訳の対象となるE1〜E3のテキストが入力部
2により入力されテキストバッファ6aに記憶される。
続いて、入力部2により自動テキスト前編集処理の指示
が入力される。
の手順を示すフローチャートである。以下、図3〜図5
を用いて、英日機械翻訳システムで翻訳されるテキスト
の前編集処理について説明する。図3は本実施例の入力
テキストの一例を示す図である。図3に示すように、英
日機械翻訳の対象となるE1〜E3のテキストが入力部
2により入力されテキストバッファ6aに記憶される。
続いて、入力部2により自動テキスト前編集処理の指示
が入力される。
【0027】STEP1では、形態素解析部5aにより
対象テキストの形態素解析を行い、対象テキストに含ま
れる対象表現となる各単語について品詞などの語彙属性
を抽出する。STEP2では、1対象テキストに含まれ
る対象表現の数をカウントする対象表現数カウンタの値
iをリセットする。STEP3〜STEP6では、識別
部5bにより、対象テキストの先頭から一表現ずつ順
に、識別規則テーブルに記憶された各テキスト識別規則
とのマッチングを行い、どの条件にマッチするかに応じ
てテキストの種類を識別する。
対象テキストの形態素解析を行い、対象テキストに含ま
れる対象表現となる各単語について品詞などの語彙属性
を抽出する。STEP2では、1対象テキストに含まれ
る対象表現の数をカウントする対象表現数カウンタの値
iをリセットする。STEP3〜STEP6では、識別
部5bにより、対象テキストの先頭から一表現ずつ順
に、識別規則テーブルに記憶された各テキスト識別規則
とのマッチングを行い、どの条件にマッチするかに応じ
てテキストの種類を識別する。
【0028】図4は本実施例の識別規則テーブルに記憶
された識別規則の一例を示す図である。入力テキストの
種類を識別する場合、入力テキストの対象表現が、識別
規則1)と2)を満たすかどうかは、対象表現を比較す
ることによって判断する。図4では、図3に示す入力テ
キストのE2、E3は、識別規則1)と2)を満たすの
で、この入力テキストは新聞記事であると識別される。
従来技術では、対象テキストの種類が例えば新聞記事で
あることをあらかじめ指定しておく必要があった。本実
施例では対象テキストの種類を自動的に識別する。
された識別規則の一例を示す図である。入力テキストの
種類を識別する場合、入力テキストの対象表現が、識別
規則1)と2)を満たすかどうかは、対象表現を比較す
ることによって判断する。図4では、図3に示す入力テ
キストのE2、E3は、識別規則1)と2)を満たすの
で、この入力テキストは新聞記事であると識別される。
従来技術では、対象テキストの種類が例えば新聞記事で
あることをあらかじめ指定しておく必要があった。本実
施例では対象テキストの種類を自動的に識別する。
【0029】STEP7では、識別規則テーブルにあら
かじめ記憶されている識別規則によってテキストの種類
に識別できない場合、テキストの種類としてある値(例
えば「一般テキスト」)が設定される。STEP8で
は、1対象テキストに含まれる対象表現の数をカウント
する対象表現数カウンタの値iをリセットする。
かじめ記憶されている識別規則によってテキストの種類
に識別できない場合、テキストの種類としてある値(例
えば「一般テキスト」)が設定される。STEP8で
は、1対象テキストに含まれる対象表現の数をカウント
する対象表現数カウンタの値iをリセットする。
【0030】STEP9〜STEP11では、前編集部
5c(選択部、検索部、書換部)により、対象テキスト
の先頭から一表現ずつ順に、前編集規則群テーブルに記
憶された各前編集規則とのマッチングを行い、マッチン
グに成功した表現に対して書き換えを行うことにより、
前編集処理を実行する。なお、STEP9のnは入力テ
キストに含まれる表現の数である。
5c(選択部、検索部、書換部)により、対象テキスト
の先頭から一表現ずつ順に、前編集規則群テーブルに記
憶された各前編集規則とのマッチングを行い、マッチン
グに成功した表現に対して書き換えを行うことにより、
前編集処理を実行する。なお、STEP9のnは入力テ
キストに含まれる表現の数である。
【0031】図5は本実施例の前編集規則テーブルに記
憶された前編集規則の一例を示す図である。図5に示す
ように、前編集規則テーブル4cには、例えば、新聞記
事の見出し用の前編集規則が記憶されている。図5の例
では、前編集規則1)、2)、3)がすべて満たされる
とき、“to”を“will”に書き換える前編集処理
である。
憶された前編集規則の一例を示す図である。図5に示す
ように、前編集規則テーブル4cには、例えば、新聞記
事の見出し用の前編集規則が記憶されている。図5の例
では、前編集規則1)、2)、3)がすべて満たされる
とき、“to”を“will”に書き換える前編集処理
である。
【0032】図3に示すテキストを前編集する場合、E
1のテキスト“Agency to inspecthealth of 8 banks
”は、図5の前編集規則1)、2)、3)をすべて満
たすので、“Agency will inspect health of 8 banks
”に書き換えられる。“Agency to inspect health of
8 banks ”という表現を“Agency will inspect healt
h of 8 banks ”に書き換えてもよいのは、この表現が
新聞記事の見出しである場合であり、そうでない場合は
書き換えてよいとは限らない。
1のテキスト“Agency to inspecthealth of 8 banks
”は、図5の前編集規則1)、2)、3)をすべて満
たすので、“Agency will inspect health of 8 banks
”に書き換えられる。“Agency to inspect health of
8 banks ”という表現を“Agency will inspect healt
h of 8 banks ”に書き換えてもよいのは、この表現が
新聞記事の見出しである場合であり、そうでない場合は
書き換えてよいとは限らない。
【0033】これに対して、E2、E3のテキストは、
この編集規則を満たさないので書き換えられない。テキ
ストの対象表現が、図5の前編集規則1)を満たすかど
うかは、対象表現と、例えば以下のような名詞句パター
ンがマッチングするかどうかによって調べる。
この編集規則を満たさないので書き換えられない。テキ
ストの対象表現が、図5の前編集規則1)を満たすかど
うかは、対象表現と、例えば以下のような名詞句パター
ンがマッチングするかどうかによって調べる。
【0034】名詞句パターン:{冠詞}{{副詞}限定
形容詞}{名詞*}名詞 ここで、括弧{ }で囲まれた要素(冠詞、副詞、限定
形容詞、名詞*)は存在してもしなくてもよいことを意
味し、記号「*」は、要素が任意回数繰り返し出現可能
であることを意味する。
形容詞}{名詞*}名詞 ここで、括弧{ }で囲まれた要素(冠詞、副詞、限定
形容詞、名詞*)は存在してもしなくてもよいことを意
味し、記号「*」は、要素が任意回数繰り返し出現可能
であることを意味する。
【0035】対象表現が前編集規則2)を満たすかどう
かは、対象表現上で、単語“for”を検索することによ
って判断する。また、対象表現が前編集規則3)を満た
すかどうかは、例えば、次のような手続きによって調べ
る。
かは、対象表現上で、単語“for”を検索することによ
って判断する。また、対象表現が前編集規則3)を満た
すかどうかは、例えば、次のような手続きによって調べ
る。
【0036】テキストの対象表現が前編集規則を満たす
かどうかの判定手順としては、対象表現の先頭から順
に、述語になり得る定形動詞を検索する。もし、述語が
見つかれば、その述語候補と、人称・数が一致する名詞
を主辞とする名詞句が前方に存在するかどうかを調べ
る。 名詞句の検索には、上記の名詞句パターンを利用
する。もし、そのような名詞句が存在すれば、それを主
語と見なし、対象表現全体を文と見なし、前編集規則
3)が満たされないものとする。
かどうかの判定手順としては、対象表現の先頭から順
に、述語になり得る定形動詞を検索する。もし、述語が
見つかれば、その述語候補と、人称・数が一致する名詞
を主辞とする名詞句が前方に存在するかどうかを調べ
る。 名詞句の検索には、上記の名詞句パターンを利用
する。もし、そのような名詞句が存在すれば、それを主
語と見なし、対象表現全体を文と見なし、前編集規則
3)が満たされないものとする。
【0037】前編集処理しないテキスト“Agency to in
spect health of 8 banks ”を、標準的な表現を主な対
象とした従来の機械翻訳システムに入力して翻訳する
と、例えば「8つの銀行の健全性を調査するための機
関」のように新聞記事の見出しとしては不適切な翻訳が
生成される。
spect health of 8 banks ”を、標準的な表現を主な対
象とした従来の機械翻訳システムに入力して翻訳する
と、例えば「8つの銀行の健全性を調査するための機
関」のように新聞記事の見出しとしては不適切な翻訳が
生成される。
【0038】これに対して、STEP1での形態素解析
処理、STEP2〜STEP7でのテキスト識別処理、
STEP8〜STEP11でのテキスト前編集処理の説
明からわかるように、本発明のテキスト前編集装置で書
き換えた“Agency will inspect health of 8 banks ”
を、従来の機械翻訳システムの入力して翻訳すれば、例
えば、「機関は8つの銀行の健全性を調査するであろ
う」のように新聞記事の見出しとして適切な翻訳が得ら
れる。
処理、STEP2〜STEP7でのテキスト識別処理、
STEP8〜STEP11でのテキスト前編集処理の説
明からわかるように、本発明のテキスト前編集装置で書
き換えた“Agency will inspect health of 8 banks ”
を、従来の機械翻訳システムの入力して翻訳すれば、例
えば、「機関は8つの銀行の健全性を調査するであろ
う」のように新聞記事の見出しとして適切な翻訳が得ら
れる。
【0039】図6は本発明のテキスト自動前編集装置の
適用システムの一例を示す図である。本発明のテキスト
自動前編集装置は、自然言語処理システムとは独立であ
り、本発明のテキスト前編集装置から出力される前編集
されたテキストを利用するシステムとして、図6に示す
ような適用テキストがある。
適用システムの一例を示す図である。本発明のテキスト
自動前編集装置は、自然言語処理システムとは独立であ
り、本発明のテキスト前編集装置から出力される前編集
されたテキストを利用するシステムとして、図6に示す
ような適用テキストがある。
【0040】例えば、異なる言語間の機械翻訳を行う機
械翻訳装置が本発明のテキスト自動前編集装置を用いて
翻訳の前編集処理を行う機械翻訳システムを提供するこ
とができる。また、自然言語装置を接続と自然言語で記
述されたテキストの転送を制御するインターフェイスが
本発明のテキスト自動前編集装置を用いてテキストの前
編集処理を行う自然言語インターフェイスを提供するこ
とができる。また、自然言語で記述されたテキストを自
動要約するテキスト要約装置が本発明のテキスト自動前
編集装置を用いてテキストを前編集処理を行うテキスト
要約システムを提供することができる。
械翻訳装置が本発明のテキスト自動前編集装置を用いて
翻訳の前編集処理を行う機械翻訳システムを提供するこ
とができる。また、自然言語装置を接続と自然言語で記
述されたテキストの転送を制御するインターフェイスが
本発明のテキスト自動前編集装置を用いてテキストの前
編集処理を行う自然言語インターフェイスを提供するこ
とができる。また、自然言語で記述されたテキストを自
動要約するテキスト要約装置が本発明のテキスト自動前
編集装置を用いてテキストを前編集処理を行うテキスト
要約システムを提供することができる。
【0041】
【発明の効果】本発明によれば、自然言語で記述された
テキストの前編集処理において、テキストの種類の識別
と、そのテキストの種類に応じた前編集規則及び標準表
記の選択を自動化したので、ユーザの負担を軽減するこ
とができる。また、その自動選択された前編集規則に基
づいて検出したテキストの前編集対象部分の単語を標準
表記に書き換えるテキスト自動前編集装置を提供するこ
とができる。
テキストの前編集処理において、テキストの種類の識別
と、そのテキストの種類に応じた前編集規則及び標準表
記の選択を自動化したので、ユーザの負担を軽減するこ
とができる。また、その自動選択された前編集規則に基
づいて検出したテキストの前編集対象部分の単語を標準
表記に書き換えるテキスト自動前編集装置を提供するこ
とができる。
【図1】本発明の一実施例であるテキスト自動前編集装
置の構成を示すブロック図である。
置の構成を示すブロック図である。
【図2】本実施例のテキスト自動前編集処理の手順を示
すフローチャートである。
すフローチャートである。
【図3】本実施例の入力テキストの一例を示す図であ
る。
る。
【図4】本実施例の識別規則テーブルに記憶された識別
規則の一例を示す図である。
規則の一例を示す図である。
【図5】本実施例の前編集規則テーブルに記憶された前
編集規則の一例を示す図である。
編集規則の一例を示す図である。
【図6】本発明のテキスト自動前編集装置の適用システ
ムの一例を示す図である。
ムの一例を示す図である。
1 制御部 2 入力部 3 出力部 4 テーブルメモリ 4a 辞書テーブル 4b 識別規則テーブル 4c 前編集規則群テーブル 5 プログラムメモリ 5a 形態素解析部 5b 識別部 5c 前編集部 5c-1 選択部 5c-2 検索部 5c-3 書換部 6 バッファメモリ 6a テキストバッファ 6b 形態素解析結果バッファ 6c 識別結果バッファ 6d 選択結果バッファ 6e 書換テキストバッファ 7 バスライン 8 記憶媒体
Claims (8)
- 【請求項1】 自然言語で記述されたテキストに関連す
る単語、品詞情報、形態素情報を記憶した辞書テーブル
とテキストの種類を識別するための識別規則を記憶した
識別規則テーブルとテキストを前編集するための前編集
規則及び標準表記をテキストの種類別に記憶した前編集
規則テーブルとからなるテーブルメモリと、テキストを
入力する入力部と、辞書テーブルを参照し、入力テキス
トの各単語について形態素解析して品詞情報、形態素情
報を抽出する形態素解析部と、識別規則テーブルを参照
し、抽出された品詞情報、形態素情報からテキストの種
類を識別する識別部と、前編集規則テーブルを参照し、
識別された種類に対応する編集規則からテキストの前編
集対象部分の単語を検出し、その単語を標準表記に書き
換える前編集部とを備えたことを特徴とするテキスト自
動前編集装置。 - 【請求項2】 前記前編集部は、前編集規則テーブルを
参照し、前記識別部により識別されたテキストの種類に
対応する編集規則を選択する選択部と、選択された編集
規則に対応するテキストの前編集対象部分の単語を検索
する検索部と、検索された単語を標準表記に書き換える
書換部とをさらに備えたことを特徴とする請求項1記載
のテキスト自動前編集装置。 - 【請求項3】 前記識別規則テーブルは、テキストの種
類が科学技術論文、特許明細書、機器の取り扱い説明書
または報道記事であるか否かを識別するための識別規則
を分野別に記憶したことを特徴とする請求項1記載のテ
キスト自動前編集装置。 - 【請求項4】 自然言語で記述されたテキストに関連す
る単語、品詞情報、形態素情報を辞書テーブルに記憶
し、テキストの種類を識別するための識別規則を識別規
則テーブルに記憶し、テキストを前編集するための前編
集規則及び標準表記をテキストの種類別に前編集規則テ
ーブルを記憶し、入力部を用いて、テキストを入力し、
形態素解析部を用いて、辞書テーブルを参照し、入力テ
キストの各単語について形態素解析して品詞情報、形態
素情報を抽出し、識別部を用いて、識別規則テーブルを
参照し、抽出された品詞情報、形態素情報からテキスト
の種類を識別し、前編集部を用いて、前編集規則テーブ
ルを参照し、識別された種類に対応する編集規則からテ
キストの前編集対象部分の単語を検出し、その単語を標
準表記に書き換えることを特徴とするテキスト自動前編
集方法。 - 【請求項5】 コンピュータに、自然言語で記述された
テキストに関連する単語、品詞情報、形態素情報を記憶
した辞書テーブルを参照させ、入力テキストを形態素解
析して品詞情報、形態素情報を抽出させ、テキストの種
類を識別するための識別規則を記憶した識別規則テーブ
ルを参照させ、抽出された品詞情報、形態素情報からテ
キストの種類を識別させ、テキストを前編集するための
前編集規則及び標準表記をテキストの種類別に記憶した
前編集規則テーブルを参照し、識別された種類に対応す
る編集規則からテキストの前編集対象部分の単語を検出
させ、その単語を標準表記に書き換えさせる処理を実行
させるテキスト自動前編集プログラムを記憶した記憶媒
体。 - 【請求項6】 異なる言語間の機械翻訳を行う機械翻訳
装置が請求項1記載のテキスト自動前編集装置を用いて
翻訳の前編集処理を行うことを特徴とする機械翻訳シス
テム。 - 【請求項7】 自然言語装置を接続と自然言語で記述さ
れたテキストの転送を制御するインターフェイスが請求
項1記載のテキスト自動前編集装置を用いてテキストの
前編集処理を行うことを特徴とする自然言語インターフ
ェイス。 - 【請求項8】 自然言語で記述されたテキストを自動要
約するテキスト要約装置が請求項1記載のテキスト自動
前編集装置を用いてテキストを前編集処理を行うことを
特徴とするテキスト要約システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11070312A JP2000268034A (ja) | 1999-03-16 | 1999-03-16 | テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11070312A JP2000268034A (ja) | 1999-03-16 | 1999-03-16 | テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000268034A true JP2000268034A (ja) | 2000-09-29 |
Family
ID=13427823
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11070312A Pending JP2000268034A (ja) | 1999-03-16 | 1999-03-16 | テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000268034A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100413966B1 (ko) * | 2000-12-18 | 2004-01-07 | 한국전자통신연구원 | 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법 |
| KR100445907B1 (ko) * | 2001-12-26 | 2004-08-25 | 한국전자통신연구원 | 음성언어 식별 장치 및 방법 |
| US7080320B2 (en) | 2001-01-29 | 2006-07-18 | Kabushiki Kaisha Toshiba | Translation apparatus and method |
| JP2008135011A (ja) * | 2006-10-19 | 2008-06-12 | Korea Electronics Telecommun | 翻訳システム及び翻訳サービス提供方法 |
| US9547645B2 (en) | 2014-01-22 | 2017-01-17 | Fujitsu Limited | Machine translation apparatus, translation method, and translation system |
| CN112287684A (zh) * | 2020-10-30 | 2021-01-29 | 中国科学院自动化研究所 | 融合变体词识别的短文本审核方法及装置 |
-
1999
- 1999-03-16 JP JP11070312A patent/JP2000268034A/ja active Pending
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100413966B1 (ko) * | 2000-12-18 | 2004-01-07 | 한국전자통신연구원 | 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법 |
| US7080320B2 (en) | 2001-01-29 | 2006-07-18 | Kabushiki Kaisha Toshiba | Translation apparatus and method |
| US7505895B2 (en) | 2001-01-29 | 2009-03-17 | Kabushiki Kaisha Toshiba | Translation apparatus and method |
| KR100445907B1 (ko) * | 2001-12-26 | 2004-08-25 | 한국전자통신연구원 | 음성언어 식별 장치 및 방법 |
| JP2008135011A (ja) * | 2006-10-19 | 2008-06-12 | Korea Electronics Telecommun | 翻訳システム及び翻訳サービス提供方法 |
| US7921018B2 (en) | 2006-10-19 | 2011-04-05 | Electronics And Telecommunications Research Institute | Translation system and method of providing translation service |
| US9547645B2 (en) | 2014-01-22 | 2017-01-17 | Fujitsu Limited | Machine translation apparatus, translation method, and translation system |
| CN112287684A (zh) * | 2020-10-30 | 2021-01-29 | 中国科学院自动化研究所 | 融合变体词识别的短文本审核方法及装置 |
| CN112287684B (zh) * | 2020-10-30 | 2024-06-11 | 中国科学院自动化研究所 | 融合变体词识别的短文本审核方法及装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4242848B2 (ja) | 電子文書に含まれる数値データを視覚的に目立たせる方法および装置 | |
| US5646840A (en) | Language conversion system and text creating system using such | |
| US8126698B2 (en) | Technique for improving accuracy of machine translation | |
| US9411788B2 (en) | Methods and apparatus for improved navigation among controlled terms in one or more user documents | |
| JP3220560B2 (ja) | 機械翻訳装置 | |
| CN101361064A (zh) | 文本编辑装置和方法 | |
| JP2008152760A (ja) | マシンアシスト翻訳ツール | |
| JPH07282063A (ja) | 機械翻訳装置 | |
| JP2003532194A (ja) | 言語間リーディングウィザードを用いたコンピュータ援用リーディングシステムおよび方法 | |
| JP2000268034A (ja) | テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体 | |
| JP2000259635A (ja) | 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体 | |
| JP6056489B2 (ja) | 翻訳支援プログラム、方法、および装置 | |
| JP2003323425A (ja) | 対訳辞書作成装置、翻訳装置、対訳辞書作成プログラム、および翻訳プログラム | |
| US8041556B2 (en) | Chinese to english translation tool | |
| Pinnis et al. | Tilde MT platform for developing client specific MT solutions | |
| US7308398B2 (en) | Translation correlation device | |
| US5640581A (en) | CD-ROM information editing apparatus | |
| JPH06348751A (ja) | 言語変換装置 | |
| JP2001337945A (ja) | 自動編集装置及び方法並びにこれに利用される記憶媒体 | |
| JP2000276479A (ja) | 電子辞書装置及び電子辞書プログラムを記録した記録媒体 | |
| JPH04174069A (ja) | 言語理解支援装置 | |
| JP4294386B2 (ja) | 異表記正規化処理装置、異表記正規化処理プログラムおよび記憶媒体 | |
| JPH0561902A (ja) | 機械翻訳システム | |
| JP2001117919A (ja) | 自然言語文自動前編集装置及び方法並びにこれに利用される記憶媒体 | |
| JPH08329059A (ja) | 汎用参照装置 |