JP6809005B2 - 翻訳装置、翻訳システムおよびプログラム - Google Patents
翻訳装置、翻訳システムおよびプログラム Download PDFInfo
- Publication number
- JP6809005B2 JP6809005B2 JP2016134715A JP2016134715A JP6809005B2 JP 6809005 B2 JP6809005 B2 JP 6809005B2 JP 2016134715 A JP2016134715 A JP 2016134715A JP 2016134715 A JP2016134715 A JP 2016134715A JP 6809005 B2 JP6809005 B2 JP 6809005B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- manuscript
- history information
- translation
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Machine Translation (AREA)
Description
また特許文献2には、文書データベースに原文に対応した最新版の翻訳データが予め存在する場合には、その翻訳データを利用し、翻訳データはなく最新版の文書データが存在している場合、文書データを翻訳処理して翻訳データを得、最新版の文書データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し、この翻訳データを利用する翻訳サーバが開示されている。
しかしながらこの場合、送信元から送られた原稿の内容は、複数回の翻訳を行なうことになるため、複数回の翻訳後に元の英語の内容が維持されるとは限らない。
本発明は、複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供することを目的とする。
請求項2に記載の発明は、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置である。
請求項3に記載の発明は、前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1または2に記載の翻訳装置である。
請求項4に記載の発明は、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果を、当該第2の言語による文章が位置する領域に配するとともに、当該履歴情報に存在した内容を当該第2の言語から当該第1の言語による原文に戻して置き換えた結果を、当該第2の言語による文章が位置する領域に置き換えることで、レイアウトを維持することを特徴とする請求項1乃至3の何れか1項に記載の翻訳装置である。
請求項5に記載の発明は、前記抽出部は、前記レイアウト解析部により作成された領域の位置の情報を基に、前記第1の言語による文章が存在する領域以外に文章が存在する領域を、前記履歴情報には存在しない内容として抽出することを特徴とする請求項4に記載の翻訳装置である。
請求項6に記載の発明は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該第2の言語から置き換えた結果とを合成する合成部と、を備え、前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする翻訳装置である。
請求項7に記載の発明は、原稿の内容を翻訳する翻訳手段と、原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、を備え、前記翻訳手段は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、を備え、前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳システムである。
請求項8に記載の発明は、コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、前記翻訳機能が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成機能と、原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析機能と、を実現させ、前記抽出機能は、前記レイアウト解析機能により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出するプログラムである。
請求項2の発明によれば、第1の言語を第2の言語に翻訳し、さらに第1の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項3の発明によれば、ユーザが追加した事項について抽出し、翻訳を行なうことができる。
請求項4の発明によれば、翻訳を行なった後の原稿のレイアウトを維持しやすくなる。
請求項5の発明によれば、履歴情報には存在しない内容を抽出するのがより容易になる。
請求項6の発明によれば、第1の言語を第2の言語に翻訳し、さらに第3の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項7の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい翻訳システムを提供することができる。
請求項8の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい機能をコンピュータにより実現できる。
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
なお以後の説明において、「原語」とは、翻訳される対象となる言語であり、翻訳前の言語である。また「訳語」とは、翻訳後の言語である。さらに「原文」とは、原語で記された1文字以上の文章のことであり、「訳文」とは、訳語で記された1文字以上の文章のことである。
図示するように、この翻訳システム1は、端末装置10と、画像形成装置30とがネットワーク90に接続されることにより構成されている。また、ネットワーク90は、例えば、図示しないゲイトウェイサーバを介して、ネットワーク70に接続されており、ネットワーク70には、クラウドサーバ50が接続されている。
なお図では、1つの端末装置10しか示していないが、複数の端末装置10を設けてもよい。また図では、1つの画像形成装置30しか示していないが、複数の画像形成装置30を設けてもよい。
ネットワーク90は、端末装置10と画像形成装置30との間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。
図2は、端末装置10のハードウェア構成を示した図である。
図示するように、端末装置10は、演算手段であるCPU(Central Processing Unit)11と、記憶手段であるメインメモリ12及びHDD(Hard Disk Drive)13とを備える。ここで、CPU11は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行する。また、メインメモリ12は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD13は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
更に、端末装置10は、外部との通信を行うための通信インターフェース(以下、「通信I/F」と表記する)14と、ビデオメモリやディスプレイ等からなる表示機構15と、キーボードやマウス等の入力デバイス16とを備える。
図示するように、画像形成装置30は、CPU31と、RAM(Random Access Memory)32と、ROM(Read Only Memory)33と、HDD(Hard Disk Drive)34と、操作パネル35と、画像読み取り部36と、画像形成部37と、通信I/F38とを備える。
RAM32は、CPU31の作業用メモリ等として用いられるメモリである。
ROM33は、CPU31が実行する各種プログラム等を記憶するメモリである。
HDD34は、画像読み取り部36が読み取った画像データや画像形成部37における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。
操作パネル35は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。
通信I/F38は、ネットワークを介して他の装置との間で各種情報の送受信を行う。
図4(a)は、ファクシミリで送られてきた原稿の一例である。
図示する原稿は、注文書(Order Sheet)であり、英語で記載された文章からなる。この場合、まず原稿の書類名を表す「Order Sheet」が最上部に記載されている。そして書類名の下部左側には、注文を行なうために必要な事項を示す「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」が記載され、下部右側には、これらの事項に対応する内容を実際に記載するための空欄が設けられている。
図示するように、原稿の最上部に記載された書類名を表す「Order Sheet」は、「注文書」に翻訳されている。また書類名の下部左側に記載された注文を行なうために必要な事項を示す「Name」、「E-mail address」等は、それぞれ「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳されている。
この例では、ユーザは、「名前」に対し、「富士 太郎」を記載している。同様にユーザは、「電子メールアドレス」に対して、「Fuji.taro@fujixerox.co.jp」を記載し、「電話番号」に対しては、「123-4567-8910」を記載している。またユーザは、「郵便番号」に対して、「123-4567」を記載し、「アドレス」に対しては、「日本国日本県日本村1-2-3」を記載している。さらにユーザは、「アイテムコード」に対して、「ABCDEF」を記載し、「意見」に対して、「日本特別仕様にして下さい。」を記載している。
この例では、日本語の文章である「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、元の英語の原稿にあった「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」に戻っている。またユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳されている。
そこで本実施の形態では、クラウドサーバ50の構成を以下のようにし、この問題の抑制を図っている。
図示するように、クラウドサーバ50は、原稿の文書データを取得するデータ取得部501と、翻訳の履歴である履歴情報を参照し取得した原稿が存在するか否かを判定する判定部502と、原稿のレイアウトを解析するレイアウト解析部503と、原文から訳文への翻訳を行なう翻訳部504と、翻訳辞書や履歴情報を記憶する記憶部505と、履歴情報を作成する履歴作成部506と、予め定められた文章を抽出する抽出部507と、翻訳結果を合成する合成部508と、翻訳後の文書データを出力するデータ出力部509とを備える。
図4(c)に示す例で説明すると、第2の言語である日本語より記載された原稿の内容として、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、履歴情報に存在する。一方、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、履歴情報に存在しない。よって抽出部507は、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」等の文章を抽出する。つまり履歴情報には存在しない内容は、ユーザが原稿に追加した事項になる。詳しくは後述するが、抽出部507は、レイアウト解析部503により解析された翻訳対象の位置に基づき、履歴情報には存在しない内容を差分として抽出する。
この場合、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から他の言語(この場合、英語)に翻訳した結果は、図4(d)に示す「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」となる。また履歴情報に存在した内容を履歴情報により第2の言語から他の言語(この場合、英語)に置き換えた結果は、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」である。つまり前者は、日本語の文章から英語の文章に翻訳されるのに対し、後者は、翻訳されず履歴情報により元の英語の文章に戻る。即ち、元の翻訳前の原稿にあった文章は、英語→日本語→英語の2回の翻訳を経ることはなく、履歴情報により元の英語の文章に戻ることになる。その結果、図4(d)に示す英語による原稿が得られる。
次に翻訳システム1の動作について説明を行なう。
図6は、翻訳システム1の動作について説明したフローチャートである。
まずユーザは、翻訳を行ないたい原稿(翻訳前の原稿)の文書データをクラウドサーバ50に対しアップロードする(ステップ101)。
この作業を画像形成装置30で行なう場合、ユーザは、画像読み取り部36において原稿をスキャンし、原稿の画像データを取得する。そして原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。このとき送信する文書データは、例えば、図4(a)に示した翻訳前の原稿の文書データであるとする。
次に判定部502が、データ取得部501が取得した文書データが履歴情報に存在するか否かを判定する(ステップ103)。ここでは、判定部502は、取得した文書データが履歴情報に存在するか否かを判定するのに、原稿に履歴情報を表すQRコードが存在するか否かで判定を行なうものとする。例えば、図4(a)に示した原稿は、QRコードがなく、そのため判定部502は、取得した文書データが履歴情報に存在しない新規のものであると判定する。
図示するようにレイアウト解析部503は、原稿の中で文章が存在する箇所について矩形領域を設定する。図示する例では、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」のそれぞれについて矩形領域S1〜S8が設定される。そしてレイアウト解析部503は、矩形領域S1〜S8のそれぞれについて、領域情報群を作成する。領域情報群には、例えば、矩形領域の位置を表す情報、矩形領域に含まれる文章、矩形領域に含まれる文章の言語が含まれる。矩形領域の位置を表す情報は、例えば、矩形領域の始点(矩形領域の左上の座標)、矩形領域の終点(矩形領域の右下の座標)である。またこれに加えてページ番号などを含んでいてもよい。矩形領域に含まれる文章は、上述した「Order Sheet」、「Name」、「E-mail address」等のテキストデータである。また矩形領域に含まれる文章の言語は、この場合、英語である。またこれに加えて翻訳先の言語(この場合、日本語)の情報を含んでいてもよい。
この場合、領域情報群に含まれる「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」は、それぞれ「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳される。
図示する履歴情報は、履歴ID、原稿ID、原語、訳語、翻訳結果からなる。そしてここでは、履歴IDとして10121および10122のものが既に存在し、今回履歴IDが10123のものが追加された例を示している。
原稿IDは、リンク情報であり、原稿IDが「3」のものを参照すると、図7で説明した領域情報群と翻訳前の原稿のイメージ情報を得ることができる。
また翻訳結果もリンク情報であり、翻訳結果が「R−3」のものを参照すると、上述した「Order Sheet」−「注文書」、「Name」−「名前」、「E-mail address」−「電子メールアドレス」、「Phone number」−「電話番号」、「Zip code」−「郵便番号」、「Address」−「アドレス」、「Item code」−「アイテムコード」、「Remarks」−「意見」の対応関係を得ることができる。また翻訳後の原稿のイメージ情報を得ることができる。即ち履歴情報には、英語による原語と日本語による訳語との対応関係が含まれている。
さらにデータ出力部509が、翻訳後の日本語による原稿の文書データを画像形成装置30に対し出力する(ステップ108)。またデータ出力部509は、このとき履歴IDをQRコードとして出力する文書データに埋め込む(この場合、10123)。その結果、図4(b)で示した翻訳後の原稿となり、ユーザは翻訳後の原稿を得ることができる。
レイアウト解析部503は、図7に示した場合と同様に原稿の中で文章が存在する箇所について矩形領域を設定する。その結果、レイアウト解析部503は、まず図7に示した矩形領域S1〜S8と同じ箇所に矩形領域を設定する。図示する例では、レイアウト解析部503は、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」のそれぞれについて矩形領域T1〜T8を設定する。またさらにレイアウト解析部503は、原稿の中でユーザが追加した箇所について矩形領域T9〜T15を設定する。つまり「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」のそれぞれについて矩形領域T9〜T15が設定される。そしてレイアウト解析部503は、矩形領域T1〜T15のそれぞれについて、領域情報群を作成する。領域情報群の内容は、図7で説明した場合と同様である。
この場合、矩形領域T9〜T15が差分として検出される。これは、抽出部507は、第2の言語(日本語)により記載された原稿の内容が履歴情報に存在したときに、履歴情報には存在しない内容を抽出する、と言い換えることもできる。
図示する履歴情報は、図8に示した履歴ID、原稿ID、原語、訳語、翻訳結果に加え、親履歴が加わっている。そしてここでは、履歴IDが10124のものが追加された例を示している。リンク情報である原稿IDは、「4」であり、これを参照すると、矩形領域T9〜T15の領域情報群を得ることができる。また追加後の原稿のイメージ情報を得ることができる。そして親履歴として、「10123」が記載される。これにより履歴IDが10124の原稿は、履歴IDが10123の原稿に対し、原稿IDが示す差分を追加したものであることがわかる。
具体的には、矩形領域T9〜T15内に含まれる「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳される。
図示する履歴情報は、図8に示した履歴情報と比較して翻訳結果としてR−4が追加されている。この翻訳結果R−4を参照すると、上述した「富士 太郎」−「Fujitarou」、「Fuji.taro@fujixerox.co.jp」−「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」−「123-4567-8910」、「123-4567」−「123-4567」、「日本国日本県日本村1-2-3」−「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」−「ABCDEF」、「日本特別仕様にして下さい。」−「Make a Japanese special series.」の対応関係が得られる。また合成部508により作成された合成後の原稿のイメージ画像が得られる。
またQRコードやバーコードのような識別子情報でなくてもよい。例えは、文書データが構造化文書であった場合は、履歴情報をデータとして埋め込んでもよい。また文書データのファイルのプロパティに設定してもよい。さらに文章のレイアウトの類似性から判定してもよい。
そして上述した例では、クラウドサーバ50は、ネットワーク70に接続されクラウドサービスを行なうものであったが、ネットワーク90に接続し、翻訳サーバとして使用してもよい。即ち、クラウドサーバ50が接続されるネットワークに特に制限はない。さらにクラウドサーバ50の機能を画像形成装置30に入れ込み、画像形成装置30単独で一連の処理を行ってもよい。この場合、画像形成装置30が翻訳装置として機能する。
なお本実施の形態におけるクラウドサーバ50が行なう処理は、例えば、CPU11が、HDD13等に記憶された各種プログラムをメインメモリ12にロードして実行することにより行なわれる。
Claims (8)
- 原稿の内容を異なる言語に翻訳する翻訳部と、
前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、
原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、
を備え、
前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳装置。 - 前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置。
- 前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1または2に記載の翻訳装置。
- 前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果を、当該第2の言語による文章が位置する領域に配するとともに、当該履歴情報に存在した内容を当該第2の言語から当該第1の言語による原文に戻して置き換えた結果を、当該第2の言語による文章が位置する領域に置き換えることで、レイアウトを維持することを特徴とする請求項1乃至3の何れか1項に記載の翻訳装置。
- 前記抽出部は、前記レイアウト解析部により作成された領域の位置の情報を基に、前記第1の言語による文章が存在する領域以外に文章が存在する領域を、前記履歴情報には存在しない内容として抽出することを特徴とする請求項4に記載の翻訳装置。
- 原稿の内容を異なる言語に翻訳する翻訳部と、
前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該第2の言語から置き換えた結果とを合成する合成部と、
を備え、
前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、
前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする翻訳装置。 - 原稿の内容を翻訳する翻訳手段と、
原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、
を備え、
前記翻訳手段は、
原稿の内容を異なる言語に翻訳する翻訳部と、
前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、
原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、
を備え、
前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳システム。 - コンピュータに、
原稿の内容を異なる言語に翻訳する翻訳機能と、
前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、
前記翻訳機能が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、
前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成機能と、
原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析機能と、
を実現させ、
前記抽出機能は、前記レイアウト解析機能により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出するプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016134715A JP6809005B2 (ja) | 2016-07-07 | 2016-07-07 | 翻訳装置、翻訳システムおよびプログラム |
| US15/441,335 US20180011840A1 (en) | 2016-07-07 | 2017-02-24 | Translation apparatus, translation system, and non-transitory computer readable medium |
| CN201710319929.4A CN107590136B (zh) | 2016-07-07 | 2017-05-09 | 翻译设备、翻译系统以及翻译方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016134715A JP6809005B2 (ja) | 2016-07-07 | 2016-07-07 | 翻訳装置、翻訳システムおよびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018005749A JP2018005749A (ja) | 2018-01-11 |
| JP6809005B2 true JP6809005B2 (ja) | 2021-01-06 |
Family
ID=60892856
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016134715A Active JP6809005B2 (ja) | 2016-07-07 | 2016-07-07 | 翻訳装置、翻訳システムおよびプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20180011840A1 (ja) |
| JP (1) | JP6809005B2 (ja) |
| CN (1) | CN107590136B (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109710951B (zh) * | 2018-12-27 | 2023-10-17 | 北京百度网讯科技有限公司 | 基于翻译历史的辅助翻译方法、装置、设备及存储介质 |
| KR102454092B1 (ko) * | 2020-10-26 | 2022-10-14 | (주)링글잉글리시에듀케이션서비스 | 사전 정의 재정렬 시스템 및 그 방법 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004341985A (ja) * | 2003-05-19 | 2004-12-02 | Nec Corp | 翻訳サービスオークションシステム,方法およびプログラム |
| JP4350566B2 (ja) * | 2004-03-17 | 2009-10-21 | 東芝ソリューション株式会社 | 機械翻訳システム |
| JP2006252049A (ja) * | 2005-03-09 | 2006-09-21 | Fuji Xerox Co Ltd | 翻訳システム、翻訳方法およびプログラム |
| JP4992216B2 (ja) * | 2005-09-21 | 2012-08-08 | 富士ゼロックス株式会社 | 翻訳装置及びプログラム |
| US8799307B2 (en) * | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
| US20120240039A1 (en) * | 2011-03-15 | 2012-09-20 | Walker Digital, Llc | Systems and methods for facilitating translation of documents |
| US9367539B2 (en) * | 2011-11-03 | 2016-06-14 | Microsoft Technology Licensing, Llc | Techniques for automated document translation |
| US9251143B2 (en) * | 2012-01-13 | 2016-02-02 | International Business Machines Corporation | Converting data into natural language form |
| JP2014059766A (ja) * | 2012-09-18 | 2014-04-03 | Sharp Corp | 画像処理装置、画像形成装置、プログラム、記録媒体 |
| JP5403183B1 (ja) * | 2013-08-09 | 2014-01-29 | 富士ゼロックス株式会社 | 画像読取装置及びプログラム |
| CN103823796A (zh) * | 2014-02-25 | 2014-05-28 | 武汉传神信息技术有限公司 | 一种翻译系统及翻译方法 |
| JP2016091266A (ja) * | 2014-11-04 | 2016-05-23 | 富士通株式会社 | 翻訳装置、翻訳方法、及び翻訳プログラム |
| JP6259804B2 (ja) * | 2014-11-26 | 2018-01-10 | ネイバー コーポレーションNAVER Corporation | コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法 |
| KR101827773B1 (ko) * | 2016-08-02 | 2018-02-09 | 주식회사 하이퍼커넥트 | 통역 장치 및 방법 |
-
2016
- 2016-07-07 JP JP2016134715A patent/JP6809005B2/ja active Active
-
2017
- 2017-02-24 US US15/441,335 patent/US20180011840A1/en not_active Abandoned
- 2017-05-09 CN CN201710319929.4A patent/CN107590136B/zh active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN107590136A (zh) | 2018-01-16 |
| CN107590136B (zh) | 2023-07-14 |
| JP2018005749A (ja) | 2018-01-11 |
| US20180011840A1 (en) | 2018-01-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5712487B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、及びプログラム | |
| US7801720B2 (en) | Translation requesting method, translation requesting terminal and computer readable recording medium | |
| US7797150B2 (en) | Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database | |
| US9530050B1 (en) | Document annotation sharing | |
| US8156115B1 (en) | Document-based networking with mixed media reality | |
| US10528679B2 (en) | System and method for real time translation | |
| US8411956B2 (en) | Associating optical character recognition text data with source images | |
| US12373631B2 (en) | Systems, methods, and devices for a form converter | |
| JP6809005B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
| US20190146646A1 (en) | Information processing system, information processing apparatus, and non-transitory computer readable medium | |
| JP4438656B2 (ja) | 画像処理装置、画像処理システムおよびプログラム | |
| CN105740317A (zh) | 用于将非文本内容对象化以及用于文档发现的方法和系统 | |
| US11928171B2 (en) | Providing shortened URL and information related contents corresponding to original URL | |
| JP7027757B2 (ja) | 情報処理装置及び情報処理プログラム | |
| US8499235B2 (en) | Method of posting content to a web site | |
| JP2021047792A (ja) | 情報処理装置及びプログラム | |
| JP2011028503A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
| JP6702047B2 (ja) | 翻訳装置、翻訳システムおよびプログラム | |
| JP2009205209A (ja) | 文書画像処理装置、及び文書画像処理プログラム | |
| JP6281739B2 (ja) | 処理装置及びプログラム | |
| US10264157B2 (en) | Image processing apparatus, image processing method and image processing program | |
| JP2004248245A (ja) | 文書処理装置 | |
| KR20070034343A (ko) | 이미지파일의 내용검색이 가능한 전자문서 전환 장치 | |
| JP2023047133A (ja) | 情報処理装置、情報処理システム、及びプログラム | |
| JP2010067187A (ja) | 文書処理装置、文書処理方法および文書処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190520 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190920 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191015 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191202 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200421 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200618 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201123 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6809005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |