[go: up one dir, main page]

JP6809005B2 - 翻訳装置、翻訳システムおよびプログラム - Google Patents

翻訳装置、翻訳システムおよびプログラム Download PDF

Info

Publication number
JP6809005B2
JP6809005B2 JP2016134715A JP2016134715A JP6809005B2 JP 6809005 B2 JP6809005 B2 JP 6809005B2 JP 2016134715 A JP2016134715 A JP 2016134715A JP 2016134715 A JP2016134715 A JP 2016134715A JP 6809005 B2 JP6809005 B2 JP 6809005B2
Authority
JP
Japan
Prior art keywords
language
manuscript
history information
translation
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016134715A
Other languages
English (en)
Other versions
JP2018005749A (ja
Inventor
泰 伊藤
泰 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016134715A priority Critical patent/JP6809005B2/ja
Priority to US15/441,335 priority patent/US20180011840A1/en
Priority to CN201710319929.4A priority patent/CN107590136B/zh
Publication of JP2018005749A publication Critical patent/JP2018005749A/ja
Application granted granted Critical
Publication of JP6809005B2 publication Critical patent/JP6809005B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Machine Translation (AREA)

Description

本発明は、翻訳装置、翻訳システム、プログラムに関する。
近年、原語で記載された紙文書や電子文書を他言語に翻訳する翻訳サービスが提供されている。この翻訳サービスは、例えば、クラウドサービスとして提供される。これは端末装置等から翻訳サービスを行なうクラウドサーバに原文を送信すると、翻訳された後の訳文が送り返されてくるものである。
特許文献1には、読取部によって読み取った原文の原稿の画像データから文字データを抽出し、文字データを指定された言語に翻訳し、翻訳文を原文のレイアウトに仮配置させ、配置エラーの有無を調べ、配置エラーが有る場合に、翻訳文の文字属性を変更する文字属性変更処理を行い、原文のレイアウトに仮配置させ、配置エラーの有無を調べる。そして依然として配置エラーが有る場合に、翻訳結果に基づいて、翻訳の方法を変更する翻訳方法変更処理あるいは翻訳後の文書を変更する翻訳文書変更処理のいずれか一方もしくは両方の処理からなる再翻訳処理を行い、翻訳内容を変更して翻訳文を原文のレイアウトに整合させることが開示されている。
また特許文献2には、文書データベースに原文に対応した最新版の翻訳データが予め存在する場合には、その翻訳データを利用し、翻訳データはなく最新版の文書データが存在している場合、文書データを翻訳処理して翻訳データを得、最新版の文書データおよび翻訳データがない場合、原稿から得た文書データを翻訳処理し、この翻訳データを利用する翻訳サーバが開示されている。
特開2007−87056号公報 特開2007−52614号公報
ここで第1の言語で記載された原稿を第2の言語にいったん翻訳した後、他の言語に再翻訳する場合がある。例えば、送信元から送られ、第1の言語として英語で記載された原稿を第2の言語として日本語に翻訳し、必要な事項を日本語で追加した後、英語に再翻訳して送信元に送り返すような場合である。
しかしながらこの場合、送信元から送られた原稿の内容は、複数回の翻訳を行なうことになるため、複数回の翻訳後に元の英語の内容が維持されるとは限らない。
本発明は、複数回の翻訳を行なっても元の原稿の内容が変化しにくい翻訳装置等を提供することを目的とする。
請求項1に記載の発明は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、を備え、前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳装置である。
請求項2に記載の発明は、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置である。
請求項に記載の発明は、前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1または2に記載の翻訳装置である。
請求項に記載の発明は、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果を、当該第2の言語による文章が位置する領域に配するとともに、当該履歴情報に存在した内容を当該第2の言語から当該第1の言語よる原文に戻して置き換えた結果を、当該第2の言語による文章が位置する領域に置き換えることで、レイアウトを維持することを特徴とする請求項1乃至の何れか1項に記載の翻訳装置である。
請求項に記載の発明は、前記抽出部は、前記レイアウト解析部により作成された領域の位置の情報を基に、前記第1の言語による文章が存在する領域以外に文章が存在する領域を、前記履歴情報には存在しない内容として抽出することを特徴とする請求項に記載の翻訳装置である。
請求項に記載の発明は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該第2の言語から置き換えた結果とを合成する合成部と、を備え、前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする訳装置である。
請求項7に記載の発明は、原稿の内容を翻訳する翻訳手段と、原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、を備え、前記翻訳手段は、原稿の内容を異なる言語に翻訳する翻訳部と、前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、を備え、前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳システムである。
請求項8に記載の発明は、コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、前記翻訳機能が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成機能と、原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析機能と、を実現させ、前記抽出機能は、前記レイアウト解析機能により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出するプログラムである。
請求項1の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい翻訳装置を提供することができる。
請求項2の発明によれば、第1の言語を第2の言語に翻訳し、さらに第1の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項3の発明によれば、ユーザが追加した事項について抽出し、翻訳を行なうことができる。
請求項の発明によれば、翻訳を行なった後の原稿のレイアウトを維持しやすくなる。
請求項の発明によれば、履歴情報には存在しない内容を抽出するのがより容易になる。
請求項6の発明によれば、第1の言語を第2の言語に翻訳し、さらに第3の言語に翻訳した場合でも元の第1の言語による原稿の内容が変化しにくくなる。
請求項7の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい翻訳システムを提供することができる。
請求項8の発明によれば、複数回の翻訳を行なっても元の第1の言語による原稿の内容が変化しにくい機能をコンピュータにより実現できる。
本実施の形態が適用される翻訳システムの全体構成例を示したものである。 端末装置のハードウェア構成を示した図である。 画像形成装置のハードウェア構成例を示した図である。 (a)は、ファクシミリで送られてきた原稿の一例である。(b)は、クラウドサーバにより翻訳された後の原稿の一例である。(c)は、ユーザが翻訳後の原稿に対し、必要な事項を追加した例を示した図である。(d)は、(c)に示す追加後の原稿を、日本語から英語に再翻訳した例を示した図である。 クラウドサーバの機能構成例を示したブロック図である。 翻訳システムの動作について説明したフローチャートである。 レイアウト解析部が原稿のレイアウトを解析した結果について示した図である。 履歴作成部が作成する履歴情報の一例を示した図である。 (a)は、レイアウト解析部が原稿のレイアウトを再解析した結果について示した図である。(b)は、抽出部が検出した差分について示した図である。 履歴作成部が作成する差分についての履歴情報の一例を示した図である。 履歴作成部が翻訳結果を追加した後の履歴情報の一例を示した図である。
<翻訳システムの全体構成の説明>
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
なお以後の説明において、「原語」とは、翻訳される対象となる言語であり、翻訳前の言語である。また「訳語」とは、翻訳後の言語である。さらに「原文」とは、原語で記された1文字以上の文章のことであり、「訳文」とは、訳語で記された1文字以上の文章のことである。
図1は、本実施の形態が適用される翻訳システムの全体構成例を示したものである。
図示するように、この翻訳システム1は、端末装置10と、画像形成装置30とがネットワーク90に接続されることにより構成されている。また、ネットワーク90は、例えば、図示しないゲイトウェイサーバを介して、ネットワーク70に接続されており、ネットワーク70には、クラウドサーバ50が接続されている。
なお図では、1つの端末装置10しか示していないが、複数の端末装置10を設けてもよい。また図では、1つの画像形成装置30しか示していないが、複数の画像形成装置30を設けてもよい。
端末装置10は、クラウドサーバ50に文書の翻訳を要求するコンピュータ装置である。ここで、端末装置10としては、PC(Personal Computer)、携帯端末、携帯電話等を用いるとよい。
画像形成装置30は、紙等の記録媒体に画像を形成し、印刷媒体として出力する装置である。画像形成装置30は、プリンタ機能を備えるが、これに加えて例えば、スキャナ機能、ファクシミリ機能等の他の画像処理機能を備えていてもよい。
また詳しくは後述するが、画像形成装置30からもクラウドサーバ50に文書の翻訳を要求することができる。画像形成装置30は、原語により記された原稿の文書データをクラウドサーバ50に送信する文書送信手段として機能する。
クラウドサーバ50は、翻訳を行なうクラウドサービスを提供するサーバコンピュータである。クラウドサーバ50は、原稿の内容を翻訳する翻訳手段(翻訳装置)として機能する。
ネットワーク70は、端末装置10とクラウドサーバ50との間の情報通信や、画像形成装置30とクラウドサーバ50との間の情報通信に用いられる通信手段であり、例えば、インターネットである。
ネットワーク90は、端末装置10と画像形成装置30との間の情報通信に用いられる通信手段であり、例えば、LAN(Local Area Network)である。
次に、端末装置10のハードウェア構成について説明する。
図2は、端末装置10のハードウェア構成を示した図である。
図示するように、端末装置10は、演算手段であるCPU(Central Processing Unit)11と、記憶手段であるメインメモリ12及びHDD(Hard Disk Drive)13とを備える。ここで、CPU11は、OS(Operating System)やアプリケーション等の各種ソフトウェアを実行する。また、メインメモリ12は、各種ソフトウェアやその実行に用いるデータ等を記憶する記憶領域であり、HDD13は、各種ソフトウェアに対する入力データや各種ソフトウェアからの出力データ等を記憶する記憶領域である。
更に、端末装置10は、外部との通信を行うための通信インターフェース(以下、「通信I/F」と表記する)14と、ビデオメモリやディスプレイ等からなる表示機構15と、キーボードやマウス等の入力デバイス16とを備える。
なお図2は、クラウドサーバ50のハードウェア構成を示した図として捉えることもできる。
図3は、画像形成装置30のハードウェア構成例を示した図である。
図示するように、画像形成装置30は、CPU31と、RAM(Random Access Memory)32と、ROM(Read Only Memory)33と、HDD(Hard Disk Drive)34と、操作パネル35と、画像読み取り部36と、画像形成部37と、通信I/F38とを備える。
CPU31は、ROM33等に記憶された各種プログラムをRAM32にロードして実行することにより、後述する各機能を実現する。
RAM32は、CPU31の作業用メモリ等として用いられるメモリである。
ROM33は、CPU31が実行する各種プログラム等を記憶するメモリである。
HDD34は、画像読み取り部36が読み取った画像データや画像形成部37における画像形成にて用いる画像データ等を記憶する例えば磁気ディスク装置である。
操作パネル35は、各種情報の表示やユーザからの操作入力の受付を行う例えばタッチパネルである。
画像読み取り部36は、原稿に記録された画像を読み取る。ここで、画像読み取り部36は、例えばスキャナであり、光源から原稿に照射した光に対する反射光をレンズで縮小してCCD(Charge Coupled Devices)で受光するCCD方式や、LED光源から原稿に順に照射した光に対する反射光をCIS(Contact Image Sensor)で受光するCIS方式のものを用いるとよい。
画像形成部37は、記録媒体に画像を形成する印刷機構の一例である。ここで、画像形成部37は、例えばプリンタであり、感光体に付着させたトナーを記録媒体に転写して像を形成する電子写真方式や、インクを記録媒体上に吐出して像を形成するインクジェット方式のものを用いるとよい。
通信I/F38は、ネットワークを介して他の装置との間で各種情報の送受信を行う。
この構成の翻訳システム1において、端末装置10は、翻訳前の原語による文書データをクラウドサーバ50に対し送信する。これは、例えば、端末装置10で動作するWebブラウザ等のソフトウェアを使用することで行なうことができる。具体的には、端末装置10の表示機構15にクラウドサーバ50が提供するクラウドサービスのWebページを表示し、Webページのメニュー等を入力デバイス16を用いて操作することで行なう。そしてクラウドサーバ50では、文書を原語から訳語に翻訳し、翻訳後の文書のデータを端末装置10に送り返す。端末装置10では、送り返された翻訳後の文書がWebページに表示される。なお文書データのフォーマットとしては、例えば、Word形式やPDF形式を使用することができる。
また端末装置10のみならず、画像形成装置30でも原語による文書データをクラウドサーバ50に対し送信することができる。この場合、例えば、画像読み取り部36で原稿をスキャンし、原稿に記録された画像を画像データを取得する。そして、原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。
クラウドサーバ50では、文書を原語から訳語に翻訳した後、翻訳後の文書データを画像形成装置30または端末装置10に対し、送り返す。翻訳後の文書データが画像形成装置30に対し送り返されたときは、画像形成装置30では、例えば、操作パネル35に翻訳後の文書が表示される。あるいはHDD34でこれを記憶してもよい。また端末装置10に対し送り返されたときは、上述した場合と同様に翻訳後の文書がWebページに表示される。
このときファクシミリで送られてきた原稿を使用して翻訳システム1を利用する場合の一例を以下に説明する。
図4(a)は、ファクシミリで送られてきた原稿の一例である。
図示する原稿は、注文書(Order Sheet)であり、英語で記載された文章からなる。この場合、まず原稿の書類名を表す「Order Sheet」が最上部に記載されている。そして書類名の下部左側には、注文を行なうために必要な事項を示す「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」が記載され、下部右側には、これらの事項に対応する内容を実際に記載するための空欄が設けられている。
ユーザは、この原稿を画像形成装置30の画像読み取り部36で原稿をスキャンし、PDF形式等のフォーマットからなる文書データをクラウドサーバ50に対し送信する。その結果、クラウドサーバ50は、図4(a)に示した翻訳前の原稿の内容を原語である英語から訳語である日本語に翻訳する。そしてクラウドサーバ50は、翻訳後の原稿を文書データとして画像形成装置30に送り返す。
図4(b)は、クラウドサーバ50により翻訳された後の原稿の一例である。
図示するように、原稿の最上部に記載された書類名を表す「Order Sheet」は、「注文書」に翻訳されている。また書類名の下部左側に記載された注文を行なうために必要な事項を示す「Name」、「E-mail address」等は、それぞれ「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳されている。
ユーザは、受け取った翻訳後の原稿に対し、必要な事項を追加する。この場合、「Name」、「E-mail address」等が記載されている箇所の右側にある空欄に必要な事項を記載する。このときユーザは、手書きで追加を行なってもよく、電子データにより追加を行なってもよい。
図4(c)は、ユーザが翻訳後の原稿に対し、必要な事項を追加した例を示した図である。
この例では、ユーザは、「名前」に対し、「富士 太郎」を記載している。同様にユーザは、「電子メールアドレス」に対して、「Fuji.taro@fujixerox.co.jp」を記載し、「電話番号」に対しては、「123-4567-8910」を記載している。またユーザは、「郵便番号」に対して、「123-4567」を記載し、「アドレス」に対しては、「日本国日本県日本村1-2-3」を記載している。さらにユーザは、「アイテムコード」に対して、「ABCDEF」を記載し、「意見」に対して、「日本特別仕様にして下さい。」を記載している。
そしてユーザは、図4(c)に示す追加後の原稿をファクシミリの送信元に返信するにあたり、再度翻訳システム1を使用して、日本語から英語に再翻訳を行なう。そして英語に翻訳した再翻訳後の原稿をファクシミリを使用して返信する。
図4(d)は、図4(c)に示す追加後の原稿を、日本語から英語に再翻訳した例を示した図である。
この例では、日本語の文章である「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、元の英語の原稿にあった「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」に戻っている。またユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳されている。
しかしながらこのとき単に日本語から英語に再翻訳を行なうと、全ての文章が再翻訳の対象となるため、元の原稿にあった文章が図4(d)に示すように元の英語の文章に戻るとは限らない。つまり英語→日本語→英語の2回の翻訳を経るときに、元の英語の文章に戻らないことがある。具体的には、「注文書」、「名前」、「電子メールアドレス」等が元の原稿にあった「Order Sheet」、「Name」、「E-mail address」等に翻訳されるとは限らない。この場合、送信元から送られた翻訳前の原稿の意味と再翻訳語の原稿の意味が相違したり、または翻訳精度が低いと意味がわからなくなる場合も生ずる。この場合、送信元にとっては、返信された再翻訳後の原稿の内容理解が困難となる。
<クラウドサーバ50の説明>
そこで本実施の形態では、クラウドサーバ50の構成を以下のようにし、この問題の抑制を図っている。
図5は、クラウドサーバ50の機能構成例を示したブロック図である。なお図5では、クラウドサーバ50が有する種々の機能のうち本実施の形態に関係するものを選択して図示している。
図示するように、クラウドサーバ50は、原稿の文書データを取得するデータ取得部501と、翻訳の履歴である履歴情報を参照し取得した原稿が存在するか否かを判定する判定部502と、原稿のレイアウトを解析するレイアウト解析部503と、原文から訳文への翻訳を行なう翻訳部504と、翻訳辞書や履歴情報を記憶する記憶部505と、履歴情報を作成する履歴作成部506と、予め定められた文章を抽出する抽出部507と、翻訳結果を合成する合成部508と、翻訳後の文書データを出力するデータ出力部509とを備える。
データ取得部501は、画像形成装置30から、原稿の文書データを取得する。ここでは、データ取得部501は、図4(a)で説明した英語で記載された原稿の文書データを取得したとして、以下の説明を行なう。
判定部502は、取得した原稿が後述する履歴情報に存在するか否かを判定する。判定部502が原稿が履歴情報に存在するか否かを判定するには、例えば、取得した文書データに履歴情報を表すQRコード(登録商標)が存在するか否かで行なう。
レイアウト解析部503は、原稿のレイアウトを解析し、領域群を抽出する。レイアウト解析部503がレイアウトを解析する方法については、後述する。
翻訳部504は、原稿の内容を異なる言語に翻訳する。翻訳部504は、記憶部505に記憶されている翻訳辞書を用いて、原語により記された原文を訳語により記された訳文に翻訳を行なう。この場合、翻訳部504では、英語から日本語に翻訳が行なわれ、図4(b)で説明した日本語で記載された文章に翻訳される。
履歴作成部506は、翻訳部504が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係である翻訳結果を含む履歴情報を作成する。この場合、第1の言語は、英語であり、第2の言語は、日本語である。そして翻訳結果は、図4(a)〜(b)で示した例では、「Order Sheet」−「注文書」、「Name」−「名前」、「E-mail address」−「電子メールアドレス」、「Phone number」−「電話番号」、「Zip code」−「郵便番号」、「Address」−「アドレス」、「Item code」−「アイテムコード」、「Remarks」−「意見」の関係が、英語による原語と日本語による訳語との対応関係となる。そして履歴情報は、この対応関係を含む。
抽出部507は、翻訳部504が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には存在しない内容を抽出する。
図4(c)に示す例で説明すると、第2の言語である日本語より記載された原稿の内容として、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」は、履歴情報に存在する。一方、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、履歴情報に存在しない。よって抽出部507は、ユーザが追加した「富士 太郎」、「Fuji.taro@fujixerox.co.jp」等の文章を抽出する。つまり履歴情報には存在しない内容は、ユーザが原稿に追加した事項になる。詳しくは後述するが、抽出部507は、レイアウト解析部503により解析された翻訳対象の位置に基づき、履歴情報には存在しない内容を差分として抽出する。
合成部508は、翻訳部504により履歴情報には存在しない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報により第2の言語から他の言語に置き換えた結果とを合成する。
この場合、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から他の言語(この場合、英語)に翻訳した結果は、図4(d)に示す「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」となる。また履歴情報に存在した内容を履歴情報により第2の言語から他の言語(この場合、英語)に置き換えた結果は、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」である。つまり前者は、日本語の文章から英語の文章に翻訳されるのに対し、後者は、翻訳されず履歴情報により元の英語の文章に戻る。即ち、元の翻訳前の原稿にあった文章は、英語→日本語→英語の2回の翻訳を経ることはなく、履歴情報により元の英語の文章に戻ることになる。その結果、図4(d)に示す英語による原稿が得られる。
また本実施の形態では、原稿のレイアウトを解析するレイアウト解析部503を設け、原稿のレイアウトを解析する。そのため翻訳部504および合成部508は、レイアウト解析部503が解析したレイアウトを維持して翻訳結果を配することができる。その結果、原稿のレイアウトを乱さずに翻訳結果を得ることができる。
データ出力部509は、翻訳後の原稿のデータや再翻訳後の原稿のデータを文書データとして画像形成装置30に対し出力する。
<翻訳システム1の動作の説明>
次に翻訳システム1の動作について説明を行なう。
図6は、翻訳システム1の動作について説明したフローチャートである。
まずユーザは、翻訳を行ないたい原稿(翻訳前の原稿)の文書データをクラウドサーバ50に対しアップロードする(ステップ101)。
この作業を画像形成装置30で行なう場合、ユーザは、画像読み取り部36において原稿をスキャンし、原稿の画像データを取得する。そして原稿の画像データをPDF形式等のフォーマットからなる文書データとし、これをクラウドサーバ50に対し送信する。このとき送信する文書データは、例えば、図4(a)に示した翻訳前の原稿の文書データであるとする。
クラウドサーバ50では、データ取得部501が、送られた文書データを原稿の文書データとして取得する(ステップ102)。
次に判定部502が、データ取得部501が取得した文書データが履歴情報に存在するか否かを判定する(ステップ103)。ここでは、判定部502は、取得した文書データが履歴情報に存在するか否かを判定するのに、原稿に履歴情報を表すQRコードが存在するか否かで判定を行なうものとする。例えば、図4(a)に示した原稿は、QRコードがなく、そのため判定部502は、取得した文書データが履歴情報に存在しない新規のものであると判定する。
データ取得部501が取得した文書データが新規のものであり、判定部502が履歴情報に存在しないと判定した場合(ステップ103でNo)、レイアウト解析部503が原稿のレイアウトを解析する(ステップ104)。
図7は、レイアウト解析部503が原稿のレイアウトを解析した結果について示した図である。
図示するようにレイアウト解析部503は、原稿の中で文章が存在する箇所について矩形領域を設定する。図示する例では、「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」のそれぞれについて矩形領域S1〜S8が設定される。そしてレイアウト解析部503は、矩形領域S1〜S8のそれぞれについて、領域情報群を作成する。領域情報群には、例えば、矩形領域の位置を表す情報、矩形領域に含まれる文章、矩形領域に含まれる文章の言語が含まれる。矩形領域の位置を表す情報は、例えば、矩形領域の始点(矩形領域の左上の座標)、矩形領域の終点(矩形領域の右下の座標)である。またこれに加えてページ番号などを含んでいてもよい。矩形領域に含まれる文章は、上述した「Order Sheet」、「Name」、「E-mail address」等のテキストデータである。また矩形領域に含まれる文章の言語は、この場合、英語である。またこれに加えて翻訳先の言語(この場合、日本語)の情報を含んでいてもよい。
図6に戻り、次に翻訳部504が、記憶部505に記憶されている翻訳辞書を使用して、原稿の内容を英語から日本語に翻訳する(ステップ105)。
この場合、領域情報群に含まれる「Order Sheet」、「Name」、「E-mail address」、「Phone number」、「Zip code」、「Address」、「Item code」、「Remarks」は、それぞれ「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」に翻訳される。
そして履歴作成部506が、履歴情報を作成する(ステップ106)。この履歴情報には、英語による原語と日本語による訳語との対応関係が含まれる。
図8は、履歴作成部506が作成する履歴情報の一例を示した図である。
図示する履歴情報は、履歴ID、原稿ID、原語、訳語、翻訳結果からなる。そしてここでは、履歴IDとして10121および10122のものが既に存在し、今回履歴IDが10123のものが追加された例を示している。
原稿IDは、リンク情報であり、原稿IDが「3」のものを参照すると、図7で説明した領域情報群と翻訳前の原稿のイメージ情報を得ることができる。
また翻訳結果もリンク情報であり、翻訳結果が「R−3」のものを参照すると、上述した「Order Sheet」−「注文書」、「Name」−「名前」、「E-mail address」−「電子メールアドレス」、「Phone number」−「電話番号」、「Zip code」−「郵便番号」、「Address」−「アドレス」、「Item code」−「アイテムコード」、「Remarks」−「意見」の対応関係を得ることができる。また翻訳後の原稿のイメージ情報を得ることができる。即ち履歴情報には、英語による原語と日本語による訳語との対応関係が含まれている。
図6に戻り、次に記憶部505が、この履歴情報を記憶する(ステップ107)。
さらにデータ出力部509が、翻訳後の日本語による原稿の文書データを画像形成装置30に対し出力する(ステップ108)。またデータ出力部509は、このとき履歴IDをQRコードとして出力する文書データに埋め込む(この場合、10123)。その結果、図4(b)で示した翻訳後の原稿となり、ユーザは翻訳後の原稿を得ることができる。
そしてユーザは、受け取った翻訳後の原稿に対し、必要な事項を追加する。その結果、図4(c)で示すような追加後の原稿となる。
そしてユーザが翻訳前の原稿の送信元に返信するため、再び追加後の原稿をアップロードした場合、これは図6のフローチャートのステップ101に戻ることを意味する。ただしステップ101およびステップ102の後のステップ103において、判定部502は、原稿に履歴情報を表すQRコードが存在するため、取得した文書データが履歴情報に存在すると判定する(ステップ103でYes)。この場合、レイアウト解析部503が原稿のレイアウトを再解析する(ステップ109)。
図9(a)は、レイアウト解析部503が原稿のレイアウトを再解析した結果について示した図である。
レイアウト解析部503は、図7に示した場合と同様に原稿の中で文章が存在する箇所について矩形領域を設定する。その結果、レイアウト解析部503は、まず図7に示した矩形領域S1〜S8と同じ箇所に矩形領域を設定する。図示する例では、レイアウト解析部503は、「注文書」、「名前」、「電子メールアドレス」、「電話番号」、「郵便番号」、「アドレス」、「アイテムコード」、「意見」のそれぞれについて矩形領域T1〜T8を設定する。またさらにレイアウト解析部503は、原稿の中でユーザが追加した箇所について矩形領域T9〜T15を設定する。つまり「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」のそれぞれについて矩形領域T9〜T15が設定される。そしてレイアウト解析部503は、矩形領域T1〜T15のそれぞれについて、領域情報群を作成する。領域情報群の内容は、図7で説明した場合と同様である。
再び図6に戻り、次に抽出部507が、領域情報群を基に、図4(b)で示した翻訳後の原稿と図4(c)で示した追加後の原稿とで矩形領域の差分を検出する(ステップ110)。この差分は、履歴情報から得られる翻訳後の原稿のイメージと追加後の原稿のイメージを比較することで得られる。
図9(b)は、抽出部507が検出した差分について示した図である。
この場合、矩形領域T9〜T15が差分として検出される。これは、抽出部507は、第2の言語(日本語)により記載された原稿の内容が履歴情報に存在したときに、履歴情報には存在しない内容を抽出する、と言い換えることもできる。
そして抽出部507は、差分が存在するか否かを判断する(ステップ111)。このとき抽出部507が差分が存在しないと判断する場合(ステップ111でNo)は、ユーザが翻訳後の原稿に対し、何も追加しなかった場合である。この場合は、ステップ114に移行する。
一方、抽出部507が差分が存在すると判断した場合(ステップ111でYes)は、ユーザが翻訳後の原稿に対し、追加を行ない、図4(c)に示すような原稿とした場合である。この場合、履歴作成部506が、差分についての履歴情報を作成する(ステップ112)。この履歴情報には、日本語による原文と英語による訳文との対応関係が含まれる。
図10は、履歴作成部506が作成する差分についての履歴情報の一例を示した図である。
図示する履歴情報は、図8に示した履歴ID、原稿ID、原語、訳語、翻訳結果に加え、親履歴が加わっている。そしてここでは、履歴IDが10124のものが追加された例を示している。リンク情報である原稿IDは、「4」であり、これを参照すると、矩形領域T9〜T15の領域情報群を得ることができる。また追加後の原稿のイメージ情報を得ることができる。そして親履歴として、「10123」が記載される。これにより履歴IDが10124の原稿は、履歴IDが10123の原稿に対し、原稿IDが示す差分を追加したものであることがわかる。
次に検出された差分である矩形領域T9〜T15内の文章を、翻訳部504が、記憶部505に記憶されている翻訳辞書を使用して、日本語から英語に翻訳する(ステップ113)。
具体的には、矩形領域T9〜T15内に含まれる「富士 太郎」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「日本国日本県日本村1-2-3」、「ABCDEF」、「日本特別仕様にして下さい。」は、それぞれ「Fujitarou」、「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」、「123-4567」、「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」、「Make a Japanese special series.」に翻訳される。
次に合成部508が、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から他の言語(この場合、第1の言語である英語)に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語(この場合、日本語)から他の言語(この場合、第1の言語である英語)に置き換えた結果とを合成する(ステップ114)。このうち前者は、矩形領域T9〜T15内に含まれる「富士 太郎」、「Fuji.taro@fujixerox.co.jp」等を、「Fujitarou」、「Fuji.taro@fujixerox.co.jp」等に翻訳した結果に該当する。また後者は、矩形領域T1〜T8内に含まれる「注文書」、「名前」等を「Order Sheet」、「Name」等に置き換えることに該当する。
なおステップ111でNoであり、ユーザが翻訳後の原稿に対し、何も追加しなかった場合は、後者の矩形領域T1〜T8内に含まれる「注文書」、「名前」等を「Order Sheet」、「Name」等に置き換える処理だけがなされる。つまり図4(a)で示した翻訳前の原稿に戻る。
次に履歴作成部506が、ステップ112で作成した履歴情報に翻訳結果を追加する(ステップ115)。
図11は、履歴作成部506が翻訳結果を追加した後の履歴情報の一例を示した図である。
図示する履歴情報は、図8に示した履歴情報と比較して翻訳結果としてR−4が追加されている。この翻訳結果R−4を参照すると、上述した「富士 太郎」−「Fujitarou」、「Fuji.taro@fujixerox.co.jp」−「Fuji.taro@fujixerox.co.jp」、「123-4567-8910」−「123-4567-8910」、「123-4567」−「123-4567」、「日本国日本県日本村1-2-3」−「Japan Japan prefecture Japan village 1-2-3」、「ABCDEF」−「ABCDEF」、「日本特別仕様にして下さい。」−「Make a Japanese special series.」の対応関係が得られる。また合成部508により作成された合成後の原稿のイメージ画像が得られる。
次に記憶部505が、翻訳結果を追加した履歴情報を記憶する(ステップ116)。
そしてデータ出力部509が、再翻訳後の英語による原稿の文書データを画像形成装置30に対し出力する(ステップ108)。またデータ出力部509は、このとき履歴ID(この場合、10124)をQRコードとして出力する文書データに埋め込む。その結果、図4(d)で示した再翻訳後の原稿となり、ユーザは再翻訳後の原稿を得ることができる。
なお上述した形態は、合成部508において、再翻訳の対象となる言語を英語以外にする場合にも適用が可能である。例えば、再翻訳の対象となる言語を第3の言語である仏語とする。このとき合成部508は、翻訳部504により履歴情報には存在しない内容を第2の言語(この場合、日本語)から第3の言語(この場合、仏語)に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第1の言語(この場合、英語)から第3の言語(この場合、仏語)に翻訳し置き換えた結果とを合成する。つまり前者は、日本語の文章から仏語の文章に翻訳されるのに対し、後者は、履歴情報により元の英語の文章から仏語の文章に翻訳される。即ち、元の翻訳前の原稿にあった文章は、英語→日本語→仏語の2回の翻訳を経ることはなく、英語→仏語の1回の翻訳しかなされない。その結果、元の英語の文章と翻訳後の仏語の文章との意味の相違が生じにくくなる。
また上述した形態では、判定部502が、取得した文書データが履歴情報に存在するか否かを判定するのに、原稿に履歴情報を表すQRコードが存在するか否かで判定を行なっていたが、これに限られるものではない。QRコードの代わりにバーコード等であってもよい。
またQRコードやバーコードのような識別子情報でなくてもよい。例えは、文書データが構造化文書であった場合は、履歴情報をデータとして埋め込んでもよい。また文書データのファイルのプロパティに設定してもよい。さらに文章のレイアウトの類似性から判定してもよい。
そして上述した例では、クラウドサーバ50は、ネットワーク70に接続されクラウドサービスを行なうものであったが、ネットワーク90に接続し、翻訳サーバとして使用してもよい。即ち、クラウドサーバ50が接続されるネットワークに特に制限はない。さらにクラウドサーバ50の機能を画像形成装置30に入れ込み、画像形成装置30単独で一連の処理を行ってもよい。この場合、画像形成装置30が翻訳装置として機能する。
<プログラムの説明>
なお本実施の形態におけるクラウドサーバ50が行なう処理は、例えば、CPU11が、HDD13等に記憶された各種プログラムをメインメモリ12にロードして実行することにより行なわれる。
よってクラウドサーバ50が行なう処理は、コンピュータに、原稿の内容を異なる言語に翻訳する翻訳機能と、翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、第1の言語による原文と第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、翻訳機能が原稿の内容を第2の言語から他の言語に翻訳するときに、第2の言語により記載された原稿の内容が履歴情報に存在した場合、履歴情報には存在しない内容を抽出する抽出機能と、翻訳機能により履歴情報には存在しない内容を第2の言語から他の言語に翻訳した結果と、履歴情報に存在した内容を履歴情報に基づき第2の言語から他の言語に置き換えた結果とを合成する合成機能と、を実現させるプログラムとして捉えることもできる。
なお、本実施の形態を実現するプログラムは、通信手段により提供することはもちろん、CD−ROM等の記録媒体に格納して提供することも可能である。
1…翻訳システム、30…画像形成装置、50…クラウドサーバ、501…データ取得部、502…判定部、503…レイアウト解析部、504…翻訳部、505…記憶部、506…履歴作成部、507…抽出部、508…合成部、509…データ出力部

Claims (8)

  1. 原稿の内容を異なる言語に翻訳する翻訳部と、
    前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
    前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
    前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、
    原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、
    を備え
    前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳装置。
  2. 前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成することを特徴とする請求項1に記載の翻訳装置。
  3. 前記履歴情報には存在しない内容は、ユーザが原稿に追加した事項であることを特徴とする請求項1または2に記載の翻訳装置。
  4. 前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果を、当該第2の言語による文章が位置する領域に配するとともに、当該履歴情報に存在した内容を当該第2の言語から当該第1の言語よる原文に戻して置き換えた結果を、当該第2の言語による文章が位置する領域に置き換えることで、レイアウトを維持することを特徴とする請求項1乃至の何れか1項に記載の翻訳装置。
  5. 前記抽出部は、前記レイアウト解析部により作成された領域の位置の情報を基に、前記第1の言語による文章が存在する領域以外に文章が存在する領域を、前記履歴情報には存在しない内容として抽出することを特徴とする請求項に記載の翻訳装置。
  6. 原稿の内容を異なる言語に翻訳する翻訳部と、
    前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
    前記翻訳部が原稿の内容を前記第2の言語から他の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
    前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記他の言語に翻訳した結果と、当該履歴情報に存在した内容を当該第2の言語から置き換えた結果とを合成する合成部と、
    を備え、
    前記他の言語は、前記第1の言語および前記第2の言語とは異なる第3の言語であり、
    前記合成部は、前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第3の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に基づき前記第1の言語から当該第3の言語に翻訳し置き換えた結果とを合成することを特徴とする訳装置。
  7. 原稿の内容を翻訳する翻訳手段と、
    原語により記載された原稿の文書データを前記翻訳手段に送信する文書送信手段と、
    を備え、
    前記翻訳手段は、
    原稿の内容を異なる言語に翻訳する翻訳部と、
    前記翻訳部が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成部と、
    前記翻訳部が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出部と、
    前記翻訳部により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成部と、
    原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析部と、
    を備え
    前記抽出部は、前記レイアウト解析部により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出する翻訳システム。
  8. コンピュータに、
    原稿の内容を異なる言語に翻訳する翻訳機能と、
    前記翻訳機能が原稿の内容を第1の言語から第2の言語に翻訳したときに、当該第1の言語による原文と当該第2の言語による訳文との対応関係を含む履歴情報を作成する履歴作成機能と、
    前記翻訳機能が原稿の内容を前記第2の言語から前記第1の言語に翻訳するときに、当該第2の言語により記載された原稿の内容が前記履歴情報に存在した場合、当該履歴情報には存在しない内容を抽出する抽出機能と、
    前記翻訳機能により前記履歴情報には存在しない内容を前記第2の言語から前記第1の言語に翻訳した結果と、当該履歴情報に存在した内容を当該履歴情報に含まれる前記対応関係により当該第2の言語から当該第1の言語による原文に戻して置き換えた結果とを合成する合成機能と、
    原稿のレイアウトとして、原稿の中で文章が存在する領域の位置を表す情報を作成するレイアウト解析機能と、
    を実現させ
    前記抽出機能は、前記レイアウト解析機能により作成された情報に基づき、前記第1の言語により記載された原稿にはなく前記第2の言語により記載された原稿にはある領域を検出し、検出した領域の文章を前記履歴情報には存在しない内容として抽出するプログラム。
JP2016134715A 2016-07-07 2016-07-07 翻訳装置、翻訳システムおよびプログラム Active JP6809005B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016134715A JP6809005B2 (ja) 2016-07-07 2016-07-07 翻訳装置、翻訳システムおよびプログラム
US15/441,335 US20180011840A1 (en) 2016-07-07 2017-02-24 Translation apparatus, translation system, and non-transitory computer readable medium
CN201710319929.4A CN107590136B (zh) 2016-07-07 2017-05-09 翻译设备、翻译系统以及翻译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016134715A JP6809005B2 (ja) 2016-07-07 2016-07-07 翻訳装置、翻訳システムおよびプログラム

Publications (2)

Publication Number Publication Date
JP2018005749A JP2018005749A (ja) 2018-01-11
JP6809005B2 true JP6809005B2 (ja) 2021-01-06

Family

ID=60892856

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016134715A Active JP6809005B2 (ja) 2016-07-07 2016-07-07 翻訳装置、翻訳システムおよびプログラム

Country Status (3)

Country Link
US (1) US20180011840A1 (ja)
JP (1) JP6809005B2 (ja)
CN (1) CN107590136B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710951B (zh) * 2018-12-27 2023-10-17 北京百度网讯科技有限公司 基于翻译历史的辅助翻译方法、装置、设备及存储介质
KR102454092B1 (ko) * 2020-10-26 2022-10-14 (주)링글잉글리시에듀케이션서비스 사전 정의 재정렬 시스템 및 그 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341985A (ja) * 2003-05-19 2004-12-02 Nec Corp 翻訳サービスオークションシステム,方法およびプログラム
JP4350566B2 (ja) * 2004-03-17 2009-10-21 東芝ソリューション株式会社 機械翻訳システム
JP2006252049A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳システム、翻訳方法およびプログラム
JP4992216B2 (ja) * 2005-09-21 2012-08-08 富士ゼロックス株式会社 翻訳装置及びプログラム
US8799307B2 (en) * 2007-05-16 2014-08-05 Google Inc. Cross-language information retrieval
US20120240039A1 (en) * 2011-03-15 2012-09-20 Walker Digital, Llc Systems and methods for facilitating translation of documents
US9367539B2 (en) * 2011-11-03 2016-06-14 Microsoft Technology Licensing, Llc Techniques for automated document translation
US9251143B2 (en) * 2012-01-13 2016-02-02 International Business Machines Corporation Converting data into natural language form
JP2014059766A (ja) * 2012-09-18 2014-04-03 Sharp Corp 画像処理装置、画像形成装置、プログラム、記録媒体
JP5403183B1 (ja) * 2013-08-09 2014-01-29 富士ゼロックス株式会社 画像読取装置及びプログラム
CN103823796A (zh) * 2014-02-25 2014-05-28 武汉传神信息技术有限公司 一种翻译系统及翻译方法
JP2016091266A (ja) * 2014-11-04 2016-05-23 富士通株式会社 翻訳装置、翻訳方法、及び翻訳プログラム
JP6259804B2 (ja) * 2014-11-26 2018-01-10 ネイバー コーポレーションNAVER Corporation コンテンツ参加翻訳装置、及びそれを利用したコンテンツ参加翻訳方法
KR101827773B1 (ko) * 2016-08-02 2018-02-09 주식회사 하이퍼커넥트 통역 장치 및 방법

Also Published As

Publication number Publication date
CN107590136A (zh) 2018-01-16
CN107590136B (zh) 2023-07-14
JP2018005749A (ja) 2018-01-11
US20180011840A1 (en) 2018-01-11

Similar Documents

Publication Publication Date Title
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US7801720B2 (en) Translation requesting method, translation requesting terminal and computer readable recording medium
US7797150B2 (en) Translation system using a translation database, translation using a translation database, method using a translation database, and program for translation using a translation database
US9530050B1 (en) Document annotation sharing
US8156115B1 (en) Document-based networking with mixed media reality
US10528679B2 (en) System and method for real time translation
US8411956B2 (en) Associating optical character recognition text data with source images
US12373631B2 (en) Systems, methods, and devices for a form converter
JP6809005B2 (ja) 翻訳装置、翻訳システムおよびプログラム
US20190146646A1 (en) Information processing system, information processing apparatus, and non-transitory computer readable medium
JP4438656B2 (ja) 画像処理装置、画像処理システムおよびプログラム
CN105740317A (zh) 用于将非文本内容对象化以及用于文档发现的方法和系统
US11928171B2 (en) Providing shortened URL and information related contents corresponding to original URL
JP7027757B2 (ja) 情報処理装置及び情報処理プログラム
US8499235B2 (en) Method of posting content to a web site
JP2021047792A (ja) 情報処理装置及びプログラム
JP2011028503A (ja) 画像処理装置、画像処理方法、およびプログラム
JP6702047B2 (ja) 翻訳装置、翻訳システムおよびプログラム
JP2009205209A (ja) 文書画像処理装置、及び文書画像処理プログラム
JP6281739B2 (ja) 処理装置及びプログラム
US10264157B2 (en) Image processing apparatus, image processing method and image processing program
JP2004248245A (ja) 文書処理装置
KR20070034343A (ko) 이미지파일의 내용검색이 가능한 전자문서 전환 장치
JP2023047133A (ja) 情報処理装置、情報処理システム、及びプログラム
JP2010067187A (ja) 文書処理装置、文書処理方法および文書処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200421

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201123

R150 Certificate of patent or registration of utility model

Ref document number: 6809005

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350