[go: up one dir, main page]

JP2020069766A - 画像生成装置、画像生成方法、及びプログラム - Google Patents

画像生成装置、画像生成方法、及びプログラム Download PDF

Info

Publication number
JP2020069766A
JP2020069766A JP2018207244A JP2018207244A JP2020069766A JP 2020069766 A JP2020069766 A JP 2020069766A JP 2018207244 A JP2018207244 A JP 2018207244A JP 2018207244 A JP2018207244 A JP 2018207244A JP 2020069766 A JP2020069766 A JP 2020069766A
Authority
JP
Japan
Prior art keywords
image
setting
print
data
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018207244A
Other languages
English (en)
Other versions
JP7224856B2 (ja
Inventor
泰志 富久
Yasushi Fuku
泰志 富久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018207244A priority Critical patent/JP7224856B2/ja
Priority to US16/660,075 priority patent/US11151368B2/en
Publication of JP2020069766A publication Critical patent/JP2020069766A/ja
Application granted granted Critical
Publication of JP7224856B2 publication Critical patent/JP7224856B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Record Information Processing For Printing (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】印刷対象となる画像に対する文字認識処理における文字認識精度を向上させることができる。
【解決手段】印刷対象画像を表す印刷データから、文字認識処理に適した画像データを生成する画像生成装置であって、前記印刷データに対する印刷設定、または前記印刷データから生成される中間データの少なくもいずれかに対して前記文字認識処理用の変更を施す変更手段と、前記文字認識処理用の変更が施された中間データをレンダリングして、前記画像データを生成するレンダリング手段と、を備える。
【選択図】図3

Description

本発明は、文字認識処理、特に光学文字認識処理に適した画像を生成する技術に関するものである。
近年、印刷出力物のセキュリティに対する意識の高まりから、印刷出力物の管理方法が問われてきている。そのような印刷出力物を管理するための技術の1つとして、スキャナにおける再現能力の限界を利用した地紋印刷が知られている。地紋印刷は、「禁複写」などの文字列が埋め込まれた地紋画像と原稿画像とを合成し、該合成画像を出力用紙上に出力する技術である。地紋印刷による出力物が複写(コピー)されると、該出力物に埋め込まれていた「禁複写」などの文字列が複写物上で浮かび上がる。
ところで、従来から、印刷データをレンダリングして得られる画像データに対して光学文字認識処理(OCR処理)を行って文字情報を抽出する技術がある。また、そのような技術において文字情報をより正確に抽出するために、OCR処理における文字認識精度を向上させる方法が提案されている。特許文献1には、PDL(ページ記述言語)データの文字オブジェクトのフォント情報をOCR処理に適したものに変更することで、文字認識精度を向上させる方法が記載されている。
特開2010−20468号公報
しかし、上記のような地紋画像などの印刷設定や罫線などの描画オブジェクト(すなわち文字以外のオブジェクト)が存在する場合、それらが文字オブジェクトに対する文字認識処理に影響を与える可能性がある。その場合、特許文献1に記載の方法により文字オブジェクトのフォント情報を変更したとしても文字認識精度を担保できない可能性がある。
そこで、本発明は、このような問題点を鑑み、印刷対象となる画像に対する文字認識処理における文字認識精度を向上させることを目的とする。
本発明による画像生成装置は、印刷対象画像を表す印刷データから、文字認識処理に適した画像データを生成する画像生成装置であって、前記印刷データに対する印刷設定、または前記印刷データから生成される中間データの少なくもいずれかに対して前記文字認識処理用の変更を施す変更手段と、前記文字認識処理用の変更が施された中間データをレンダリングして、前記画像データを生成するレンダリング手段と、を備えることを特徴とする。
本発明によれば、印刷対象となる画像に対する文字認識処理における文字認識精度を向上させることができる。
印刷システムの第1実施形態の構成を示す図である。 PCが実行する印刷データ生成処理を示すフローチャートである。 第1実施形態の印刷装置が実行する印刷処理を示すフローチャートである。 S303の処理を示すフローチャートである。 印刷データから文字認識処理用レンダリング画像データが生成される様子を示す図である。 第1実施形態で使用されるNGキーワードリストの一例を示す図である。 第2実施形態の印刷装置が実行する印刷処理を示すフローチャートである。
以下、図面を参照して本発明の実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成要素には同一の参照番号を付して、説明を省略する。
[実施形態1]
<印刷システム概要>
図1は、印刷システムの第1実施形態の構成を示す図である。図1に示すように、印刷システムは、印刷装置100とPC(パーソナルコンピュータ)191を含む。本実施形態では、印刷装置100が、印刷機能、読み取り機能、FAX機能等、複数の機能が一体化された複合機(MFP:Multi Function Printer)である場合を例にする。しかし、印刷装置100は、SFP(Single Function Printer)やLBP(Laser Beam Printer)など、MFP以外のプリンタであってもよい。印刷装置100とPC190とは、LAN(Local Area Network)180を介して通信可能に接続されている。なお、印刷装置100とPC190とはLAN以外のネットワークを介して接続されていてもよい。また、図1には、1台のPCが例示されているが、印刷装置100には複数台のPCが接続されていてもよい。また、印刷装置100にはPC以外にサーバ等の他の装置が接続されていてもよい。さらに、LAN180は、有線ネットワークや無線ネットワークであってもよいし、それらが組み合わされて構成されていてもよい。
印刷装置100は、制御装置110(以下、画像生成装置110とも呼ぶ。)、リーダ装置120、プリンタ装置130、操作部140、及び記憶装置150を含む。制御装置110は、印刷装置100を統括的に制御する制御基板(コントローラ)である。制御装置110は、CPU111、ROM112、RAM113、画像処理部114、及びレンダリングハードウェア(レンダリングHW)115を含む。CPU111は、不図示のシステムバスを介して、制御装置110内の各ブロックを制御する。これにより、印刷装置100の各機能が実現される。例えば、CPU111は、ROM112、RAM113、記憶装置150、または、他の不図示の記憶媒体に記憶されたプログラムを読み出して実行することにより、制御装置110内の各ブロックを制御する。ROM112は、例えば、制御プログラムや、印刷装置100の機能を実現する上で必要なテーブルや設定データ等を記憶する。RAM113は、例えば、CPU111のワークメモリとして用いられる。画像処理部114は、リーダ装置120によって生成された読み取りデータや、印刷装置100の外部から受信された画像データに対して、変換、補正、編集、圧縮/解凍など、種々の画像処理を実行する。画像処理部114は、ハードウェアで構成されていても良いし、ソフトウェアで実現されても良い。レンダリングHW115は、中間データをもとにレンダリング画像データを高速で生成するハードウェアである。記憶装置150は、例えば、画像データや、動作モードやライセンスなどの機器情報や、アドレス帳やカスタマイズなどの情報を記憶する。リーダ装置120は、スキャナエンジンの構成を有する。リーダ装置120は、印刷装置100の原稿台(不図示)にセットされた原稿や、自動原稿給送装置(ADF:Automatic Document Feeder)から給送された原稿を光学的に読み取り、読み取りデータを生成する。プリンタ装置130は、インクジェット記録方式や電子写真方式等、各種の記録方式に対応したプリンタエンジンを有し、記録媒体上に画像を形成する。操作部140は、ユーザ操作を受付けるための操作キーと、各種設定画面やユーザインターフェース(UI)画面などを表示する液晶パネルとを備える。操作部140は、操作キーを介してユーザから受け付けた情報を制御装置110に出力する。なお、印刷装置100の構成は図1に示す構成に限られず、FAX機能などその他の機能を実現するための構成や、近距離無線通信を可能にする構成などを含んでいてもよい。
PC190は、制御装置191、操作部195、記憶装置196、及び表示部197を含む。制御装置191は、PC190を統括的に制御する制御基板(コントローラ)である。制御装置191は、CPU192、ROM193、及びRAM194を含む。CPU192は、システムバス(不図示)を介して、制御装置191内の各ブロックを制御する。例えば、CPU192は、ROM193、RAM194、記憶装置196、または、他の記憶媒体に記憶されたプログラムを読み出して実行することにより、PC190の機能を実行する。ROM193は、例えば、オペレーティングシステム(OS)等の各種制御プログラムや、PC190の機能を実現する上で必要なテーブルや設定データ等を記憶する。RAM194は、例えば、CPU192のワークメモリとして用いられる。記憶装置196は、各種アプリケーションプログラムや、データ、ユーザ情報、機器情報などを記憶する。操作部195は、ユーザ操作を受け付けるためのキーボードやポインティングデバイス等を備え、それらを介してユーザから受け付けた情報を制御装置191に出力する。表示部197は、例えば液晶ディスプレイであり、各種UI画面や各種情報を表示する。
図2は、PC190が実行する印刷データ生成処理を示すフローチャートである。図2に示す処理は、例えば、CPU192が、ROM193に記憶されたプログラムをRAM194に読み出して実行することで実現される。
CPU192は、印刷データを生成するためのアプリケーション等を介して、ユーザからの印刷指示を受け付けると、プリンタドライバを起動する(S201)。その際、CPU192は、ROM193等に記憶された印刷設定や画像処理設定などの各種設定の設定情報(ここでは、初期値)を読み込む。次いで、CPU192は、表示部197にプリンタドライバのUI画面を表示する。このUI画面には、印刷設定や画像処理設定などの変更を行うか、設定変更を行わずに印刷実行を行うかを、ユーザに選択させるためのボタン等が設けられている。CPU192は、設定変更を行うことが選択されたか否かを確認する(S202)。
設定変更を行わないことが選択された場合(S202のNO)、CPU192は、S204の処理に移行する。設定変更を行うことが選択された場合(S202のYES)、CPU192は、印刷設定や画像処理設定などの変更を行うためのUI画面(以下、設定変更画面と呼ぶ。)を表示する。このとき、CPU192は、S201で読み込まれた各種設定の初期値を設定変更画面に設定する。そして、CPU192は、設定変更画面を介して、印刷設定や画像処理設定などの各種設定の変更操作を受け付ける(S203)。
アプリケーションからOSを介して通知される印刷命令を受け取ると、CPU192は、S203で変更された各種設定に従って印刷データを生成する(S204)。なお、S203の処理が実行されていない場合には、CPU192は、S201で読み込まれた各種設定の初期値に従って印刷データを生成する。このとき生成される印刷データには、ユーザ情報やジョブ名などの情報や、出力方法の情報がセットされているものとする。最後に、CPU192は、LAN180を介して印刷装置100に印刷データを送信し(S205)、処理を終了する。
なお、ここでは、PC190上でプリンタドライバを使用して印刷データを生成したが、印刷データを生成する方法はこれに限定されない。例えば、携帯端末などの他のデバイスを使用して印刷データを生成したり、アプリケーションがプリンタドライバを介さずに印刷データを生成したりしてもよい。また、ユーザ情報は、印刷データを送信する際に印刷データに付加するなどして印刷データとの紐づけができていればよく、必ずしも印刷データに埋め込まれていなくてもよい。
図3は、第1実施形態の印刷装置100が実行する印刷処理を示すフローチャートである。図3に示す処理は、例えば、CPU111が、ROM112に記憶されたプログラムをRAM113に読み出して実行することで実現される。印刷装置100が、S205でPC190から送信された印刷データを受信すると、CPU111によって図3に示す処理が開始される。
まず、CPU111は、印刷ジョブを開始し、受信した印刷データに対してジョブIDの割り当てを行う(S301)。ジョブIDは、ジョブを受け付けた順にシーケンシャルに割り当てられるため、ジョブIDにより印刷ジョブの処理開始順を一意に特定することができる。なお、印刷データの情報取得や先行ジョブの処理待ちなどのために、CPU111は、受信した印刷データをRAM113や記憶装置150に一時的に格納した上で、以降の処理を行ってもよい。
次いで、CPU111は、ROM112に記憶されている印刷前チェック機能のオン/オフ(ON/OFF)設定やNGキーワードリストの設定と、印刷ジョブのユーザ情報などとに基づき、印刷前チェックが必要か否かを判定する(S302)。NGキーワードリストについては図6を用いて後述する。印刷前チェックが不要である場合は(S302のNO)、CPU111は、S309の処理に移行する。一方、印刷前チェックが必要である場合は(S302のYES)、CPU111は、印刷データに含まれる文字情報を抽出する処理(以下、文字情報抽出処理と呼ぶ。)を実行する(S303)。
ここで、S303の処理について説明する。図4は、S303の文字情報抽出処理を示すフローチャートである。まず、CPU111は、印刷データをRAM113または記憶装置150の作業領域にコピーする(S401)。図5(a)には、印刷データによって示される描画画像(以下、印刷対象画像と呼ぶ場合がある。)の一例が示されている。描画画像500は、文字列501、グラフィック502、背景パターンの中に描かれた文字列503、罫線を含むリスト504、及びイメージ505を含む。図5(b)には、印刷データのジョブ設定の一例が示されている。ジョブ設定510は、ユーザ名、ユーザ権限、ジョブ名、印刷解像度、地紋設定などの印刷設定が指定されている。ここでは、図5(b)に示すように、地紋設定として、印刷装置本体の地紋印字機能をONにする設定と、地紋として「COPY」という文字を埋め込む設定がなされているものとする。図5(c)には、ジョブ設定510の地紋設定に従って生成される地紋画像520が示されている。図5(d)には、通常の印刷処理で出力される印刷向けレンダリング画像530が示されている。印刷向けレンダリング画像530は、描画画像500と地紋画像520とが合成されることで生成される。なお、印刷向けレンダリング画像530は、地紋画像の影響によりOCR処理の認識精度に悪影響を及ぼす画像(すわなち、文字認識処理に適さない画像)となっている。
次いで、CPU111は、印刷データのジョブ設定510を、文字認識処理用に地紋設定を無効(OFF)に変更して、地紋画像520を合成しないように加工する(S402)。ここでは、地紋設定を例に挙げたが、オーバーレイ設定やスタンプ設定やヘッダ設定やフッタ設定など画像を合成するその他の印刷設定についても、同様にOFFに変更する。また、CPU111は、ラインの太らせやイメージシャープネスなどの画像処理設定のように、描画結果に影響がある印刷出力のための設定項目についても、同様にOFFなどに変更する。つまり、CPU111は、それらの設定項目を、描画結果に影響が少ない設定に変更する。次いで、CPU111は、印刷データのジョブ設定とPDLコマンドとを解釈し、レンダリング処理のための中間データを生成する(S403)。ここで、印刷データをレンダリングHW115で処理可能な中間データにすることで、レンダリングHW115で高速に処理することができるようになる。
次いで、CPU111は、中間データを文字認識処理用に加工する(S404)。本実施形態では、CPU111は、文字列503の背景パターンの色指定を白色の単色に置き換えるといったように、パターンやグラデーションなどの塗り指定を単色塗りに変更する。また、CPU111は、罫線を含むリスト504から、所定の描画オブジェクトを削除する。本実施形態では、CPU111は、表のタイトルの背景の矩形と水平及び垂直のラインとを削除するといったように、一定サイズを超える矩形やラインなどのように点数が少なく明らかに文字では無いと判断できる描画オブジェクトを削除する。この際、白色の文字のように、背景の矩形を削除したことで文字が見えなくなってしまう場合には、文字色を変更するようにしても良い。さらに、CPU111は、ページ集約やピクセル塗りルールなどのPDL設定のように描画結果に影響があるPDL設定のパラメータを、中間データを加工することでOFFなどに変更する。例えばページ集約のパラメータとして「2in1」が設定されている場合、CPU111は、中間データを加工して、「2in1」を描画結果に影響が少ない「1in1」に変更する。つまり、印刷データに対する文字認識精度をより高くするパラメータに変更する。このように本実施形態では、PDL設定の変更を、PDLデータではなく中間データに対して行う。それにより、PDL設定の変更をPDL種別に依らずに行うことが可能となる。
次いで、CPU111は、レンダリングHW115を用いて、中間データをもとにレンダリング処理を行い、文字認識処理用のレンダリング画像データを生成する(S405)。以下、このレンダリング画像データを文字認識処理用画像データと呼ぶ。また、図5(e)には、S404で加工された中間データをレンダリングして得られる文字認識処理用画像データによって示される文字認識処理用画像540が示されている。図5(e)に示すように、描画画像500内の文字列503は、背景パターンが削除され、文字列506に加工される。描画画像500内のリスト504は、罫線とタイトルの背景の矩形とが削除され、文字グループ507に加工される。
最後に、CPU111は、S405で生成した文字認識処理用画像540に対してOCR処理を行う(S406)。そして、CPU111は、OCR処理により得られた文字情報をRAM113または記憶装置150に保存し、本処理を終了する。文字認識処理用画像540は、S402で地紋画像やスタンプ等の画像合成がOFFにされ、且つS404で背景パターンや罫線等の文字以外の描画オブジェクトが削除された画像である。文字認識処理用画像540をOCR処理に用いることで、文字認識精度を向上させることができる。ここでは、「Confidential」「A」「Pattern」「List」「Data」「Data」「製品XXX」の文字情報が抽出されるものとする。
図3の説明に戻る。S303の後、CPU111は、S406で抽出した印刷データ内の文字情報と、事前に設定したNGキーワードリストとを比較して、印刷データ内にNGキーワードが含まれているかをチェックする(S304)。図6は、第1実施形態で使用されるNGキーワードリストの一例を示す図である。NGキーワードリストには、番号600、キーワード601、対象ユーザ602、処理内容603の各情報が含まれる。番号600は、リストに登録されているNGキーワードに一意に割り当てられる識別番号である。キーワード601は、NGキーワードの内容(文字列)を示す情報である。対象ユーザ602は、対象となるユーザを示す情報である。処理内容603は、S303の文字抽出処理においてNGキーワードが検出された場合に実行される処理の内容を示す情報である。ここで、NGキーワード「Confidential」については、対象ユーザとして「全ユーザ」が登録されているので、印刷ジョブのユーザ情報によらず、印刷前チェック機能のON/OFF設定のみで印刷前チェックが必要か否かを判断できる。一方、NGキーワード「製品XXX」については、対象ユーザとして「一般者」が登録されている。よって、印刷ジョブのユーザ情報に、ユーザが「一般者」以外(例えば、「管理者」)であることを示す情報が含まれる場合には、「製品XXX」はS304においてチェックが不要となる。したがって、NGキーワード「製品XXX」については、印刷前チェックが必要か否かを判断する際、印刷前チェック機能のON/OFF設定に加えて印刷ジョブのユーザ情報を参照する必要がある。
印刷データ内にNGキーワードが含まれていない場合には(S304のNO)、CPU111は、S309の処理に進む。印刷データ内にNGキーワードが含まれている場合には(S304のYES)、CPU111は、NGキーワードリストをもとに、印刷データ内に含まれる各NGキーワードの処理内容を判定する(S305)。なお、ここでは、ジョブ設定510のユーザ権限が「一般者」であり、S406で抽出される文字情報の中に「Confidential」と「製品XXX」というNGキーワードが含まれているため、CPU111は、S305の処理に進む。
S305で判定した処理内容が「ジョブキャンセル」である場合には、CPU111は、印刷ジョブをキャンセルして、一時的に格納した印刷データの削除などの後処理を行い、本処理を終了する(S306)。一方、S305で判定した処理内容が「管理者への通知」である場合には、CPU111は、印刷データの内容のチェック依頼のための通知を、メールなどの通知手段を用いて管理者のPC190に対して行う(S307)。PC190はこの通知を受信すると、印刷データのプレビュー画像などを表示部197に表示する。管理者は、表示部197に表示されるプレビュー画像などをもとに、印刷データをチェックする。そして、管理者はPC190を操作して、印刷許可であるか印刷不可であるかを示すチェック結果を印刷装置100に返す。本実施形態では、CPU111はS307において、印刷データのチェック結果を入力させるためのWebページ(以下、確認用Webページと呼ぶ。)のURLを記載したメールを、メールサーバ(不図示)経由でPC190宛てに送信する。PC190のCPU192は、管理者のメール確認の操作と上記URLへのアクセスの操作とを受け付けると、表示部197に確認用Webページを表示して、管理者にチェック結果の入力を促す。そして、CPU192は、管理者が確認用Webページに対してチェック結果を入力すると、該チェック結果を印刷装置100(より具体的にはCPU111)に通知する。なお、これはあくまで一例であり、管理者への通知や印刷データの確認の手段は問わない。
管理者のチェック結果が印刷不可を示す場合、CPU111は、S306の処理に進む。一方、印刷許可を示す場合、CPU111は、印刷を実行する(S309)。このとき、CPU111は、受信した印刷データを解釈して中間データを生成し、レンダリングHW115を用いて中間データをレンダリングする。そして、CPU111は、レンダリングにより得られた画像データをプリンタ装置130に渡す。プリンタ装置130は、受け取った画像データに基づいて用紙などの記録媒体上に画像を形成する。CPU111は、一時的に格納した印刷データの削除などの後処理を行い、処理を終了する。
なお、図5(a)に示す描画画像500のように複数のNGキーワードが含まれる場合には、S305において、各NGキーワードに対応する処理内容のうちより厳しい処理内容が採用されるものとする。つまり、描画画像500については、「管理者への通知」よりも厳しい処理内容である「ジョブキャンセル」が採用されることになる。なお、これはあくまで一例であり、複数のNGキーワードが含まれる場合における処理内容の採用方法は問わない。
以上のように、本実施形態では、印刷データのジョブ設定を文字認識処理に適した設定に変更したり、中間データを文字認識処理に適した内容に加工したりして、文字認識処理用画像を生成する。このように、ジョブ設定や中間データといったPDL種別に依存しない情報に対して設定変更や加工などの処理を適用することにより、印刷データのPDL種別を意識することなく、文字認識処理用画像を生成することができる。また、このようにして生成された文字認識処理用画像を用いて文字認識処理を行うことで、印刷データに地紋設定など文字認識精度を低下させる設定がなされている場合でも、NGキーワードを正確に抽出することが可能となる。したがって、NGキーワードに対応する所望の処理(ジョブキャンセルや、管理者への通知処理)を確実に実行することができる。よって、例えば、文字認識処理により得られた文字情報を印刷データの検索に活用するシーンにおいて、文字認識処理の妨げになる地紋画像等が原稿画像に合成されている場合でも、印刷データの検索を適切に実行することができる。同様に、文字認識処理により得られた文字情報を印刷可否チェックや印刷出力の監査などに活用するシーンにおいても本実施形態は有効である。
なお、本実施形態では図3に示す処理を印刷装置100上で全て実行する例を示したが、処理負荷を分散するために、S303の文字情報抽出処理などの一部の処理を、LAN180で接続されるサーバ装置(不図示)などで行うようにしてもよい。
[実施形態2]
以下、本発明による印刷システムの第2実施形態について説明する。なお、第2実施形態における印刷システムの構成は、第1実施形態と同様であるため説明を省略する。以下では、第2実施形態における印刷システムの動作について、第1実施形態と異なる部分を説明する。
図7は、第2実施形態の印刷装置100が実行する印刷処理を示すフローチャートである。図7に示す処理は、例えば、CPU111が、ROM112に記憶されたプログラムをRAM113に読み出して実行することで実現される。印刷装置100が、S205でPC190から送信された印刷データを受信すると、CPU111によって図7に示す処理が開始される。S701の処理は、S301の処理と同様である。
S701の後、CPUは、受信した印刷データに基づき印刷を実行する(S702)。なお、S702の処理は、S309の処理と同様である。S702の印刷処理が完了した後、CPU111は、ROM112に記憶されている印刷後チェック機能のON/OFF設定やNGキーワードリストの設定と、印刷ジョブのユーザ情報などとに基づき、印刷後チェックが必要か否かを判定する(S703)。印刷後チェックが不要である場合は(S703のNO)、CPU111は、本処理を終了する。印刷後チェックが必要である場合は(S703のYES)、CPU111は、文字情報抽出処理を実行する(S704)。このとき、S303と同様に図4に示すS401〜S406の処理が実行される。次いで、CPU111は、S406で抽出した印刷データ内の文字情報と、事前に設定したNGキーワードリストとを比較して、印刷データ内にNGキーワードが含まれているかをチェックする(S705)。印刷データ内にNGキーワードが含まれていない場合には(S705のNO)、CPU111は、本処理を終了する。印刷データ内にNGキーワードが含まれている場合には(S705のYES)、CPU111は、メールなどの通知手段を用いて管理者のPC190に対して、NGキーワードを含む印刷データが印刷されたことを通知し(S706)、本処理を終了する。PC190がこの通知を受信すると、通知されたNGキーワードや印刷データのプレビュー画像などを表示部197に表示する。管理者は、表示部197に表示されるNGキーワードやプレビュー画像などをもとに、印刷データをチェックする。そして、管理者は、チェック結果に基づき、印刷出力したユーザに注意喚起するなどの対応を行う。
以上のように、本実施形態においても、第1実施形態と同様に、文字認識処理用画像を生成してNGキーワードを抽出するので、NGキーワードを正確に抽出することができる。また、NGキーワードが含まれる印刷データが印刷された場合に、管理者に通知するようにしている。よって、設計図面など特定のユーザを閲覧対象とする印刷物が出力された場合でも、管理者は、それらの印刷物に対する第三者の閲覧を制限することが可能となる。それにより、情報漏洩の抑止や情報漏洩者を追跡することができる。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (16)

  1. 印刷対象画像を表す印刷データから、文字認識処理に適した画像データを生成する画像生成装置であって、
    前記印刷データに対する印刷設定、または前記印刷データから生成される中間データの少なくもいずれかに対して前記文字認識処理用の変更を施す変更手段と、
    前記文字認識処理用の変更が施された中間データをレンダリングして、前記画像データを生成するレンダリング手段と、を備える
    ことを特徴とする画像生成装置。
  2. 前記レンダリング手段が生成した前記画像データに対して前記文字認識処理を行って、前記印刷データに含まれる文字情報を取得する取得手段と、
    前記取得された文字情報に特定のキーワードが含まれる場合に、該特定のキーワードに対応する通知処理を実行する通知手段と、をさらに備える
    ことを特徴とする請求項1に記載の画像生成装置。
  3. 前記印刷データを用いた前記印刷対象画像の印刷が実行される前に、前記取得手段と前記通知手段とによる処理が実行される
    ことを特徴とする請求項2に記載の画像生成装置。
  4. 前記印刷データを用いた前記印刷対象画像の印刷が実行された後に、前記取得手段と前記通知手段とによる処理が実行される
    ことを特徴とする請求項2に記載の画像生成装置。
  5. 前記変更手段は、
    前記印刷データに対する印刷設定に、前記印刷対象画像に他の画像を合成する設定が含まれる場合に、該設定を無効にする
    ことを特徴とする請求項1から請求項4のうちのいずれか1項に記載の画像生成装置。
  6. 前記他の画像を合成する設定には、地紋設定、オーバーレイ設定、スタンプ設定、ヘッダ設定、またはフッタ設定のいずれかが少なくとも含まれる
    ことを特徴とする請求項5に記載の画像生成装置。
  7. 前記変更手段は、
    前記印刷データに対する印刷設定に、前記印刷対象画像に所定の画像処理を施すための設定が含まれる場合に、前記所定の画像処理を施すための設定を無効にする
    ことを特徴とする請求項1から請求項6のうちのいずれか1項に記載の画像生成装置。
  8. 前記所定の画像処理には、ラインの太らせまたはイメージシャープネスのいずれかが少なくとも含まれる
    ことを特徴とする請求項7に記載の画像生成装置。
  9. 前記変更手段は、
    前記中間データに含まれる描画オブジェクトを変更または削除することで、前記中間データに対して前記文字認識処理用の変更を施す
    ことを特徴とする請求項1から請求項8のうちのいずれか1項に記載の画像生成装置。
  10. 前記変更手段は、
    前記中間データにパターンまたはグラデーションが含まれる場合に、前記パターンまたは前記グラデーションの塗り指定を単色塗りに変更する
    ことを特徴とする請求項9に記載の画像生成装置。
  11. 前記変更手段は、
    前記中間データに文字では無いと判断できる所定の描画オブジェクトが含まれる場合に、前記所定の描画オブジェクトを削除する
    ことを特徴とする請求項9または請求項10に記載の画像生成装置。
  12. 前記所定の描画オブジェクトには、ラインまたは一定サイズを超える矩形のいずれかが少なくとも含まれる
    ことを特徴とする請求項11に記載の画像生成装置。
  13. 前記変更手段は、
    前記中間データに含まれるPDL設定に関する情報を変更することで、前記中間データに対して前記文字認識処理用の変更を施し、
    前記PDL設定には、ページ集約またはピクセル塗りルールのいずれかが少なくとも含まれる
    ことを特徴とする請求項1から請求項12のうちのいずれか1項に記載の画像生成装置。
  14. 前記変更手段は、
    前記PDL設定のパラメータを、前記印刷データに対する文字認識精度をより高くするパラメータに変更する
    ことを特徴とする請求項13に記載の画像生成装置。
  15. 印刷対象画像を表す印刷データから、文字認識処理に適した画像データを生成する画像生成方法であって、
    前記印刷データに対する印刷設定、または前記印刷データから生成される中間データの少なくもいずれかに対して前記文字認識処理用の変更を施すステップと、
    前記文字認識処理用の変更が施された中間データをレンダリングして、前記画像データを生成するステップと、を含む
    ことを特徴とする画像生成方法。
  16. コンピュータを、請求項1から請求項14のうちのいずれか1項に記載の画像生成装置として機能させるためのプログラム。
JP2018207244A 2018-11-02 2018-11-02 画像生成装置、画像生成方法、及びプログラム Active JP7224856B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018207244A JP7224856B2 (ja) 2018-11-02 2018-11-02 画像生成装置、画像生成方法、及びプログラム
US16/660,075 US11151368B2 (en) 2018-11-02 2019-10-22 Image generation apparatus, image generation method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018207244A JP7224856B2 (ja) 2018-11-02 2018-11-02 画像生成装置、画像生成方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2020069766A true JP2020069766A (ja) 2020-05-07
JP7224856B2 JP7224856B2 (ja) 2023-02-20

Family

ID=70459969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018207244A Active JP7224856B2 (ja) 2018-11-02 2018-11-02 画像生成装置、画像生成方法、及びプログラム

Country Status (2)

Country Link
US (1) US11151368B2 (ja)
JP (1) JP7224856B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7265135B2 (ja) * 2019-04-25 2023-04-26 京セラドキュメントソリューションズ株式会社 情報処理システム
JP2021047693A (ja) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 情報処理装置及びプログラム
CN113296715A (zh) * 2021-06-29 2021-08-24 中国平安人寿保险股份有限公司 图片资源处理方法、装置和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004038505A (ja) * 2002-07-02 2004-02-05 Seiko Epson Corp 帳票印刷方法、帳票印刷装置、帳票印刷システム、帳票印刷プログラム、帳票印刷プログラムを記録した記録媒体、コンピュータ
JP2009118340A (ja) * 2007-11-08 2009-05-28 Canon Inc 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP2009277093A (ja) * 2008-05-15 2009-11-26 Canon Inc 画像処理装置、方法、及び、プログラム
JP2010020468A (ja) * 2008-07-09 2010-01-28 Canon Inc 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US20100214614A1 (en) * 2009-02-23 2010-08-26 Andrew Rodney Ferlitsch Context-aware printing method and system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1268547A (en) * 1986-03-31 1990-05-01 Ahmed Mostafa El-Sherbini Thresholding algorithm selection apparatus
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
JP2007317022A (ja) * 2006-05-26 2007-12-06 Canon Inc 手書文字処理装置及び手書文字処理方法
US20090300148A1 (en) * 2008-02-15 2009-12-03 Gomes A Ferdinand Configuration data deployment control systems and methods
JP2011028492A (ja) * 2009-07-24 2011-02-10 Oki Data Corp 画像処理システム
JP5528121B2 (ja) * 2010-01-05 2014-06-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP2012009000A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP5676942B2 (ja) * 2010-07-06 2015-02-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP5280425B2 (ja) * 2010-11-12 2013-09-04 シャープ株式会社 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP6080259B2 (ja) * 2013-02-06 2017-02-15 日本電産サンキョー株式会社 文字切り出し装置及び文字切り出し方法
US9251413B2 (en) * 2013-06-14 2016-02-02 Lexmark International Technology, SA Methods for automatic structured extraction of data in OCR documents having tabular data
US10237424B2 (en) * 2016-02-16 2019-03-19 Ricoh Company, Ltd. System and method for analyzing, notifying, and routing documents
JP7005959B2 (ja) * 2017-06-22 2022-01-24 コニカミノルタ株式会社 印刷指示装置、印刷指示方法及び印刷指示プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004038505A (ja) * 2002-07-02 2004-02-05 Seiko Epson Corp 帳票印刷方法、帳票印刷装置、帳票印刷システム、帳票印刷プログラム、帳票印刷プログラムを記録した記録媒体、コンピュータ
JP2009118340A (ja) * 2007-11-08 2009-05-28 Canon Inc 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP2009277093A (ja) * 2008-05-15 2009-11-26 Canon Inc 画像処理装置、方法、及び、プログラム
JP2010020468A (ja) * 2008-07-09 2010-01-28 Canon Inc 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US20100214614A1 (en) * 2009-02-23 2010-08-26 Andrew Rodney Ferlitsch Context-aware printing method and system

Also Published As

Publication number Publication date
US20200143158A1 (en) 2020-05-07
US11151368B2 (en) 2021-10-19
JP7224856B2 (ja) 2023-02-20

Similar Documents

Publication Publication Date Title
US8314964B2 (en) Image processing apparatus and image processing method
US20080055633A1 (en) Computer readable medium, computer data signal, instruction apparatus, image processing method and image processing system
JP2002171400A (ja) 画像処理装置
US11151368B2 (en) Image generation apparatus, image generation method, and storage medium
US8218178B2 (en) Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
US20140016152A1 (en) Image processing apparatus and method and non-transitory computer readable medium
JP6876561B2 (ja) 画像処理装置、及びプログラム
US20070127085A1 (en) Printing system, printing method and program thereof
US8810863B2 (en) Image forming apparatus, image processing method, and software program
US10554863B2 (en) Image forming apparatus with an improved capability to edited selectable detected areas
US11989474B2 (en) Image processing apparatus
US12400190B2 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method for enabling device to be used based on contract between organization and contract source
JP6767651B2 (ja) 情報処理システムとその処理方法及びプログラム
JP7119409B2 (ja) 情報処理装置、配信システム、プログラム、配信方法
JP2002248829A (ja) 画像処理装置および画像処理プログラムを記録した記憶媒体
JP7312357B2 (ja) 画像形成装置
JP2015225535A (ja) 情報処理装置、及びこれを用いる認証プリントシステム
US20250039323A1 (en) Storage medium, method of controlling image processing apparatus, and image processing apparatus
JP4784635B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP2010109653A (ja) 画像読取装置、画像形成装置、画像読取方法および画像読取プログラム
JP6624027B2 (ja) 画像処理装置及び画像形成装置
JP7224879B2 (ja) 印刷制御装置、印刷システム、印刷制御方法及びプログラム
JP2024142635A (ja) 画像形成装置およびプログラムに関する
JP2015135666A (ja) 画像処理装置、画像処理方法、印刷システム及びプログラム。
JP4674539B2 (ja) 印刷指示装置、その指示方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230208

R151 Written notification of patent or utility model registration

Ref document number: 7224856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151