JP2019068323A - Device for setting file name for scanned image, control method thereof and program - Google Patents
Device for setting file name for scanned image, control method thereof and program Download PDFInfo
- Publication number
- JP2019068323A JP2019068323A JP2017193615A JP2017193615A JP2019068323A JP 2019068323 A JP2019068323 A JP 2019068323A JP 2017193615 A JP2017193615 A JP 2017193615A JP 2017193615 A JP2017193615 A JP 2017193615A JP 2019068323 A JP2019068323 A JP 2019068323A
- Authority
- JP
- Japan
- Prior art keywords
- user
- character string
- unit area
- screen
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Facsimiles In General (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
Abstract
Description
本発明は、スキャン画像の文字認識結果を用いて、当該スキャン画像に対してファイル名等を設定する技術に関する。 The present invention relates to a technique for setting a file name or the like for a scanned image using character recognition results of the scanned image.
従来より、文書の管理手法として、紙文書をスキャンして電子化する手法が広く行われている。そして、文書の電子化に際して、スキャンされた画像データに対して文字認識処理(OCR処理)を行い、認識された文字を、電子化した文書ファイルのファイル名に使用する技術がある。例えば、特許文献1に記載のドキュメントスキャナでは、ドキュメントをスキャンして得た画像においてユーザにより位置が指定されると、この位置に基づき抽出エリアを決定する。そして、抽出エリアに対してOCR処理を行ってメタデータ(文字列情報)を取得する。
Conventionally, as a document management method, a method of scanning and digitizing a paper document is widely used. Then, at the time of digitizing a document, there is a technique of performing character recognition processing (OCR processing) on scanned image data, and using the recognized character as the file name of the digitized document file. For example, in the document scanner described in
しかしながら、特許文献1では、ユーザが意図した文字列以外の文字を含んだ抽出エリアあるいはユーザが意図した文字列の一部しか含まない抽出エリアが決定されることがあり、ユーザが意図した適切な文字列を取得できない場合があった。一方、ユーザにより画像内の全ての文字列を選択可能とすることが考えられる。この場合、ユーザにより文字列が誤って選択されると、誤って選択された文字列を削除してから、所望の文字列を再度選択しなければならない場合があった。いずれの場合も、ユーザの利便性を低下させてしまう可能性があった。
However, in
本発明は、上記の課題に鑑みなされたものであり、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ユーザの利便性を高めることを目的としている。 The present invention has been made in view of the above problems, and it is an object of the present invention to improve user's convenience in setting a file name and the like using a character string obtained by performing an OCR process on a scanned image. It is an object.
上述した課題を解決する本発明に係る装置は、文書をスキャンして得られたスキャン画像に対して所定の処理を行う装置であって、前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが識別可能に表示した、前記所定の処理を行うためのUI画面を表示する表示制御手段と、前記UI画面を介してユーザにより選択した単位領域に対してOCR処理を行い、該OCR処理によって抽出された文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、を備え、前記表示制御手段は、前記文書の文章方向に沿う方向と交わる方向における前記単位領域の大きさに応じて該単位領域をユーザにより識別可能に前記UI画面に表示することを特徴とする。 An apparatus according to the present invention which solves the above-mentioned problem is an apparatus which performs predetermined processing on a scanned image obtained by scanning a document, and is presumed to be a series of character strings in the scanned image. A display control means for displaying a UI screen for performing the predetermined processing, in which a unit area is identifiably displayed, and performing OCR processing on the unit area selected by the user via the UI screen; And setting means for setting incidental information for the predetermined process using the character string extracted by the OCR process, the display control means may set the unit in a direction intersecting the direction along the text direction of the document. The unit area is displayed on the UI screen so as to be distinguishable by the user according to the size of the area.
本発明によれば、スキャン画像に対してOCR処理を行って得られた文字列を用いてファイル名等の設定を行う場面において、ユーザの利便性を高めることができる。 According to the present invention, the convenience of the user can be enhanced in the setting of the file name and the like using the character string obtained by performing the OCR processing on the scan image.
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. The following embodiments do not limit the invention according to the claims, and all combinations of the features described in the embodiments are not necessarily essential to the solution means of the invention.
[第1の実施形態]
<画像処理システムの構成>
図1は、本実施形態に係る画像処理システムの全体構成を示す図である。画像処理システムは、MFP110とファイルサーバ120とで構成され、LAN(Local Area Network)を介して互いに通信可能に接続されている。
First Embodiment
<Configuration of image processing system>
FIG. 1 is a diagram showing an overall configuration of an image processing system according to the present embodiment. The image processing system includes an
MFP(Multi Function Printer)110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。ファイルサーバ120は、電子化された文書ファイルを保存・管理する外部サーバの一例である。本実施形態の画像処理システムは、MFP110とファイルサーバ120とからなる構成としているがこれに限定されない。例えば、MFP110がファイルサーバ120の役割を兼ね備えてもよい。また、LANに代えてインターネットなどを介した接続形態であってもよい。また、MFP110は、PSTN(Public Switched Telephone Networks)に接続され、ファクシミリ装置(不図示)との間で画像データをファクシミリ通信することができる。
An MFP (Multi Function Printer) 110 is a multifunction peripheral having a plurality of functions such as a scanner and a printer, and is an example of an image processing apparatus. The
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211〜219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、他の態様であっても構わない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210を接続するインタフェースである。操作部220には、タッチパネル機能を有する液晶表示部やキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける受付部としての役割を担う。これらのユーザによる操作などは液晶パネルに対するタッチによって受け付けてもよいし、ユーザによるキーボードやボタンなどの操作によって受け付けてもよい。プリンタI/F216は、プリンタ部221と制御部210を接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210を接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)するほか、ファイル送信またはメール送信することができる。モデムI/F218は、モデム223と制御部210を接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてLAN上の外部装置(ファイルサーバ120など)に画像データや情報を送信したり、各種情報を受信したりする。
<Hardware Configuration of MFP>
FIG. 2 is a hardware configuration diagram of the
<ファイルサーバのハードウェア構成>
図3は、ファイルサーバ120のハードウェア構成図である。ファイルサーバ120は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、ファイルサーバ120全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリアなどの一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、ファイルサーバ120をLANに接続するインタフェースである。ファイルサーバ120は、ネットワークI/F315を用いてLAN上の他の装置(例えばMFP110)との間で各種情報を送受信する。
<Hardware Configuration of File Server>
FIG. 3 is a hardware configuration diagram of the
<MFPのソフトウェア構成>
図4は、MFP110のソフトウェア構成図である。MFP110のソフトウェアは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大きく分けられる。ネイティブ機能モジュール410に含まれる各部は、MFP110に標準的に備えられた機能モジュールである。これに対し、アディショナル機能モジュール420に含まれる各部は、MFP110に追加的に備わる機能モジュールであり、例えばアプリケーションのインストールによって実現される機能モジュールである。本実施形態におけるアディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しないほかのアプリケーションがインストールされていてもよい。以下、両機能モジュール410及び420を構成する各部について説明する。
<Software Configuration of MFP>
FIG. 4 is a software configuration diagram of the
アプリケーション表示部423は、操作部220のタッチパネルに、ユーザによる各種操作を受け付けるためのUI画面を表示する表示制御を行う。表示するUI画面の詳細については後述する。スキャン指示部421は、UI画面を介して入力されたユーザ指示に従い、スキャン設定や転送設定の情報を含んだスキャン要求をスキャン実行部411に送信して、スキャン処理を実行させる。このスキャン要求には、後述するアプリケーション受信部422が受信する画像データが、当該スキャン要求に対応したものかどうかを識別するための要求IDも含まれる。
The
スキャン実行部411は、スキャン指示部421からスキャン要求を受けて、スキャナI/F217を介してスキャナ部222を制御しスキャン処理を実行する。これにより、原稿が読み取られて画像データが生成される。スキャンによって生成された画像データ(以下、「スキャン画像データ」と呼ぶ。)はその転送先を特定する転送特定の情報と共に転送部412に渡される。転送部412は、スキャン実行部411から受け取ったスキャン画像データを、転送設定に従って転送する。スキャン画像データの転送先としては、ファイルサーバ120や、LAN上のPC(不図示)等を設定可能である。ただし、本実施形態ではスキャン実行部411で生成したスキャン画像データは、一旦全て、アディショナル機能モジュール420に転送するように設定されているものとする。転送部412は、FTP(File Transfer Protocol)クライアント機能を有しており、FTPサーバ機能を有するアプリケーション受信部422に対してFTPでスキャン画像データを転送する。
The scan execution unit 411 receives a scan request from the scan instruction unit 421, controls the
アプリケーション受信部422は、転送部412から内部転送されたスキャン画像データを受信し、アプリケーション転送部424に渡す。アプリケーション転送部424は、受信したスキャン画像データを画像解析部425に渡す。
The
画像解析部425は、受け取ったスキャン画像データに対して文字列領域の特定や文字列認識や文章方向の特定といった画像解析処理を行なう。そして、スキャン画像データとその解析結果は、アプリケーション転送部424を介して、プレビュー表示部426に渡される。プレビュー表示部426は、スキャン画像データとその解析結果に基づき、ユーザがファイル名設定を行うためのUI画面であるプレビュー画面を生成し、操作部220のタッチパネルに表示するといった表示制御を行う。表示するプレビュー画面の詳細については後述する。
The
アップロード指示部427は、ユーザがフォルダパス設定を行うためのUI画面を生成し、操作部220のタッチパネルに表示する。アプリケーション転送部424は、ファイルサーバ120にスキャン画像データを転送(送信)する。アプリケーション転送部424は、転送が終了すると、アプリケーション表示部423に転送が終了したことを通知する。アプリケーション表示部423は、アプリケーション転送部424からの通知を受けて、表示内容を更新する。また、アプリケーション転送部424は、SMB(Server Message Block)クライアント機能を有している。これにより、SMBサーバ機能を有するファイルサーバ120に対してSMBを用いてファイル操作及びフォルダ操作を行う。なお、使用するプロトコルは、SMBに限定されるものではなく、WebDAV、FTP、SMTPなどであってもよい。また、SOAPやRESTといったファイル送信目的以外のプロトコルも使用可能である。
The upload
続いて、MFP110において原稿からスキャン画像を生成し、ファイルサーバ120にアップロードする際の動作制御について説明する。図5は、スキャン画像データの生成からアップロードまでの制御の流れを示すフローチャートである。この一連の処理は、制御部210がHDD214に記憶された制御プログラムを実行することにより実現される。以下、詳しく説明する。
Subsequently, operation control at the time of generating a scan image from a document in the
ステップ501では、アプリケーション表示部423により、スキャン処理のための各種設定を行うためのUI画面(以下、「スキャン設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。図6は、スキャン設定画面の一例を示す図である。図6のスキャン設定画面600には、5つの設定ボタン601〜605が存在する。[カラー設定]ボタン601は、原稿をスキャンする際のカラー/モノクロを設定するためのボタンである。[解像度設定]ボタン602は、原稿をスキャンする際の解像度を設定するためのボタンである。[両面読み取り設定]ボタン603は、原稿の両面をスキャンしたい場合に用いる設定ボタンである。[原稿混載設定]ボタン604は、サイズが異なる原稿をまとめてスキャンしたい場合に用いる設定ボタンである。[画像形式設定]ボタン605は、スキャン画像データの保存形式を指定する際に用いる設定ボタンである。これら設定ボタン601〜605を用いた設定時には、MFP110においてサポートされている範囲で設定可能な候補(選択肢)が表示され、ユーザが表示された候補から望むものを選択する。なお、上述の設定ボタンは一例であって、これらすべての設定項目が存在しなくてもよいし、これら以外の設定項目が存在してもよい。ユーザは、このようなスキャン設定画面600を介してスキャン処理についても詳細な設定を行う。[キャンセル]ボタン620は、スキャン設定を中止する場合に用いるボタンである。[スキャン開始]ボタン621は、原稿台等にセットした原稿に対するスキャン処理の開始を指示するためのボタンである。
In step 501, the
ステップ502では、アプリケーション表示部423により、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[スキャン開始]ボタン621の押下を検出された場合、アプリケーション表示部423によって各設定ボタン601〜605で設定された内容とスキャン処理の実行開始の受付が、スキャン指示部421に対して伝えられる。一方、[キャンセル]ボタン620の押下を検出された場合は本処理を終える。
In step 502, the
ステップ503では、スキャン指示部421からの指示に応答して、スキャン実行部411によってスキャン処理が実行される。これにより得られたスキャン画像データは、ステップ504において、転送部412を通じてアプリケーション受信部422にFTPで内部転送され、さらにアプリケーション転送部424を介して画像解析部425に送られる。
In
ステップ505では、画像解析部425において、スキャン画像データの解析処理が実行される。具体的には、まず、スキャン画像データに対し、画像信号の二値化やスキャン時にずれた原稿の傾きの修正、原稿が正立する方向への回転などを行って、解析処理を行いやすい状態に補正する。そして、補正されたスキャン画像(2値画像)に対しエッジ抽出などを行って、当該画像内の文字列領域、すなわち、一続きの文字列と推認される塊(単位領域)を特定する。文字列領域の座標、文字列領域の幅方向(横方向)および高さ方向(縦方向)の大きさが特定される。文字列領域の幅方向(横方向)とは、文書の文章方向に沿う方向を示している。文字列領域の高さ方向(縦方向)とは、文書の文章方向に沿う方向と交わる方向、例えば直交する方向を示している。また、原稿にて文章方向が横書きであるか縦書きであるかを特定する。これはスキャン画像(2値画像)に対し縦と横の射影をとって、この射影の分散の低いほうを行方向と判定する方法があり、これを用いることができる。以下の表1は、ある見積書のスキャン画像の一部に対して画像解析処理を行った結果の一例を示している。
In
上記表1において、[番号]は、特定された各文字列領域を一意に示す番号である。この例では1から10までの通し番号が、認識した順番に付けられている。座標はプレビュー領域710の左上を原点(0,0)として右方向にX軸、下方向にY軸をとるものとする。[領域のX座標]は、特定された各文字列領域の左上隅のX座標を示す。[領域のY座標]は、特定された各文字列領域の左上隅のY座標を示す。以後、文字列領域に対して“座標”という場合は、特に断らない限り、文字列領域の左上隅の位置座標のことを意味するものとする。[領域の幅]は、特定された各文字列領域の左辺から右辺までの距離を示す。[領域の高さ]は、特定された各文字列領域の上辺から下辺までの距離を示す。本実施形態では、[領域のX座標]、[領域のY座標]、[領域の幅]、[領域の高さ]はいずれもピクセルで示すが、ポイントやインチ等で示してもよい。スキャン画像から抽出された各文字列領域の情報(以下、「文字列領域情報」と呼ぶ。)は、画像解析データとしてアプリケーション転送部424に渡される。画像解析データは、例えばCSVやXMLのフォーマットとするが、他のフォーマットであっても構わない。また、HDD214に一旦保存した上で、所定のタイミングで渡してもよい。
In Table 1 above, [No.] is a number uniquely indicating each identified character string area. In this example,
ステップ506では、アプリケーション転送部424により、ステップ503で読み込まれたスキャン画像が、操作部220のタッチパネルにプレビュー表示される。このプレビュー表示用の画面データは、アプリケーション表示部423によって生成・提供される。ユーザは、スキャン画像がプレビュー表示されたUI画面(以下、「プレビュー画面」と呼ぶ。)を介して、スキャン画像データのファイル名を設定することができる。図7(a)は、プレビュー画面の一例を示す図である。プレビュー画面700において、画面中央にあるプレビュー領域710内には、スキャン画像と共にその表示状態を変更するための複数のボタン711〜714も表示される。ボタン711及び712はスキャン画像の全体を表示しきれないときに現れるボタンで、表示領域を縦方向にスクロールするためのボタンである。MFP110が備えるタッチパネルは通常それほど大きくはない。そこで、例えば、スキャン画像がA4縦・横書きの原稿を読み取ったものである場合は、スキャン画像の幅方向(短手方向)全体がプレビュー領域710にちょうど収まるように上詰めで縮小表示されるよう初期設定される。つまり、初期設定においては、A4縦のスキャン画像の下部は、プレビュー領域710内に表示されないことになる。このようなとき、「↓」のボタン712を押下すると下に表示領域がスクロールし、下部を表示させることができる。さらに、スキャン画像が例えばA4横やA3などの場合には、表示領域を横方向にスクロールするためのボタンをさらに設ければよい。ボタン713及び714は、表示領域を拡大・縮小するためのボタンであり、「+」のボタン713を押下するとズームインし、「−」のボタン714を押下するとズームアウトする。これらボタン操作による動作を、プレビュー画面上でスワイプやピンチアウト/ピンチインといったユーザの指による操作で実現してもよい。また、プレビュー領域710には、ステップ505の画像解析処理によって特定された文字領域が、上述の文字列領域情報に基づき、ユーザに選択可能で識別可能な態様にて表示される。この文字列領域表示処理の詳細については後述する。図7(b)は、図7(a)のプレビュー画面700において、各文字列領域が囲み枠によって識別可能に表示された状態を示す図である。文字列領域の表示処理の詳細については後述する。ユーザがユーザに識別可能な態様でプレビュー領域710に表示された文字列領域の中から任意の文字列領域を選択(例えば指でタッチ)する。この選択操作に伴い、そこに含まれる文字列がファイル名入力欄701に表示、すなわち自動入力され、ファイル名を構成する文字列の一部となる。[戻る]ボタン720は、プレビュー表示を中止する場合に用いるボタンである。[次へ]ボタン721は、読み込まれたスキャン画像データのアップロード先を設定する画面に移行するためのボタンである。また、ボタン702はファイル名のフォーマットなどを設定するためのボタンである。なお、上述した各種ボタンの種類、各文字列領域の表示や選択の態様は一例にすぎず、これに限定されない。例えば、ファイル名入力欄701に表示された文字列を修正・変更したり、ファイル名を確定したりするためのボタンがあってもよい。
In step 506, the
ステップ507では、プレビュー表示部426により、読み込まれたスキャン画像に対するファイル名の生成がなされる。図8は、ファイル名生成後のプレビュー画面700の状態を示している。この例では、「見積書」、「東京株式会社」、「2017年04月14日」に対応する文字列領域が順次選択されたことで、「見積書_東京株式会社_2017年04月14日」の文字列が、ファイル名入力欄701に表示・設定されている。また、プレビュー領域710では、ユーザがタッチ操作した文字列領域の囲みが、ファイル名の一部として選択されたことを示すため太枠に変わっている。このファイル名生成処理の詳細については後述する。所望するファイル名が生成されてユーザが[次へ]ボタン721を押下すると、ステップ508へ進む。
In step 507, the
ステップ508では、プレビュー表示部426により、ステップ502と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[次へ]ボタン721の押下が検出された場合は、ファイル名入力欄701に表示中のファイル名(ファイル名として設定された文字列)の情報がアップロード指示部427へ送られ、ステップ509へ進む。一方、[戻る]ボタン720の押下が検出された場合は、ステップ501(スキャン設定画面の表示)へ戻る。
In
ステップ509では、アップロード指示部427により、スキャン画像データの転送先を設定するためのUI画面(以下、「アップロード設定画面」と呼ぶ。)が、操作部220のタッチパネルに表示される。ユーザは、このアップロード設定画面を介して、ファイルサーバ120へのアップロードに関する詳細設定を行う。図9は、アップロード設定画面の一例を示す図である。ユーザは、[フォルダパス]入力欄901に、ファイルサーバ120へ外部転送する際のフォルダパスの名称(パス名)を入力する。図9の例では、“2017_04_14”がパス名として入力されている。入力方法としては、例えば[フォルダパス]入力欄901へのタップ操作に応じてキーボード画面のサブウインドウ(不図示)を表示し、ユーザに、当該キーボード画面を介してパス名を入力させる方法がある。あるいは、HDD214内に保持するアドレス帳の中から選択して設定できるようにしてもよい。[戻る]ボタン920は、アップロードに関する詳細設定を中止する場合に用いるボタンである。[アップロード]ボタン921は、[フォルダパス]入力欄901で設定したフォルダパスへのアップロードを指示するためのボタンである。
In
ステップ510では、アップロード指示部427により、ステップ508と同様、ユーザによるボタン操作の内容によって処理の切り分けがなされる。[アップロード]ボタン921の押下が検出された場合は、ステップ511へ進む。その際、[フォルダパス]入力欄901に入力されたパス名、ステップ507で生成されたファイル名、ファイルサーバ設定は、ファイルサーバ120にスキャン画像データを格納するために必要な情報である。具体的には、ホスト名、フォルダパスの起点、ログイン用のユーザ名とパスワードといった情報を含む。一方、[戻る]ボタン920の押下が検出された場合は、ステップ506(プレビュー画面の表示)へ戻る。
In step 510, the upload
ステップ511では、アプリケーション転送部424により、スキャン画像データの格納先パスが、アップロード指示部427から受け取った情報に基づき生成される。具体的には、ファイルサーバ設定(ファイルサーバ120のホスト名、フォルダパスの起点)にフォルダパスを加えて生成される。これにより、例えば“\\server01\Share\2017_04_14”といった格納先パスが生成される。そして、ステップ512では、アプリケーション転送部424により、ファイルサーバ120に対するアクセスが実行される。この際、ファイルサーバ設定に含まれるユーザ名とパスワードをファイルサーバ120に送信する。ユーザ名とパスワードを受け取ったファイルサーバ120では、認証処理が実行される。
In step 511, the
ステップ513では、アプリケーション転送部424により、ファイルサーバ120での認証結果に従って処理の切り分けがなされる。すなわち、ファイルサーバ120から認証成功の通知を受信した場合は、ステップ514に進む。一方、認証失敗の通知を受信した場合は、本処理を終了する。
In step 513, the
ステップ514では、アプリケーション転送部424により、ステップ511で生成された格納先パスが示すフォルダにスキャン画像データが外部転送され、ファイルサーバ120内に格納される。
In
以上が、本実施形態に係るスキャン画像の生成からアップロードまでの動作制御の内容である。なお、本実施形態では、ステップ505〜507の処理を、スキャンによって生成された1ページ分の画像データに対して行うことを想定している。例えば、プレビュー画面700内に次のページの画像解析を行うためのボタンを設け、その解析によって得られた次ページのプレビュー表示を行って、次ページ以降の文字列領域からファイル名を構成する文字列を設定できるようにしてもよい。
The above is the contents of operation control from generation of a scan image to upload according to the present embodiment. In the present embodiment, it is assumed that the processing in
<ファイル名の生成>
図10は、プレビュー表示部426におけるファイル名生成処理(ステップ507)の詳細を示すフローチャートである。以下、図10のフローに沿って説明する。
<Generation of file name>
FIG. 10 is a flowchart showing details of the file name generation process (step 507) in the
ステップ1001では、タッチパネル上に表示されたプレビュー画面700へのユーザによるタッチ操作の有無が監視される。タッチ操作が検出されるとステップ1002へ進む。続くステップ1002では、タッチ操作の内容によって処理の切り分けがなされる。タッチ操作の内容が、[次へ]ボタン721または[戻る]ボタン720の押下であった場合は、本処理を終了する。[次へ]ボタン721または[戻る]ボタン720の押下ではなかった場合は、ステップ1003へ進む。
In
ステップ1003では、タッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。続くステップ1004では、タッチ操作された位置座標が、ユーザに選択可能で識別可能な態様にて表示されたいずれかの文字列領域と重なるかどうかが判定される。例えば、タッチ操作された位置座標が、ユーザに選択可能で識別可能な態様にてプレビュー領域710に表示された各文字列領域の内側(文字列領域の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定する。タッチ操作された位置座標がユーザに選択可能で識別可能な態様にて表示されたいずれかの文字列領域と重なっている場合は、ステップ1005へ進む。一方、重なっていない場合は、ステップ1001に戻る。
In
ステップ1005では、タッチ操作された位置座標と重なっている文字列領域の文字列が取得される。文字列の取得は、タッチ操作によって選択された文字列領域(以下、「選択文字列領域」と呼ぶ。)に対するOCR処理を画像解析部425で実行して、文字列を抽出することで取得される。そして、ステップ1006では、ファイル名入力欄701に現在表示中のファイル名が取得される。続くステップ1007では、取得したファイル名の中身が“空”であるか判定する。ここで、ファイル名が“空”とは、ファイル名入力欄701内に何らの文字列も表示されていない空欄状態を意味する。取得したファイル名が“空”であった場合は、ステップ1009に進む。一方、“空”でなかった場合は、ステップ1008に進む。
In step 1005, a character string in a character string area overlapping the position coordinates touched is acquired. Acquisition of a character string is performed by executing OCR processing on a character string area (hereinafter referred to as “selected character string area”) selected by a touch operation by the
ステップ1008では、ステップ1006で取得したファイル名の末尾に、所定の区切り文字を追加する処理がなされる。所定の区切り文字として、ここでは、アンダーバーを例に説明するが、これに限定されるものではない。例えばハイフンなどアンダーバー以外の記号・文字でも構わないし、さらにはスペースのような実体を伴わないものでも構わない。 In step 1008, processing is performed to add a predetermined delimiter to the end of the file name acquired in step 1006. Here, underbars will be described as an example of predetermined delimiters, but the present invention is not limited to this. For example, hyphens and other symbols and characters other than underscores may be used, and those without an entity such as a space may also be used.
ステップ1009では、ステップ1005で取得した文字列(選択文字列領域から抽出した文字列)が、ファイル名の構成要素として設定される。この際、既に設定された文字列が存在している場合は、その末尾に追加される。そして、ステップ1010では、現時点で設定されている文字列が、ファイル名入力欄701に表示(自動入力)される。
In step 1009, the character string acquired in step 1005 (character string extracted from the selected character string area) is set as a component of the file name. At this time, if there is a string that has already been set, it is added to the end. Then, in
以上が、ファイル名生成処理の内容である。このような処理によって、ユーザに選択された複数の文字列領域の間に区切り文字を挿入して、スキャン画像のファイル名が生成される。 The above is the contents of the file name generation process. By such processing, the delimiter is inserted between the plurality of character string areas selected by the user, and the file name of the scan image is generated.
<文字列領域の表示>
図11は、プレビュー表示部426におけるプレビュー画面表示処理(ステップ506)の詳細を示すフローチャートである。以下、図11のフローに沿って説明する。
<Display of character string area>
FIG. 11 is a flowchart showing details of preview screen display processing (step 506) in the
ステップ1101では、プレビュー表示部426により、ステップ505の画像処理によって特定された文章方向の情報がアプリケーション転送部424を介して取得される。
In
ステップ1102では、プレビュー表示部426により、HDD214などに予め記憶された文字列領域の表示条件が取得される。文字列領域の表示条件は、文字列領域をプレビュー画面に表示するか否かを判断するための条件である。例えば、文字列領域の縦横比を表示/非表示の判定値(例えば、上限値、下限値、基準値など)として用いることが可能である。判定値は、原稿サイズに応じて変えることが可能である。
In step 1102, the
判定値は、文章方向で異なる。文章(文字列)が横書きである場合、文字列領域の幅方向(横方向)の大きさを文字列領域の高さ方向(縦方向)の大きさで除算して得られた値が判定値として用いられる。また、文章(文字列)が縦書きである場合、文字列領域の高さ方向の大きさを文字列領域の幅方向の大きさで除算して得られた値が判定値として用いられる。本実施形態では、プレビュー画面に文字列領域を表示する上限値を15とする。上限値を15とした理由は、一文字の幅と高さがほぼ同じであると仮定すると約15文字の文字列領域であると予想でき、15文字の文字列は本文などの文章である可能性が高く、ファイル名に用いられる可能性が低いためである。この判定値の設定は、例えば、HDD214にあらかじめ記憶させておいてもよい。この場合、判定値を原稿サイズに応じて設定しておくことも可能である。あるいは、スキャン設定画面における設定ボタンの押下に応じて表示条件設定画面のサブウインドウ(不図示)を表示し、ユーザに、当該表示条件設定画面を介して判定値を入力させてもよい。
Judgment values differ in the sentence direction. When a sentence (character string) is written horizontally, the value obtained by dividing the size in the width direction (horizontal direction) of the character string area by the size in the height direction (vertical direction) of the character string area is the judgment value Used as Further, when the sentence (character string) is written vertically, a value obtained by dividing the size in the height direction of the character string area by the size in the width direction of the character string area is used as the determination value. In the present embodiment, the upper limit value for displaying the character string area on the preview screen is 15. The reason why the upper limit is set to 15 is that if it is assumed that the width and height of one character are almost the same, it can be expected to be a character string area of about 15 characters, and the 15 character character string may be a sentence such as text And is unlikely to be used for file names. The setting of the determination value may be stored in advance in the
ステップ1103では、プレビュー表示部426により、画像解析部425で得られた複数の文字列領域の中から1つの文字領域が決定される。
In step 1103, the
ステップ1104では、プレビュー表示部426により、ステップ1103で決定された文字列領域に関し、ステップ505の画像処理によって特定された文字列領域の情報がアプリケーション転送部424を介して取得される。
In step 1104, the
ステップ1105では、プレビュー表示部426により、ステップ1101で取得した文章方向の情報と、ステップ1004で取得した文字列領域の情報とに基づき、文字列領域の縦横比(アスペクト比)が算出される。スキャン画像が横書きの原稿を読み取ったものである場合、文字列領域の縦横比の算出方法として、文字列領域の幅方向(横方向)の大きさを文字列領域の高さ方向(縦方向)の大きさで除算する算出方法を用いることが可能である。また、スキャン画像が縦書きの原稿を読み取ったものである場合、文字列領域の縦横比の算出方法として、文字列領域の高さ方向(縦方向)の大きさを文字列領域の横方向(幅方向)の大きさで除算する算出方法を用いることが可能である。例えば、表1の番号1に対応する文字列領域の縦横比は、幅方向の大きさ20を高さ方向の大きさ10で除算することで得られ、2となる。一方、表1の番号10に対応する文字列領域の縦横比は、幅方向の大きさ80を縦方向の大きさ5で除算することで得られ、18となる。
In step 1105, the
ステップ1106では、プレビュー表示部426により、文字列領域がユーザに選択可能で識別可能な態様にてタッチパネルに表示する文字列領域表示条件を満たすかどうかが判定される。この判定は、ステップ1105で算出された結果とステップ1102で取得された文字列領域表示条件とに基づき行われる。例えば、ステップ1102で取得された判定値を、ユーザに識別可能に文字列領域を表示する上限値として用いる場合について以下に説明する。ステップ1105で算出された文字列領域の縦横比が文字列領域表示条件を満たす場合、すなわち、ステップ1102で取得された判定値と同じか判定値よりも小さい場合、ステップ1107に進む。一方、ステップ1105で算出された文字列領域の縦横比が文字列領域表示条件を満たさない場合、すなわち、判定閾値より大きい場合には、囲み枠によって識別可能に文字列領域をプレビュー画面に表示するステップ1107へは進まず、ステップ1108に進む。例えば、判定値を15とした場合、下記表2に示すように、番号1〜9では、文字列領域の縦横比(幅/高さ)が15以下であり文字列領域の表示条件を満たすと判定される。一方、番号10では文字列領域の縦横比(幅/高さ)が15よりも大きい18であり文字列領域の表示条件を満たさないと判定される。ステップ1106において条件を満たしていない場合、プレビュー画面700では、符号722で示すような文字列の記載箇所に囲み枠が表示されない。
In step 1106, it is determined by the
ステップ1007では、プレビュー表示部426により、ステップ1103で決定された文字列領域が、ユーザに選択可能で識別可能な態様にてプレビュー画面700のプレビュー領域710に表示される。例えば、図8のプレビュー領域710に示されるように文字列領域を囲む枠線が表示される。
In
ステップ1108では、プレビュー表示部426により、未処理の文字列領域があるか判定される。未処理の文字列領域がある場合には、ステップ1103に戻り、ステップ1104〜1108の処理が行われる。他方、未処理の文字列領域が無い場合は、本処理を終了する。
In
文字列領域表示条件に基づき、ユーザに選択可能で識別可能な態様にて文字列領域をプレビュー画面に表示することから、文字列領域表示条件が無い場合と比べ、プレビュー画面に表示される文字列領域を制限することができ、ユーザの利便性を高めることができる。 Since the character string area is displayed on the preview screen in a selectable and distinguishable manner based on the character string area display condition, the character string displayed on the preview screen as compared with the case where there is no character string area display condition The area can be restricted, and the convenience of the user can be enhanced.
ここで、図8で示す「見積書_東京株式会社_2017年04月14日」のファイル名が生成されるまでの過程を、前述の表1を参照して説明する。まず、表1における1〜10の通し番号は、それぞれ以下に示すように各文字列領域と対応付けられている。
1:「見積書」
2:「東京株式会社」
3:「御中」
4:「見積もり番号」
5:「R-1234」
6:「納品希望日」
7:「2017年04月14日」
8:「横浜株式会社」
9:「神奈川県横浜市1000-1」
10:「平素は格別のご高配を賜り厚く御礼申し上げます。」
Here, the process until the file name of “estimate document _ Tokyo Ltd. April 14, 2017” shown in FIG. 8 is generated will be described with reference to the above-mentioned Table 1. First,
1: "Estimate"
2: "Tokyo Corporation"
3: "On the house"
4: "Estimate number"
5: "R-1234"
6: "desired delivery date"
7: "April 14, 2017"
8: "Yokohama Corporation"
9: "1000-1 Yokohama City, Kanagawa Prefecture"
10: "I would like to thank you very much for your exceptional service."
最初に、スキャン画像データに対し画像解析処理されて文字列領域が取得されると、取得された総ての文字列領域の縦横比が算出される。そして、文字列表示条件を満たした文字列領域のみがユーザに選択可能で識別可能な態様にてプレビュー画面のプレビュー領域に表示される。文字列表示条件の判定値を文字列領域の縦横比が15以下とすると、番号1〜9に対応する文字列領域には、ユーザに選択可能で識別可能な態様の一例である、文字列領域を囲む枠がプレビュー画面のプレビュー領域に表示される。一方、番号10に対応する文字列領域の縦横比が18であり、文字列表示条件を満たさないので、ユーザに選択可能で識別可能な態様の一例である、文字列領域を囲む枠がプレビュー画面のプレビュー領域には表示されないこととなる。
First, when image analysis processing is performed on scan image data and a character string area is acquired, the aspect ratio of all acquired character string areas is calculated. Then, only the character string area that satisfies the character string display condition is displayed in the preview area of the preview screen in a selectable and distinguishable manner for the user. Assuming that the aspect ratio of the character string area is 15 or less, the character string area corresponding to the
次に、タッチパネルへのタッチ操作を検知すると、タッチされた座標と重なる文字列が判定される(ステップ1001〜1004)。「見積書」の文字列領域へのタッチ操作を検知すると、「見積書」の文字列領域に対しOCR処理されて「見積書」の文字が取得される(ステップ1005〜1006)。そして、この段階ではファイル名入力欄701は何らの文字列も表示されておらず“空”の状態なので(ステップ1007でYes)、ファイル名入力欄701に「見積書」が表示される(ステップ1010)。また、プレビュー領域710では、ユーザのタッチ操作によってファイル名の一部として選択されたことを示すため、「見積書」の文字列領域の囲みが太枠に変わる。
Next, when a touch operation on the touch panel is detected, a character string overlapping the touched coordinates is determined (
次に、「東京株式会社」の文字列領域へのタッチ操作を検知する(ステップ1001〜1006)と、「東京株式会社」の文字列領域に対しOCR処理されて「東京株式会社」の文字が取得される(ステップ1001〜1006)。そして、この段階ではファイル名入力欄701には「見積書」の文字が表示されており“空”ではない(ステップ1007でNo)。よって、ファイル名入力欄701において、「見積書」の文字に続けて区切り文字であるアンダーバー“_”が追加設定される(ステップ1008)。この時点でファイル名は「見積書_」となる。その後、さらに「東京株式会社」の文字が追加され(ステップ1009)、ファイル名入力欄701に「見積書_東京株式会社」が表示され(ステップ1010)、ファイル名は「見積書_東京株式会社」となる。
Next, when a touch operation on the character string area of "Tokyo, Inc." is detected (
そして、「2017年04月14日」の文字列領域にてタッチ操作が検知される(ステップ1001〜1006)と、「2017年04月14日」の文字列領域に対してOCR処理が行われて「東京株式会社」の文字が取得される(ステップ1001〜1006)。よって、ファイル名入力欄701において、「東京株式会社」の文字に続けて区切り文字であるアンダーバー“_”が追加設定される(ステップ1008)。この時点でファイル名は「見積書_東京株式会社_」となる。その後、さらに「2017年04月14日」の文字が追加され(ステップ1009)、ファイル名入力欄701に「見積書_東京株式会社_2017年04月14日」が表示される(ステップ1010)。最終的に「見積書_東京株式会社_2017年04月14日」のファイル名が得られる。また、プレビュー領域710では、「見積書」の文字列領域と同様、「東京株式会社」と「2017年04月14日」の文字列領域の囲みも太枠に変わる。
Then, when the touch operation is detected in the character string area of "Apr. 14, 2017" (
以上が、ファイル名生成処理の内容である。本実施形態では、スキャン画像内の文字列領域の文字認識結果を用いてファイル名を設定する場面を例に説明したが、本発明の適用範囲はファイル名を設定する場面に限定されるものではない。例えば、スキャン画像のアップロード先といったデータの転送先設定や、FAX送信やメール送信の宛先設定に適用してもよい。この場合、例えば、前述の図9のアップロード設定画面900において、スキャン画像内の文字列領域の文字認識結果をフォルダパスの候補として選択可能に表示し、ユーザ選択に応じてパス名を設定できるようにする。また、不図示の宛先設定画面において、スキャン画像内の文字列領域の文字認識結果をFAX番号やメールアドレスの候補として選択可能に表示し、ユーザ選択に応じてFAX番号やメールアドレスを設定できるようにする。このように、ファイル名設定以外の場面、例えばデータの転送先等の設定など、スキャン画像に関連する様々な情報(付帯情報)の設定を行う場面において、本発明は幅広く適用可能である。
The above is the contents of the file name generation process. In the present embodiment, the scene where the file name is set using the character recognition result of the character string area in the scan image is described as an example, but the scope of application of the present invention is limited to the scene where the file name is set. Absent. For example, the present invention may be applied to transfer destination setting of data such as a scan image upload destination, and destination setting of FAX transmission and mail transmission. In this case, for example, in the upload
したがって、本実施形態によれば、文字列領域の表示条件を満たした文字列領域をユーザに選択可能で識別可能な態様にて表示する。これにより、スキャン画像の全ての文字列領域をユーザに選択可能な態様で表示する場合と比べて、ユーザによる誤操作を未然に防ぎ、ユーザの利便性を高めることができる。 Therefore, according to the present embodiment, the character string area that satisfies the display condition of the character string area is displayed in a selectable and distinguishable manner for the user. As a result, compared with the case where all the character string areas of the scan image are displayed in a selectable manner for the user, an erroneous operation by the user can be prevented and the convenience of the user can be enhanced.
ユーザにより選択された文字列領域に対してOCR処理を行うことから、スキャン画像データ全体に対してOCR処理を行う場合と比べて、スキャン画像データからの文字列の取得を効率よく行うことができる。 Since the OCR processing is performed on the character string area selected by the user, it is possible to efficiently acquire the character string from the scanned image data as compared to the case where the OCR processing is performed on the entire scanned image data. .
[第2の実施形態]
次に、文章の直交方向での文字列領域の大きさに応じた文字列表示条件を有する場合、文字列領域の縦横比を算出しなくても、ユーザに識別可能に表示する態様を第2の実施形態として説明する。なお、MFP110におけるスキャン動作の制御の流れなど第1の実施形態と共通する内容については説明を省略することとし、以下では本実施形態の特徴である文字列領域の表示処理を中心に説明するものとする。
Second Embodiment
Next, in a case where the character string display condition according to the size of the character string area in the orthogonal direction of the sentence is provided, the second aspect of displaying identifiably to the user without calculating the aspect ratio of the character string area It demonstrates as embodiment of. The description of the flow common to the first embodiment such as the flow of control of the scan operation in the
本実施形態では、例えば、図10の文字列領域表示判定において、文字列領域の縦横比の代わりに、スキャン画像データの原稿サイズに対応した文字列領域の高さ方向(または幅方向)での大きさの範囲(上限値と下限値の間の範囲)を用いる。 In the present embodiment, for example, in the character string area display determination of FIG. 10, instead of the aspect ratio of the character string area, the height direction (or width direction) of the character string area corresponding to the document size of the scan image data. Use a range of sizes (range between upper limit and lower limit).
文字列領域の高さ方向(または幅方向)の大きさが、原稿サイズに対応した文字列領域の高さ方向(または幅方向)での大きさ範囲内にある場合には、文字列領域がユーザに選択可能で識別可能な態様にてプレビュー画面のプレビュー領域に表示される。一方、文字列領域の高さ方向(または幅方向)の大きさが、原稿サイズに対応した文字列領域の高さ方向(または幅方向)での大きさ範囲外である場合、文字列領域がユーザに選択可能で識別可能な態様ではプレビュー画面のプレビュー領域に表示されないこととなる。 If the size in the height direction (or width direction) of the character string area is within the size range in the height direction (or width direction) of the character string area corresponding to the document size, the character string area is It is displayed in the preview area of the preview screen in a manner that can be selected and identified by the user. On the other hand, if the size in the height direction (or width direction) of the character string area is outside the size range in the height direction (or width direction) of the character string area corresponding to the document size, the character string area In a user selectable and distinguishable aspect, the preview area is not displayed in the preview area of the preview screen.
以上が、文字列領域表示処理の内容である。これにより、明らかにファイル名などに利用しないと推認される小さな文字または大きな文字の文字列領域を表示させなくすることができる。そのため、文字列領域表示条件によりユーザが選択する可能性の低い文字列領域を非表示とするが、ファイル名などに利用する可能性が高い特定の大きさの文字列領域のみを表示することができ、ユーザによる誤選択を防ぐことができる。 The above is the content of the character string area display processing. As a result, it is possible to prevent the display of a character string area of small characters or large characters that are clearly assumed not to be used for file names and the like. Therefore, although the character string area which is unlikely to be selected by the user according to the character string area display condition is not displayed, it is possible to display only the character string area of a specific size which is highly likely to be used as a file name. It is possible to prevent false selection by the user.
[第3の実施形態]
次に、複数の入力エリア(入力欄)がある場合に、それぞれのエリアに対応した文字列領域表示条件に基づき、文字列領域をユーザに識別可能に表示する態様を第3の実施形態として説明する。ファイル名入力欄とは異なる文字列領域表示条件に基づき入力されるフォルダ名入力欄とファイル名入力欄とを有する場合に、入力エリアに応じた文字列表示条件をユーザがそのつど選択しなくても、自動選択する態様を第3の実施形態として説明する。なお、MFP110におけるスキャン動作の制御の流れなど第1の実施形態と共通する内容については説明を省略することとする。以下では本実施形態の特徴である、入力条件の異なる複数の入力エリアがある場合における、ファイル名などの生成処理を中心に説明するものとする。
Third Embodiment
Next, when there is a plurality of input areas (input fields), a mode of displaying the character string area in a discriminable manner for the user based on the character string area display condition corresponding to each area will be described as the third embodiment. Do. In the case of having a folder name input box and a file name input box input based on a character string area display condition different from the file name input box, the user does not select the character string display condition according to the input area each time Also, an aspect of automatically selecting will be described as a third embodiment. The description of the flow of control of the scan operation in
図12(a)は、複数入力エリアを備えたプレビュー画面の一例を示す図である。プレビュー画面1200においては、画面中央にあるプレビュー領域1201の上方には、ファイル名の入力に対応した入力エリア1202と共に、フォルダ名の入力に対応した入力エリア1203とが表示される。入力エリア1202と入力エリア1203とは、上下で隣接して表示される。図12(b)は、図12(a)のプレビュー画面1200において、各文字列領域が囲み枠によって識別可能に表示された状態を示す図である。また、プレビュー画面1200では、ユーザがタッチ操作したフォルダ名の入力エリア1203の囲みが、当該エリアを選択した状態であることを示すため太枠に変わっている。
FIG. 12A is a view showing an example of a preview screen provided with a plurality of input areas. In the
図13は、ユーザ操作によって操作中の入力エリアが切り替わった時のプレビュー表示部426による、文字列領域の再表示処理の詳細を示すフローチャートである。以下、図13のフローチャートに沿って説明する。
FIG. 13 is a flowchart showing details of the redisplay processing of the character string area by the
ステップ1301では、タッチパネル上に表示されたプレビュー画面1200へのユーザによるタッチ操作の有無が監視される。タッチ操作が検出されるとステップ1302へ進む。続くステップ1302では、タッチ操作の内容によって処理の切り分けがなされる。タッチ操作の内容が、[次へ]ボタンまたは[戻る]ボタンの押下であった場合は、本処理を終了する。[次へ]ボタン1321または[戻る]ボタンの押下ではなかった場合は、ステップ1303へ進む。
In step 1301, the presence or absence of a touch operation by the user on the
ステップ1303では、タッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。続くステップ1304では、タッチ操作された位置座標が、入力エリアと重なるかどうかが判定される。例えば、タッチ操作された位置座標が、ファイル名入力エリア1302またはフォルダ名入力エリア1303の内側(矩形の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定される。タッチ操作された位置座標がファイル名入力エリア1202またはフォルダ名入力エリア1203のいずれか一方と重なっている場合は、ステップ1305へ進む。一方、重なっていない場合は、ステップ1301に戻る。
In step 1303, position coordinates (x, y) on the touch panel on which the touch operation has been performed are acquired. In the following
ステップ1305では、タッチ操作された位置座標と重なり当該タッチ操作によって選択された入力エリア(以下、「選択入力エリア」と呼ぶ。)に対応した文字列領域表示条件が取得される。この文字列領域表示条件は入力エリアに応じて予め設定されている。 In step 1305, a character string area display condition corresponding to the touch-operated position coordinate and the input area selected by the touch operation (hereinafter referred to as "selection input area") is acquired. The character string area display conditions are preset according to the input area.
表3は、入力エリアごとに保持された文字列領域表示条件テーブルの一例を示している。 Table 3 shows an example of the character string area display condition table held for each input area.
例えば、比較的長い文字列を入力する可能性のあるファイル名入力エリア(番号1)には、文字列領域の縦横比の閾値として15が設定されている。また、長い文字列を入力する可能性の少なく、ファイル名入力エリアと比べて短い文字列しか入力しないフォルダ名入力エリア(番号2)には、文字列領域の縦横比の閾値として10が設定されている。文字列領域表示条件は、HDD214などに予め記憶されている。プレビュー表示部426は、入力エリアへの入力の選択を受け付けると、選択入力エリアに対応した文字列領域表示条件がHDD214などから取得される。
For example, in the file name input area (number 1) where there is a possibility of inputting a relatively long character string, 15 is set as the threshold of the aspect ratio of the character string area. Also, in the folder name input area (No. 2) where there is little possibility of inputting a long character string and only a character string shorter than the file name input area, 10 is set as the threshold of the aspect ratio of the character string area ing. The character string area display conditions are stored in advance in the
続いてステップ1306以降にて、文字列領域表示処理が行われる。ステップ1306〜1311の各処理は、第1の実施形態の図11に示されるステップ1103〜1108と同じである。例えば、フォルダ名入力エリア(番号2)の文字列領域表示条件は縦横比の閾値(上限値)が10である。そのため、表2の番号1〜8に対応する文字列領域の縦横比は、それぞれ、ステップ1305で取得された文字列領域表示条件である10以下であり、ユーザに識別可能な態様で表示される。一方、表2の番号9,10に対応する文字列領域の縦横比は、それぞれ、ステップ1305で取得された文字列領域表示条件である10以下ではなく、ユーザに識別可能な態様ではプレビュー画面のプレビュー領域には表示されない。符号1304が示すような文字列が記載されている箇所に囲み枠が表示されない。
Subsequently, in step 1306 and subsequent steps, character string area display processing is performed. Each process of steps 1306 to 1311 is the same as steps 1103 to 1108 shown in FIG. 11 of the first embodiment. For example, the character string area display condition of the folder name input area (number 2) has an aspect ratio threshold (upper limit) of 10. Therefore, the aspect ratio of the character string area corresponding to the
以上が、文字列表示条件の異なる複数の入力エリアがある場合の文字列領域表示処理の内容である。これにより、入力エリアに対して入力可能な文字列領域のみをユーザに識別可能な態様で表示することができる。すなわち、選択中の入力エリアに従って表示する文字列領域を切り替えることができる。 The above is the contents of the character string area display processing when there are a plurality of input areas with different character string display conditions. Thus, only the character string area that can be input to the input area can be displayed in a manner that can be identified by the user. That is, the character string area to be displayed can be switched according to the input area being selected.
なお、入力エリアに入力可能な文字数が決められている場合、入力エリアに入力された文字数に応じて、ユーザに選択可能で識別可能な態様で表示される文字列領域を変更することも可能である。 If the number of characters that can be input to the input area is determined, it is possible to change the character string area displayed in a selectable and distinguishable manner according to the number of characters input to the input area. is there.
[第4の実施形態]
次に、文字列表示条件を満たしていない文字列領域をユーザに選択可能で識別可能に表示する態様を第4の実施形態として説明する。なお、MFP110におけるスキャン動作の制御の流れなど第1の実施形態と共通する内容については説明を省略することとし、以下では本実施形態の特徴である文字列領域の表示処理を中心に説明するものとする。
Fourth Embodiment
Next, an aspect will be described as a fourth embodiment in which a character string area that does not satisfy the character string display condition can be displayed on the user in a selectable and distinguishable manner. The description of the flow common to the first embodiment such as the flow of control of the scan operation in the
本実施形態では、例えば、上述の第1〜3の実施形態とは異なる特定のタッチ操作(例えば、長押しタッチ、ダブルタップ)が検出された場合の処理内容である。 The present embodiment is, for example, processing content when a specific touch operation (for example, long press touch, double tap) different from the first to third embodiments described above is detected.
図14は、特定のユーザ操作が検出された場合の文字列領域表示処理の詳細を示すフローチャートである。図14のフローチャートに沿って説明する。 FIG. 14 is a flowchart showing details of character string area display processing when a specific user operation is detected. It demonstrates along the flowchart of FIG.
ステップ1401では、タッチパネル上に表示されたプレビュー画面へのユーザによる特定のタッチ操作の有無が監視される。特定のタッチ操作としては、例えば、画面長押しタッチ、ダブルタップなどのボタンを1回押下する場合の操作と区別して検出可能なタッチ操作が挙げられる。画面長押しタッチなどの特定のタッチ操作が検出されるとステップ1402へ進む。続くステップ1402では、タッチ操作の内容によって処理の切り分けがなされる。タッチ操作の内容が、[次へ]ボタン721または[戻る]ボタン720の押下であった場合は、本処理を終了する。[次へ]ボタン721または[戻る]ボタン720の押下ではなかった場合は、ステップ1403へ進む。
In
ステップ1403では、タッチ操作がなされたタッチパネル上の位置座標(x,y)が取得される。続くステップ1404では、タッチ操作された位置座標が、ユーザに選択可能で識別可能な態様にて表示さていない文字列領域(以下、「非表示文字列領域」と呼ぶ。)と重なるかどうかが判定される。例えば、タッチ操作された位置座標が、ユーザに識別可能な態様で表示されていない文字列領域の内側(文字列領域の四隅を表す位置座標で特定される矩形の内側)に含まれるかどうかで判定する。タッチ操作された位置座標がユーザに識別可能な態様で表示されていない文字列領域と重なっている場合は、ステップ1405へ進む。一方、重なっていない場合は、ステップ1401に戻る。
In step 1403, position coordinates (x, y) on the touch panel on which the touch operation has been performed are acquired. In the following
ステップ1405では、タッチ操作された位置座標と重なっている文字列領域がユーザに選択可能で識別可能な態様にてプレビュー画面に表示される。 In step 1405, a character string area overlapping the position coordinates touched by the touch operation is displayed on the preview screen in a selectable and distinguishable manner by the user.
以上が、非表示文字列領域の表示処理の内容である。このような処理によって、文字列領域表示条件を満たさないと判定されて非表示状態(選択不可状態)となった文字列領域であっても、ユーザに選択可能で識別可能な態様でプレビュー画面に表示できる。よって、文字を含むスキャン画像から所望の文字列の抽出を煩雑な作業を必要とせず簡易な作業で行うことができる。 The above is the contents of the display processing of the non-display character string area. Even if the character string area is determined to not satisfy the character string area display condition by such processing and is in the non-display state (non-selectable state), the preview screen can be selected and identifiable by the user. It can be displayed. Therefore, it is possible to perform extraction of a desired character string from a scanned image including characters by a simple operation without requiring a complicated operation.
[変形例]
以下に本実施形態の変形例について説明する。
[Modification]
The modification of this embodiment is described below.
ファイル名入力欄に表示されたファイル名の先頭に、該ファイル名側から区切り文字およびタッチ操作で選択された文字列を記載順に追加してファイル名を生成することも可能である。 It is also possible to add a delimiter selected from the file name side to the beginning of the file name displayed in the file name input field and a character string selected by touch operation in the order of description to generate a file name.
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Other Embodiments
The present invention supplies a program that implements one or more functions of the above-described embodiments to a system or apparatus via a network or storage medium, and one or more processors in a computer of the system or apparatus read and execute the program. Can also be realized. It can also be implemented by a circuit (eg, an ASIC) that implements one or more functions.
110 MFP
120 ファイルサーバ
210 制御部
211 CPU
212 ROM
213 RAM
214 HDD
410 ネイティブ機能モジュール
411 スキャン実行部
420 アディショナル機能モジュール
426 プレビュー表示部
110 MFP
120
212 ROM
213 RAM
214 HDD
410 native function module 411
Claims (16)
前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが識別可能に表示した、前記所定の処理を行うためのUI画面を表示する表示制御手段と、
前記UI画面を介してユーザが選択した単位領域に対してOCR処理を行い、該OCR処理によって抽出された文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、
を備え、
前記表示制御手段は、前記文書の文章方向に沿う方向と交わる方向における前記単位領域の大きさに応じて該単位領域をユーザにより識別可能に前記UI画面に表示する
ことを特徴とする装置。 An apparatus for performing predetermined processing on a scanned image obtained by scanning a document,
A display control unit that displays a UI screen for performing the predetermined processing, in which a unit area inferred as a series of character strings in the scanned image is identifiably displayed by a user;
Setting means for performing an OCR process on a unit area selected by the user via the UI screen, and setting additional information for the predetermined process using a character string extracted by the OCR process;
Equipped with
The display control means may display the unit area on the UI screen so as to be distinguishable by a user according to the size of the unit area in a direction intersecting the direction along the text direction of the document.
ことを特徴とする請求項1に記載の装置。 The apparatus according to claim 1, wherein the display control means displays the unit area on the UI screen so as to be distinguishable by a user according to an aspect ratio of the unit area.
ことを特徴とする請求項1から3の何れか一項に記載の装置。 The apparatus according to any one of claims 1 to 3, wherein the display control unit displays the unit area on the UI screen together with the scan image.
前記表示制御手段は、ユーザにより選択された前記入力エリアに応じた前記単位領域をユーザにより識別可能に前記UI画面に表示する
ことを特徴とする請求項1から4の何れか一項に記載の装置。 The UI screen has a plurality of input areas that can be input,
The display control unit according to any one of claims 1 to 4, wherein the unit area corresponding to the input area selected by the user is displayed on the UI screen so as to be distinguishable by the user. apparatus.
前記表示制御手段は、ユーザにより選択された前記入力エリアに従ってユーザにより識別可能に前記UI画面に表示する前記単位領域を切り替える
ことを特徴とする請求項1から4の何れか一項に記載の装置。 The UI screen has a plurality of input areas that can be input,
The apparatus according to any one of claims 1 to 4, wherein the display control means switches the unit area displayed on the UI screen so as to be distinguishable by the user according to the input area selected by the user. .
ことを特徴とする請求項1から6の何れか一項に記載の装置。 The apparatus according to any one of claims 1 to 6, wherein the display control means displays the unit area which can not be identified by the user as unselectable.
前記付帯情報は、前記スキャン画像を保存する際のファイル名であることを特徴とする請求項1から8の何れか一項に記載の装置。 The predetermined process is a process of storing data of the scan image,
The apparatus according to any one of claims 1 to 8, wherein the incidental information is a file name when the scanned image is stored.
前記付帯情報は、前記スキャン画像を保存する際のフォルダ名であることを特徴とする請求項1から8の何れか一項に記載の装置。 The predetermined process is a process of storing data of the scan image,
The apparatus according to any one of claims 1 to 8, wherein the incidental information is a folder name for storing the scan image.
前記付帯情報は、アップロード先を示すパス名であることを特徴とする請求項1から8の何れか一項に記載の装置。 The predetermined process is a process of uploading the data of the scanned image to a predetermined place,
The apparatus according to any one of claims 1 to 8, wherein the incidental information is a path name indicating an upload destination.
前記付帯情報は、FAX番号であることを特徴とする請求項1から8の何れか一項に記載の装置。 The predetermined process is a process of faxing data of the scanned image,
The apparatus according to any one of claims 1 to 8, wherein the incidental information is a fax number.
前記付帯情報は、メールアドレスであることを特徴とする請求項1から8の何れか一項に記載の装置。 The predetermined process is a process of transmitting data of the scan image by e-mail,
The apparatus according to any one of claims 1 to 8, wherein the incidental information is a mail address.
前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うためのUI画面を表示する表示制御手段と、
前記UI画面を介してユーザが選択した単位領域に対してOCR処理を行い、該OCR処理によって抽出された文字列を用いて前記所定の処理のための付帯情報を設定する設定手段と、
を備え、
前記表示制御手段は、前記文書の文章方向に沿う方向と交わる方向における前記単位領域の大きさに応じて該単位領域をユーザにより選択可能に前記UI画面に表示する
ことを特徴とする装置。 An apparatus for performing predetermined processing on a scanned image obtained by scanning a document,
Display control means for displaying a UI screen for performing the predetermined processing, in which a user can selectably display a unit area that is presumed to be a series of character strings in the scanned image;
Setting means for performing an OCR process on a unit area selected by the user via the UI screen, and setting additional information for the predetermined process using a character string extracted by the OCR process;
Equipped with
The display control means may display the unit area on the UI screen so as to be selectable by a user according to the size of the unit area in a direction intersecting the direction along the text direction of the document.
表示制御手段が、前記スキャン画像内の一続きの文字列と推認される単位領域をユーザが選択可能に表示した、前記所定の処理を行うためのUI画面を表示するステップと、
設定手段が、前記UI画面を介してユーザが選択した単位領域に対してOCR処理を行い、該OCR処理によって抽出された文字列を用いて前記所定の処理のための付帯情報を設定するステップと、
を含み、
前記表示するステップでは、前記文書の文章方向に沿う方向と交わる方向における前記単位領域の大きさに応じて該単位領域をユーザにより識別可能に前記UI画面に表示する
ことを特徴とする制御方法。 A control method of an apparatus for performing predetermined processing on a scanned image obtained by scanning a document, comprising:
Displaying a UI screen for performing the predetermined processing, in which the display control means displays a unit area that is considered as a series of character strings in the scan image in a selectable manner by the user;
The setting unit performs an OCR process on a unit area selected by the user via the UI screen, and sets additional information for the predetermined process using a character string extracted by the OCR process; ,
Including
And displaying the unit area on the UI screen so that the unit area can be identified by the user according to the size of the unit area in a direction intersecting the direction along the text direction of the document.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017193615A JP2019068323A (en) | 2017-10-03 | 2017-10-03 | Device for setting file name for scanned image, control method thereof and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017193615A JP2019068323A (en) | 2017-10-03 | 2017-10-03 | Device for setting file name for scanned image, control method thereof and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019068323A true JP2019068323A (en) | 2019-04-25 |
Family
ID=66340824
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017193615A Pending JP2019068323A (en) | 2017-10-03 | 2017-10-03 | Device for setting file name for scanned image, control method thereof and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2019068323A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021166365A (en) * | 2020-04-08 | 2021-10-14 | 京セラドキュメントソリューションズ株式会社 | Image processing apparatus and image forming apparatus |
| JP2023091487A (en) * | 2021-12-20 | 2023-06-30 | キヤノン株式会社 | Image processing device, image processing method and program |
| EP4380142A1 (en) * | 2022-11-30 | 2024-06-05 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium capable of storing electronic file including mask region with appropriate name |
-
2017
- 2017-10-03 JP JP2017193615A patent/JP2019068323A/en active Pending
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021166365A (en) * | 2020-04-08 | 2021-10-14 | 京セラドキュメントソリューションズ株式会社 | Image processing apparatus and image forming apparatus |
| JP7419942B2 (en) | 2020-04-08 | 2024-01-23 | 京セラドキュメントソリューションズ株式会社 | Image processing device and image forming device |
| JP2023091487A (en) * | 2021-12-20 | 2023-06-30 | キヤノン株式会社 | Image processing device, image processing method and program |
| US12456174B2 (en) | 2021-12-20 | 2025-10-28 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium storing program comprising acquiring an image generated by reading an original, and removing noise from an object region with a size smaller than a size specified in a first threshold |
| JP7765274B2 (en) | 2021-12-20 | 2025-11-06 | キヤノン株式会社 | Image processing device, image processing method, program, and storage medium |
| EP4380142A1 (en) * | 2022-11-30 | 2024-06-05 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium capable of storing electronic file including mask region with appropriate name |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6891073B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
| JP6968647B2 (en) | A device for setting a file name for a scanned image, its control method, and a program. | |
| JP6953230B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
| JP7034730B2 (en) | Devices, methods, and programs for setting information related to scanned images | |
| JP6983675B2 (en) | Devices, methods, programs, and systems for setting information related to scanned images | |
| JP7062388B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
| JP7476557B2 (en) | DEVICE, PROCESSING EXECUTION SYSTEM, PROCESSING EXECUTION METHOD, AND PROGRAM | |
| JP7030462B2 (en) | Image processing equipment, image processing methods, and programs that acquire character information from scanned images. | |
| US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
| JP6762722B2 (en) | Information processing equipment, control methods, and programs | |
| JP2020178286A (en) | Image processing device that displays guidance for user operation, its control method and program | |
| JP2020177521A (en) | Image processing device for character input using a touch panel, its control method and program | |
| JP2019114024A (en) | Device, method and program for setting information related to scan image | |
| JP7077127B2 (en) | Devices, methods, and programs for setting information related to scanned image data. | |
| JP6983687B2 (en) | Devices, methods, and programs for setting information related to scanned image data. | |
| JP2019068323A (en) | Device for setting file name for scanned image, control method thereof and program | |
| JP2020178283A (en) | Image processing device for character input using a touch panel, its control method and program | |
| JP2020178280A (en) | Image processing device for setting properties on scanned images, its control method and program | |
| JP2024040612A (en) | Information processing device, control method for information processing device, and program | |
| JP7387282B2 (en) | Image processing device that displays a preview of a scanned image, its control method, and program | |
| JP7150967B2 (en) | Apparatus, method, and program for setting information related to scanned images | |
| JP2021026604A (en) | Image processing device, image processing method and program | |
| JP2021164132A (en) | Image processing system and program | |
| JP6544985B2 (en) | FAX data management system, FAX data management method, and program | |
| JP2020177523A (en) | An image processing device that displays a preview of a scanned image, its control method, and a program. |