JP2019068406A - INFORMATION PROCESSING APPARATUS, METHOD, AND PROGRAM - Google Patents
INFORMATION PROCESSING APPARATUS, METHOD, AND PROGRAM Download PDFInfo
- Publication number
- JP2019068406A JP2019068406A JP2018139489A JP2018139489A JP2019068406A JP 2019068406 A JP2019068406 A JP 2019068406A JP 2018139489 A JP2018139489 A JP 2018139489A JP 2018139489 A JP2018139489 A JP 2018139489A JP 2019068406 A JP2019068406 A JP 2019068406A
- Authority
- JP
- Japan
- Prior art keywords
- file
- character
- image
- information processing
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Facsimiles In General (AREA)
Abstract
【課題】検索可能なファイルであることを通知するためのコマンドを用いることなく、ファイルが検索可能なファイルであるかを高精度に判定すること。【解決手段】本発明は、ファイルに含まれる画像オブジェクト内の文字領域を抽出する第1抽出手段と、前記第1抽出手段により抽出された文字領域と、前記ファイルに含まれる文字オブジェクトが描画された領域との位置関係に基づき、前記ファイルが、画像と、該画像に対応する文字認識の結果とを含む検索可能なファイルであるか否かを判定する第1判定手段と、前記第1判定手段により、前記ファイルが検索可能なファイルでないと判定されたことに応じて、前記画像オブジェクトに対する文字認識処理を実行し、該文字認識処理の結果を含むファイルを生成する生成手段とを有することを特徴とする情報処理装置である。【選択図】図4To accurately determine whether a file is a searchable file without using a command for notifying that the file is a searchable file. According to the present invention, first extracting means for extracting a character area in an image object included in a file, a character area extracted by the first extracting means, and a character object included in the file are drawn. Determination means for determining whether or not the file is a searchable file including an image and a character recognition result corresponding to the image, based on a positional relationship with the region, and the first determination Means for executing character recognition processing on the image object in response to determining that the file is not a searchable file, and generating a file including a result of the character recognition processing. This is a characteristic information processing device. [Selection diagram] Figure 4
Description
本発明は、ファイル内の画像中の文字列を認識して、検索可能なファイルを生成する情報処理装置、方法、及びプログラムに関する。 The present invention relates to an information processing apparatus, method, and program for recognizing a character string in an image in a file and generating a searchable file.
従来、文字列を検索可能なサーチャブルPDFファイル(以下SPDFファイル)を作成するソフトウェアがある。図2にSPDFファイルの一例を示す。SPDFファイル201には、スキャン画像202が含まれる。さらに、SPDFファイル201には、スキャン画像に重なるように、該スキャン画像内の文字画像の位置に合わせて透明な文字列が埋め込まれている。例えば、スキャン画像内の文字画像203の前面または背面に、透明な文字列「200,000」が配置されるように、その文字列の文字コードがPDF(PortableDocumentFormat)ファイルに記述される。また、図示していないが、スキャン画像内の文字画像203以外の全ての文字画像に対応する透明な文字列の文字コードもPDFファイルに記述されている。スキャン画像内の文字画像だけでは、文字列の検索を行うことはできないが、文字認識処理の結果得られる文字コードを透明な文字列として、文字画像と対応する位置に埋め込むことで、スキャン画像の見た目を変更することなく、文字列の検索を可能とする。このように、SPDFファイルを作成するソフトウェアは、スキャン画像に対して文字認識処理を行い、その結果得られる文字コードを透明な文字列としてPDFファイルに追加する。
Conventionally, there is software for creating a searchable PDF file (hereinafter referred to as SPDF file) that can search for character strings. An example of the SPDF file is shown in FIG. The
SPDFファイルを作成するソフトウェアがインストールされたPCは、複写機やソフトウェアで作成されたスキャン画像、または画像を含むPDFファイルを受け取り、該受け取ったデータを用いてSPDFファイルを作成する。しかし、例えば複写機によっては複写機自体がSPDFファイルを作成することも可能であり、SPDFファイルを作成するソフトウェアを実行するPCへの入力データとして、複写機を含む該PC以外の装置で作成されたSPDFファイルが入力される場合がある。尚、本明細書で「入力データ」とは、SPDFファイルを作成する際の作成元のデータを意味し、入力データに基づいてSPDFファイルが作成される。入力データとして例えば、複写機が作成するスキャン画像、又は、スキャン画像等の画像を含むPDFファイル若しくはSPDFファイル等が考えられる。 The PC on which the software for creating the SPDF file is installed receives the scanned image created by the copying machine or software, or the PDF file including the image, and creates the SPDF file using the received data. However, for example, depending on the copying machine, it is possible for the copying machine itself to create the SPDF file, and the input data to the PC that executes the software for creating the SPDF file is created by an apparatus other than the PC including the copying machine SPDF files may be input. In the present specification, “input data” means data of the creation source when creating the SPDF file, and the SPDF file is created based on the input data. As input data, for example, a scanned image created by a copying machine, or a PDF file or an SPDF file including an image such as a scanned image can be considered.
ここで、SPDFのファイル拡張子は、サーチャブル化されていないPDFのファイル拡張子と同じく「pdf」であるので、ファイル拡張子に基づいて、入力データのPDFファイルがSPDFファイルであるか否か判定することができないという問題が生じる。 Here, since the file extension of SPDF is “pdf” as well as the file extension of PDF that is not searchable, it is determined whether the PDF file of the input data is an SPDF file based on the file extension. The problem arises that you can not
この問題を解決するための1つの方法として、特許文献1には、検索可能なファイルであることを通知するためのコマンドをファイルに埋め込むことで、PDFファイルがSPDFファイルであるか否かの判定を可能とする技術が開示されている。
As one method for solving this problem,
しかしながら、SPDFファイルを作成する既存のソフトウェアや複写機は、SPDFファイルであることを通知するためのコマンドをファイルに埋め込む特許文献1のような機能を有さない。その理由は、PDFフォーマットの定義の中に、SPDFファイルであるか否かを識別するための定義がないためである。このようなコマンドをファイルに埋め込む機能を有さない既存のソフトウェア等を用いて作成、送信されたPDFファイルについては、該PDFファイルが入力された装置側で入力データのPDFファイルがSPDFファイルであるか否かを判定することはできない。
However, existing software and copiers that create SPDF files do not have the function as in
また、単純に、入力データ内に透明文字列があるか否かを基準として、入力データがSPDFファイルであるか否かを判定することも考えられるが、以下の理由からその判定基準は適切ではない。図3は、画像の内容と関係のない透明文字列が埋め込まれている一例を示す図である。ユーザーの運用によっては、ユーザーを識別するためのID等の情報を、透明文字列302として画像に埋め込むことがある。このように、スキャン画像内の文字画像とは関係のない透明文字列がファイル内に存在するケースがあるため、入力データ内に透明文字列があるか否かを基準として、入力データがSPDFファイルであるか否かを判定することは、精度の観点から適切ではない。
Also, it is conceivable to simply determine whether or not the input data is an SPDF file based on whether or not there is a transparent character string in the input data, but for the following reasons, the determination criterion is appropriate. Absent. FIG. 3 is a view showing an example in which a transparent character string unrelated to the content of the image is embedded. Depending on the operation of the user, information such as an ID for identifying the user may be embedded in the image as a
そこで本発明は、上記の課題に鑑み、検索可能なファイルであることを通知するためのコマンドを用いることなく、ファイルが検索可能なファイルであるかを高精度に判定することを目的とする。 Therefore, in view of the above problems, it is an object of the present invention to determine with high accuracy whether a file is a searchable file without using a command for notifying that the file is a searchable file.
本発明は、ファイルに含まれる画像オブジェクト内の文字領域を抽出する第1抽出手段と、前記第1抽出手段により抽出された文字領域と、前記ファイルに含まれる文字オブジェクトが描画された領域との位置関係に基づき、前記ファイルが、画像と、該画像に対応する文字認識の結果とを含む検索可能なファイルであるか否かを判定する第1判定手段と、前記第1判定手段により、前記ファイルが検索可能なファイルでないと判定されたことに応じて、前記画像オブジェクトに対する文字認識処理を実行し、該文字認識処理の結果を含むファイルを生成する生成手段とを有することを特徴とする情報処理装置である。 According to the present invention, a first extraction unit for extracting a character area in an image object included in a file, a character area extracted by the first extraction unit, and an area in which a character object included in the file is drawn A first determination unit that determines whether the file is a searchable file including an image and a result of character recognition corresponding to the image based on a positional relationship; and the first determination unit Information characterized by performing character recognition processing on the image object in response to the determination that the file is not a searchable file, and generating a file including the result of the character recognition processing It is a processing device.
本発明により、検索可能なファイルであることを通知するためのコマンドを用いることなく、ファイルが検索可能なファイルであるかを高精度に判定することが可能になる。 According to the present invention, it is possible to determine with high accuracy whether a file is a searchable file without using a command for notifying that the file is a searchable file.
[実施例1]
<システムの構成について>
以下、本実施例におけるシステムの構成について、図1を用いて説明する。
Example 1
<About the system configuration>
Hereinafter, the configuration of the system in the present embodiment will be described with reference to FIG.
図1(a)は、本実施例におけるシステムを示すブロック図である。図示するように、システム100は、画像形成可能な複写機110と、情報処理装置120とを有する。複写機110と情報処理装置120とは有線又は無線で通信可能に接続されており、互いにデータを送受信することが可能である。
FIG. 1A is a block diagram showing a system in the present embodiment. As shown, the
図1(b)は、複写機110の機能構成を示すブロック図である。複写機110は、スキャナ部111と、送受信部112と、プリンタ部113と、制御部114とを有する。
FIG. 1B is a block diagram showing a functional configuration of the
図1(c)は、情報処理装置120の機能構成を示すブロック図である。情報処理装置120は、送受信部121と、保存部122と、制御部123と、表示部124と、受付部125とを有する。情報処理装置120は、CPUと、ROMやハードディスク等の記憶媒体と、RAM等の一時記憶媒体とを内部に有し、該ROMに格納されているプログラムが該RAMにロードされ、該CPUが該ロードされたプログラムを実行する。これにより、図1(c)に示す各構成が実現され、当該各構成による処理が実行される。尚、受付部125は、キーボードとマウスとを含む形態が一般的であるが、この形態に限られない。またここでは、表示部124と受付部125とは別個の構成としているが、表示部124及び受付部125は、例えばタッチパネル等によって一体的に実現されても良い。
FIG. 1C is a block diagram showing a functional configuration of the
<文書のスキャンからSPDFファイルの作成までの流れについて>
以下、複写機110で文書をスキャンして、情報処理装置120でSPDFファイルを作成する流れについて説明する。複写機110のスキャナ部111が文書をスキャンすると、スキャン画像(スキャン画像データとも言う。)が作成される。作成されたスキャン画像を、送受信部112が情報処理装置120に送信する。すると、情報処理装置120の送受信部121がスキャン画像を受信し、制御部123は、該受信したスキャン画像を保存部122に保存する。
<Flow from document scanning to creation of SPDF file>
The flow of scanning a document by the copying
ユーザーが受付部125を介して、保存部122に保存されている1又は複数のスキャン画像の中から、1つのスキャン画像を選択する。すると、制御部123は、そのスキャン画像を表示部124に表示する。
The user selects one scan image from the one or more scan images stored in the
ユーザーが受付部125を介して、表示部124に表示されたスキャン画像に基づくSPDFファイルの作成を指示する。すると、制御部123は、スキャン画像に対し、下記の処理、即ち(1)〜(5)に示す領域分割、(6)に示す文字認識、及び(7)に示す透明文字列の埋め込みを実行することでSPDFファイルを作成し、該作成したSPDFファイルを保存部122に保存する。
The user instructs creation of the SPDF file based on the scan image displayed on the
<スキャン画像に基づくSPDFファイル作成処理について>
以下、スキャン画像に基づきSPDFファイルを作成する処理について詳しく説明する。
<About SPDF file creation processing based on scanned image>
The process of creating the SPDF file based on the scanned image will be described in detail below.
(1)2値化
制御部123は、スキャン画像に対して2値化を行うことにより、黒画素と白画素のみから成る2値画像を得る。2値化により、スキャン画像における所定の閾値以上の濃度値を有する画素は黒画素、該所定の閾値未満の濃度値を有する画素は白画素となる。尚、以下では、スキャン画像が100DPIであるものとして説明を行うが、スキャン画像がこの解像度に限られないことは言うまでもない。
(1) The
(2)黒画素塊の検出
制御部123は、2値画像に対して8連結で繋がる黒画素の輪郭を追跡することにより、8方向の何れかの方向で連続して存在する黒画素の塊(黒画素塊とする。)を検出する。8連結とは、左上、左、左下、下、右下、右、右上、上の8つの方向の何れかで、同色(今回のケースでは黒)の画素が連続しているという意味である。一方、4連結とは、左、下、右、上の4つの方向の何れかで同色の画素が連続しているという意味である。本実施例では、8方向に存在する8つの隣接画素の何れもが黒画素ではない単独の黒画素が、黒画素塊として検出されることはない。一方、8方向に存在する8つの隣接画素の何れか1つにでも黒画素が存在する黒画素は、その隣接する黒画素と共に、黒画素塊として検出されることになる。図12の符号1201は、制御部123が検出した黒画素塊の一例を示す。
(2) The black pixel block
また制御部123は、検出した黒画素塊の外接矩形の位置情報、具体的には、外接矩形の四頂点夫々のX座標、Y座標を導出する。尚、X軸は右方向に伸び、Y軸は下方向に伸びているものとする。図12の符号1202は黒画素塊1201の外接矩形を示す。尚、本明細書で特に断り無く「矩形」と表現したときは、斜め向きの矩形は含まれず、四辺の全てがX軸とY軸との何れかと平行な矩形を表すものとする。
The
(3)表領域の検出
制御部123は、検出した黒画素塊の夫々について、以下に示す3つの条件を全て満たすか判定し、3つの条件を全て満たす黒画素塊を、表の枠線を構成する黒画素塊と判定する。以下、3つの条件について説明する。
(3) The
第1の条件は、黒画素塊の外接矩形の幅が所定の閾値以上であり、かつ、該外接矩形の高さが所定の閾値以上であることである。本明細書で、「幅」はX方向の長さを、「高さ」はY方向の長さを指すものとする。尚、本実施例では、幅及び高さがともに、100画素に相当する0.25cm以上であるか判定する。 The first condition is that the width of the circumscribed rectangle of the black pixel block is equal to or greater than a predetermined threshold, and the height of the circumscribed rectangle is equal to or greater than the predetermined threshold. In the present specification, “width” refers to the length in the X direction, and “height” refers to the length in the Y direction. In this embodiment, it is determined whether the width and the height are both 0.25 cm or more, which corresponds to 100 pixels.
第2の条件は、外接矩形内部における黒画素塊の充填率が所定の閾値以下であることである。尚、本実施例では、黒画素塊の外接矩形に占める割合が20%以下であるか判定する。 The second condition is that the filling factor of the black pixel block inside the circumscribed rectangle is equal to or less than a predetermined threshold. In this embodiment, it is determined whether the proportion of black pixel blocks in the circumscribed rectangle is 20% or less.
第3の条件は、黒画素塊の最大幅と外接矩形の幅との間の差、及び、黒画素塊の最大高さと外接矩形の高さとの間の差が何れも小さいことである。具体的には、黒画素塊の最大幅と外接矩形の幅との間の差が所定の閾値以下であり、かつ、黒画素塊の最大高さと外接矩形の高さとの間の差が所定の閾値以下であることである。尚、本実施例では、黒画素塊の最大幅と外接矩形の幅との間の差、及び、黒画素塊の最大高さと外接矩形の高さと間の差がともに、10画素以下であるか判定する。 The third condition is that the difference between the maximum width of the black pixel block and the width of the circumscribed rectangle and the difference between the maximum height of the black pixel block and the height of the circumscribed rectangle are both small. Specifically, the difference between the maximum width of the black pixel block and the width of the circumscribed rectangle is less than or equal to a predetermined threshold, and the difference between the maximum height of the black pixel block and the height of the circumscribed rectangle is predetermined It is below the threshold. In the present embodiment, whether the difference between the maximum width of the black pixel block and the width of the circumscribed rectangle and the difference between the maximum height of the black pixel block and the height of the circumscribed rectangle are both 10 pixels or less judge.
制御部123は、黒画素塊の夫々について上述の第1〜第3の条件を全て満たすかの判定を行うことで、表の枠線を構成する黒画素塊であるかの判定を行い、表の枠線を構成する黒画素塊の外接矩形の位置情報を保存部122に保存する。このようにして保存された位置情報を持つ外接矩形の領域を表領域と呼ぶ。尚、図12に示すケースでは、表領域の検出の結果、黒画素塊1201が、表の枠線を構成する黒画素塊と判定され、外接矩形1202の領域が、表領域として検出されたものとする。尚、本実施例では、上述の第1〜第3の条件を全て満たす黒画素塊を、表の枠線を構成する黒画素塊と判定したが、判定条件はこれに限られない。例えば、第1〜第3の条件のうちの少なくとも1つを満たす黒画素塊を、表の枠線を構成する黒画素塊と判定しても良い。
The
(4)認識セルの特定
制御部123は、表領域内部の認識セルを特定する。ここで「認識セル」とは、表領域内部の白画素塊の外接矩形である。認識セルを特定するためには、表領域内部の白画素の輪郭を追跡することにより、白画素塊を検出する必要がある。その上で、制御部123は、検出した白画素塊の夫々について、以下に示す3つの条件を満たすか判定し、3つの条件を全て満たす白画素塊の外接矩形を、認識セルとして特定する。
(4) Identification Control Unit of Recognition Cell The
第1の条件は、白画素塊の外接矩形の幅が所定の閾値以上であり、かつ該外接矩形の高さが所定の閾値以上であることである。尚、本実施例では、幅及び高さがともに、20画素以上であるか判定する。 The first condition is that the width of the circumscribed rectangle of the white pixel block is equal to or greater than a predetermined threshold, and the height of the circumscribed rectangle is equal to or greater than the predetermined threshold. In this embodiment, it is determined whether the width and height are both 20 pixels or more.
第2の条件は、外接矩形内部における黒画素塊の充填率が所定の閾値以下であることである。尚、本実施例では、黒画素塊の外接矩形に占める割合が20%以下であるか判定する。 The second condition is that the filling factor of the black pixel block inside the circumscribed rectangle is equal to or less than a predetermined threshold. In this embodiment, it is determined whether the proportion of black pixel blocks in the circumscribed rectangle is 20% or less.
第3の条件は、白画素塊の最大幅と外接矩形の幅との間の差、及び、白画素塊の最大高さと外接矩形の高さとの間の差が何れも小さいことである。具体的には、白画素塊の最大幅と外接矩形の幅との間の差が所定の閾値以下であり、かつ、白画素塊の最大高さと外接矩形の高さとの間の差が所定の閾値以下であることである。尚、本実施例では、白画素塊の最大幅と外接矩形の幅との間の差、及び、白画素塊の最大高さと外接矩形の高さとの間の差がともに、5画素以下であるか判定する。 The third condition is that the difference between the maximum width of the white pixel block and the width of the circumscribed rectangle and the difference between the maximum height of the white pixel block and the height of the circumscribed rectangle are both small. Specifically, the difference between the maximum width of the white pixel block and the width of the circumscribed rectangle is less than or equal to a predetermined threshold, and the difference between the maximum height of the white pixel block and the height of the circumscribed rectangle is predetermined It is below the threshold. In the present embodiment, the difference between the maximum width of the white pixel block and the width of the circumscribed rectangle and the difference between the maximum height of the white pixel block and the height of the circumscribed rectangle are both 5 or less. Determine if
図12の符号1203、1204は、制御部123が特定した認識セルを示す。制御部123は、特定した認識セルの位置情報を保存部122に保存する。
尚、本実施例では、上述の第1〜第3の条件を全て満たす白画素塊の外接矩形を、認識セルとして特定したが、判定条件はこれに限られない。例えば、第1〜第3の条件のうちの少なくとも1つを満たす白画素塊の外接矩形を、認識セルとして特定しても良い。 In the present embodiment, the circumscribed rectangle of the white pixel block satisfying all of the above-described first to third conditions is specified as the recognition cell, but the determination condition is not limited to this. For example, a circumscribed rectangle of a white pixel block satisfying at least one of the first to third conditions may be specified as a recognition cell.
(5)認識セル内の文字領域の特定
制御部123は、各認識セルの内部に、その各認識セルに内接する白画素塊によって囲まれた黒画素塊があるか判定する。そして、黒画素塊があると判定した場合、あると判定された全ての黒画素塊に対する外接矩形を設定する。
(5) The
さらに、制御部123は、1つの認識セルの中に複数の外接矩形を設定した場合に、外接矩形同士の距離が所定の閾値以下であるか判定する。具体的には、制御部123は、外接矩形を1つずつ選択し、選択した外接矩形からの距離が所定の閾値以下となる外接矩形を検出する。例えば、外接矩形同士の距離が20画素以下であるか判定する。
Furthermore, when a plurality of circumscribed rectangles are set in one recognition cell, the
さらに、制御部123は、そのような外接矩形を検出した場合、検出した外接矩形と、選択した外接矩形とを統合する。つまり、制御部123は、これら両方の外接矩形に外接する新たな外接矩形を設定するとともに、選択した外接矩形と、検出した外接矩形とを削除する。
Furthermore, when such a circumscribed rectangle is detected, the
新たな外接矩形の設定、2つの外接矩形の削除が完了した後、制御部123は、その認識セル内の外接矩形をまた初めから1つずつ選択し、互いの間の距離が所定の閾値以下の外接矩形同士を統合していく。以上の処理を繰り返す。即ち、互いの間の距離が所定の閾値以下の外接矩形が無くなるまで、外接矩形同士の統合が繰り返される。
After setting of a new circumscribed rectangle and deletion of two circumscribed rectangles are completed, the
以上の通り、本実施例では、1つの認識セルの内部に存在する外接矩形同士の統合を行うが、認識セルをまたぐ外接矩形同士の統合を行わない。 As described above, in this embodiment, the circumscribed rectangles present inside one recognition cell are integrated, but the circumscribed rectangles straddling the recognition cell are not integrated.
以上の処理が終わって依然として設定されている外接矩形は、文字領域(又はテキストブロック)と呼ばれる。以上の処理を認識セル内の文字領域の特定と呼ぶ。制御部123は、認識セルの内部に存在する文字領域の位置情報を、該認識セルに関連付けて保存部122に保存する。
The circumscribed rectangle that has been set up after the above processing is called a character area (or text block). The above processing is called identification of a character area in a recognition cell. The
図12のケースでは、符号1205、1206が文字領域を示している。文字領域1205の位置情報は、認識セル1203に関連付けられて保存部122に保存される。また、文字領域1206の位置情報は、認識セル1204に関連付けられて保存部122に保存される。
In the case of FIG. 12,
(6)文字認識
制御部123は、各文字領域に対して文字認識を行うことによって、各文字領域に対応する認識文字を取得する。ここで「認識文字」とは、オリジナル文字(スキャン画像中の文字画像のこと)を文字認識することで得られる文字コードであり、認識文字が透明文字列としてPDFファイルに埋め込まれる。文字認識で取得された認識文字は、対応する文字領域と関連付けられて保存部122に保存される。そうすることによって、認識文字は、文字領域と予め関連付けられている認識セルとも関連付けられることになる。文字認識を行わない場合、もしくは文字認識に失敗した場合は、文字領域に関連付けられる認識文字はない。
(6) The character
また、文字認識を行う際に、認識率も取得する場合がある。認識率は、文字を正しく認識できたかを示す指標であり、認識文字と関連付けられて保存部122に保存される。
Moreover, when performing character recognition, a recognition rate may be acquired. The recognition rate is an index indicating whether the character has been correctly recognized, and is stored in the
(7)透明文字列の埋め込み
制御部123は、入力データが画像の場合は、まず新規にPDFファイルを作成して、その中にスキャン画像を格納する一方、入力データがPDFファイルの場合は、PDFファイルに含まれる透明文字列を一旦全て削除する。その後、制御部123は、上述の(6)文字認識で取得した認識文字を、対応する文字領域の位置に、透明文字列としてPDFファイルに追加する。
(7) When the input data is an image, the transparent character string embedding
尚、ここでは上述の(1)〜(7)の処理を、情報処理装置120の制御部123が実行する場合について説明したが、これらの処理を、複写機110の制御部114で実行しても構わない。その場合は、複写機110がSPDFファイルを作成することになる。
Here, although the case where the
<PDFファイル判定処理を伴うSPDFファイル作成処理について>
以下、入力データに基づくSPDFファイル作成をユーザーが指示した場合に実行される、入力データのPDFファイルがSPDFファイルか判定するPDFファイル判定処理を伴うSPDFファイル作成処理について、図4を用いて説明する。
<About SPDF file creation processing with PDF file determination processing>
Hereinafter, SPDF file creation processing accompanied by PDF file determination processing for determining whether the PDF file of input data is an SPDF file, which is executed when the user instructs creation of an SPDF file based on input data, will be described using FIG. .
ステップS401において、制御部123は、入力データがPDFファイルの場合に、該PDFファイル内にページサイズ相当の画像が含まれているか判定することで、該PDFファイルにスキャン画像が含まれているか判定する。PDFファイルにページサイズ相当の画像が含まれている場合、該PDFファイルにスキャン画像が含まれていると判定してステップS404に進む。一方、PDFファイルにページサイズ相当の画像が含まれていない場合、該PDFファイルにスキャン画像が含まれていないと判定してステップS402に進む。具体的に本実施例では、ステップS401において、まずPDFファイルからページの幅x[mm]と高さy[mm]とを取得した上で、次に、幅がx−5[mm]以上であって、かつ高さがy−5[mm]以上の画像がPDFファイル内にあるか判定する。ここで5は、許容可能な誤差である。このように本ステップでは、スキャン画像からPDFファイルを作成する際に余白が入る場合があることを考慮している。つまり、ページサイズと画像サイズとが完全に一致しなくても、ある程度ページサイズに近いサイズの画像があれば、PDFファイルにスキャン画像が含まれていると判定する。尚、本実施例では、許容可能な誤差を5[mm]に設定したが、この値はスキャン環境に応じて適宜変更して構わない。
In step S401, when the input data is a PDF file, the
まず、PDFファイル内にページサイズ相当の画像が含まれていない(ステップS401でNOの場合)について説明する。この場合、ステップS402において、制御部123は、入力データのPDFファイルがSPDFファイルではないと判定する。次いで、ステップS403において、制御部123は、入力データに対してOCR処理を実行し、その結果得られる文字コードを透明文字列として埋め込むことでSPDFファイルを作成し、該作成したSPDFファイルを保存部122に保存する。
First, the case where the image corresponding to the page size is not included in the PDF file (in the case of NO at step S401) will be described. In this case, in step S402, the
続いて、PDFファイル内にページサイズ相当の画像が含まれている場合(ステップS401でYES)について説明する。この場合、ステップS404において、制御部123は、画像に対して領域分割を実行することで文字領域を抽出する。本ステップで得た文字領域の総数をN個とする。
Next, the case where the image of the page size is included in the PDF file (YES in step S401) will be described. In this case, in step S404, the
ステップS405において、制御部123は、透明文字列と位置及びサイズが一致する文字領域をカウントするためのパラメータXを初期化して0に設定する。
In step S405, the
ステップS406において、制御部123は、未チェックの文字領域の1つに着目する(着目文字領域の選択)。
In step S406, the
ステップS407において、制御部123は、位置及びサイズが着目文字領域のそれらと一致する透明文字列が存在するか判定する。本ステップでは、画像オブジェクト内の文字領域と、文字オブジェクト(具体的には透明文字列)が描画された領域との位置関係を見ている。ステップS407の判定結果が真の場合、ステップS408に進む一方、該判定結果が偽の場合、ステップS409に進む。尚、本ステップにおいて、スキャンのズレ等も考慮し、位置及びサイズが完全に一致していなくても、着目文字領域の位置及びサイズが透明文字列の位置及びサイズと一致すると判定しても良い。例えば、±1mm程度の範囲内の差異があったとしても、一致すると判定しても良い。
In step S407, the
ステップS407でYESの場合、ステップS408において、制御部123は、Xをインクリメントし、ステップS409に進む。これに対し、ステップS407でNOの場合、Xをインクリメントすることなく、ステップS409に進む。
If YES in step S407, the
ステップS409において、制御部123は、全ての文字領域をチェックしたか判定する。ステップS409の判定結果が真の場合、ステップS410に進む一方、該判定結果が偽の場合、ステップS406に戻る。
In step S409, the
このように本実施例では、ステップS405〜ステップS409において、文字領域のうち、位置及びサイズが透明文字列と一致するものが何個あるかをカウントしている。 As described above, in this embodiment, in steps S405 to S409, it is counted how many positions and sizes of the character areas match the transparent character string.
ステップS410において、制御部123は、以下の式(1)を満たすか判定する。ステップS410の判定結果が真の場合、ステップS411に進む一方、該判定結果が偽の場合、ステップS413に進む。
In step S410, the
式(1)において、Sは、入力データがSPDFファイルであるか判定するための閾値であって、位置及びサイズが透明文字列と一致する文字領域の数がいくつより大きいときに、入力データがSPDFファイルと判定するための閾値である。本実施例では、Sを0.9に設定した。Sを0.9に設定したということは、文字領域のうちの、位置及びサイズが透明文字列と一致する文字領域の割合が90%より大きければ、入力データがSPDFファイルと判定されることを意味する。Sを1.0ではなく0.9とした理由は、環境に応じたスキャン精度の低下等が原因で、常に100%の認識率で文字を認識できるわけではないことを考慮しているためである。尚、Sの値は当然、環境に応じて変更して構わない。 In Equation (1), S is a threshold value for determining whether the input data is a SPDF file, and the input data is a threshold when the number of character areas whose position and size match the transparent character string is greater than This is a threshold for determining an SPDF file. In the present embodiment, S is set to 0.9. Setting S to 0.9 means that the input data is determined to be an SPDF file if the ratio of the character area whose position and size match the transparent character string among the character areas is greater than 90%. means. The reason why S is set to 0.9 instead of 1.0 is because it takes into consideration that characters can not always be recognized with a recognition rate of 100% because of a decrease in scan accuracy according to the environment, etc. is there. Of course, the value of S may be changed according to the environment.
式(1)を満たす場合(ステップS410でYES)、ステップS411において、制御部123は、入力データがSPDFファイルと判定する。次いで、ステップS412において、制御部123は、SPDFファイルを作成し直すことなく、入力データのSPDFファイルをそのまま保存部122に保存し、一連の処理は終了する。
If equation (1) is satisfied (YES in step S410), in step S411,
これに対し、式(1)を満たさない場合(ステップS410でNO)、ステップS413において、制御部123は、入力データがSPDFファイルではないと判定する。次いで、ステップS414において、制御部123は、入力データに対してOCR処理を実行し、OCR処理の結果取得する文字コードを透明文字列として埋め込むことでSPDFファイルを作成し、該作成したSPDFファイルを保存部122に保存する。以上が、本実施例における、PDFファイル判定処理を伴うSPDFファイル作成処理の内容である。
On the other hand, when the equation (1) is not satisfied (NO in step S410), in step S413, the
本実施例により、検索可能なファイルであることを通知するためのコマンドを用いることなく、入力データのPDFファイルがSPDFファイルであるかを高精度に判定することができる。また、入力データが既にSPDFファイルであった場合は、該SPDFファイルをそのまま保存部に保存しSPDFファイルを作成し直すことがない。従って、無駄な処理を減らすことができる。 According to this embodiment, it is possible to determine with high accuracy whether the PDF file of the input data is an SPDF file without using a command for notifying that the file is a searchable file. If the input data is already an SPDF file, the SPDF file is stored as it is in the storage unit and the SPDF file is not re-created. Therefore, unnecessary processing can be reduced.
[実施例2]
本実施例では、入力データがSPDFファイルと判定された場合(ステップS410でYES→ステップS411)に、SPDFファイルを作成し直すか否かをユーザーに選択させる。尚、以下では既述の実施例との差分について主に説明し、既述の実施例と同様の内容については説明を適宜省略する。
Example 2
In the present embodiment, when it is determined that the input data is an SPDF file (YES in step S410 → step S411), the user is made to select whether or not to re-create the SPDF file. In the following, differences from the above-described embodiment will be mainly described, and the description of the same contents as the above-described embodiment will be appropriately omitted.
入力データが既にSPDFファイルだったとしても、情報処理装置120で文字認識をやり直すことで、文字認識の精度が向上する場合がある。例えば情報処理装置120に搭載されている文字認識エンジンが優れていれば、情報処理装置120で文字認識をやり直すことで、文字認識の精度が向上する可能性がある。一方で、元々SPDFファイルを作成した文字認識エンジンの方が情報処理装置120に搭載されている文字認識エンジンより優れていれば、情報処理装置120で文字認識をやり直しても文字認識の精度が向上することはない。また、文字認識は処理にある程度の時間を要するため、パフォーマンスの観点から、常にSPDFファイルを作成し直すことは好ましくない。このように、SPDFファイルを作成し直すことには一長一短があり、そのメリット及びデメリットもユーザー環境に依存するため、SPDFファイルを作成し直すか否かをユーザーが選択できるようにする。
Even if the input data is already an SPDF file, the character recognition accuracy may be improved by re-doing the character recognition in the
以下、本実施例における処理について、図5を用いて説明する。 Hereinafter, the process in the present embodiment will be described with reference to FIG.
ステップS411で、入力データがSPDFファイルと判定された場合、ステップS501において、制御部123は、SPDFファイルを作成し直すか否かをユーザーに選択させるためのダイアログを、表示部124に表示する。図6は、本ステップで表示されるダイアログの一例を示す図である。ダイアログ601は、SPDFファイルを作成し直すか否かを問うメッセージ602を有する。また、ダイアログ601は、SPDFファイルを作成する場合にユーザーが押下するYesボタン603、及び、SPDFファイルを作成しない場合にユーザーが押下するNoボタン604を有する。
If it is determined in step S411 that the input data is an SPDF file, in step S501, the
ステップS502において、制御部123は、ダイアログ601のYesボタン603が押下されたか判定する。ステップS502の判定結果が真の場合、ステップS503に進む一方、該判定結果が偽の場合(即ち、Noボタン604が押下された場合)、ステップS412に進む。
In step S502, the
YESボタン603が押下された場合(ステップS502でYES)、ステップS503において、制御部123は、SPDFファイルを作成し直し、該作成し直したSPDFファイルを保存部122に保存する。
When the YES button 603 is pressed (YES in step S502), in step S503, the
本実施例により、入力データがSPDFファイルと判定された場合に、SPDFファイルを作成し直すかどうかをユーザーに選択させることが可能になる。 According to the present embodiment, when the input data is determined to be an SPDF file, it is possible to allow the user to select whether to re-create the SPDF file.
[実施例3]
本実施例では、SPDFファイルを作成し直す際に、画像の内容と無関係な透明文字列を削除せずに残す。
[Example 3]
In this embodiment, when the SPDF file is re-created, the transparent character string irrelevant to the content of the image is left without being deleted.
入力データのSPDFファイルに基づいてSPDFファイルを作成し直す場合は通常、元々埋め込まれている透明文字列を一旦削除し、新たに取得した文字コードを透明文字列として埋め込む。しかしこのような処理を図3のような画像の内容と無関係な透明文字列が存在するSPDFファイルに対して実行した場合、該透明文字列は、削除されたまま消えてしまうことになる。そのため本実施例では、透明文字列を一旦削除する際に、画像の内容と無関係な透明文字列を削除しないようにする。以下、本実施例におけるSPDFファイルを作成し直す処理について、図7を用いて説明する。 When recreating the SPDF file based on the SPDF file of the input data, normally, the originally embedded transparent character string is once deleted, and the newly acquired character code is embedded as the transparent character string. However, when such a process is performed on an SPDF file having a transparent character string unrelated to the content of the image as shown in FIG. 3, the transparent character string will be deleted and disappear. Therefore, in the present embodiment, when the transparent character string is once deleted, the transparent character string unrelated to the content of the image is not deleted. Hereinafter, the process of creating the SPDF file again in the present embodiment will be described with reference to FIG.
まずステップS701において、制御部123は、入力データの画像に対して領域分割、文字認識を行い、その結果得られる情報を保存部122に保存しておく。
First, in step S701, the
ステップS702において、制御部123は、未チェックの透明文字列の1つに着目する(着目透明文字列の選択)。
In step S702, the
ステップS703において、制御部123は、着目透明文字列の位置及びサイズがステップS701で取得した文字領域の何れかの位置及びサイズと一致するか判定する。ステップS703の判定結果が真の場合、ステップS704に進む一方、該判定結果が偽の場合、ステップS706に進む。尚、本ステップにおいて、スキャンのズレ等も考慮し、位置及びサイズが完全に一致していなくても、着目透明文字列の位置及びサイズが文字領域の何れかの位置及びサイズと一致すると判定しても良い。
In step S703, the
着目透明文字列の位置及びサイズが文字領域の1つと一致する場合(ステップS703でYES)、ステップS704において、制御部123は、着目透明文字列が画像の内容と関係する透明文字列、つまり検索用の透明文字列と判定する。次いで、ステップS705において、制御部123は、着目透明文字列を削除し、ステップS707に進む。
If the position and size of the target transparent character string match one of the character areas (YES in step S703), in step S704, the
これに対し、着目透明文字列の位置及びサイズと一致する位置及びサイズを有する文字領域が存在しない場合(ステップS703でNO)、ステップS706において、制御部123は、着目透明文字列が画像の内容と無関係な透明文字列と判定する。次いで、ステップS707に進む。
On the other hand, when there is no character area having a position and size matching the position and size of the target transparent character string (NO in step S703), in step S706, the
ステップS707において、制御部123は、全ての透明文字列をチェックしたか判定する。ステップS707の判定結果が真の場合、ステップS708に進む一方、該判定結果が偽の場合、ステップS702に戻る。
In
ステップS708において、制御部123は、文字認識で取得した文字コードを透明文字列として追加する。以上が、本実施例におけるSPDFファイルを作成し直す処理の内容である。
In
本実施例により、SPDFファイルを作成し直す際に、画像の内容と無関係な透明文字列を削除せずに残すことができる。 According to this embodiment, when the SPDF file is re-created, it is possible to leave the transparent character string unrelated to the content of the image without deleting it.
[実施例4]
本実施例では、画像の内容と無関係な透明文字列を削除せずに残すか否かをユーザーが選択できるようにする。
Example 4
In this embodiment, it is possible for the user to select whether or not the transparent character string irrelevant to the content of the image is left without being deleted.
図8は、画像の内容と無関係な透明文字列を削除するか否かをユーザーに選択させる際に、制御部123が表示部124に表示するプロンプト画面の一例を示す図である。図8のケースでは、制御部123が画像の内容と無関係な透明文字列302を検出し、その外接矩形801を表示することで、透明文字列302を強調している。また、図示していないが、一時的に透明文字列302を半透明にして表示することで、ユーザーが透明文字列302を視認できるようにしている。さらに、透明文字列302の近くにチェックボックス802を表示している。ユーザーがこのチェックボックス802にチェックをつけた場合、透明文字列302はSPDFファイルを作成し直す際に削除されることになる。
FIG. 8 is a diagram showing an example of a prompt screen displayed on the
<画面作成処理について>
以下、本実施例における、図8に例示したような画面を作成する処理について、図9(a)を用いて説明する。
<About screen creation process>
Hereinafter, the process of creating the screen as illustrated in FIG. 8 in the present embodiment will be described with reference to FIG.
本実施例における画面作成処理では、ステップS706で着目透明文字列が画像の内容と無関係な透明文字列と判定された後、ステップS901に進む。そして、ステップS901において、制御部123は、着目透明文字列に対応する外接矩形と、チェックボックスとを、表示部124に表示するとともに、着目透明文字列を半透明にして表示する。
In the screen creation processing in the present embodiment, after it is determined in step S706 that the target transparent character string is a transparent character string unrelated to the content of the image, the processing proceeds to step S901. Then, in step S901, the
<SPDFファイル作成処理について>
以下、本実施例におけるSPDFファイル作成処理について、図9(b)を用いて説明する。
<About SPDF file creation process>
Hereinafter, the SPDF file creation processing in the present embodiment will be described using FIG. 9 (b).
本実施例におけるSPDFファイル作成処理では、ステップS706で着目透明文字列が画像の内容と無関係な透明文字列と判定された後、ステップS902に進む。そして、ステップS902において、制御部123は、着目透明文字列に対応するチェックボックスにチェックがつけられたか判定する。ステップS902の判定結果が真の場合、ステップS705に進み、着目透明文字列を削除する一方、該判定結果が偽の場合、ステップS707に進む。この場合、着目透明文字列は削除されない。つまり本実施例では、画像の内容と無関係な透明文字列を必ず削除するのではなく、ユーザーの選択に応じて該透明文字列を削除する。
In the SPDF file creation process in the present embodiment, after it is determined in step S706 that the target transparent character string is a transparent character string unrelated to the content of the image, the process proceeds to step S902. Then, in step S902, the
本実施例により、画像の内容と無関係な透明文字列を削除せずに残すか否かをユーザーが選択することが可能になる。 The present embodiment allows the user to select whether or not to keep transparent strings irrelevant to the content of the image without deleting them.
[実施例5]
本実施例では、SPDFファイルを作成し直す際に、認識率の高い文字列のみを透明文字列で置き換える。上述したように、SPDFファイルを作成し直す際には、既存の透明文字列を一旦削除してから文字認識を行い、透明文字列を追加する。しかし、認識率が低い場合、既存の透明文字列を取得した際よりも認識精度が落ちてしまう可能性が高い。そのため、本実施例では、認識率が閾値以上の文字列のみを透明文字列で置き換えるようにする。
[Example 5]
In this embodiment, only the character string having a high recognition rate is replaced with the transparent character string when the SPDF file is re-created. As described above, when the SPDF file is re-created, the existing transparent character string is once deleted, then character recognition is performed, and the transparent character string is added. However, when the recognition rate is low, there is a high possibility that the recognition accuracy will be lower than when the existing transparent character string is acquired. Therefore, in the present embodiment, only the character string whose recognition rate is equal to or more than the threshold value is replaced with the transparent character string.
図10は、SPDFファイルを作成する際のオプションを設定するためのダイアログの一例を示す図である。オプション設定ダイアログ1001は、全ての透明文字を置き換える場合にチェックをつけるチェックボックス1004と、認識率の高い文字列のみ置き換える場合にチェックをつけるチェックボックス1005とを有する。ユーザーは、チェックボックス1004とチェックボックス1005との何れかにチェックをつける。
FIG. 10 is a diagram showing an example of a dialog for setting options when creating an SPDF file. The
<SPDFファイル作成処理について>
以下、本実施例における、オプション設定ダイアログ1001内のチェックボックス1005にチェックが入っていた場合に実行されるSPDFファイル作成処理について、図11を用いて説明する。
<About SPDF file creation process>
Hereinafter, the SPDF file creation process executed when the
本実施例では、ステップS704の次にステップS1101に進み、ステップS1101において、制御部123は、着目透明文字列に対応する認識文字の認識率が所定の閾値以上か判定する。ステップS1101の判定結果が真の場合、ステップS705に進んで着目透明文字列を削除する一方、該判定結果が偽の場合、ステップS707に進む。このように本ステップでは、後続のステップS1102で認識率が高い文字列のみを透明文字列で置き換えるために、認識率が高い既存の透明文字列を予め削除しておく。
In the present embodiment, the process proceeds to step S1101 after step S704, and in step S1101 the
また、本実施例では、ステップS707の次にステップS1102に進み、ステップS1102において、制御部123は、認識文字のうち、認識率が所定の閾値以上のものを透明文字列として追加し、一連の処理は終了する。以上が、本実施例におけるSPDFファイル作成処理の内容である。
Further, in the present embodiment, the process proceeds to step S1102 after step S707, and in step S1102, the
本実施例により、SPDFファイルを作成し直す際に、認識率の高い文字列のみを透明文字列で置き換えることができる。 According to this embodiment, when the SPDF file is re-created, only the character string having a high recognition rate can be replaced with the transparent character string.
[実施例6]
本実施例では、上述の実施例で説明した方法で生成したSPDFファイルの活用方法の一例について述べる。本実施例では、保存部122などに保存された各ファイルを詳細に検索する仕組みを提供する。また、検索で見つかったファイルを,複写機110を用いて印刷する仕組みを提供する。図13(a)及び図13(b)は、情報処理装置120の表示部124に表示される画面の例を示す図である。図13(a)は、検索ワードを入力する画面の一例を示す図であり、図13(b)は、検索結果の一覧を示す画面の一例を示す図である。図13(a)及び図13(b)に示す画面は、生成されたSPDFファイルや、コンピュータ内部の文書ファイルなどを管理する文書管理アプリケーションが提供する画面である。ユーザーは、図13(a)及び図13(b)の画面を介してファイルの属性検索、全文検索、概念検索などを行うことができる。
[Example 6]
In this embodiment, an example of a method of utilizing the SPDF file generated by the method described in the above-described embodiment will be described. In the present embodiment, a mechanism is provided for searching in detail each file stored in the
本実施例では、SPDFを含むファイルの全文検索について説明する。領域1301は、検索キーワードを入力する領域である。ユーザーは、領域1301に検索したいキーワードを入力することができる。検索方式のチェックボックスは、各キーワードをANDで検索するかORで検索するかを指定するためのチェックボックスである。Searchキー1302は、検索を行う際に押下されるキーである。
In this embodiment, full-text search of files including SPDF will be described. An
図13(b)は、検索結果の一例を示す画面である。ここでは、「Kawasaki」、「BlackBlue」の2つの検索キーワードを含む3つのファイル見つかり、リストに列挙されているケースを例示している。符号1303は、見つかった3つのファイルのうち、図2のSPDFファイルが指定されている様子を示している。ユーザーは、図13(b)の画面を介して検索で見つかったファイルを開いたり、印刷したりすることができる。
FIG. 13B is a screen showing an example of the search result. Here, three files including two search keywords of “Kawasaki” and “BlackBlue” are found and illustrated in the list.
具体的な制御方法について図14を用いて説明する。図14のフローチャートは、文書管理アプリケーションの管理画面を介してファイル検索のユーザー操作を受け付けたことに従って実行される。 A specific control method will be described with reference to FIG. The flowchart of FIG. 14 is executed according to the user operation of file search being accepted via the management screen of the document management application.
ステップS1401において、制御部123は、受付部125を介して検索キーワードの入力を受け付ける。検索キーワードの入力を受け付けた後に、Searchキー1302が押下されたことを検知すると、ステップS1402に進む。
In step S1401, the
ステップS1402において、制御部123は、ステップS1401で入力されたキーワードに基づき、検索対象のストレージ内にあるファイル内の文字列を検索する。ファイル内の文字列にキーワードが含まれているファイルがあれば、表示対象として当該ファイルの属性情報を取得する。ストレージ内のファイルの検索が完了すると、ステップS1403に進む。尚、本実施例では、SPDFファイルやWORDファイル、エクセルファイル等を直接参照し、検索を行う場合を想定しているが、これに限定されるものではない。例えば、ファイル内の文字列をインデックス化したデータベースを予め生成しておき、該生成したデータベースを参照するようにしても良い。
In step S1402, the
ステップS1403において、制御部123は、ステップS1402で見つかった検索結果の一覧を示す画面を表示する。図13(b)は、検索結果の一覧を示す画面の一例である。
In step S1403, the
ステップS1404において、制御部123は、検索結果の一覧から文書を選択するユーザー操作を受け付ける。本ステップにおける文書の選択では、ユーザーは、複数の文書ファイルを選択することもできる。
In step S1404, the
ステップS1405において、制御部123は、選択した文書を印刷するユーザー操作を受け付けたか判定する。本ステップの判定結果が真の場合、ステップS1406に進む一方、該判定結果が偽の場合、ステップS1407に進む。
In step S1405, the
ステップS1406において、制御部123は、選択された文書に基づく印刷データを生成し、MFP(例えば、複写機110)に該生成した印刷データを送信する。この印刷データを受信したMFPは、受信した印刷データに基づき用紙等の記録媒体に画像を形成する。
In step S1406, the
ステップS1407において、制御部123は、選択文書を開くユーザー操作を受け付けたか判定する。本ステップの判定結果が真の場合、ステップS1408に進む一方、該判定結果が偽の場合、ステップS1404に戻る。
In step S1407, the
ステップS1408では、制御部123は、選択された文書の拡張子に関連付けられたアプリケーションで、選択された文書を開く。
In step S1408, the
以上説明したように、本実施例では、情報処理装置120内部に記憶されたSPDF形式の文書ファイルの全文探索を行うことができる。従って、ユーザーが必要とする資料を簡単に探すことができるようになる。また、探索で見つかった文書ファイルについて、複写機110と連携して印刷することができる。従って、情報処理装置上で管理されている多種多様の文書ファイルから、所望のファイルを簡単にサーチし、再印刷することができる。従ってユーザーの利便性を高めることができる。
As described above, in the present embodiment, the full text search of the SPDF format document file stored in the
[その他の実施形態]
上述の各実施形態では、情報処理装置120と複写機110が有線又は無線で接続されている場合を例示しているがこれに限定されるものではない。例えば、SPDFを生成したり、各文書ファイルを管理したりする情報処理装置120の各機能は、クラウド上のサーバとして実現することもできる。この場合、複写機などで読み取られたデータは、クラウド上のサーバに送信され、必要に応じてSPDFファイルに変換されてクラウドストレージ上に記憶される。また、クラウド上のサーバは、クライアントPCのWebブラウザ等からアクセス可能なWebアプリケーションを提供する。この場合、ユーザーは、Webアプリケーションを経由して、実施例6で説明した全文探索の機能や、探索で見つかった文書ファイルの印刷機能を利用するものとする。
Other Embodiments
In the above-described embodiments, the
また、上述の実施形態では、検索可能に変換するファイルの一例としてPDFを例示したがこれに限定されるものではない。その他ファイルフォーマット(例えば、Microsoftが提唱するXPSフォーマットや、Xeroxが提唱するDocuWorks文書で用いられるXDWフォーマットのファイルを解析し、検索可能なファイルに変換することもできる。 Moreover, in the above-mentioned embodiment, although PDF was illustrated as an example of a file which transforms into searchable, it is not limited to this. Other file formats (for example, XPS format proposed by Microsoft, XDW format file used in DocuWorks document proposed by Xerox) can be analyzed and converted into searchable files.
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。 The present invention supplies a program that implements one or more functions of the above-described embodiments to a system or apparatus via a network or storage medium, and one or more processors in a computer of the system or apparatus read and execute the program. Can also be realized. It can also be implemented by a circuit (eg, an ASIC) that implements one or more functions.
Claims (15)
前記第1抽出手段により抽出された文字領域と、前記ファイルに含まれる文字オブジェクトが描画された領域との位置関係に基づき、前記ファイルが、画像と、該画像に対応する文字認識の結果とを含む検索可能なファイルであるか否かを判定する第1判定手段と、
前記第1判定手段により、前記ファイルが検索可能なファイルでないと判定されたことに応じて、前記画像オブジェクトに対する文字認識処理を実行し、該文字認識処理の結果を含むファイルを生成する生成手段と
を有することを特徴とする情報処理装置。 First extracting means for extracting a character area in an image object included in the file;
Based on the positional relationship between the character area extracted by the first extraction means and the area where the character object included in the file is drawn, the file includes an image and a result of character recognition corresponding to the image. A first determination unit that determines whether or not the file is a searchable file that includes;
Generating means for executing a character recognition process on the image object in response to the first determination means determining that the file is not a searchable file, and generating a file including a result of the character recognition process; An information processing apparatus comprising:
前記第2判定手段が、前記PDFファイルにページサイズ相当の画像が含まれていると判定した場合、前記第1判定手段は、該PDFファイルが前記検索可能なPDFファイルか否かの判定を行う一方、
前記第2判定手段が、前記PDFファイルにページサイズ相当の画像が含まれていないと判定した場合、前記第1判定手段は、該PDFファイルが前記検索可能なPDFファイルか否かの判定を行わない
ことを特徴とする請求項3に記載の情報処理装置。 The apparatus further comprises a second determination unit that determines whether the PDF file includes an image equivalent to a page size before the determination by the first determination unit is performed,
When the second determination unit determines that the PDF file includes an image equivalent to a page size, the first determination unit determines whether the PDF file is the searchable PDF file. on the other hand,
When the second determination means determines that the PDF file does not contain an image of a page size, the first determination means determines whether the PDF file is the searchable PDF file. The information processing apparatus according to claim 3, wherein the information processing apparatus is not provided.
前記文字認識処理は、前記第1抽出手段により抽出された文字領域に対して実行され、
前記生成手段は、前記第1抽出手段により抽出された文字領域と同じ位置に、前記文字認識処理の結果得られた文字列を示す透明な文字オブジェクトが追加された検索可能なPDFファイルを、生成する
ことを特徴とする請求項4に記載の情報処理装置。 When the second determination unit determines that the PDF file includes an image equivalent to a page size, the first extraction unit extracts a character region by dividing the image.
The character recognition process is performed on the character area extracted by the first extraction unit.
The generation unit generates a searchable PDF file to which a transparent character object indicating a character string obtained as a result of the character recognition process is added at the same position as the character area extracted by the first extraction unit. The information processing apparatus according to claim 4, wherein:
前記第2抽出手段が抽出したファイルの一覧を、表示部に表示させることを特徴とする請求項3に記載の情報処理装置。 A second extracting unit is further provided for extracting a plurality of files including saved searchable PDF files as a search target, and extracting a file in which a character string in the search target file includes a keyword designated by the user And
4. The information processing apparatus according to claim 3, wherein a list of files extracted by the second extraction unit is displayed on a display unit.
前記一覧の中から選択されたファイルを印刷するユーザー操作を受け付けたことに応じて、該選択されたファイルに基づき印刷データを生成する生成手段を更に有し、該生成手段で生成された印刷データを前記画像形成装置に送信することを特徴とする請求項7に記載の情報処理装置。 The information processing apparatus is communicably connected to the image forming apparatus.
The print data generation method further includes generation means for generating print data based on the selected file in response to receiving a user operation for printing a file selected from the list, and the print data generated by the generation means The information processing apparatus according to claim 7, wherein the information processing apparatus transmits the image data to the image forming apparatus.
前記抽出ステップにて抽出された文字領域と、前記ファイルに含まれる文字オブジェクトが描画された領域との位置関係に基づき、前記ファイルが、画像と、該画像に対応する文字認識の結果とを含む検索可能なファイルであるか否かを判定する判定ステップと、
前記判定ステップにて、前記ファイルが検索可能なファイルでないと判定されたことに応じて、前記画像オブジェクトに対する文字認識処理を実行し、該文字認識処理の結果を含むファイルを生成する生成ステップと
を有することを特徴とする方法。 An extraction step of extracting a character area in an image object included in the file;
The file includes an image and a result of character recognition corresponding to the image based on the positional relationship between the character area extracted in the extracting step and the area where the character object included in the file is drawn. A determination step of determining whether or not the file is a searchable file;
Generating a file including a result of the character recognition process by executing character recognition processing on the image object in response to the determination that the file is not a searchable file in the determination step; A method characterized by having.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16/141,278 US10922538B2 (en) | 2017-10-03 | 2018-09-25 | Information processing apparatus that determines whether a PDF file is searchable, and method and storage medium thereof |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017193518 | 2017-10-03 | ||
| JP2017193518 | 2017-10-03 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019068406A true JP2019068406A (en) | 2019-04-25 |
Family
ID=66340121
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018139489A Pending JP2019068406A (en) | 2017-10-03 | 2018-07-25 | INFORMATION PROCESSING APPARATUS, METHOD, AND PROGRAM |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2019068406A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023047133A (en) * | 2021-09-24 | 2023-04-05 | 富士フイルムビジネスイノベーション株式会社 | Information processing device, information processing system, and program |
-
2018
- 2018-07-25 JP JP2018139489A patent/JP2019068406A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023047133A (en) * | 2021-09-24 | 2023-04-05 | 富士フイルムビジネスイノベーション株式会社 | Information processing device, information processing system, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10824801B2 (en) | Interactively predicting fields in a form | |
| JP4181892B2 (en) | Image processing method | |
| JP4895340B2 (en) | Information processing apparatus and method | |
| JP4681863B2 (en) | Image processing apparatus and control method thereof | |
| US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
| JP4502385B2 (en) | Image processing apparatus and control method thereof | |
| US11908215B2 (en) | Information processing apparatus, information processing method, and storage medium | |
| US7747108B2 (en) | Image processing apparatus and its method | |
| US20120250048A1 (en) | Image processing apparatus and image processing method | |
| JP6876914B2 (en) | Information processing device | |
| JP4533273B2 (en) | Image processing apparatus, image processing method, and program | |
| US10803233B2 (en) | Method and system of extracting structured data from a document | |
| JP4232679B2 (en) | Image forming apparatus and program | |
| US8181108B2 (en) | Device for editing metadata of divided object | |
| JP4785655B2 (en) | Document processing apparatus and document processing method | |
| JP2019068406A (en) | INFORMATION PROCESSING APPARATUS, METHOD, AND PROGRAM | |
| JP2008040753A (en) | Image processing apparatus, method, program, and recording medium | |
| JP2008129793A (en) | Document processing system, apparatus and method, and recording medium recording program | |
| US10922538B2 (en) | Information processing apparatus that determines whether a PDF file is searchable, and method and storage medium thereof | |
| JP4323856B2 (en) | Image processing method | |
| JP2021144673A (en) | Image processing apparatus, image processing method and program | |
| JP2008028716A (en) | Image processing method and apparatus | |
| JP6012700B2 (en) | Information processing apparatus, information processing method, information processing system, and computer program | |
| JP5420032B2 (en) | Information processing apparatus, information processing method, information processing system, and computer program | |
| JP2024034778A (en) | Image processing device, image processing system, image processing method, and program |