JP2006023946A - Image processing apparatus, control method therefor, and program - Google Patents
Image processing apparatus, control method therefor, and program Download PDFInfo
- Publication number
- JP2006023946A JP2006023946A JP2004200808A JP2004200808A JP2006023946A JP 2006023946 A JP2006023946 A JP 2006023946A JP 2004200808 A JP2004200808 A JP 2004200808A JP 2004200808 A JP2004200808 A JP 2004200808A JP 2006023946 A JP2006023946 A JP 2006023946A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image data
- access level
- block
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
Description
本発明は、所望の画像データを検索する画像処理装置及びその制御方法、プログラムに関するものである。 The present invention relates to an image processing apparatus that searches for desired image data, a control method thereof, and a program.
近年、オフィスのペーパレス化が唱えられているが、紙文書には、目が疲れにくい、全体を概観しやすい、書き込めるなど、電子文書にはないメリットがあり、現状のオフィスでは、電子文書と紙文書のそれぞれのメリットを生かし、電子文書と紙文書が併用されている状況にある。このような状況では、紙文書と電子文書との扱いの差異を軽減するために、電子文書から紙文書へ、紙文書から電子文書への相互の移行が容易にできるような環境が求められている。 In recent years, paper-less offices have been advocated, but paper documents have advantages not found in electronic documents, such as less eye fatigue, easy overview, and writeability. Utilizing the merits of each document, electronic documents and paper documents are used together. In such a situation, in order to reduce the difference in handling between paper documents and electronic documents, an environment that facilitates the mutual transition from electronic documents to paper documents and from paper documents to electronic documents is required. Yes.
電子文書から紙文書への移行は、電子文書をプリンタによって印刷することで容易に達成できる。それに対して、紙文書から電子文書への移行は、紙文書をスキャナーで読み取り、画像データとして電子化する方法が一般的に行なわれている。 The transition from an electronic document to a paper document can be easily achieved by printing the electronic document with a printer. On the other hand, in order to shift from a paper document to an electronic document, a method in which a paper document is read by a scanner and digitized as image data is generally performed.
しかしながら、紙文書に対して、オリジナルの電子文書が存在する場合は、その紙文書を読み取ることでその紙文書から電子文書へ移行するよりも、紙文書に対するオリジナルの電子文書に移行するほうが望ましい。 However, when an original electronic document exists for a paper document, it is preferable to shift to the original electronic document for the paper document rather than reading the paper document to shift from the paper document to the electronic document.
これを実現する方法として、例えば、特許文献1では、オリジナルの電子文書をラスター画像に変換してその電子文書と対応付けて保存しておき、紙文書をスキャンして得られたラスター画像データとオリジナルの電子文書に対するラスター画像データとを、その特徴量の類似性を比較することにより、オリジナルの電子文書を検索することを可能にしている。
As a method for realizing this, for example, in
例えば、会議で発表する時に用いた資料が、オリジナルの電子文書を印刷することによって得られる紙文書として出席者に配布されている場合には、その配布された紙文書から、オリジナルの電子文書を取得することが可能になる。これにより、会議の出席者は、オリジナルの電子文書を編集したり、会議に出席していない人に配布したりすることが可能になる。 For example, if the material used for presentation at the meeting is distributed to attendees as a paper document obtained by printing the original electronic document, the original electronic document is extracted from the distributed paper document. It becomes possible to acquire. This allows attendees of the conference to edit the original electronic document or distribute it to people who are not attending the conference.
一方、近年、情報に対するセキュリティを厳格に運用しようという機運が高まり、文書の構成要素(テキスト、表、図形、写真など)ごとに、アクセスできるユーザを切り替える技術が提案されている。 On the other hand, in recent years, there has been an increase in the momentum to strictly operate security for information, and a technique for switching accessible users for each component of a document (text, table, figure, photograph, etc.) has been proposed.
例えば、特許文献2では、文書画像を送信する際、文書画像の構成要素(オブジェクト)ごとに、ある受信者には文字領域のみを、他の受信者には文字領域と写真領域を閲覧させるようにするために、文書画像をオブジェクト単位に分割し、オブジェクトごとに暗号化を施す技術が提案されている。
For example, in
また、インターネットとWEBブラウザの普及により、現在作成されている電子文書として、HTML文書が増加しており、HTML文書の中には、CGIなどのプログラムによって動的に生成する文書がある。このようなHTML文書では、アクセスする人によって、表示するオブジェクトを切り替えることも行われている。 Also, with the spread of the Internet and WEB browsers, HTML documents are increasing as electronic documents currently created, and some HTML documents are dynamically generated by a program such as CGI. In such an HTML document, an object to be displayed is switched by an accessing person.
このような動的に生成される電子文書に対して、紙文書からオリジナルの電子文書を生成しようとした場合、特許文献1で提案された技術を用いると、動的に生成される全てのパターンをラスター画像に変換して、動的に生成される電子文書と対応付けて保存しておく必要があった。
印刷された紙文書は、容易に人から人に渡すことができるため、上述のような動的に生成される電子文書の場合、例えば、Aさんが閲覧した電子文書の印刷物を元に、Bさんがオリジナルの電子文書を検索すると、従来技術では、Aさんが閲覧した電子文書が得られることになり、Bさんが閲覧できる情報とは異なる場合がある。このような場合、Bさんは、Bさんの閲覧できる情報を含んだ電子文書を取得できたほうが好ましい場合が多いが、従来の技術では、必要な情報が得られないことになる。 Since the printed paper document can be easily transferred from person to person, in the case of the electronic document generated dynamically as described above, for example, based on the printed matter of the electronic document viewed by Mr. A, B When Mr. A searches for an original electronic document, in the prior art, an electronic document browsed by Mr. A is obtained, which may be different from information that B can browse. In such a case, it is often preferable that Mr. B can obtain an electronic document including information that can be viewed by Mr. B, but the conventional technology cannot obtain necessary information.
また、電子文書の検索を行う場合、検索結果の候補の電子文書のサムネイル画像を一覧表示し、一覧表示されたサムネイル画像から所望の電子文書を選択することで、所望の文書を取得するということが一般的に行われている。ここで、紙文書からオリジナルの電子文書を検索する場合、一覧表示の中から、入力した紙文書と同じサムネイル画像を探すことになる。しかしながら、取得されるオリジナルの電子文書が、入力された紙文書とは異なる内容になると、入力した紙文書とは異なる内容の電子文書がサムネイル画像として表示されるため、入力した紙文書との対応がつかなくなり、所望の電子文書を検索しづらいという課題があった。 Also, when searching for an electronic document, a list of thumbnail images of candidate electronic documents as search results is displayed in a list, and a desired document is acquired by selecting the desired electronic document from the displayed thumbnail images. Is generally done. Here, when the original electronic document is searched from the paper document, the same thumbnail image as the input paper document is searched from the list display. However, if the original electronic document to be acquired has a different content from the input paper document, the electronic document with the content different from the input paper document is displayed as a thumbnail image. There is a problem that it is difficult to search for a desired electronic document.
更に、紙文書は容易に人から人に渡すことができるため、例えば、アクセスレベルの低い人が、その人がアクセスアクセスできない情報を含んだ紙文書を入手する可能性があり、このような紙文書を元にオリジナルの電子文書を検索して、オリジナルの電子文書を入手すると、オリジナルの電子文書の中に自分がアクセスできない情報が含まれていることになる。このように、電子文書は、紙文書以上に複製、送信などの再利用性が高まり、アクセス制限が掛けられた情報が拡散してしまうという危険性があった。 Furthermore, since paper documents can be easily passed from person to person, for example, a person with a low access level may obtain a paper document containing information that the person cannot access. When an original electronic document is retrieved based on the document and the original electronic document is obtained, information that cannot be accessed by the user is included in the original electronic document. As described above, the electronic document has a higher reusability such as duplication and transmission than a paper document, and there is a risk that information on which access restriction is applied spreads.
また、このように、アクセス制限が破られて、アクセスできない情報を含んだ紙文書が渡ったことが、従来技術では検知できず、また、そのことが管理者に通知されないため、情報漏洩に対応することができないという課題もあった。 In addition, in this way, it is not possible to detect that a paper document containing information that cannot be accessed because access restrictions have been violated, and it is not possible to notify the administrator of this, so it is possible to deal with information leakage. There was also a problem that we could not do it.
本発明は上記の課題を解決するためになされたものであり、ユーザのアクセスレベルに適した内容で構成される電子文書を適切にかつ安全に検索することができる画像処理装置及びその制御方法、プログラムを提供することを目的とする。 The present invention has been made to solve the above-described problem, and an image processing apparatus capable of appropriately and safely searching for an electronic document configured with contents suitable for a user's access level, and a control method thereof, The purpose is to provide a program.
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
所望の画像データを検索する画像処理装置であって、
複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理する記憶手段と、
ユーザ情報を入力する入力手段と、
前記入力手段で入力されたユーザ情報のアクセスレベルを取得する取得手段と、
原稿を読み取る読取手段と、
前記読取手段によって得られる第1画像データに対応する第2画像データを前記記憶手段から検索する検索手段と、
前記取得手段で取得したユーザ情報のアクセスレベルに基づいて、前記検索手段で検索された第2画像データの各構成要素の出力の可否を判定する判定手段と、
前記判定手段で出力が許可された構成要素を含む第2画像データを出力する出力手段と
を備える。
In order to achieve the above object, an image processing apparatus according to the present invention comprises the following arrangement. That is,
An image processing apparatus for searching for desired image data,
Storage means for storing and managing image data composed of a plurality of types of components by setting an access level for each component;
An input means for inputting user information;
Obtaining means for obtaining an access level of the user information input by the input means;
Reading means for reading a document;
Search means for searching the storage means for second image data corresponding to the first image data obtained by the reading means;
A determination unit that determines whether or not each component of the second image data searched by the search unit can be output based on an access level of the user information acquired by the acquisition unit;
Output means for outputting second image data including components permitted to be output by the determination means.
また、好ましくは、前記検索手段は、前記読取手段によって得られる第1画像データと前記記憶手段に記憶されている画像データを比較する比較手段とを備え、
前記比較手段の比較結果に基づいて、前記第1画像データに対応する第2画像データを検索する。
Preferably, the search means includes first image data obtained by the reading means and comparison means for comparing the image data stored in the storage means,
Based on the comparison result of the comparison means, second image data corresponding to the first image data is searched.
また、好ましくは、前記比較手段は、前記第1画像データの特徴量を抽出する抽出手段を備え、
前記抽出手段で抽出した特徴量と、前記記憶手段に記憶されている画像データの特徴量と比較する。
Preferably, the comparison unit includes an extraction unit that extracts a feature amount of the first image data.
The feature quantity extracted by the extraction means is compared with the feature quantity of the image data stored in the storage means.
また、好ましくは、前記抽出手段は、前記第1データの画像特徴量及び文字特徴量のいずれかまたは両方を抽出する。 Preferably, the extraction unit extracts one or both of an image feature amount and a character feature amount of the first data.
また、好ましくは、前記検索手段で検索された前記第2画像データの候補となる候補画像データの一覧を表示する表示手段を更に備え、
前記判定手段は、前記取得手段で取得したアクセスレベルに基づいて、前記表示手段で表示された候補画像データの一覧から選択された前記2画像データとなる候補画像データの各構成要素の出力の可否を判定する。
Preferably, the apparatus further comprises display means for displaying a list of candidate image data that are candidates for the second image data searched by the search means,
Whether the determination unit outputs each component of the candidate image data to be the two image data selected from the list of candidate image data displayed by the display unit based on the access level acquired by the acquisition unit Determine.
また、好ましくは、前記判定手段は、前記検索手段で検索された第2画像データに対するアクセスレベルを設定する設定手段と、
前記設定手段で設定されたアクセスレベルと、前記取得手段で取得したユーザ情報のアクセスレベルを比較するアクセスレベル比較手段と、
前記アクセスレベル比較手段の比較結果に基づいて、警告情報を出力する警告情報出力手段と
を備える。
Preferably, the determination means includes a setting means for setting an access level for the second image data searched by the search means;
An access level comparing means for comparing the access level set by the setting means with the access level of the user information acquired by the acquiring means;
Warning information output means for outputting warning information based on the comparison result of the access level comparison means.
また、好ましくは、前記取得手段で取得したユーザ情報のアクセスレベルが、前記設定手段で設定されたアクセスレベルより高い場合、前記判定手段は、該設定手段で設定されたアクセスレベルに基づいて、前記検索手段で検索された第2画像データの各構成要素の出力の可否を判定する。 Preferably, when the access level of the user information acquired by the acquisition unit is higher than the access level set by the setting unit, the determination unit is configured based on the access level set by the setting unit. Whether to output each component of the second image data searched by the search means is determined.
また、好ましくは、前記取得手段で取得したユーザ情報のアクセスレベルが、前記設定手段で設定されたアクセスレベルと同じあるいはそれより低い場合、前記判定手段は、該取得手段で取得したユーザ情報のアクセスレベルに基づいて、前記検索手段で検索された第2画像データの各構成要素の出力の可否を判定する。 Preferably, when the access level of the user information acquired by the acquisition unit is the same as or lower than the access level set by the setting unit, the determination unit accesses the user information acquired by the acquisition unit. Based on the level, it is determined whether or not each component of the second image data searched by the search means can be output.
また、好ましくは、前記記憶手段は、複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理するとともに、その構成要素毎に特徴量を記憶管理する。 Preferably, the storage unit stores and manages image data including a plurality of types of components by setting an access level for each component, and stores and manages a feature amount for each component.
また、好ましくは、前記記憶手段は、複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理するとともに、その構成要素毎に特徴量を記憶管理する場合、同一の特徴量については、その特徴量を示す識別子を用いて記憶管理する。 Preferably, the storage unit stores and manages image data including a plurality of types of components by setting an access level for each component, and stores and manages a feature amount for each component. The same feature quantity is stored and managed using an identifier indicating the feature quantity.
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理する記憶部から、所望の画像データを検索する画像処理装置の制御方法であって、
ユーザ情報を入力する入力工程と、
前記入力工程で入力されたユーザ情報のアクセスレベルを取得する取得工程と、
原稿を読み取る読取工程と、
前記読取工程によって得られる第1画像データに対応する第2画像データを前記記憶部から検索する検索工程と、
前記取得工程で取得したユーザ情報のアクセスレベルに基づいて、前記検索工程で検索された第2画像データの各構成要素の出力の可否を判定する判定工程と、
前記判定工程で出力が許可された構成要素を含む第2画像データを出力する出力工程と
を備える。
In order to achieve the above object, a method for controlling an image processing apparatus according to the present invention comprises the following arrangement. That is,
A method for controlling an image processing apparatus that searches for desired image data from a storage unit that stores and manages image data including a plurality of types of components by setting an access level for each component,
An input process for inputting user information;
An acquisition step of acquiring an access level of the user information input in the input step;
A reading process for reading a document;
A search step of searching the storage unit for second image data corresponding to the first image data obtained by the reading step;
A determination step of determining whether or not each component of the second image data searched in the search step can be output based on the access level of the user information acquired in the acquisition step;
An output step of outputting second image data including components permitted to be output in the determination step.
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理する記憶部から、所望の画像データを検索する画像処理装置の制御を実現するプログラムであって、
ユーザ情報を入力する入力工程のプログラムコードと、
前記入力工程で入力されたユーザ情報のアクセスレベルを取得する取得工程のプログラムコードと、
原稿を読み取る読取工程のプログラムコードと、
前記読取工程によって得られる第1画像データに対応する第2画像データを前記記憶部から検索する検索工程のプログラムコードと、
前記取得工程で取得したユーザ情報のアクセスレベルに基づいて、前記検索工程で検索された第2画像データの各構成要素の出力の可否を判定する判定工程のプログラムコードと、
前記判定工程で出力が許可された構成要素を含む第2画像データを出力する出力工程のプログラムコードと
を備える。
In order to achieve the above object, a program according to the present invention comprises the following arrangement. That is,
A program that realizes control of an image processing apparatus that searches for desired image data from a storage unit that stores and manages image data including a plurality of types of components by setting an access level for each component,
A program code of an input process for inputting user information;
A program code of an acquisition step for acquiring an access level of the user information input in the input step;
A program code for a reading process for reading a document;
A program code of a search step for searching the storage unit for second image data corresponding to the first image data obtained by the reading step;
Based on the access level of the user information acquired in the acquisition step, the program code of the determination step for determining whether to output each component of the second image data searched in the search step,
And a program code of an output process for outputting second image data including components permitted to be output in the determination process.
以上説明したように、本発明によれば、ユーザのアクセスレベルに適した内容で構成される電子文書を適切にかつ安全に検索することができる画像処理装置及びその制御方法、プログラムを提供できる。 As described above, according to the present invention, it is possible to provide an image processing apparatus, a control method thereof, and a program that can appropriately and safely search an electronic document configured with contents suitable for a user's access level.
以下、本発明の実施の形態について図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は本発明の実施形態の画像処理システムの構成例を示すブロック図である。 FIG. 1 is a block diagram showing a configuration example of an image processing system according to an embodiment of the present invention.
ネットワーク103には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現するMFP(マルチ・ファンクション・プリンタ)100、MFP100を制御するマネージメントPC101、クライアントPC102、文書管理サーバ106が接続されている。
Connected to the
文書管理サーバ106には、文書データを格納するデータベース105が接続されており、文書管理サーバ106は、WEBアプリケーション(例えば、WEBブラウザ)により、データベース105に格納されている文書データを、クライアントPC102に送信することができる。
A database 105 for storing document data is connected to the
クライアントPC102では、送信された文書データをWEBアプリケーションを用いて閲覧し、必要に応じて印刷を行う。
In the
MFP100は、本発明において、原稿である紙文書(印刷物)を電子的に読み取る画像読取部と画像読取部から得られる画像信号に対する画像処理を実行する画像処理部を有し、この画像信号は、LAN104を用いてマネージメントPC101に送信することができる。
In the present invention, the
マネージメントPC101は、通常のPC(パーソナルコンピュータ)であり、内部に画像記憶部、画像処理部、表示部、入力部を有するが、その一部をMFP100に一体化して構成されている。
The
尚、ネットワーク103は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、少なくともデータの送受信が可能であれば良い。
The
また、マネージメントPC101、クライアントPC102、文書管理サーバ106等の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
Various terminals such as the
次に、MFP100の詳細構成について、図2を用いて説明する。
Next, a detailed configuration of the
図2は本発明の実施形態のMFPの詳細構成を示すブロック図である。 FIG. 2 is a block diagram showing a detailed configuration of the MFP according to the embodiment of the present invention.
図2において、画像入力部110は、例えば、スキャナやリーダで構成される画像読取部であり、特に、画像入力部110がスキャナやリーダで構成される場合には、オートドキュメントフィーダ(ADF)で更に構成される。画像入力部110は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状のスキャン画像データを所定密度(600DPI等)のラスタ画像として得る。
In FIG. 2, an
尚、画像入力部110は、スキャナやリーダ以外に、デジタルカメラやデジタルビデオ等の撮像装置、PCやPDA等のCPUを有する情報処理装置、移動携帯通信端末やFAX等の通信装置等、ラスタ画像データを入力可能な装置であれば、どのようなものでも良い。
In addition to the scanner and the reader, the
次に、MFP100の主要な機能群について、以下に説明する。
Next, main function groups of
「複写(コピー)機能」
MFP100は、スキャン画像データに対応する画像を印刷部112で記録媒体に印刷する複写機能を有し、原稿画像を1つ複写する場合には、このスキャン画像データをデータ処理部115(CPU、RAM、ROM等から構成される)で各種の補正を行う画像処理を施して、印刷データを生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部111に一旦一ページ分の印刷データを記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
"Copy function"
The
尚、記憶部111に印刷データを保持せずに、スキャン画像データをデータ処理部115にて各種の補正を行う画像処理を施して印刷データを生成して、直接印刷部112によって記録媒体上に印刷させることも可能である。
In addition, without storing the print data in the
「保存機能」
MFP100は、画像入力部110からスキャン画像データあるいは画像処理が施されたスキャン画像データを記憶部111に保存する。
"Save function"
The
「送信機能」
ネットワークI/F114を介する送信機能においては、画像入力部110から得られるスキャン画像データあるいは保存機能で記憶部111に保存されたスキャン画像データを、TIFFやJPEG等の圧縮画像ファイル形式、あるいはPDF等のベクトルデータファイル形式の画像ファイルへと変換し、ネットワークI/F114から出力する。出力された画像ファイルは、ネットワーク103を介して文書管理サーバ106へ送信されたりする。
"Transmission function"
In the transmission function via the network I /
また、ここでは図示しないが、FAX I/Fを使用して、スキャン画像データを電話回線を使用してファクシミリ送信する構成も可能である。また、記憶部111にスキャン画像データを保存せずに、そのスキャン画像データをデータ処理部115にて各種の送信に関する画像処理を施した後に、直接送信することも可能である。
Although not shown here, it is also possible to use a FAX I / F to send scanned image data by facsimile using a telephone line. Further, the scan image data may be directly transmitted after being subjected to various kinds of image processing by the
「印刷機能」
印刷部112による印刷機能においては、例えば、クライアントPC102から出力された印刷データをネットワークI/F114経由でデータ処理部115が受信する。データ処理部115は、その印刷データを印刷部112で印刷可能なラスタデータに変換し、記憶部111に一旦一ページ分の記録データを記憶保持した後、印刷部112によって印刷媒体上に画像を形成する。
"Print Function"
In the printing function by the
以上、各種機能を実行するためのMFP100への操作者の指示は、MFP100に装備されたキー操作部とマネージメントPC101に接続されたキーボード及びマウスからなる入力部113から行われ、これら一連の動作はデータ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。
As described above, an operator's instruction to the
記憶部111は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの送受信及び制御は、ネットワークI/F117及びLAN104を介して行われる。
The
上記画像処理システムにおいて、文書管理サーバ106で管理されている電子文書は、その電子文書を構成する要素(文字ブロック、画像ブロック、表ブロック、グラフブロック等)毎にアクセスレベルが設定されて記憶管理されており、クライアントPC102のWEBブラウザから電子文書を閲覧する際、ユーザのアクセスレベルによって、同じ電子文書に対して出力(表示)される要素が異なる。
In the image processing system, an electronic document managed by the
また、マネージメントPC101から指示することにより、文書管理サーバ106で管理されている電子文書を印刷した紙文書を、MFP100の画像入力部110から読み取り、読み込まれた紙文書のオリジナルの電子文書を検索し、文書管理サーバ106からオリジナルの電子文書を取得することができる。
In response to an instruction from the
以下、本発明の画像処理システムの詳細について説明する。 Details of the image processing system of the present invention will be described below.
まず、本実施形態において、データベース105に格納されている電子文書(文書データ)を、クライアントPC102から閲覧して印刷する印刷処理について、図3を用いて説明する。
First, a printing process for browsing and printing an electronic document (document data) stored in the database 105 from the
図3は本発明の実施形態の印刷処理を示すフローチャートである。 FIG. 3 is a flowchart showing the printing process according to the embodiment of the present invention.
まず、ステップS301において、クライアントPC102からWEBブラウザを立ち上げ、文書管理サーバ106のWEBアプリケーションのTOPページのURL(Uniform Resource Locator)を指定し、WEBブラウザから文書管理システムにログインする。
First, in step S301, the WEB browser is started from the
TOPページのURLを指定すると、ユーザ名とパスワードを入力するページがWEBブラウザに表示され、ユーザは、キーボードを用いて、ユーザ名とパスワードを入力する。ステップS302において、入力されたユーザ名を元に、図4に示すユーザ情報を参照し、入力されたパスワードをチェックする。 When the URL of the TOP page is designated, a page for inputting the user name and password is displayed on the WEB browser, and the user inputs the user name and password using the keyboard. In step S302, based on the input user name, the user information shown in FIG. 4 is referred to and the input password is checked.
ここで、ユーザ情報について、図4を用いて説明する。 Here, the user information will be described with reference to FIG.
図4は本発明の実施形態のユーザ情報の一例を示す図である。 FIG. 4 is a diagram showing an example of user information according to the embodiment of the present invention.
図4に示すように、ユーザ情報は、ユーザ名、文書管理システムのログイン時のパスワード、ユーザを固有に識別するためのユーザID、及び電子文書を構成する構成要素の出力(表示)の可否を規定するアクセスレベルが対応づけて構成されている。このユーザ情報は、例えば、文書管理サーバ106で管理されており、必要に応じて、管理者は、このユーザ情報を変更することができる。
As shown in FIG. 4, the user information includes a user name, a password at the time of logging in the document management system, a user ID for uniquely identifying the user, and whether or not to output (display) the components constituting the electronic document. The specified access levels are configured in association with each other. This user information is managed by the
図3の説明に戻る。 Returning to the description of FIG.
入力されたユーザ名とパスワードが正当でない場合(ステップS302でNO)、処理を終了する。一方、入力されたユーザ名とパスワードが正当である場合(ステップS302でYES)、文書管理サーバ106は、セッションIDを発行し、以降の処理では、セッション管理が行われる。WEBアプリケーションにおけるセッション管理は、Cookieを用いる方法などが知られており、広く一般的に行われているので詳細な説明は省略する。
If the input user name and password are not valid (NO in step S302), the process ends. On the other hand, if the input user name and password are valid (YES in step S302), the
ステップS303において、図4のユーザ情報から、ユーザ名に対応したアクセスレベルを取得する。以降、ここで取得したアクセスレベルを、ユーザアクセスレベルと呼ぶことにする。 In step S303, the access level corresponding to the user name is acquired from the user information in FIG. Hereinafter, the access level acquired here will be referred to as a user access level.
続いて、ステップS304において、文書データの一覧を表示する。文書データの一覧は、図5に示す文書情報を元にHTML(Hyper Text Markup Language)文書を生成する。 In step S304, a list of document data is displayed. The list of document data generates an HTML (Hyper Text Markup Language) document based on the document information shown in FIG.
ここで、文書情報について、図5を用いて説明する。 Here, the document information will be described with reference to FIG.
図5は本発明の実施形態の文書情報の一例を示す図である。 FIG. 5 is a diagram showing an example of document information according to the embodiment of the present invention.
図5に示されるように、文書情報には、個々の文書データに関する情報として、文書データの識別子である文書IDと、その文書データを閲覧できるレベルを示すアクセスレベル(以降、文書アクセスレベルと呼ぶ)と、その文書データの名前である文書名、さらにその文書データの管理者とを対応させて格納している。この文書情報は、例えば、文書管理サーバ106で管理されており、必要に応じて、管理者は、このユーザ情報を変更することができる。
As shown in FIG. 5, in the document information, as information related to individual document data, a document ID that is an identifier of the document data and an access level indicating a level at which the document data can be browsed (hereinafter referred to as a document access level). ), The document name that is the name of the document data, and the administrator of the document data are stored in association with each other. The document information is managed by, for example, the
また、各文書データに設定されているアクセスレベルは、文書データに対するアクセスの制限であり、アクセスレベルの値が大きいほど、アクセスできる人が少なくなることを意味している。また、このアクセスレベルの値は、後述する文書データ内のブロックに対するアクセスレベルから求めることができる。 Also, the access level set for each document data is a restriction on access to the document data, and means that the larger the access level value, the fewer people can access. Further, the value of this access level can be obtained from the access level for a block in document data to be described later.
図3の説明に戻る。 Returning to the description of FIG.
特に、ステップS304では、ステップS303で取得したユーザアクセスレベルと文書情報中の文書アクセスレベルとを比較し、ユーザアクセスレベルと等しいか、もしくは、小さい文書アクセスレベルに対応した文書データのリストを、文書名のリストとして生成する。文書データの一覧を表示する文書データ一覧画面の例を、図29に示す。 In particular, in step S304, the user access level acquired in step S303 is compared with the document access level in the document information, and a list of document data corresponding to a document access level that is equal to or smaller than the user access level is obtained as a document. Generate as a list of names. FIG. 29 shows an example of a document data list screen that displays a list of document data.
ここで、文書データ一覧画面について、図29を用いて説明する。 Here, the document data list screen will be described with reference to FIG.
図29は本発明の実施形態の文書データ一覧画面の一例を示す図である。 FIG. 29 is a diagram showing an example of a document data list screen according to the embodiment of the present invention.
図29では、各文書名の左側にラジオボタンを配置し、生成する文書データのアクセスレベルをリストボックスから選択できるようになっている。このリストボックスの中に表示されるアクセスレベルの最大値は、ステップS303で取得したユーザアクセスレベルの値となるようにする。更に、閲覧ボタンが構成されている。 In FIG. 29, a radio button is arranged on the left side of each document name, and the access level of the generated document data can be selected from a list box. The maximum value of the access level displayed in this list box is set to the value of the user access level acquired in step S303. In addition, a browse button is configured.
図3の説明に戻る。 Returning to the description of FIG.
続いて、ステップS305において、処理対象の文書を指定する。 In step S305, a document to be processed is designated.
具体的には、ユーザは、文書データ一覧画面において、所望の文書名に対するラジオボタンをマウスでクリックすることによって選択し、取得したい文書のアクセスレベルをリストボックスを用いて選択し、閲覧ボタンをマウスでクリックする。 Specifically, on the document data list screen, the user selects a desired document name by clicking on the radio button with the mouse, selects the access level of the document to be acquired using the list box, and clicks the browse button with the mouse. Click with.
これにより、ラジオボタンに対応付けられた文書ID、選択されたアクセスレベルが、文書管理サーバ106上の文書生成プログラムに送信され、ステップS306において、選択された文書IDとアクセスレベルに対応した文書データを生成する。HTML文書で定義されるFORMタグを用いることで、このような動作を行うHTML文書は、ステップS304において容易に作成することができる。
As a result, the document ID associated with the radio button and the selected access level are transmitted to the document generation program on the
尚、ステップS306の文書生成処理は、図9を用いて後で説明する。この処理によって生成した文書データは、HTML文書データであり、ステップS307において、クライアントPC102に送信することで、クライアントPC102のWEBブラウザ上に表示される。
Note that the document generation processing in step S306 will be described later with reference to FIG. The document data generated by this processing is HTML document data, and is displayed on the WEB browser of the
続いて、ステップS308で、ユーザの指示に基づき、クライアントPC102のWEBブラウザに表示されているHTML文書データを、MFP100に出力して印刷する。
Subsequently, in step S308, based on a user instruction, the HTML document data displayed on the WEB browser of the
次に、文書データを構成する構成要素であるブロックに関する文書ブロック情報について、図6を用いて説明する。 Next, document block information relating to blocks that are constituent elements of document data will be described with reference to FIG.
図6は本発明の実施形態の文書ブロック情報の一例を示す図である。 FIG. 6 is a diagram showing an example of document block information according to the embodiment of the present invention.
尚、上述の図5の文書情報、以下の図6の文書ブロック情報及び図7のオブジェクト情報は、文書管理サーバ106で管理され、データベース105に格納されている文書データに関する情報である。特に、本実施形態では、簡単のために、各文書データは、1ページから構成されているものとしているが、複数ページから構成される文書データを扱う拡張は、容易に行うことができる。
Note that the document information in FIG. 5 described above, the following document block information in FIG. 6 and the object information in FIG. 7 are information on document data managed by the
図6に示されるように、各文書データのページは、複数のブロック(矩形領域)から構成されており、図6の文書ブロック情報には、文書IDに対するブロックの情報が格納されている。 As shown in FIG. 6, each document data page is composed of a plurality of blocks (rectangular areas), and the block information for the document ID is stored in the document block information in FIG.
文書ブロック情報の中では、1つのブロックの情報が、その識別子であるブロックIDと、そのブロックが含まれる文書データの文書ID、ブロックの位置(例えば、文書データのページの左上を原点として、ブロックの左上の点の座標)、ブロックのサイズ(縦、横の長さ)とを対応させて格納されている。各ブロックの内容は、図7のオブジェクト情報で定義される。 In the document block information, information of one block includes a block ID that is an identifier, a document ID of the document data that includes the block, and a block position (for example, a block with the upper left corner of the page of the document data as the origin) Are stored in correspondence with the block size (vertical and horizontal lengths). The contents of each block are defined by the object information in FIG.
ここで、オブジェクト情報について、図7を用いて説明する。 Here, the object information will be described with reference to FIG.
図7は本発明の実施形態のオブジェクト情報の一例を示す図である。 FIG. 7 is a diagram showing an example of object information according to the embodiment of the present invention.
オブジェクト情報では、各ブロックの内容が、その識別子であるオブジェクトIDと、その内容が格納されているファイルのアドレスを示すブロック内容と、その内容の属性(画像、テキスト、表など)と、その内容を含むブロックのブロックIDと、そのブロックが含まれる文書IDと、その内容に対するアクセスを制限するアクセスレベル(以降、オブジェクトアクセスレベルと呼ぶ)とが対応づけられて管理されている。 In the object information, the content of each block is the object ID that is the identifier, the block content indicating the address of the file in which the content is stored, the attribute of the content (image, text, table, etc.), and the content A block ID of a block including the document ID, a document ID including the block, and an access level (hereinafter referred to as an object access level) that restricts access to the content are managed in association with each other.
図7に示されるように、各ブロックの内容は、アクセスレベルによって異なっている。ひとつのブロックに対して、アクセスレベルが変わると、その内容を変更する場合や、アクセスレベルによってブロックの内容がなくなる場合などがある。図7のオブジェクト情報の例に基づき、文書IDが0001の文書データに対して、アクセスレベルによって、文書の内容が異なる例を、図8に示す。
As shown in FIG. 7, the contents of each block differ depending on the access level. When the access level changes for one block, the contents may be changed or the contents of the block may be lost depending on the access level. FIG. 8 shows an example in which the content of the document differs depending on the access level for the document data with the
図8は本発明の実施形態の文書データの出力例を示す図である。 FIG. 8 is a diagram showing an example of document data output according to the embodiment of the present invention.
図8では、文書IDが0001の文書データに対して、アクセスレベルが4の場合には、図8(a)に示すように、「dog」、「car」、「aaa」及び「bbb」の4つのオブジェクトの内容が含まれる。また、図8(b)に示すように、アクセスレベルが3と2の場合には、「dog」、「car」及び「bbb」の3つのオブジェクトの内容が含まれる。更に、アクセスレベルが1の場合には、図8(c)に示すように、「cat」及び「bbb」の2つのオブジェクトの内容が含まれる。つまり、アクセスレベルによって、含まれる(出力(表示)される)オブジェクトの内容がなくなり、別のオブジェクトに変更されている。
In FIG. 8, when the access level is 4 for the document data with the
このように、文書管理サーバ106で管理される文書データは、同じ文書IDを持つ文書データでも、アクセスレベルによって含まれる(出力(表示)される)内容が異なる。換言すれば、アクセスレベルによって、文書データの構成要素の出力の可否が制御される。
As described above, the document data managed by the
尚、図5の文書情報における文書アクセスレベルは、図7のオブジェクト情報に格納されているオブジェクトアクセスレベルから求めることができる。具体的には、オブジェクト情報の中で文書IDに対して最も小さいオブジェクトアクセスレベルが、その文書の文書アクセスレベルになる。 The document access level in the document information of FIG. 5 can be obtained from the object access level stored in the object information of FIG. Specifically, the lowest object access level for the document ID in the object information is the document access level for the document.
次に、ステップS306の文書生成処理の詳細について、図9を用いて説明する。 Next, details of the document generation processing in step S306 will be described with reference to FIG.
図9は本発明の実施形態の文書生成処理の詳細を示すフローチャートである。 FIG. 9 is a flowchart showing details of the document generation processing according to the embodiment of the present invention.
ステップS901において、文書ブロック情報から、ステップS305で指定された文書データの文書IDに対応したブロックIDをひとつ取得する。 In step S901, one block ID corresponding to the document ID of the document data designated in step S305 is acquired from the document block information.
ステップS902において、指定された文書データの文書IDに対応した文書ブロック情報中のすべてのブロックIDの取得が終了したか否かを判定する。取得が終了した場合(ステップS902でYES)、ステップS906に進む。一方、取得が終了していない場合(ステップS902でNO)、ステップS903に進む。 In step S902, it is determined whether or not acquisition of all block IDs in the document block information corresponding to the document ID of the designated document data has been completed. When the acquisition is completed (YES in step S902), the process proceeds to step S906. On the other hand, if the acquisition has not ended (NO in step S902), the process proceeds to step S903.
ステップS903において、オブジェクト情報から、対象の文書ID、ブロックIDに対して、ステップS305で指定されたアクセスレベルに対応したブロックのブロック内容を取得する。 In step S903, the block contents of the block corresponding to the access level specified in step S305 are acquired from the object information for the target document ID and block ID.
ここで、ステップS305で指定されたアクセスレベルの値と同じ値のオブジェクトアクセスレベルがあれば、そのオブジェクトアクセスレベルに対応したブロックのブロック内容を取り出す。そうでなければ、指定されたアクセスレベルよりも小さく、最大の値を持つオブジェクトアクセスレベルを探し、そのオブジェクトアクセスレベルに対応したブロックのブロック内容を取得する。 If there is an object access level having the same value as the access level specified in step S305, the block contents of the block corresponding to the object access level are extracted. Otherwise, an object access level that is smaller than the specified access level and has the maximum value is searched, and the block contents of the block corresponding to the object access level are acquired.
ステップS904において、ブロック内容を取得したか否かを判定する。取得していない場合(ステップS904でNO)、次のブロックIDを取得するために、ステップS901に戻る。一方、取得した場合(ステップS904でYES)、ステップS905に進む。 In step S904, it is determined whether the block content has been acquired. If not acquired (NO in step S904), the process returns to step S901 to acquire the next block ID. On the other hand, if acquired (YES in step S904), the flow advances to step S905.
ステップS905において、ステップS305で指定された文書の文書IDと、ステップS901で取得したブロックIDと、ステップS903で取得したブロック内容とを対応させてメモリに一時記憶する。その後、ステップS901に戻る。 In step S905, the document ID of the document specified in step S305, the block ID acquired in step S901, and the block content acquired in step S903 are temporarily stored in the memory in association with each other. Thereafter, the process returns to step S901.
ステップS902において、すべてのブロックIDの取得が終了した場合、ステップS906において、ステップS905で一時記憶したブロックとそのブロック内容を元に、文書データを生成する。生成する文書データは、HTML文書データであり、CSS(Cascading Style sheets)を用いて、ブロック情報に格納されているブロックの位置サイズ情報に基づいて、ブロックの内容をレイアウトする。 If acquisition of all block IDs is completed in step S902, document data is generated in step S906 based on the block temporarily stored in step S905 and its block contents. The generated document data is HTML document data, and the content of the block is laid out based on the position size information of the block stored in the block information using CSS (Cascading Style sheets).
次に、MFP100を用いて文書管理サーバ106で管理されている文書データを検索するための前準備として、マネージメントPC101の制御のもとに、文書データをMFP100内のデータベース118に登録する登録処理の概要について、図10を用いて説明する。
Next, as a preparation for searching for document data managed by the
図10は本発明の実施形態の登録処理を示すフローチャートである。 FIG. 10 is a flowchart showing registration processing according to the embodiment of the present invention.
まず、ステップS1001において、文書管理サーバ106から取得して得られる文書情報を元に、文書IDをひとつ取得する。
First, in step S1001, one document ID is acquired based on the document information acquired from the
ステップS1002において、すべての文書IDの取得が終了したか否かを判定する。取得が終了した場合(ステップS1002でYES)、ステップS1009に進む。一方、取得が終了していない場合(ステップS1002でNO)、ステップS1003に進む。 In step S1002, it is determined whether or not all document IDs have been acquired. If the acquisition is completed (YES in step S1002), the process proceeds to step S1009. On the other hand, if the acquisition has not ended (NO in step S1002), the process proceeds to step S1003.
ステップS1003において、アクセスレベルの最大値から順番に設定する。ステップS1004で、すべてのアクセスレベルの設定が終了したか否かを判定する。設定が終了した場合(ステップS1004でYES)、ステップS1001に戻る。一方、設定が終了していない場合(ステップS1004でNO)、ステップS1005に進む。 In step S1003, the maximum access level is set in order. In step S1004, it is determined whether or not all access levels have been set. When the setting is completed (YES in step S1004), the process returns to step S1001. On the other hand, if the setting has not been completed (NO in step S1004), the process proceeds to step S1005.
ステップS1005において、ステップS306と同様にして、文書管理サーバ106から取得して得られる文書ブロック情報とオブジェクト情報を元に、ステップS1001で取得した文書IDとステップS1003で設定したアクセスレベルに対する文書データを生成する。
In step S1005, similarly to step S306, based on the document block information and object information obtained from the
続いて、ステップS1006において、ステップS1005で生成した文書データと同一の文書データが生成済であるか否かを判定する。生成済である場合(ステップS1006でYES)、ステップS1008にス進む。一方、生成済でない場合(ステップS1006でNO)、ステップS1007に進む。 In step S1006, it is determined whether the same document data as the document data generated in step S1005 has been generated. If it has been generated (YES in step S1006), the flow advances to step S1008. On the other hand, if it has not been generated (NO in step S1006), the process advances to step S1007.
尚、ステップS1006において、生成した文書データと同一の文書データが生成済であるか否かの判定は、図11に示す生成文書情報と図12に示す生成文書ブロック情報を参照して実現する。 In step S1006, whether or not the same document data as the generated document data has been generated is determined with reference to the generated document information shown in FIG. 11 and the generated document block information shown in FIG.
ここで、生成文書情報及び生成文書ブロック情報について、図11及び図12を用いて説明する。 Here, the generated document information and the generated document block information will be described with reference to FIGS.
図11は本発明の実施形態の生成文書情報の一例を示す図である。また、図12は本発明の実施形態の生成文書ブロック情報の一例を示す図である。 FIG. 11 is a diagram illustrating an example of generated document information according to the embodiment of this invention. FIG. 12 is a diagram showing an example of generated document block information according to the embodiment of the present invention.
生成文書情報と生成文書ブロック情報は、文書IDに対して、異なるアクセスレベルごとに生成される文書情報を格納する情報である。生成文書情報は、文書管理サーバ106で管理されている全ての文書データに対して、アクセスレベルによって生成される文書データのバリエーションを格納する情報であり、図11に示すように、文書管理サーバ106で管理されている全ての文書IDに対して、アクセスレベルごとに生成される文書データのIDである生成文書IDと対応付けて管理される。
The generated document information and the generated document block information are information for storing document information generated for different access levels with respect to the document ID. The generated document information is information for storing variations of document data generated according to the access level for all document data managed by the
また、異なるアクセスレベルでも、生成される文書データが同一の場合は、同じ生成文書IDが付与される。 Also, even when the access levels are different, the same generated document ID is assigned when the generated document data is the same.
一方、生成文書ブロック情報は、図12に示すように、生成文書IDに対して、その文書データに含まれるブロック、およびそのブロック内容であるオブジェクトIDとが対応付けて管理される。 On the other hand, as shown in FIG. 12, the generated document block information is managed by associating a generated document ID with a block included in the document data and an object ID that is the content of the block.
図10の説明に戻る。 Returning to the description of FIG.
ステップS1006において、生成した文書データと同一の文書データが生成済でない場合、ステップS1007において、図12に示されるように、生成した文書データに対する生成文書IDを新たに発行し、ステップS1005で生成した文書データのブロックの情報(属性、位置、サイズ)とブロックの内容を示すオブジェクトIDとを生成文書IDと対応させて、データベース118上の生成文書ブロック情報に格納する。
If the same document data as the generated document data has not been generated in step S1006, a generated document ID for the generated document data is newly issued in step S1007 and generated in step S1005, as shown in FIG. Document data block information (attribute, position, size) and object ID indicating the contents of the block are stored in the generated document block information on the
また、図11に示されるように、生成文書IDと文書IDとアクセスレベルを対応させて、データベース118上の生成文書情報に格納する。また、生成文書情報には、生成した文書データに対して、ラスタ画像を作成して縮小することでサムネイル画像を作成し、そのサムネイル画像のアドレス情報を格納する。その後、ステップS1001に戻る。
Further, as shown in FIG. 11, the generated document ID, the document ID, and the access level are associated with each other and stored in the generated document information on the
一方、ステップS1006において、生成した文書データと同一の文書データが生成済である場合、ステップS1008において、生成文書情報の同一の生成文書データの生成文書IDに対して、ステップS1003で設定したアクセスレベルを追加する。その後、ステップS1001に戻る。 On the other hand, if the same document data as the generated document data has been generated in step S1006, the access level set in step S1003 for the generated document ID of the same generated document data in the generated document information in step S1008. Add Thereafter, the process returns to step S1001.
ステップS1002において、すべての文書IDの取得が終了した場合(ステップS1002でYES)、ステップS1009において、文書管理サーバ106から取得して得られるオブジェクト情報を元に、各オブジェクトの種別に応じて特徴量情報の抽出を行う。
If acquisition of all document IDs is completed in step S1002 (YES in step S1002), a feature amount corresponding to the type of each object is obtained based on the object information obtained from the
例えば、画像ブロックについては、色に関する画像特徴量を抽出する。文字ブロックについては、その文字ブロック中の文字列を文字特徴量として抽出する。各オブジェクトの種別に応じて抽出した特徴量の内、画像特徴量は、図13に示す色特徴量情報として、文字特徴量は、図14に示す文字特徴量情報としてそれぞれデータベース118上に登録する。その後、登録処理を終了する。
For example, for an image block, an image feature amount related to color is extracted. For a character block, a character string in the character block is extracted as a character feature amount. Of the feature quantities extracted in accordance with the type of each object, the image feature quantity is registered on the
次に、紙文書から対応するオリジナルの文書データを検索し、印刷等の各種処理を実行する検索処理について、図15を用いて説明する。 Next, a search process for searching corresponding original document data from a paper document and executing various processes such as printing will be described with reference to FIG.
図15は本発明の実施形態の検索処理を示すフローチャートである。 FIG. 15 is a flowchart showing search processing according to the embodiment of the present invention.
まず、ステップS1501において、マネージメントPC101からオリジナル文書検索システムのログインを行う。ステップS301と同様に、キーボードから、ユーザ名とパスワードを入力する。入力されたユーザ名とパスワードは、文書管理サーバ106へ送信され、ステップS301と同様に、ユーザ名とパスワードの正当性が判定され、正当性が確認されるとセッションが開始される。
In step S1501, the
続いて、ステップS1502において、ステップS303と同様にして、文書管理サーバ106において、ユーザのアクセスレベルを取得する。
In step S1502, the
アクセスレベルを取得すると、ユーザ名とパスワードの正当性の判定結果が、文書管理サーバ106から返信され、正当である場合は、ステップS1503において、マネージメントPC101は、MFP100のADFを含む画像入力部110を動作させ、紙文書をラスタ状に走査してラスタ画像を記憶部111に読み込む。
When the access level is acquired, the result of determination of the validity of the user name and password is returned from the
ステップS1504において、記憶部111に格納されている1ページ分のラスタ画像に対して、ブロックセレクション(BS)処理を行う。この処理は、マネージメントPC101の制御によって実行する。
In step S1504, block selection (BS) processing is performed on the raster image for one page stored in the
具体的には、マネージメントPC101のCPUは、記憶部111に格納された処理対象のラスタ画像を、まず、文字/線画部分とハーフトーン画像部分とに領域分割し、文字/線画部分は更に段落で塊として纏まっているブロック毎に、あるいは線で構成された表、図形毎に分割する。
Specifically, the CPU of the
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等のブロックに分割する。 On the other hand, the halftone image part is divided into blocks such as an image part of a block separated into a rectangle and a background part.
ここで、ブロックセレクション処理を行う前のラスタ画像とブロックセレクションの結果の対応の例を、図16に示す。 Here, an example of the correspondence between the raster image before the block selection process and the result of the block selection is shown in FIG.
次に、ステップS1505において、各ブロックの種別に応じてブロック毎に特徴量抽出を行う。 Next, in step S1505, feature amount extraction is performed for each block according to the type of each block.
この特徴量抽出においては、画像ブロックについては、その位置とサイズを対応させ、さらに、色に関する画像特徴量を対応させて画像特徴量情報(紙文書画像特徴量情報)とする。紙文書画像特徴量情報の例を図17に示す。また、文字ブロックに対しては、その位置とサイズを対応させ、さらに、OCRをかけて抽出された文字コードを文字特徴量(紙文書文字特徴量情報)とする。ここで、紙文書文字特徴量情報の例を図18に示す。 In this feature amount extraction, the position and size of an image block are associated with each other, and further, the image feature amount relating to color is associated with image feature amount information (paper document image feature amount information). An example of the paper document image feature amount information is shown in FIG. In addition, the character block is made to correspond to the position and size of the character block, and the character code extracted by OCR is used as the character feature amount (paper document character feature amount information). Here, an example of the paper document character feature information is shown in FIG.
そして、これらの紙文書文字特徴量情報と紙文書画像特徴量情報は、記憶部111内に一時的に記憶される。
The paper document character feature amount information and the paper document image feature amount information are temporarily stored in the
次に、ステップS1506において、比較処理を行う。データベース118に格納されている生成文書ブロック情報を元に、生成文書IDをひとつずつ順番に処理し、生成文書IDに対応したブロック情報(位置、サイズ、属性)と、そのブロック(オブジェクトID)に対応したデータベース118中の色特徴量情報とテキスト特徴量情報を、記憶部111内に格納されている紙文書画像特徴量情報と紙文書文字特徴量情報から類似度を算出し、所定の閾値よりも高い文書データを、文書候補リストに登録する。
Next, in step S1506, a comparison process is performed. Based on the generated document block information stored in the
文書候補リストは、生成文書IDと類似度を対応させたリストであり、その一例を、図19に示す。文書候補リストの中では、類似度の値によって、生成文書IDが降順にソーティングされる。 The document candidate list is a list in which the generated document ID is associated with the similarity, and an example thereof is shown in FIG. In the document candidate list, the generated document IDs are sorted in descending order according to the similarity value.
ステップS1507において、候補表示/選択を行う。文書候補リストに格納されている生成文書IDに対する文書データのサムネイルを表示し、複数の候補の中からオペレータがオリジナルの文書データの生成文書IDの特定を行う。サムネイルは、データベース118中に格納された生成文書情報から生成文書IDに対応したサムネイル画像を得ることができる。
In step S1507, candidate display / selection is performed. A thumbnail of the document data corresponding to the generated document ID stored in the document candidate list is displayed, and the operator specifies the generated document ID of the original document data from a plurality of candidates. A thumbnail image corresponding to the generated document ID can be obtained from the generated document information stored in the
マネージメントPC101のディスプレイに、生成文書IDに対応したサムネイル画像の一覧を表示し、オペレータは、その中からサムネイル画像の一つを選択すると、選択されたサムネイル画像に対応した生成文書IDが選択されることになる。
A list of thumbnail images corresponding to the generated document ID is displayed on the display of the
続いて、ステップS1508において、ステップS1507で選択された生成文書IDに対して、取得する文書IDを設定し、さらに、取得する際に必要となるアクセスレベルの設定を行う。 In step S1508, a document ID to be acquired is set for the generated document ID selected in step S1507, and an access level necessary for acquisition is set.
続いて、ステップS1509において、ステップS1508で設定された文書IDに対して、設定されたアクセスレベルに対応した文書データを文書管理サーバ106から取得する。これは、文書管理サーバ106の文書生成プログラムに、ステップS1501でログインしたセッションで、文書IDとアクセスレベルを送信し、文書IDとアクセスレベルに対応した文書データを生成させて取得する。この処理は、ステップS306と同様である。
In step S1509, document data corresponding to the set access level is acquired from the
ステップS1510において、ステップS1509で取得した文書データに対して、オペレータの指示に基づいて、印刷、配信、編集のいずれかの処理を行う。 In step S1510, any one of printing, distribution, and editing is performed on the document data acquired in step S1509 based on an instruction from the operator.
以下、各処理の詳細について説明する。 Details of each process will be described below.
まず、ステップS1504のブロックセレクション処理の詳細について説明する。 First, details of the block selection process in step S1504 will be described.
ブロックセレクション処理とは、例えば、図16(a)の示すラスタ画像を、図16(b)のように、意味のある各オブジェクト毎の塊として認識し、該ブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。 In the block selection process, for example, the raster image shown in FIG. 16A is recognized as a block for each meaningful object as shown in FIG. 16B, and the attribute (character (TEXT)) of each block is recognized. / Picture (PICTURE) / Photo (PHOTO) / Line (LINE) / Table (TABLE), etc.), and is divided into blocks having different attributes.
ブロックセレクション処理の実施形態を以下に説明する。 An embodiment of the block selection process will be described below.
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。 First, the input image is binarized into black and white, and contour tracking is performed to extract a block of pixels surrounded by a black pixel contour. For a black pixel block with a large area, the white pixel block is extracted by tracing the outline of the white pixel inside, and a black pixel is recursively extracted from the white pixel block with a certain area or more. Extract the lump.
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。 The blocks of black pixels obtained in this way are classified by size and shape, and are classified into blocks having different attributes. For example, a block in a range where the aspect ratio is close to 1 and the size is constant is a pixel block corresponding to a character, a portion where adjacent characters can be grouped in an aligned manner is a character block, and a flat pixel block is a line block. The area occupied by the black pixel block that is larger than the size and contains the rectangular white pixel block well aligned is a table block, the area where the irregular pixel block is scattered is a photo block, and the pixel block of any other shape is drawn. Let it be a block.
次に、ステップS1505の特徴量抽出処理の詳細について説明する。 Next, details of the feature amount extraction processing in step S1505 will be described.
尚、特徴量抽出は、画像、文字で処理方法が異なるので、それぞれ別に説明する。 It should be noted that the feature amount extraction will be described separately because the processing method differs between images and characters.
ここで、画像ブロックは、図16(b)の例の場合、写真ブロックと図画ブロックとするが、用途や目的に応じて、画像ブロックを写真ブロック及び図画ブロックの少なくとも一方にすることも可能である。 Here, in the example of FIG. 16B, the image block is a photographic block and a graphic block, but the image block may be at least one of a photographic block and a graphic block depending on the application and purpose. is there.
まず、画像ブロックに対する特徴量抽出処理について説明する。 First, feature amount extraction processing for an image block will be described.
尚、1文書に複数の画像ブロックが存在する場合は、その総数分、以下の処理を繰り返す。 If there are a plurality of image blocks in one document, the following processing is repeated for the total number of image blocks.
本実施形態では、一例として、画像の色に関する色特徴量を抽出する色特徴量情報抽出処理を行う。 In this embodiment, as an example, color feature amount information extraction processing for extracting a color feature amount related to the color of an image is performed.
この色特徴量情報抽出処理の詳細について、図20を用いて説明する。 Details of the color feature amount information extraction processing will be described with reference to FIG.
図20は本発明の実施形態の色特徴量情報抽出処理の詳細を示すフローチャートである。 FIG. 20 is a flowchart showing details of color feature amount information extraction processing according to the embodiment of the present invention.
尚、この処理では、処理対象画像を複数のメッシュブロックに分割した各メッシュブロックの色ヒストグラム中の最頻色を有する色と各メッシュブロックの位置情報を対応づけた情報を色特徴情報として抽出する。 In this process, information associating the color having the most frequent color in the color histogram of each mesh block obtained by dividing the processing target image into a plurality of mesh blocks and the position information of each mesh block is extracted as color feature information. .
まず、ステップS2020で、画像を複数のメッシュブロックに分割する。本実施形態では、図21に示すように、画像を縦横をそれぞれ9メッシュブロックに分割する。特に、本実施形態では、表記の都合上9×9=81メッシュブロックに分割している例を示しているが、実際には、15×15=225メッシュブロック程度であることが好ましい。 First, in step S2020, the image is divided into a plurality of mesh blocks. In the present embodiment, as shown in FIG. 21, the image is divided into 9 mesh blocks in the vertical and horizontal directions. In particular, in the present embodiment, an example in which it is divided into 9 × 9 = 81 mesh blocks is shown for convenience of description, but actually, it is preferable that the number is about 15 × 15 = 225 mesh blocks.
次に、ステップS2030で、処理対象となる着目メッシュブロックを左上端のブロックに設定する。尚、この着目メッシュブロックの設定は、例えば、図22に示すように、予め処理順序が決定された順序決定テーブルを参照して行う。本実施形態では、左上端から右へ走査し、その行を終えると次の行の左端から右へスキャンする走査例を示している。 In step S2030, the target mesh block to be processed is set as the upper left block. For example, as shown in FIG. 22, the target mesh block is set with reference to an order determination table in which the processing order is determined in advance. In the present embodiment, a scanning example is shown in which scanning is performed from the upper left end to the right, and when the line is finished, scanning is performed from the left end of the next line to the right.
ステップS2040で、未処理の着目メッシュブロックの有無を判定する。未処理の着目メッシュブロックがない場合(ステップS2040でNO)、処理を終了する。一方、未処理の着目メッシュブロックがある場合(ステップS2040でYES)、ステップS2050に進む。 In step S2040, the presence / absence of an unprocessed target mesh block is determined. If there is no unprocessed target mesh block (NO in step S2040), the process ends. On the other hand, if there is an unprocessed target mesh block (YES in step S2040), the process proceeds to step S2050.
ステップS2050で、着目メッシュブロックの全画素の各濃度値を、図23の色空間を分割して作った部分空間である色ビンへ射影し、色ビンに対する色ヒストグラムを生成する。 In step S2050, the density values of all the pixels of the target mesh block are projected onto a color bin, which is a partial space created by dividing the color space of FIG. 23, and a color histogram for the color bin is generated.
尚、本実施形態では、図23に示すように、RGB色空間を3×3×3=27に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影する場合を示しているが、実際には、RGB色空間を6×6×6=216に分割した色ビンへ着目メッシュブロックの全画素の濃度値を射影するほうが好ましい。 In the present embodiment, as shown in FIG. 23, the density values of all the pixels of the target mesh block are projected onto the color bin obtained by dividing the RGB color space into 3 × 3 × 3 = 27. Actually, it is preferable to project the density values of all the pixels of the target mesh block onto the color bin obtained by dividing the RGB color space into 6 × 6 × 6 = 216.
ステップS2060で、色ヒストグラムの最頻色ビンの色ビンIDをその着目メッシュブロックの代表色と決定し、その着目メッシュブロックとその位置に対応づけて記憶部111に記憶する。
In step S2060, the color bin ID of the most frequent color bin of the color histogram is determined as the representative color of the target mesh block, and stored in the
ステップS2070で、図22の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS2040に戻り、未処理の着目メッシュブロックがなくなるまで、ステップS2040〜ステップS2070の処理を繰り返す。 In step S2070, the target mesh block to be processed next is set with reference to the order determination table of FIG. Then, it returns to step S2040 and repeats the process of step S2040-step S2070 until there is no unprocessed focused mesh block.
以上の処理によって、処理対象画像(画像ブロック)のメッシュブロック毎の代表色と各メッシュブロックの位置情報が対応付けられた情報を色特徴量情報として抽出することができる。 Through the above processing, information in which the representative color for each mesh block of the processing target image (image block) and the position information of each mesh block are associated can be extracted as color feature amount information.
次に、文字ブロックに対する文字特徴量情報抽出処理について説明する。 Next, character feature information extraction processing for character blocks will be described.
尚、1文書に複数の文字ブロックが存在する場合は、その総数分、以下の処理を繰り返す。 If there are a plurality of character blocks in one document, the following processing is repeated for the total number of character blocks.
文字ブロックに対する文字特徴量情報は、その文字ブロックにOCR(文字認識)処理を施して得られる文字コードとする。 Character feature amount information for a character block is a character code obtained by subjecting the character block to OCR (character recognition) processing.
OCR(文字認識)処理は、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチングの一手法を用いて文字認識を行い、対応する文字コードを取得する。 In the OCR (character recognition) process, character recognition is performed on a character image cut out in character units from a character block using a pattern matching method, and a corresponding character code is acquired.
この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。 This character recognition process compares an observed feature vector obtained by converting a feature obtained from a character image into a numerical sequence of several tens of dimensions with a dictionary feature vector obtained in advance for each character type. Is the recognition result.
特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。 There are various known methods for extracting a feature vector. For example, there is a method characterized by dividing a character into meshes and using a mesh number-dimensional vector obtained by counting character lines in each mesh block as line elements according to directions.
ブロックセレクション処理(ステップS1504)で抽出された文字ブロックに対して文字認識を行う場合は、まず、該当文字ブロックに対し横書き/縦書きの判定を行い、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。 When character recognition is performed on the character block extracted in the block selection process (step S1504), first, horizontal writing / vertical writing is determined for the corresponding character block, and a character string is cut out in the corresponding direction. The character image is obtained by cutting out the character from the character string.
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。 The horizontal / vertical writing is determined by taking a horizontal / vertical projection of the pixel value in the corresponding character block. If the horizontal projection has a large variance, the horizontal writing is determined, and if the vertical projection has a large variance, the vertical writing is determined. If the block is a horizontally written character block, the character string and character are decomposed by cutting out the line using the horizontal projection and cutting out the character from the vertical projection of the cut line. . On the other hand, for vertically written character blocks, horizontal and vertical may be reversed.
次に、ステップS1506の比較処理の詳細について、図24を用いて説明する。 Next, details of the comparison processing in step S1506 will be described with reference to FIG.
図24は本発明の実施形態の比較処理の詳細を示すフローチャートである。 FIG. 24 is a flowchart showing details of the comparison processing according to the embodiment of the present invention.
まず、ステップS2410で、比較先文書を管理する生成文書情報の先頭から文書IDを順番に取得する。 First, in step S2410, document IDs are acquired in order from the top of generated document information for managing comparison target documents.
次に、ステップS2420で、すべての文書IDの取得が終了したか否かを判定する。取得が終了した場合(ステップS2420でNO)、ステップS2470に進む。一方、取得が終了していない場合(ステップS2420でYES)、ステップS2430に進む。 In step S2420, it is determined whether all document IDs have been acquired. If the acquisition is complete (NO in step S2420), the process advances to step S2470. On the other hand, if acquisition has not ended (YES in step S2420), the flow advances to step S2430.
次に、ステップS2430で、レイアウトの比較を行う。ここで、レイアウトとは、ブロック情報にあるブロックの属性、サイズ、位置のことである。 In step S2430, layouts are compared. Here, the layout refers to the attribute, size, and position of the block in the block information.
ここで、ステップS1504で抽出したブロックセレクション処理で得られたレイアウトの情報は、属性が画像であるブロックのサイズと位置は、紙文書画像特徴量情報に格納されており、属性が文字であるブロックのサイズと位置は、紙文書テキスト特徴量情報に格納されている。 Here, in the layout information obtained by the block selection process extracted in step S1504, the size and position of the block whose attribute is an image are stored in the paper document image feature information, and the block whose attribute is a character. Are stored in the paper document text feature amount information.
具体的には、各ブロックの属性、サイズ、位置と、ステップS2410で取得した文書IDに対応した生成文書ブロック情報中の各ブロックの属性、サイズ、位置を比較し、レイアウトが同じであるか否かを判定する。 Specifically, the attribute, size, and position of each block are compared with the attribute, size, and position of each block in the generated document block information corresponding to the document ID acquired in step S2410, and the layout is the same. Determine whether.
そして、比較元画像(紙文書)と比較先画像(オリジナル文書)のレイアウトが同じである場合(ステップS2430でYES)、ステップS2440に進む。一方、比較元画像と比較先画像のレイアウトが同じでない場合(ステップS2430でNO)、ステップS2410に戻る。 If the comparison source image (paper document) and the comparison destination image (original document) have the same layout (YES in step S2430), the process advances to step S2440. On the other hand, if the layouts of the comparison source image and the comparison destination image are not the same (NO in step S2430), the process returns to step S2410.
次に、ステップS2440で、比較元画像(紙文書)と比較先画像(オリジナル文書)のページ同士の比較を行うページ比較処理を実行する。この比較は、ブロックの属性に合わせ、文字、画像それぞれに応じた特徴量を用いて、複合的に比較を行い、ページの類似度を算出する。この処理の詳細については後述する。 Next, in step S2440, page comparison processing for comparing pages of the comparison source image (paper document) and the comparison destination image (original document) is executed. This comparison is performed in a composite manner using feature amounts corresponding to characters and images according to the block attributes, and the similarity of pages is calculated. Details of this processing will be described later.
次に、ステップS2450で、算出された類似度が閾値以上であるか否かを判定する。閾値未満である場合(ステップS2450でNO)、ステップS2410に戻る。一方、閾値以上である場合(ステップS2450でYES)、ステップS2460に進む。 Next, in step S2450, it is determined whether the calculated similarity is greater than or equal to a threshold value. If it is less than the threshold value (NO in step S2450), the process returns to step S2410. On the other hand, if it is equal to or greater than the threshold value (YES in step S2450), the process proceeds to step S2460.
次に、ステップS2460で、現在処理中の文書IDに対応した文書候補リストの類似度合計に、ステップS2440で算出された類似度を累積加算する。その後、ステップS2410へ戻り、比較先文書となる次の文書IDを生成文書情報から取得する。 Next, in step S2460, the similarity calculated in step S2440 is cumulatively added to the similarity total of the document candidate list corresponding to the currently processed document ID. Thereafter, the process returns to step S2410, and the next document ID to be the comparison target document is acquired from the generated document information.
一方、ステップS2420において、すべての文書IDの取得が終了した場合、ステップS2470に進み、文書候補リストに登録されている文書IDを対応する類似度合計の値によって降順にソートし、比較処理を終了する。 On the other hand, if all the document IDs have been acquired in step S2420, the process proceeds to step S2470, where the document IDs registered in the document candidate list are sorted in descending order by the corresponding similarity total value, and the comparison process ends. To do.
次に、ステップS2440の特徴量比較処理の詳細について、図25を用いて説明する。 Next, details of the feature amount comparison processing in step S2440 will be described with reference to FIG.
図25は本発明の実施形態の特徴量比較処理の詳細を示すフローチャートである。 FIG. 25 is a flowchart showing details of the feature amount comparison processing according to the embodiment of the present invention.
まず、ステップS2510で、生成文書ブロック情報を参照し、処理対象となる文書IDに対応する文書データ中で、未比較のブロックの有無を判定する。未比較のブロックがない場合(ステップS2510でNO)、ステップS2570に進む。一方、未比較のブロックがある場合(ステップS2510でYES)、ステップS2520に進む。 First, in step S2510, the generated document block information is referenced to determine whether there is an uncompared block in the document data corresponding to the document ID to be processed. If there is no uncompared block (NO in step S2510), the process advances to step S2570. On the other hand, if there are uncompared blocks (YES in step S2510), the flow advances to step S2520.
次に、ステップS2520で、比較対象のブロックの属性を判定する。属性が画像ブロックである場合、ステップS2540に進む。一方、属性が文字ブロックである場合、ステップS2560に進む。 Next, in step S2520, the attribute of the comparison target block is determined. If the attribute is an image block, the process proceeds to step S2540. On the other hand, if the attribute is a character block, the process proceeds to step S2560.
属性が画像ブロックである場合、ステップS2540で、色に関する特徴量情報で比較元ブロックと比較先ブロックとの類似比較である色特徴量情報比較処理を行う。この処理の詳細については後述する。これによって得られる類似度は、比較先の文書ID、ブロックIDに対応させて記憶部111に一時記憶する。
If the attribute is an image block, in step S2540, color feature amount information comparison processing, which is a similarity comparison between the comparison source block and the comparison target block, is performed with the feature amount information about color. Details of this processing will be described later. The degree of similarity thus obtained is temporarily stored in the
一方、属性が文字ブロックである場合、ステップS2560で、文字の特徴量情報での比較元ブロックと比較先ブロックとの類似比較である文字特徴量情報比較処理を行う。この処理の詳細については後述する。また、これによって得られる類似度は、比較先の文書ID、ブロックIDに対応させて記憶部111に一時記憶する。
On the other hand, if the attribute is a character block, in step S2560, a character feature amount information comparison process, which is a similarity comparison between the comparison source block and the comparison target block in the character feature amount information, is performed. Details of this processing will be described later. Further, the similarity obtained thereby is temporarily stored in the
次に、ステップS2510において、全てのブロックとの比較が終了した場合(ステップS2510でNO)、ステップS2570に進み、ステップS2540及びステップS2560の処理によって記憶部111に記憶されている、比較先文書(オリジナル文書)のページに含まれる全てのブロックの類似度を統合し、検索条件である紙文書とオリジナル文書中のページとの類似度を算出する統合処理を行う。
Next, in step S2510, when the comparison with all the blocks is completed (NO in step S2510), the process proceeds to step S2570, and the comparison destination document (stored in the
次に、ステップS2540の色特徴量情報比較処理の詳細について、図26を用いて説明する。 Next, details of the color feature amount information comparison processing in step S2540 will be described with reference to FIG.
図26は本発明の実施形態の色特徴量情報比較処理の詳細を示すフローチャートである。 FIG. 26 is a flowchart showing details of color feature amount information comparison processing according to the embodiment of the present invention.
まず、ステップS2610で、比較元画像と比較先画像の色特徴量を色特徴量情報から読み出す。 First, in step S2610, the color feature amounts of the comparison source image and the comparison destination image are read from the color feature amount information.
次に、ステップS2620で、処理対象とする画像中の着目メッシュブロックを先頭に設定する。ステップS2630で、比較元画像の色特徴量と、比較対象の色特徴量の類似度を示す類似距離を0にリセットする。 In step S2620, the target mesh block in the image to be processed is set at the head. In step S2630, the similarity distance indicating the similarity between the color feature value of the comparison source image and the color feature value to be compared is reset to zero.
ステップS2640で、未比較の着目メッシュブロックの有無を判定する。未比較の着目メッシュブロックがない場合(ステップS2640でNO)、ステップS2680に進む。一方、未比較の着目メッシュブロックがある場合(ステップS2640でYES)、ステップS2650に進む。 In step S2640, the presence / absence of an uncompared target mesh block is determined. If there is no uncompared target mesh block (NO in step S2640), the process advances to step S2680. On the other hand, if there is an uncompared target mesh block (YES in step S2640), the process advances to step S2650.
ステップS2650で、比較元画像と比較先画像のそれぞれの色特徴量から、それぞれの着目メッシュブロックの色ビンIDを取得する。 In step S2650, the color bin ID of each target mesh block is acquired from each color feature amount of the comparison source image and the comparison destination image.
ステップS2660で、図27の色ビンペナルティマトリックスを参照して、取得した色ビンID間に対応する着目メッシュブロックの局所的類似距離を取得し、これを直前の処理で取得している類似距離に累積加算する。そして、この類似距離は記憶部111に記憶する。
In step S2660, the local similarity distance of the target mesh block corresponding to the acquired color bin ID is acquired with reference to the color bin penalty matrix of FIG. 27, and this is used as the similar distance acquired in the immediately preceding process. Cumulative addition. The similarity distance is stored in the
ここで、色ビンペナルティマトリックスについて、図27を用いて説明する。 Here, the color bin penalty matrix will be described with reference to FIG.
図27は本発明の実施形態の色ビンペナルティマトリックスの構成を示す図である。 FIG. 27 is a diagram showing the configuration of the color bin penalty matrix according to the embodiment of the present invention.
色ビンペナルティマトリックスは、色ビンID同士の局所的類似距離を管理するマトリックスである。図27によれば、色ビンペナルティマトリックスは、同一色ビンIDではその類似距離は0となり、色ビンID同士の差が大きくなるほど、つまり、類似度が低くなるほど、その類似距離は大きくなるように構成されている。また、同一色ビンIDの対角位置は全て、その類似距離は0で、それを境に対称性を持っている。 The color bin penalty matrix is a matrix that manages the local similarity distance between the color bin IDs. According to FIG. 27, the color bin penalty matrix has a similarity distance of 0 for the same color bin ID, and the similarity distance increases as the difference between the color bin IDs increases, that is, as the similarity decreases. It is configured. In addition, all the diagonal positions of the same color bin ID have a similarity distance of 0 and have symmetry with respect to the boundary.
このように、本実施形態では、色ビンペナルティマトリックスを参照するだけで、色ビンID同士の類似距離を取得することができるので、処理の高速化を図ることができる。 Thus, in this embodiment, the similarity distance between the color bin IDs can be acquired only by referring to the color bin penalty matrix, so that the processing can be speeded up.
そして、ステップS2670で、図22の順序決定テーブルを参照して、次の処理対象となる着目メッシュブロックを設定する。その後、ステップS2640に戻る。 In step S2670, the target mesh block to be processed next is set with reference to the order determination table of FIG. Thereafter, the process returns to step S2640.
そして、ステップS2640で、未比較の着目メッシュブロックがない場合(ステップS2640でNO)、ステップS2680に進み、記憶部111に記憶されている類似距離を類似度に変換し、ブロックIDと対にして出力する。
In step S2640, if there is no uncompared target mesh block (NO in step S2640), the process proceeds to step S2680, and the similarity distance stored in the
尚、類似度への変換は、例えば、類似距離が最小値のときを類似度100%、類似距離が最大値のときを類似度0%として、その範囲内の類似距離に対する類似度は、最小値あるいは最大値に対する差に基づいて算出するようにすれば良い。 The conversion to similarity is, for example, 100% similarity when the similarity distance is the minimum value, 0% similarity when the similarity distance is the maximum value, and the similarity to the similarity distance within the range is the minimum What is necessary is just to calculate based on the difference with respect to a value or a maximum value.
次に、ステップS2560の文字特徴量情報比較処理の詳細について説明する。 Next, details of the character feature amount information comparison processing in step S2560 will be described.
この処理では、比較元画像と比較先画像中のそれぞれの文字ブロック内の各文字コード同士の比較を行い、その一致度から類似度を算出する。 In this process, the character codes in the character blocks in the comparison source image and the comparison target image are compared with each other, and the similarity is calculated from the matching degree.
尚、検索条件とする紙文書とオリジナル文書との比較である場合、類似度は100%となるのが理想的であるが、実際には、検索条件となる紙文書中の文字ブロックに対するOCR処理では誤認識が発生する場合があるので、オリジナル文書との比較であっても、類似度は100%にならないことはあるが、かなり100%に近い値となる。 It should be noted that when comparing a paper document as a search condition with an original document, the similarity is ideally 100%. However, in actuality, OCR processing is performed on a character block in a paper document as a search condition. In some cases, misrecognition may occur. Therefore, even when compared with the original document, the degree of similarity may not be 100%, but is a value close to 100%.
次に、ステップS2570の統合処理の詳細について説明する。 Next, details of the integration processing in step S2570 will be described.
この統合処理では、比較先画像であるオリジナル文書内で占めている割合の大きいブロックの類似度が、オリジナル文書全体の類似度としてより大きく反映されるような、算出されたブロック毎の類似度の統合を行う。 In this integration processing, the similarity of the calculated block-by-block similarity is such that the similarity of the block that accounts for a large proportion in the original document that is the comparison target image is more largely reflected as the similarity of the entire original document. Perform integration.
例えば、オリジナル文書中のブロックB1〜B6に対し、ブロック毎の類似率がn1〜n6と算出されたとする。このときオリジナル文書全体の総合類似率Nは、以下の式で表現される。 For example, it is assumed that the similarity ratio for each block is calculated as n1 to n6 for the blocks B1 to B6 in the original document. At this time, the overall similarity N of the entire original document is expressed by the following equation.
N=w1*n1+w2*n2+w3*n3+ ・・・ +w6*n6 (1)
ここで、w1〜W6は、各ブロックの類似率を評価する重み係数である。重み係数w1〜w6は、ブロックのオリジナル文書内占有率により算出する。例えば、ブロック1〜6のサイズをS1〜S6とすると、ブロック1の占有率w1は、
w1=S1/(S1+S2+・・・+S6) (2)
として算出することができる。
N = w1 * n1 + w2 * n2 + w3 * n3 +... + W6 * n6 (1)
Here, w1 to W6 are weighting factors for evaluating the similarity of each block. The weighting factors w1 to w6 are calculated based on the occupation ratio of the block in the original document. For example, if the sizes of the
w1 = S1 / (S1 + S2 +... + S6) (2)
Can be calculated as
このような占有率を用いた重み付け処理により、オリジナル文書内で大きな領域を占めるブロックの類似度がより、オリジナル文書全体の類似度に反映することができる。 By the weighting process using such an occupancy rate, the similarity of blocks that occupy a large area in the original document can be reflected in the similarity of the entire original document.
次に、ステップS1508のアクセスレベル設定処理の詳細について、図28を用いて説明する。 Next, details of the access level setting process in step S1508 will be described with reference to FIG.
図28は本発明の実施形態のアクセスレベル設定処理の詳細を示すフローチャートである。 FIG. 28 is a flowchart showing details of access level setting processing according to the embodiment of this invention.
ステップS2801において、ステップS1507で選択した生成文書IDに対する文書アクセスレベルを取得し、ステップS1502で取得したユーザアクセスレベルと比較する。 In step S2801, the document access level for the generated document ID selected in step S1507 is acquired and compared with the user access level acquired in step S1502.
文書アクセスレベルは、生成文書情報から生成文書IDに対応したアクセスレベルを取得でき、ひとつの生成文書IDに対して、複数のアクセスレベルが存在する可能性がある。そして、ユーザアクセスレベルと同じ値が、生成文書情報から得られるアクセスレベルに含まれていれば、文書アクセスレベルを変更せずに、アクセスレベル設定処理を終了する。 As the document access level, an access level corresponding to the generated document ID can be acquired from the generated document information, and there is a possibility that a plurality of access levels exist for one generated document ID. If the same value as the user access level is included in the access level obtained from the generated document information, the access level setting process is terminated without changing the document access level.
一方、ユーザアクセスレベルが、生成文書情報から得られる文書アクセスレベルの最大値よりも大きい場合は、ステップS2802に進む。 On the other hand, if the user access level is higher than the maximum value of the document access level obtained from the generated document information, the process proceeds to step S2802.
ステップS2802において、ユーザに、取得する文書データのアクセスレベルを指定させる。これは、ステップS1503で読み込んだ紙文書のアクセスレベルが、ユーザのアクセスレベルよりも低い場合であり、ユーザが、欲しい文書データとして、スキャンした紙文書と同じアクセスレベルの文書データが欲しい場合と、自分のアクセスレベルに応じた文書データが欲しい場合の両方があり、その両方に対応するためである。 In step S2802, the user is allowed to specify the access level of the document data to be acquired. This is a case where the access level of the paper document read in step S1503 is lower than the access level of the user, and the user wants document data having the same access level as the scanned paper document as the desired document data. This is because there are both cases where document data corresponding to the access level of the user is desired, and both of them are supported.
また、この場合、読み込んだ紙文書よりも低いアクセスレベルの文書データを選択することも、読み込んだ紙文書よりも高く、ユーザよりも低いアクセスレベルの文書をデータ選択することも可能である。但し、ユーザよりも高いアクセスレベルの文書データを選択することはできないとする。 In this case, it is also possible to select document data with an access level lower than that of the read paper document, or to select data with an access level higher than that of the read paper document and lower than that of the user. However, it is assumed that document data having a higher access level than the user cannot be selected.
そこで、ステップS2802では、選択可能なアクセスレベルをユーザに提示し、ユーザはその中からアクセスレベルを選択することにより、必要に応じて、ステップS2801で取得した文書アクセスレベルを変更する。その後、処理を終了する。 Therefore, in step S2802, the selectable access level is presented to the user, and the user selects the access level from among them, thereby changing the document access level acquired in step S2801 as necessary. Thereafter, the process ends.
ステップS2801において、ユーザアクセスレベルが、生成文書情報から得られる文書アクセスレベルの最小値よりも小さい場合は、ステップS2803に進む。 If the user access level is smaller than the minimum value of the document access level obtained from the generated document information in step S2801, the process proceeds to step S2803.
ステップS2803において、ステップS1507で選択した生成文書IDから、対応する文書IDを取得し、その文書データを管理している管理者の管理者端末に、その文書データにアクセスできないユーザが、紙文書を利用しようとしていることを示す警告情報を出力する。これは、生成文書情報から選択された生成文書IDに対する文書IDを取得し、それに対応する文書情報から文書IDに対応した管理者を取得することができる。 In step S2803, a corresponding document ID is acquired from the generated document ID selected in step S1507, and a user who cannot access the document data to a manager terminal of the manager who manages the document data creates a paper document. Outputs warning information indicating that it is going to be used. In this case, the document ID corresponding to the generated document ID selected from the generated document information can be acquired, and the administrator corresponding to the document ID can be acquired from the corresponding document information.
管理者への通知は、例えば、管理者に対して電子メールアドレスを対応付けておき、電子メールで、ステップS1501でスキャンしたユーザ名とアクセスレベルと文書名、文書ID等の必要な情報を通知する。あるいは、専用の通知画面を用いて、通知しても良い。 For notification to the administrator, for example, an e-mail address is associated with the administrator, and necessary information such as the user name, access level, document name, and document ID scanned in step S1501 is notified by e-mail. To do. Alternatively, notification may be made using a dedicated notification screen.
続いて、ステップS2804において、ステップS2801で取得した文書アクセスレベルの値を、ユーザアクセスレベルに変更する。その後、処理を終了する。 In step S2804, the value of the document access level acquired in step S2801 is changed to the user access level. Thereafter, the process ends.
以上説明したように、本実施形態によれば、ユーザに応じて動的に生成される文書データに対して、その印刷物から別のユーザがオリジナルの電子文書データを検索した場合でも、検索した文書データを取得する際に、検索者に応じた文書データを生成するので、検索者に応じた情報を含む文書データを取得することができる。 As described above, according to the present embodiment, even when another user searches the original electronic document data from the printed material for the document data dynamically generated according to the user, the searched document Since document data corresponding to the searcher is generated when data is acquired, document data including information corresponding to the searcher can be acquired.
また、ユーザに応じて動的に生成される文書データに対して、その印刷物から別のユーザがオリジナルの電子文書データを検索した場合に、検索結果を確認しやすくし、かつ、検索者に応じた情報を含むオリジナルの電子文書データを取得することができる。 In addition, for document data that is dynamically generated according to the user, when another user searches the original electronic document data from the printed matter, it is easy to check the search results and also according to the searcher. The original electronic document data including the information can be acquired.
また、紙文書からオリジナルの電子文書データを検索する場合に、アクセスできない情報を含む紙文書から検索が行われたことを検知することにより、アクセスできない情報が拡散することを防ぐようにすることができる。また、検知した後、その情報の管理者に通知することにより、情報漏洩の対応を促進することができる。 In addition, when searching for original electronic document data from a paper document, it is possible to prevent the inaccessible information from spreading by detecting that a search has been performed from a paper document including inaccessible information. it can. In addition, after the detection, the information management can be promoted by notifying the manager of the information.
<その他の実施形態>
上記実施形態において、図10の登録処理では、特徴量を共用して使用するメモリを削減するためにオブジェクト毎に特徴量を登録していたが、実際の特徴量を比較し、同一の特徴量を共用するようにしてもよい。このようにした場合、例えば、生成文書ブロック情報、色特徴量情報、文字特徴量情報は、図31、図32、図33に示されるように、オブジェクトIDの代わりに特徴量を識別するための特徴量IDが格納される。
<Other embodiments>
In the above embodiment, in the registration process of FIG. 10, the feature amount is registered for each object in order to reduce the memory used by sharing the feature amount. However, the actual feature amount is compared, and the same feature amount is compared. May be shared. In this case, for example, the generated document block information, the color feature amount information, and the character feature amount information are used for identifying the feature amount instead of the object ID as shown in FIGS. 31, 32, and 33. The feature amount ID is stored.
そして、図10の登録処理は、図30の登録処理を実行することになる。 Then, the registration process of FIG. 10 executes the registration process of FIG.
ここで、他の実施形態における登録処理について、図30を用いて説明する。 Here, a registration process in another embodiment will be described with reference to FIG.
図30は本発明の他の実施形態の登録処理を示すフローチャートである。 FIG. 30 is a flowchart showing registration processing according to another embodiment of the present invention.
尚、図30において、図10と同一のステップについては、同一のステップ番号を付加して、その詳細については省略する。 In FIG. 30, the same steps as those in FIG. 10 are denoted by the same step numbers, and the details thereof are omitted.
図10では、ステップS1007でオブジェクトIDを生成文書ブロック情報に格納していたが、図30のステップS3007では、その格納を行わない。また、図10のステップS1009で特徴量登録を行っていた代わりに、ステップS3009において特徴量登録を実行する。 In FIG. 10, the object ID is stored in the generated document block information in step S1007. However, in step S3007 in FIG. 30, the storage is not performed. Also, instead of performing feature amount registration in step S1009 in FIG. 10, feature amount registration is executed in step S3009.
まず、ステップS1005で生成した文書データの各ブロックに対して、その属性に応じて特徴量の抽出処理を切り替え、画像ブロックに対しては、色特徴量を抽出し、文字ブロックに関しては文字特徴量を抽出する。 First, for each block of the document data generated in step S1005, the feature amount extraction processing is switched according to the attribute, the color feature amount is extracted for the image block, and the character feature amount for the character block. To extract.
そして、抽出した各特徴量に対し、画像ブロックは、図32に示す色特徴量情報の中から、同じ特徴量を探し、同じ特徴量が存在すれば、対応する特徴量IDを図31に示す生成文書ブロック情報の対象のブロックに対応した特徴量IDに格納する。 Then, for each extracted feature quantity, the image block searches for the same feature quantity from the color feature quantity information shown in FIG. 32. If the same feature quantity exists, the corresponding feature quantity ID is shown in FIG. Stored in the feature amount ID corresponding to the target block of the generated document block information.
一方、同じ特徴量が存在しなければ、新たに特徴量IDを発行し、色特徴量情報に、特徴量IDと色特徴量を対応させて追加する。 On the other hand, if the same feature amount does not exist, a new feature amount ID is issued, and the feature amount ID and the color feature amount are added in correspondence with the color feature amount information.
同様に、文字ブロックは、図33に示す文字特徴量情報の中から、同じ特徴量を探し、同じ特徴量が存在すれば、対応する特徴量IDを図31に示す生成文書ブロック情報の対象のブロックに対応した特徴量IDに格納する。 Similarly, the character block is searched for the same feature amount from the character feature amount information shown in FIG. 33, and if the same feature amount exists, the corresponding feature amount ID is the target of the generated document block information shown in FIG. Stored in the feature amount ID corresponding to the block.
一方、同じ特徴量が存在しなければ、新たに特徴量IDを発行し、文字特徴量情報に、特徴量IDとテキスト特徴量を対応させて追加する。 On the other hand, if the same feature quantity does not exist, a new feature quantity ID is issued, and the feature quantity ID and the text feature quantity are associated with each other and added to the character feature quantity information.
このようにすることで、同一の特徴量が共用されるようになる。 In this way, the same feature amount is shared.
また、上記実施形態において、生成文書ブロック情報において、ブロックの情報(属性、位置、サイズ)を、生成文書IDに対してブロック毎に直接記述していたが、図31等から明らかなように、生成文書ブロック情報の中には、ブロックの属性、位置、サイズが同じものが存在する。 In the above embodiment, in the generated document block information, the block information (attribute, position, size) is directly described for each block with respect to the generated document ID. As is clear from FIG. Some pieces of generated document block information have the same attribute, position, and size.
従って、これらのブロックの情報にIDを付与し、生成文書ブロック情報には、このIDを格納するようにし、ブロックの情報を別テーブルで管理するようにすれば、ブロックの情報の重複を避けることができる。 Therefore, it is possible to avoid duplication of block information by assigning IDs to these block information, storing this ID in the generated document block information, and managing the block information in a separate table. Can do.
また、同様に、画像特徴量や文字特徴量をのぞいたブロックのレイアウト情報(ページ内のブロック数、各ブロックの属性、位置、サイズ)も、別テーブルで管理するようにすれば、レイアウト情報の重複も避けることができる。 Similarly, if the layout information (number of blocks in the page, the attribute, position, and size of each block) excluding the image feature amount and character feature amount is also managed in a separate table, the layout information Duplication can also be avoided.
以上説明したように、他の実施形態によれば、上記実施形態で説明した効果に加えて紙文書からオリジナルの電子文書データを検索する場合に、検索のために登録されている文書データの特徴量の重複する特徴量を一つにまとめて記憶するため、特徴量を記憶するために必要な記憶容量を削減することができる。 As described above, according to another embodiment, in addition to the effects described in the above embodiment, when original electronic document data is searched from a paper document, the characteristics of document data registered for search are described. Since the feature amounts having the same amount are stored together as one, the storage capacity necessary for storing the feature amounts can be reduced.
尚、上記実施形態において、色特徴抽出情報処理は、処理対象画像の最頻色を色特徴情報として抽出する例を説明したが、これに限定されるものではなく、例えば、平均色を色特徴情報として抽出するようにしても良い。 In the above embodiment, the color feature extraction information processing is described as an example in which the most frequent color of the processing target image is extracted as the color feature information. However, the present invention is not limited to this. It may be extracted as information.
また、画像特徴量として色特徴量を用いたが、これに限定されるものではなく、例えば、最頻輝度、平均輝度等の輝度特徴量、共起行列、コントラスト、エントロピ、Gabor変換等で表現されるテクスチャ特徴量、エッジ、フーリエ記述子等の形状特徴量等の複数種類の画像特徴量を1つ、或いは、任意に組み合わせた画像特徴量を用いても良い。 In addition, although the color feature amount is used as the image feature amount, the present invention is not limited to this. For example, the feature amount is represented by luminance feature amounts such as mode luminance and average luminance, co-occurrence matrix, contrast, entropy, Gabor conversion, and the like. A plurality of types of image feature amounts such as texture feature amounts, shape features such as edges and Fourier descriptors, or any combination of image feature amounts may be used.
また、文字特徴量としては文字コードを採用したが、例えば、単語辞書とのマッチングを予め行って単語の品詞を抽出しておき、名詞である単語を文字特徴量としても良い。 In addition, although a character code is used as the character feature amount, for example, matching with a word dictionary may be performed in advance to extract a word part of speech, and a word that is a noun may be used as the character feature amount.
上記実施形態では、文書管理サーバ106で管理されている文書データをMFP100内のデータベース118に登録する際、電子ファイルから直接、ブロックの情報、文字コード画像を抜き出していたが、電子フィアイルについて、一旦、ラスタ画像に変換した後、ラスタ画像に対して、ステップS1504からステップS1505と同様にして、ブロックの情報、ならびに、文字特徴量、画像特徴量を取得するようにしても良い。
In the above embodiment, when registering the document data managed by the
上記実施形態では、ステップS306で生成する文書データは、HTML文書データとしているが、PDF(Portable Document Format)等、画像や文字等の生成する文書内のオブジェクトの位置をレイアウトできるフォーマットであれば、どのようなものを用いてもよい。 In the above embodiment, the document data generated in step S306 is HTML document data. However, any format that can lay out the position of an object in a document to be generated, such as a PDF (Portable Document Format), is used. Any thing may be used.
上記実施形態では、文書データに対するアクセス制御を行うために、アクセスレベルという概念を用い、アクセスレベルの上下によって、アクセス可能なオブジェクトが増減したが、オブジェクトごとに、アクセスできる個人、グループを記述するようにして、個人単位、所属するグループ単位で、個別にアクセス制御を行ってもよい。 In the above embodiment, in order to control access to document data, the concept of access level is used, and the number of accessible objects increases or decreases depending on the level of the access level. Thus, access control may be performed individually for each individual and for each group to which the user belongs.
上記実施形態では、画像読取部110(スキャナ)と印刷部112(プリンタ)が一体に構成されているMFP100を例に挙げて説明したが、画像読取部110と印刷部112をそれぞれ個別の機器として、LAN103、もしくはクライアントPC102等に接続して構成するようにしても良い。この場合、MFP100のそれ以外の構成要素は、マネージメントPC101に含まれることになり、画像読取部110(スキャナ)と印刷部112(プリンタ)との接続は、ネットワークI/F114を介して、LAN103経由で接続されることになる。
In the above embodiment, the
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。 Although the embodiments have been described in detail above, the present invention can take an embodiment as, for example, a system, an apparatus, a method, a program, or a storage medium, and specifically includes a plurality of devices. The present invention may be applied to a system that is configured, or may be applied to an apparatus that includes a single device.
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。 In the present invention, a software program (in the embodiment, a program corresponding to the flowchart shown in the figure) that realizes the functions of the above-described embodiment is directly or remotely supplied to the system or apparatus, and the computer of the system or apparatus Is also achieved by reading and executing the supplied program code.
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。 Accordingly, since the functions of the present invention are implemented by computer, the program code installed in the computer also implements the present invention. In other words, the present invention includes a computer program itself for realizing the functional processing of the present invention.
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。 In that case, as long as it has the function of a program, it may be in the form of object code, a program executed by an interpreter, script data supplied to the OS, or the like.
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。 As a recording medium for supplying the program, for example, floppy (registered trademark) disk, hard disk, optical disk, magneto-optical disk, MO, CD-ROM, CD-R, CD-RW, magnetic tape, nonvolatile memory card ROM, DVD (DVD-ROM, DVD-R) and the like.
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。 As another program supply method, a client computer browser is used to connect to an Internet homepage, and the computer program of the present invention itself or a compressed file including an automatic installation function is downloaded from the homepage to a recording medium such as a hard disk. Can also be supplied. It can also be realized by dividing the program code constituting the program of the present invention into a plurality of files and downloading each file from a different homepage. That is, a WWW server that allows a plurality of users to download a program file for realizing the functional processing of the present invention on a computer is also included in the present invention.
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。 In addition, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM, distributed to users, and key information for decryption is downloaded from a homepage via the Internet to users who have cleared predetermined conditions. It is also possible to execute the encrypted program by using the key information and install the program on a computer.
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。 In addition to the functions of the above-described embodiments being realized by the computer executing the read program, the OS running on the computer based on an instruction of the program is a part of the actual processing. Alternatively, the functions of the above-described embodiment can be realized by performing all of them and performing the processing.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。 Furthermore, after the program read from the recording medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion board or The CPU or the like provided in the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
100 MFP
101 マネージメントPC
102 クライアントPC
103 ネットワーク
104 LAN
105 データベース
106 文書管理サーバ
110 画像入力部
111 記憶部
112 印刷部
113 入力部
114、117 ネットワークI/F
115 データ処理部
116 表示部
100 MFP
101 Management PC
102 Client PC
105
115
Claims (12)
複数種類の構成要素からなる画像データを、その構成要素毎にアクセスレベルを設定して記憶管理する記憶手段と、
ユーザ情報を入力する入力手段と、
前記入力手段で入力されたユーザ情報のアクセスレベルを取得する取得手段と、
原稿を読み取る読取手段と、
前記読取手段によって得られる第1画像データに対応する第2画像データを前記記憶手段から検索する検索手段と、
前記取得手段で取得したユーザ情報のアクセスレベルに基づいて、前記検索手段で検索された第2画像データの各構成要素の出力の可否を判定する判定手段と、
前記判定手段で出力が許可された構成要素を含む第2画像データを出力する出力手段と
を備えることを特徴とする画像処理装置。 An image processing apparatus for searching for desired image data,
Storage means for storing and managing image data composed of a plurality of types of components by setting an access level for each component;
An input means for inputting user information;
Obtaining means for obtaining an access level of the user information input by the input means;
Reading means for reading a document;
Search means for searching the storage means for second image data corresponding to the first image data obtained by the reading means;
A determination unit that determines whether or not each component of the second image data searched by the search unit can be output based on an access level of the user information acquired by the acquisition unit;
An image processing apparatus comprising: output means for outputting second image data including components permitted to be output by the determination means.
前記比較手段の比較結果に基づいて、前記第1画像データに対応する第2画像データを検索する
ことを特徴とする請求項1に記載の画像処理装置。 The search means includes a first image data obtained by the reading means and a comparison means for comparing the image data stored in the storage means,
The image processing apparatus according to claim 1, wherein second image data corresponding to the first image data is searched based on a comparison result of the comparison unit.
前記抽出手段で抽出した特徴量と、前記記憶手段に記憶されている画像データの特徴量と比較する
ことを特徴とする請求項2に記載の画像処理装置。 The comparison means includes an extraction means for extracting a feature amount of the first image data,
The image processing apparatus according to claim 2, wherein the feature amount extracted by the extraction unit is compared with a feature amount of image data stored in the storage unit.
ことを特徴とする請求項3に記載の画像処理装置。 The image processing apparatus according to claim 3, wherein the extraction unit extracts one or both of an image feature amount and a character feature amount of the first data.
前記判定手段は、前記取得手段で取得したアクセスレベルに基づいて、前記表示手段で表示された候補画像データの一覧から選択された前記2画像データとなる候補画像データの各構成要素の出力の可否を判定する
ことを特徴とする請求項1に記載の画像処理装置。 Display means for displaying a list of candidate image data to be candidates for the second image data searched by the search means;
Whether the determination unit outputs each component of the candidate image data to be the two image data selected from the list of candidate image data displayed by the display unit based on the access level acquired by the acquisition unit The image processing apparatus according to claim 1, wherein:
前記設定手段で設定されたアクセスレベルと、前記取得手段で取得したユーザ情報のアクセスレベルを比較するアクセスレベル比較手段と、
前記アクセスレベル比較手段の比較結果に基づいて、警告情報を出力する警告情報出力手段と
を備えることを特徴とする請求項1に記載の画像処理装置。 The determination means includes a setting means for setting an access level for the second image data searched by the search means;
An access level comparing means for comparing the access level set by the setting means with the access level of the user information acquired by the acquiring means;
The image processing apparatus according to claim 1, further comprising: warning information output means for outputting warning information based on a comparison result of the access level comparison means.
ことを特徴とする請求項6に記載の画像処理装置。 When the access level of the user information acquired by the acquisition unit is higher than the access level set by the setting unit, the determination unit is searched by the search unit based on the access level set by the setting unit. The image processing apparatus according to claim 6, wherein whether or not each component of the second image data is output is determined.
ことを特徴とする請求項6に記載の画像処理装置。 When the access level of the user information acquired by the acquisition unit is the same as or lower than the access level set by the setting unit, the determination unit is based on the access level of the user information acquired by the acquisition unit, The image processing apparatus according to claim 6, wherein whether or not each component of the second image data searched by the search unit can be output is determined.
ことを特徴とする請求項1に記載の画像処理装置。 The storage unit stores and manages image data including a plurality of types of components by setting an access level for each component and storing and managing a feature amount for each component. The image processing apparatus according to 1.
ことを特徴とする請求項1に記載の画像処理装置。 The storage means stores and manages image data composed of a plurality of types of components by setting an access level for each component, and stores and manages feature amounts for each component. The image processing apparatus according to claim 1, wherein storage management is performed using an identifier indicating the feature amount.
ユーザ情報を入力する入力工程と、
前記入力工程で入力されたユーザ情報のアクセスレベルを取得する取得工程と、
原稿を読み取る読取工程と、
前記読取工程によって得られる第1画像データに対応する第2画像データを前記記憶部から検索する検索工程と、
前記取得工程で取得したユーザ情報のアクセスレベルに基づいて、前記検索工程で検索された第2画像データの各構成要素の出力の可否を判定する判定工程と、
前記判定工程で出力が許可された構成要素を含む第2画像データを出力する出力工程と
を備えることを特徴とする画像処理装置の制御方法。 A method for controlling an image processing apparatus that searches for desired image data from a storage unit that stores and manages image data including a plurality of types of components by setting an access level for each component,
An input process for inputting user information;
An acquisition step of acquiring an access level of the user information input in the input step;
A reading process for reading a document;
A search step of searching the storage unit for second image data corresponding to the first image data obtained by the reading step;
A determination step of determining whether or not each component of the second image data searched in the search step can be output based on the access level of the user information acquired in the acquisition step;
An output step of outputting second image data including components permitted to be output in the determination step.
ユーザ情報を入力する入力工程のプログラムコードと、
前記入力工程で入力されたユーザ情報のアクセスレベルを取得する取得工程のプログラムコードと、
原稿を読み取る読取工程のプログラムコードと、
前記読取工程によって得られる第1画像データに対応する第2画像データを前記記憶部から検索する検索工程のプログラムコードと、
前記取得工程で取得したユーザ情報のアクセスレベルに基づいて、前記検索工程で検索された第2画像データの各構成要素の出力の可否を判定する判定工程のプログラムコードと、
前記判定工程で出力が許可された構成要素を含む第2画像データを出力する出力工程のプログラムコードと
を備えることを特徴とするプログラム。 A program that realizes control of an image processing apparatus that searches for desired image data from a storage unit that stores and manages image data including a plurality of types of components by setting an access level for each component,
A program code of an input process for inputting user information;
A program code of an acquisition step for acquiring an access level of the user information input in the input step;
A program code for a reading process for reading a document;
A program code of a search step for searching the storage unit for second image data corresponding to the first image data obtained by the reading step;
Based on the access level of the user information acquired in the acquisition step, the program code of the determination step for determining whether to output each component of the second image data searched in the search step,
And a program code of an output process for outputting second image data including the components permitted to be output in the determination process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004200808A JP2006023946A (en) | 2004-07-07 | 2004-07-07 | Image processing apparatus, control method therefor, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004200808A JP2006023946A (en) | 2004-07-07 | 2004-07-07 | Image processing apparatus, control method therefor, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006023946A true JP2006023946A (en) | 2006-01-26 |
Family
ID=35797180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004200808A Withdrawn JP2006023946A (en) | 2004-07-07 | 2004-07-07 | Image processing apparatus, control method therefor, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006023946A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009294754A (en) * | 2008-06-03 | 2009-12-17 | Chih Cheng Lin | Vehicle management system and document importing/exporting device thereof |
JP2014056444A (en) * | 2012-09-12 | 2014-03-27 | Ricoh Co Ltd | Document management system, server and program for document management |
JP2017158189A (en) * | 2017-04-05 | 2017-09-07 | シャープ株式会社 | Image forming apparatus and user authentication method |
CN117036347A (en) * | 2023-10-08 | 2023-11-10 | 山东柯林瑞尔管道工程有限公司 | Visual detection method and system for pipeline lining leakage based on image enhancement |
-
2004
- 2004-07-07 JP JP2004200808A patent/JP2006023946A/en not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009294754A (en) * | 2008-06-03 | 2009-12-17 | Chih Cheng Lin | Vehicle management system and document importing/exporting device thereof |
JP2014056444A (en) * | 2012-09-12 | 2014-03-27 | Ricoh Co Ltd | Document management system, server and program for document management |
JP2017158189A (en) * | 2017-04-05 | 2017-09-07 | シャープ株式会社 | Image forming apparatus and user authentication method |
CN117036347A (en) * | 2023-10-08 | 2023-11-10 | 山东柯林瑞尔管道工程有限公司 | Visual detection method and system for pipeline lining leakage based on image enhancement |
CN117036347B (en) * | 2023-10-08 | 2024-02-02 | 山东柯林瑞尔管道工程有限公司 | Visual detection method and system for pipeline lining leakage based on image enhancement |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4405831B2 (en) | Image processing apparatus, control method therefor, and program | |
US8326090B2 (en) | Search apparatus and search method | |
US7272269B2 (en) | Image processing apparatus and method therefor | |
US7876471B2 (en) | Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document | |
US7545992B2 (en) | Image processing system and image processing method | |
US7746507B2 (en) | Image processing apparatus for image retrieval and control method therefor | |
JP5036430B2 (en) | Image processing apparatus and control method thereof | |
JP2006085298A (en) | Image processing apparatus and image processing method | |
JP4956319B2 (en) | Image processing apparatus, control method thereof, program thereof, and storage medium | |
US8818110B2 (en) | Image processing apparatus that groups object images based on object attribute, and method for controlling the same | |
JP2006023940A (en) | Image processing system and image processing method | |
US8144988B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
US7596271B2 (en) | Image processing system and image processing method | |
JP2004334337A (en) | Image processing device | |
US20090083316A1 (en) | Information processing apparatus, information processing method, and information processing program | |
US8194982B2 (en) | Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program | |
JP2006023946A (en) | Image processing apparatus, control method therefor, and program | |
JP2004348467A (en) | Image retrieval apparatus, control method thereof, and program | |
JP6767651B2 (en) | Information processing system and its processing method and program | |
JP4047222B2 (en) | Image processing apparatus, control method therefor, and program | |
JP2005149323A (en) | Image processing system, image processing apparatus, and image processing method | |
JP2010218466A (en) | Device, method and program for editing document image, and computer readable recording medium storing program for making computer execute the method | |
JP2006333248A (en) | Image processing apparatus, image processing method, program, and storage medium | |
JP2005352783A (en) | Image processing system, method, program, and storage medium | |
JP2001101213A (en) | Information processing device, document management device, information processing system, information management method, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20071002 |