以下、図面を参照して、本発明の好適な実施形態を例示的に詳しく説明する。ただし、この実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。
(第1実施形態)
(画像処理システムの構成)
図1は、実施形態に係る画像処理システムの全体構成を示すブロック図である。図1において、画像処理システムは、互いにネットワークを介して接続された画像処理装置110,120,130とパーソナルコンピュータ(情報処理装置)101、102とサーバシステム140とから構成される。ネットワークは、例えばLAN(Local Area Network)100で構成される。
画像処理装置110は、画像入力デバイスであるスキャナ113、画像出力デバイスであるプリンタ114、制御ユニット111、ユーザインタフェースである操作部112から構成される。スキャナ113、プリンタ114、操作部112はそれぞれ、制御ユニット111に接続されて、制御ユニット111からの命令によって制御される。制御ユニット111は、LAN100に接続されている。
また、画像処理装置120、130は、画像処理装置110と同様の構成となっている。
パーソナルコンピュータ101は、複数のユーザのそれぞれが主に個人的に使用する情報処理装置であり、ユーザが利用するアプリケーションプログラムやユーザのデータ等を格納している。
サーバシステム140は、サーバコンピュータ141と大規模ストレージ装置142から構成される。
サーバコンピュータ141は、複数のユーザやクライアントシステムに対してサービスを提供するサーバアプリケーションや共有データ等を格納している。大規模ストレージ装置142は、高性能で信頼性が高い大規模な二次記憶装置であり、主にサーバコンピュータ141上で稼動するデータベース管理システム(DBMS)のデータ等を格納している。
サーバシステム140によってサービスされるサーバアプリケーションのひとつは、ネットワーク全域に渡って流通するジョブデータをアーカイブ(すなわち蓄積管理)するデータベース(DB)アプリケーションである。このサーバアプリケーションを以下ジョブアーカイブアプリケーションと呼ぶ。ジョブアーカイブアプリケーションは、ネットワークに接続された他の装置群にそれぞれ組み込まれたソフトウェアと連携して、ジョブアーカイブシステムと呼ばれる分散アプリケーションを構成する。
図1のシステムにおいて、パーソナルコンピュータ101は、画像処理装置110、120、130や、サーバシステム140などとLAN100を介して連携する。例えば、パーソナルコンピュータ101は、画像処理装置110との間で文書データ(以下、単に「文書」ともいう)を送受信する。そして、プリント、スキャン、ファクス送信と受信、ボックス(画像処理装置110に組み込みの文書管理システム)への蓄積とリトリーブ、などのジョブを実行する。文書を処理するジョブを実行するとき、サーバシステム140上で稼動するジョブアーカイブアプリケーションが、ジョブ情報とジョブの処理対象文書データの控えをアーカイブする。例えば、プリントジョブの場合、パーソナルコンピュータ101のプリンタドライバが画像処理装置110へジョブを投入するとともに、サーバシステム140へもそのジョブに関連する情報と処理対象文書のデータを送信することで、アーカイブが達成される。
図1のシステムにおいて、画像処理装置110は、他の画像処理装置120、130や、パーソナルコンピュータ101、102や、サーバシステム140などとLAN100を介して連携する。例えば、画像処理装置110は、原稿の画像をスキャンしてデジタルデータ化して他の装置へ送信することが可能である。あるいは、画像処理装置110は、他の装置が保有しているデータをリトリーブしてプリントしたりローカルのボックスへ蓄積したり更に他の装置へ転送したりするジョブを実行することも可能である。
これらの文書を処理するジョブを実行するときにも、サーバシステム140上で稼動するジョブアーカイブアプリケーションが、ジョブ情報とジョブの処理対象文書データの控えをアーカイブする。例えば、プッシュスキャンジョブの場合、画像処理装置110の「送信」アプリケーションが、原稿文書をスキャナで読み取ったデジタル文書データを本来の送信宛先に送信する。そして、送信とともに、サーバシステム140へもそのジョブに関連する情報(ジョブ情報)と処理対象文書のデータを送信することで、アーカイブが達成される。
このようにして、ネットワーク全域に渡り流通するジョブ文書はジョブアーカイブアプリケーションによりアーカイブされている。
(ジョブアーカイブアプリケーションのソフトウェア構成)
図2は、サーバシステム140において稼動するジョブアーカイブアプリケーションのソフトウェア構成を示すブロック図である。
データベース管理システム(DB管理システム)201は、大量のレコードを含む大容量のデータを、レコード間の関連とともに構造化したデータベースとして格納する。また、SQL(Structured Query Language)などの問い合わせ言語による問い合わせに応じて、条件に合致するレコードをデータベースから高速にリトリーブする。DB管理システム201は、文書DB202、ジョブDB203、インデクスDB204を含む。DB管理システム201はよく知られたリレーショナルデータベースやオブジェクト指向データベースなどの実装によって実現できる。
文書DB202は、ジョブアーカイブシステムが蓄積管理する文書データを格納するデータベースである。文書の内容データと文書に関連するメタデータとを文書レコードとして格納している。文書DB202とジョブDB203とは、格納されるレコード間で相互に関連している。
ジョブDB203は、ジョブアーカイブシステムが蓄積管理するジョブデータをジョブレコードとして格納するデータベースである。ジョブDB203と文書DB202とは、格納されるレコード間で相互に関連している。
インデクスDB204は、ジョブアーカイブシステムが蓄積管理する文書データやジョブデータから、所望のデータを高速に検索するためのインデクスレコードを格納するデータベースである。インデクスDB204に格納されるインデクスレコードは、文書DB202およびジョブDB203内のレコードを参照している。
ストア部205は、画像処理装置110やパーソナルコンピュータ101などのクライアント装置から文書データおよびジョブデータを受信して、DB管理システム201に格納する格納要求受け付けモジュールである。ストア部205は、受信した文書データとジョブデータをDB管理システム201に格納する。また、ストア部205は、受信した文書データのデータ形式に応じてメタデータを生成するための処理を切り替える。受信した文書データが、画像スキャナで読み取ったり、デジタルカメラで撮影したり、ファクスで受信したりして生成されるラスタ画像文書データである場合、ストア部205は、文書データをラスタ画像ページ処理部206に送る。
受信した文書データがコード化された文書データであった場合、ストア部205は、展開部210にデータを送る。例えば、ストア部205は、ページ記述言語やベクタ表現された各種文書フォーマットを展開部210に送る。また、ストア部205は、デスクトップパブリッシングやワードプロセッサや表計算やプレゼンテーションやドローイングやペインティング等各種アプリケーションの文書フォーマットのデータを展開部210に送る。
ラスタ画像ページ処理部206は、ラスタ画像文書から文書を構成するページ(画像ページ)を切り分けて画像ページごとに処理するモジュールである。ラスタ画像ページ処理部206は、切り分けた画像ページを画像特徴抽出部207および画像構造解析部208に送る。
画像特徴抽出部207は、ラスタ画像データを解析して画像間の類似性判定の基準として用いる特徴データ(以下、単に「特徴」ともいう)を抽出するモジュールである。抽出された特徴データはDB管理システム201に送られ、DB管理システム201は受信した特徴データを格納する。類似画像検索に有効な特徴抽出の手法は種々のものが適用可能である。本実施形態では、特定のアルゴリズムには依存せず有効な手法を複数併用する。採用可能な手法には、たとえば以下のものを含む。
例えば、画像中のエッジなどからオブジェクトを抽出し、オブジェクトの形状を判定し形状やその配置や配色や複数のオブジェクト間の位置関係などを用いる手法がある。画像全体を構成する支配的な色の組み合わせや配色パターンをヒストグラムなどで抽出する手法もある。また、認知的な類似性判定に近い特性を持つ特徴量を導き出す各種の数学処理(たとえばフーリエ・メリン変換 Fourier Mellin Transforms)を用いる手法もある。特開2006−65866号公報(特願2005‐244684)により開示されるアプローチも好適な手法である。
画像構造解析部208は、ラスタ画像データからその構造を解析するモジュールである。画像構造解析部208は、領域分割(ブロックセレクション)或は像域分離などの手法を用いて、ひとかたまりの画像領域(画像ページ)から、それを構成する特性の異なる複数の領域に分解する。例えば、画像構造解析部208は、複数の領域(文字領域、画像領域、写真領域、グラフィクス領域、白黒領域、カラー領域等)に分解し、領域構造に関する解析と分類を行う。
また、背景などの下地バターンとその上に配置された文字や形状などのオブジェクトとの、レイヤ構造に関する解析と分類も行う。解析の結果得られた画像領域(あるいは画像レイヤ)のラスタ画像データを画像特徴抽出部207に送る。また、解析の結果得られたテキスト領域(またはテキストレイヤ)のラスタ画像データをOCR209に送る。また、解析の結果得られた構造情報はDB管理システム201に送り格納する。
OCR209は、文字が描画されたラスタ画像データを解析して文字認識するモジュールである。OCR209は、文字認識したテキストデータ(すなわち、Unicodeなどによってコード化されたデータ)をDB管理システム201に送り格納する。
インデクス生成部211は、文書DB202やジョブDB203から高速にデータを検索するためのインデクス情報を生成するモジュールである。インデクスは、検索キーとして与えられる画像に類似した画像を含む文書レコードを高速に検索したり、検索キーとして与えられるテキストを文書内容データやページ内容データの中に含む文書レコードを高速に全文検索したりするために予め生成される。また、インデクスは、検索キーとして与えられる条件に合致するメタデータを持つ文書レコードやジョブレコードを高速に検索したりするために予め生成される。インデクスの生成も、知られている複数の手法を併用できる。
全文検索のためのインデクスの生成には、例えば、N−グラム(N-gram)の手法を用いる。類似画像検索のためのインデクスの生成のためには、画像の特徴を表現する特徴ベクトルを予め分類(クラスタリング)したりハッシュ関数などによって順序づけたりしておく。インデクス生成部211によるインデクス生成は、文書データやジョブデータの追加登録や編集などによって文書DB202やジョブDB203が更新されたときに行われる。また、各DBの更新とは非同期に、バッチ処理としてインデクス生成することもできる。生成したインデクスはDB管理システム201のインデクスDB204に格納する。
リトリーブ部212は、画像処理装置110やパーソナルコンピュータ101などのクライアント装置から検索キー(検索キー画像または検索キーテキスト)とその検索条件を受け付けるモジュールである。また、リトリーブ部212は、受け付けた検索条件に応じてDB管理システム201から文書データを検索する。そして、ヒットした文書データや文書に関連するサムネール画像(以下、単に「サムネール」ともいう)やジョブデータ等のメタデータをクライアント装置に返信する。
文書検索部213は、文書検索要求に合致する文書を検索するモジュールである。文書検索部213は、検索要求と与えられた検索キーの型に応じて、文書の内容データに基づく検索や文書に含まれるページデータに基づく検索や文書のメタデータに基づく検索が可能である。また、文書検索部213は、文書に関連するジョブに基づく検索を組み合わせて、検索要求に合致する文書レコードの候補を複数探し出すことも可能である。
ページ検索部214は、文書に含まれるページデータに基づく検索の要求に応じて、文書DB202から、検索要求の条件に合致するページレコードの候補(およびそのページを含む文書)を複数探し出す。
類似画像検索部215は、検索キーとして与えられた画像に基づく類似画像検索の要求に応じて、検索キー画像に類似する画像を含むページ内容データを持つページレコード(およびそのページを含む文書)を複数探し出す。類似画像検索部215は、画像特徴抽出部207と同様の画像特徴抽出を検索キー画像に対して行い、特徴間の類似性をもとに類似画像を検索する。
DB操作部216は、クライアント装置からデータベースに対する操作や各データベース内のレコードに対する操作要求を受け付けて処理し結果を返送するデータベース操作モジュールである。クライアント装置には、サーバコンピュータ141の管理コンソールまたは画像処理装置110やパーソナルコンピュータ101などが含まれる。レコードに対する操作は、たとえば、メタデータ(タグなど)の追加や編集といった操作を含む。
(画像処理装置のハードウェア構成)
図3は、画像処理装置110のハードウェア構成を示すブロック図である。画像処理装置120、130も同じ構成を備えるものとする。
制御ユニット111は、スキャナ113やプリンタ114と接続する一方でLAN100や公衆回線(WAN)と接続することで、画像情報やデバイス情報の入出力を制御する。
CPU301は、制御ユニット111全体を制御するコントローラである。RAM302は、CPU301が動作するために使用するシステムワークメモリである。また、RAM302は、画像データを一時記憶するための画像メモリでもある。ROM303は、ブートROMであり、システムのブートプログラムが格納されている。HDD304は、ハードディスクドライブであり、システムソフトウェア、画像データを格納する。
操作部I/F306は、操作部(UI)112との間のインタフェースを司り、操作部112に表示すべき画像データを操作部112に対して出力する。また、使用者が操作部112を介して入力した情報を、CPU301に伝える役割を果たす。
ネットワークインタフェース(Network)308は、LAN100との接続を司り、LAN100に対して情報の入出力を行う通信手段として機能する。モデム(MODEM)309は、公衆回線との接続を司り、公衆回線に対して情報の入出力を行う通信手段として機能する。以上のデバイスがシステムバス307上に配置される。
イメージバスインターフェース(Image Bus I/F)305は、システムバス307と画像データを高速で転送する画像バス310とを接続し、データ構造を変換するバスブリッジである。画像バス310は、PCIバスまたはIEEE1394で構成される。
画像バス310には以下のデバイスが配置される。ラスタイメージプロセッサ(RIP)311は、ネットワークから送信されたPDLコードをビットマップイメージに展開する。デバイスI/F312は、画像入出力デバイスであるスキャナ113やプリンタ114と制御ユニット111とを接続し、画像データの同期系/非同期系の変換を行う。
スキャナ画像処理部313は、入力画像データに対し補正、加工、編集を行う。プリンタ画像処理部314は、プリント出力画像データに対して、プリンタ114の性能に応じた補正、解像度変換等を行う。画像回転部315は画像データの回転を行う。画像圧縮部316は、多値画像データに対してはJPEG圧縮伸長処理を行い、2値画像データに対してはJBIG、MMR、MHの圧縮伸長処理を行う。
(画像処理装置の外観)
図4は、画像処理装置110の外観を示す斜視図である。画像処理装置120、130も同等の外観を備える。尚、これ以降では、画像処理装置110について説明するが、画像処理装置120、130でも全く同じ構成が備えられ、全く同じ動作を行うことが可能である。
画像入力デバイスであるスキャナ113は、原稿となる記録媒体(紙上)の画像を照明し、CCDラインセンサ(図示せず)を走査することによって、ラスターイメージデータを生成する。
使用者が原稿用紙を原稿フィーダ405のトレイ406にセットして、操作部112において読み取りの起動を指示すると、制御ユニット111のCPU301がスキャナ113に指示を与える。与えられた指示に基づき、トレイ406にセットされた原稿用紙は1枚ずつフィードされ、スキャナ113が原稿画像の読み取り動作を行う。
画像出力デバイスであるプリンタ114は、ラスターイメージデータを記録媒体(用紙)に印刷し、出力する。印刷方式は、感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して記録媒体(用紙)上に直接画像を形成するインクジェット方式等があるが、どの方式であってもよい。なお、印刷動作は、CPU301からの指示によって起動される。
プリンタ114は、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセット401、402、403を備える。また、排紙トレイ404は、印刷し終わった用紙を受ける。
(画像処理装置の操作部)
図5は、画像処理装置110の操作部112の構成を示す平面図である。尚、画像処理装置120、130の操作部も同等の構成を備える。
LCD表示部501は、LCD(液晶表示装置)上にタッチパネルシートが貼られた構成になっている。LCD表示部501は、画像処理装置110の操作画面およびソフトキーを表示するとともに、表示してあるキーが押された場合には、押された位置を示す位置情報が制御ユニット111のCPU301に伝える。
スタートキー505は、原稿画像の読み取り動作を開始する場合等に操作されるキーである。スタートキー505の中央部には、緑と赤の2色LED表示部506があり、その色によってスタートキー505を操作できる状態であるか否かを示す。ストップキー503は、稼働中の画像処理装置110の動作を止めたい場合に操作されるキーである。IDキー507は、使用者のユーザIDを入力するときに操作されるキーである。また、リセットキー504は、操作部112からの設定を初期化するときに操作されるキーである。
(操作部及び操作部I/Fの内部構成)
図6は、画像処理装置110の操作部112及び操作部I/F306の内部構成を制御ユニット111の内部構成と対応させて示すブロック図である。尚、これ以降では、画像処理装置110について説明するが、画像処理装置110を画像処理装置120または画像処理装置130と読み替えても全く何ら支障は無い。
上述したように、操作部112は、操作部I/F306を介してシステムバス307に接続される。システムバス307には、CPU301、RAM302、ROM303、ハードディスクドライブ(HDD)304が接続されている。CPU301は、ROM303とHDD304に記憶された制御プログラム等に基づいて、システムバス307に接続される各種デバイスとのアクセスを総括的に制御する。また、CPU301は、デバイスI/F312を介して接続されるスキャナ113から入力情報を読み込み、またデバイスI/F312を介して接続されるプリンタ114に出力情報としての画像信号を出力する。RAM302はCPU301の主メモリ、ワークエリア等として機能する。
ディスプレイ502のタッチパネルや各種ハードキー503、504、505、507からのユーザ入力情報は、入力ポート601を介してCPU301に渡される。CPU301は、ユーザ入力情報の内容と制御プログラムとに基づいて表示画面データを生成し、画面出力デバイスを制御する出力ポート602を介して、LCD表示部501に表示画面データを出力する。また、必要に応じて2色LED表示部506を制御する。
図7は、画像処理装置110の操作部112に表示される標準的な操作画面の一例を示す図である。
図7の最上部の表示領域701に並んでいるボタン群は、画像処理装置110が提供する各種機能から1つを選択するためのボタン群である。コピー機能704は、スキャナ113でスキャンし読み取った原稿画像データをプリンタ114でプリントして原稿の複写物を得るための機能である。
送信機能705は、スキャナ113で読み取った原稿画像データやHDD304に蓄積されている画像データを各種出力先に送信するための機能である。出力先としては、ネットワークインタフェース308経由で各種のプロトコルによって送信可能な各種の出力先、および、モデム309経由でファクシミリなどのプロトコルによって送信可能な各種の出力先がある。送信機能705により複数の出力先を選択して送信することができる。
ボックス機能706は、HDD304に蓄積されている画像データやコードデータなどの文書ファイルを閲覧、編集、プリント、および送信するための機能である。HDD304に蓄積される文書ファイルには、スキャナ113によって読み取った原稿画像データ、ネットワークインタフェース308経由でダウンロードしたデータが含まれる。また、HDD304に蓄積される文書ファイルにはネットワークインタフェース308経由で他の装置から受信したプリントデータを蓄積したデータ、モデム309経由で他の装置から受信したファクシミリデータなどが含まれる。
ボックス機能706は、ユーザのオフィス環境において電子的なメールボックスとして利用できる。また、パスワードを入力するまで用紙へのプリント出力を遅延することによって、PDLプリントジョブの守秘性を高めるセキュアドプリントとして利用することもできる。
ボックス機能706の利用により、他の画像処理装置120、130のHDDや情報処理装置101、102が公開する共有ファイルシステムにアクセスし、データの閲覧、編集、プリント、および送信が可能になる。ボックス機能706によりサーバシステム140の共有ファイルシステムやデータベースシステム等に蓄積されている画像データやコードデータ等の文書ファイルにアクセスし、データの閲覧、編集、プリント、送信が可能になる。
拡張機能707は、スキャナ113を外部装置から利用するために、各種の拡張機能を呼び出すための機能である。
検索機能708は、画像処理装置110のボックスや、他の画像処理装置のボックス等から所望の文書を検索するための機能である。検索機能708により、情報処理装置が公開する共有ファイルシステムや、サーバシステム140がサービスする共有ファイルシステムやデータベースシステムから、所望の文書を検索することが可能である。
図7の中間部分の表示領域702は、コピー機能704が選択された場合の操作画面を表示している。図7の最下部703はステータス表示領域であり、最上部の表示領域701で選択された機能の如何に関わらず、画像処理装置110の各機能や装置自体の情報などの各種のメッセージをユーザに対して表示する。
図8は、DB管理システム201に格納される各データベースの概略的な構成を示す図である。
文書DB202は、複数の文書レコード801を含む。文書レコード801は、ユーザが取り扱う紙文書や電子的な文書ファイルに対応するレコードである。文書レコード801は、文書メタデータ802、文書内容データ803、および複数のページレコード804を含む。
文書メタデータ802は、文書レコードに対応する文書に関連する各種のメタデータを格納するレコードである。文書メタデータ802は、対応する文書に関して、文書名、作者、作成日付、データ形式、データサイズ、ページ数、タグ、および、ジョブ履歴などを含む。
「タグ」とは、文書にユーザがつけた任意の文字列からなるキーワードのような情報である。タグに基づいて文書の検索が可能である。ユーザはひとつの文書に対して複数のタグを自由につけることができるので、タグを文書に付加することにより文書をさまざまな基準で分類したり検索しやすくしたりすることが可能である。共有の文書に対して、その文書を後で参照したり利用したりするために、複数のユーザが後からタグを追加していくこともできる。これによって文書を分類や検索するためのメタデータを飛躍的に充実させることが期待できる。
このアプローチをフォークソノミー (folksonomy) と呼ぶ場合がある。「Folksonomy 」とは 「folks」(言葉づかい) と 「taxonomy」(分類法) を組み合わせた用語である。
ジョブ履歴は、文書を処理対象として実行された一連のジョブを特定する参照情報のリストである。1つの文書レコードは複数のジョブレコードへの参照を保持する場合がある。たとえば、明らかに同一と特定できる文書を複数のジョブが処理対象とした場合である。
文書内容データ803は、文書そのものの内容に対応するデータである。コード化された文書データが格納された場合における、テキストやアプリケーションプログラムのデータなどが相当する。紙の原稿に対応しスキャナ113で読み取られたラスタ画像データのように、文書を構成するページが明確に分離している場合は、ページレコード804に内容データを含める。
ページレコード804は、文書を構成するページのそれぞれに対応するレコードである。スキャナ113で読み取ったラスタ画像データ群や、アプリケーションプログラムのデータを展開部210で展開してページ単位に分割した画像データや構造情報やテキストやメタデータ群等が、夫々のページレコードに対応する。
ページレコードは、ページメタデータ805とページ内容データ806などを含む。ページメタデータ805は、ページレコードに対応するページに関連する各種のメタデータを格納するレコードである。ページメタデータ805は、構造情報、特徴、サムネールなどを含む。構造情報は、画像構造解析部208や展開部210が解析して格納したページの構造に関する情報である。
特徴は、画像特徴抽出部207が抽出して格納したページを構成する画像の特徴を表現する情報である。
サムネールは、ページ全体の画像やページに含まれる画像要素を、解像度変換(または縮小変倍)して、比較的小さくて扱いやすいいくつかのサイズにした画像である。サムネール画像はページメタデータ805の生成時に生成してもよいし、外部からのリトリーブに応えるために必要となったときオンデマンドに生成してもよい。また、スケジューリングされたバッチ処理によって、まだ生成されていないサムネール画像群をまとめて生成するタスクを非同期に実行してもよい。
ページ内容データ806は、ページそのものの内容に対応するデータである。紙原稿のページを画像スキャナで読み取ったラスタ画像データや、コード文書を展開部210でページにレンダリングした画像データなどページ単位の画像データが、ページ内容データ806に格納される。また、ページ画像をOCR209で文字認識して得たテキストデータや、コード文書を展開部210が展開して得たページ単位のテキスト情報なども、ページ内容データ806に格納される。
ジョブDB203は、複数のジョブレコード808を含む。ジョブレコード808は、ユーザが実行した文書処理ジョブの各々に対応するレコードである。ジョブレコード808は、日時、操作者、要求した装置、処理した装置、処理内容、および、処理文書などを含む。日時は、ジョブを実行した日時を表現するデータである。操作者は、ジョブを実行したユーザを特定するデータである。
処理を要求した装置は、ジョブ実行の要求元になった装置である例えば、パーソナルコンピュータ101から画像処理装置110にプリントした場合、要求元となる装置はパーソナルコンピュータ101である。
処理した装置は、ジョブを実質的に処理した装置である。例えば、パーソナルコンピュータ101から画像処理装置110にプリントした場合、処理した装置は画像処理装置110である。
処理内容は、ジョブの処理内容を特定する情報である。ジョブの種別、およびそれぞれのジョブ種別において選択可能な各種オプションと設定可能な各種パラメータをどのように選択・設定して処理したか特定する情報を含む。
処理文書は、このジョブが処理対象とした文書を特定する参照情報のリストである。1つのジョブレコードが複数の文書レコードを参照する場合がある。たとえば、1つのジョブが複数の文書を処理対象として実行された場合である。
インデクスDB204は、複数のインデクスレコード809を含む。インデクスレコード809は、文書DB202やジョブDB203から高速にデータを検索するためのインデクス情報であり複数の文書レコード801および複数のジョブレコード808を参照している。
インデクスレコードはインデクス生成部211によって生成される。インデクスレコードは、検索キーとして与えられる画像に類似した画像を含む文書レコードを高速に検索するために使用することが可能である。また、インデックスレコードは、検索キーとして与えられるテキストを文書内容データやページ内容データの中に含む文書レコードを高速に全文検索するために使用することが可能のである。更に、インデックスレコードは、検索キーとして与えられる条件に合致するメタデータを持つ文書レコードやジョブレコードを高速に検索したりするために使用することが可能である。
(検索処理の手順)
図9は、検索処理の手順を説明するフローチャートである。本検索処理は画像処理装置110のCPU301において実行される組み込みアプリケーションプログラムによって達成される。この組み込みアプリケーションを文書検索アプリケーションと呼ぶ。
本フローチャートの一連の手順は、ユーザが操作部112の表示領域701中の「検索」ボタンを選択したときなどに開始する。
ステップS901で、文書検索機能の基本画面(検索画面)を操作部112の表示領域702に表示する。検索画面では、検索条件の設定、検索キーの入力、検索スタートなどができる。検索画面の構成は、図10によって説明する。
ステップS902で、ユーザの指示に応じて、検索キー画像を入力する。
ステップS903で、ユーザの指示に応じて、他の検索条件設定を入力する。
ステップS904で、ユーザからの検索開始指示が入力されるのを待機する。ユーザから検索開始が指示されるまでの間(S904−No)、ステップS902に戻り検索キー画像や他の検索条件設定の入力を繰り返す。ユーザから検索開始指示が入力されると(S904−Yes)、ステップS905に進む。
ステップS905で、検索処理を行う。文書検索アプリケーションは、サーバシステム140上で稼動するジョブアーカイブアプリケーションに接続し、リトリーブ部212に対して検索キーと検索条件を送信する。そして、リトリーブ部212による検索の結果、検索条件に合致(ヒット)した1つ以上の文書に関して、検索結果リストの表示に必要なデータを受信する。類似画像検索や全文検索の特徴上、相当数の文書が検索にヒットする場合が多い。検索結果リストを表示するために必要なデータは、ヒットした文書に対応する文書レコードに含まれるメタデータおよび文書レコードに関連付けられたジョブレコードに含まれるデータの一部である。
ステップS906で、ジョブアーカイブアプリケーションから受信した情報に基づいて検索結果リストを表示する。検索結果リスト表示の構成は、図11によって説明する。
ステップS907で、ユーザがサムネール表示設定変更を指示したか判定する。指示を受けた場合は(S907−Yes)、ステップS908に進み、サムネール表示設定を変更する。そして、ステップS906に処理が戻され、ステップS906で、変更されたサムネール表示設定に基づいて検索結果リストを再表示する。
ステップS907の判定で、サムネール表示設定変更指示が入力されない場合(S907−No)、処理はステップS909に進められる。
ステップS909で、ユーザが文書レコードフィルタ変更を指示したか判定する。指示を受けた場合は(S909−Yes)、ステップS910に進み、文書レコードフィルタを変更する。そして、ステップS906に処理が戻され、ステップS906で、変更された文書レコードフィルタに基づいて検索結果リストを再表示する。
ステップS909の判定で、文書レコードフィルタ変更指示が入力されない場合(S909−No)、処理はステップS911に進められる。
ステップS911で、ユーザが文書やページの詳細項目表示を指示したか判定する。指示を受けた場合は(S911−Yes)、ステップS912に進み、選択された文書やページやジョブに関する詳細情報を示すウィンドウを表示する。ユーザが詳細項目表示ウィンドウを閉じるとステップS906に戻り検索結果リストを再表示する。
ステップS911の判定で、詳細項目表示が入力されない場合(S911−No)、処理はステップS913に進められる。
ステップS913で、ユーザが文書レコードに対する操作を指示したか判定する。リスト中に示された文書レコードに対して可能な操作は、印刷、保存、送信、タグ付け、関連文書の検索表示、マーク付け、などがある。指示を受けた場合は(S913−Yes)、ステップS914に進み選択された指示に対応する文書レコード操作を実行する。次いで、ステップS906に戻り検索結果リストを再表示する。
ステップS915の判定で、文書レコード操作が入力されない場合(S913−No)、処理はステップS915に進められる。
ステップS915で、ユーザが再検索を指示したか判定する。指示を受けていない場合(S915−No)、ステップS906に戻り検索結果リストを再表示する。ステップS915の判定で再検索の指示を受けた場合は(S915−Yes)、ステップS901に戻り、再度一連の検索処理を実行する。
尚、この手順の一連の処理は情報処理装置101で実行してもよい。あるいは、一連の処理を部分に分割してそれぞれの処理を担当するソフトウェアを複数の装置上に配備して実行する分散アプリケーションとして構成することもできる。例えば、検索画面や検索結果リストの表示とユーザからの指示入力を画像処理装置110上で実行する。そして、それ以外の処理を情報処理装置101やサーバシステム140や他の画像処理装置120、130などの上で実行するように構成してもよい。
逆に、検索画面や検索結果リストの表示とユーザからの指示入力を情報処理装置101上で実行し、それ以外の処理を画像処理装置110やサーバシステム140の上で実行するように構成してもよい。情報処理装置101において文書検索アプリケーションを操作する場合、手元にスキャナ113を備える画像処理装置110において操作する場合よりも紙原稿の画像を検索キー画像として入力する操作は不便になることもある。この場合、予め画像処理装置110のボックス機能により蓄えた画像を、情報処理装置101や他の画像処理装置120などからも操作できるので、ボックスから選択した画像を検索キー画像として用いることは容易である。
尚、分散アプリケーションを構成する方法の1つとして、WebブラウザとWebサーバの組み合わせによって実現するWebアプリケーションの形態もある。
(文書検索画面の構成例)
図10は、文書検索アプリケーションの基本画面である文書検索画面の構成例を示す図である。
文書検索画面1000は、文書検索アプリケーションの基本画面である。本実施形態における文書検索アプリケーションは文書検索画面を操作部112の表示領域702に表示する。文書検索画面1000は、検索条件設定領域1001、検索キー画像入力領域1002、および、検索スタート指示領域1003から構成される。
検索条件設定領域1001は、検索条件を設定したり確認したりするための領域である。「検索キーの出現パターンに基づく検索」ラジオボタン1004は、基本的な検索条件を選択し選択されている設定を確認するためのラジオボタンである。このラジオボタンが選択されているとき、検索キーが文書の中に出現するパターンを条件として検索を行う。
検索キー出現パターンプルダウンメニュー1020は、「検索キーの出現パターンに基づく検索」ラジオボタン1004が選択状態にあるとき有効となり、検索条件として検索キーが文書の中に出現するパターンを選択する。検索キー出現パターンプルダウンメニュー1020において選ばれている選択肢の例「いずれかのキーを前半に含む」は、セットした検索キーのうちのいずれかにヒットするページを文書の前半部分に含む文書を検索することを示す。検索キー出現パターンプルダウンメニュー1020の他の選択肢については、図14乃至図17を参照して詳述する。
正規表現フィールド1021は、「検索キーの出現パターンに基づく検索」ラジオボタン1004が選択状態にあるとき有効となる。正規表現フィールド1021は、検索条件として設定されている検索キーが文書の中に出現するパターンを記述するフィールドである。検索キー出現パターンプルダウンメニュー1020の選択に応じて、設定された検索条件(検索キー)に相当する正規表現が表示される。検索キーの出現パターンを表現する表記方法は、Perl言語やgrepコマンドなどにおいて広く利用されよく知られている正規表現(regular expression)を用いることができる。本実形態の正規表現は、Perl言語の書式のサブセットを元にさらに若干の独自拡張を施している。正規表現フィールド1021については、図16を参照して後に詳述する。
「高度な検索」ラジオボタンは、検索オプションボタン1022によって設定したより詳細な検索条件の設定に基づいて、ヒットする文書を検索するためのラジオボタンである。
検索オプションボタン1022は、詳細な検索条件を設定するウィンドウを開くためのボタンである。詳細な検索条件の設定は、高度な検索モードで検索が実行されたときヒットする文書を判定する基準として用いる高度な検索条件の設定を含む。詳細な検索のオプションとして、メタデータ検索や全文検索を併用する条件を、類似画像検索と併用して設定できる。
メタデータ検索は、文書に対応する文書レコード801に関して、その文書メタデータやページメタデータ805群や対応するジョブレコード808にそれぞれ格納されているデータ項目ごとに検索条件を指定する検索方法である。メタデータ検索によって、タグ、文書名、所有者、作成日付、データ形式、ページ数、タグ、関連文書、などに基づく検索条件を指定できる。また、メタデータ検索によって、ジョブ履歴(日時、操作者、要求した装置、処理した装置、処理内容、このジョブにおいて処理した他の処理対象文書)、ページの構造情報、などに基づく検索条件を指定できる。
したがって、文書名や所有者や作成日時やタグなどに基づく一般的な検索に加えて、関連文書や過去にその文書が検索された履歴に基づいて検索することもできる。
メタデータ検索によれば、文書を構成するページに関して、方向がポートレート(縦長)か、ランドスケープ(横長)か、などの基準に基づいて検索することもできる。また、メタデータ検索によれば、用紙のサイズ、ページ数がnページ以上mページ未満、カラーかモノクロか、画像とテキストの割合はどの程度かなどの基準に基づいて検索することもできる。
また、メタデータ検索によれば、いつ、どこで、誰が、どのように処理した文書であるかという、ジョブに関連する基準に基づいて検索することもできる。
全文検索は、検索キーとしてテキスト(文字列)を設定し、文書の全テキスト中に設定された文字列を含む文書を検索する。文書のテキストは、文書レコード801に含まれる文書内容データ803、ページレコード804のいずれかに含まれるページ内容データに含まれているテキストである。
文書メタデータ802やページメタデータ805に含まれているテキスト形式のデータを全文検索の対象に加えることもできる。文書と関連するジョブレコード808に含まれているテキスト形式のデータを全文検索の対象に加え、ジョブレコード808がヒットした場合は対応する文書レコード801がヒットするように設定することもできる。
検索キー画像入力領域1002は、類似画像検索の検索キーとする画像を設定したり確認したりするための領域である。
原稿画像スキャンボタン1006は、画像処理装置のスキャナ113を用いて紙原稿を読み取り、類似画像検索の検索キーとして入力するためのボタンである。原稿画像スキャンボタン1006が押されると、画像スキャンウィンドウを開く。画像スキャンウィンドウでは画像処理装置110のコピー機能や送信機能における原稿読み取り設定やTWAIN等に基づく一般的なスキャナデバイスドライバの原稿読み取り設定等と同様に原稿読み取りのパラメータを設定できる。
スタートキー505が押されると、設定されている原稿読み取りパラメータに従って原稿画像をスキャンし読み取った画像データを検索キー画像として入力する。原稿画像のスキャンが完了したとき画像スキャンウィンドウが開かれていれば閉じる。原稿画像スキャンボタン1006を押さず、スタートキー505が押された場合、デフォルトの原稿読み取りパラメータ、または、その時点までに設定されている原稿読み取りパラメータに従って原稿画像をスキャンする。
ボックス画像選択ボタン1007は、画像処理装置110のボックス機能を利用して、あらかじめ格納されている文書群の中から検索キー画像を選択するためのボタンである。ボックス機能によって、画像処理装置110のHDD304を閲覧して、検索キー画像として利用したい画像を含む文書を選択できる。また、他の画像処理装置120、130のHDDや情報処理装置101、102が公開する共有ファイルシステムに、LAN100を介してアクセスし、閲覧し、検索キー画像として利用したい画像を含む文書を選択できる。あるいは、サーバシステム140がサービスする共有ファイルシステムやデータベースシステムなどの文書ファイルにLAN100を介してアクセスし、閲覧して、検索キー画像として利用したい画像を含む文書を選択できる。
検索キー画像設定領域1008は、セットされている検索キー画像の組を確認し操作するための領域である。
検索キー画像設定状況メッセージ1009は、検索キー画像のセット状況を示すメッセージであり、セットされている検索キー画像の個数などを表示する。
検索キー画像表示領域1010は、セットされている検索キー画像群を表示する領域である。この領域に、検索キーとしてセットされた画像に対応する検索キーアイコンの組が並べて表示される。原稿画像スキャンボタン1006やボックス画像選択ボタン1007を用いて検索キー画像を入力すると、対応する検索キーアイコンがこの領域に追加される。
検索キーアイコン1011は、1つの検索キー画像に対応するアイコンである。このアイコンを介して、検索キーに対する各種の操作を指示できる。
検索キーID1012は、この検索キーを特定するための識別情報(識別子)である。
検索キーサムネール1013は、検索キーのサムネール画像である。検索キーサムネール1013が押されると、画像ビューアウィンドウを開きサムネールよりも大きなサイズで検索キー画像が表示される。画像ビューアウィンドウによって、ユーザは検索キー画像の詳細を確認できる。
検索キー概要1014は、検索キー画像に関する簡単な説明である。
検索キー詳細ボタン1015は、検索キー画像に関する詳細情報を確認するためのボタンである。検索キー詳細ボタン1015の操作により検索キー概要1014よりも詳細に検索キーに関する情報を表示する検索キー詳細ウィンドウを開くことができる。検索キー詳細ウィンドウでは、検索キー画像に固有の検索条件を設定することもできる。今後の検索するときこの検索キーを再利用するために、検索キー画像をボックスに保存することもできる。
検索キー編集ボタン1016は、検索キー画像を編集するためのボタンである。検索キー編集ボタン1016の操作により検索キー画像を編集するための検索キー編集ウィンドウを開くことができる。検索キー編集ウィンドウでは、検索キー画像に対してトリミング、マスキング、ノイズ除去などの各種画像処理を施して、所望の検索キー画像へと編集できる。また、検索キー画像を切り分けて、複数の検索キー画像に分割できる。また、複数ページ画像を含む文書に対応する1つの検索キーをページ画像単位に切り分けて、それぞれのページ画像に対応する検索キー画像に分割できる。
検索キー削除ボタン1017は、検索キー画像を検索キーの組から取り除くためのボタンである。検索スタート指示領域1003は、検索処理を起動するための領域である。
検索開始ボタン1018は、検索処理を開始するためのボタンである。検索開始ボタン1018が押されると検索条件設定領域1001の検索条件と検索キー画像入力領域1002の検索キー画像とを用いて、サーバシステム140のジョブアーカイブアプリケーションに対し検索処理要求を発行する。
(文書検索結果リスト画面の構成例)
図11は、文書検索アプリケーションの文書検索結果リスト画面の構成例を表す図である。文書検索結果リスト画面1100は、文書検索アプリケーションがジョブアーカイブアプリケーションから検索処理要求の応答を受信したときその検索結果を表示する画面の一例である。本実施形態における文書検索アプリケーションは文書検索結果リスト画面を操作部112の表示領域702に表示する。文書検索結果リスト画面1100は、検索リスト操作領域1101、検索リスト表示領域1102、スクロールバー1103から構成される。
検索リスト操作領域1101は、検索結果リストの表示を制御するための操作設定領域である。表示フィルタリング表示1104は、検索リスト表示領域1102に表示されている文書群が、検索の結果ヒットした複数の文書群に対してどのような表示フィルタを施した結果残った文書群であるかを示す表示である。図11の場合、検索の結果ヒットした「全文書」を表示している状態を示す。
サーバシステム140のリトリーブ部212から受信したヒット文書の組を全て表示することもできるし(すなわちフィルタなし)、またヒットした文書の中から表示を絞り込むための表示フィルタ設定した条件に従い選別して表示することもできる。
表示フィルタ設定ボタン(フィルタ)1105は、表示フィルタ条件を設定するためのボタンである。表示フィルタ設定ボタン1105が押されると、表示フィルタ設定ウィンドウを開き、ユーザに所望のフィルタ条件を設定させる。ヒットした文書群の文書レコード801に含まれる各種の情報に基づく条件をフィルタ条件に設定できる。文書メタデータ802、ヒットしたページのページレコード804のページメタデータ805、文書に関連付けられたジョブレコード808等に格納された各情報に対するパターンマッチングとして条件を設定できる。言い換えると、検索オプションボタン1022で設定できる詳細な検索のオプションと同様のフィルタ条件を設定できる。
例えば、文書名や作成日時やタグなどに基づく一般的なフィルタリングに加えて、関連文書や過去にその文書が検索された履歴に基づいてフィルタリングすることもできる。検索キーとなる検索条件と文書データとの類似度を絞込み込みを行うための表示フィルタ設定条件とすることも可能である。また、文書を構成するページに関して、方向がポートレート(縦長)か、ランドスケープ(横長)かなどの基準に基づいてフィルタリングすることもできる。また、用紙のサイズ、ページ数がnページ以上mページ未満、カラーかグレースケール(連続階調画像)か、白黒二値画像か、画像とテキストの割合はどの程度かなどの基準に基づいてフィルタリングすることもできる。また、いつ、どこで、誰が、どのように処理した文書であるかという、ジョブに関連する基準に基づいてフィルタリングすることもできる。
本実施形態によれば、検索でヒットした文書の組をすべて検索リスト表示領域1102に表示するだけでなく、特定の条件を満足する文書を抽出して一覧表示するフィルタを設定できる。さらに、設定を変更すると即時に検索結果リストが更新されるので、大量の候補文書の中から所望の文書を容易に見つけ出せる。
表示項目設定領域1106は、検索でヒットした文書の組を検索リスト表示領域1102に表示する際に、文書ごとに表示する項目を制御する領域である。チェックボックスの矩形またはチェックボックスにつけられたラベル文字列を押すたびに、チェックボックスの選択状態と非選択状態とが交互に切り替わる。「属性情報を表示」チェックボックスが選択されている場合、文書名、データ形式、ページ数、文書の所在情報、などの文書に関するメタデータ群を検索リスト表示領域1102に表示する。「サムネールを表示」チェックボックスが選択されている場合、検索条件にヒットしたページのサムネール画像を検索リスト表示領域1102に表示する。
文書サマリーサムネール設定領域1107は、検索でヒットした文書の組を検索リスト表示領域1102に表示する際に、文書ごとに表示する文書サマリーサムネールの表示形式を制御する領域である。表示項目設定領域1106の「サムネールを表示」チェックボックスが選択されており、かつ、「文書サマリーサムネールを表示」するチェックボックスが選択されている場合、文書サマリーサムネールを表示する。文書サマリーサムネールとは、その文書の概要を視覚的に把握しやすくするために、文書を構成するページに対応する一組のサムネールを並べたものである。
文書サマリーサムネール構成設定領域1108は、文書サマリーサムネールを構成するサムネール群の構成を設定する慮域である。文書サマリーサムネール構成設定領域1108には4つの数値入力用のテキスト入力フィールドが並べてあり、それぞれに「先頭」、「前」、「後」、「末尾」のラベル文字列をつけてある。「先頭」の数値によって、文書の先頭ページから何ページ分のサムネールを表示するか設定する。「前」の数値によって、検索でヒットしたページに先行するページのサムネールを何ページ分表示するか設定する。「後」の数値によって、検索でヒットしたページに後続するページのサムネールを何ページ分表示するか設定する。「末尾」の数値によって、文書の末尾ページから何ページ分のサムネールを表示するか設定する。
アニメーション表示チェックボックス1109は、文書サマリーサムネールをアニメーション表示設定するためのチェックボックスである。
再検索ボタン1110は、文書検索画面1000に戻るためのボタンである。
絞り込み検索ボタン1111は、文書検索画面1000に戻って絞り込み再検索を行うためのボタンである。検索リスト表示領域1102に表示された文書の中から検索キーとして追加したい文書(検索キーとして追加したい画像を含む文書)をマークしてから、絞り込み検索ボタン1111を押す。絞り込み検索ボタン1111が押下されると、マークをつけられた文書が検索キーとして検索キー画像表示領域1010に追加された状態で文書検索画面1000に戻り、絞り込み再検索を続行することが可能になる。
的確な検索キー画像をできるだけ多く簡便に追加することによって、所望の文書の検索ヒット率(設定された条件に合致する割合)が向上し、所望の文書を見つけ出しやすくできる。また、追加された検索キー画像の特徴量を分析し、類似度の判定における各種特徴量の配点を調整することによって、よりユーザの意図に即した類似画像検索を行うことが可能となる。
すなわち、ユーザが絞り込み検索によってあえて追加した検索キー画像は、検索を行うユーザの観点からみても主観的に類似度が高いサンプル画像であると判断できる。したがって、この検索キー画像の類似度がより高く評価されるように、複数の特徴量と類似度判定アルゴリズムを組み合わせる配点を調整することができる。例えば、元の検索キー画像と追加された検索キー画像の間で、形状に基づく類似度が高く色合いに基づく類似度が低かった場合は、絞り込み再検索では形状ベースの類似度を色合いよりも優先するように検索することができる。同様にして、色合い優先、配色パターン優先、オブジェクト構造木の類似度優先など、適切な調整を行うことができる。
検索リスト表示領域1102は、検索した結果、検索条件に合致した文書の一覧を表示する領域である。検索ヒット文書表示1112、1113、1114、1115は、それぞれ検索条件、絞り込みがかけられた条件に合致した文書に対応する情報を表示している。デフォルトの設定では、ヒット率(設定された条件に合致する割合)が高い文書ほどリストの上位に表示する。同等のヒット率(設定された条件に合致する割合)の場合、文書の価値を数値化した文書ランクが高い文書ほど上位に表示する。表示フィルタ設定ボタン1105を押して、デフォルト以外の順序で並べ替えて文書リストを表示し直すこともできる。例えば、文書の作成日、最終参照日、文書名、データ形式、ページ数、文書の所在情報、その文書を対象としたジョブの日時や装置や処理内容等、文書に関連づけられた各種のメタデータに基づいて、昇順または降順に表示できる。文書リストの表示順序を設定しなおすと、即時にリスト表示が更新される。
デフォルトの表示順序のよりどころとなる文書のヒット率(設定された条件に合致する割合)について簡単に説明する。類似画像検索は、アルゴリズムごとに固有の類似度に基づく。一般に類似度は「似ている程度」を表現する連続量であり、「似ているか、または、似ていない」の二値ではない。但し、本実施形態の実装上は、類似度が所定の閾値よりも低い画像は似ていないものとして処理する。類似度が所定の閾値よりも高い画像に関して、相対的に類似度の高い画像と低い画像とを区別することができる。与えられた検索条件に含まれる検索キー画像と、検索される文書データに含まれる画像との類似度の判定結果に基づいて、ヒット率(設定された条件に合致する割合)が算出される。すなわち、類似度が高い画像を含む文書の方が、比較的低い画像を含む文書よりも、ヒット率は高く算出される。
また、検索キーは複数指定できるので、より多くの検索条件に合致する文書の方がより少ない検索条件だけに合致する文書よりもヒット率を高く算出する。類似画像検索の検索キー画像が複数指定される場合、類似度の高い画像を多く含めばヒット率を高くする。尚、「すべてのキーを含む」ラジオボタンが選択されて検索された場合、与えられた検索キーのすべてに合致しなければヒットしないものとする。
次に、デフォルトの表示順序のよりどころとなる文書ランクについて説明する。文書ランクは文書の意味的な重要度を表す指標として算出される。文書ランクは、文書のメタデータとして明示的に割り付けられた重要度に基づく。また、機密度、所有者、作者、保管場所、ページ数、などの文書の属性に基づいて文書ランクを算出する。更に、その文書に後からつけられたタグの数や種類、参照された回数、関連文書の参照関係のネットワークなどに基づいて文書ランクを算出することもできる。
関連文書の相互参照関係のネットワークに基づく文書ランクとは、文書ランクの高い文書から多く参照されている文書は比較的ランクが高いものとして算出される。また、文書ランクの高い文書と同時に処理(すなわち、同時にプリント、送信、保存、リトリーブ、ジョブ結合など)された履歴を持つ文書は比較的文書ランクが高いものとして文書ランクが算出される。
検索リスト表示領域1102に表示される文書群のうち、リストの下位に配置される文書は上位に配置される文書よりも、検索ヒット文書表示をより簡略化したり縮小したりすることによって、一画面の中に表示可能な文書の総件数を増やすことも可能である。
本実施形態によれば、デフォルトの設定では、ヒット率順、文書ランク順、文書に付随するメタデータ順、その文書を対象として行われたジョブのメタデータ順、などに基づいて、文書リストを並べて表示できる。更に、文書リストの表示順序を設定し直すと即時にリスト表示が更新されるので、多数の候補文書の中から所望の文書を容易に検索することができる。
スクロールバー1103は、文書検索結果リスト画面1100をスクロールするためのスクロールバーである。多くの場合、検索リスト表示領域1102には大量の文書が表示されるので、操作部112のディスプレイ502の表示領域に納まらない場合が普通である。ユーザは画面をスクロールしながら文書を一覧してその中から所望の文書を見つけ出すことができる。尚、検索リスト表示領域1102の最下部などにページ送りのためのボタンなど(不図示)を配置して、検索結果文書のリストを複数のページに分割して表示してもよい。
尚、検索リスト表示領域1102の最下部などに配置したリストプリントボタン(不図示)を押すと、文書検索結果リストをプリント出力するように構成してもよい。限られた表示領域の中で、できるだけ多数の文書を一覧したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことの難しい競合要件である。しかしながら、本実施形態に拠れば、文書検索結果リストを即時にプリント出力できるので、ディスプレイ502よりも高解像度で一覧性も高い出力紙を用いて、容易に所望の文書を見つけ出すことができる。
(検索ヒット文書表示の一例)
図11に示す検索ヒット文書表示1112、1113、1114、1115は、全て同様に構成されている。斜体の文字列は、実際の画面表示においては文書が持つ対応するメタデータの実際の値が表示されることを示している。下線が付してある文字列は、その表示領域を押すと対応する詳細情報表示ウィンドウが開き、それぞれの情報のより詳細な情報を確認できる。
図12は、検索ヒット文書表示例として、検索ヒット文書表示1112を示す図である。データ形式アイコン1201は対応する文書のデータ形式を表示するためのアイコンである。文書名1202は対応する文書の文書名を表示するための文字列である。データ形式1203は対応する文書のデータ形式を表示するための文字列である。ページ数1204は対応する文書のページ数を表示するための文字列である。文書の所在情報1205は、対応する文書が保存されているファイルサーバなどの格納位置(場所)を特定するための文字列である。文書の所在情報は、URIやファイルサーバとそのファイルシステム中のファイルパス文字列などによって識別される。ジョブアーカイブシステムが蓄積した文書の場合、ジョブアーカイブシステムのジョブにおいて収集された処理対象文書の控えデータが保存されている位置を表示してもよい。あるいは、処理対象文書のオリジナルデータが保存されている位置が特定できる場合はその位置を表示してもよい。
履歴情報1206は、対応する文書を処理対象として過去に施されたジョブ処理や検索などの履歴を表現するための文字列である。いつ、誰が、どんな処理を、どの装置において、この文書に対して施したかといった履歴情報を確認できる。
ページ1207は、対応する文書を構成するページのうち、検索キーの条件にヒットしたページのページ番号を表現するための文字列である。
ヒットページサムネール1208は、対応する文書を構成するページのうち、検索キーの条件にヒットしたページまたは画像要素の概観を表示するためのサムネール画像である。
先頭ページサムネール1209は、対応する文書の先頭のページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
前ページサムネール1210は、検索キーにヒットしたページに先行するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。後ページサムネール1211は、検索キーにヒットしたページに後続するページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。末尾ページサムネール1212は、対応する文書の末尾ページの概観を表現するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことが難しい。しかしながら、本実施形態によれば、文書サマリーサムネール中に表示するページ構成とそのページ数を簡単に変更可能であるため、容易に所望の文書を検索することができる。
非常に多くのページを文書サマリーサムネールに表示しようとした場合、より縮小率の高い小さなサムネールを表示して、限られた表示領域の中に収まるように検索結果の表示を調整することができる。あるいは、比較的優先度の低いページのサムネールをより小さく縮小して表示したり、先行するページの裏側に重ね合わせページの一部が隠れるように配置して表示を制御することも可能である。あるいは、検索結果の表示を省略することによって、限られた表示領域の中に収まるように検索結果の表示を調整することも可能である。
表示領域が不十分なとき、文書サマリーサムネール中に優先的に表示する優先度の高いページは、次のようなアルゴリズムに従って選択することが可能である。例えば、文書の前方のページをより優先する、先に指定された検索キーに対応してヒットしたページをより優先する、類似画像検索の条件にヒットした場合は類似度の高いページを優先するアルゴリズムを利用することができる。
印刷ボタン1213は、対応する文書をプリント機能によってプリント出力するためのボタンである。保存ボタン1214は、対応する文書をボックス機能に保存するためのボタンである。送信ボタン1215は、対応する文書を送信機能によって送信するためのボタンである。
タグ付けボタン1216は、対応する文書のタグを操作するためのボタンである。タグ付けボタン1216を押すと、文書タグウィンドウが開き、既に当該する文書に設定されているタグを閲覧および編集するとともに、任意のタグを新たに追加登録できる。
関連文書ボタン1217は、対応する文書に関連付けられている文書(関連文書)に対する操作設定を行うためのボタンである。関連文書ボタン1217を押すと、関連文書ウィンドウが開き、該当する文書に関連付けられている関連文書を閲覧し、編集することが可能である。また、該当する文書に対して、他の文書を関連付け、関連文書として追加登録することができる。
マーク付けチェックボックス(マーク)1218は、対応する文書をマークするためのチェックボックスである。リストに表示された文書群のうちいくつかの文書に対する選択的な操作を行う場合、このチェックボックスが選択状態にある文書が対象となる。例えば、マーク付けチェックボックス1218を選択状態にしてから、絞り込み検索ボタン1111を押すと、マークされた(選択状態にされた)文書群が検索キーに追加された状態で再検索が実行される。
本実施形態に拠れば、文書サマリーサムネールによって検索にヒットしたページだけでなく、そのページの前後関係と、文書の全体像とを一目で把握できるので、リスト中から所望の文書を容易に検索することが可能になる。
(複数ページがヒットした文書の表示)
図13は、複数ページがヒットした文書の検索ヒット文書表示の一例を示す図である。前述の表示項目に関しては同一の符号をつけて説明を省略する。類似画像検索は連続的な類似度に基づく検索であるため、ひとつの文書に含まれる複数の類似画像が検索にヒットする可能性がある。また、検索キーと条件を複数設定して検索できるため、ひとつの文書内の複数のページが検索にヒットする可能性もある。図13は、文書中の2つのヒットページサムネール1208、1302が検索にヒットした文書に関する表示例を示している。
ページ1301は、対応する文書を構成するページのうち、検索キーの条件にヒットした2番目のページのページ番号を表示するための文字列である。ヒットページサムネール1302は、対応する文書を構成するページのうち、検索キーの条件にヒットした2番目のページの概観を表示するためのサムネール画像である。
前ページサムネール1303は、検索キーにヒットした2番目のページに先行するページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
後ページサムネール1304は、検索キーにヒットした2番目のページに後続するページの概観を表示するためのサムネール画像である。文書サマリーサムネール構成設定領域1108において設定されたページ数分のサムネール画像を並べて表示する。
限られた表示領域の中で、できるだけ多数の文書を一覧して所望の文書を選び出したいという要件と、できるだけ詳細な文書サマリーサムネールを見くらべて所望の文書を選び出したいという要件とは、同時に満たすことが難しい。しかしながら、本実施形態によれば、文書サマリーサムネール中に表示するページ構成とそのページ数を簡単に変更可能であるため、容易に所望の文書を検索することが可能になる。
尚、図13の表示例の場合でも図12と同様に、より縮小率の高い小さなサムネールを表示して、限られた表示領域の中に収まるように検索結果の表示を調整することができる。あるいは、比較的優先度の低いページのサムネールをより小さく縮小して表示したり、先行するページの裏側に重ね合わせページの一部が隠れるように配置して表示を制御することも可能である。あるいは、検索結果の表示を省略することによって、限られた表示領域の中に収まるように検索結果の表示を調整することも可能である。
尚、表示領域が不十分なとき、文書サマリーサムネール画像に優先度が設定される。優先度の高いページは、次のようなアルゴリズムに従って選択することが可能である。例えば、文書の前方のページをより優先する、先に指定された検索キーに対応してヒットしたページをより優先する、類似画像検索の条件にヒットした場合は類似度の高いページを優先するアルゴリズムを利用することができる。
(検索キー画像の出現パターンに基づく検索条件設定の例)
図14は、第1実施形態における検索キー画像の出現パターンに基づく検索条件設定の例を示す図である。
図10に示した文書検索画面1000の検索条件設定領域1001において、検索キー出現パターンプルダウンメニュー1020および正規表現フィールド1021は、図14(a)〜(d)のような設定を取り得る。
図14(a)は、「いずれかのキーを含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像のいずれかに類似する画像を文書の任意の位置に含む文書が検索される。
図14(b)は、「すべてのキーを含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像のすべてに類似する画像を文書の任意の位置に含む文書が検索される。
図14(c)は、「キーの順に含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像のすべてに関して類似する画像を、キーに設定した順番に文書の任意の位置に含む文書が検索される。各々のキーにヒットする画像の間に任意の他の画像が含まれている文書も図14(c)の検索条件に合致する。
図14(d)は、「キーの順に連続して含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像のすべてに関して類似する画像をキーに設定した順番に、しかも連続して、文書の任意の位置に含む文書が検索される。各々のキーにヒットする画像の間に他の画像が含まれている文書は、図14(d)の検索条件に合致しない。
また、不図示のオプション設定項目によって、図14(a)〜(d)の検索条件に該当しない文書がヒットするような条件(否定の条件)を追加設定できる。更に、キー画像との類似度が著しく低く、キー画像にヒットしない画像を検出する「キー画像の否定」を検索条件に含めることもできる。
本形態によれば、画像検索に基づく文書検索において、検索キー画像の文書中における出現パターンに基づいて検索条件を設定して文書の検索を行うことが可能になる。
本形態によれば、画像検索に基づく文書検索において、きめの細かい検索条件を設定し、絞り込み行い、所望の文書に近い文書だけがヒットする画像検索に基づく文書検索が可能になる。
また、類似画像検索に基づく、文書を構成する画像の部分一致検索が可能となる。
また、本形態によれば、例えば、「冒頭の数ページがこれに似ている文書を検索(例えば、ドラフトから完成版に向かう複数バージョンを検索)」などの感覚的な条件を検索条件に反映した実用的な検索が可能となる。
(第2実施形態)
図15は、第2実施形態における検索キー画像の出現パターンに基づく検索条件設定の例を示す図である。
図10に示した文書検索画面1000の検索条件設定領域1001において、検索キー出現パターンプルダウンメニュー1020および正規表現フィールド1021は、図15(a)〜(e)のような設定を取り得る。
図15(a)は、「キーから始まる」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像に類似する画像を文書の先頭の位置に含む文書が検索される。
図15(b)は、「キーで終わる」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像に類似する画像を文書の末尾の位置に含む文書が検索される。
図15(c)は、「キーを前半に含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像に類似する画像を文書の前半部分の位置に含む文書が検索される。
図15(d)は、「キーを後半に含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像に類似する画像を文書の後半部分の位置に含む文書が検索される。
図15(e)は、「キーを中間の1/3に含む」という検索キーの出現パターンに基づく検索条件が設定される例である。この条件が設定されているとき、セットした検索キー画像に類似する画像を、文書全体を三分割した中間部分の範囲に含む文書が検索される。
また、不図示のオプション設定項目によって、図15(a)〜(d)の検索条件に該当しない文書がヒットするような条件(否定の条件)を追加設定できる。更に、キー画像との類似度が著しく低く、キー画像にヒットしない画像を検出する「キー画像の否定」を検索条件に含めることもできる。
本形態によれば、画像検索に基づく文書検索において、検索キー画像の文書中における出現パターンに基づいて検索条件を設定して文書の検索を行うことが可能になる。
本形態によれば、画像検索に基づく文書検索において、きめの細かい検索条件を設定し、絞り込み行い、所望の文書に近い文書だけがヒットする画像検索に基づく文書検索が可能になる。
また、本形態によれば、例えば、「冒頭の数ページがこれに似ている文書を検索(例えば、ドラフトから完成版に向かう複数バージョンを検索)」などの感覚的な条件を検索条件に反映した実用的な検索が可能となる。
(第3実施形態)
図16は、第3実施形態における検索キー画像の出現パターンに基づく検索条件設定の例を示す図である。
図10に示した文書検索画面1000の検索条件設定領域1001において、検索キー出現パターンプルダウンメニュー1020から「パターンを設定」を選択する。「パターンを設定」が選択されると、パレット領域1600とパターン領域1615が表示され、グラフィカルなユーザインタフェースによってパターンをきめ細かく設定できるようになる。
パレット領域1600は、パターンを構成する要素に相当するアイコンの集合が並ぶ領域である。パレット領域1600には、キー要素アイコン1601、1602、および、正規表現構成記号アイコン1603〜1614が表示される。正規表現構成記号アイコン1603〜1614は、選択されたキー要素アイコン1601、1602(キー画像)の検索を制御するための記述的な検索条件となる。
ユーザはパレット領域1600の中からアイコンを選び、パターン領域1615にドラッグアンドドロップすることによって、そのアイコンに相当するパターン構成要素を検索条件の設定に含めることができる。
代替記号アイコン1603は、2つ以上のパターンからなる選択肢を指定することを可能とする代替演算子アイコンである。例えば、「 a|b 」は対象文書中の任意の位置に「 a 」または 「b 」のパターンが含まれていれば検索条件に合致(マッチ)する。
左括弧記号アイコン1604と右括弧記号アイコン1605は、パターンのグループ化を表現するためのアイコンである。これらのアイコンで囲むことによって、1単位として扱うサブパターンを指定できる。たとえば a(b|c)d は、「abd 」または「 acd 」というパターンが含まれていれば検索条件に合致(マッチ)する。
0以上繰り返し記号アイコン1607は、直前の要素の0回以上の繰り返しが含まれていれば検索条件に合致(マッチ)する。例えば、「 ab*c」 は、ac, abc, abbc, abbbc,... など、「a」、「b」、「ab」が直前に含まれていれば検索条件に合致する(マッチ)する。
1以上繰り返し記号アイコン1608は、直前の要素の1回以上の繰り返しが含まれていれば検索条件に合致(マッチ)する。例えば、「 ab+c」 は、abbc, abbbc, ... などは本検索条件に合致(マッチ)する。
0か1記号アイコン1609は直前の要素の繰り返しが無いか、または1つだけあるとき検索条件に合致(マッチ)する。例えば、「ab?c」は、「ac」および「abc」にマッチする。
任意記号アイコン1610は、任意の画像にマッチするワイルドカードである。例えば、「a.b 」は「aab」,「 abb」, 「acb」, 「adb」, ... 等にマッチする。また、例えば 「.* 」は任意の画像が0以上繰り返すパターンを検索するための検索条件を表現する。
先頭記号アイコン1611は、文書の先頭位置にマッチする検索位置の指定条件を示す位置指定子である。例えば、「^a 」は、パターン「a」が文書の先頭にある場合にマッチする。
末尾記号アイコン1612は、文書の末尾位置にマッチする検索位置の指定条件を示す位置指定子である。例えば、「a$」 は、パターン「a」が文書の末尾にある場合にマッチする。
任意の1/3文書記号アイコン1613は、文書の約三分の一に相当する任意の部分文書にマッチするものを検索するアイコンである。
任意の1/2文書記号アイコン1614は、文書の約半分に相当する任意の部分文書にマッチするものを検索するアイコンである。
パターン領域1615は、検索するべき文書のパターンを設定するための領域である。ユーザは、パターン領域1615中に配置したアイコンをドラッグアンドドロップすることによって順序を並べ替えることができる。また、アイコンをドラッグして領域外でドロップすることによって、そのアイコンに相当する要素をパターン設定から取り除くこともできる。
正規表現フィールド1021は、パターン領域1615においてグラフィカルに設定されているパターンを、正規表現によって表示する。不図示のキーボードや操作部112の操作などから正規表現フィールド1021へ直接テキストを入力することもできる。
また、不図示のオプション設定項目によって、本実施形態で説明した検索条件に該当しない文書がヒットするような条件(否定の条件)を追加設定できる。更に、キー画像との類似度が著しく低く、キー画像にヒットしない画像を検出する「キー画像の否定」を検索条件に含めることもできる。
本形態によれば、画像検索に基づく文書検索において、検索キー画像の文書中における出現パターンに基づいて検索条件を設定して文書の検索を行うことが可能になる。
本形態によれば、画像検索に基づく文書検索において、きめの細かい検索条件を設定し、絞り込み行い、所望の文書に近い文書だけがヒットする画像検索に基づく文書検索が可能になる。
また、本形態によれば、例えば、「冒頭の数ページがこれに似ている文書を検索(例えば、ドラフトから完成版に向かう複数バージョンを検索)」などの感覚的な条件を検索条件に反映した実用的な検索が可能となる。
(第4実施形態)
先に説明した実施形態では文書を構成するページを単位として検索パターンを設定したが、本実施形態ではページを構成する画像群のページ中における出現パターンを検索条件とする。
図17は、複数の画像領域要素から構成される文書の一例を示す図である。文書1700は、複数の画像領域およびテキスト領域から構成される文書の一例である。文書1700を画像構造解析部208や展開部210が解析した結果としてページの構造に関する構造情報が得られ、文書を構成する複数の画像や複数テキストといった要素を分解できる。また、各要素の間の配置上の距離や、文化によってきまる配置と前後関係の慣習などに基づく解析によって、要素間の相互関係も構造情報として得られる。尚、文書がHTMLなどのコードデータによって記述されている場合は、データそのものが要素間の関係を自己記述している場合もある。
文書1700は、画像要素1701〜1712を含む。これらの画像要素群は、まず左から右の順に配置され、さらに上から下の順に配置されるという文化的慣習に基づき符号の番号の順に前後関係を持つものと解析できる。
図18は、第4実施形態における検索キー画像の出現パターンに基づく検索条件設定の例を示す図である。図10に示した文書検索画面1000の検索条件設定領域1001において、検索キー出現パターンプルダウンメニュー1020から「ページ内の位置を設定」を選択する。「ページ内の位置を設定」が選択されると、パレット領域1600とパターン領域1615が表示され、グラフィカルなユーザインタフェースによってパターンをきめ細かく設定できるようになる。
パレット領域1600は、パターンを構成する要素に相当するアイコンの集合が並ぶ領域である。パレット領域1600には、キー要素アイコン1601、1602、および、正規表現構成記号アイコン1801〜1805が表示される。正規表現構成記号アイコン1801〜1805は、選択されたキー要素アイコン1601、1602(キー画像)の検索を制御するための記述的な検索条件となる。ユーザはパレット領域1600の中からアイコンを選び、パターン領域1615にドラッグアンドドロップすることによって、そのアイコンに相当するパターン構成要素をパターン設定に含めることができる。
ページ先頭記号アイコン1801は、直前に配置された検索対象のパターンが文書を構成するページの先頭の位置にあるとき検索条件に合致(マッチ)する。例えば、検索キー画像に相当するキー要素アイコンの次にこのアイコンを置くと、キー画像の類似画像がページの先頭部分にあるページを含む文書を検索できる。
ページ前半記号アイコン1802は、直前に配置された検索対象のパターンが文書を構成するページの前半部分の範囲内にあるとき検索条件に合致(マッチ)する。例えば、検索キー画像に相当するキー要素アイコンの次にこのアイコンを置くと、キー画像の類似画像がページの前半部分にあるページを含む文書を検索できる。
ページ中ほど記号アイコン1803は、直前に配置された検索対象のパターンが文書を構成するページの中ほど部分の範囲内にあるとき検索条件に合致(マッチ)する。例えば、検索キー画像に相当するキー要素アイコンの次にこのアイコンを置くと、キー画像の類似画像がページの中ほど部分にあるページを含む文書を検索できる。
ページ後半記号アイコン1804は、直前に配置された検索対象のパターンが文書を構成するページの後半部分の範囲内にあるとき検索条件に合致(マッチ)する。例えば、検索キー画像に相当するキー要素アイコンの次にこのアイコンを置くと、キー画像の類似画像がページの後半部分にあるページを含む文書を検索できる。
ページ末尾記号アイコン1805は、直前に配置された検索対象のパターンが文書を構成するページの末尾の位置にあるときマッチする。たとえば検索キー画像に相当するキー要素アイコンの次にこのアイコンを置くと、キー画像の類似画像がページの末尾部分にあるページを含む文書を検索できる。
前述の実施例において説明したページ単位の出現パターンに基づく検索と、本実施例のページ内の画像領域出現パターンに基づく検索を組み合わせて、より複雑なパターンを検索条件として設定することもできる。
また、不図示のオプション設定項目によって、本実施形態で説明した検索条件に該当しない文書がヒットするような条件(否定の条件)を追加設定できる。更に、キー画像との類似度が著しく低く、キー画像にヒットしない画像を検出する「キー画像の否定」を検索条件に含めることもできる。
本形態によれば、画像検索に基づく文書検索において、検索キー画像の文書中における出現パターンに基づいて検索条件を設定して文書の検索を行うことが可能になる。
本形態によれば、画像検索に基づく文書検索において、きめの細かい検索条件を設定し、絞り込み行い、所望の文書に近い文書だけがヒットする画像検索に基づく文書検索が可能になる。
また、本形態によれば、例えば、「冒頭の数ページがこれに似ている文書を検索(例えば、ドラフトから完成版に向かう複数バージョンを検索)」などの感覚的な条件を検索条件に反映した実用的な検索が可能となる。
(他の実施形態)
尚、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。