[go: up one dir, main page]

JP2001160068A - 文書管理システムにおいて問い合わせを処理するための方法及び装置 - Google Patents

文書管理システムにおいて問い合わせを処理するための方法及び装置

Info

Publication number
JP2001160068A
JP2001160068A JP2000318119A JP2000318119A JP2001160068A JP 2001160068 A JP2001160068 A JP 2001160068A JP 2000318119 A JP2000318119 A JP 2000318119A JP 2000318119 A JP2000318119 A JP 2000318119A JP 2001160068 A JP2001160068 A JP 2001160068A
Authority
JP
Japan
Prior art keywords
document
query
document database
database
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000318119A
Other languages
English (en)
Inventor
Piasoru Kurt
ピアソル カート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/439,151 external-priority patent/US6775665B1/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2001160068A publication Critical patent/JP2001160068A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書管理システムにおいて、普通の文書と同
様に、問い合わせの保存、検索、再利用、修正、アクセ
ス制御などを可能にする。 【解決手段】 文書データベースのオブジェクトを検索
するための第1のデータベース問い合わせを識別し(8
02)、この問い合わせを説明する注釈データを受け取
り(804)、第1のデータベース問い合わせと注釈デ
ータとから内容検索可能なデータベース問い合わせを生
成し(806)、その問い合わせを、その後に検索する
ために、1つのオブジェクトとして文書データベースに
格納する(808)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書管理システム
に係り、特に、文書管理システムにおいて問い合わせを
処理するための方法及び装置に関する。
【0002】
【従来の技術】様々な量のデジタルデータを、後日検索
するため組織化して格納するために、電子的なデータベ
ース・システムが利用されることが多い。電子的なデー
タベース・システムに格納されたデータを探し出すた
め、ユーザはしばしば、データベース検索の実行範囲を
定義する様々な検索条件を含んだ問い合わせを作成す
る。利便性を高めるため、あるデータベース応用プログ
ラムでは、ユーザが問い合わせを作成し、それ保存する
ことができるので、それら問い合わせを実行のたびに作
成し直す必要がない。これは何度も実行される問い合わ
せについては有益であろうが、そのような保存された問
い合わせは、一般に固定した検索条件を含んでおり、ま
た、データベース応用プログラムの一部として格納され
ている。これらの保存された問い合わせは、そのような
ものであるから、不変のデータセットを収容する従来の
構造化された電子的データベースをうまく処理できるか
もしれないが、電子的文書データベースに適用する場合
には不十分であることが判明した。
【0003】電子的文書データベースは、物理的な文書
の電子的表現を索引付けする特殊な電子的データベース
である。電子的文書データベースは一般に、それに収容
された電子的文書を、メタデータとして知られている付
加的な構造化情報のみならず各文書の全テキスト内容に
基づいて検索することが可能である。電子的文書データ
ベースを検索するために作成される問い合わせは、多く
の場合、文書生成の日付及び/又は時間帯に加え文書内
容に特有の検索条件を含む。したがって、そのような文
書問い合わせは、内容、日付及び時刻に左右されやすい
ため、データベース応用プログラムの一部として格納さ
れた場合には、データベース自体の一部として格納され
た場合に比べ利用しにくいことが判明した。
【0004】当該技術分野で知られている方法により保
存された問い合わせに関する、その他の不十分な点とし
て、保存された問い合わせの配布と再利用の問題があ
る。一般に、データベース・システムのユーザ間で問い
合わせを共有するためには、データベースから独立した
特殊な機構を利用する必要がある。このような機構は、
保存された問い合わせに対するユーザ・アクセスの制御
に関し問題があることが多く、保存されている問い合わ
せに対する不適切なユーザ・アクセスを許可してしま
う。また、当該技術分野で知られている方法により問い
合わせを保存した場合、ユーザは、ユーザ自身の問い合
わせよりも自分の検索に適している可能性のある他の既
存の保存問い合わせを検索することができない。
【0005】
【発明が解決しようとする課題】よって、本発明の目的
は、以上に述べたような文書管理システムにおける問い
合わせに関する不都合を解決するためための改良した方
法と装置を提供することにある。
【0006】
【課題を解決するための手段】本発明によれば、文書管
理システムにおいて、保存された問い合わせが検索可能
な文書として扱われる方法と装置が提供される。
【0007】本発明方法の主要な特徴は、請求項1記載
のように、文書データベースのオブジェクトを検索する
ための第1の文書データベース問い合わせを識別し、前
記第1の文書データベース問い合わせから内容検索可能
な問い合わせ文書を生成し、前記内容検索可能な問い合
わせ文書を、後に検索するため1つのオブジェクトとし
て前記文書データベースに格納することである。もう1
つの特徴は、請求項2記載のように、前記第1の文書デ
ータベース問い合わせを説明する注釈データを受け取
り、この注釈データと前記第1の文書データベース問い
合わせとから前記内容検索可能な問い合わせ文書を生成
するである。もう1つの特徴は、請求項3記載のよう
に、第2の文書データベース問い合わせが実行される
と、それに応答して前記文書データベースより前記内容
検索可能な問い合わせ文書を検索することである。もう
1つの特徴は、請求項4記載のように、前記内容検索可
能な問い合わせ文書を実行して付加的な文書データベー
ス・オブジェクトを検索することである。
【0008】本発明装置の主要な特徴は、請求項21記
載のように、文書データベースのオブジェクトを検索す
るための第1の文書データベース問い合わせを識別する
手段、前記第1の文書データベース問い合わせから内容
検索可能な問い合わせ文書を生成する手段、前記内容検
索可能な問い合わせ文書を後に検索するため1つのオブ
ジェクトとして前記文書データベースに格納する手段を
有することである。もう1つの特徴は、請求項22記載
のように、前記第1の文書データベース問い合わせを説
明する注釈データを受け取る手段をさらに有し、前記内
容検索可能な問い合わせ文書を生成する前記手段は、前
記第1の文書データベース問い合わせ及び前記注釈デー
タより前記内容検索可能な問い合わせ文書を生成するこ
とである。もう1つの特徴は、請求項23記載のよう
に、第2の文書データベース問い合わせが実行される
と、それに応答して前記文書データベースより前記内容
検索可能な問い合わせ文書を検索する手段をさらに有す
ることである。もう1つの特徴は、請求項24記載のよ
うに、前記内容検索可能な問い合わせ文書を実行して付
加的な文書データベース・オブジェクトを検索する手段
をさらに有することである。
【0009】以上に述べた本発明の特徴及びその他の特
徴は、以下の実施の形態に関連した説明から明白となろ
う。
【0010】
【発明の実施の形態】以下の記述中に、あくまで説明の
ためのものであるが、本発明を完全に理解できるように
様々な具体例が示される。しかし、当業者には、そのよ
うな具体例によることなく本発明を実施し得ることは明
白であろう。他方、本発明を分かりにくくしないため、
周知の構造や装置はブロック図の形で表現される。
【0011】以下の詳細な説明には、コンピュータ・メ
モリ内のデータビットに対する操作のアルゴリズム及び
記号表現によって表された部分がある。このようなアル
ゴリズム記述及び表現は、データ処理技術分野におい
て、当業者が研究内容を他の当業者に最も効率的に伝え
るために用いる手段である。あるアルゴリズムがあり、
それが概して期待した結果に至る筋の通ったステップの
系列だと理解されるとする。それらのステップは、物理
量の物理的処理を要するステップである。必ずという訳
ではないが、これらの物理量は記憶、転送、結合、比
較、その他処理が可能な電気的または磁気的信号の形を
とるのが普通である。これらの信号をビット、値、要
素、記号、文字、用語、数値等で表わすのが、主に慣用
上の理由から便利な場合があることが分かっている。
【0012】しかしながら、このような用語や同様の用
語は、適切な物理量に関連付けられるべきであり、ま
た、これら物理量に付けた便宜上のラベルに過ぎないと
いうことに留意すべきである。以下の説明から明らかな
ように、特に断わらない限り、”処理”、”演算”、”
計算”、”判定”、”表示”等の用語によって論じられ
ることは、コンピュータシステムのレジスタ及びメモリ
の内部の物理的(電子的)な量として表現されたデータ
を処理して、コンピュータシステムのメモリやレジス
タ、その他同様の情報記憶装置、情報伝送装置又は表示
装置の内部の同様に物理量として表現された他のデータ
へ変換する、コンピュータシステムや同様の電子演算装
置の作用及びプロセスを意味する。
【0013】本発明は、ここに述べる操作を実行するた
めの装置にも関係する。このような装置は、所要目的の
ために専用に作られてもよいし、内蔵のコンピュータ・
プログラムにより選択駆動もしくは再構成された汎用コ
ンピュータであってもよい。そのようなコンピュータ・
プログラムは、コンピュータが読み取り可能な記憶媒
体、例えば、フロッピーディスク、光ディスク、CD−
ROM、光磁気ディスクなどの任意の種類のディスク、
リードオンリーメモリ(ROM)やランダムアクセスメ
モリ(RAM)、EPROM、EEPROM、磁気カー
ド又は光カードなど、すなわち電子的命令の記憶に適し
たコンピュータのシステムバスに接続された任意の種類
の媒体に格納することができる。ここに提示するアルゴ
リズム及び表示は、本質的に、どのような特定のコンピ
ュータ、その他の装置とも関わりがない。様々な汎用マ
シンを、ここに述べる内容に従ったプログラムで使用す
ることができるが、所要の方法のステップの実行のため
に、より特化した装置を作るほうが好都合であることも
ある。これら多様なシステムに要求される構造は以下の
説明から明らかになろう。また、ここに述べる本発明の
内容の実現に、様々なプログラミング言語を使用し得る
ことは明らかであろう。
【0014】その処理操作の全部又は一部を、コンピュ
ータ又は専用装置の1つ以上の処理装置(例えばCP
U)上で動作するソフトウェアにより実行することがで
き、あるいは、デジタル・ロジック及び/又は回路、集
積回路(例えばASIC)、その他の半導体基板によっ
て実行することができる。
【0015】《システムの概要》文書管理システムにお
いて、保存された問い合わせを検索可能な文書として扱
うためのシステムが開示される。ファイル管理装置(”
FMA”)は、複数のプロセス及び待ち行列を用いて文
書取り込みサービス及び索引付けサービスを提供する、
文書管理システムの一部としての装置である。このFM
Aシステムの文書取り込みサービス及び索引付けサービ
スによって、文書は1つ以上のデータ記憶装置にアーカ
イブされることにより、文書データベースを構築する。
ユーザがそのようなアーカイブ・データを1つ以上のデ
ータベースより検索する方法の1つは、1つ以上の問い
合わせを作成し、それをFMAシステムに提示すること
による方法である。FMAシステム内で作成された問い
合わせは、同システム内の文書として扱われる。したが
って、問い合わせを、後に検索し実行するために文書と
して文書データベース内にアーカイブすることができ
る。
【0016】図1は、本発明に係るファイル管理システ
ムの一例を示す。クライアント110は、ネットワーク
100に接続された汎用デジタルコンピュータである。
ネットワーク100は、ローカル・エリア・ネットワー
ク(LAN)であったり、イントラネットであったり、
インターネットであったり、あるいは、それ以外の複数
装置間で通信可能な任意の相互接続データ経路である。
ネットワーク100には、マルチメディア・ソース11
2、ファクシミリ装置120、複写機125、プリンタ
130、スキャナ135、データ記憶装置140、サー
バー145、ファイル管理装置(”FMA”)150も
接続されている。
【0017】マルチメディア・ソース112は、ネット
ワーク100に接続された1つ以上の音声・映像入力装
置である。マルチメディア・ソース112は、例えば、
アナログデータとデジタルデータの両方をネットワーク
100に供給できる1つ以上のマイクロホン及び/又は
ビデオカメラである。
【0018】ファクシミリ装置120は、ネットワーク
100に接続され、電話回線を通じてテキスト、画像な
どのデータを送受信(ファクス通信)することができる
装置である。ファクシミリ装置120は、一実施例で
は、印刷物として作成されたテキストと画像を送信し、
別の実施例では、ネットワーク100に接続された任意
数の装置によって生成された電子データを送信する。同
様に、ファクシミリ装置120は、一実施例では受信デ
ータのハードコピーをプリントし、別の実施例では受信
データをネットワーク100に接続された任意数の装置
へ転送する。
【0019】複写機125は、テキストと画像を複写す
ることができる装置である。複写機125は、一実施例
では、印刷されたテキスト及び画像を再生する写真複写
機であるが、別の実施例では、ネットワーク100に接
続された任意数の装置より受信したデータを再生する写
真複写機である。
【0020】プリンタ130は電子データを印刷された
テキスト及び画像へ変換することができる装置であり、
スキャナ135は印刷されたテキスト及び画像を電子デ
ータへ変換することができる装置である。一実施例で
は、ファクシミリ装置120、写真複写機125、プリ
ンタ130、スキャナ135はそれぞれ、ネットワーク
100に接続された別々の装置である。別の実施例で
は、これら装置の任意の組み合わせが1台の多機能装置
で置き換えられる。なお、本発明の範囲から逸脱するこ
となく、任意数の装置をネットワーク100から省き、
あるいはネットワーク100に追加することができる。
【0021】一実施例では、図1に示すように、データ
記憶装置140がネットワーク100に接続される。一
実施例では、データ記憶装置140は、例えばCD−R
OM、DVD−ROM、DVD−RAM、DVD−R
W、磁気テープなどの着脱可能な記憶媒体である。別の
実施例では、データ記憶装置140はハードディスク・
ドライブもしくは固定ディスク・ドライブのような着脱
不可能な記憶媒体である。一実施例では、データ記憶装
置140はアーカイブ装置である。
【0022】サーバー145は、ネットワーク100に
接続された汎用デジタルコンピュータであり、ネットワ
ーク100に接続された他の装置に対しネットワーク・
サービスを提供するように構成される。一実施例では、
サーバー145はネットワーク100に対しファイル共
有サービスとプリンタ・サービスを提供する。別の実施
例では、サーバー145はウェブ・サーバーであり、要
求されたHTML(hypertext markup language)ペー
ジ又はファイルを、要求元の装置へネットワーク100
を通じて提供する。さらに別の実施例では、サーバー1
45はネットワーク100に対し環境設定サービスを提
供できるNOAサーバーである。
【0023】FMA150は、ネットワーク100に接
続された、文書取り込みサービス、索引付けサービス及
び問い合わせサービスを提供するファイル管理装置であ
る。一実施例では、FMA150は文書取り込みサービ
ス、索引付けサービス及び問い合わせサービスに加え、
環境設定サービスをネットワーク100に提供できる装
置である。一実施例では、FMA150は、どの装置と
も直接接続されず、ネットワーク100を通じて他の装
置と通信可能に接続される。FMA150は、その存在
をHTTPプロトコル又は他のプロトコルによりネット
ワーク100上の他の装置に知らせる機能を有する。
【0024】自動的な文書取り込み(もしくは”無意識
的取り込み”)は、後に詳述するが、ある装置がデータ
記憶装置140などのアーカイブ装置に文書をアーカイ
ブすることを要求するプロセスである。一実施例では、
FMA150がその要求元の装置であるが、他の装置も
文書のアーカイブを要求できる。
【0025】FMA環境においては、1つの文書を単一
のファイルから構成することができる。一実施例では、
文書という用語が、文書を表すために”文書ディレクト
リ”という用語と同じ意味で用いられる。1つの文書
を、その内容の少なくとも一部を表現する、色々なタイ
プの多くの個別ファイルから構成することができる。ク
ライアント110上でプリンタ130に対して生成され
るプリント・ジョブを、例えば、サムネイル画像、post
scriptファイル、PDF(portable documentformat)
ファイル、及び、抽出されたテキストを含むASCII
ファイルとして取り込むことができる。さらに、FMA
150は例えばJPEG形式(jointphotographic expe
rts group format)、GIF形式(graphics interchan
geformat)、TIFF形式(tagged image file forma
t)などの様々な画像ファイル形式を処理できる。一実
施例では、それぞれの固有なファイル・タイプは、その
ファイル名に付けた対応した固有のファイル拡張子によ
って表される。例えば、PDFファイルは”ファイル
名.pdf”と表され、またサムネイル画像は”ファイル
名.thumb”と表される。
【0026】一実施例では、FMA150は複合ファイ
ル名拡張子を解釈する機能を備える。例えば、サムネイ
ル画像を含むTIFF形式のファイルは、”ファイル
名.thumb.tiff”と表すことができる。一実施例では、
FMA150は、文書のページ番号をファイル名として
用いる。このような方法で、1つの文書を同じディレク
トリに置かれた複数のファイルで表すことができ、その
各々のファイルはその文書の、ファイル名で示された別
々のページに相当する。例えば”01.thumb.jpg”はJP
EG形式のページ1のサムネイル画像を意味することに
なる。同様に、”12.thumb.tiff”はTIFF形式のペ
ージ12のサムネイル画像を意味することになる。
【0027】FMA150は、プリンタ130、ファク
シミリ装置120、クライアント110、スキャナ13
5などのネットワーク100に接続された様々な装置か
ら取り込まれたデータの索引付けを行うことができる。
一実施例では、ファクシミリ装置120は電話回線を通
じてデータを取り込み、その受信データの少なくとも一
部をネットワーク100を介しFMA150へ送信す
る。別の実施例では、クライアント110からネットワ
ーク100を介しファクシミリ装置120へ送信された
データは、透過的に(例えば装置側が知らないうちに)
取り込まれ、そのデータの少なくとも一部が索引付けの
ためにFMA150へ送られる。他の実施例では、ファ
クシミリ装置120はクライアント110の内部に置か
れることにより、クライアント110はファクシミリ・
データを取り込ませるためにネットワーク100経由で
送信する必要がなくなる。このような実施例でも、FM
A150は同様に取り込みデータの少なくとも一部分を
受け取る。一実施例では、FMA150は文書から抽出
された書誌的データすなわち”メタデータ”を受信す
る。一実施例では、ファクシミリ装置120より受信さ
れたデータはTIFF形式に変換されるが、クライアン
ト110から受信されたデータは伝送時の元の形式のま
まとすることができる。
【0028】このFMAの取り込みプロセスは、スキャ
ナ135や複写機125など、ネットワーク100に接
続された他の装置にも同様に適用される。一実施例で
は、スキャン文書又は複写文書に対し光学文字認識(O
CR)が実行されるときに、FMA150は2つの特殊
なOCR関連ファイルを生成する。一実施例では、FM
A150によって、”contents.txt”と”contents.pd
f”が生成され、これらは、その文書の全テキスト及び
返送ページ画像を1つの文書ファイルとして索引付けす
るためにそれぞれ用いられる。
【0029】一実施例では、FMA150はネットワー
ク100上の装置中の任意の1つ以上の装置と同じ機能
を提供することにより、それ以外の専用装置は必要でな
くなる。一方、別の実施例では、FMA150は、ネッ
トワーク100経由の文書取り込み及び索引付けをサポ
ートできるだけのハードウェアとソフトウェアを内蔵し
たシン・サーバーとして実現される。
【0030】図2は、FMAのハードウェア構成の一例
を示すブロック図である。図2を参照すると、一実施例
では、FMA150は制御装置252、入出力装置25
4、メインメモリ256、記憶装置258、ネットワー
ク制御装置262を有し、これらは全てバス265を介
して接続される。制御装置252は、FMA150の全
体的動作を制御するもので、当該技術分野で知られてい
る任意の方法で実現できる。一実施例では、制御装置2
52はデータ処理の分野で知られている汎用マイクロプ
ロセッサからなる。メインメモリ256は、ランダムア
クセスメモリ(RAM)、リードオンリーメモリ(RO
M)、プログラマブルROM(PROM)、消去可能な
PROM(EPROM)、又は、その他の当該技術分野
で知られている任意のメモリ・デバイスである。FMA
150は、メインメモリ256のほかに、二次メモリ装
置(不図示)を持つこともできる。一実施例では、FM
A150は、それが必要としないUNIXコマンドを削
除したUNIXベース・オペレーティングシステムのペ
アド・ダウン(pared-down)バージョンを使用する。こ
のような実施例では、制御装置252はメインメモリ2
56より命令を取り出し、解読し、実行する。一実施例
では、FMA150はメインメモリ256内の所定位置
にある命令を実行する。
【0031】入出力装置254はバス265に接続さ
れ、FMA150へのデータ入力とFMA150からの
データ出力を可能にする。入出力装置254は、当該技
術分野で知られている任意の汎用入出力装置によって実
現できる。入出力装置254を、液晶ディスプレイ26
4やタッチスクリーン274、図2には示さないが当該
技術分野で知られている他の任意の表示装置など、任意
台数の表示装置とも接続できる。入出力装置254を、
当該技術分野で知られている任意台数のデータ入力装置
と接続することもできる。図2には、入出力装置254
に接続されたキーボート284とキーパッド294が示
されているが、それらに加えて、あるいは、それらに代
えて、他の任意の汎用入力装置を接続することができ
る。一実施例では、図2に示すように、入出力装置25
4はFMA150の内部にある。別の実施例では、入出
力装置254はFMA150の外部に設けられる。
【0032】FMA150のネットワーク200経由の
通信を可能にするため、ネットワーク制御装置262が
バス265に接続されている。ネットワーク制御装置2
62は、ネットワーク・インターフェース・カードや特
定用途向け集積回路(ASIC)として、又はその他の
当該技術分野で知られている任意の方法によって、FM
A150のネットワーク接続を可能にするよう構成され
る。一実施例では、図2に示すように、ネットワーク制
御装置262はFMA150の内部に設けられる。別の
実施例では、ネットワーク制御装置262はFMA15
0の外部に設けられる。
【0033】記憶装置258はバス265に接続されて
おり、当該技術分野で知られている任意の不揮発性記憶
装置である。記憶装置258は、CDやDVDなどの着
脱可能な記憶媒体を使用することができ、あるいは、ハ
ード/固定ディスクなどの着脱不可能な記憶媒体を使用
することができる。待ち行列ファイル260(後に詳述
する)は、記憶装置258上に順序付けられて格納され
た文書を表す。
【0034】《待ち行列》一実施例では、FMAの動作
環境は、1つ以上の処理待ち行列を処理するために、い
くつかのプロセス又はデーモンの同時実行が可能であ
る。FMAは、文書とも呼ばれるファイルとディレクト
リの組み合わせを用いて、そのような待ち行列を作成す
る。一実施例では、待ち行列ファイル260などの待ち
行列ファイルは、改行文字で区切られた文書格納場所の
リストを格納している。
【0035】図3及び図4は、FMAの待ち行列処理の
処理フローの一例を示す流れ図である。図3及び図4を
参照して説明する。FMA150は最初に受信待ち行列
ファイルのロックの取得を試みる(処理ブロック31
0)。一実施例では、FMA150は、メタデータ・フ
ァイル(以下に詳述する)を受信待ち行列ファイルのロ
ックを取得できるか否かを示すために利用する。FMA
150は、受信待ち行列ファイルのロック又は対応した
メタデータ・ファイルを取得できないときには、所定時
間だけ待ち(処理ブロック312)、その後に受信待ち
行列ファイルのロックの取得を再度試みる(処理ブロッ
ク310)。FMA150は、受信待ち行列ファイルの
ロックを取得できたならば、文書を受信待ち行列ファイ
ルの文書リストに追加する(処理ブロック314)。文
書の追加を終えると、FMA150は受信待ち行列ファ
イルのロックを解除し(処理ブロック316)、受信待
ち行列ファイルに処理待ちのエントリーがある旨の信号
を受信デーモンに送る(処理ブロック318)。
【0036】受信デーモンは、そのような受信待ち行列
ファイルに文書が存在することを示す信号を検知する
か、そのような信号を検知する前にタイムアウトが発生
すると(処理ブロック320)、受信待ち行列ファイル
をロックし(処理ブロック322)、受信待ち行列ファ
イルに処理すべき文書が実際に存在するか否か調べる
(処理ブロック324)。受信待ち行列ファイルに文書
が存在しないときには、受信デーモンはスリープ・モー
ドに戻り、再度、受信待ち行列ファイル内に文書がある
ことを示す信号又はタイムアウトの発生を待つ。一方、
受信待ち行列ファイルに文書があるときには(処理ブロ
ック324)、受信デーモンは、その文書に”処理中”
のマークが付けられているか調べる(処理ブロック32
6)。その文書に”処理中”マークが付けられていると
きには、先に実行されたデーモン・プロセスが早く終了
した可能性があるので、受信デーモンはその文書を処理
することなく、その文書に”終了”マークを付ける(処
理ブロック328)。一方、その文書に”処理中”マー
クがついていない場合(処理ブロック326)、受信デ
ーモンはその文書に”処理中”マークを付け(処理ブロ
ック330)、受信待ち行列ファイルのロックを解除し
(処理ブロック332)、その文書の通常の処理を続け
る(処理ブロック334)。その文書の処理後、受信デ
ーモンはその文書に”終了”マークを付け(処理ブロッ
ク336)、受信待ち行列ファイルを再度ロックする
(処理ブロック338)。文書に”終了”マークが付け
られると(処理ブロック328からであっても、処理ブ
ロック336からであっても)、受信デーモンは、その
文書を次の待ち行列に格納し(処理ブロック340)、
受信待ち行列から、その文書のエントリーを削除する
(処理ブロック342)。最後に、受信デーモンは、次
の文書処理を可能にするため受信待ち行列ファイルのロ
ックを解除する(処理ブロック344)。
【0037】《メタデータ》一実施例では、FMAシス
テム内に取り込まれた各文書は、FMA上に、メタデー
タ・ファイルを含む1つの独立したUNIXディレクト
リとして格納される。一実施例では、メタデータ・ファ
イルは文書に関する特殊な情報、例えば、取り込み装置
より得られた書誌的データなどを格納している。一実施
例では、文書のメタデータは属性とその値のペアからな
る。
【0038】図5は、FMAのメタデータ・ファイルの
一例を示す。図5には、文書のメタデータの属性が各々
の意味とともに列挙されている。
【0039】図6は、FMAのメタデータ・ファイルの
もう一つ例を示す。図6には、文書のメタデータの属性
が、そのとり得る値の型とともに列挙されている。
【0040】図7は、XML(extensible markup lang
uage)で記述されたFMAのメタデータ・ファイルの一
例を示す。図7に示した部分的なメタデータ・コード
は、ある文書に関し生成されるであろうもの、すなわ
ち、その文書がユーザ”jones”により取り込まれたこ
と(行640)、ユーザ”jones”の所有であること
(行630)、連続番号”883639”を持つこと(行62
0)、アーカイブされたこと、つまり”バックアップさ
れた”こと(行690)を示している。さらに、図7に
示したメタデータ・コードは、その文書がOCRと圧縮
の処理がなされたこと(行660及び行670)、索引
付けされたこと(行680)、ディスク37にバックア
ップされたこと(行690)を示している。
【0041】FMAは、(http://WWW.W
3.orgのワールド・ワイド・ウェブ・コンソーシア
ム(W3C)より入手可能なXML仕様書で規定され
た)ウェルフォームド(well-formed)ファイルでないメ
タデータ・ファイルを検知したときには、一実施例で
は、そのメタデータを、その文書に関する検証可能な全
ての情報を含むウェルフォームド・ファイルで置き換え
る。その結果、ウェルフォームドであるが属性/値のペ
アを全く含まない、完全に空のメタデータ・ファイルと
なることもあり得る。一実施例では、図5、図6及び図
7に示したメタデータ・ファイル及びデータ・フィール
ド定義はXML仕様に準拠して作られているが、同様の
機能を得るために他のプログラム言語、例えば、HTM
L、XHTML(extensible hypertext markup langua
ge)、SGML(standard generalizedmarkup languag
e)、その他の当該技術分野で知られている任意の言語
を同様に使用することができる。一実施例では、メタデ
ータ・ファイルに対し項目を追加又は削除するため、F
MAは、小さなソフトウェア・ライブラリもしくはルー
チンを使って、メタデータ・ファイルを解析するととも
に、文書又はメタデータの項目に関するロック操作、読
み出し操作、書き込み操作及び削除操作を行う。
【0042】FMAは、FMA上の文書を管理するマス
ター文書リストも保持することができる。一実施例で
は、このマスター文書リストは、FMAでこれまでに取
り込まれた全ての文書に関する情報を指示する唯一の情
報格納場所である。一実施例では、マスター文書リスト
は、図5、図6及び図7に示されたメタデータ・ファイ
ルに見られるものと同じ属性を保持する。マスター文書
リストを作るために、内容索引付けが可能な任意のデー
タベースを利用することができる。
【0043】《文書の取り込み》文書の取り込みは、あ
る装置(例えばFMA150)がアーカイブ装置(例え
ばデータ記憶装置140)に文書のアーカイブを要求す
る動作である。しかし、文書の取り込みが実行されるの
は、特定のネットワーク・エンティティもしくは装置の
みに限ったものではない。一実施例では、文書の取り込
みはFMAシステム内の全文書に対し自動的に実行され
るが、別の実施例では、ユーザによる設定に応じて、選
択された文書のみが取り込まれる。例えば、ユーザは、
文書の自動取り込みを防止するボタンを押すことができ
る。一実施例では、文書の取り込みに標準的なインター
ネット・プロトコルが用いられ、複数文書の取り込みあ
るいは1つの文書に関連した複数ファイルの取り込みが
可能である。
【0044】一実施例では、取り込みプロトコルとして
HTTPが用いられる。HTTPのPOST操作によ
り、FMAで、例えばアーカイブ形式を含む様々な形式
のファイルを取り込むことができる。このようなアーカ
イブ・ファイルは別々の名前のデータ・ファイルの集合
を格納することができ、また、テープ・アーカイブ(t
ar)形式、zip形式、gzip形式、pkzip形
式、Stuffit形式などのアーカイブ形式をとり得
る。
【0045】別の実施例では、FTP(Internet File
Transfer Protocol)のインプリメンテーションが取り
込みプロトコルとして用いられることにより、文書はM
IME(multipurpose Internet mail extension)ファ
イルとしてデフォルトのFTPディレクトリに取り込ま
れ、あるいは同デフォルト・ディレクトリのサブディレ
クトリとして取り込まれる。文書の名前はディレクトリ
・システムの一部としては格納されず、メタデータ・フ
ァイルに格納されるため、文書ディレクトリの実際の名
前は文書の取り込みでは重要でない。一実施例では、文
書の取り込み日が文書ディレクトリの名前として用いら
れる。また、連続番号のようなユニークな識別子を各文
書に割り当て、文書のメタデータ・ファイルに格納する
ことができる(図5、図6及び図7に、420、52
0、620として各々示されている)。
【0046】図8は、FMA環境の一実施例において用
いられるMIME取り込みの処理フローの一例を示す流
れ図である。図8を参照すると、取り込み装置は、1つ
以上のコンテンツ・ファイルと1つのメタデータ・ファ
イルを含むMIMEマルチパート・ファイルを生成する
(処理ブロック710)。取り込み装置は、そのMIM
Eファィルを生成した後、デスティネーション装置との
アノニマスFTPセッションの確立を試みる(処理ブロ
ック715)。FTPセッションの確立後、取り込み装
置はデスティネーション装置上でユニークなファイル名
を決定し(処理ブロック720)、そのファイルのデス
ティネーション装置への転送を試みる(処理ブロック7
25)。この転送を失敗した場合、取り込み装置は別の
ファイル名を取得して、ファイル転送を再度試みる。フ
ァイル転送が成功すると(処理ブロック730)、取り
込みは完了する。
【0047】図9は、FMA環境の一実施例におけるデ
ィレクトリ取り込みの処理フローの一例を示す流れ図で
ある。図9を参照すると、取り込み装置はデスティネー
ション装置とのアノニマスFTPセッションを確立する
(処理ブロック735)。このFTPセッションが確立
した後、取り込み装置はデスティネーション装置上でユ
ニークであると見込まれるディレクトリ名(以下に詳述
する)を決定する(処理ブロック740)。ディレクト
リ名の決定後、取り込み装置は、デスティネーション装
置上に、その名前を持つディレクトリの作成を試みる
(処理ブロック745)。ディレクトリ名の重複、その
他の理由で、このディレクトリ作成の試みが成功しない
ときには、取り込み装置は別のディレクトリ名を決定
し、ディレクトリの作成を再度試みる(処理ブロック7
50,740,745)。一方、取り込み装置は、デス
ティネーション装置上にディレクトリを首尾良く作成で
きると(処理ブロック750)、1つ又は複数のコンテ
ンツ・ファイルを、新たに作成したディレクトリに複写
する(処理ブロック755)。取り込み装置はメタデー
タ・ファイルも生成し(処理ブロック760)、このメ
タデータ・ファイルがFMA装置へ送られ(処理ブロッ
ク765)、プロセスは完了する。
【0048】図10は、FMA環境での文書格納プロセ
スの処理フローの一例を示す流れ図である。この文書格
納プロセスにおいて、FMAは適当なディレクトリを作
成し、そのディレクトリに文書を移動させ、そしてマス
ター・リストを更新する。図10を参照すると、格納し
ようとする文書のメタデータ・ファイルがアクセスさ
れ、その"Capture date”フィールド(図5及び図6の
項目450,550を各々参照)の情報が取得される
(処理ブロック770)。その文書の"Capture date”
(取り込み日)フィールドが存在しないか、そのメタデ
ータ・ファイルさえも存在しないときには、現在のシス
テム・タイムが取得され、それが文書の"Capture dat
e”として用いられる(処理ブロック774)。一方、
その文書の”Capture date”が存在するときには、シス
テムは適切な名前が付けられたディレクトリが存在する
か調べる。一実施例では、文書ディレクトリは”yyyy/m
m/dd”で表される。ここで、yyyyは文書の作成年、mmは
文書の作成月、ddは文書の作成日を意味する。
【0049】図10を再度参照する。システムは、適切
な4桁年で表されたディレクトリが存在するか調べる
(処理ブロック776)。適切な年を表すディレクトリ
が存在しないときには、システムはそのようなディレク
トリを作成する(処理ブロック778)。一方、適切な
年を表すディレクトリが存在するときには、システム
は、その年ディレクトリ内に適切な月を表すディレクト
リが存在するか調べる(処理ブロック780)。その年
ディレクトリ内に適切な月ディレクトリが存在しないと
きには、システムは、その年ディレクトリ内に月ディレ
クトリを作成する(処理ブロック782)。適切な年デ
ィレクトリと月ディレクトリが存在するときには、シス
テムは最後に、そのネストされた年/月ディレクトリ内
に適切な日ディレクトリが存在するか調べる(処理ブロ
ック784)。その日ディレクトリが存在しないときに
は、システムはその年/月ディレクトリ内に適切な日デ
ィレクトリを作成する(処理ブロック786)。一方、
適切な年月日を表すディレクトリが既に存在するなら
ば、システムは文書が格納される新しい文書ディレクト
リ名を生成する。一実施例では、システムは、既存の文
書ディレクトリ名の最後に付けられる4桁の乱数を生成
する(処理ブロック788)。ユニークな文書ディレク
トリ名が確定したならば(処理ブロック786,78
8)、文書がそのディレクトリに移され(処理ブロック
790)、その文書の新たな格納場所を反映するように
マスター文書リストが更新される(処理ブロック79
2)。
【0050】《文書の所有権》FMAシステムでは、文
書へのアクセスを規制するため、文書に対し様々なアク
セス権もしくは所有権のプロパティを個別的又は一般的
に割り当てることができる。普通、文書の所有者は、一
定の文書のアクセス及び管理に関し最大の自由を持つと
みなされる。例えば、FMA上の文書の所有者は、その
文書に関し、閲覧、所有権の変更、削除、他の所有者へ
の複写など様々な操作を行うことが許される。所有者が
特定の文書に対して持つ支配権は広範であるため、FM
A上のファイルに対するアクセスは”単独所有者”の所
有権モデルで管理される。すなわち、すべての文書は、
どのユーザ又はユーザたちにアクセス又は閲覧が許可さ
れるか指定する所有者フィールドを含んでいる。FMA
上の所有者を、個人ユーザとして、あるいはユーザ・グ
ループとして指定することができる。あるグループが文
書の所有者として指定されたときには、そのグループの
すべてのメンバーがそのファイルの所有者として扱われ
る。一実施例では、FMA上の各文書を公開文書に指定
することができ、そうすることにより、その文書の所有
権は変更されないが、全てのユーザがその文書の閲覧を
許される。一実施例では、所有権アクセス用のユーザ及
びグループ名空間は、ウェブ・サーバーに対しHTTP
認証を与えるために使用されるユーザ及びグループ名空
間と同じである。
【0051】《問い合わせ》FMAベース・システムの
文書取り込みサービス及び索引付けサービスにより、文
書は例えばデータ記憶装置140などの1つ以上のデー
タ記憶装置にアーカイブされる。一実施例では、電子文
書のアーカイブは文書データベースと呼ばれ、それに収
容された各文書は1つ以上の電子データ・オブジェクト
によって表される。ユーザが、そのようなアーカイブ・
データを1つ以上のデータベースより検索する方法の1
つは、1つ以上の問い合わせを作成し、それをFMAシ
ステムに提示することによる方法である。一実施例で
は、FMA問い合わせは、実行したいデータベース検索
の範囲を定義する様々な検索条件を用いて作成される。
その検索条件は、一実施例ではユーザにより指定される
が、もう1つの実施例では、FMA又は同様装置によっ
て自動的に生成させることができる。一実施例では、図
5及び図6に示すようなFMAの各種メタデータ属性の
各々は、FMAによって索引付けされ、また、検索され
る問い合わせの内部で指定することができる。しかしな
がら、一実施例では、文書データベース内の項目は検索
される順に索引付けされる必要はないことに留意すべき
である。
【0052】FMAシステム内の問い合わせは、FMA
文書データベース内の文書として扱われるので、後に検
索し実行するために文書として同データベース内にアー
カイブすることができる。一実施例では、保存された各
問い合わせ文書に対し、問い合わせでない文書に関する
メタデータ・ファイルと同様のメタデータ・ファイルが
生成され、対応付けされる。このようなメタデータ・フ
ァイルは、例えば、その問い合わせの作成者、作成日
時、最後に実行又は更新された日時など、各種の問い合
わせプロパティを記述した検索可能な属性を含むことが
できる。このように、問い合わせを文書として扱うこと
により、問い合わせ自体がデータベースに格納された検
索可能なデータ・オブジェクトになる。
【0053】FMAベース・システム内に多数の文書が
格納され、なおかつ同システムにおける問い合わせ作成
の際に自由度が与えられるとすると、FMAによる回答
文書の数が検索の度毎に大幅に変化することは容易に想
像される。さらに、ある問い合わせによって、要求され
た検索条件に合致する多数の文書が得られたとしても、
そのようなFMAの回答文書の全部がユーザにとって適
切なものであるということには必ずしもならない。ある
問い合わせが、あるユーザにとって特に有益であること
が分かった場合、そのユーザは、その問い合わせを後日
再利用するため保存しておきたいであろう。そのユーザ
は、後日、その問い合わせを現在の形のままで再実行す
るかもしれないが、おそらくは、再実行する前に、その
検索条件を変更するか追加するかして問い合わせを修正
したいと思うであろう。一実施例では、FMAは、ユー
ザがデータベースの問い合わせを実行、保存、更新、及
び再実行するための手段を提供する。
【0054】ある問い合わせで多数の文書が回答された
場合、ユーザは、その時に必要としているものに応じて
最も適切な文書を割り出すため、それらの文書をソート
したいと思うであろう。しかし残念なことに、各文書の
内容を確認するための何らかの説明情報がないと、ユー
ザは、1つ以上の適切な文書をうっかり見落とすことが
ある。文書の表題によって、問い合わせでない対応文書
の内容を多少なりとも推測できるかもしれないが、問い
合わせ文書は1つの簡単な表題で効果的に要約できない
文書の集合を表す。一実施例では、FMAシステムは、
ユーザが、データベース検索を容易にするために問い合
わせに説明用の注釈データを添付する方法を提供する。
例えば、ユーザは、問い合わせを、特定の検索条件の組
み合わせを選んだ理由、検索テーマなどの様々な角度か
ら要約した、ある量のテキストを入力したいと思うであ
ろう。一実施例では、既存の問い合わせ文書のみなら
ず、新規に作成された問い合わせを説明するためにも注
釈データが用いられる。しかし、注釈データの形式はテ
キスト・データだけに限定される。一実施例では、注釈
データは、例えば音声データ、デジタル画像データ、動
画データなどのテキストデータ以外のデータ形式も含む
ことができる。一実施例では、FMAシステム内の注釈
データは索引付けされて検索可能である。
【0055】図11は、FMAベース・システムなどの
システムにおいて、内容検索可能な問い合わせ文書を生
成してアーカイブするためのプロセスの処理フローの一
例を示す流れ図である。このプロセスは、ハードウェ
ア、ソフトウェア、あるいは、その組み合わせによって
遂行することができる。このソフトウェアは、汎用コン
ピュータ・システム又は専用マシン上で実行させること
ができる。
【0056】図11を参照すると、処理ブロック802
で、1つのデータベース問い合わせが識別される。識別
されたデータベース問い合わせは、一実施例では、新規
に作成された問い合わせであるが、別の実施例では、F
MAシステム内にアーカイブ済みの既存の問い合わせで
ある。同じように、一実施例では、ユーザがデータベー
ス問い合わせを識別するが、他の実施例では、ユーザが
介入することなくシステムがデータベース問い合わせを
識別する。1つのデータベース問い合わせが識別される
と、処理ブロック804で、システムはその識別された
データベース問い合わせを説明する注釈データを受け取
る。処理ブロック806で、その識別されたデータベー
ス問い合わせと受け取られた注釈データとが統合され、
1つの問い合わせ文書が生成される。注釈データは、一
実施例では、識別されたデータベース問い合わせの末尾
に付けられるが、他の実施例では、1つの独立したデー
タ・オブジェクトとしてデータベース問い合わせにリン
クされる。さらに別の実施例では、注釈データとデータ
ベース問い合わせの両方が、例えばHTMLコードなど
のグラフィカルなマークアップ言語の表現に変換されて
統合され、1つの文書が生成される。処理ブロック80
8で、統合されたデータベース問い合わせと注釈データ
がFMA文書データベースにアーカイブされることによ
り、この新たに作成された問い合わせ文書とそれに付随
した注釈データが1文書として検索できるようになる。
【0057】問い合わせをFMA内の文書と同様に扱う
ことにより、これまでに述べなかったいくつかの利点が
得られる。そのような利点の1つは、格納された問い合
わせの管理に関するものである。FMA内の問い合わせ
は独立したデータ・オブジェクトとして扱われるため、
問い合わせ文書の1つ1つを、データベースでサポート
されている様々な編成方式により格納することができ
る。例えば、問い合わせ文書を内容によって分類してア
ーカイブすることができ、又は、問い合わせ名、生成日
時、最終実行日時などの様々なファイル属性によって問
い合わせ文書を分類することができる。もう1つの選択
肢として、問い合わせを、指定された分類に従って格納
するのではなく、それぞれ別個に格納することができ
る。
【0058】問い合わせは、問い合わせでない文書に関
連して前述したような特定のすなわちデフォルトのアク
セス権及び所有権のプロパティを割り当てられたり、か
つ/又は、それを継承することもできる(前記”文書の
所有権”を参照)。FMAのアクセス権及び所有権のプ
ロパティを問い合わせ文書のために用いることにより、
問い合わせ文書をあるユーザから隠蔽し、あるいは、F
MAシステムの他のユーザに公開もしくは配布すること
ができる。例えば、ユーザが問い合わせを作成し、それ
をアーカイブしたいが他人にはアクセスできないように
したい場合、ユーザは、その問い合わせ文書にある特定
の属性を割り当てることにより、その問い合わせ文書を
非公開とし他人から隠蔽することができる。もう1つの
選択肢として、ユーザは、問い合わせ文書を誰でもアク
セスできるように、特定の属性を問い合わせ文書に割り
当てることもできる。一実施例では、FMA上で作成さ
れた問い合わせ文書は全て、ユーザがそれを非公開とし
ない限り公開文書として扱われる。
【0059】一実施例では、誰にとつてもアクセス可能
とされた問い合わせ文書は、また誰にも検索可能であ
る。したがって、ユーザが問い合わせを実行すると、そ
れに応答して、指定された条件に合致する誰でもアクセ
ス可能な問い合わせ文書を含む文書リストがユーザに呈
示される可能性がある。FMAによって回答された文書
リストの再検討時に、ユーザは、他のユーザによって作
成された既存の問い合わせのほうが、自分自身の問い合
わせよりも自分の要求にかなっていると判断することも
できる。そして、ユーザは、自身の問い合わせを実行せ
ずに、あるいは、自身の問い合わせを実行するととも
に、その既存の問い合わせを実行することができる。一
実施例では、FMAは、ユーザが最初の問い合わせによ
って得られた任意の文書集合に対し続けて問い合わせを
行うことができるようにする。したがって、ユーザは、
例えば、内容優先の問い合わせの結果に基づいて時間優
先の問い合わせを生成することができ、また逆に、時間
優先問い合わせの結果に基づいて内容優先の問い合わせ
を生成することができる。また、ユーザは、新しい問い
合わせを生成したいと考えず、以前の問い合わせを手直
ししたいと考えることもあろう。一実施例では、ユーザ
は、以前提示したフィールド項目を含む以前の問い合わ
せに戻り、適切な検索条件を入力して、その問い合わせ
を修正することができる。
【0060】FMAはさらに、問い合わせの結果得られ
た文書と問い合わせ文書そのものを含む選択された文書
を、後で閲覧するために、ある格納場所すなわち”スタ
ック”に追加する方法を提供する。一実施例では、FM
Aは、各文書の識別子すなわち、その文書のメタデータ
・ファイルに含まれている連続番号をスタック内容ファ
イルの最後に書き込むことにより、文書をスタックに追
加する。一実施例では、保存されている問い合わせがス
タックに追加されるときには、その問い合わせを表すH
TMLページがスタックの最後に追加される。スタック
の内容は、文書問い合わせ結果と同様な方法で、例えば
後述のリスト表示などによって表示させることができ
る。
【0061】《ウェブ・インターフェースとユーザ・イ
ンターフェース》FMAは、多様なグラフィカル入力ペ
ージとグラフィカル表示ページを使ってFMAユーザ・
インターフェースを実現する。さらに、FMAは、その
ネットワーク接続経由のデータ送受信を可能にするグラ
フィカルなウェブ・ベースのインターフェースを備え
る。
【0062】一実施例では、FMAは、問い合わせ結果
を表示するための1つ以上のウェブ・ページを、CGI
スクリプトを用いて生成する。FMAの問い合わせ結果
は、例えばリスト表示とカレンダー表示などの様々な時
間優先表示、あるいは、例えばストリーム表示とサムネ
イル表示などの様々な内容優先表示によって、グラフィ
カルに表示させることができる。一実施例では、ユーザ
は、文書表示設定によって、各々の問い合わせ結果表示
を選択的に切り替えることができる。
【0063】本発明のリスト表示によれば、多数の文書
に関する大量のテキスト情報をユーザに伝えることがで
きる。図12は、リスト表示を表すFMAの問い合わせ
結果ページの一例を示す。図12では、”relative sen
tences”という問い合わせの条件に合致した文書のリス
トが表示されている。このリスト表示においては、例え
ば、参照番号902で示されている、生成ソース(文書
を生成した、又は取り込んだ装置)、生成時刻、ファイ
ル・サイズ、検索結果スコアなどの様々な基準で、問い
合わせ結果をソートすることができる。ソース・アイコ
ン904は、対応した文書が生成された又は取り込まれ
た装置をユーザにグラフィカルに表示する。一実施例で
は、個々の文書の取り込みソースは、その文書のメタデ
ータ・ファイル内に明示される(図5及び図6では、参
照番号445、545でそれぞれ表されている)。一実
施例では、ユーザがソース・アイコン又は対応した文書
をダブルクリックすると、その文書がFTP経由でユー
ザのマシンに取り出される。
【0064】一実施例では、カレンダー表示は、問い合
わせ結果を標準的な月間カレンダーに似た形に整形して
表示する。カレンダー表示は、個々の問い合わせ結果の
イベント・ベースの表示をユーザに提供し、文書の作業
密度指標としても役立つ。一実施例では、取り込み文書
を表すアイコンは、その文書が取り込まれた日に対応し
たカレンダー上の位置にグラフィカル表示される。この
ような実施例では、ある日に対応して表示されたアイコ
ンの数は、その日に取り込まれた文書の数に対応してい
る。別の実施例では、文書又は文書を表すアイコンを、
文書の取り込み日ではなく生成日に従ってカレンダー上
に表示させ、あるいは、生成日と取り込み日の両方に従
って表示させることができる。図13は、カレンダー表
示を表すFMAの問い合わせ結果ページの一例を示す。
一実施例では、ユーザがカレンダー表示中の文書ソース
・アイコンを指示すると、その文書のサムネイル画像が
画面に挿入画像として表示される。同様に、ユーザが、
あるアイコンを例えばダブルクリックして選択とする、
その文書がダウンロードされる。
【0065】本発明のストリーム表示では、問い合わせ
結果を、取り込み時刻順に文書を並べたグラフィカルな
文書ストリームの形で表示する。一実施例では、問い合
わせの結果として得られた各文書の第1ページとその取
り込み日が、各文書を互いに少しずつずらして並べた形
でグラフィカルに表示される。一実施例では、その取り
込み日はハイパーリンクであり、それが選択されるとF
MAにその日に取り込まれた文書を含む新たなページを
表示させる。一実施例では、補助的な文書表示も用意さ
れ、ストリーム表示上で文書が選択されると、その文書
を拡大したものが、その要約情報とともに表示画面上の
付随ウインドウ内に表示される。図14は、ストリーム
表示を表すFMAの問い合わせ結果ページの一例を示
す。一実施例では、サムネイル表示は上記ストリーム表
示と似かよっている。一実施例では、サムネイル表示
は、問い合わせ結果として得られた各文書の第1ページ
をサムネイル画像としてグラフィカルに表示する。一実
施例では、サムネイル画像は並べてサムネイル表示中に
表示される。図15は、サムネイル表示を表すFMAの
問い合わせ結果ページの一例を示す。
【0066】なお、ここで遂行される処理は処理ロジッ
クによって実行されるが、この処理ロジックはハードウ
ェア(例えば、専用のロジック、回路など)、ソフトウ
ェア、あるいは、その両者の組み合わせにより構成する
ことができる。
【0067】以上の説明を読めば、本発明の多くの変形
及び修正が当業者に明白となるであろうから、説明のた
めに図示及び記述したいずれの実施例も決して限定を意
図したものでないことを理解すべきである。よって、様
々な実施例に関し詳細に述べた内容は、特許請求の範囲
を限定することを意図するものではない。
【0068】
【発明の効果】以上の説明から明らかなように、本発明
によれば、文書管理システムにおいて、普通の文書と同
様に問い合わせを保存し、それを検索し、そのまま再利
用したり、修正して再利用したりすることができ、検索
した問い合わせの内容を注釈データによって容易に確認
することができ、保存された問い合わせを特定のーザに
のみ公開し、それ以外のユーザから隠蔽することができ
るも等々の効果を得られる。
【図面の簡単な説明】
【図1】FMAを含むネットワーク化システムの構成例
を示す。
【図2】FMAのハードウェア構成例を示す。
【図3】FMAの待ち行列処理フローの一例を示す。
【図4】図3に示した待ち行列処理フローの続きを示
す。
【図5】FMAのメタデータ・ファイル形式の一例を示
【図6】FMAのメタデータ・ファイル形式の別の例を
示す。
【図7】XML形式のFMAのメタデータ・ファイルの
一例を示す。
【図8】FMA環境におけるMIME取り込みの処理フ
ローの一例を示す。
【図9】FMA環境におけるディレクトリ取り込みの処
理フローの一例を示す。
【図10】FMA環境における文書格納プロセスの処理
フローの一例を示す。
【図11】内容検索可能な問い合わせ文書を生成しアー
カイブするプロセスの処理フローの一例を示す。
【図12】リスト表示のFMA問い合わせ結果ページの
一例を示す。
【図13】カレンダー表示のFMA問い合わせ結果ペー
ジの一例を示す。
【図14】ストリーム表示のFMA問い合わせ結果ペー
ジの一例を示す。
【図15】サムネイル表示のFMA問い合わせ結果ペー
ジの一例を示す。
【符号の説明】
100 ネットワーク 110 クライアント 112 マルチメディア・ソース 120 ファクシミリ装置 125 複写機 130 プリンタ 135 スキャナ 140 データ記憶装置 145 サーバー 150 FMA(ファイル管理装置) 200 ネットワーク 252 制御装置 254 入出力装置 256 メインメモリ 258 記憶装置 262 ネットワーク制御装置 265 バス

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 文書管理システムにおいて問い合わせを
    処理するための方法であって、 文書データベースのオブジェクトを検索するための第1
    の文書データベース問い合わせを識別し、 前記第1の文書データベース問い合わせから内容検索可
    能な問い合わせ文書を生成し、 前記内容検索可能な問い合わせ文書を後に検索するため
    1つのオブジェクトとして前記文書データベースに格納
    することからなる、ことを特徴とする方法。
  2. 【請求項2】 前記第1の文書データベース問い合わせ
    を説明する注釈データを受け取ることをさらに含み、ま
    た、前記内容検索可能な問い合わせ文書を生成すること
    は、前記第1の文書データベース問い合わせ及び前記注
    釈データから前記内容検索可能な問い合わせ文書を生成
    することからなる、ことを特徴とする請求項1記載の方
    法。
  3. 【請求項3】 第2の文書データベース問い合わせが実
    行されると、それに応答して前記文書データベースより
    前記内容検索可能な問い合わせ文書を検索することをさ
    らに含む、ことを特徴とする請求項1記載の方法。
  4. 【請求項4】 前記内容検索可能な問い合わせ文書を実
    行して付加的な文書データベース・オブジェクトを検索
    することをさらに含む、ことを特徴とする請求項3記載
    の方法。
  5. 【請求項5】 前記第1の文書データベース問い合わ
    せ、前記第2の文書データベース問い合わせ、及び前記
    内容検索可能な問い合わせ文書の中の少なくとも1つは
    HTML形式の問い合わせである、ことを特徴とする請
    求項3記載の方法。
  6. 【請求項6】 第1の文書データベース問い合わせを識
    別することは、新たに生成された文書データベース問い
    合わせを入力として受け取ることを含む、ことを特徴と
    する請求項1記載の方法。
  7. 【請求項7】 第1の文書データベース問い合わせを識
    別することは、前記文書データベースより以前生成され
    た問い合わせを検索することを含む、ことを特徴とする
    請求項2記載の方法。
  8. 【請求項8】 前記内容検索可能な問い合わせ文書を生
    成することは、前記第1の文書データベース問い合わ
    せ、及び、それを説明する前記注釈データのグラフィカ
    ル表現を生成することからなる、ことを特徴とする請求
    項2記載の方法。
  9. 【請求項9】 前記グラフィカル表現は、HTML、X
    HTML、XML及びSGMLを含む複数のウェブ・ベ
    ースのマークアップ言語の中の少なくとも1つのマーク
    アップ言語からなる、ことを特徴とする請求項8記載の
    方法。
  10. 【請求項10】 前記内容検索可能な問い合わせ文書を
    後に検索するため1つのオブジェクトとして前記文書デ
    ータベースに格納することは、前記内容検索可能な問い
    合わせ文書に、複数のユーザ中のどのユーザが前記文書
    データベース内の前記内容検索可能な問い合わせ文書を
    アクセスできるか指示するアクセス権属性を割り当てる
    ことを含む、ことを特徴とする請求項1記載の方法。
  11. 【請求項11】 複数の命令が格納された機械読み取り
    可能な記録媒体であって、前記複数の命令は、1つ以上
    のプロセッサによって実行された時に、前記1つ以上の
    プロセッサに、 文書データベースのオブジェクトを検索するための第1
    の文書データベース問い合わせを識別させ、 前記第1の文書データベース問い合わせから内容検索可
    能な問い合わせ文書を生成させ、 前記内容検索可能な問い合わせ文書を後に検索するため
    1つのオブジェクトとして前記文書データベースに格納
    させることを特徴とする記録媒体。
  12. 【請求項12】 前記複数の命令は、前記1つ以上のプ
    ロセッサによって実行された時に、前記1つ以上のプロ
    セッサに、前記第1の文書データベース問い合わせを説
    明する注釈データを受け取らせ、前記第1の文書データ
    ベース問い合わせ及び前記注釈データから内容検索可能
    な問い合わせ文書を生成させる命令をさらに含む、こと
    を特徴とする請求項10記載の記録媒体。
  13. 【請求項13】 前記複数の命令は、前記1つ以上のプ
    ロセッサによって実行された時に、前記1つ以上のプロ
    セッサに、第2の文書データベース問い合わせが実行さ
    れると、それに応答して前記文書データベースより前記
    内容検索可能な問い合わせ文書を検索させる命令をさら
    に含む、ことを特徴とする請求項11記載の記録媒体。
  14. 【請求項14】 前記複数の命令は、前記1つ以上のプ
    ロセッサによって実行された時に、前記1つ以上のプロ
    セッサに、前記内容検索可能な問い合わせ文書を実行さ
    せ付加的な文書データベース・オブジェクトを検索させ
    る命令をさらに含む、ことを特徴とする請求項13記載
    の記録媒体。
  15. 【請求項15】 前記第1の文書データベース問い合わ
    せ、前記第2の文書データベース問い合わせ、及び前記
    内容検索可能な問い合わせ文書の中の少なくとも1つは
    HTML形式の問い合わせである、ことを特徴とする請
    求項13記載の記録媒体。
  16. 【請求項16】 第1の文書データベース問い合わせを
    識別するための前記命令は、新たに生成された文書デー
    タベース問い合わせを入力として受け取る命令をさらに
    含む、ことを特徴とする請求項11記載の記録媒体。
  17. 【請求項17】 第1の文書データベース問い合わせを
    識別するための前記命令は、前記文書データベースより
    以前生成された問い合わせを検索するための命令をさら
    に含む、ことを特徴とする請求項11記載の記録媒体。
  18. 【請求項18】 前記内容検索可能な問い合わせ文書を
    生成するための前記命令は、前記第1の文書データベー
    ス問い合わせ、及び、それを説明する前記注釈データの
    グラフィカル表現を生成するための命令をさらに含む、
    ことを特徴とする請求項12記載の記録媒体。
  19. 【請求項19】 前記グラフィカル表現は、HTML、
    XHTML、XML及びSGMLを含む複数のウェブ・
    ベースのマークアップ言語の中の少なくとも1つのマー
    クアップ言語からなる、ことを特徴とする請求項18記
    載の記録媒体。
  20. 【請求項20】 前記内容検索可能な問い合わせ文書を
    後に検索するため1つのオブジェクトとして前記文書デ
    ータベースに格納するための前記命令は、前記内容検索
    可能な問い合わせ文書に、複数のユーザ中のどのユーザ
    が前記文書データベース内の前記内容検索可能な問い合
    わせ文書をアクセスできるか指示するアクセス権属性を
    割り当てるための命令をさらに含む、ことを特徴とする
    請求項12記載の記録媒体。
  21. 【請求項21】 文書管理システムにおいて問い合わせ
    を処理するための装置であって、 文書データベースのオブジェクトを検索するための第1
    の文書データベース問い合わせを識別する手段、 前記第1の文書データベース問い合わせから内容検索可
    能な問い合わせ文書を生成する手段、 前記内容検索可能な問い合わせ文書を後に検索するため
    1つのオブジェクトとして前記文書データベース内に格
    納する手段からなることを特徴とする装置。
  22. 【請求項22】 前記第1の文書データベース問い合わ
    せを説明する注釈データを受け取る手段をさらに有し、
    また、前記内容検索可能な問い合わせ文書を生成する前
    記手段は、前記第1の文書データベース問い合わせ及び
    前記注釈データより前記内容検索可能な問い合わせ文書
    を生成する、ことを特徴とする請求項21記載の装置。
  23. 【請求項23】 第2の文書データベース問い合わせが
    実行されると、それに応答して前記文書データベースよ
    り前記内容検索可能な問い合わせ文書を検索する手段を
    さらに有する、ことを特徴とする請求項21記載の装
    置。
  24. 【請求項24】 前記内容検索可能な問い合わせ文書を
    実行して付加的な文書データベース・オブジェクトを検
    索する手段をさらに有する、ことを特徴とする請求項2
    3記載の装置。
JP2000318119A 1999-11-12 2000-10-18 文書管理システムにおいて問い合わせを処理するための方法及び装置 Pending JP2001160068A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/439,151 US6775665B1 (en) 1999-09-30 1999-11-12 System for treating saved queries as searchable documents in a document management system
US09/439151 1999-11-12

Publications (1)

Publication Number Publication Date
JP2001160068A true JP2001160068A (ja) 2001-06-12

Family

ID=23743505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000318119A Pending JP2001160068A (ja) 1999-11-12 2000-10-18 文書管理システムにおいて問い合わせを処理するための方法及び装置

Country Status (4)

Country Link
EP (1) EP1104901B1 (ja)
JP (1) JP2001160068A (ja)
DE (1) DE60001350T2 (ja)
ES (1) ES2190928T3 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311984A (ja) * 2004-04-26 2005-11-04 Olympus Corp 画像処理装置、画像加工・編集装置、画像ファイル再生装置、画像処理方法、画像加工・編集方法及び画像ファイル再生方法
WO2005115016A1 (ja) * 2004-04-26 2005-12-01 Olympus Corporation 画像処理装置、画像加工・編集装置、画像ファイル再生装置、画像処理方法、画像加工・編集方法及び画像ファイル再生方法
US7664738B2 (en) 2004-12-07 2010-02-16 Canon Kabushiki Kaisha Search system, information processing apparatus, control method therefor, and program
JP2010191999A (ja) * 2004-12-17 2010-09-02 Microsoft Corp 拡張ファイルシステム
US8321439B2 (en) 2004-12-17 2012-11-27 Microsoft Corporation Quick filename lookup using name hash
US8364732B2 (en) 2006-05-23 2013-01-29 Microsoft Corporation Extending cluster allocations in an extensible file system
US8606830B2 (en) 2004-12-17 2013-12-10 Microsoft Corporation Contiguous file allocation in an extensible file system
JP2014518576A (ja) * 2011-04-13 2014-07-31 ヒョク チャン,ジン Pdf文書基盤のイーブック用マルチメディア再生システム及びその再生方法,並びにこれを具現したpc又はモバイル装置用アプリケーション

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5157783A (en) * 1988-02-26 1992-10-20 Wang Laboratories, Inc. Data base system which maintains project query list, desktop list and status of multiple ongoing research projects
US5802512A (en) * 1996-03-12 1998-09-01 Oracle Corporation Storage, replay and error detection of user-defined queries
US6185551B1 (en) * 1997-06-16 2001-02-06 Digital Equipment Corporation Web-based electronic mail service apparatus and method using full text and label indexing

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311984A (ja) * 2004-04-26 2005-11-04 Olympus Corp 画像処理装置、画像加工・編集装置、画像ファイル再生装置、画像処理方法、画像加工・編集方法及び画像ファイル再生方法
WO2005115016A1 (ja) * 2004-04-26 2005-12-01 Olympus Corporation 画像処理装置、画像加工・編集装置、画像ファイル再生装置、画像処理方法、画像加工・編集方法及び画像ファイル再生方法
US8693764B2 (en) 2004-04-26 2014-04-08 Olympus Corporation Image file processing apparatus which generates an image file to include stereo image data and collateral data related to the stereo image data, and information related to an image size of the stereo image data, and corresponding image file processing method
US8155431B2 (en) 2004-04-26 2012-04-10 Olympus Corporation Image file processing apparatus which generates an image file to include stereo image data, collateral data related to the stereo image data, information of a date and time at which the collateral data is updated, and information of a date and time at which the image file is generated or updated, and corresponding image file processing method
US7664738B2 (en) 2004-12-07 2010-02-16 Canon Kabushiki Kaisha Search system, information processing apparatus, control method therefor, and program
US10474641B2 (en) 2004-12-17 2019-11-12 Microsoft Technology Licensing, Llc Extensible file system
US8321439B2 (en) 2004-12-17 2012-11-27 Microsoft Corporation Quick filename lookup using name hash
US10614032B2 (en) 2004-12-17 2020-04-07 Microsoft Technology Licensing, Llc Quick filename lookup using name hash
US9575972B2 (en) 2004-12-17 2017-02-21 Microsoft Technology Licensing, Llc Contiguous file allocation in an extensible file system
US8583708B2 (en) 2004-12-17 2013-11-12 Microsoft Corporation Extensible file system
US8606830B2 (en) 2004-12-17 2013-12-10 Microsoft Corporation Contiguous file allocation in an extensible file system
JP2010191999A (ja) * 2004-12-17 2010-09-02 Microsoft Corp 拡張ファイルシステム
US10303650B2 (en) 2004-12-17 2019-05-28 Microsoft Technology Licensing, Llc Contiguous file allocation in an extensible file system
US9639554B2 (en) 2004-12-17 2017-05-02 Microsoft Technology Licensing, Llc Extensible file system
US9575988B2 (en) 2004-12-17 2017-02-21 Microsoft Technology Licensing, Llc Extensible file system
US9336231B2 (en) 2004-12-17 2016-05-10 Microsoft Technology Licensing, Llc Extensible file system
US9454542B2 (en) 2004-12-17 2016-09-27 Microsoft Technology Licensing, Llc Extensible file system
US8364732B2 (en) 2006-05-23 2013-01-29 Microsoft Corporation Extending cluster allocations in an extensible file system
US9558223B2 (en) 2006-05-23 2017-01-31 Microsoft Technology Licensing, Llc Extending cluster allocations in an extensible file system
US9122695B2 (en) 2006-05-23 2015-09-01 Microsoft Technology Licensing, Llc Extending cluster allocations in an extensible file system
US8805780B2 (en) 2006-05-23 2014-08-12 Microsoft Corporation Extending cluster allocations in an extensible file system
US8452729B2 (en) 2006-05-23 2013-05-28 Microsoft Corporation Extending cluster allocations in an extensible file system
US10585868B2 (en) 2006-05-23 2020-03-10 Microsoft Technology Licensing, Llc Extending cluster allocations in an extensible file system
US8433677B2 (en) 2006-05-23 2013-04-30 Microsoft Corporation Extending cluster allocations in an extensible file system
JP2014518576A (ja) * 2011-04-13 2014-07-31 ヒョク チャン,ジン Pdf文書基盤のイーブック用マルチメディア再生システム及びその再生方法,並びにこれを具現したpc又はモバイル装置用アプリケーション

Also Published As

Publication number Publication date
DE60001350D1 (de) 2003-03-13
ES2190928T3 (es) 2003-09-01
DE60001350T2 (de) 2003-06-26
EP1104901A2 (en) 2001-06-06
EP1104901A3 (en) 2001-11-07
EP1104901B1 (en) 2003-02-05

Similar Documents

Publication Publication Date Title
US6775665B1 (en) System for treating saved queries as searchable documents in a document management system
US7386599B1 (en) Methods and apparatuses for searching both external public documents and internal private documents in response to single search request
US7213066B2 (en) Method and apparatus for electronic document management
US6810404B1 (en) Computer-based document management system
US6820094B1 (en) Computer-based document management system
US6009442A (en) Computer-based document management system
US9116927B2 (en) Methods and apparatuses for publication of unconsciously captured documents
US6237011B1 (en) Computer-based document management system
US5893908A (en) Document management system
US6957384B2 (en) Document management system
US6708189B1 (en) Computer file transfer system
US7315848B2 (en) Web snippets capture, storage and retrieval system and method
JP5023715B2 (ja) 情報処理システム、情報処理装置及びプログラム
US20100079781A1 (en) Document processing system and control method thereof, program, and storage medium
JPH11224148A (ja) 文書検索方法、記憶媒体及びコンピュータシステム
JP2005018754A (ja) 関連付けを有するコンピュータオブジェクトの共有
US20090313539A1 (en) Information processor, information processing method, and recording medium
JP2009129017A (ja) 文書移行支援システム、監視装置、文書移行支援装置、方法、およびプログラム
US7949206B2 (en) Scanned image management device
EP1104901B1 (en) A system for treating saved queries as searchable documents in a document management system
US9489380B2 (en) Methods and apparatus for management of unconsciously captured documents
CN100428235C (zh) 素材管理系统和方法
US20090271452A1 (en) Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program
JPH117445A (ja) 統合化文書管理装置
EP1063598A2 (en) System and method for document management and document sharing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070801

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071029

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080220