[go: up one dir, main page]

JP2001159998A - Web contents cache system, its method and recording medium - Google Patents

Web contents cache system, its method and recording medium

Info

Publication number
JP2001159998A
JP2001159998A JP34487499A JP34487499A JP2001159998A JP 2001159998 A JP2001159998 A JP 2001159998A JP 34487499 A JP34487499 A JP 34487499A JP 34487499 A JP34487499 A JP 34487499A JP 2001159998 A JP2001159998 A JP 2001159998A
Authority
JP
Japan
Prior art keywords
content
cache
storage unit
keyword
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP34487499A
Other languages
Japanese (ja)
Inventor
Yukinori Saito
幸儀 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP34487499A priority Critical patent/JP2001159998A/en
Publication of JP2001159998A publication Critical patent/JP2001159998A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a Web contents cache system by which a required cache storage capacity is reduced and also a retrieval speed is improved. SOLUTION: The system is provided with a cache storage part for storing URL, the last reference date and its contents, a keyword storage part for storing a keyword included in the contents together with the number of its reference times, a cache retrieving means for receiving URL from an input device, inspecting whether the URL is registered in the cache storage part or not and outputting the contents from the cache storage part to an output device, a keyword register means for reading the contents of URL in the case it is not registered extracting the keyword, registering the contents of the URL in the cache storage part and registering the extracted keyword in the keyword storage part and a cache erasing means for erasing contents information from the cache storage part by referring to the last reference date of the contents in the cache storage part and to the number of keyword reference times in the keyword storage parts.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、WWW(World W
ide Web)ブラウザのキャッシュシステムに関し、
特に、キャッシュ内のコンテンツの削除制御に関する。
The present invention relates to a WWW (World WWW).
ide Web) Regarding the browser cache system,
In particular, the present invention relates to control for deleting content in a cache.

【0002】[0002]

【従来の技術】インターネットを介して接続されるWe
bサーバのコンテンツをクライアント端末のブラウザで
閲覧するシステムにおいて、コンテンツ参照の高速化等
を図るために、Webサーバから取得したコンテンツ
を、例えばProxyサーバあるいはクライアント側の
キャッシュに、一定期間保持しておくシステムが広く普
及している。
2. Description of the Related Art Web connected via the Internet
In a system for browsing the content of the server b with the browser of the client terminal, the content acquired from the web server is retained for a certain period of time in, for example, a proxy server or a cache on the client side in order to speed up the content reference. The system is widespread.

【0003】従来のWebコンテンツキャッシュシステ
ムは、その一般構成として、キャッシュ記憶部と、キャ
ッシュ登録手段と、キャッシュ削除手段と、を備え、指
定されたURLのコンテンツがキャッシュ記憶部に登録
されている場合には、該キャッシュ記憶部からコンテン
ツを出力し、指定されたURLのコンテンツがキャッシ
ュ記憶部に登録されていない場合には、該URLのコン
テンツを新たに取得して出力すると共に、キャッシュ登
録手段は該取得したコンテンツをキャッシュ記憶部に登
録する。
[0003] A conventional Web content cache system has, as a general configuration, a cache storage unit, a cache registration unit, and a cache deletion unit, and when a content of a designated URL is registered in the cache storage unit. Output the content from the cache storage unit, and if the content of the specified URL is not registered in the cache storage unit, newly acquire and output the content of the URL, and the cache registration unit The acquired content is registered in the cache storage unit.

【0004】キャッシュ登録手段は、例えば予め定めら
れたメモリ容量までキャッシュ記憶部にコンテンツを登
録し、該メモリ容量を超えた場合には、キャッシュ削除
手段でコンテンツをキャッシュ記憶部から削除する。そ
の際、キャッシュ削除手段は、コンテンツに登録されて
いるコンテンツの最終参照日時(最後に参照が行われた
日時情報)を用いて、最も参照されていないコンテンツ
をキャッシュ記憶部から削除する。
[0004] The cache registration means registers the content in the cache storage unit up to a predetermined memory capacity, for example, and when the memory capacity is exceeded, the cache deletion means deletes the content from the cache storage unit. At this time, the cache deletion unit deletes the least referenced content from the cache storage unit using the last reference date and time of the content registered in the content (date and time information of the last reference).

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記し
た従来のシステムは、下記記載の問題点を有している。
However, the above-mentioned conventional system has the following problems.

【0006】第1の問題点は、キャッシュのメモリ容量
が増大する、ということである。
[0006] The first problem is that the memory capacity of the cache increases.

【0007】その理由は、キャッシュ削除手段は、単純
な削除機能しか持ち合わせていないため、コンテンツ参
照の高速性を維持するには、キャッシュの容量を大きく
設定することが必要とされている、ためである。
[0007] The reason is that the cache deletion means has only a simple deletion function, so that it is necessary to set a large cache capacity in order to maintain high-speed content reference. is there.

【0008】第2の問題点は、長時間参照されていない
重要なコンテンツを高速に参照することができない、と
いうことである。
A second problem is that it is not possible to quickly refer to important contents that have not been referenced for a long time.

【0009】その理由は、コンテンツの最終参照日時だ
けを用いて、該コンテンツのキャッシュからの削除する
か否かを判定しており、重要なコンテンツであっても、
長時間参照されていないコンテンツは、キャッシュから
削除される、ためである。
[0009] The reason is that it is determined whether or not to delete the content from the cache using only the last reference date and time of the content.
This is because content that has not been referenced for a long time is deleted from the cache.

【0010】したがって本発明は、上記問題点に鑑みて
なされたものであって、その目的は、必要とされるキャ
ッシュの記憶容量を削減するとともに、検索速度を向上
するWebコンテンツキャッシュシステム方法並びに記
録媒体を提供することにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and has as its object to reduce the required storage capacity of a cache and to improve a search speed in a Web content cache system method and recording. To provide a medium.

【0011】[0011]

【課題を解決するための手段】前記目的を達成する本発
明は、Webコンテンツへのアクセスを高速化するWe
bコンテンツキャッシュシステムにおいて、コンテンツ
に含まれるキーワードの参照回数を利用して、キャッシ
ュからのコンテンツを削除する手段を備える。
SUMMARY OF THE INVENTION In order to achieve the above object, the present invention provides a Web system for accelerating access to Web contents.
b In the content cache system, the content cache system includes means for deleting the content from the cache using the number of times of reference to the keyword included in the content.

【0012】本発明においては、前記コンテンツのアク
セス状況が所定の基準に達せず、且つ、前記コンテンツ
に含まれるキーワードの参照回数が所定値以下の場合、
前記コンテンツを前記キャッシュから削除する。
[0012] In the present invention, when the access status of the content does not reach a predetermined criterion and the number of times of reference to a keyword included in the content is less than a predetermined value,
Deleting the content from the cache;

【0013】[0013]

【発明の実施の形態】本発明の実施の形態について説明
する。本発明は、その好ましい一実施の形態において、
図1を参照すると、キャッシュに登録するコンテンツの
URL(Uniform Resource Locator)と、参照された
最終参照日時情報と、該コンテンツとを記憶するキャッ
シュ記憶部(31)と、キャッシュ内のコンテンツに含
まれるキーワードをその参照回数とともに記憶するキー
ワード記憶部(32)と、入力装置(1)からURLを
受け取り、該URLがキャッシュ記憶部(31)に記憶
されているか否かを調べ、キャッシュ記憶部(31)に
記憶されている場合には、キャッシュ記憶部(31)か
らコンテンツを出力装置(4)へ出力するキャッシュ検
索手段(21)と、該URLがキャッシュ記憶部(3
1)に記憶されていない場合、該URLで指定される位
置からコンテンツを取得して、該コンテンツに含まれる
キーワードを抽出し、キャッシュ記憶部(31)へ該U
RLのコンテンツを登録するとともに、キーワード記憶
部(32)へ抽出されたキーワードを登録し、その際、
参照回数を初期値である「1」に設定するとともに、該
コンテンツを出力するキーワード登録手段(22)と、
予め定められた所定期間毎に起動され、キャッシュ記憶
部(31)内のコンテンツの最終参照日時情報と、キー
ワード記憶部(32)を参照して、当該コンテンツのキ
ーワードと同一のキーワードの参照回数に基づき、コン
テンツが所定期間参照されず、且つコンテンツに含まれ
るキーワードの参照回数が所定値以下であるコンテンツ
を、キャッシュ記憶部(31)から削除するキャッシュ
削除手段(23)を備えている。
Embodiments of the present invention will be described. The present invention, in one of its preferred embodiments,
Referring to FIG. 1, a URL (Uniform Resource Locator) of the content to be registered in the cache, last referenced date and time information referred to, and the cache storage unit (31) storing the content are included in the content in the cache. A keyword storage unit (32) for storing a keyword together with the number of times of reference, and a URL from the input device (1) are received, and it is checked whether the URL is stored in the cache storage unit (31). If the URL is stored in the cache storage unit (3), the cache search unit (21) that outputs the content from the cache storage unit (31) to the output device (4).
If the URL is not stored in 1), the content is acquired from the position specified by the URL, the keyword included in the content is extracted, and the URL is stored in the cache storage unit (31).
In addition to registering the contents of the RL, the extracted keywords are registered in the keyword storage unit (32).
A keyword registration unit (22) for setting the number of times of reference to an initial value “1” and outputting the content;
It is activated every predetermined period, and refers to the last reference date and time information of the content in the cache storage unit (31) and the number of times of reference to the same keyword as the keyword of the content by referring to the keyword storage unit (32). A cache deletion unit (23) for deleting, from the cache storage unit (31), the content in which the content has not been referred to for a predetermined period and the number of times of reference to the keyword included in the content is equal to or less than a predetermined value.

【0014】かかる構成の本発明の一実施の形態におい
ては、コンテンツのアクセス状況が所定の基準に達しな
いコンテンツであっても、参照回数が所定値を超えるキ
ーワードを含むコンテンツであれば、キャッシュから削
除されない。以下、本発明の一実施の形態の動作につい
て説明する。
In an embodiment of the present invention having such a configuration, even if the access status of the content does not reach the predetermined criterion, if the content includes a keyword whose reference count exceeds the predetermined value, the content is read from the cache. Not deleted. Hereinafter, the operation of the embodiment of the present invention will be described.

【0015】入力装置(1)から入力されたURLとし
て、例えば「http://www.nec.co.jp/」が与えられ、該
コンテンツには「コンピュータ」がキーワードとして含
まれているものとする。キャッシュ検索手段(21)
は、このURL「http://www.nec.co.jp/」がキャッシ
ュ記憶部(31)に記憶されているか否かを調べ、キャ
ッシュ記憶部(31)に記憶されていれば、そのコンテ
ンツを出力装置(4)へ出力する。
[0015] For example, "http://www.nec.co.jp/" is given as a URL inputted from the input device (1), and the contents include "computer" as a keyword. I do. Cache search means (21)
Checks whether or not this URL "http://www.nec.co.jp/" is stored in the cache storage unit (31). If the URL is stored in the cache storage unit (31), the content is checked. Is output to the output device (4).

【0016】キャッシュ記憶部(31)に記憶されてい
ない場合には、該URLで指定される位置のコンテンツ
を読み出して、キーワードを抽出し、キャッシュ登録手
段(22)は、キャッシュ記憶部(31)へ「http://w
ww.nec.co.jp/」のコンテンツ、キーワード記憶部(3
2)へ「コンピュータ」を登録する。キーワード記憶部
(32)は、キーワードと参照回数の欄(情報フィール
ド)をキーワード毎に備え、この場合、キーワード記憶
部(32)に「コンピュータ」のキーワードが登録され
ていない場合には、新たに「コンピュータ」のキーワー
ドを追加して、その参照回数を「1」に設定する。一
方、すでにキーワード記憶部(32)に「コンピュー
タ」のキーワードが登録されている場合には、「コンピ
ュータ」のキーワードの参照回数を1加算する。
If the content is not stored in the cache storage unit (31), the content at the position specified by the URL is read out to extract a keyword, and the cache registration unit (22) reads the content from the cache storage unit (31). To http: // w
ww.nec.co.jp/ ”content, keyword storage (3
Register “Computer” in 2). The keyword storage unit (32) includes a column (information field) of a keyword and the number of times of reference for each keyword. The keyword “computer” is added, and the number of times of reference is set to “1”. On the other hand, when the keyword of “computer” is already registered in the keyword storage unit (32), the number of times of reference to the keyword of “computer” is incremented by one.

【0017】キャッシュ削除手段(23)は、定期的に
起動され、キャッシュ記憶部(31)内のコンテンツに
含まれるキーワードと最終参照日時とワード記憶部(3
2)とを用いてキャッシュ記憶部(31)のコンテンツ
を削除する。
The cache deletion means (23) is started periodically, and includes a keyword included in the contents in the cache storage unit (31), the last reference date and time, and the word storage unit (3).
2) to delete the contents of the cache storage unit (31).

【0018】利用者が、例えばキーワード「コンピュー
タ」に関係ないコンテンツを多く参照し、キーワード
「コンピュータ」を含むコンテンツをほとんどあるいは
全く参照しなかった場合、「http://ww.nec.co.jp/」の
コンテンツはキャッシュ記憶部(31)から削除され
る。
For example, if the user refers to a lot of contents unrelated to the keyword “computer” and does not refer to the contents including the keyword “computer” with little or no content, “http://ww.nec.co.jp The content "/" is deleted from the cache storage unit (31).

【0019】これにより、Webコンテンツのキャッシ
ュ容量を不用意に増やすことなく、利用者が関心を示す
Webコンテンツをキャッシュに保持し、該コンテンツ
の参照を高速化することができる。
Thus, without carelessly increasing the cache capacity of the Web contents, the Web contents that the user is interested in can be held in the cache and the reference of the contents can be speeded up.

【0020】本発明において、キャッシュに登録するコ
ンテンツのURLと、最終参照日時情報と、該コンテン
ツを記憶するキャッシュ記憶部(31)と、キャッシュ
に登録されるコンテンツに含まれるキーワードをその参
照回数とともに記憶するキーワード記憶部(32)と、
を備えた記憶装置(3)と、入力装置(1)と、出力装
置(4)と、プログラム制御されるデータ処理装置
(2)とを備えた情報処理装置において、入力装置
(1)からURLを受け取り、該URLが前記キャッシ
ュ記憶部に登録されているか否かを調べ、キャッシュ記
憶部(31)に登録されている場合、キャッシュ記憶部
(31)からコンテンツを出力装置へ出力する検索処理
(キャッシュ検索手段21の処理)と、該URLが前記
キャッシュ記憶部(31)に登録されていない場合、該
URLで指定される位置からコンテンツを読み出して、
キーワードを抽出し、キャッシュ記憶部へ該URLのコ
ンテンツを登録し、キーワード記憶部(32)へ抽出さ
れたキーワードを登録する登録処理(キャッシュ登録手
段22の処理)と、キャッシュ記憶部(31)内のコン
テンツの最終参照日時情報と、キーワード記憶部(3
2)内のキーワードの参照回数とを参照して、キャッシ
ュ記憶部(31)内のコンテンツが所定期間参照され
ず、且つ、該コンテンツに含まれるキーワードの参照回
数が所定値以下である場合、該コンテンツの情報を、キ
ャッシュ記憶部(31)から削除する削除処理(キャッ
シュ削除手段23の処理)と、の各処理は、データ処理
装置(2)で実行されるプログラムをにより実現され
る。この場合、該プログラムを記録した媒体(半導体メ
モリ、CD−ROM、DVD(digital versatile di
sk)、及びFD、MT等の磁気記録媒体)、又はサーバ
からのダウンロード時の通信媒体、から、読み出し装置
又は通信装置を介して、情報処理装置にプログラムをイ
ンストールし、該プログラムの実行形式をデータ処理装
置の主メモリにロードして実行することで本発明を実施
することができる。
In the present invention, the URL of the content to be registered in the cache, the last reference date and time information, the cache storage unit (31) for storing the content, and the keyword included in the content to be registered in the cache together with the number of times of reference. A keyword storage unit (32) for storing;
In an information processing apparatus including a storage device (3) including a storage device (3), an input device (1), an output device (4), and a data processing device (2) controlled by a program, a URL is input from the input device (1). And checks whether or not the URL is registered in the cache storage unit. If the URL is registered in the cache storage unit (31), a search process for outputting the content from the cache storage unit (31) to the output device ( If the URL is not registered in the cache storage unit (31), the content is read from the position specified by the URL,
A registration process of extracting a keyword, registering the content of the URL in the cache storage unit, and registering the extracted keyword in the keyword storage unit (32) (processing of the cache registration unit 22); Last reference date and time information of the content of
Referring to the keyword reference count in 2), if the content in the cache storage unit (31) is not referred to for a predetermined period and the reference count of the keyword included in the content is equal to or smaller than a predetermined value, Each process of deleting content information from the cache storage unit (31) (the process of the cache deleting unit 23) is realized by a program executed by the data processing device (2). In this case, the medium (semiconductor memory, CD-ROM, DVD (digital versatile digital
sk) and a magnetic recording medium such as FD or MT), or a communication medium at the time of download from the server, and installs the program in the information processing device via a reading device or a communication device, and executes the execution format of the program. The present invention can be implemented by loading the data into the main memory of the data processing device and executing the data.

【0021】また、本発明においては、キャッシュに登
録するコンテンツのURLと、最終参照日時情報と、該
コンテンツとを記憶するキャッシュ記憶部(31)と、
キャッシュに登録されるコンテンツの分類情報を記憶す
る分類情報記憶部(33)と、キャッシュに登録される
コンテンツに含まれるキーワードをその参照回数ととも
に分類単位に記憶するキーワード記憶部(32)と、を
備えた記憶装置(6)と、入力装置(1)と、出力装置
(4)と、データ処理装置(5)とを備えた情報処理装
置において、入力装置(1)からURLを受け取り、該
URLが前記キャッシュ記憶部(31)に登録されてい
るか否かを調べ、キャッシュ記憶部に登録されている場
合、キャッシュ記憶部(31)からコンテンツを出力装
置(4)へ出力する検索処理(キャッシュ検索手段21
の処理)と、前記URLがキャッシュ記憶部(31)に
登録されていない場合、該URLで指定される位置から
コンテンツを読み出し、前記コンテンツの分類情報を登
録する分類処理(コンテンツ分類手段24の処理)と、
前記コンテンツからキーワードを抽出し、キャッシュ記
憶部へ該URLのコンテンツを登録し、前記キーワード
記憶部(31)へ抽出されたキーワードを登録する登録
処理(キャッシュ登録手段22の処理)と記分類情報記
憶部(33)に記憶されている分類ごとに、キャッシュ
記憶部(31)からコンテンツの情報を取り出し、キャ
ッシュ記憶部(31)内のコンテンツの最終参照日時
と、キーワード記憶部(32)のキーワードの参照回数
を参照して、前記コンテンツが所定期間参照されず、且
つ、前記コンテンツに含まれるキーワードの参照回数が
所定値以下のコンテンツの情報をキャッシュ記憶部(3
1)から削除する削除処理(キャッシュ削除手段25の
処理)と、の各処理は、データ処理装置(2)で実行さ
れるプログラムをにより実現される。この場合、該プロ
グラムを記録した媒体(半導体メモリ、CD−ROM、
DVD(digital versatile disk)、及びFD、MT
等の磁気記録媒体)、又はサーバからのダウンロード時
の通信媒体から、読み出し装置又は通信装置を介して、
情報処理装置にプログラムをインストールし、該プログ
ラムの実行形式をデータ処理装置の主メモリにロードし
て実行することで本発明を実施することができる。
Further, in the present invention, a cache storage unit (31) for storing the URL of the content to be registered in the cache, last reference date and time information, and the content,
A classification information storage unit (33) for storing the classification information of the content registered in the cache; and a keyword storage unit (32) for storing the keywords included in the content registered in the cache together with the number of times of reference in the classification unit. An information processing device including a storage device (6) provided with an input device (1), an output device (4), and a data processing device (5) receives a URL from the input device (1), and receives the URL. Is checked in the cache storage unit (31), and if it is registered in the cache storage unit, a search process (cache search) for outputting the content from the cache storage unit (31) to the output device (4) Means 21
If the URL is not registered in the cache storage unit (31), a classifying process of reading the content from the position specified by the URL and registering the classifying information of the content (the process of the content classifying unit 24) )When,
A registration process (processing of the cache registration unit 22) for extracting a keyword from the content, registering the content of the URL in the cache storage unit, and registering the extracted keyword in the keyword storage unit (31), and storing classification information The content information is extracted from the cache storage unit (31) for each classification stored in the unit (33), and the last reference date and time of the content in the cache storage unit (31) and the keyword of the keyword in the keyword storage unit (32) are read. By referring to the reference count, the cache storage unit (3) stores information of the content in which the content has not been referred to for a predetermined period and the reference count of a keyword included in the content is equal to or less than a predetermined value.
Each processing of the deletion processing (processing of the cache deletion unit 25) to delete from 1) is realized by a program executed by the data processing device (2). In this case, a medium (semiconductor memory, CD-ROM,
DVD (digital versatile disk), FD, MT
Magnetic recording medium, etc.), or from a communication medium at the time of download from the server, via a reading device or a communication device,
The present invention can be implemented by installing a program in an information processing apparatus, loading an execution format of the program into a main memory of a data processing apparatus, and executing the program.

【0022】[0022]

【実施例】上記した本発明の実施の形態について更に詳
細に説明すべく、本発明の実施例について説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS In order to describe the above-mentioned embodiment of the present invention in more detail, an embodiment of the present invention will be described.

【0023】図1は、本発明の第1の実施例の構成を示
す図である。図1を参照すると、本発明の第1の実施例
に係るシステムは、Webブラウザ等の入力装置1と、
プログラム制御により動作するデータ処理装置2と、記
憶装置3と、Webプラウザ等の出力装置4とを含む。
FIG. 1 is a diagram showing the configuration of the first embodiment of the present invention. Referring to FIG. 1, a system according to a first embodiment of the present invention includes an input device 1 such as a web browser,
It includes a data processing device 2 that operates under program control, a storage device 3, and an output device 4 such as a Web browser.

【0024】記憶装置3は、キャッシュ記憶部31と、
キーワード記憶部32とを備えている。
The storage device 3 includes: a cache storage unit 31;
And a keyword storage unit 32.

【0025】キャッシュ記憶部31は、URLとそのコ
ンテンツと最終参照日時とを記憶している。
The cache storage unit 31 stores a URL, its contents, and the last reference date and time.

【0026】キーワード記憶部32は、キャッシュ記憶
部31内のコンテンツが保持しているキーワードと参照
回数を記憶している。
The keyword storage unit 32 stores the keywords held by the contents in the cache storage unit 31 and the number of times of reference.

【0027】データ処理装置2は、キャッシュ検索手段
21と、キャッシュ登録手段22と、キャッシュ削除手
段23とを備える。
The data processing apparatus 2 includes a cache search unit 21, a cache registration unit 22, and a cache deletion unit 23.

【0028】キャッシュ検索手段21は、入力装置1か
ら与えられたURLをキーにして、キャッシュ記憶部3
1に記憶されたコンテンツを検索する。
The cache search means 21 uses the URL provided from the input device 1 as a key and
1 is searched for the content stored therein.

【0029】キャッシュ登録手段22は、キャッシュ検
索手段21がコンテンツの検索に失敗したとき、実際に
コンテンツを読み出し、コンテンツからキーワードを抽
出して、コンテンツのURL、参照日時、コンテンツを
キャッシュ記憶部31へ登録し、キーワードをキーワー
ド記憶部32へ登録した後、出力装置4へコンテンツを
出力する。コンテンツをキャッシュ記憶部31へ登録す
るにあたり、コンテンツから抽出されたキーワードが該
コンテンツのものであることも登録しておく(該コンテ
ンツについてキーワードを再抽出することを不要とす
る)。
When the cache search unit 21 fails to search the content, the cache registration unit 22 actually reads the content, extracts a keyword from the content, and stores the URL of the content, the reference date and time, and the content in the cache storage unit 31. After registering and registering the keyword in the keyword storage unit 32, the content is output to the output device 4. When registering the content in the cache storage unit 31, it is also registered that the keyword extracted from the content is that of the content (it is not necessary to re-extract the keyword for the content).

【0030】キャッシュ削除手段23は、定期的に起動
されてキャッシュ記憶部31内のコンテンツに含まれる
キーワードと最終参照日時ワード記憶部32とを用いて
キャッシュ記憶部31のコンテンツを削除する。
The cache deletion means 23 is periodically started and deletes the contents of the cache storage unit 31 using the keyword included in the contents in the cache storage unit 31 and the last reference date / time word storage unit 32.

【0031】図2及び図3は、本発明の第1の実施例の
動作の説明するための流れ図である。図1、図2及び図
3を参照して、本発明の第1の実施例の動作について詳
細に説明する。
FIGS. 2 and 3 are flowcharts for explaining the operation of the first embodiment of the present invention. The operation of the first exemplary embodiment of the present invention will be described in detail with reference to FIGS.

【0032】まず、入力装置1から与えられたURL
は、キャッシュ検索手段21に供給される。キャッシュ
手段21は、このURLが、キャッシュ記憶部31に記
憶されているか否かを調べる(図2のステップA1およ
びA2)。
First, the URL given from the input device 1
Is supplied to the cache search means 21. The cache unit 21 checks whether the URL is stored in the cache storage unit 31 (steps A1 and A2 in FIG. 2).

【0033】キャッシュ記憶部31にURLが記憶され
ていた場合には、キャッシュ記憶部31内の最終参照日
時及びキーワード記憶部32内のキーワード参照回数を
更新し(ステップA7)、図2のステップA6へ移る。
If the URL has been stored in the cache storage unit 31, the last reference date and time in the cache storage unit 31 and the number of keyword references in the keyword storage unit 32 are updated (step A7), and step A6 in FIG. Move to

【0034】次に、図2において、ステップA2で、キ
ャッシュ記憶部31にURLが記憶されていないと判断
された場合には、URLで示されるコンテンツを不図示
のインターネットを介してHTTPプロトコル等により
実際に読み込む(ステップA3)。
Next, in FIG. 2, when it is determined in step A2 that the URL is not stored in the cache storage unit 31, the content indicated by the URL is transmitted by the HTTP protocol or the like via the Internet (not shown). It is actually read (step A3).

【0035】読み込んだコンテンツからキーワードを抽
出する(ステップA4)。
A keyword is extracted from the read content (step A4).

【0036】コンテンツをURLと共にキャッシュ記憶
部31へ登録し、抽出されたキーワードをキーワード記
憶部32へ登録する(ステップA5)。
The content is registered in the cache storage unit 31 together with the URL, and the extracted keywords are registered in the keyword storage unit 32 (step A5).

【0037】そして、コンテンツを出力装置4へ出力す
る(ステップA6)。
Then, the contents are output to the output device 4 (step A6).

【0038】キャッシュ削除手段23は、定期的に起動
され、キャッシュ記憶部31のコンテンツを読み出す
(図3のステップA10およびA11)。
The cache deleting means 23 is started periodically and reads out the contents of the cache storage unit 31.
(Steps A10 and A11 in FIG. 3).

【0039】読み出したコンテンツのキーワードと、最
終参照日時とを取り出す(ステップA12)。
The keyword of the read content and the last reference date and time are extracted (step A12).

【0040】取り出したキーワードと等しいキーワード
記憶部32のキーワードの参照回数を取り出し、キーワ
ードの参照回数が予め定められた基準値よりも小さく、
システム時計の現在の日時と最終参照日時との差から、
最終参照日時からの経過時間(アクセス時間間隔)が予
め定められた時間より長いか否かを調べる(ステップA
13)。
The number of times of reference to the keyword in the keyword storage unit 32 equal to the extracted keyword is extracted, and the number of times of reference to the keyword is smaller than a predetermined reference value.
From the difference between the current date and time of the system clock and the last reference date and time,
It is checked whether the elapsed time (access time interval) from the last reference date and time is longer than a predetermined time (step A).
13).

【0041】キーワードの参照回数が予め定められた基
準値以下であり、且つ、最終参照日時からの経過時間が
予め定められた時間より長い場合は、そのURLに関す
る情報(URL、最終参照日時、コンテンツ)を、キャ
ッシュ記憶部31とキーワード記憶部32より削除する
(ステップA14)。
If the number of times the keyword is referenced is equal to or less than a predetermined reference value and the elapsed time from the last reference date and time is longer than the predetermined time, information on the URL (URL, last reference date and time, content ) Is deleted from the cache storage unit 31 and the keyword storage unit 32.
(Step A14).

【0042】次に、具体例に即して本発明の第1の実施
例の動作のついて説明する。
Next, the operation of the first embodiment of the present invention will be described with reference to a specific example.

【0043】図4に示すように、キャッシュ記憶部31
には、現在までに読み込まれているコンテンツ情報が登
録されている。
As shown in FIG. 4, the cache storage unit 31
Has registered therein content information that has been read so far.

【0044】キャッシュ検索手段21は、入力装置1よ
りURL「http://www.nec.co.jp/」を受け取り、キャ
ッシュ記憶部31を検索する。
The cache search means 21 receives the URL “http://www.nec.co.jp/” from the input device 1 and searches the cache storage unit 31.

【0045】この場合、図4に示すように、キャッシュ
記憶部31には、URL「http://www.nec.co.jp/」は
記憶されていないため、キャッシュ検索手段21は検索
不能と判断する(図2のステップA1およびステップA
2)。
In this case, as shown in FIG. 4, since the URL “http://www.nec.co.jp/” is not stored in the cache storage unit 31, the cache search unit 21 determines that the search cannot be performed. Judgment (Step A1 and Step A in FIG. 2)
2).

【0046】次に、キャッシュ検索手段21は、実際に
コンテンツを読み出し(ステップA3)、コンテンツのキ
ーワードである「コンピュータ」を抽出する(ステップ
A4)。そして該コンテンツをキャッシュ記憶部31へ
登録し(URL「http://www.nec.co.jp/」及び参照日
時「1999/9/31」も登録)、抽出されたキーワード「コ
ンピュータ」をキーワード記憶部32へ登録する(ステ
ップA5)。そしてコンテンツを出力装置4へ出力する
(ステップA6)。なお、キーワード「コンピュータ」が
キーワード記憶部32にすでに登録されている場合、キ
ーワード記憶部32のキーワード「コンピュータ」の参
照回数の欄を1つ加算する。
Next, the cache search means 21 actually reads the content (step A3) and extracts "computer" which is a keyword of the content (step A4). The content is registered in the cache storage unit 31 (the URL “http://www.nec.co.jp/” and the reference date and time “1999/9/31” are also registered), and the extracted keyword “computer” is used as the keyword. The information is registered in the storage unit 32 (step A5). Then, the content is output to the output device 4.
(Step A6). If the keyword “computer” has already been registered in the keyword storage unit 32, one is added to the column of the number of times of reference of the keyword “computer” in the keyword storage unit 32.

【0047】そして定期的に起動されるキャッシュ削除
手段23は、キャッシュ記憶部31内のコンテンツの最
終参照日時とコンテンツに含まれるキーワードよりキャ
ッシュを削除するか否かを決定する(図3のステップA
10、A11、A12及びA13)。
The cache erasing means 23 started periodically determines whether or not to delete the cache based on the last reference date and time of the contents in the cache storage unit 31 and the keywords included in the contents (step A in FIG. 3).
10, A11, A12 and A13).

【0048】例えばキーワードに関する閾値が「1」
で、時間が「1月(1month)」でキャッシュ削除手段
23が実行された日が1999年9月31日であったと
すると、「自動車」をキーワードとするURL「http:/
/www.bbb.co.jp/」のキャッシュ情報が削除される(図3
のステップA14)。これは、キャッシュ記憶部31に
登録されているURL「http://www.bbb.co.jp/」の最
終参照日時が1999年8月10日であり、そのコンテ
ンツのキーワード「自動車」の参照回数が「1」である
ため、キーワードの参照回数が予め定められた基準値
(=1)以下であり、且つ、最終参照日時からの経過時
間が予め定められた時間(=1月)よりも長いという削
除条件を満たしているためである。
For example, the threshold value for the keyword is “1”
Assuming that the date when the cache deletion unit 23 is executed with the time being “1 month” is September 31, 1999, the URL “http: /” with “automobile” as a keyword
/www.bbb.co.jp/ "is deleted (Fig. 3
Step A14). This is because the URL “http://www.bbb.co.jp/” registered in the cache storage unit 31 has a last reference date and time of August 10, 1999, and refers to the keyword “car” of the content. Since the number of times is “1”, the number of times of reference to the keyword is equal to or less than a predetermined reference value (= 1), and the elapsed time from the last reference date and time is longer than a predetermined time (= 1 month). This is because the long deletion condition is satisfied.

【0049】キャッシュ記憶部31に登録されているU
RL「http://www.aaa.co.jp/」、URL「http://www.
ccc.co.jp/」の最終参照日時は、ともに1999年8月
10日であるが、これらのコンテンツのキーワード「科
学」の参照回数は「4」であるため、これらのコンテン
ツの情報は、キャッシュ記憶部31から削除されない。
U registered in the cache storage unit 31
RL "http://www.aaa.co.jp/", URL "http: // www.
ccc.co.jp/ "has the last reference date and time of August 10, 1999, respectively. However, since the number of references to the keyword" science "of these contents is" 4 ", the information of these contents is It is not deleted from the cache storage unit 31.

【0050】次に、本発明の第2の実施例について説明
する。図5は、本発明の第2の実施例の構成を示す図で
ある。図5を参照すると、本発明の第2の実施例は、デ
ータ処理装置5が、図1に示した前記第1の実施例のデ
ータ処理装置2の構成に加え、さらに、コンテンツ分類
手段24を備え、記憶装置6が分類情報記憶部33をさ
らに備えている。以下では、本発明の第2の実施例につ
いて、前記第1の実施例との相違点について説明する。
Next, a second embodiment of the present invention will be described. FIG. 5 is a diagram showing the configuration of the second embodiment of the present invention. Referring to FIG. 5, according to a second embodiment of the present invention, a data processing device 5 includes a content classification unit 24 in addition to the configuration of the data processing device 2 of the first embodiment shown in FIG. The storage device 6 further includes a classification information storage unit 33. In the following, the differences between the second embodiment of the present invention and the first embodiment will be described.

【0051】コンテンツ分類手段24は、読み込んだコ
ンテンツを、一般的な機能を用いて分類する。例えば、
一般的に良く知られる分類機能を持った検索サービス
(「www.yahoo.co.jp」等)を利用したり、分類する為の
ツールを使用する。
The contents classifying means 24 classifies the read contents by using general functions. For example,
A search service with a well-known classification function
(Such as "www.yahoo.co.jp") or use a tool for classification.

【0052】本実施例では、キーワード記憶部32は分
類毎にキーワードを記憶し、キャッシュ削除手段25は
キーワードを調べる場合、この分類毎に記憶されている
キーワード記憶部32を調査する。
In this embodiment, the keyword storage unit 32 stores a keyword for each classification, and when checking the keyword, the cache deletion unit 25 checks the keyword storage unit 32 stored for each classification.

【0053】図6及び図7は、本発明の第2の実施例の
動作を説明するための流れ図である。図5、図6及び図
7を参照して、本発明の第2の実施例の動作について説
明する。
FIGS. 6 and 7 are flow charts for explaining the operation of the second embodiment of the present invention. The operation of the second exemplary embodiment of the present invention will be described with reference to FIGS.

【0054】図6のステップA1−A4、A6及びA7
で示される本実施例におけるキャッシュ検索手段21の
動作と、図7のステップA10、A12及びA14の動
作は、前記第1の実施例のキャッシュ検索手段21、キ
ャッシュ登録22およびキャッシュ削除23の動作と同
一のため、説明は省略する。
Steps A1-A4, A6 and A7 in FIG.
The operations of the cache search means 21 in this embodiment and the operations of steps A10, A12 and A14 in FIG. 7 are the same as those of the cache search means 21, cache registration 22 and cache deletion 23 in the first embodiment. The description is omitted because they are the same.

【0055】前記第1の実施例では、キーワード記憶部
32は、キャッシュ記憶部31の全てに関するキーワー
ドを記憶していたが、本発明の第2の実施例では、キー
ワード記憶部32は分類単位に記憶する。
In the first embodiment, the keyword storage unit 32 stores the keywords for all of the cache storage units 31. However, in the second embodiment of the present invention, the keyword storage unit 32 stores the keywords in classification units. Remember.

【0056】コンテンツ分類手段24は、読み込んだコ
ンテンツを、一般的な機能を用いて分類する。例えば、
一般的に良く知られる分類機能を持った検索サービス
(「www.yahoo.co.jp」等)を利用したり、分類する為の
ツールを使用する(図6のステップB1)。分類された情
報を分類情報記憶部33へ記憶する(ステップB2)。
The contents classifying means 24 classifies the read contents by using general functions. For example,
A search service with a well-known classification function
(Such as "www.yahoo.co.jp") or a tool for classification (step B1 in FIG. 6). The classified information is stored in the classification information storage unit 33 (Step B2).

【0057】次に、キャッシュ削除手段25は、分類毎
にコンテンツを取り出す(図7のステップB10、B1
1、及びA11)。
Next, the cache deleting means 25 extracts the contents for each classification (steps B10 and B1 in FIG. 7).
1, and A11).

【0058】キャッシュから削除するか否かを調査する
処理で、比較対象となるキーワードをキーワード記憶部
32からではなく、分類情報記憶部33として調査を行
う(ステップB12)。
In the process of examining whether or not to delete from the cache, the keyword to be compared is examined not as the keyword storage unit 32 but as the classification information storage unit 33 (step B12).

【0059】次に、具体例に即して本発明の第2の実施
例について説明する。
Next, a second embodiment of the present invention will be described with reference to a specific example.

【0060】例えば図8に示すように、キャッシュ記憶
部31、キーワード記憶部32、分類情報記憶部33に
は、それぞれ、現在までに読み込まれているコンテンツ
の情報が登録されているものとする。
For example, as shown in FIG. 8, it is assumed that information on the content that has been read so far is registered in the cache storage unit 31, the keyword storage unit 32, and the classification information storage unit 33, respectively.

【0061】キャッシュ検索手段21は、入力装置1よ
りURL「http://www.nec.co.jp/」を受け取り、キャ
ッシュ記憶部31を検索する。
The cache search unit 21 receives the URL “http://www.nec.co.jp/” from the input device 1 and searches the cache storage unit 31.

【0062】ここで、キャッシュ記憶部31には、UR
L「http://www.nec.co.jp/」が記憶されていないた
め、キャッシュ検索手段21は検索不能と判断する(図
6のステップA1およびA2)。
Here, the UR is stored in the cache storage unit 31.
Since L “http://www.nec.co.jp/” is not stored, the cache search unit 21 determines that the search is impossible (steps A1 and A2 in FIG. 6).

【0063】次に、キャッシュ検索手段21は、実際
に、コンテンツを読み出し(ステップA3)、公知の方法
を用いて、分類を行う(ステップB1)。この場合、コン
テンツは「科学」に分類される。
Next, the cache search means 21 actually reads out the contents (step A3) and performs classification using a known method (step B1). In this case, the content is classified as “science”.

【0064】次に読み出したコンテンツのキーワードで
ある「コンピュータ」を抽出し(ステップA4)、コンテ
ンツをキャッシュ記憶部31へ登録し、キーワードをキ
ーワード記憶部32へ登録し、分類情報を分類情報記憶
部33へ登録し(ステップB2)、出力装置4へ出力する
(ステップA6)。
Next, "computer" which is a keyword of the read content is extracted (step A4), the content is registered in the cache storage unit 31, the keyword is registered in the keyword storage unit 32, and the classification information is stored in the classification information storage unit. 33 (step B2) and output to the output device 4.
(Step A6).

【0065】キャッシュ削除手段25は、分類情報記憶
部33からキャッシュ記憶部31内のコンテンツの最終
参照日時と、コンテンツに含まれるキーワードよりキャ
ッシュを削除するか否かを決定する(図7のステップB
10、B11、A10、A12及びB12)。
The cache deletion unit 25 determines whether or not to delete the cache from the classification information storage unit 33 based on the last reference date and time of the contents in the cache storage unit 31 and the keywords included in the contents (step B in FIG. 7).
10, B11, A10, A12 and B12).

【0066】例えばキーワードに関する閾値が「1」
で、未アクセス期間を規定する時間が一ヶ月であり、キ
ャッシュ削除手段23が実行された日が1999年9月
31日であったとすると、コンテンツの分類が「乗り
物」であり、キーワード参照回数が「1」のキーワード
「自転車」を含む「http://www.ddd.co.jp/」のキャッ
シュ情報が削除される(図7のステップA14)。
For example, the threshold value for the keyword is “1”
Assuming that the time for defining the non-access period is one month, and the date on which the cache deletion unit 23 is executed is September 31, 1999, the content classification is “vehicles” and the keyword reference count is The cache information of “http://www.ddd.co.jp/” including the keyword “bicycle” of “1” is deleted (step A14 in FIG. 7).

【0067】コンテンツの分類が「乗り物」であり、キ
ーワード参照回数が「3」のキーワード「自動車」を含
む「http://www.bbb.co.jp/」、コンテンツの分類が
「科学」であり、キーワード参照回数が「4」のキーワ
ード「科学」を含む「http://www.aaa.co.jp/」、コン
テンツの分類が「科学」であり、キーワード参照回数が
「2」のキーワード「自動車」を含む「http://www.cc
c.co.jp/」は削除されない。このように、分類情報を用
いることで、より正確に、削除対象のコンテンツを決定
することができる。
The classification of the content is “vehicles”, “http://www.bbb.co.jp/” including the keyword “car” having the keyword reference frequency of “3”, and the classification of the content is “science”. Yes, "http://www.aaa.co.jp/" including the keyword "science" with a keyword reference count of "4", a keyword whose content classification is "science" and the keyword reference count is "2""Http://www.cc" including "automobile"
c.co.jp/ "is not deleted. As described above, by using the classification information, the content to be deleted can be determined more accurately.

【0068】前記した本発明の第1、第2の実施例にお
いて、キャッシュ検索手段21、キャッシュ登録手段2
2、キャッシュ削除手段23、25、コンテンツ分類手
段24は、データ処理装置で実行されるプログラムによ
りその処理、機能が実現される。
In the first and second embodiments of the present invention, the cache search means 21 and the cache registration means 2
2. The processes and functions of the cache deletion units 23 and 25 and the content classification unit 24 are realized by a program executed by the data processing device.

【0069】[0069]

【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
As described above, according to the present invention, the following effects can be obtained.

【0070】本発明の第1の効果は、キャッシュの記憶
容量を削減することができる、ということである。
The first effect of the present invention is that the storage capacity of the cache can be reduced.

【0071】その理由は、本発明においては、時間だけ
でなく、コンテンツに含まれるキーワードを用いてキャ
ッシュを破棄し、再度読み込む可能性がないコンテンツ
をキャッシュから削除する構成としたためである。
The reason is that, in the present invention, not only the time but also the keyword included in the content is used to discard the cache, and the content that is not likely to be read again is deleted from the cache.

【0072】本発明の第2の効果は、キャッシュを用い
て検索速度を向上することができる、ということであ
る。
A second effect of the present invention is that the search speed can be improved by using a cache.

【0073】その理由は、本発明においては、時間だけ
でなく、コンテンツに含まれるキーワードを用いてキャ
ッシュを破棄する構成としており、再利用する可能性が
高いコンテンツをキャッシュに保持できるためである。
The reason is that, in the present invention, not only the time but also the keyword contained in the content is used to destroy the cache, so that the content that is highly likely to be reused can be held in the cache.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例の構成を示す図である。FIG. 1 is a diagram showing a configuration of a first exemplary embodiment of the present invention.

【図2】本発明の第1の実施例の処理手順を示す流れ図
である。
FIG. 2 is a flowchart showing a processing procedure according to the first embodiment of the present invention.

【図3】本発明の第1の実施例の処理手順を示す流れ図
である。
FIG. 3 is a flowchart showing a processing procedure according to the first embodiment of the present invention.

【図4】本発明の第1の実施例を具体的の説明するため
の模式図である。
FIG. 4 is a schematic diagram for specifically explaining the first embodiment of the present invention.

【図5】本発明の第2の実施例の構成を示す図である。FIG. 5 is a diagram showing a configuration of a second exemplary embodiment of the present invention.

【図6】本発明の第2の実施例の処理手順を示す流れ図
である。
FIG. 6 is a flowchart showing a processing procedure according to a second embodiment of the present invention.

【図7】本発明の第2の実施例の処理手順を示す流れ図
である。
FIG. 7 is a flowchart showing a processing procedure according to a second embodiment of the present invention.

【図8】本発明の第2の実施例を具体的の説明するため
の模式図である。
FIG. 8 is a schematic diagram for specifically explaining a second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力装置 2 データ処理装置 3、6 記憶装置 4 出力装置 21 キャッシュ検索手段 22 キャッシュ登録手段 24 コンテンツ分類手段 23、25 キャッシュ削除手段 31 キャッシュ記憶部 32 キーワード記憶部 33 分類情報記憶部 Reference Signs List 1 input device 2 data processing device 3, 6 storage device 4 output device 21 cache search means 22 cache registration means 24 content classification means 23, 25 cache deletion means 31 cache storage unit 32 keyword storage unit 33 classification information storage unit

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】キャッシュに登録されたコンテンツのアク
セス状況と、前記コンテンツに含まれるキーワードの参
照回数とに基づき、前記キャッシュから削除するコンテ
ンツを決定する手段を備えたことを特徴とするWebコ
ンテンツキャッシュシステム。
1. A Web content cache, comprising: means for determining content to be deleted from the cache based on an access status of content registered in the cache and a reference count of a keyword included in the content. system.
【請求項2】前記コンテンツのアクセス状況が予め定め
られた所定の基準に達せず、且つ、前記コンテンツに含
まれるキーワードの参照回数が予め定められた所定値以
下の場合に、前記コンテンツを前記キャッシュから削除
する、ことを特徴とする請求項1記載のWebコンテン
ツキャッシュシステム。
2. When the access status of the content does not reach a predetermined reference and the number of times of reference to a keyword included in the content is equal to or less than a predetermined value, the content is cached. 2. The Web content cache system according to claim 1, wherein the Web content cache system deletes the content.
【請求項3】キャッシュに登録されているコンテンツを
削除するにあたり、前記コンテンツのアクセス状況と、
前記コンテンツに含まれるキーワードの参照回数とに基
づき、前記キャッシュから削除するコンテンツを決定す
る、ことを特徴とするWebコンテンツキャッシュ制御
方法。
3. When deleting a content registered in a cache, an access status of the content,
A Web content cache control method, wherein a content to be deleted from the cache is determined based on a reference count of a keyword included in the content.
【請求項4】前記コンテンツのアクセス状況が予め定め
られた所定の基準に達せず、且つ、前記コンテンツに含
まれるキーワードの参照回数が予め定められた所定値以
下の場合に、前記コンテンツを前記キャッシュから削除
する、ことを特徴とする請求項3記載のWebコンテン
ツキャッシュ制御方法。
4. When the access status of the content does not reach a predetermined reference and the number of times of reference to a keyword included in the content is equal to or less than a predetermined value, the content is cached. 4. The web content cache control method according to claim 3, wherein the web content cache control method deletes the content.
【請求項5】指定されたURL(Uniform Resource L
ocator)のコンテンツがキャッシュに登録されている場
合には前記キャッシュから前記コンテンツを出力し、前
記URLのコンテンツが前記キャッシュに登録されてい
ない場合には新たに該URLのコンテンツを取得して前
記キャッシュに登録するとともに出力するWebコンテ
ンツキャッシュシステムにおいて、 前記キャッシュに登録するコンテンツに含まれるキーワ
ードを抽出し前記抽出されたキーワードを記憶管理する
手段と、 前記キャッシュにすでに登録されているコンテンツにつ
いて、前記コンテンツのアクセス情報と、キーワードの
参照回数とに基づき、削除するコンテンツを決定する手
段をを備えたことを特徴するWebコンテンツキャッシ
ュシステム。
5. A designated URL (Uniform Resource L)
ocator), the content is output from the cache when the content is registered in the cache, and when the content of the URL is not registered in the cache, the content of the URL is newly obtained and A web content cache system for registering and outputting the content in the cache, extracting a keyword included in the content to be registered in the cache, storing and managing the extracted keyword, and for the content already registered in the cache, Web content cache system comprising means for determining content to be deleted based on the access information and the number of times a keyword is referenced.
【請求項6】指定されたURL(Uniform Resource L
ocator)のコンテンツがキャッシュに登録されている場
合には前記キャッシュから前記コンテンツを出力し、前
記URLのコンテンツが前記キャッシュに登録されてい
ない場合には新たに該URLのコンテンツを取得して前
記キャッシュに登録するとともに出力するWebコンテ
ンツキャッシュシステムにおいて、 前記キャッシュに登録するコンテンツの分類情報を取得
する手段と、 前記キャッシュに登録するコンテンツに含まれるキーワ
ードを抽出し前記抽出されたキーワードを前記コンテン
ツの分類毎に記憶管理する手段と、 前記キャッシュにすでに登録されているコンテンツにつ
いて、分類毎に、前記コンテンツのアクセス情報とキー
ワードの参照回数とに基づき、削除するコンテンツを決
定する手段を、 を備えたことを特徴するWebコンテンツキャッシュシ
ステム。
6. A designated URL (Uniform Resource L)
ocator), the content is output from the cache when the content is registered in the cache, and when the content of the URL is not registered in the cache, the content of the URL is newly obtained and Means for acquiring classification information of contents registered in the cache, extracting a keyword included in the contents registered in the cache, and classifying the extracted keywords into the classification of the contents. Means for storing and managing each content, and for content already registered in the cache, for each classification, means for determining content to be deleted based on the access information of the content and the number of times of reference to the keyword. We feature b Content cache system.
【請求項7】キャッシュに登録するコンテンツのURL
(Uniform Resource Locator)と、該コンテンツの最
終参照日時情報と、該コンテンツとを記憶するキャッシ
ュ記憶部と、 前記キャッシュ記憶部に登録されるコンテンツに含まれ
るキーワードをその参照回数とともに記憶するキーワー
ド記憶部と、 入力装置からURLを受け取り、該URLが前記キャッ
シュ記憶部に登録されているか否かを調べ、前記キャッ
シュ記憶部に登録されている場合には、前記キャッシュ
記憶部からコンテンツを出力装置へ出力するキャッシュ
検索手段と、 前記URLが前記キャッシュ記憶部に登録されていない
場合には、該URLで指定される位置からコンテンツを
取得して、前記コンテンツに含まれるキーワードを抽出
し、前記キャッシュ記憶部へ該URLのコンテンツを登
録するとともに、前記キーワード記憶部へ前記抽出され
たキーワードを登録し、前記コンテンツを前記出力装置
に出力するキャッシュ登録手段と、 前記キャッシュ記憶部内のコンテンツの最終参照日時情
報と、前記キーワード記憶部のキーワードの参照回数と
を参照して、前記コンテンツが予め定められた所定期間
参照されず、且つ、前記コンテンツに含まれるキーワー
ドの参照回数が予め定められた所定値以下であるコンテ
ンツの情報を、前記キャッシュ記憶部から削除するキャ
ッシュ削除手段と、 を備えていることを特徴とする情報処理装置。
7. The URL of the content to be registered in the cache
(Uniform Resource Locator), last reference date and time information of the content, a cache storage unit for storing the content, and a keyword storage unit for storing a keyword included in the content registered in the cache storage unit together with the number of times of reference. And receives a URL from the input device, checks whether the URL is registered in the cache storage unit, and outputs the content from the cache storage unit to the output device if the URL is registered in the cache storage unit. If the URL is not registered in the cache storage unit, obtains a content from a position specified by the URL, extracts a keyword included in the content, And register the contents of the URL, and to the keyword storage unit. A cache registration unit that registers the extracted keyword and outputs the content to the output device; a last reference date and time information of the content in the cache storage unit; and a reference count of the keyword in the keyword storage unit. A cache deletion unit configured to delete, from the cache storage unit, content information in which the content has not been referred to for a predetermined period and the number of times of reference to a keyword included in the content is equal to or less than a predetermined value. An information processing apparatus, comprising:
【請求項8】キャッシュに登録するコンテンツのURL
(Uniform Resource Locator)と、該コンテンツの最
終参照日時情報と、該コンテンツとを記憶するキャッシ
ュ記憶部と、 前記キャッシュ記憶部に登録されるコンテンツの分類情
報を記憶する分類情報記憶部と、 前記キャッシュ記憶部に登録されるコンテンツに含まれ
るキーワードをその参照回数とともに分類単位に記憶す
るキーワード記憶部と、 入力装置からURLを受け取り、該URLが前記キャッ
シュ記憶部に登録されているか否かを調べ、前記キャッ
シュ記憶部に登録されている場合には、前記キャッシュ
記憶部からコンテンツを出力装置へ出力するキャッシュ
検索手段と、 前記URLが前記キャッシュ記憶部に登録されていない
場合には、前記URLで指定される位置からコンテンツ
を取得し、前記取得したコンテンツの分類情報を登録す
るコンテンツ分類手段と、 前記取得したコンテンツからキーワードを抽出し、前記
キャッシュ記憶部へ前記URLのコンテンツを登録する
とともに、前記キーワード記憶部へ抽出されたキーワー
ドを登録し、前記コンテンツを前記出力装置に出力する
キャッシュ登録手段と、 前記分類情報記憶部に記憶されている分類ごとに、前記
キャッシュ記憶部からコンテンツの情報を取り出し、前
記キャッシュ記憶部内のコンテンツの最終参照日時情報
と、前記キーワード記憶部のキーワードの参照回数とを
参照して、前記コンテンツが予め定められた所定期間参
照されず、且つ、前記コンテンツに含まれるキーワード
の参照回数が予め定められた所定値以下であるコンテン
ツの情報を前記キャッシュ記憶部から削除するキャッシ
ュ削除手段と、 を備えていることを特徴とする情報処理装置。
8. The URL of the content to be registered in the cache
(Uniform Resource Locator), last reference date and time information of the content, a cache storage unit that stores the content, a classification information storage unit that stores classification information of the content registered in the cache storage unit, and the cache A keyword storage unit that stores a keyword included in the content registered in the storage unit together with the number of references in a classification unit, a URL received from the input device, and a check is made as to whether the URL is registered in the cache storage unit, A cache search unit that outputs the content from the cache storage unit to an output device when the URL is registered in the cache storage unit; and a URL that is specified by the URL when the URL is not registered in the cache storage unit. Content from the location to be registered and register the classification information of the acquired content Extracting a keyword from the acquired content, registering the content of the URL in the cache storage unit, registering the extracted keyword in the keyword storage unit, and transmitting the content to the output device. Cache registering means for outputting, for each classification stored in the classification information storage unit, extracting information of the content from the cache storage unit, final reference date and time information of the content in the cache storage unit, By referring to the number of times of reference to the keyword, the information of the content in which the content has not been referred to for a predetermined period of time and the number of times of reference of the keyword included in the content is equal to or less than a predetermined value is cached. A cache deleting means for deleting from the storage unit; The information processing apparatus characterized by being e.
【請求項9】キャッシュに登録するコンテンツのURL
(Uniform Resource Locator)、該コンテンツの最終
参照日時情報と、該コンテンツとを記憶するキャッシュ
記憶部と、 前記キャッシュ記憶部に登録されるコンテンツに含まれ
るキーワードをその参照回数とともに記憶するキーワー
ド記憶部と、を備えた記憶装置と、 入力装置と、出力装置と、データ処理装置とを備えた情
報処理装置において、 (a)前記入力装置からURLを受け取り、前記URL
が前記キャッシュ記憶部に登録されているか否かを調
べ、前記キャッシュ記憶部に登録されている場合には、
前記キャッシュ記憶部からコンテンツを出力装置へ出力
する検索処理と、 (b)前記URLが前記キャッシュ記憶部に登録されて
いない場合には、該URLで指定される位置からコンテ
ンツを読み出して、キーワードを抽出し、前記キャッシ
ュ記憶部へ該URLのコンテンツを登録するとともに、
前記キーワード記憶部へ抽出されたキーワードを登録す
る登録処理と、 (c)前記キャッシュ記憶部内のコンテンツの最終参照
日時情報と、前記キーワード記憶部のキーワードの参照
回数を参照して、前記コンテンツが所定期間参照され
ず、且つ、前記コンテンツに含まれるキーワードの参照
回数が所定値に満たないコンテンツの情報を前記キャッ
シュ記憶部から削除する削除処理と、 の前記(a)乃至(c)の各処理を、前記データ処理装
置で実行させるためのプログラムを記録した記録媒体。
9. The URL of the content to be registered in the cache
(Uniform Resource Locator), a cache storage unit for storing last reference date and time information of the content, the content, and a keyword storage unit for storing a keyword included in the content registered in the cache storage unit together with the number of times of reference. , An input device, an output device, and a data processing device, comprising: (a) receiving a URL from the input device;
Check whether is registered in the cache storage unit, if it is registered in the cache storage unit,
(B) when the URL is not registered in the cache storage unit, the content is read from a location specified by the URL, and a keyword is input. Extract and register the content of the URL in the cache storage unit,
A registration process of registering the extracted keyword in the keyword storage unit; and (c) determining the content by referring to the last reference date and time information of the content in the cache storage unit and the number of times of reference of the keyword in the keyword storage unit A process of deleting from the cache storage unit information of a content that is not referred to for a period and for which the number of times of reference to a keyword included in the content is less than a predetermined value; and a process of (a) to (c) of And a recording medium storing a program to be executed by the data processing device.
【請求項10】キャッシュに登録するコンテンツのUR
L(Uniform Resource Locator)、該コンテンツの最
終参照日時情報と、該コンテンツとを記憶するキャッシ
ュ記憶部と、 前記キャッシュ記憶部に登録されるコンテンツの分類情
報を記憶する分類情報記憶部と、 前記キャッシュ記憶部に登録されるコンテンツに含まれ
るキーワードをその参照回数とともに分類単位に記憶す
るキーワード記憶部と、を備えた記憶装置と、 入力装置と、出力装置と、データ処理装置とを備えた情
報処理装置において、 (a)前記入力装置からURLを受け取り、前記URL
が前記キャッシュ記憶部に登録されているか否かを調
べ、前記キャッシュ記憶部に登録されている場合には、
前記キャッシュ記憶部からコンテンツを出力装置へ出力
する検索処理と、 (b)前記URLが前記キャッシュ記憶部に登録されて
いない場合には、前記URLで指定される位置からコン
テンツを取得し、前記取得したコンテンツの分類情報を
登録する分類処理と、 (c)前記取得したコンテンツからキーワードを抽出
し、前記キャッシュ記憶部へ前記URLのコンテンツを
登録するとともに、前記キーワード記憶部へ前記抽出さ
れたキーワードを登録する登録処理と、 (d)前記分類情報記憶部に記憶されている分類ごと
に、前記キャッシュ記憶部からコンテンツの情報を取り
出し、前記キャッシュ記憶部内のコンテンツの最終参照
日時情報と、前記キーワード記憶部のキーワードの参照
回数とを参照して、前記コンテンツが予め定められた所
定期間参照されず、且つ、前記コンテンツに含まれるキ
ーワードの参照回数が予め定められた所定値に満たない
コンテンツの情報を前記キャッシュ記憶部から削除する
削除処理と、 の前記(a)乃至(d)の各処理を、前記データ処理装
置で実行させるためのプログラムを記録した記録媒体。
10. The UR of the content to be registered in the cache
L (Uniform Resource Locator), last reference date and time information of the content, a cache storage unit for storing the content, a classification information storage unit for storing classification information of the content registered in the cache storage unit, and the cache A storage device including a keyword storage unit that stores a keyword included in the content registered in the storage unit together with the number of references in a classification unit, an information processing device including an input device, an output device, and a data processing device (A) receiving a URL from the input device;
Check whether is registered in the cache storage unit, if it is registered in the cache storage unit,
(B) when the URL is not registered in the cache storage unit, obtains the content from a position specified by the URL; (C) extracting a keyword from the acquired content, registering the URL content in the cache storage unit, and registering the extracted keyword in the keyword storage unit. (D) for each category stored in the category information storage unit, extracting content information from the cache storage unit, and obtaining the last reference date and time information of the content in the cache storage unit, and The content is determined in advance by referring to the (A) through (d): a deletion process of deleting from the cache storage unit information of content that has not been referred to for a predetermined period and in which the number of times of reference to a keyword included in the content is less than a predetermined value. A) a recording medium on which a program for causing the data processing device to execute each process of the above) is recorded.
JP34487499A 1999-12-03 1999-12-03 Web contents cache system, its method and recording medium Pending JP2001159998A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34487499A JP2001159998A (en) 1999-12-03 1999-12-03 Web contents cache system, its method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34487499A JP2001159998A (en) 1999-12-03 1999-12-03 Web contents cache system, its method and recording medium

Publications (1)

Publication Number Publication Date
JP2001159998A true JP2001159998A (en) 2001-06-12

Family

ID=18372667

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34487499A Pending JP2001159998A (en) 1999-12-03 1999-12-03 Web contents cache system, its method and recording medium

Country Status (1)

Country Link
JP (1) JP2001159998A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608982B1 (en) * 2001-11-30 2006-08-03 가부시키가이샤 엔.티.티.도코모 Content distribution system, description data distribution apparatus, content location management apparatus, data conversion apparatus, reception terminal apparatus, and content distribution method
JP2008186065A (en) * 2007-01-26 2008-08-14 Fuji Xerox Co Ltd Image processor, image processing system, and display control system
US8478943B2 (en) 2010-12-28 2013-07-02 Kabushiki Kaisha Toshiba Content caching device, content caching method, and computer readable medium
KR20150001893A (en) * 2013-06-27 2015-01-07 에스케이텔레콤 주식회사 Method for providing content in content delivery system and apparatus thereof
JP2019061442A (en) * 2017-09-26 2019-04-18 カシオ計算機株式会社 Information processing system, electronic device, information processing method, and program
CN112738148A (en) * 2019-10-28 2021-04-30 中兴通讯股份有限公司 Batch deletion method, device and equipment for cache content and readable storage medium
US12010186B2 (en) 2019-10-01 2024-06-11 Telefonaktiebolaget L M Ericsson (Publ) Support of indirect communication with TLS

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196049A (en) * 1997-09-18 1999-04-09 Toshiba Corp Recording / reproducing apparatus, recording / reproducing method, and recording medium
JPH11102366A (en) * 1997-09-26 1999-04-13 Toshiba Corp Search method and search device
JPH11120069A (en) * 1997-10-17 1999-04-30 Hitachi Ltd Data prefetching method
JPH11328227A (en) * 1998-04-14 1999-11-30 Fuji Xerox Co Ltd Document storage management system, management method for document storage system and graphical user interface

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1196049A (en) * 1997-09-18 1999-04-09 Toshiba Corp Recording / reproducing apparatus, recording / reproducing method, and recording medium
JPH11102366A (en) * 1997-09-26 1999-04-13 Toshiba Corp Search method and search device
JPH11120069A (en) * 1997-10-17 1999-04-30 Hitachi Ltd Data prefetching method
JPH11328227A (en) * 1998-04-14 1999-11-30 Fuji Xerox Co Ltd Document storage management system, management method for document storage system and graphical user interface

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100608982B1 (en) * 2001-11-30 2006-08-03 가부시키가이샤 엔.티.티.도코모 Content distribution system, description data distribution apparatus, content location management apparatus, data conversion apparatus, reception terminal apparatus, and content distribution method
JP2008186065A (en) * 2007-01-26 2008-08-14 Fuji Xerox Co Ltd Image processor, image processing system, and display control system
US8478943B2 (en) 2010-12-28 2013-07-02 Kabushiki Kaisha Toshiba Content caching device, content caching method, and computer readable medium
KR20150001893A (en) * 2013-06-27 2015-01-07 에스케이텔레콤 주식회사 Method for providing content in content delivery system and apparatus thereof
KR102070062B1 (en) * 2013-06-27 2020-01-28 에스케이텔레콤 주식회사 Method for providing content in content delivery system and apparatus thereof
JP2019061442A (en) * 2017-09-26 2019-04-18 カシオ計算機株式会社 Information processing system, electronic device, information processing method, and program
JP7069615B2 (en) 2017-09-26 2022-05-18 カシオ計算機株式会社 Information processing systems, electronic devices, information processing methods and programs
US12010186B2 (en) 2019-10-01 2024-06-11 Telefonaktiebolaget L M Ericsson (Publ) Support of indirect communication with TLS
CN112738148A (en) * 2019-10-28 2021-04-30 中兴通讯股份有限公司 Batch deletion method, device and equipment for cache content and readable storage medium
CN112738148B (en) * 2019-10-28 2024-05-14 中兴通讯股份有限公司 Batch deletion method, device and equipment of cache content and readable storage medium

Similar Documents

Publication Publication Date Title
CN107590169B (en) A kind of preprocessing method and system of operator gateway data
KR101976220B1 (en) Recommending data enrichments
KR101648235B1 (en) Pattern-recognition processor with matching-data reporting module
KR100705411B1 (en) Local Computer Search System and Local Computer Search Method Using the Same
US9331981B2 (en) Method and apparatus for filtering URL
US20120272338A1 (en) Unified tracking data management
JPH10198680A (en) Distributed dictionary management method and machine translation method using the same
CN108304410A (en) A detection method, device and data analysis method for abnormally accessed pages
US10235427B2 (en) Entity-driven logic for improved name-searching in mixed-entity lists
CN111008348A (en) Anti-crawler method, terminal, server and computer readable storage medium
US8126859B2 (en) Updating a local version of a file based on a rule
US8595229B2 (en) Search query generator apparatus
JP2001159998A (en) Web contents cache system, its method and recording medium
CN104598651B (en) A kind of management method and device of mobile terminal collection
CN114553858A (en) Resource pre-downloading method, device and equipment
CN112347324B (en) Document query method, device, electronic device and storage medium
CN107122381B (en) File generation method and device and data analysis method and device
JP5567906B2 (en) Apparatus and method for supporting screen reproduction
CN113687885A (en) Method, device and system for loading page data
US11250084B2 (en) Method and system for generating content from search results rendered by a search engine
CN115225291A (en) Web page access security detection method, device and storage medium
JP2003263353A (en) Failure cause analysis device, failure cause analysis method, and failure cause analysis program
KR20070031152A (en) A method of providing a search result for a search term input and a search engine employing the method
KR102485460B1 (en) System providing customized statistical analysis service and method of operation of system
JP2000132480A (en) Internet browsing method and apparatus, and recording medium recording Internet browsing program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041019