JP2008129998A - ハイパーテキスト変換プログラム、方法及び装置 - Google Patents
ハイパーテキスト変換プログラム、方法及び装置 Download PDFInfo
- Publication number
- JP2008129998A JP2008129998A JP2006316917A JP2006316917A JP2008129998A JP 2008129998 A JP2008129998 A JP 2008129998A JP 2006316917 A JP2006316917 A JP 2006316917A JP 2006316917 A JP2006316917 A JP 2006316917A JP 2008129998 A JP2008129998 A JP 2008129998A
- Authority
- JP
- Japan
- Prior art keywords
- anchor
- hypertext
- link destination
- new
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】元ハイパーテキスト中の処理範囲に存在する元アンカー72のリンク先ハイパーテキストを取得し、リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出する。元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定し、元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、マッチ範囲文字列「製品情報」と新規リンク先URLとのペアから成る新規アンカー情報を生成し、元ハイパーテキストのマッチ範囲文字列に新アンカー102を付与して新ハイパーテキスト70−1に変換する。
【選択図】 図10
Description
本発明は、コンピュータにより実行されるハイパーテキスト変換プログラムを提供する。
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
処理開始箇所に基づき元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
文字列比較によりマッチしたリンク先アンカー情報のリンク先文字列とペアを組むリンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を実行させる。
(1)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列、又は
(2)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んだ文字列、
を生成する。
新規アンカー付与ステップは、元ハイパーテキスト中のマッチ範囲に対し、優先度に基づいて、複数の新規リンク先URLに対応した複数の新規アンカーを付与する。
(1)優先度が最も高い新規アンカーを付与する処理、
(2)複数の新規アンカーを優先度順に付与する処理、
(3)優先度が予め定めた閾値より高い新規アンカーを付与する処理、又は
(4)優先度順に予め定めた数の新規アンカーを付与する処理、
を実行する。
クライアント又はキャッシュサーバは元ハイパーテキストを受信した際にハイパーテキスト変換プログラムを実行し、サーバは元ハイパーテキストを送信する際にハイパーテキスト変換プログラムを実行する。
本発明は、ウェブページを閲覧するクライアント、クライアントの処理を代行するプロキシキャッシュサーバ、またはクライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法を提供する。
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する前記文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
文字列比較によりマッチしたリンク先アンカー情報の前記リンク先文字列とペアを組むリンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を備え、
必要に応じて、更に、
新規アンカー情報中のマッチ範囲に存在する元ハイパーテキストの文字列に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを備えたこと特徴とする。
本発明は、ウェブページを閲覧するクライアント、クライアントの処理を代行するプロキシキャッシュサーバ、またはクライアントの閲覧要求に対しウェブページを送信するサーバとして機能するハイパーテキスト変換装置を提供する。
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
処理開始箇所に基づき元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
文字列比較によりマッチしたリンク先アンカー情報のリンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
を備え、
必要に応じて更に、
新規アンカー情報中のマッチ範囲に存在する元ハイパーテキストの文字列に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与部を備えたと特徴とする。
<h1>,</h1>,<h2>,</h2>, <h3>,</h3>,<p>,<td>,</td>,<li>,</li>
を区切り記号として、元アンカー72を含む処理範囲に決定してもよいし、元ハイパーテキスト全体を処理範囲に決定してもよい。更に処理範囲決定部34で使用する図5のパターン定義テーブル76のパターン内容に応じ、処理範囲を変えるようにしてもよい。
<h1>,</h1>,<h2>,</h2>, <h3>,</h3>,<p>,<td>,</td>,<li>,</li>
を区切り記号として、元アンカーを含む1ブロックを元アンカー影響範囲に決定してもよいし、元ハイパーテキスト全体を元アンカー影響範囲に決定してもよい。
(1)元ハイパーテキスト中のマッチ範囲の文字列を新規アンカー文字列として生成する。
(2)元ハイパーテキスト中の元アンカー文字列とマッチ範囲の文字列とを組み合わせた組合せ文字列を、新規アンカー文字列として生成する。
(2−1)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を新規アンカー文字列として生成する。
(2−2)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んで新規アンカー文字列を生成する。
元ハイパーテキスト中のマッチ範囲の文字列「製品情報」に新規アンカー文字列「ABCのページ:製品情報」が後置され、新規アンカー文字列「ABCのページ:製品情報」による新規アンカー102−2が付与されている。
(1)更新情報
(2)新着情報
といったタイトルパターンを予め定めておき、このタイトルパターンに照合するページを特殊ページとして判定する。
(1)トップページ
(2)TOP
(3)ホームページ
などを設定しておく。更に図20の判定された特殊ページにおける元アンカー影響範囲は元ハイパーテキスト130全体とする。
ここで本発明の特徴をまとめて列挙すると次の付記のようになる。
(付記1)(プログラム)
コンピュータに、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を実行させることを特徴とするハイパーテキスト変換プログラム。(1)
付記1記載のハイパーテキスト変換プログラムに於いて、前記コンピュータに、更に、
前記新規アンカー情報中の前記マッチ範囲に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを実行させることを特徴とするハイパーテキスト変換プログラム。(2)
付記2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記マッチ範囲の文字列を前記新規アンカーの新規アンカー文字列とすることを特徴とするハイパーテキスト変換プログラム。(3)
付記3記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記元アンカー文字列と前記マッチ範囲の文字列とを組み合わせた組合せ文字列を、前記新規アンカーの新規アンカー文字列として生成することを特徴とするハイパーテキスト変換プログラム。
付記3記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記新規アンカー文字列として、
前記元アンカー文字列に所定の連結記号を介して前記マッチ範囲文字列を組み合わせた文字列、又は
前記元アンカー文字列に所定の連結記号を介して前記マッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んだ文字列、
を生成することを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、更に、前記新規アンカー情報生成ステップにより生成された前記新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、前記処理開始箇所決定ステップ、前記処理範囲決定ステップ、前記リンク先ハイパーテキスト取得ステップ、前記リンク先アンカー情報抽出ステップ、前記アンカー影響範囲決定ステップ、前記文字列比較ステップ、および前記新規アンカー情報生成ステップの処理を再帰的に実行する再帰的処理ステップを備えたことを特徴とするハイパーテキスト変換プログラム。
付記2記載のハイパーテキスト変換プログラムに於いて、更に、前記新規アンカー情報生成ステップにより生成された前記新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、前記処理開始箇所決定ステップ、前記処理範囲決定ステップ、前記リンク先ハイパーテキスト取得ステップ、前記リンク先アンカー情報抽出ステップ、前記アンカー影響範囲決定ステップ、前記文字列比較ステップ、前記新規アンカー情報生成ステップおよび前記新規アンカー付与ステップの処理を再帰的に実行する再帰的処理ステップを備えたことを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、前記処理開始箇所決定ステップは、前記元ハイパーテキスト中に存在する元アンカー文字列の周辺に存在するリンク張りを示唆する予め定めた文字列パターンと一致する文字列を検索して処理開始箇所に決定することを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、前記処理範囲決定ステップは、前記元ハイパーテキスト中に存在する前記元アンカーの文字列及び前記処理開始箇所を含む句点で区切られた一文、前記元アンカーの文字列及び前記処理開始箇所を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を処理範囲に決定することを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、前記元アンカー影響範囲決定ステップは、前記元アンカーの文字列を含む句点で区切られた一文、前記元アンカーの文字列を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を元アンカー影響範囲に決定することを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー情報生成ステップは、前記新規アンカー情報中の同じマッチ範囲に複数の新規リンク先URLが対応する場合、前記複数の新規リンク先URLに優先度を付与することを特徴とするハイパーテキスト変換プログラム。
付記2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記新規アンカー情報の同じマッチ範囲に複数の前記新規リンク先URLが対応する場合、前記元ハイパーテキスト中の前記マッチ範囲に対し前記複数の新規リンク先URLに対応した複数の新規アンカーを付与することを特徴とするハイパーテキスト変換プログラム。
付記2記載のハイパーテキスト変換プログラムに於いて、
前記新規アンカー情報生成ステップは、前記新規アンカー情報の同じマッチ範囲に複数の前記新規リンク先URLが対応する場合、前記新規リンク先URLに優先度を付与し、
前記新規アンカー付与ステップは、前記元ハイパーテキスト中の前記マッチ範囲に対し、前記優先度に基づいて、前記複数の新規リンク先URLに対応した複数の新規アンカーを付与することを特徴とするハイパーテキスト変換プログラム。
付記13記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、
前記優先度が最も高い新規アンカーを付与する処理、
前記複数の新規アンカーを優先度順に付与する処理、
優先度が予め定めた閾値より高い新規アンカーを付与する処理、又は
優先度順に予め定めた数の新規アンカーを付与する処理、
を実行することを特徴とするハイパーテキスト変換プログラム。
付記1記載のハイパーテキスト変換プログラムに於いて、
前記処理開始箇所決定ステップは、前記元ハイパーテキストのタイトルが予め定義したタイトル条件にマッチする場合には、予め定義したアンカー条件にマッチするアンカーを前記元アンカーとして処理開始箇所を決定し、
前記処理範囲決定ステップは処理範囲を前記元ハイパーテキスト全体に決定することを特徴とするハイパープログラム変換プログラム。
付記15記載のハイパーテキスト変換プログラムに於いて、前記処理開始箇所決定ステップは、前記タイトルとして更新情報又は新着情報を定義すると共に前記アンカー条件としてTOP、トップページ、ホームページ又はこれらの同義語を定義し、前記TOP、トップページ、ホームページ又はこれらの同義語にマッチするアンカーを元アンカーとすることを特徴とするハイパーテキスト変換プログラム。
付記1又は2記載のハイパーテキスト変換プログラムにおいて、前記コンピュータは、ネットワーク上のウェブページにアクセスして前記元ハイパーテキストを受信して表示するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、又はクライアントからの閲覧要求に対し前記元ハイパーテキストを送信するウェブサーバであり、
前記クライアント又はプロキシキャッシュサーバは前記元ハイパーテキストを受信した際に前記ハイパーテキスト変換プログラムを実行し、前記サーバは前記元ハイパーテキストを送信する際に前記ハイパーテキスト変換プログラムを実行することを特徴とするハイパーテキスト変換プログラム。
ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法に於いて、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を備えたことを特徴とするハイパーテキスト変換方法。(4)
付記18記載のハイパーテキスト変換方法に於いて、更に、前記新規アンカー情報中の前記マッチ範囲に存在する文字列に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを備えたことを特徴とするハイパーテキスト変換方法。
ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバとして機能するハイパーテキスト変換装置に於いて、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
を備えたことを特徴とするハイパーテキスト変換装置。(5)
付記20記載のハイパーテキスト変換装置に於いて、更に、前記新規アンカー情報中の前記マッチ範囲に存在する元ハイパーテキストの文字列に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与部を備えたことを特徴とするハイパーテキスト変換装置。
12:インターネット
14:プロキシキャッシュサーバ
16:LAN
18−1〜18−4,18:クライアント
20−12〜20−4:ウェブページ
22−1〜22−4,22:ブラウザ
24:ハイパーテキスト変換部
26:キャッシュ
28:通信制御部
30:プロキシ処理部
32:処理開始箇所決定部
34:処理範囲決定部
36:リンク先ハイパーテキスト取得部
38:リンク先アンカー情報抽出部
40:元アンカー影響範囲決定部
42:文字列比較部
44:新規アンカー情報生成部
46:新規アンカー付与部
48:再帰的処理部
50:CPU
52:バス
54:RAM
56:ROM
58:ハードディスクドライブ
60:デバイスインタフェース
62:キーボード
64:マウス
66:ディスプレイ
68:ネットワークアダプタ
70,114,130:元ハイパーテキスト
70−1〜70−4,114−1,130−1:新ハイパーテキスト
72,116,118,132:元アンカー
74:処理開始箇所
76:パターン定義テーブル
78,115:処理範囲
80,104,134,154:リンク先ハイパーテキスト
82,84,86,106,108,110,136,138,156,158:リンク先アンカー
88,140,160:リンク先アンカー情報テーブル
90,142,162:リンク先アンカーの文字列
92,144,164:リンク先アンカーのリンク先URL
94,94−1,94−2,122,146,166:新規アンカー情報テーブル
96,120,124,148,168:マッチ範囲
98,126,150,170:新規リンク先URL
100,128,152,172:新規アンカー文字列
102,102−1,102−2,112,120,174,176,178,224−1〜224−4:新規アンカー
129:優先度
220−1〜220−5:新規アンカー群
222:マッチ範囲文字列
Claims (5)
- コンピュータに、
処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を実行させることを特徴とするハイパーテキスト変換プログラム。
- 請求項1記載のハイパーテキスト変換プログラムに於いて、前記コンピュータに、更に、
前記新規アンカー情報中の前記マッチ範囲に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを実行させることを特徴とするハイパーテキスト変換プログラム。
- 請求項2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記マッチ範囲の文字列を前記新規アンカーの新規アンカー文字列とすることを特徴とするハイパーテキスト変換プログラム。
- ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法に於いて、
処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を備えたことを特徴とするハイパーテキスト変換方法。
- ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバとして機能するハイパーテキスト変換装置に於いて、
処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
を備えたことを特徴とするハイパーテキスト変換装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006316917A JP4915219B2 (ja) | 2006-11-24 | 2006-11-24 | ハイパーテキスト変換プログラム、方法及び装置 |
| US11/786,721 US7757158B2 (en) | 2006-11-24 | 2007-04-12 | Converting hypertext character strings to links by attaching anchors extracted from existing link destination |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006316917A JP4915219B2 (ja) | 2006-11-24 | 2006-11-24 | ハイパーテキスト変換プログラム、方法及び装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2008129998A true JP2008129998A (ja) | 2008-06-05 |
| JP4915219B2 JP4915219B2 (ja) | 2012-04-11 |
Family
ID=39464971
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006316917A Expired - Fee Related JP4915219B2 (ja) | 2006-11-24 | 2006-11-24 | ハイパーテキスト変換プログラム、方法及び装置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US7757158B2 (ja) |
| JP (1) | JP4915219B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010009414A (ja) * | 2008-06-27 | 2010-01-14 | Fujitsu Ltd | 関連情報登録装置、関連情報登録方法および関連情報登録プログラム |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102331985B (zh) * | 2010-07-12 | 2013-09-25 | 阿里巴巴集团控股有限公司 | 网页页面的分片嵌套缓存的处理方法和装置 |
| US9047259B1 (en) * | 2010-07-21 | 2015-06-02 | Google Inc. | System and method for renaming hyperlinks |
| US10296158B2 (en) * | 2011-12-20 | 2019-05-21 | Oath Inc. | Systems and methods involving features of creation/viewing/utilization of information modules such as mixed-media modules |
| US10346551B2 (en) * | 2013-01-24 | 2019-07-09 | New York University | Systems, methods and computer-accessible mediums for utilizing pattern matching in stringomes |
| US10318397B2 (en) | 2013-04-15 | 2019-06-11 | Vmware, Inc. | Efficient data pattern matching |
| US9244903B2 (en) * | 2013-04-15 | 2016-01-26 | Vmware, Inc. | Efficient data pattern matching |
| CN105095441A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 一种信息获取方法及装置 |
| CA2939395A1 (en) * | 2016-08-15 | 2016-10-17 | Richard S. Brown | Method and device for invoking a search from a text message |
| US11100186B2 (en) * | 2019-05-16 | 2021-08-24 | Vmware, Inc. | Automated hyperlinks for draft emails |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001256259A (ja) * | 2000-03-13 | 2001-09-21 | Omron Corp | ハイパーテキスト制御システム |
| JP2001312520A (ja) * | 2001-04-02 | 2001-11-09 | Casio Comput Co Ltd | ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置 |
Family Cites Families (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0451384B1 (en) * | 1990-04-10 | 1997-09-24 | International Business Machines Corporation | Hypertext data processing system and method |
| JPH07325827A (ja) | 1994-04-07 | 1995-12-12 | Mitsubishi Electric Corp | ハイパーテキスト自動生成装置 |
| US5603025A (en) * | 1994-07-29 | 1997-02-11 | Borland International, Inc. | Methods for hypertext reporting in a relational database management system |
| US5794257A (en) * | 1995-07-14 | 1998-08-11 | Siemens Corporate Research, Inc. | Automatic hyperlinking on multimedia by compiling link specifications |
| US5745360A (en) * | 1995-08-14 | 1998-04-28 | International Business Machines Corp. | Dynamic hypertext link converter system and process |
| US5822539A (en) | 1995-12-08 | 1998-10-13 | Sun Microsystems, Inc. | System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server |
| US5761683A (en) * | 1996-02-13 | 1998-06-02 | Microtouch Systems, Inc. | Techniques for changing the behavior of a link in a hypertext document |
| WO1997044726A1 (en) * | 1996-05-06 | 1997-11-27 | Adobe Systems Incorporated | Internet hyperlink drag and drop |
| US5724595A (en) * | 1996-06-19 | 1998-03-03 | Sun Microsystems, Inc. | Simple method for creating hypertext links |
| DE69718669T2 (de) * | 1996-10-23 | 2003-11-27 | Access Co., Ltd. | Informationsgerät mit automatischer web-lesefunktion |
| JPH10228473A (ja) * | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置および記憶媒体 |
| US6658623B1 (en) * | 1997-09-15 | 2003-12-02 | Fuji Xerox Co., Ltd. | Displaying in a first document a selectable link to a second document based on a passive query |
| US6016494A (en) * | 1997-11-21 | 2000-01-18 | International Business Machines Corporation | Expanding web documents by merging with linked documents |
| US6574644B2 (en) * | 1997-11-26 | 2003-06-03 | Siemens Corporate Research, Inc | Automatic capturing of hyperlink specifications for multimedia documents |
| US6230168B1 (en) * | 1997-11-26 | 2001-05-08 | International Business Machines Corp. | Method for automatically constructing contexts in a hypertext collection |
| US6092074A (en) * | 1998-02-10 | 2000-07-18 | Connect Innovations, Inc. | Dynamic insertion and updating of hypertext links for internet servers |
| US6748385B1 (en) * | 1998-02-10 | 2004-06-08 | National Broadcasting Company, Inc. | Dynamic insertion and updating of hypertext links for internet servers |
| US6122647A (en) * | 1998-05-19 | 2000-09-19 | Perspecta, Inc. | Dynamic generation of contextual links in hypertext documents |
| US6295542B1 (en) * | 1998-10-02 | 2001-09-25 | National Power Plc | Method and apparatus for cross-referencing text |
| US6772139B1 (en) * | 1998-10-05 | 2004-08-03 | Smith, Iii Julius O. | Method and apparatus for facilitating use of hypertext links on the world wide web |
| US6751777B2 (en) * | 1998-10-19 | 2004-06-15 | International Business Machines Corporation | Multi-target links for navigating between hypertext documents and the like |
| JP2000163432A (ja) | 1998-11-27 | 2000-06-16 | Oki Electric Ind Co Ltd | ハイパーテキストのリンク生成システム |
| US7003719B1 (en) * | 1999-01-25 | 2006-02-21 | West Publishing Company, Dba West Group | System, method, and software for inserting hyperlinks into documents |
| US7594166B1 (en) * | 1999-05-20 | 2009-09-22 | Microsoft Corporation | Dynamic web page behaviors |
| US6505197B1 (en) * | 1999-11-15 | 2003-01-07 | International Business Machines Corporation | System and method for automatically and iteratively mining related terms in a document through relations and patterns of occurrences |
| US7191400B1 (en) * | 2000-02-03 | 2007-03-13 | Stanford University | Methods for generating and viewing hyperlinked pages |
| US7418657B2 (en) * | 2000-12-12 | 2008-08-26 | Ebay, Inc. | Automatically inserting relevant hyperlinks into a webpage |
| US7013309B2 (en) * | 2000-12-18 | 2006-03-14 | Siemens Corporate Research | Method and apparatus for extracting anchorable information units from complex PDF documents |
| US6874019B2 (en) * | 2001-03-08 | 2005-03-29 | International Business Machines Corporation | Predictive caching and highlighting of web pages |
| US6990494B2 (en) * | 2001-07-27 | 2006-01-24 | International Business Machines Corporation | Identifying links of interest in a web page |
| US20030229857A1 (en) * | 2002-06-05 | 2003-12-11 | Fuji Xerox Co., Ltd. | Apparatus, method, and computer program product for document manipulation which embeds information in document data |
| US7840888B2 (en) * | 2004-09-16 | 2010-11-23 | Jimmy Jong-Yuan Lin | Architecture and methodology of redirection for dynamic new URL links |
-
2006
- 2006-11-24 JP JP2006316917A patent/JP4915219B2/ja not_active Expired - Fee Related
-
2007
- 2007-04-12 US US11/786,721 patent/US7757158B2/en not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001256259A (ja) * | 2000-03-13 | 2001-09-21 | Omron Corp | ハイパーテキスト制御システム |
| JP2001312520A (ja) * | 2001-04-02 | 2001-11-09 | Casio Comput Co Ltd | ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010009414A (ja) * | 2008-06-27 | 2010-01-14 | Fujitsu Ltd | 関連情報登録装置、関連情報登録方法および関連情報登録プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20080126400A1 (en) | 2008-05-29 |
| US7757158B2 (en) | 2010-07-13 |
| JP4915219B2 (ja) | 2012-04-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10796076B2 (en) | Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine | |
| US7757158B2 (en) | Converting hypertext character strings to links by attaching anchors extracted from existing link destination | |
| CN101194256B (zh) | 具有表意文字和音标字符的语言的自动输入完成的方法和系统 | |
| JP5264892B2 (ja) | 多言語情報検索 | |
| US8631097B1 (en) | Methods and systems for finding a mobile and non-mobile page pair | |
| US7310633B1 (en) | Methods and systems for generating textual information | |
| US11361036B2 (en) | Using historical information to improve search across heterogeneous indices | |
| JP2011118652A (ja) | 単語の関連キーワードを決定する装置ならびにその動作制御方法およびその動作制御プログラム | |
| JP2011222056A (ja) | 検索システム及び検索方法 | |
| KR100455439B1 (ko) | 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법 | |
| JP2020021455A (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
| JP5186165B2 (ja) | 組織名抽出装置、方法及びプログラム | |
| JP2001265774A (ja) | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム | |
| US20050060291A1 (en) | Method and apparatus for searching universal resource identifiers | |
| JP4842921B2 (ja) | 検索システムおよびその方法 | |
| US20020124056A1 (en) | Method and apparatus for modifying a web page | |
| KR100516302B1 (ko) | 인터넷 주소의 오타 처리 방법 및 시스템 | |
| JP2010079863A (ja) | 絞り込み検索サービス提供方法及びプログラム | |
| KR101499685B1 (ko) | 키워드 트리 제공 방법 | |
| Darie et al. | Professional Search Engine Optimization with PHP: A Developer's Guide to SEO | |
| JP2002063203A (ja) | 情報検索装置及び方法並びに情報検索プログラムを格納した記録媒体 | |
| JP4543818B2 (ja) | 情報収集支援システム、情報収集支援方法及び情報収集支援プログラム | |
| KR20220164982A (ko) | 커먼 아이디정보의 매칭을 이용한 웹페이지 메모 공유방법 | |
| JP2008090523A (ja) | コンテンツ作成装置及びコンテンツ作成方法 | |
| JP2009070194A (ja) | 翻訳者選択方法、翻訳コンテンツ提供サーバ、および翻訳者選択プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090810 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111216 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111227 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120109 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150203 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |