[go: up one dir, main page]

JP2008129998A - ハイパーテキスト変換プログラム、方法及び装置 - Google Patents

ハイパーテキスト変換プログラム、方法及び装置 Download PDF

Info

Publication number
JP2008129998A
JP2008129998A JP2006316917A JP2006316917A JP2008129998A JP 2008129998 A JP2008129998 A JP 2008129998A JP 2006316917 A JP2006316917 A JP 2006316917A JP 2006316917 A JP2006316917 A JP 2006316917A JP 2008129998 A JP2008129998 A JP 2008129998A
Authority
JP
Japan
Prior art keywords
anchor
hypertext
link destination
new
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006316917A
Other languages
English (en)
Other versions
JP4915219B2 (ja
Inventor
Yutaka Mitsuishi
豊 光石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006316917A priority Critical patent/JP4915219B2/ja
Priority to US11/786,721 priority patent/US7757158B2/en
Publication of JP2008129998A publication Critical patent/JP2008129998A/ja
Application granted granted Critical
Publication of JP4915219B2 publication Critical patent/JP4915219B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ハイパーテキストが直接または間接的にリンクしている他のハイパーテキスト群のアンカー情報がリンク元のアンカー情報から見て適切な場合にのみリンクを張る。
【解決手段】元ハイパーテキスト中の処理範囲に存在する元アンカー72のリンク先ハイパーテキストを取得し、リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出する。元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定し、元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、マッチ範囲文字列「製品情報」と新規リンク先URLとのペアから成る新規アンカー情報を生成し、元ハイパーテキストのマッチ範囲文字列に新アンカー102を付与して新ハイパーテキスト70−1に変換する。
【選択図】 図10

Description

本発明は、ハイパーテキストのアンカーから取得されるリンク先ハイパーテキストのリンク先アンカーを元のハイパーテキストに自動的に付与するハイパーテキスト変換プログラム、方法及び装置に関し、特に、元のハイパーテキストの文脈に関連する適切なリンク先アンカーを元のハイパーテキストに付与するハイパーテキスト変換プログラム、方法及び装置に関する。
従来、HTMLを使用してウェブページのハイパーテキストを作成した場合、必要に応じて他のウェブページにハイパーリンクするためにアンカーを埋め込んでいる。
一般に他のウェブサイトのハイパーテキストに対するリンク張りは、相手のトップページにリンクすることがマナーやルールであると考える人が多く存在する。
しかしながら、リンク張りによって閲覧したいのは必ずしもリンク先のトップページではなく、トップページのメニューからリンクされる内部ページであることが多い。この場合、リンク先のトップページにリンクを張らずに直接内部ページにリンクを張ることは可能であるが、リンク元のウェブページ作成者が、リンク先ウェブサイト作成者の内部ページへのリンク禁止の要望を受け入れたり内部ページへのリンクがマナー違反であると考えたりするために、トップページへのリンクを張る場合が多く存在する。
このため従来のハイパーテキストのリンク張りにあっては、ユーザがハイパーテキストを開いて情報を更に詳しく知るためにアンカーを操作した場合、リンク先のホームページを開くようにリンク張りしており、ホームページのメニューから必要とする情報に該当しそうなメニューを選択して探すこととなり、必要とする情報に行き着くまでに手間と時間がかかる問題がある。
このような問題を解決するため、ハイパーテキストを開いた際にリンク張りしているホームページからリンクを辿って必要な情報を閲覧可能とする自動リンク方法が数多く存在している。
このような自動リンク方法として、特許文献1の方法は、リンク先のハイパーテキストからキーワードを抽出し、そのキーワードを元にリンクを張るようにしている。また特許文献2,3の方法は、リンク先のハイパーテキストの文字列が辞書に登録された文字列にマッチしたらリンクを張るようにしている。更に、特許文献4の方法は、所定の深さまでリンクを辿り、元ページに新たにアンカーを作成しリンクを張るようにしている。
特開平7-325827号公報 特開平10−049425号公報 特開2000−163432号公報 特開2001−256259号公報
しかしながら、このような従来の自動リンク方法にあっては、ハイパーテキストを開いた際に自動的に張られるリンクは、必ずしも利用者にとって役立つものとは限らず、不便な場合がある。
例えば特許文献1,2,3の方法は、元となったハイパーテキストに直接関係のない参考情報や文脈の異なる情報へのリンクを張ってしまう可能性がある。また特許文献4の方法は、元となったハイパーテキストが直接または間接的にリンクしている文脈的に関係あるハイパーテキスト群へのリンクを張るが、全てのリンクを辿って取得した全てのアンカーが無条件に元のハイパーテキストに追加されるため、どのアンカーが利用者にとって役立つか見極めるのが困難である。
本発明は、ハイパーテキストが直接または間接的にリンクしているリンク先のハイパーテキスト群のアンカー情報がリンク元のアンカーの関連する文脈から見て適切な場合にのみリンクを張るようにしたハイパーテキスト変換プログラム、方法及び装置を提供することを目的とする。
(プログラム)
本発明は、コンピュータにより実行されるハイパーテキスト変換プログラムを提供する。
本発明は、コンピュータに、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
処理開始箇所に基づき元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
文字列比較によりマッチしたリンク先アンカー情報のリンク先文字列とペアを組むリンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を実行させる。
本発明のハイパーテキスト変換プログラムは、コンピュータに、更に、新規アンカー情報中のマッチ範囲に存在する元ハイパーテキストの文字列に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを実行させること特徴とする。
新規アンカー付与ステップは、マッチ範囲の文字列を前記新規アンカーの新規アンカー文字列とする。
また新規アンカー付与ステップは、元アンカー文字列とマッチ範囲の文字列とを組み合わせた組合せ文字列を、新規アンカーの新規アンカー文字列として生成してもよい。
例えば新規アンカー付与ステップは、新規アンカー文字列として、
(1)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列、又は
(2)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んだ文字列、
を生成する。
本発明のハイパーテキスト変換プログラムは、更に、新規アンカー情報生成ステップにより生成された新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、処理開始箇所決定ステップ、処理範囲決定ステップ、リンク先ハイパーテキスト取得ステップ、リンク先アンカー情報抽出ステップ、アンカー影響範囲決定ステップ、文字列比較ステップ、新規アンカー情報生成ステップの処理、又は更に新規アンカー付与ステップを加えた処理を、それぞれ再帰的に実行する再帰的処理ステップを備える。
処理開始箇所決定ステップは、元ハイパーテキスト中に存在する元アンカー文字列の周辺に存在するリンク張りを示唆する予め定めた文字列パターンと一致する文字列を検索して処理開始箇所に決定する。
処理範囲決定ステップは、元ハイパーテキスト中に存在する元アンカー文字列及び処理開始箇所を含む句点で区切られた一文、元アンカー文字列及び処理開始箇所を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を処理範囲に決定する。
元アンカー影響範囲決定ステップは、元アンカー文字列を含む句点で区切られた一文、元アンカーの文字列を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を元アンカー影響範囲に決定する。
新規アンカー情報生成ステップは、新規アンカー情報中の同じマッチ範囲に複数の新規リンク先URLが対応する場合、複数の新規リンク先URLに優先度を付与する。
新規アンカー付与ステップは、新規アンカー情報の同じマッチ範囲に複数の新規リンク先URLが対応する場合、元ハイパーテキスト中のマッチ範囲に対し複数の新規リンク先URLに対応した複数の新規アンカーを付与する。
新規アンカー情報生成ステップは、新規アンカー情報の同じマッチ範囲に複数の新規リンク先URLが対応する場合、新規リンク先URLに優先度を付与し、
新規アンカー付与ステップは、元ハイパーテキスト中のマッチ範囲に対し、優先度に基づいて、複数の新規リンク先URLに対応した複数の新規アンカーを付与する。
新規アンカー付与ステップは、優先度による新アンカーの付与として、
(1)優先度が最も高い新規アンカーを付与する処理、
(2)複数の新規アンカーを優先度順に付与する処理、
(3)優先度が予め定めた閾値より高い新規アンカーを付与する処理、又は
(4)優先度順に予め定めた数の新規アンカーを付与する処理、
を実行する。
処理開始箇所決定ステップは、元ハイパーテキストのタイトルが予め定義したタイトル条件にマッチする場合には、予め定義したアンカー条件にマッチするアンカーを前記元アンカーして処理開始箇所を決定し、処理範囲決定ステップは処理範囲を前記元ハイパーテキスト全体に決定する。
具体的には、処理開始箇所決定ステップは、タイトルとして更新情報又は新着情報を定義すると共にアンカー条件としてTOP、トップページ、ホームページ又はこれらの同義語を定義し、TOP、トップページ、ホームページ又はこれらの同義語にマッチするアンカーを元アンカーとする。
ハイパーテキスト変換プログラムを実行するコンピュータは、ネットワーク上のウェブページにアクセスして元ハイパーテキストを受信して表示するクライアント、クライアント側に配置されたキャッシュサーバ、又はクライアントからの閲覧要求に対し元ハイパーテキストを送信するサーバであり、
クライアント又はキャッシュサーバは元ハイパーテキストを受信した際にハイパーテキスト変換プログラムを実行し、サーバは元ハイパーテキストを送信する際にハイパーテキスト変換プログラムを実行する。
(方法)
本発明は、ウェブページを閲覧するクライアント、クライアントの処理を代行するプロキシキャッシュサーバ、またはクライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法を提供する。
本発明のハイパーテキスト変換方法は、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する前記文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
文字列比較によりマッチしたリンク先アンカー情報の前記リンク先文字列とペアを組むリンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を備え、
必要に応じて、更に、
新規アンカー情報中のマッチ範囲に存在する元ハイパーテキストの文字列に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを備えたこと特徴とする。
(装置)
本発明は、ウェブページを閲覧するクライアント、クライアントの処理を代行するプロキシキャッシュサーバ、またはクライアントの閲覧要求に対しウェブページを送信するサーバとして機能するハイパーテキスト変換装置を提供する。
本発明のハイパーテキスト変換装置は、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
処理開始箇所に基づき元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
元アンカー影響範囲に存在する文字列とリンク先アンカー情報に存在する文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
文字列比較によりマッチしたリンク先アンカー情報のリンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
を備え、
必要に応じて更に、
新規アンカー情報中のマッチ範囲に存在する元ハイパーテキストの文字列に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与部を備えたと特徴とする。
本発明によれば、元ハイパーテキストの元アンカーによりリンクを辿ったリンク先のアンカー情報がリンク元アンカー情報に一致するか一部に含むような場合に、適切なリンク先と判断して元アンカーに新アンカーを付与してリンク張りするため、元ハイパーテキストのコンテンツ作成者が誘導したいであろう文脈的に関連のある利用者にとって有用な情報を閲覧するための適切なリンクを張ることができる。
また本発明により適切と判断されたリンク先にリンクを張る新規アンカーを元ハイパーテキストに付与して新規ハイパーテキストに変換する処理は、クライアントによりウェブサーバのハイパーテキストを閲覧した際に、クライアント側又はサーバ側の処理としてその都度自動的に行われ、コンテンツ製作者が作成したオリジナルのハイパーテキストにおける例えばトップページへのリンク張りというコンセプトを改変してしまう問題はない。
またコンテンツ製作者にあっては、本発明をオリジナルのハイパーテキストに適用することで、元ハイパーテキストのコンテンツ作成者が誘導したいであろう文脈的に関連のある有用な情報を閲覧するための適切なリンクを自動的に張ることができ、ハイパーテキストのエディタとして活用することもできる。
図1は本発明によるハイパーテキスト変換処理が適用されるシステム構成のブロック図である。図1において、インターネット12に対してはサーバ10−1〜10−4が接続されており、それぞれウェブページ20−1〜20−4を有し、HTMLで記述されたハイパーテキストを備えている。
インターネット12に対しては、本実施形態にあってはプロキシキャッシュサーバ14を介して企業内のLAN16が接続され、LAN16に対しクライアント18−1〜18−4を接続している。クライアント18−1〜18−4のそれぞれには、サーバ10−1〜10−4のウェブページ20−1〜20−4の閲覧に使用するブラウザ22−1〜22−4が設けられている。
図1において、本発明のハイパーテキスト変換処理はプロキシキャッシュサーバ14で実行される。このためプロキシキャッシュサーバ14には、本発明によるハイパーテキスト変換部24が設けられている。ハイパーテキスト変換部24はプログラムの実行により実現される機能である。
またプロキシキャッシュサーバ14にはキャッシュ26が設けられ、クライアント18−1〜18−4でアクセスしたウェブページを、有効期限を付けてキャッシュ26に格納し、有効期限中はキャッシュ26からクライアント18−1〜18−4がウェブページを取得できるようにしている。
プロキシキャッシュサーバ14に設けた本発明のハイパーテキスト変換部24は、クライアント18−1〜18−4側からのアクセスで、サーバ10−1〜10−4のいずれかからウェブページのハイパーテキストを取得した際に、このハイパーテキストに設けられているリンク先アンカーに基づいて、自動的にリンク先ハイパーテキストにリンクするための新規アンカーを生成して付与することにより、新ハイパーテキストに変換してクライアント側に提供する。
図2は本発明のハイパーテキスト変換機能を備えたプロキシキャッシュサーバ14の実施形態を示したブロック図である。図2において、プロキシキャッシュサーバ14は、通信制御部28によりインターネット12及びLAN16に接続して通信処理を行うことができ、通信制御部28に対してはプロキシ処理部30を介してキャッシュ26が配置され、また本発明の実施形態であるハイパーテキスト変換部24が配置されている。
ハイパーテキスト変換部24にはハイパーテキスト変換プログラムの実行により実現される機能として、処理開始箇所決定部32、処理範囲決定部34、リンク先ハイパーテキスト取得部36、リンク先アンカー情報抽出部38、元アンカー影響範囲決定部40、文字列比較部42、新規アンカー情報生成部44、新規アンカー付与部46及び再帰的処理部48が設けられている。
処理開始箇所決定部32は、処理対象とする元ハイパーテキスト中の処理開始位置を決定する。処理範囲決定部34は、処理開始箇所決定部32で決定された処理開始箇所に基づき、元ハイパーテキスト中の元アンカーを含む処理範囲を決定する。
リンク先ハイパーテキスト取得部36は、処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得する。リンク先アンカー情報抽出部38は、リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアからなるリンク先アンカー情報を抽出する。
元アンカー影響範囲決定部40は、元ハイパーテキストに新規アンカーを追加する候補文字列の範囲となる元アンカー影響範囲を決定する。
文字列比較部42は、元アンカー影響範囲に存在する文字列とリンク先アンカー情報抽出部38で抽出したリンク先アンカー情報に存在する文字列とを比較し、元アンカー影響範囲中のマッチ範囲を決定する。
新規アンカー情報生成部44は、文字列比較部42の比較によりマッチしたリンク先アンカー情報のアンカー文字列とペアを組むリンク先URLを新規リンク先URLとし、マッチ範囲と新規リンク先URLとのペアからなる新規アンカー情報を生成する。
新規アンカー付与部46は、新規アンカー情報生成部44で生成した新規アンカー情報の中のマッチ範囲に存在する元ハイパーテキストの文字列(マッチ範囲文字列)に対して、新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して、元ハイパーテキストを新ハイパーテキストに変換する。
再帰的処理部48は、新規アンカー情報生成部44により生成された新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、処理開始箇所決定部32から新規アンカー付与部46に至る一連の処理を再帰的に実行し、再帰的処理の回数により逐次、元ハイパーテキストに新規アンカーを付与した新ハイパーテキストに変換する。この再帰的処理部48による再帰的処理は、新規アンカーが生成されなくなるまで繰り返すか、あるいは予め定めた深さ(回数)まで繰り返す。
図3は本発明のハイパーテキスト変換プログラムが実行されるコンピュータのハードウェア環境を示したブロック図であり、図1の場合にはプロキシキャッシュサーバ14を構成するコンピュータが対応する。
図3において、コンピュータのハードウェア環境は、CPU50を備え、CPU50のバス52に対し、RAM54、ROM56、ハードディスクドライブ58、キーボード62,マウス64,ディスプレイ66を接続するデバイスインタフェース60、更にネットワークアダプタ68を備えている。
ハードディスクドライブ58には本実施形態のハイパーテキスト変換プログラムが格納されている。コンピュータを起動すると、BIOSの動作によるブートアップ処理により、ハードディスクドライブ58からRAM54にOSが読出し配置された後、OSの実行でハードディスクドライブ58からRAM54に本実施形態のハイパーテキスト変換プログラムが読出し配置され、CPU50により実行される。
次に図2に示したハイパーテキスト変換部24の各機能を具体的に説明する。図4は本実施形態で処理対象とするハイパーテキストの説明図である。図4(A)はブラウザに画面表示される処理対象となるハイパーテキストであり、本実施形態にあっては元ハイパーテキスト70としている。元ハイパーテキスト70にはアンカー文字列を「ABCのページ」とした元アンカー72が存在している。
図4(B)は、図4(A)の元ハイパーテキスト70における元アンカー72の部分をソース文として示している。このソース文において、元アンカー72は、リンク先URLとして「http://10.20.30.40/abc/」が記述されている。
図2の本実施形態によるハイパーテキスト変換部24にあっては、まず処理開始箇所決定部32により図4の元ハイパーテキスト70について処理開始箇所を決定する。この処理開始箇所の決定は図5に示すパターン定義テーブル76を使用して行われる。
図5のパターン定義テーブル76には、定義パターンとして「辿って下さい」、「辿ってください」、「→」、「進んでください」といったハイパーリンクの存在を示唆するような文字列が予め登録されている。図2の処理開始箇所決定部32は、パターン定義テーブル76に登録されているパターン群により図4の元ハイパーテキスト70とのマッチングを行い、例えばパターン「辿って下さい」に対応した処理開始箇所74を決定する。
処理開始箇所決定部32による処理は、図5のパターン定義テーブル76以外に、適宜の基準を用いた部分一致や正規表現によるマッチングなどの手法であってもよい。
図4において、処理開始箇所74の「辿って下さい」が決定されると、処理開始箇所74を示す範囲情報として「From:320,To:326」を取得する。なお「From:320,To:326」は「元ハイパーテキスト70の先頭から320字〜326字の範囲」を意味している。
ここでは範囲情報を「From:320,To:326」のようにFromとToを用いて表現したが、元ハイパーテキスト中の範囲が分かる方法であれば別の形式で表現してもよい。以降に述べる処理範囲や元アンカー影響範囲の範囲情報についても同様に別の形式で表現してもよい。
続いて図2の処理範囲決定部34が、図4の処理開始箇所74の周辺を処理範囲に決定する。本実施形態にあっては、図6に示すように、句点を1文の区切り記号として処理開始箇所を含む1文を処理範囲78に決定している。この図6における処理範囲78の範囲情報としては「From:258,To:327」を取得する。
本実施形態にあっては、処理開始箇所74を含む1文を処理範囲78と決定したが、これ以外にソース文で使用されている
<h1>,</h1>,<h2>,</h2>, <h3>,</h3>,<p>,<td>,</td>,<li>,</li>
を区切り記号として、元アンカー72を含む処理範囲に決定してもよいし、元ハイパーテキスト全体を処理範囲に決定してもよい。更に処理範囲決定部34で使用する図5のパターン定義テーブル76のパターン内容に応じ、処理範囲を変えるようにしてもよい。
次に図2のリンク先ハイパーテキスト取得部36が処理範囲決定部34で決定した図6の処理範囲78から元アンカー72を取り出し、リンク先ハイパーテキストを取得する。図6において、元アンカー72のURL「http://10.20.30.40/abc/」で示されるリンク先のハイパーテキストを取得する。
図7は図6の元アンカー72を取り出して取得したリンク先ハイパーテキスト80を示している。図7(A)のリンク先ハイパーテキスト80には、リンク先アンカー82,84,86の3つが存在している。図7(B)はリンク先アンカー82,84,86をソース文として示している。
次に図2のリンク先アンカー情報抽出部38が図7(B)のリンク先ハイパーテキスト80におけるリンク先アンカー82,84,86のソース文を解析し、図8に示すリンク先アンカー情報テーブル88を生成する。リンク先アンカー情報テーブル88は、リンク先アンカーの文字列90とリンク先アンカーのリンク先URL92とのペアから成るリンク先アンカー情報で構成される。図7(B)のリンク先アンカー82,84,86の場合、それぞれリンク先アンカーの文字列90として「会社情報」、「製品情報」、「ダウンロード」が抽出され、これらの文字列に対応して、リンク先アンカーのリンク先URL92としてソース文に記述されたURLが抽出される。
次に図2の元アンカー影響範囲決定部40が図8のリンク先アンカー情報テーブル88に登録されたリンク先アンカー情報を利用し、図4の元ハイパーテキスト70に新規アンカーを追加する候補となる文字列の範囲である元アンカー影響範囲を決定する。
本実施形態にあっては、元アンカー影響範囲として句点を1文の区切り記号として、元アンカーを含む1文を決定する。これは図6に示した処理範囲78と同じになることから、元アンカー影響範囲を示す範囲情報として「From:258,To:327」を取得する。
ここで本実施形態にあっては、元範囲を含む1文を元アンカー影響範囲として決定しているが、これ以外にソース文に使用されている
<h1>,</h1>,<h2>,</h2>, <h3>,</h3>,<p>,<td>,</td>,<li>,</li>
を区切り記号として、元アンカーを含む1ブロックを元アンカー影響範囲に決定してもよいし、元ハイパーテキスト全体を元アンカー影響範囲に決定してもよい。
次に図2の文字列比較部42が図6の処理範囲78と同じ範囲に決定した元アンカー影響範囲と、図8のリンク先アンカー情報テーブル88に登録したリンク先アンカー情報の中のリンク先アンカーの文字列90のそれぞれとを比較する。本実施形態にあっては、文字列の完全一致で比較する。
この比較処理により、図8のリンク先アンカー情報テーブル88の2番目の文字列「製品情報」が元ハイパーテキストの元アンカー影響範囲にマッチし、図4の元ハイパーテキスト70における文字列「製品情報」の範囲情報「From:306,To:310」をマッチ範囲として取得する。
本実施形態では文字列比較部42による比較の基準として文字列の完全一致を用いたが、前方一致、後方一致、部分一致など適宜の比較基準を用いた部分一致などの他の比較方法であってもよい。
次に図2の新規アンカー情報生成部44が図9に示す新規アンカー情報テーブル94を生成する。新規アンカー情報テーブル94は、マッチ範囲96と新規リンク先URL98及び新規アンカー文字列100から成る新規アンカー情報で構成されている。なお、本実施形態では説明を容易にするため、更に新規アンカー文字列100を配置しているか、これは後述する新規アンカー付与部46により生成される文字列である。
新規アンカー情報テーブル94のマッチ範囲96としては、文字列比較部42で比較された元ハイパーテキスト中の文字列「製品情報」の範囲を示すマッチ範囲である「From:306,To:310」を格納する。新規リンク先URL98としては、図8のリンク先アンカー情報テーブル88のリンク先アンカーの文字列90における「製品情報」に対応する、リンク先アンカーリンク先URL92を格納する。
次に図2の新規アンカー付与部46が図9に示した新規アンカー情報テーブル94に登録した新規アンカー情報に基づき、図4の元ハイパーテキスト70を変換して、図10に示す新ハイパーテキスト70−1を生成する。図10(A)は生成された新ハイパーテキスト70−1であり、図10(B)はそのアンカー部分をソース文で示している。
図10(A)の新ハイパーテキスト70−1にあっては、図9の新規アンカー情報テーブル94に登録した新規アンカー情報に基づき、「製品情報」の部分に新規アンカー102が付与される。
具体的には、図10(B)の新規アンカー102に示すように、図9の新規アンカー情報テーブル94におけるマッチ範囲96となる「From:306,To:310」の文字列「製品情報」を、図9の新規アンカー情報テーブル94に示すように、新規アンカー文字列100として生成し、この新規アンカー文字列「製品情報」と新規リンク先URL98のURLを含むソース文が新規アンカー102として付与されている。
次に図2の再帰的処理部48が、図10のように生成された新ハイパーテキスト70−1における新規アンカー102を元アンカーと見なし(これは図9の新規アンカー情報を元アンカーと見なすことと同等)、処理開始箇所決定部32に戻って、新たな元アンカー「製品情報」について同様なハイパーテキスト変換処理を繰り返す。
このような再帰的処理部48による処理の繰り返しで、元ハイパーテキストの元アンカーを含む処理範囲につき、次々とリンクを辿りながら元ハイパーテキストの処理範囲の文脈に関連するリンク先のアンカー情報が、リンクが切れるまで、予め定めた回数に達するまで、あるいは別サイトへのリンクであるかどうか等の予め定めた条件に合致するまで繰り返し付与されることになる。
本実施形態においては、新規アンカー付与部46において繰り返しごとに新ハイパーテキストを生成するが、新規アンカー情報テーブル146を繰り返しごとに更新していき、再帰的処理部48において繰り返しが終了した時点で最終的な新ハイパーテキストを生成するようにしてもよい。
図2の新規アンカー付与部46の新規アンカー付与部46は予め定めた規則に従って新規アンカー文字列を生成する。この生成規則には例えば次のものがある。
(1)元ハイパーテキスト中のマッチ範囲の文字列を新規アンカー文字列として生成する。
(2)元ハイパーテキスト中の元アンカー文字列とマッチ範囲の文字列とを組み合わせた組合せ文字列を、新規アンカー文字列として生成する。
生成規則(1)は、図9,図10に示した場合であり、元ハイパーテキスト70中のマッチ範囲の文字列「製品情報」をそのまま新規アンカー文字列として生成する。
生成規則(2)は更に次の生成規則に分かれる。
(2−1)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を新規アンカー文字列として生成する。
(2−2)元アンカー文字列に所定の連結記号を介してマッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んで新規アンカー文字列を生成する。
生成規則により生成された文字列の使用方法としては、元ハイパーテキスト中のマッチ範囲の文字列を生成規則により生成された文字列に置換する方法と、元ハイパーテキスト中のマッチ範囲の文字列に前置または後置させる方法とがある。
図11は生成規則(2−1)に基づく新規アンカー文字列の生成を示した説明図である。図11(A)は図2の新規アンカー付与部46で生成される新規アンカー情報テーブル94−1であり、マッチ範囲96及び新規リンク先URL98については図9と同じであるが、新規アンカー文字列100として、生成規則(2−1)に従って、元アンカーの文字列「ABCのページ」とマッチ範囲文字列「製品情報」とを連結記号「:」により組み合わせて新規アンカー文字列「ABCのページ:製品情報」を生成している。
図11(B)は図11(A)の新規アンカー情報テーブル94−1に基づいて生成された新ハイパーテキスト70−2の説明図であり、図11(C)にアンカー部分をソース文として示しており、元ハイパーテキスト中のマッチ範囲の文字列「製品情報」が新規アンカー文字列「ABCのページ:製品情報」に置換され、新規アンカー文字列「ABCのページ:製品情報」による新規アンカー102−1が付与されている。
このように新規アンカー文字列を元アンカー文字列とマッチ範囲の文字列と組み合わせることで、元アンカーとリンク先との文脈の関連性をアンカー文字列として示すことができる。
図12は生成規則(2−2)に基づく新規アンカー文字列の生成を示した説明図である。図12(A)は図2の新規アンカー付与部46で生成される新規アンカー情報テーブル94−2であり、マッチ範囲96及び新規リンク先URL98については図9と同じであるが、新規アンカー文字列100として、生成規則(2−2)に従って、元アンカーの文字列「ABCのページ」とマッチ範囲文字列「製品情報」とを連結記号「:」により組み合わせ、更に全体を括弧の区切り記号で囲んだ新規アンカー文字列「(ABCのページ:製品情報)」を生成している。
図12(B)は図12の新規アンカー情報テーブル94−2に基づいて生成された新ハイパーテキスト70−3であり、図12(C)はアンカー部分をソース文で示しており、
元ハイパーテキスト中のマッチ範囲の文字列「製品情報」に新規アンカー文字列「ABCのページ:製品情報」が後置され、新規アンカー文字列「ABCのページ:製品情報」による新規アンカー102−2が付与されている。
なお、新規アンカー文字列の生成規則としては、上記の生成規則に限定されず、元ハイパーテキストの元アンカーを含む適宜の処理範囲の文脈に関連するリンク先ハイパーテキストとの関連を示す文字列を生成して配置することができる。
図13は図2の再帰的処理部48により取得されたリンク先ハイパーテキストの説明図である。再帰的処理部48にあっては、1回目の処理で新規アンカー情報生成部44により図9に示した新規アンカー情報テーブル94の登録内容が得られていることから、このテーブル登録された新規アンカー情報を元アンカーと見なし、この元アンカーの新規アンカー情報における新規リンク先URLにより図13(A)のリンク先ハイパーテキスト104を取得している。
この再帰的処理により取得されたリンク先ハイパーテキスト104にはリンク先アンカー106,108,110の3つが含まれている。図13(B)はリンク先ハイパーテキスト104のリンク先アンカー106,108,110の部分をソース文で示している。
続いて再帰的処理により取得されたリンク先ハイパーテキスト104におけるリンク先アンカー106,108,110のソース文につき、図8に示したと同様なリンク先アンカー情報テーブル88を、リンク先アンカーの文字列「デスクトップPC」、「ノートPC」、「周辺機器」について生成し、図4の元ハイパーテキスト70における処理範囲の文字列比較でマッチ範囲として「周辺機器」の範囲が取得され、その結果、「周辺機器」をマッチ範囲として、図13の「周辺機器」に対応したリンク先アンカー110に示すリンク先URLとのペアからなる図9の新規アンカー情報テーブル92と同様な新規アンカー情報が得られ、最終的に図14に示す新ハイパーテキスト70−4が生成される。
図14(A)の新ハイパーテキスト70−4にあっては、1回目の処理で得られた新規アンカー102に続いて、2回目の処理で「周辺機器」に新規アンカー112が設定される。図14(B)は新ハイパーテキスト70−4のアンカーをソース文で示しており、2回目の処理で得られた新規アンカー112にあっては、図13(B)の「周辺機器」のリンク先アンカーのURLがリンク先として記述されている。
図15は元ハイパーテキストの処理範囲に2つの元アンカーが存在する場合の本実施形態によるハイパーテキスト変換処理の説明図である。
図15において、元ハイパーテキスト114にあっては、処理範囲115の中に元アンカー116と118の2つが存在している。このような処理範囲115について図2のハイパーテキスト変換部24による処理を行った場合、元アンカー116である「DEFのページ」から取得されたリンク先ハイパーテキストと、元アンカー118の「ABCのページ」から取得されたリンク先ハイパーテキストにつき、生成された新規アンカー情報のマッチ範囲120が共に、処理範囲115の中の「製品情報」となる場合がある。
このように2つの元アンカー116,118から得られた新規アンカー情報のマッチ範囲が同じになった場合には、マッチ範囲120に対する元アンカー116,118の距離を求め、距離の近い順に優先度を設定し、優先度の最も高い元アンカー118のリンク先ハイパーテキストから得られた新規アンカー情報に基づく新規アンカーを付与する。
なお、本実施形態においては優先度の決定にマッチ範囲に対する元アンカーの距離を用いたが、元ハイパーテキストのURLと新規リンク先URLの類似度等他の基準を優先度に用いてもよい。
図16は図15の2つの元アンカー116,118のリンク先ハイパーテキストのそれぞれから生成された新規アンカー情報を登録した新規アンカー情報テーブル122である。新規アンカー情報テーブル122において、1行目が元アンカー116に対応した新規アンカー情報であり、2行目が次の元アンカー118に対応した新規アンカー情報であり、両者はマッチ範囲124が同じ「である「From:306,To:310」となっている。
そこで、図15の元ハイパーテキスト114において、マッチ範囲120に対し距離の近い元アンカー118に対応した2行目に最も優先度の高い優先度=1を設定し、距離の遠い元アンカー116については優先度=2を設定している。
このようにマッチ範囲が同じ2つの新規アンカー情報が生成された場合には、図17の新ハイパーテキスト114−1に示すように、新規アンカー情報テーブル122における優先度の高い2行目の新規アンカー情報により、マッチ範囲である「製品情報」に対し優先度=1となる新規リンク先URL「http://10.20.30.40/abc/products/index.html」を記述した新規アンカー120を付与する。なお、この場合は、生成規則(1)による新規アンカー文字列を例にとっている。
図18は図15〜図17に示したように、元ハイパーテキストの処理範囲に複数の元アンカーが存在して、これらの元アンカーのリンク先ハイパーテキストから同じマッチ範囲の新規アンカー情報が複数得られた場合の新規アンカー群の付与のパターンを示している。
単一のマッチ範囲に対して複数の新規アンカーを付与するには、生成規則(1),(2−1)又は(2−2)により生成された新規アンカー文字列それぞれにつき新規アンカーを付与し、それらを順に並べて、マッチ範囲の文字列と置換したり、あるいはマッチ範囲の文字列に前置又は後置させたりすることにより行ってもよいし、別画面に複数の新規アンカーをメニューとして表示する等他の方法により行ってもよい。
図18図では、新規アンカー情報テーブル122について、同じマッチ範囲を持つ4つの新規アンカー情報が得られた場合を例にとっている。図18(A)のパターンにあっては、新規アンカー群220−1として、マッチ範囲文字列222に対し、生成された4つの新規アンカー224−1〜224−4をすべて付与している。この場合、4つの新規アンカー224−1〜224−4については優先度の設定は行われず、例えば生成順に単に並べている。
図18(B)〜(D)は、生成した4つの新規アンカー224−1〜224−4につき、マッチ範囲文字列から元アンカーまでの距離に応じて優先度を1位から4位までP1〜P4として付与した場合である。
図18(B)は、最も高い優先度P1の新規アンカー224−1をマッチ範囲文字列222に付与した新規アンカー群220−2である。
図18(C)の新規アンカー群220−3は、4つの新規アンカー224−1〜224−4を優先度P1〜P4の順番に並べてマッチ範囲文字列222に付与している。
図18(D)の新規アンカー群220−4は、予め定めた閾値以上の優先度例えばP3以上の優先度の新規アンカー224−1〜224−3を優先度順に並べてマッチ範囲文字列222に加えている。
更に図18(E)の新規アンカー群220−5は、予め定めた数の新規アンカー例えば2つまでの新規アンカー224−1〜224−2を優先度順に並べて、マッチ範囲文字列222に付与している。
このように、マッチ範囲が同一となる複数のアンカー情報が生成された場合の新ハイパーテキストへの変換は、図18(A)〜(E)のいずれかの規則に従って元ハイパーテキストに付与して新ハイパーテキストに変換すればよい。
図19は本実施形態によるハイパーテキスト変換処理を示したフローチャートであり、図2を参照して説明すると次のようになる。
図19において、ハイパーテキスト変換処理は、ステップS1で例えばプロキシ処理部30によりクライアント側からの閲覧要求の代行処理で取得されたハイパーテキストを読み込み、ステップS2で、処理箇所決定部32で例えば図5に示したパターン定義テーブル76の登録パターンとの完全一致により処理開始箇所を決定する。
次にステップS3で、処理範囲決定部34により処理開始箇所を含む例えば句点を区切り記号として処理範囲を決定する。続いてステップS4で、リンク先ハイパーテキスト取得部36が処理範囲に存在する元アンカーを1つ選択し、リンク先ハイパーテキストを取得する。
続いてステップS5で、リンク先アンカー情報抽出部38がリンク先ハイパーテキストに存在するリンク先アンカーのソース文の解析により図8のリンク先アンカー情報テーブル88に示したようなリンク先アンカー情報を抽出する。続いてステップS6で、元アンカー影響範囲決定部40が、リンク先アンカー情報を利用して元ハイパーテキストに新規アンカーを追加する候補となる文字列の範囲である、元アンカー影響範囲を決定する。
続いてステップS7で、文字列比較部42が元アンカー影響範囲とリンク先アンカー情報の中のアンカー文字列とを比較し、例えば文字列の完全一致により得られた元ハイパーテキストの中の文字列をマッチ範囲として取得する。
続いてステップS8で、新規アンカー情報生成部44がマッチ範囲とリンク先ハイパーテキストのリンク先URLのペアである図9の新規アンカー情報テーブル94に示すような新規アンカー情報を生成する。
続いてステップS9で元ハイパーテキストの処理範囲に未処理の元アンカーがあるか否かチェックし、未処理の元アンカーがある場合にはステップS4に進み、次の元アンカーにつきステップS4からの処理を繰り返す。したがって、ステップS9の新規アンカー情報は元アンカーごとに生成されることになる。
続いてステップS9で未処理の元アンカーがなくなった場合には、ステップS10に進み、生成されている新規アンカー情報の中でマッチ範囲が同じ複数の新規リンク先URLを持つ新規アンカー情報が存在するか否か判別する。同じマッチ範囲の新規リンク先URLが一つであればステップS12に進み、複数あった場合にはステップS11に進み、例えばマッチ範囲の文字列に対する元アンカーまでの距離に基づいた優先度を新規リンク先URLに設定する。続いてステップS12で新規アンカー情報に基づく新規アンカーを元ハイパーテキストに付与して新規ハイパーテキストを生成する。
続いてステップS13に進み、処理モードとして再帰的処理が設定されていれば、ステップS14で新ハイパーテキストにおける新規アンカー、具体的には新規アンカーに対応した新規アンカー情報を元アンカーに設定した後、ステップS2に戻り、新たに設定した元アンカーを対象に同様な処理を繰り返す。
ステップS13で再帰的処理がオフされているか、再帰的処理の回数が予め定めた回数に達したか、その他の予め定めた条件に合致したか、更には元アンカーに続いて新規アンカーの付与が行われなかった場合には、一連の処理を終了する。
ここで、図1のプロキシキャッシュサーバ14に本実施形態のハイパーテキスト変換部24を設けた場合、図2のリンク先ハイパーテキスト取得部36により取得したリンク先ハイパーテキストを有効期限をつけてキャッシュ26に保存し、またハイパーテキスト変換部24で生成された新ハイパーテキストについても、有効期限をつけてキャッシュ26に保存する。
この結果、クライアントからの元ハイパーテキストの閲覧要求時に、対応する新ハイパーテキストがキャッシュ26に存在すれば、本実施形態のハイパーテキスト変換処理を実行することなく、キャッシュ26に保存している新ハイパーテキストをクライアントに提供し、したがって、プロキシキャッシュサーバ14の処理負担を軽減し、またクライアントのレスポンス時間を短縮する。
図20は本発明の他の実施形態の処理となる特殊な元ハイパーテキストを示した説明図である。
図20(A)の元ハイパーテキスト130はタイトルが「更新履歴」であり、元アンカー132は「トップページに戻る」となっている。図20(B)は元ハイパーテキスト130のソース文を示している。
この図20(A)に示す元ハイパーテキスト130のような特殊なページの判定は、例えばタイトルについて
(1)更新情報
(2)新着情報
といったタイトルパターンを予め定めておき、このタイトルパターンに照合するページを特殊ページとして判定する。
特殊ページと判定した場合には、予め定義したアンカー条件で元アンカーを決定する。
この元アンカーを決定するためのアンカー定義条件は
(1)トップページ
(2)TOP
(3)ホームページ
などを設定しておく。更に図20の判定された特殊ページにおける元アンカー影響範囲は元ハイパーテキスト130全体とする。
この特殊ページに対するハイパーテキスト変換処理は、例えば元ハイパーテキス中に書かれた情報がトップページからのリンクを辿るようなことを示唆している場合に有効である。
図2のハイパーテキスト変換部24の処理開始箇所決定部32及び処理範囲決定部34は、図20のような特殊ページについて、元ハイパーテキスト130全体を処理範囲とし、リンク先ハイパーテキスト取得部36により元アンカー132のURLにより、例えば図21(A)に示すトップページとなるリンク先ハイパーテキスト134を取得する。このトップページとなるリンク先ハイパーテキスト134には、リンク先アンカー136として「日記」、またリンク先アンカー138として「写真館」が設定されている。図21(B)はリンク先ハイパーテキスト134をソース文で示している。
次に図2の文字列比較部42が、図22のリンク先アンカー情報テーブル140のリンク先アンカーの文字列142と、図20の元ハイパーテキスト130の文字列を比較し、「日記」及び「写真館」がマッチする。その結果「日記」の範囲情報「From:541,To:542」と「写真館」の範囲情報「From:515,To:517」とをマッチ範囲として取得する。
次に図2の新規アンカー情報生成部44が図23に示す新規アンカー情報テーブル146を生成する。図9の新規アンカー情報テーブル94の生成と同様に、各マッチ範囲148に対して、図22のリンク先アンカー情報テーブル140から得られるリンク先アンカーのリンク先URL144を新規リンク先URL150として、新規アンカー情報テーブル146に格納する。説明の便宜上、図9と同様に図23には新規アンカー文字列152を配置している。
続いて再帰的処理部48により、図23の新規アンカー情報テーブル146の例えば「写真館」に対応した新規アンカー情報を元アンカーとして、図2の処理開始箇所決定部32からの処理を繰り返し、図22の「写真館」に対応したリンク先URLにより、図24(A)のリンク先ハイパーテキスト154を取得する。
この2回目の処理で取得したリンク先ハイパーテキスト154には、リンク先アンカー156として「花の写真集」とリンク先アンカー158として「昆虫の写真集」が設定されている。
図24(B)は2回目の処理におけるリンク先ハイパーテキスト154のソース文である。このソース文を解析すると、図25のリンク先アンカー情報テーブル160が得られる。
そこで、図25のリンク先アンカー情報テーブル160に登録している2つのリンク先アンカー情報の文字列162の「花の写真集」、「昆虫の写真集」につき、図20の元ハイパーテキスト130との文字列比較を行うと、「花の写真集」について文字列完全一致が得られることで、これをマッチ範囲とし、リンク先アンカー情報テーブル160の「花の写真集」のリンク先URL164を新規リンク先URL170とした図26の新規アンカー情報テーブル166を生成する。
図27は図23の新規アンカー情報テーブル146及び図26の新規アンカー情報テーブル166により、新規アンカーを図20の元ハイパーテキスト130に付与して変換した新規ハイパーテキスト130−1を示している。
図27(A)の新ハイパーテキスト130−1にあっては、図23の新規アンカー情報テーブル146の2つの新規アンカー情報から「写真館」について新規アンカー174が付与され、また「日記」につき新規アンカー176が付与される。更に図26の新規アンカー情報テーブル166の新規アンカー情報から「花の写真集」につき新規アンカー178が付与される。
図27(B)は新規ハイパーテキスト130−1のソース文であり、新規アンカー174,176には図23の新規アンカー情報テーブル146の対応する新規リンク先URL150がそれぞれ記述され、また新規アンカー178には図26の新規アンカー情報テーブル166の新規リンク先URL170の登録内容が記述されている。
なお再帰的処理として、この場合には図21(A)のリンク先ハイパーテキスト134のリンク先アンカー138の「写真館」から得られるリンク先ハイパーテキストを対象とするが、同様にリンク先アンカー136の「日記」についても再帰的処理を行うことで、リンク先ハイパーテキストから関連する日記に関するリンク先の新規アンカー情報を生成して新規アンカーを付与した新ハイパーテキストを生成できる。
図28は本発明のハイパーテキスト変換処理をクライアントで実行するシステム構成のブロック図である。図28において、クライアント18がブラウザ22によりインターネット12を介してサーバ10−1〜10−4のウェブページ20−1〜20−4にアクセスしてハイパーテキストを取得して閲覧することができる。
本実施形態にあっては、クライアント18に図2のプロキシキャッシュサーバ14に設けたと同じ機能構成を持つハイパーテキスト変換部24を設けている。このため、図28のシステムにあっては、クライアント18のブラウザ22で任意のウェブページのテキストページを閲覧した際に、サーバ側から受信したハイパーテキストを元ハイパーテキストとして、本実施形態によるハイパーテキスト変換処理が実行されることになる。
なお、図28はクライアント18をインターネット12に直接接続しているが、図1のように、プロキシキャッシュサーバ14を介してクライアントをインターネットに接続しているシステムで各クライアントに本実施形態のハイパーテキスト変換部24を設けた場合、図2のリンク先ハイパーテキスト取得部36により取得したリンク先ハイパーテキストを有効期限をつけてキャッシュ26に保存する。
この場合は、その後、同じ元ハイパーテキストの閲覧要求に伴うハイパーテキスト変換処理がクライアントで実行された場合、その中のリンク先ハイパーテキスト取得部36の処理として、クライアントが要求したリンク先ハイパーテキストがキャッシュ26に存在すれば、インターネット上のサーバからリンク先ハイパーテキストを取得することなく、キャッシュ26に保存しているリンク先ハイパーテキストをクライアントに提供することができる。
図29は本発明のハイパーテキスト変換処理をウェブサーバで実行するシステム構成のブロック図である。図28において、サーバ10−1〜10−4のうち、サーバ10−1にはウェブページに加え、図1のプロキシキャッシュサーバ14に設けたと同じ機能構成の本実施形態のハイパーテキスト変換部24が設けられている。
このため、クライアント18−1〜18−4のブラウザ22−1〜22−4のいずれかによるウェブページ20−1の閲覧要求をサーバ10−1で受信した場合、ウェブページから読み出されたハイパーテキストを対象に、本実施形態のハイパーテキスト変換部24による変換処理がサーバ10−1自身で実行され、このハイパーテキスト変換処理により生成された新ハイパーテキストが、閲覧要求を行ったクライアント側に送信されて表示されることになる。
更に本発明によるハイパーテキスト変換部の実施形態として、ハイパーテキストを作成するエディタに本実施形態のハイパーテキスト変換部24を組み合わせ、エディタの支援機能として使用することができる。
即ち、ハイパーテキストのエディタでハイパーテキストを作成した場合、作成後に本実施形態のハイパーテキスト変換部を起動し、作成したオリジナルのハイパーテキストを元ハイパーテキストとして本実施形態のハイパーテキスト変換処理を実行することで、新ハイパーテキストを生成して、自動的にチューニングすることができる。
また本発明は図1のプロキシキャッシュサーバ14、図28のクライアントあるいは図29のサーバで実行されるプログラムを格納した記録媒体を提供する。ここで記録媒体とは、CD−ROM、フロッピィディスク(R)、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブ(HDD)などの記憶装置の他、回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。
また上記の実施形態にあっては、図2のハイパーテキスト変換部24に示したように、処理箇所決定部32、処理範囲決定部34、リンク先ハイパーテキスト36、リンク先アンカー情報抽出部38、元アンカー影響範囲決定部40、文字列比較部42、新規アンカー情報生成部44、新規アンカー付与部46、再帰的処理部48の機能構成を持つものであるが、他の実施形態として新規アンカー付与部46を除いた処理開始箇所決定部32から新規アンカー情報生成部44までの機能構成を持つ実施形態としてもよく、この実施形態についても、新規アンカー情報を元アンカーとして、再帰的処理部48による処理を繰り返すことになる。
即ち、新規アンカー情報生成部44までの処理で新規アンカー情報が生成できれば、その後の元ハイパーテキストに対する新規アンカーの付与による新ハイパーテキストへの変換は別の処理として独立に行うことができ、変換ツールとしては処理開始箇所決定部32から新規アンカー情報生成部44までの処理を含むだけでも、変換プログラム、方法、装置として成立することができる。
なお本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態に示した数値による限定は受けない。

ここで本発明の特徴をまとめて列挙すると次の付記のようになる。

(付記1)(プログラム)
コンピュータに、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を実行させることを特徴とするハイパーテキスト変換プログラム。(1)
(付記2)(新規アンカー付与ステップ)
付記1記載のハイパーテキスト変換プログラムに於いて、前記コンピュータに、更に、
前記新規アンカー情報中の前記マッチ範囲に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを実行させることを特徴とするハイパーテキスト変換プログラム。(2)
(付記3)(新規アンカー文字列その1)
付記2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記マッチ範囲の文字列を前記新規アンカーの新規アンカー文字列とすることを特徴とするハイパーテキスト変換プログラム。(3)
(付記4)(新規アンカー文字列その2)
付記3記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記元アンカー文字列と前記マッチ範囲の文字列とを組み合わせた組合せ文字列を、前記新規アンカーの新規アンカー文字列として生成することを特徴とするハイパーテキスト変換プログラム。
(付記5)(組合せ新規アンカー文字列の具体例)
付記3記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記新規アンカー文字列として、
前記元アンカー文字列に所定の連結記号を介して前記マッチ範囲文字列を組み合わせた文字列、又は
前記元アンカー文字列に所定の連結記号を介して前記マッチ範囲文字列を組み合わせた文字列を、更に、所定の区切り記号で囲んだ文字列、
を生成することを特徴とするハイパーテキスト変換プログラム。
(付記6)(再帰的処理その1)
付記1記載のハイパーテキスト変換プログラムに於いて、更に、前記新規アンカー情報生成ステップにより生成された前記新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、前記処理開始箇所決定ステップ、前記処理範囲決定ステップ、前記リンク先ハイパーテキスト取得ステップ、前記リンク先アンカー情報抽出ステップ、前記アンカー影響範囲決定ステップ、前記文字列比較ステップ、および前記新規アンカー情報生成ステップの処理を再帰的に実行する再帰的処理ステップを備えたことを特徴とするハイパーテキスト変換プログラム。
(付記7)(再帰的処理その2)
付記2記載のハイパーテキスト変換プログラムに於いて、更に、前記新規アンカー情報生成ステップにより生成された前記新規アンカー情報を元ハイパーテキスト中の元アンカーと見なし、前記処理開始箇所決定ステップ、前記処理範囲決定ステップ、前記リンク先ハイパーテキスト取得ステップ、前記リンク先アンカー情報抽出ステップ、前記アンカー影響範囲決定ステップ、前記文字列比較ステップ、前記新規アンカー情報生成ステップおよび前記新規アンカー付与ステップの処理を再帰的に実行する再帰的処理ステップを備えたことを特徴とするハイパーテキスト変換プログラム。
(付記8)(処理開始箇所決定ステップ詳細)
付記1記載のハイパーテキスト変換プログラムに於いて、前記処理開始箇所決定ステップは、前記元ハイパーテキスト中に存在する元アンカー文字列の周辺に存在するリンク張りを示唆する予め定めた文字列パターンと一致する文字列を検索して処理開始箇所に決定することを特徴とするハイパーテキスト変換プログラム。
(付記9)(処理範囲決定ステップ詳細)
付記1記載のハイパーテキスト変換プログラムに於いて、前記処理範囲決定ステップは、前記元ハイパーテキスト中に存在する前記元アンカーの文字列及び前記処理開始箇所を含む句点で区切られた一文、前記元アンカーの文字列及び前記処理開始箇所を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を処理範囲に決定することを特徴とするハイパーテキスト変換プログラム。
(付記10)(元アンカー影響範囲決定詳細)
付記1記載のハイパーテキスト変換プログラムに於いて、前記元アンカー影響範囲決定ステップは、前記元アンカーの文字列を含む句点で区切られた一文、前記元アンカーの文字列を含む所定のブロック区切り記号で区切られたブロック、又は元ハイパーテキスト全体を元アンカー影響範囲に決定することを特徴とするハイパーテキスト変換プログラム。
(付記11)(URL優先度)
付記1記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー情報生成ステップは、前記新規アンカー情報中の同じマッチ範囲に複数の新規リンク先URLが対応する場合、前記複数の新規リンク先URLに優先度を付与することを特徴とするハイパーテキスト変換プログラム。
(付記12)(複数の新規アンカー)
付記2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記新規アンカー情報の同じマッチ範囲に複数の前記新規リンク先URLが対応する場合、前記元ハイパーテキスト中の前記マッチ範囲に対し前記複数の新規リンク先URLに対応した複数の新規アンカーを付与することを特徴とするハイパーテキスト変換プログラム。
(付記13)(上位概念:URL優先度)
付記2記載のハイパーテキスト変換プログラムに於いて、
前記新規アンカー情報生成ステップは、前記新規アンカー情報の同じマッチ範囲に複数の前記新規リンク先URLが対応する場合、前記新規リンク先URLに優先度を付与し、
前記新規アンカー付与ステップは、前記元ハイパーテキスト中の前記マッチ範囲に対し、前記優先度に基づいて、前記複数の新規リンク先URLに対応した複数の新規アンカーを付与することを特徴とするハイパーテキスト変換プログラム。
(付記14)(優先度処理の詳細)
付記13記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、
前記優先度が最も高い新規アンカーを付与する処理、
前記複数の新規アンカーを優先度順に付与する処理、
優先度が予め定めた閾値より高い新規アンカーを付与する処理、又は
優先度順に予め定めた数の新規アンカーを付与する処理、
を実行することを特徴とするハイパーテキスト変換プログラム。
(付記15)(タイトルを元アンカー)
付記1記載のハイパーテキスト変換プログラムに於いて、
前記処理開始箇所決定ステップは、前記元ハイパーテキストのタイトルが予め定義したタイトル条件にマッチする場合には、予め定義したアンカー条件にマッチするアンカーを前記元アンカーとして処理開始箇所を決定し、
前記処理範囲決定ステップは処理範囲を前記元ハイパーテキスト全体に決定することを特徴とするハイパープログラム変換プログラム。
(付記16)(タイトルを元アンカーの詳細)
付記15記載のハイパーテキスト変換プログラムに於いて、前記処理開始箇所決定ステップは、前記タイトルとして更新情報又は新着情報を定義すると共に前記アンカー条件としてTOP、トップページ、ホームページ又はこれらの同義語を定義し、前記TOP、トップページ、ホームページ又はこれらの同義語にマッチするアンカーを元アンカーとすることを特徴とするハイパーテキスト変換プログラム。
(付記17)(クライアント又はサーバによるプログラム実行)
付記1又は2記載のハイパーテキスト変換プログラムにおいて、前記コンピュータは、ネットワーク上のウェブページにアクセスして前記元ハイパーテキストを受信して表示するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、又はクライアントからの閲覧要求に対し前記元ハイパーテキストを送信するウェブサーバであり、
前記クライアント又はプロキシキャッシュサーバは前記元ハイパーテキストを受信した際に前記ハイパーテキスト変換プログラムを実行し、前記サーバは前記元ハイパーテキストを送信する際に前記ハイパーテキスト変換プログラムを実行することを特徴とするハイパーテキスト変換プログラム。
(付記18)(方法)
ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法に於いて、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
を備えたことを特徴とするハイパーテキスト変換方法。(4)
(付記19)(新規アンカー付与ステップその1)
付記18記載のハイパーテキスト変換方法に於いて、更に、前記新規アンカー情報中の前記マッチ範囲に存在する文字列に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを備えたことを特徴とするハイパーテキスト変換方法。
(付記20)(装置)
ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバとして機能するハイパーテキスト変換装置に於いて、
処理対象とする元(original)ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
を備えたことを特徴とするハイパーテキスト変換装置。(5)
(付記21)(新規アンカー付与部その1)
付記20記載のハイパーテキスト変換装置に於いて、更に、前記新規アンカー情報中の前記マッチ範囲に存在する元ハイパーテキストの文字列に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与部を備えたことを特徴とするハイパーテキスト変換装置。
本発明のハイパーテキスト変換処理が適用されるシステム構成のブロック図 本発明のハイパーテキスト変換機能を備えたプロキシキャッシュサーバの実施形態を示したブロック図 本発明のハイパーテキスト変換プログラムが実行されるコンピュータのハードウェア環境を示したブロック図 本実施形態で処理対象とするハイパーテキストの説明図 本実施形態で処理開始位置の決定に使用するパターン定義テーブルの説明図 本実施形態で決定した処理範囲の説明図 本実施形態で元アンカーの操作で取得されるリンク先ハイパーテキストの説明図 本実施形態でリンク先ハイパーテキストから生成されたリンク先アンカー情報テーブルの説明図 本実施形態で生成された新規アンカー情報テーブルの説明図 本実施形態で新規アンカーを付与して変換した新ハイパーテキストの説明図 元アンカー文字列とマッチ範囲文字列を組み合わせた新規アンカー文字列を生成して新規アンカーを付与する本実施形態の説明図 元アンカー文字列とマッチ範囲文字列を組み合わせた新規アンカー文字列を生成して新規アンカーを付与する別の本実施形態の説明図 本実施形態の再帰的処理により取得されたリンク先ハイパーテキストの説明図 図13のリンク先ハイパーテキストから生成された新アンカーを付与した新ハイパーテキストの説明図 処理範囲に2つの元アンカーが存在する元ハイパーテキストの説明図 図15の2つの元アンカーのリンク先ハイパーテキストから生成された新規アンカー情報テーブルの説明図 図16の新規アンカー情報テーブルから優先度に応じて新規アンカーを付与した新ハイパーテキストの説明図 新規アンカー情報テーブルにマッチ範囲を同一とする複数の新規リンク先URLが存在する場合の新規アンカー群の付与方法を示した説明図 本実施形態によるハイパーテキスト変換処理を示したフローチャート 本発明の他の実施形態となる特殊な元ハイパーテキストを示した説明図 図20の元アンカーから取得されたトップページであるリンク先ハイパーテキストの説明図 図20のリンク先ハイパーテキストから生成されたリンク先アンカー情報テーブルの説明図 図22のリンク先アンカー情報テーブルから生成された新規アンカー情報テーブルの説明図 図21の「写真館」を元アンカーとして取得されたリンク先ハイパーテキストの説明図 図24のリンク先ハイパーテキストから生成されたリンク先アンカー情報テーブルの説明図 図25のリンク先アンカー情報テーブルから生成された新規アンカー情報テーブルの説明図 図23と図26の新規アンカー情報から新規アンカーを付与した新ハイパーテキストの説明図 本発明のハイパーテキスト変換処理をクライアントで実行するシステム構成のブロック図 本発明のハイパーテキスト変換処理をウェブサーバで実行するシステム構成のブロック図
符号の説明
10−1〜10−4:サーバ
12:インターネット
14:プロキシキャッシュサーバ
16:LAN
18−1〜18−4,18:クライアント
20−12〜20−4:ウェブページ
22−1〜22−4,22:ブラウザ
24:ハイパーテキスト変換部
26:キャッシュ
28:通信制御部
30:プロキシ処理部
32:処理開始箇所決定部
34:処理範囲決定部
36:リンク先ハイパーテキスト取得部
38:リンク先アンカー情報抽出部
40:元アンカー影響範囲決定部
42:文字列比較部
44:新規アンカー情報生成部
46:新規アンカー付与部
48:再帰的処理部
50:CPU
52:バス
54:RAM
56:ROM
58:ハードディスクドライブ
60:デバイスインタフェース
62:キーボード
64:マウス
66:ディスプレイ
68:ネットワークアダプタ
70,114,130:元ハイパーテキスト
70−1〜70−4,114−1,130−1:新ハイパーテキスト
72,116,118,132:元アンカー
74:処理開始箇所
76:パターン定義テーブル
78,115:処理範囲
80,104,134,154:リンク先ハイパーテキスト
82,84,86,106,108,110,136,138,156,158:リンク先アンカー
88,140,160:リンク先アンカー情報テーブル
90,142,162:リンク先アンカーの文字列
92,144,164:リンク先アンカーのリンク先URL
94,94−1,94−2,122,146,166:新規アンカー情報テーブル
96,120,124,148,168:マッチ範囲
98,126,150,170:新規リンク先URL
100,128,152,172:新規アンカー文字列
102,102−1,102−2,112,120,174,176,178,224−1〜224−4:新規アンカー
129:優先度
220−1〜220−5:新規アンカー群
222:マッチ範囲文字列

Claims (5)

  1. コンピュータに、
    処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
    前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
    前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
    前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
    前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
    前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
    前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
    を実行させることを特徴とするハイパーテキスト変換プログラム。
  2. 請求項1記載のハイパーテキスト変換プログラムに於いて、前記コンピュータに、更に、
    前記新規アンカー情報中の前記マッチ範囲に対して、前記新規アンカー情報中の新規リンク先URLを記述した新規アンカーを付与して前記元ハイパーテキストを新ハイパーテキストに変換する新規アンカー付与ステップを実行させることを特徴とするハイパーテキスト変換プログラム。
  3. 請求項2記載のハイパーテキスト変換プログラムに於いて、前記新規アンカー付与ステップは、前記マッチ範囲の文字列を前記新規アンカーの新規アンカー文字列とすることを特徴とするハイパーテキスト変換プログラム。
  4. ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバで実行されるハイパーテキスト変換方法に於いて、
    処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定ステップと、
    前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定ステップと、
    前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得ステップと、
    前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出ステップと、
    前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定ステップと、
    前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較ステップと、
    前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成ステップと、
    を備えたことを特徴とするハイパーテキスト変換方法。
  5. ウェブページを閲覧するクライアント、前記クライアントの処理を代行するプロキシキャッシュサーバ、または前記クライアントの閲覧要求に対しハイパーテキストを送信するウェブサーバとして機能するハイパーテキスト変換装置に於いて、
    処理対象とする元ハイパーテキスト中の処理開始箇所を決定する処理開始箇所決定部と、
    前記処理開始箇所に基づき前記元ハイパーテキスト中での元アンカーを含む処理範囲を決定する処理範囲決定部と、
    前記処理範囲に存在する元アンカーのリンク先ハイパーテキストを取得するリンク先ハイパーテキスト取得部と、
    前記リンク先ハイパーテキストからリンク先アンカーの文字列とリンク先URLとのペアから成るリンク先アンカー情報を抽出するリンク先アンカー情報抽出部と、
    前記元ハイパーテキストに新規アンカーを追加する候補文字列範囲となる元アンカー影響範囲を決定する元アンカー影響範囲決定部と、
    前記元アンカー影響範囲に存在する文字列と前記リンク先アンカー情報に存在する前記文字列とを比較し、前記元アンカー影響範囲中のマッチ範囲を決定する文字列比較部と、
    前記文字列比較によりマッチした前記リンク先アンカー情報の前記リンク先文字列とペアを組む前記リンク先URLを新規リンク先URLとし、前記マッチ範囲と前記新規リンク先URLとのペアから成る新規アンカー情報を生成する新規アンカー情報生成部と、
    を備えたことを特徴とするハイパーテキスト変換装置。
JP2006316917A 2006-11-24 2006-11-24 ハイパーテキスト変換プログラム、方法及び装置 Expired - Fee Related JP4915219B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006316917A JP4915219B2 (ja) 2006-11-24 2006-11-24 ハイパーテキスト変換プログラム、方法及び装置
US11/786,721 US7757158B2 (en) 2006-11-24 2007-04-12 Converting hypertext character strings to links by attaching anchors extracted from existing link destination

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006316917A JP4915219B2 (ja) 2006-11-24 2006-11-24 ハイパーテキスト変換プログラム、方法及び装置

Publications (2)

Publication Number Publication Date
JP2008129998A true JP2008129998A (ja) 2008-06-05
JP4915219B2 JP4915219B2 (ja) 2012-04-11

Family

ID=39464971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006316917A Expired - Fee Related JP4915219B2 (ja) 2006-11-24 2006-11-24 ハイパーテキスト変換プログラム、方法及び装置

Country Status (2)

Country Link
US (1) US7757158B2 (ja)
JP (1) JP4915219B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009414A (ja) * 2008-06-27 2010-01-14 Fujitsu Ltd 関連情報登録装置、関連情報登録方法および関連情報登録プログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102331985B (zh) * 2010-07-12 2013-09-25 阿里巴巴集团控股有限公司 网页页面的分片嵌套缓存的处理方法和装置
US9047259B1 (en) * 2010-07-21 2015-06-02 Google Inc. System and method for renaming hyperlinks
US10296158B2 (en) * 2011-12-20 2019-05-21 Oath Inc. Systems and methods involving features of creation/viewing/utilization of information modules such as mixed-media modules
US10346551B2 (en) * 2013-01-24 2019-07-09 New York University Systems, methods and computer-accessible mediums for utilizing pattern matching in stringomes
US10318397B2 (en) 2013-04-15 2019-06-11 Vmware, Inc. Efficient data pattern matching
US9244903B2 (en) * 2013-04-15 2016-01-26 Vmware, Inc. Efficient data pattern matching
CN105095441A (zh) * 2015-07-23 2015-11-25 百度在线网络技术(北京)有限公司 一种信息获取方法及装置
CA2939395A1 (en) * 2016-08-15 2016-10-17 Richard S. Brown Method and device for invoking a search from a text message
US11100186B2 (en) * 2019-05-16 2021-08-24 Vmware, Inc. Automated hyperlinks for draft emails

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256259A (ja) * 2000-03-13 2001-09-21 Omron Corp ハイパーテキスト制御システム
JP2001312520A (ja) * 2001-04-02 2001-11-09 Casio Comput Co Ltd ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0451384B1 (en) * 1990-04-10 1997-09-24 International Business Machines Corporation Hypertext data processing system and method
JPH07325827A (ja) 1994-04-07 1995-12-12 Mitsubishi Electric Corp ハイパーテキスト自動生成装置
US5603025A (en) * 1994-07-29 1997-02-11 Borland International, Inc. Methods for hypertext reporting in a relational database management system
US5794257A (en) * 1995-07-14 1998-08-11 Siemens Corporate Research, Inc. Automatic hyperlinking on multimedia by compiling link specifications
US5745360A (en) * 1995-08-14 1998-04-28 International Business Machines Corp. Dynamic hypertext link converter system and process
US5822539A (en) 1995-12-08 1998-10-13 Sun Microsystems, Inc. System for adding requested document cross references to a document by annotation proxy configured to merge and a directory generator and annotation server
US5761683A (en) * 1996-02-13 1998-06-02 Microtouch Systems, Inc. Techniques for changing the behavior of a link in a hypertext document
WO1997044726A1 (en) * 1996-05-06 1997-11-27 Adobe Systems Incorporated Internet hyperlink drag and drop
US5724595A (en) * 1996-06-19 1998-03-03 Sun Microsystems, Inc. Simple method for creating hypertext links
DE69718669T2 (de) * 1996-10-23 2003-11-27 Access Co., Ltd. Informationsgerät mit automatischer web-lesefunktion
JPH10228473A (ja) * 1997-02-13 1998-08-25 Ricoh Co Ltd 文書画像処理方法、文書画像処理装置および記憶媒体
US6658623B1 (en) * 1997-09-15 2003-12-02 Fuji Xerox Co., Ltd. Displaying in a first document a selectable link to a second document based on a passive query
US6016494A (en) * 1997-11-21 2000-01-18 International Business Machines Corporation Expanding web documents by merging with linked documents
US6574644B2 (en) * 1997-11-26 2003-06-03 Siemens Corporate Research, Inc Automatic capturing of hyperlink specifications for multimedia documents
US6230168B1 (en) * 1997-11-26 2001-05-08 International Business Machines Corp. Method for automatically constructing contexts in a hypertext collection
US6092074A (en) * 1998-02-10 2000-07-18 Connect Innovations, Inc. Dynamic insertion and updating of hypertext links for internet servers
US6748385B1 (en) * 1998-02-10 2004-06-08 National Broadcasting Company, Inc. Dynamic insertion and updating of hypertext links for internet servers
US6122647A (en) * 1998-05-19 2000-09-19 Perspecta, Inc. Dynamic generation of contextual links in hypertext documents
US6295542B1 (en) * 1998-10-02 2001-09-25 National Power Plc Method and apparatus for cross-referencing text
US6772139B1 (en) * 1998-10-05 2004-08-03 Smith, Iii Julius O. Method and apparatus for facilitating use of hypertext links on the world wide web
US6751777B2 (en) * 1998-10-19 2004-06-15 International Business Machines Corporation Multi-target links for navigating between hypertext documents and the like
JP2000163432A (ja) 1998-11-27 2000-06-16 Oki Electric Ind Co Ltd ハイパーテキストのリンク生成システム
US7003719B1 (en) * 1999-01-25 2006-02-21 West Publishing Company, Dba West Group System, method, and software for inserting hyperlinks into documents
US7594166B1 (en) * 1999-05-20 2009-09-22 Microsoft Corporation Dynamic web page behaviors
US6505197B1 (en) * 1999-11-15 2003-01-07 International Business Machines Corporation System and method for automatically and iteratively mining related terms in a document through relations and patterns of occurrences
US7191400B1 (en) * 2000-02-03 2007-03-13 Stanford University Methods for generating and viewing hyperlinked pages
US7418657B2 (en) * 2000-12-12 2008-08-26 Ebay, Inc. Automatically inserting relevant hyperlinks into a webpage
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
US6874019B2 (en) * 2001-03-08 2005-03-29 International Business Machines Corporation Predictive caching and highlighting of web pages
US6990494B2 (en) * 2001-07-27 2006-01-24 International Business Machines Corporation Identifying links of interest in a web page
US20030229857A1 (en) * 2002-06-05 2003-12-11 Fuji Xerox Co., Ltd. Apparatus, method, and computer program product for document manipulation which embeds information in document data
US7840888B2 (en) * 2004-09-16 2010-11-23 Jimmy Jong-Yuan Lin Architecture and methodology of redirection for dynamic new URL links

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001256259A (ja) * 2000-03-13 2001-09-21 Omron Corp ハイパーテキスト制御システム
JP2001312520A (ja) * 2001-04-02 2001-11-09 Casio Comput Co Ltd ドキュメントデータのリンク付け装置、リンク先アドレスの表示/アクセス装置、及びリンク付けされたドキュメントデータの配付装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009414A (ja) * 2008-06-27 2010-01-14 Fujitsu Ltd 関連情報登録装置、関連情報登録方法および関連情報登録プログラム

Also Published As

Publication number Publication date
US20080126400A1 (en) 2008-05-29
US7757158B2 (en) 2010-07-13
JP4915219B2 (ja) 2012-04-11

Similar Documents

Publication Publication Date Title
US10796076B2 (en) Method and system for providing suggested tags associated with a target web page for manipulation by a useroptimal rendering engine
US7757158B2 (en) Converting hypertext character strings to links by attaching anchors extracted from existing link destination
CN101194256B (zh) 具有表意文字和音标字符的语言的自动输入完成的方法和系统
JP5264892B2 (ja) 多言語情報検索
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
US7310633B1 (en) Methods and systems for generating textual information
US11361036B2 (en) Using historical information to improve search across heterogeneous indices
JP2011118652A (ja) 単語の関連キーワードを決定する装置ならびにその動作制御方法およびその動作制御プログラム
JP2011222056A (ja) 検索システム及び検索方法
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
JP2020021455A (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
JP5186165B2 (ja) 組織名抽出装置、方法及びプログラム
JP2001265774A (ja) 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
US20050060291A1 (en) Method and apparatus for searching universal resource identifiers
JP4842921B2 (ja) 検索システムおよびその方法
US20020124056A1 (en) Method and apparatus for modifying a web page
KR100516302B1 (ko) 인터넷 주소의 오타 처리 방법 및 시스템
JP2010079863A (ja) 絞り込み検索サービス提供方法及びプログラム
KR101499685B1 (ko) 키워드 트리 제공 방법
Darie et al. Professional Search Engine Optimization with PHP: A Developer's Guide to SEO
JP2002063203A (ja) 情報検索装置及び方法並びに情報検索プログラムを格納した記録媒体
JP4543818B2 (ja) 情報収集支援システム、情報収集支援方法及び情報収集支援プログラム
KR20220164982A (ko) 커먼 아이디정보의 매칭을 이용한 웹페이지 메모 공유방법
JP2008090523A (ja) コンテンツ作成装置及びコンテンツ作成方法
JP2009070194A (ja) 翻訳者選択方法、翻訳コンテンツ提供サーバ、および翻訳者選択プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees