JP2000510270A

JP2000510270A - 音声による広域情報システム

Info

Publication number: JP2000510270A
Application number: JP10527994A
Authority: JP
Inventors: バーバラ，ダニエル．; ナキュビ，シャミン，エイ．
Original assignee: テルコーディアテクノロジーズインコーポレイテッド
Priority date: 1996-12-19
Filing date: 1997-12-16
Publication date: 2000-08-08
Anticipated expiration: 2017-12-16
Also published as: CA2274126A1; EP0954857A1; JP3138280B2; US5926789A; EP0954857A4; WO1998027542A1

Abstract

(57)【要約】広域情報システムはクライアントと音声データが格納された少なくとも１つのサーバとを含む。少なくともときどきサーバとクライアントとの間に転送接続を確立することにより音声データはサーバからクライアントに選択的に転送される。音声データの転送は、クライアント上に設けられた入力インターフェイスを介して入力されるユーザ選択のコマンドと入力によって制御される。これらのコマンドおよび入力も，クライアントとサーバとの間で少なくともときどき確立される転送接続を介してサーバに転送される。サーバ上の音声データはハイパーオーディオ・リンクによって相互参照で関連付けられたページ・ユニットとして構成される。ページ・ユニットは可聴ディレクトリ情報の周期的に繰り返すディレクトリ・ページを使用することで特徴的に検索可能である。そのような音声を利用したシステムを可能とするためにデータ・プロトコルが定義される。

Description

【発明の詳細な説明】音声による広域情報システム発明の背景発明の分野本発明は、情報を構築したり情報にアクセスするための広域情報システムおよびその実施方法に関する。関連技術の説明：インターネットのワールドワイドウェブ(WWW)部門の人気は、一般にその存在がますます知られるようになるにつれて最近著しく上昇してきた。しかし、その人気と多様性にもかかわらず、WWWにおいて音声情報の果たす役割は目立って小さい。 WWW上での音声の現在の使用法としては、あるWWWサイトから音声ファイル部分をダウンロードすることである。普通、ユーザは全部の音声ファイルが転送されて音声ファイルを聞くことができるまでに、時には長い間、待たなければならない。テキサス・インストルメンツ社（TI）が開発したシステムによればユーザは音声インターフェイスを介してWWWにアクセスすることができ、従来のようにWWWハイパーリンクにアクセスするのにポイント／クリック操作の必要がない。しかしこのシステムにおいてはまだ、表示端末がブラウズしているデータを表示しコマンドの入力を案内することが必要である。TIシステムによれば、ユーザはハイパーリンク名を発声することにより異なるページにジャンプすることができる。前記の従来システムにおいては音声はまだ相当に二次的なものであることが分かる。第一に、WWWページ上の情報の大部分は音声情報ではない。第二に、ユーザはまだ、ナビゲートするためには、例えばTI音声インターフェイスであっても、視覚的なインターフェイスが必要である。後者に関しては、ユーザがコンピュータ等を使用できない場合、あるいは自動車を運転するなど、視覚的注意を必要とすることを行っている場合には、問題となる。このことから、音声は情報の重要な媒体であり続け、広域情報システムにおいて今まで対応していなかった要求を満たすことができると思われる。しかし、電話メニューシステム（例えばボイスメール）等、音声を使用する試みがなされた用途においては、ユーザはメニューリストを覚えておかなければならず、またそのリストがあまりに多くの情報を提供しているので、ユーザがリストを思い出すことは困難あるいは不可能である。発明の概要したがって本発明の目的は、音声を情報の基本媒体として使用するクライアント・サーバ広域情報システム(client-server based wide area information sys tem)を提供することにある。本発明によれば、たまに仮想クライアントとも呼ばれるクライアントは、音声ファイルを再生したり、インターフェイスを介してコマンド入力に応答したり、サーバと交信することによって音声情報の「ページ」を取り出すことができる。クライアントは例えば電話、パソコン、ワークステーション、ラジオ等の任意の数の装置で実現できる。サーバはWWWと同様な音声ページと一般に呼ばれる単位で音声情報を提供する。（後で、オーディオ・ウェブ・ページとディレクトリ・ページの違いについて説明する。）音声ページはディレクトリ・サービスを介してインデックスが付けられる。本発明によれば、普通、検索可能なディレクトリ・ページは周期的にユーザに提示される。一般に各ディレクトリ・レベルはサブディレクトリ・ページへの音声リンクを含んでいる。ディレクトリ・サービスの最後のレベルはそのディレクトリ・サービスで登録された個々の音声ページ（すなわちオーディオ・ウェブ・ページ）を示す。本発明の上記および他の目的および新しい特徴は、添付図面と以下の詳細な説明からより明らかとなるであろう。図面の簡単な説明図１は本発明による音声クライアントを示す。図２は本発明によるディレクトリ・サービスの階層を図式的に示す。図３は循環ディレクトリ・ページのオプション・メニュー「ウインドウ」を示す。図４は本発明で使用可能なバイナリ検索方法を示す。図５はディレクトリ・ページをナビゲートする手順の概念を示す。図６は本発明によるデジタル・ハイパーラジオ・システムを示す。好適実施形態の説明本発明はまず、本システムの基本として音声情報を使用する場合について説明する。しかしこの説明は本発明に関する概念を十分に説明するためにのみおこなうものであり、これらの概念がマルチメディア等の他の形態やそれらを組み合わせた形態にも適用できることは後で述べるように明らかである。図１は本発明によるクライアント・サーバシステムにおける仮想音声クライアントおよびその役割を示す。仮想音声クライアント（ここでは互換的に「クライアント」という）は、ユーザがオーディオ・ウェブ（Audio Web）をナビゲートするための手段である。図１に示すように、クライアントはいくつかの入力およびコマンドを認識できる。例えば、クライアントは最初の５つの基数（１から５）およびSTOP(ストップ停止))、PLAY(プレイ(再生))、FORWARD(フォワード(前送り))、BACK(バック(後送り))、PRESET(リセット)、DELETE(削除)、RETURN(戻り)、およびGO（ゴー）コマンドを認識することができる。図１はクライアントを示し、外見がビデオカセットレコーダのリモコンに似ており、ボタンは前記入力に対応している。しかしこれはひとつの例に過ぎず、クライアントが実際にどのように実現されるかはクライアントを構成する実際の装置による。すなわち図１に示す概念的入力ボタンのひとつをユーザがどのように「押す」かは、クライアントにアクセスするために使用する装置に依存する。例えば、ユーザはその装置として電話、パソコン、ワークステーション、ラジオ等を使用することができる。例えば電話を使った場合、クライアントは電話と計算装置とを接続することによって実現できる。この接続は局所的な（すなわち配線接続された）ものであってもよいし、標準の電話接続を介して電話と通信する計算装置へダイヤルすることによって確立することもできる。ユーザは、各コマンドに対応する電話のキーを押すことによって、コマンドを出す。押されたそれぞれの数字キーに応答して電話が発生する標準トーンは、コンピュータに送られ、コンピュータはそのトーンを適切に（従来の音認識ソフトウェアを介して）認識し、対応するプログラムを起動させ所望のコマンドを実行する。あるいは、ユーザは電話にコマンドを発声する。コンピュータはそれが持つ適切な音声認識ソフトウェア（例えば、限られた語彙を持ち話手に依存しないもの）で認識した発声コマンドを対応するコマンドプログラムに割り当てる。パソコンまたはワークステーションがクライアントを実現するために使われた場合、その入力装置および計算装置はひとつの「パッケージ」で提供される。この場合、ユーザはマウスタイプのコントロール・デバイスと組み合わせたグラフィカル・インターフェイスを使って入力する。以上の例は説明のために示したものであって、本発明のクライアントの実現方法に制限を加えるものではない。例えば、ラジオ・トランシーバの使用について後でより詳しい説明を提供する。考えているオーディオ・ウェブの概要を示すために、ユーザが与える入力とそれに対するクライアントとサーバの動作を次の会話形式のシナリオで示す。シナリオにおいて、ユーザは（キャピトル・レコードから出された）Beatles Anthol ogy（ビートルズ名曲集）に関する情報を探そうとしている。クライアント：オーディオ・ウェブ・ディレクトリ・サーバーにようこそ。あなたにとって興味深い題材を用意しています。マティーニ…マウス…音楽！」ユーザ：停止(仮想クライアント上の停止キーを「押す」または「停止」と発声することによって)。クライアント：「次のいずれかを選択してください。１：音楽、２：海の生き物、３：図書館、４：土地の灌漑、５：凧」ユーザ：１（コマンドを「押す」または発声することによって）。クライアント：＜要求された音声ページに対する適切なサーバに接触する＞サーバ：＜クライアントにその音声ページを送る＞クライアント：「あなたは音楽ディレクトリを選ばれました。ここからあらゆる種類の音楽を入手できます！」バロック＜バロック音楽のサンプルを再生する＞ロック＜ロック・ミュージック・トラックのサンプルを再生する＞」ユーザ：停止。クライアント：「あなたが選びたいものは：１：サンバ、２：ロック、３：ジャズ、４：マンボ、５：ポルカ」ユーザ：２。クライアント：＜要求されたページに対する適切なサーバに接触する＞サーバ：＜クライアントにそのページを送る＞クライアント：「これはロックのページです。今までの偉大なグループの音楽を聴きましよう。ビートルズ、…」ユーザ：停止。クライアント：「あなたが聞きたいのは１：ビートルズ、２…」ユーザ：１。クライアント：「オーディオ・ウェブ・マジカル・ミステリー・ツアーにようこそ！！これらのページにはビートルズ・サウンド・ファイル集が含まれています。最新のビートルズリリースについては新しい名曲集ページをチェックしてください。」ユーザ：停止。クライアント：「次のページを訪れます：１：名曲集、２：ジョン・レノンのページ、３：ポール・マッカートニーのページ、４：ジョージ・ハリソンのページ、５：リンゴ・スターのページ」ユーザ：１。クライアント：＜要求されたページに対する適切なサーバに接触する＞サーバ：＜クライアントにそのページを送る＞クライアント：「＜新しいビートルズ・トラック‘Free as a Bird’の最初の部分が再生され始める＞」したがって、本発明のシステムは以下の機能を必要とする。ユーザは、ディレクトリ・サービスを使ってオーディオ・ウェブを検索して興味のある音声ページを見つける方法を与えられる。上記の仮定の例に示されるように、オーディオ・ウェブをナビゲートする手段は重要である。この例において、取り出された最初の３ページは、図２に示す階層構造にしたがって重ねられた（スタックされた）ディレクトリ・ページである。一旦、ページに入ると、「ハイパーオーディオ」リンクが他のページ（常にではないが、しばしば、関連する題材）へのつながりを与える。上記のように、ユーザは例えば「何か新しい」ページから「名曲集」ページへ適切なハイパーオーディオ・リンクを使ってジャンプした。ハイパーオーディオ・リンクは一般に、 WWWにおけるハイパーテキスト・リンクに似ている(ここでは互換的に「音声リンク」という)。ユーザはコマンドおよび他の情報を（クライアントを介して）入力することにより、オーディオ・ウェブ上のナビゲートを制御できる。例えば、以下に示すように適切なナビゲーション・コマンドを使って、ユーザは「名曲集」ページを終えた後に「何か新しい」ページにジャンプして戻り、さらに再びビートルズ・ページへ戻ることもできる。ユーザはまた、特定の音声ページにブックマークでしるしを付けておき、ひとつまたは複数のディレクトリをナビゲートする代わりにそのページに直接ジャンプすることができる。さらにユーザの選択したブックマークをまとめたブックマークリストも提供される。音声ページを作ってディレクトリ・ページの階層に含めることもできる。また、音声ページ作成者は音声ページにハイパーオーディオ・リンクを組み込むことができる。最後に、オーディオ・トラックを送信するための標準プロトコルを使用する。ユーザが関心のあるページを探し当てることができるように、次のディレクトリ・スキームを使用している。各ディレクトリは、ダウンロードされると、メニュー選択の流れとなって周期的にユーザに音声で提供される。ディレクトリ・フォーマットはもちろん用途にあったものでなければならないが、好ましくは情報を上手に伝え、面白く、もっとも重要なことであるが、目的物を探し出すことができなければならない。ユーザの最初のオーディオ・ウェブへの接触は、WWW（図２参照）場の「ホームページ」に似た、ホーム・ディレクトリ・ページ１０である。このホーム・ディレクトリ・ページ１０は１つまたは複数のサブディレクトリ・ページ１２へのハイパーオーディオ・リンク１６を含む。この構造は、いくつかのレベルにわたって継続し、図２に概略的に示した階層ツリーのような階層ツリー構造を構成する。最後あるいは最下のレベルにあるディレクトリ・ページ１４（リーフ・ノード）は個々の音声ページであって、これらはディレクトリ・ページに登録されている。図２に示す重ねられた「ツリー」構成が望ましい。これは多数の音声ページに対する管理可能なインデックスを提供しながら、リンクの出力数（fanout）を妥当な数に抑えるからである。ここで用いたツリー構成はデータベース管理システムで一般に使用されるＢツリー構成に似ている。それぞれの音声ページは最大数の音声リンク、および固定の音声情報容量を有する。これが有利であるのは、ユーザがディレクトリ・ページを聞いているときに散乱した情報の波に飲み込まれることがなく、またもっと重要なことは、どの選択メニューにおいても選択肢の数が多過ぎず、ユーザが多数の選択肢を覚えておかなければならないという負担がないからである。本発明による別のページ構成方法（図示せず）は、与えられたページがハイパーオーディオ・リンクによって少なくとも１つの他のページにリンクされるように、重なる階層構造を用いないで、複数のページを提供する。それぞれのハイパーオーディオ・リンクは、WWWにおけるハイパーテキスト・リンクがページ上のテキストの反転部分に関連しているのと同様に、音声ページの音声トラックの一部分に関連している。上記の如く、ユーザが最初にオーディオ・ウェブ・サーバに接続したとき、ユーザが最初に出会う音声ページはホーム・ディレクトリ・ページである。このホーム・ディレクトリ・ページは繰り返す音声トラックであり、一般に複数のハイパーオーディオ・リンクの一覧を示す。このディレクトリを使うには、ユーザは（例えば、関心のある音声リンクが聞こえたときに）クライアントからSTOPコマンドを発する。そしてディレクトリは、STOPコマンドが発される前の最後のｋ個（例えば５個）のハイパーオーディオ・リンクからなる選択メニューを提供する。図３は繰り返すディレクトリ・ページの概念を示し、より具体的には、ユーザが発したSTOPコマンドによるウィンドウ内のｋ個のハイパーオーディオ・リンクの集まりを示す。この時点で、ユーザはｋ個のハイパーオーディオ・リンクの名前を挙げる新しい音声トラックを聞く。そのような音声トラックは以下の通りである。「この時点でのあなたの選択は：」１：＜１番目のハイパーオーデイオ・リンクの名前＞；２：＜２番目のハイパーオーディオ・リンクの名前＞；３：＜３番目のハイパーオーディオ・リンクの名前＞… ｋ番目のハイパーオーディオ・リンクまで。ユーザはクライアントを介して対応する番号を入力して選択する。したがってシステムは時間ウィンドウの過去のｋ個のリンクに基づいてダイナミックな選択メニューを定義する。このダイナミック・ウィンドウの概念において、ユーザはリンク出力数（fanout）（すなわち、ある音声ページ上に定義されたハイパーオーディオ・リンクの総数）にかかわらず、いずれの場合もｋ個の選択肢の集まりを提供される、ということが理解されるであろう。これが有利であるのは、ユーザは一度に比較的少ない数の選択肢を扱うだけでよく、選択動作が処理可能な範囲に抑えられるからである。しかし、このダイナミック・ウィンドウ概念でさえ、ユーザは興味のあるトピックを見つけるまでに、ハイパーオーディオ・リンクの大きなリストを聞かなければならないということが起こり得る。したがって本発明によれば、ディレクトリ・ページを検索するのを容易にする方法を提供する。特にバイナリ検索法が有用である。バイナリ検索は順番に並べられた項目をすばやく繰り返し検索する方法として知られている。図４はバイナリ検索法の概要を示したものである。一回目の「パス」において、リストの中央の項目i_mから検索が開始される。i_mが探しているi_rよりも「大きい」(例えば、数字的に大きいか、またはアルファベット順に後である)場合、検索はリスト中央の「左側」すなわちリストの「より低い」端の方へ移動する。他方、i_mが探している項目よりも「小さい」(例えば、数字的に小さいか、またはアルファベット順に前である)場合、検索はリスト中央の「右側」すなわち「より高い」端の方へ移動する。一般に、それぞれの移動は、パスの開始における中央点によって定義される小部分のひとつの中央に向かう。したがって、図４に示す一回目のパスにおいて、動きは一般に全リストの中央i_mからi_mによって定義される２つの小部分（この場合、２つの半分）のひとつの中央へ向かう。ここでこれらの小部分のそれぞれは i_mと全リストの端の一つとの間を延びる。図４に示すように、一回目のパスにおいて、i_r<i_mであると判断される。したがって最初の動きは、i_mからi_lへ左の方へ向かう。ここでi_lはリストの端と項目 i_mとの間の中間である。二番目のパスにおいて、i_r>i_lであると判断される。したがって、第二の動きは、i_rがi_lとi_mの中間であるから、i_lからi_rへ右の方へ向かう。i_rが探している項目であるから、検索は完了する。目標を狭めていくこの繰り返し方法を必要に応じて続けることにより、求めている項目に到達する。必要とされるパスの数は全リストのサイズ（項目の数）の対数に比例することが知られている。本発明に適用された、バイナリ検索はブラウジング/検索システムにおいて以下のように使用される。ユーザが音声トラックを検索したいとき(これは音声トラックが再生されている間いつでもできる)、ユーザは適宜BACKまたはFORWARDコマンドを入力する。これに応じて、ブラウザは音声トラックにおける現在の位置t_lと音声トラックの終端または開始端t_eとの間の中間時点t_mを特定する。そしてブラウザはt_mから前方へ音声トラックを再生する。探している項目がt_mの前（すなわちt_mの「左側」）であるとユーザが判断した場合、ユーザはBACKコマンドを発し、ブラウザはt_lと t_mの中間点から音声トラックを再生する。他方、探している項目がt_mの後（すなわちt_mの「右側」）であるとユーザが判断した場合、ユーザはFORWARDコマンドを入力し、音声再生をt_mとt_eとの中間点まで進める。図４に関して説明したように、この方法を繰り返すと、検索は比較的すばやく目標の項目に到達する。ユーザが目標の項目に到達したら、ユーザはSTOPコマンドを発する。その後、目標項目に基づいて、上記のダイナミック・メニュー・ウィンドウが構築される。一旦ユーザがダイナミック・メニュー・ウィンドウからハイパーオーディオ・リンクを選択すると、対応する音声ページがサーバからクライアントへ送られ、上記の手順が再び始まる。より具体的に説明すると、新しく選択された音声ページがディレクトリである場合、上記のように、ユーザは再び、繰り返し音声情報を聞くことになる。新しく選択した音声ページがオーディオ・ウェブ・ページである場合、ユーザはそれに含まれる音声情報を聞き、それを望むように使用できる。図５は本発明によるオーディオ・ウェブのナビゲート概念を示す。オーディオ・ウェブ・ページはディレクトリ・ページと類似の方法で処理される。唯一の大きな違いは、オーディオ・ウェブ・ページはディレクトリ・ページのように繰り返されることがない点である。ユーザはページ記述に提示される順に、情報を線形的に受け取る。この音声情報を聞いたとき、ユーザはSTOPコマンドを使って、図３に示したように、そのページにおける最後のｋ個のハイパーオーディオ・リンクによって形成される選択メニューを促す。その後、ユーザは望みのハイパーオーディオ・リンクに対応する数字を選び、そのハイパーオーディオ・リンクに対応する新しいページに分岐またはジャンプすることができる(図５を再度参照)。時間の経過とともに、ユーザは多分多くのページに出会って、後でディレクトリを検索するという比較的時間のかかる手順を踏まずに、それらのページに戻りたいと思うことがあるであろう。ブックマークは、その名が示すとおり、興味のある特定ページに直接ジャンプできるようにそれらに単に「しるし」を付けるものである。ブックマークはブックマークリストに蓄積しておき、そのリストを前記のディレクトリ・ページと同様にディレクトリ・ページとして構成することができる。この点で、ブックマーク・リストはディレクトリ構造におけるリーフ・ノードと同じ構造を有する。ブックマーク・リストを作るには、ユーザはプリセット・コマンドを使って興味あるページにブックマークを割り当て、そのページの名前をリストに加える。ページの名前は、そのページを指しているハイパーオーディオ・リンクの名前から、あるいはユーザが与えた（例えばユーザが話した）名前からとって、ページ・アドレスと組み合わせることができる。（ページ・アドレッシングは以下に詳しく説明する。）ブックマークを付けたページを取り出すには、ユーザはGOコマンドを使って興味あるページへ直接移動してそれを取り出して再生する。望みのページが完了したら、ユーザはそれを停止させ、ブックマークを付けたページ上のハイパーオーディオ・リンクを使って他のページへ分岐する。時間の経過とともに、ブックマーク・リストは比較的大きくなり、それを検索することが厄介になるということが考えられる。したがって、上記のように、ここでバイナリ検索を再び使ってブックマークの検索を管理する。バイナリ検索を適用するために、ブックマーク・リストは辞書編集法的に順番に並べられていると仮定する。音声トラックをどのように再生するか、あるいは発声コマンドをどのように認識するかという問題が当然発生する。 WWWにおいて、ハイパー・テキスト・プロトコル（HTTP）はうまく機能している、なぜならこれは状態を持たないからである。すなわち、WWWページがアクセスされた時はいつでも、そのページが置かれたサーバは単にそのページの内容をクライアントに転送するだけで、その後はその要求については何も「覚えて」いないからである。WWWブラウザが走るクライアントはページ・レイアウトとユーザ・インターフェース問題を扱う。したがって、事実上、ハイパーテキスト・リンクがユーザによって選択される（「クリックされる」）と、別のネットワーク接続が確立されて、新しく選択されたページがクライアントに提供される。この特性によって、WWWサーバは「拡大が可能」となる。この特徴はオーディオ・ウェブにおいても重要である。ユーザが与えられたページを単に操作しているときも続けてサーバをクライアントに接続させておくのは実際的でない。接続状態を継続して覚えておき、複数のクライアントからのコマンドを処理するのはサーバにとって膨大な負担となる。しかも、使用が増えるにつれてシステムは拡大できなくなる。したがって、オーディオ・ウェブ用にハイパーオーディオ・トランスファー・プロトコル（HATP）が設けられ、これがWW WのHTTPと同様に動作する。本発明の一つの特徴は、HATPがクライアントへ音声ページを送るための接続なし、あるいは状態なし、プロトコルであるということである。オーディオ・ウェブの場合、以下の構造を有するハイパーオーディオ・マークアップ・ランゲージ（HAML）はハイパーテキスト・マークアップ・ランゲージ（ HTML）と同等である。 pagetype＜音声トラック＞ autiolinks＜i:t_i ^b，t_i ^e，hatpアドレス＞ pagetypeはそのページがディレクトリ・ページかオーディオ・ウェブ・ページかを示す。（ディレクトリ・ページは周期的に再生されるが、オーディオ・ウェブ・ページはそうではないため、この区別は必要である。）ページにおけるハイパーオーディオ・リンクの記述は全音声トラックの後に与えられる。これによって、全音声トラックを、好ましくは便利なデータ圧縮フォーマット（これは従来から知られているものでよい）で、一つの単位として送ることができる。ハイパーオーディオ・リンクは３つのコンポーネントを有する。すなわち、リンク番号( 上記の下付き文字i)、ハイパーオーディオ・リンク名として使用される音声トラックの一部の始まりt_i ^bと終わりt_i ^eを表す（全音声トラックの始めからの）一対の経過時間値、およびハイパーオーディオ・リンクが示すページのHATPアドレスである。 HATPはHTTPとよく似ていることが好ましく、次の４つのステージからなる状態なしプロトコルでなければならない。１．接続：ユーザ・リソース・ローケータ（URL）を使ってクライアントからそれぞれのサーバへのデータ接続を確立する。２．要求：クライアントからサーバへ要求メッセージを送る。３．応答：サーバからクライアントへ応答メッセージを送る。４．終了：応答メッセージが完了した後に接続を終了させる。もちろん、HATPとHTTPとの間にはHTTPにおいて知られている概念という点でいくつかの大きな違いはある。１．ACCEPTヘッダー・ラインは、クライアントによって受け付けられる唯一のフォーマットとしてHAMLを指定する。２．ACCEPT-ENCODINGヘッダー・ラインは、HAML文書の符号化フォーマット（例えば、x-compress，x-zip等）および音声トラックの圧縮フォーマット（例えば、MPEG）を指定する。３．HTTP等におけるTEXTSEARCHの代わりに、AUDIOSEARCHと呼ばれる方法が実行される。これによって対象物を音声の流れによって検索できる。GET法という検索形態を使って対象物を検索する。これ以降は、仮想クライアントが上記の機能を実行する本発明の方法について説明する。一般に、クライアントはHATPプロトコルを走らせてHAMLページ記述を要求し受け取る。クライアントはまた上記のコマンド（例えば、STOP、FORWARD、BACK、P LAY、RESET等）を認識し実行する。最後に、クライアントはオーディオ・ウェブ・ページからの音声トラックを再生する。１．STOPコマンドページ再生中に、ユーザはSTOPコマンドを発することができる。この時点で、ブラウザは音声トラックの再生を停止し、STOPコマンドが発せられた時点より前の音声トラックの最後のｋ個のリンクを含むダイナミック・メニュー・ウィンドウを作成する。そのために、ブラウザは音声トラックの始めからの経過時間を追跡し、またST OPコマンドが発せられた時刻を記録する。この時刻はt_sで表される。その後、クライアントのオーディオ・ウェブ・ブラウザは以下のアルゴリズムに従う。 t_j ^b>t_sとなるようなリンクリスト内の最初のリンクｊを見出す；リンクｊから、およびリンクリストを後に検索しながら、次のことを行う： menu=0(メニュー・ウィンドウを最初に空にするために)； m=1; 後方に検索しながらGL(Get Link):next link ｉ（次のリンクｉを捕らえる）項目ｉがまだメニューにある場合、 STに行く(ページが例えば５リンクよりも少ない場合)；さもなければ、項目＜m、リンク名、リンク・アドレス、t_i ^b，t_i ^e＞をメニューに挿入する。 m=m+1 （例えば）m<5の場合、GLに行く。 ST:メニュー・リストのメニュー項目を再生し、選択肢（１から５までの数字）を待つ m=choice（選択肢）エントリにおけるリンク・アドレスによって示されるページを取り出す。２．上記のように、FORWARDとBACKコマンドはディレクトリ・ページのバイナリ検索に関して有用である。ブラウザは次のアルゴリズムを使ってこれらのコマンドを実行する。経過時間に関して、t_lとt_rはそれぞれ当該音声トラックの開始端と終了端であり、t_sはその音声トラックの開始点である。再生の始めの時点では、t_l=t_s=0である。上記のように、t_rは音声トラックの終了時間と同じに設定されている。 a. FORWARDコマンドが発せられたら、以下の手順が行われる。音声トラックの再生を停止する t_l=t_sと設定する t_s=1/2(t_l+t_r)と設定する時刻t_sから音声トラックの再生を開始する。 b. BACKコマンドが発せられたら、以下の手順が行われる。音声トラックの再生を停止する t_s=t_mと設定する t_s=1/2(t_l＋t_r)と設定する新しい時刻t_sから音声トラックの再生を開始する。３．RETURNコマンドは、ブラウザに現在のページの直前のページを取り出すように命令するために使用する。ブラウザはメモリ・キャッシュを保持して現在のページの直前のページを保存しておくことが好ましい。またブラウザは、（例えば、ユーザがジャンプしたハイパーオーディオ・リンク番号をキャッシュすることにより）直前のページを離れた状態を記憶することにより、直前ページの音声トラックをそれから離れた点から再び再生できるようにすることがさらに望ましい。４．PLAYコマンドは、STOPコマンドで再生を停止した後に、再生を再開するために使用する。PLAYコマンドはSTOPコマンドで停止した点で再生を再開させる。５．上記のように、PRESETコマンドはブックマーク・リストに新しいエントリを追加するために使用する。このコマンドは、現在のページへのリンクをその名前とともにブックマーク・リストに迫加するようにブラウザに対して命令する。例えばブラウザは、ブックマーク・リストにエントリを追加させるために、そのリンク名を発声するようにユーザに促すか、あるいはメモリ・キャッシュ内のページからリンク名を取ることもできる。ブックマークを付けられたリンクは、上述のようにHAMLリンク記述子としてエントリされる。６．GOコマンドは、ブックマーク・リストを繰り返し情報の流れとして再生開始するようにブラウザに命令し、それによってブックマーク・リストを上述のディレクトリ・システムの変形として扱う。GOコマンドを使用した後システムは、ダイナミック・メニュー・ウィンドウを作成するためにユーザがSTOPコマンドを使うまで、あるいはブックマーク・リストをバイナリ検索するためにFORWARDコマンドまたはBACKコマンドを使うまで、続行する。 WWWのウェブ・ページはテキスト列を使って検索できる。したがって、WWW ページは市ごとの天気データ、カタログ等の情報データベースを含むことができる。同様な特徴はオーディオ・ウェブにも設けられている。本発明によれば、ユーザは音声列を送ってそれに対応する音声情報を受け取ることによって音声ページを検索する。そのようなページを提供されたら、クライアントはユーザが問い合わせを発声するのを待ち、上記のAUDIOSEARCH法を使ってユーザの要求をサーバに送る。そのような音声検索は、相当大きな語彙を有し且つ正確で話手に依存しない音声認識能力、あるいは音声の流れに「ほぼ匹敵する」手段を必要とする。ここに開示されたオーディオ・ウェブに関する概念は、ラジオを聞くことに特に適応できる。したがって本発明によるデジタル・ハイパー・ラジオ（「DHR」）もここで説明する。 DHRの概念を説明するために、図６において例えば英国放送協会（「BBC」）の国際ラジオ放送のラジオ送信と比較する。例えば、ニューヨーク市でBBC放送を個別に聞くとき、ラジオをBBC中継局が使う周波数に同調させる。ところが、DHRを使えば、上記の説明と同じようにして、使用可能な周波数バンドの一部を使ってハイパーオーディオ・リンクのリストが放送される。実際には、ラジオ送信はHA MLフォーマットを使ったオーディオ・ウェブ・ページのフォーマットを有する。各ハイパーオーディオ・リンクはそれぞれのオーディオ・ウェブ・サーバを示し、オーディオ・ウェブ・サーバはそのリンクで指名されたトピックについて更なる情報を提供する。したがって、この構成において、可聴放送ラジオ送信は新しいヘッドラインのみからなり、一方それぞれの全ニュース・ストーリーはラジオ送信「ページ」によって指定されたオーディオ・ウェブ・ページにおいて得られる。聞き手は、特別に装備されたラジオ・トランシーバをクライアントとして使って、ニュース・ヘッドラインの送信を停止させ、リンクのメニューを得、興味あるトピックを選び、オーディオ・ウェブ・サーバから対応する全ニュース・ストーリーをダウンロードする。リンクはまた他のラジオ放送周波数を示すこともでき、ラジオ・トランシーバは対応するリンクを選択した後にその周波数に自動的に同調する。これらの送信は例えば最初の放送で流したトピックに関する拡張された情報を提供するか、あるいはもっと詳しい選択肢のリストを提供する。ここで説明した概念は他の形態の媒体に有用に適用できることが理解されるであろう。映像情報の場合、ディレクトリ・ページは「予告編」(すなわち全プログラムを見るように視聴者を誘うために使われるプログラムからとった短いビデオ)の周期的な流れから構成してもよい。ユーザがSTOPコマンドを使ってディレクトリの流れを停止させると、ダイナミック・メニュー・ウィンドウが作成される。メニュー・ウィンドウは（例えば）５つのビデオ静止フレームを表示する。これらはSTOPコマンドを使用する直前に映された５つの予告編から１つづつ採ったものである。ユーザは１、２、…５を入力することによってプログラムの１つを選択する。最初のディレクトリ・ページで表示されるそれぞれの予告編は共通のトピック、例えば「音楽」、についてのあらましであることが好ましい。こうして最初の予告編の中から選択したら、ユーザは最初の予告編の共通トピックに関連する別の周期的な予告編の流れを見る。一旦望みのビデオ・ページが見つかったなら、ユーザはそのページをビデオ・プログラムとして受け取る。そのページはまた異なるビデオ・ページを示すハイパービデオ・リンクを含む。オーディオ・ウェブの場合と同様に、ユーザはプログラムの途中いつでもビデオ再生を停止し、その時点までにプログラムで識別された例えば最後の５つのハイパービデオ・リンクのダイナミック・メニュー・ウィンドウを作成する。メニューからハイパービデオ・リンクの１つを選択すると、クライアントはサーバから対応するビデオ・プログラムをダウンロードしその再生を開始する。本発明によるビデオ・ページは音声ページと同様にフォーマットされており、ハイパービデオ・リンクのフォーマットは＜i:t_i ^b，t_i ^e，アドレス＞、ここでt_i ^b ，t_i ^eはそれぞれハイパービデオ・リンク名として使用されるフレームの始めと終わりを表す。このフォーマットのクライアントは、上記のコマンド用として適切な押しボタン入力を備えたリモート・コントロール・ユニットを有する対話型のテレビ・ユニットであることが好ましい。またコマンドを（ソフトウェアを走らせている代理クライアントに）アップリンクするのに必要なデータ・バンド幅は最小であることが有利である。本発明によれば、テキスト情報も管理される。例えば、テキストのティッカー・タイプ表示を使って周期的なディレクトリ・ページを表示できる。前記と同様に、ユーザは望みの位置で表示を停止させ、ダイナミック・メニュー・ウィンドウを作成し、興味ある項目を選択する。望みのテキスト・ページに到達したら、そのページは制限された状態で表示されるか、あるいは余分の実際の状態が使用できる場合、別のところに表示される。ハイパーテキスト・リンクは、ハイパーオーディオ・リンクやハイパービデオ・リンクと同じように、フォーマット＜i:b、e、アドレス＞を使って符号化される。唯一の違いはｂとｅが、経過時間の代わりに、バイト単位でのテキストの流れの始めからの変位を表していることである。ユーザはテキスト・ウェブを使って、（時には携帯情報端末（PDA）として知られている）手の上のコンピュータ・ユニットをクライアントとして使用する。 PDAは普通その計算能力が制約され、表示も小さい。それでも、ユーザはPDAを使ってディレクトリ・ページ、ダイナミック・メニュー・ウィンドウおよびテキスト・ページを思い通りに表示できる。しかも、ユーザは全テキストーページを、例えばファックス・オン・デマンド・モードのファックス等、他の装置に送ってより容易に読むことができる。最後に、マルチメディア・ウェブは、音声、映像およびテキストを組み合わせて表示することによって実現できる。この場合、これら３つのメディアは第一級の対象物である。ウェブ概念の各ステージにおいて、ユーザは上記の概念にしたがって、音声、映像およびテキストによるマルチメディア情報を受け取る。本発明はWWW用の新しいブラウザおよびナビゲータを包含することが理解されるであろう。特に、周期的ディレクトリは現在知られているWWWナビゲーション法に組み込むことができる。

【手続補正書】特許法第１８４条の８第１項【提出日】平成１０年１２月４日（１９９８．１２．４）【補正内容】請求の範囲１．少なくとも１つのサーバが少なくとも１つの音声ページと音声コマンドを認識する手段とを有し、前記少なくとも１つの音声ページのそれぞれが音声データを有し、少なくとも１つの他の音声ページに相互参照によってリンクされるように構成された少なくとも１つのサーバと、前記少なくとも１つのサーバが前記音声コマンドを受け取ったときにテキストまたは視覚的インターフェイスなしで前記音声データが選択的に前記クライアントに転送されるように、前記少なくとも１つのサーバと通信するクライアントとを具えたことを特徴とする広域情報システム。２．請求項１に記載のシステムにおいて、前記少なくとも１つのサーバはスタックされた階層に構成された複数の音声ページを含むことを特徴とするシステム。３．請求項２に記載のシステムにおいて、前記スタックされた階層は最上レベルにホーム・ページを含み、前記ホーム・ページは選択的に前記クライアントに転送される最初の音声データを有することを特徴とするシステム。４．請求項３に記載のシステムにおいて、前記ホーム・ページは繰り返し音声トラックに対応する音声データを有するディレクトリ・ページであることを特徴とするシステム。５．請求項４に記載のシステムにおいて、前記繰り返し音声トラックは前記ホーム・ページの下の階層レベルにある音声ページへの複数の相互参照を含むことを特徴とするシステム。６．請求項５に記載のシステムにおいて、前記階層は最下レベルを含み、該最下レベルは、少なくとも１つのページであって、少なくとも１つの他のページへの少なくとも１つの相互参照リンクを有する少なくとも１つのページを含むことを特徴とするシステム。７．請求項６に記載のシステムにおいて、前記階層は、前記最下レベルの上の少なくとも１つの中間レベルを含み、前記少なくとも１つの中間レベルは、少なくとも１つのページであって、前記少なくとも１つの中間レベルの上の前記階層レベルにあるページへの少なくとも１つの相互参照リンクおよび前記少なくとも１つの中間レベルの下のレベルにあるページへの少なくとも１つの相互参照リンクを有する少なくとも１つのページを有することを特徴とするシステム。８．請求項７に記載のシステムにおいて、前記クライアントは前記少なくとも１つのサーバからの前記音声データの転送を制御し、前記少なくとも１つのサーバから転送される音声データを聞こえるようにするための手段を含むことを特徴とするシステム。９．請求項８に記載のシステムにおいて、前記音声データの転送を制御する手段は前記ディレクトリの前記繰り返し音声トラックを制御するためのコマンドを入力する手段を含むことを特徴とするシステム。１０．請求項９に記載のシステムにおいて、前記コマンドを入力する手段は前記繰り返し音声トラックの再生を停止させるためのコマンドを入力する手段を含むことを特徴とするシステム。１１．請求項１０に記載のシステムにおいて、前記クライアントは、前記繰り返し音声トラックの再生を停止させるためのコマンドを受ける直前の前記繰り返し音声トラックにおける前記複数の相互参照からなる部分集合を識別する手段を含むことを特徴とするシステム。１２．請求項１１に記載のシステムにおいて、前記クライアントは前記部分集合内の前記相互参照のひとつを選択する手段を含むことを特徴とするシステム。１３．請求項１２に記載のシステムにおいて、前記複数の相互参照からなる部分集合を識別する手段は前記部分集合内の前記相互参照の可聴リストを生成することを特徴とするシステム。１４．請求項１３に記載のシステムにおいて、前記部分集合内の前記相互参照は基数の集合に対応し、前記繰り返し音声トラックを制御するためのコマンドを入力する手段は前記部分集合内の前記相互参照の１つを選択するための基数を入力する手段を含み、前記選択された相互参照に対応するページは前記音声データ転送接続を介して前記クライアントに転送されることを特徴とするシステム。１５．請求項１４に記載のシステムにおいて、前記コマンドを入力する手段は前記音声トラックの再生再開コマンドを入力する手段を含むことを特徴とするシステム。１６．請求項１５に記載のシステムにおいて、前記コマンドを入力する手段は検索コマンドを入力する手段を含み、望みの相互参照を見出すために前記繰り返し音声トラックを検索することができることを特徴とするシステム。１７．請求項１６に記載のシステムにおいて、前記検索コマンドは前記繰り返し音声トラックの再生を、与えられた時点に関してある時間間隔だけ進めるための前送りコマンドと、前記繰り返し音声トラックの再生を与えられた時点に関してある時間間隔だけ戻すための後送りコマンドとを含むことを特徴とするシステム。１８．請求項１７に記載のシステムにおいて、前記繰り返し音声トラックの再生を進め、または戻す際の前記時間間隔は、バイナリ検索アルゴリズムにしたがって変えることができることを特徴とするシステム。１９．請求項１８に記載のシステムにおいて、再生を進めたり戻したりする際の前記時間間隔は、前記前送りと後送りコマンドが繰り返し入力されるにしたがって次第に減少することを特徴とするシステム。２０．請求項１に記載のシステムにおいて、前記クライアントはさらに前記クライアントに転送される音声データを聞こえるようにする手段を含むことを特徴とするシステム。２１．請求項２０に記載のシステムにおいて、前記クライアントは複数の基数と少なくとも１つのコマンド動作を入力する手段を備えることを特徴とするシステム。２２．請求項２１に記載のシステムにおいて、前記複数の基数と少なくとも１つのコマンド動作を入力する手段は前記複数の基数のそれぞれと前記少なくとも１つのコマンド動作に割り当てられた各キーまたはキーの組み合わせを有するキーパッドを備えることを特徴とするシステム。２３．請求項２２に記載のシステムにおいて、前記クライアントは前記キーパッドとイヤピースを有する電話を備え、前記少なくとも１つのサーバは前記キーまたはキーの組み合わせが押されたときに前記電話が発生するトーンを認識する手段を備え、前記音声データを聞こえるようにする手段は前記音声データを前記イヤピースにおいて聞こえるようにする手段を含むことを特徴とするシステム。２４．請求項２２に記載のシステムにおいて、前記クライアントは音声発生装置とキーボードを有するコンピュータを備え、前記キーボードは基数入力および少なくとも１つのコマンド動作手段を備え、前記音声データを聞こえるようにする手段は前記音声データを前記音声発生装置において聞こえるようにする手段を含むことを特徴とするシステム。２５．請求項２１に記載のシステムにおいて、前記複数の基数と少なくとも１つのコマンド動作を入力する手段は前記複数の基数と少なくとも１つのコマンド動作に対応する発声された言葉を認識する手段を備えることを特徴とするシステム。２６．少なくとも１つのサーバと１つのクライアントとを備え、前記サーバのそれぞれが音声データを有する少なくとも１つの音声ページと音声コマンドを認識する手段とを有し、情報がすべて音声ページとして格納され、システムがテキストまたは表示装置を使用しないでナビゲートされるような広域情報システムにおいて前記音声データをユーザに提示する方法であって、前記クライアントから前記サーバへの接続を確立するステップと、前記少なくとも１つの音声ページを要求するための、識別子を有する音声要求メッセージを前記クライアントから前記サーバへ送るステップと、前記メッセージ要求により識別された音声データを有する前記要求された音声ページを前記サーバから前記クライアントが受け取るステップと、前記接続を終了させるステップと、前記クライアントにおいて前記受け取った音声ページを前記ユーザに提示するステップとを有することを特徴とする方法。２７．請求項２６に記載された方法において、前記受け取るステップはさらに前記メッセージ要求によって識別された前記音声ページを前記サーバから送るサブステップを有し、前記音声ページはページ・タイプ識別子を含み、前記ページ・タイプ識別子は前記音声ページが繰り返し音声トラックを有するディレクトリ・ページであるか、あるいは線形音声トラックと前記音声トラックの後にハイパーオーディオ・リンクとを有するオーディオ・ウェブ・ページであることを示し、前記ハイパーオーディオ・リンクはリンク番号、一対の経過時間および前記ハイパーオーディオ・リンクが示すアドレスを有することを特徴とする方法。２８．請求項２７に記載された方法において、前記提示するステップは、さらに、前記クライアントにおいて、それぞれが前記受け取った音声データの一部に対応する複数の選択肢を有する選択メニューをユーザに提供するステップと、前記クライアントにおいて、前記受け取った音声データの一部に対応する前記複数の選択肢の１つを前記選択メニューから選択するステップと、前記選択された選択肢に対応する前記音声データが前記クライアントで受け取られるように、前記受け取った音声データの一部をクライアントから前記サーバへ転送するステップとを有することを特徴とする方法。２９．請求項２８に記載された方法において、前記提示ステップは、さらに、前記転送された音声データを可聴音に変換するステップを含むことを特徴とする方法。３０．請求項２９に記載された方法において、選択メニューを提供する前記ステップは、前記複数の選択肢からなる第１集合を順に提示するステップと、前記第１集合の複数選択肢の前記提示を停止するステップと、前記第１集合の選択肢の中から第２集合の選択肢を提示するステップとを有し、前記第２集合は前記選択メニューを形成することを特徴とする方法。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考）Ｈ０４Ｍ 3/42 Ｈ０４Ｍ 3/493 3/493 Ｇ１０Ｌ 9/00 ＮＧ０６Ｆ 15/40 ３７０Ｅ

Claims

【特許請求の範囲】１．クライアントと、音声データを格納し、前記クライアントと音声データ転送接続を少なくともときどき有するように構成され、前記音声データが前記クライアントに選択的に転送される少なくとも１つのサーバとを具えたことを特徴とする広域情報システム。２．請求項１に記載の広域情報システムにおいて、前記クライアントは入力インターフェイスと出力インターフェイスを含むことを特徴とする広域情報システム。３．請求項２に記載の広域情報システムにおいて、前記入力インターフェイスは前記少なくとも１つのサーバから前記クライアントに前記音声データの転送を制御する手段を含むことを特徴とする広域情報システム。４．請求項３に記載の広域情報システムにおいて、前記音声データの転送を制御する前記手段は複数の基数と少なくとも１つのコマンド動作を入力する手段を有することを特徴とする広域情報システム。５．請求項３に記載の広域情報システムにおいて、前記出力インターフェイスは前記クライアントに転送した前記音声データを聞こえるようにする手段を有することを特徴とする広域情報システム。６．請求項４に記載の広域情報システムにおいて、前記出力インターフェイスは前記クライアントに転送した前記音声データを聞こえるようにする手段を有することを特徴とする広域情報システム。７．請求項６に記載の広域情報システムにおいて、、前記クライアントはキーパッドとイヤピースを有する電話とを備え、前記複数の基数と少なくとも１つのコマンド動作を入力する手段は、前記複数の基数と前記少なくとも１つのコマンド動作のそれぞれに割り当てられた、前記キーパッドの各キーまたはキーの組み合わせを有し、前記クライアントと前記少なくとも１つのサーバのいずれかは、前記キーパッドの前記キーまたはキーの組み合わせが押されたときに前記電話が発生した音を認識し、当該認識した音を前記サーバが認識できる形態に変換する手段を備え、前記音声データを聞こえるようにする前記手段は、前記転送された音声データを前記電話の前記イヤピースを介して聞こえる音信号に変換する手段を備えることを特徴とする広域情報システム。８．請求項６に記載の広域情報システムにおいて、前記クライアントはマウスピースとイヤピースを有する電話を備え、前記複数の基数と少なくとも１つのコマンド動作を入力する手段は、前記マウスピースを介して受けた前記複数の基数と少なくとも１つのコマンド動作に対応する発生された言葉を認識し、前記認識した発声語を前記少なくとも１つのサーバが認識できる形態に変換する手段を有し、前記音声データを聞こえるようにする手段は、前記転送された音声データを前記電話の前記イヤピースを介して聞こえる音信号に変換する手段を有することを特徴とする広域情報システム。９．請求項６に記載の広域情報システムにおいて、前記クライアントは、相互接続されたキーボード、中央演算ユニットおよび表示装置を含むコンピュータを備え、前記複数の基数と少なくとも１つのコマンド動作を入力する前記手段は前記キーボードを有し、前記コンピュータはさらに音声発生装置を含み、前記音声データを聞こえるようにする前記手段は前記音声発生装置を有することを特徴とする広域情報システム。１０．請求項５に記載の広域情報システムにおいて、前記少なくとも１つのサーバに格納された前記音声情報は重なった階層に構成された複数のページを有し、前記ページのそれぞれは少なくとも他の１つのページに相互参照により関連付けられていることを特徴とする広域情報システム。１１．請求項１０に記載の広域情報システムにおいて、前記重なった階層はその最上レベルにホーム・ページを含み、前記ホーム・ページは前記クライアントに最初に転送される音声データであることを特徴とする広域情報システム。１２．請求項１１に記載の広域情報システムにおいて、前記ホーム・ページは繰り返し音声トラックに対応する音声データを含むディレクトリ・ページであり、前記繰り返し音声トラックは前記音声データを聞こえるようにする手段によって聞こえるようにされることを特徴とする広域情報システム。１３．請求項１２に記載の広域情報システムにおいて、前記繰り返し音声トラックは前記ホーム・ページの下の前記階層レベルにあるページへの複数の相互参照を含むことを特徴とする広域情報システム。１４．請求項１３に記載の広域情報システムにおいて、前記階層は少なくとも１つの中間レベルを含み、前記少なくとも１つの中間レベルは、前記少なくとも１つの中間レベルの上の前記階層レベルにあるページへの少なくとも１つの相互参照リンクと前記少なくとも１つの中間レベルの下のレベルにあるページへの少なくとも１つの相互参照リンクとを有する少なくとも１つのページを含むことを特徴とする広域情報システム。１５．請求項１４に記載の広域情報システムにおいて、前記階層は最下レベルを含み、前記最下レベルは、その上の前記階層レベルにある少なくとも１つのページへの少なくとも１つの相互参照リンクを有する少なくとも１つのページを含むことを特徴とする広域情報システム。１６．請求項１３に記載の広域情報システムにおいて、前記階層は最下レベルを含み、前記最下レベルは、その上の前記階層レベルにある少なくとも１つのページへの少なくとも１つの相互参照リンクを有する少なくとも１つのページを含むことを特徴とする広域情報システム。１７．請求項１に記載の広域情報システムにおいて、前記少なくとも１つのサーバに格納された前記音声データは複数のページを有し、前記複数のページのそれぞれは前記複数のページの少なくとも１つの他のページに相互参照により関連付けられていることを特徴とする広域情報システム。１８．請求項１０に記載の広域情報システムにおいて、第１のサーバと第２のサーバとが設けられ、それぞれのサーバは音声データを格納し、前記第１と第２のサーバの前記音声データはそれぞれ第１と第２の複数ページを有し、前記第１と第２の複数ページのそれぞれのページは前記第１と第２の複数ページの少なくとも１つの他のページに相互参照により関連付けられ、前記第１の複数ページの少なくとも１つのページは前記第２の複数ページの１つのページに相互参照により関連付けられ、前記第１と第２のサーバはそれらの間の音声データ転送接続を少なくともときどき有するように構成されており、それによって音声データが前記第１と第２のサーバ間で転送できることを特徴とする広域情報システム。１９．請求項１３に記載の広域情報システムにおいて、前記音声データの転送を制御する前記手段は前記ディレクトリ・ページの前記繰り返し音声トラックを制御するコマンドを入力する手段を含むことを特徴とする広域情報システム。２０．請求項１９に記載の広域情報システムにおいて、前記コマンドを入力する手段は前記繰り返し音声トラックの再生を停止させるコマンドを入力する手段を含むことを特徴とする広域情報システム。２１．請求項２０に記載の広域情報システムにおいて、前記クライアントは前記繰り返し音声トラックの再生を停止させるコマンドを受け取る直前の前記繰り返し音声トラックにおける前記複数の相互参照からなる部分集合を識別する手段を含むことを特徴とする広域情報システム。２２．請求項２１に記載の広域情報システムにおいて、前記クライアントは前記部分集合内の前記相互参照のひとつを選択する手段を含むことを特徴とする広域情報システム。２３．請求項２２に記載の広域情報システムにおいて、前記複数の相互参照からなる部分集合を識別する前記手段は前記部分集合内の前記相互参照の可聴リストを生成することを特徴とする広域情報システム。２４．請求項２３に記載の広域情報システムにおいて、前記部分集合内の前記相互参照は対応する基数に関連付けられており、前記繰り返し音声トラックを制御するコマンドを入力する前記手段は、前記部分集合内の前記相互参照の１つを選択するための基数を入力する手段を含み、前記選択された相互参照に対応するページが前記音声データ転送接続を介して前記クライアントに転送されることを特徴とする広域情報システム。２５．請求項１９に記載の広域情報システムにおいて、コマンドを入力する前記手段は検索コマンドを入力する手段を含み、前記繰り返し音声トラックを検索することにより望みの相互参照を見出すことができることを特徴とする広域情報システム。２６．請求項２５に記載の広域情報システムにおいて、前記検索コマンドは前記繰り返し音声トラックの再生を与えられた時点に関してある時間間隔だけ進めるためのフォワード（FORWARD）コマンドと、前記繰り返し音声トラックの再生を与えられた時点に関してある時間間隔だけ戻すためのバック（BACK）コマンドとを含むことを特徴とする広域情報システム。２７．請求項２６に記載の広域情報システムにおいて、前記繰り返し音声トラックの再生を進めたり戻したりする際の前記時間間隔は、バイナリ検索アルゴリズムにしたがって変えることができることを特徴とする広域情報システム。２８．請求項２７に記載の広域情報システムにおいて、前記再生を進めたり戻したりする際の時間間隔は、前記フォワードおよび前記バックコマンドが繰り返し入力されるにしたがって次第に減少することを特徴とする広域情報システム。２９．請求項１０に記載の広域情報システムにおいて、前記クライアントはユーザが作成した相互参照ブックマークの付いたページを識別する手段を含み、前記ページは前記ブックマークを選択することにより直接選択されて前記少なくとも１つのサーバから前記クライアントに転送され、また前記クライアントは複数の前記ユーザ作成ブックマークを格納する手段を含むことを特徴とする広域情報システム。３０．請求項２９に記載の広域情報システムにおいて、複数のブックマークを格納する前記手段はディレクトリ・ページであり、前記ディレクトリ・ページは前記複数のブックマークを可聴的にリストする繰り返し音声トラックに対応する音声データを含むことを特徴とする広域情報システム。３１．請求項３０に記載の広域情報システムにおいて、前記音声データ転送を制御する前記手段はブックマークの付いたページを取り出すためのコマンドを入力する手段を含むことを特徴とする広域情報システム。３２．請求項１０に記載の広域情報システムにおいて、前記クライアントは、前記クライアントに送った最新ページの直前の少なくとも１つのページを保持するように構成されたメモリ・キャッシュを含むことを特徴とする広域情報システム。３３．請求項３２に記載の広域情報システムにおいて、前記音声データ転送を制御する前記手段は、前記最新ページと前記メモリ・キャッシュに保持された前記少なくとも１つのページとの間を移動するためのコマンドを入力する手段を含むことを特徴とする広域情報システム。３４．請求項２０に記載の広域情報システムにおいて、コマンドを入力する前記手段は、再生を停止させるための前記コマンドを入力することにより前記再生を停止した後に、前記音声トラックの再生を再開するためのコマンドを入力する手段を含むことを特徴とする広域情報システム。３５．請求項２９に記載の広域情報システムにおいて、前記クライアントはページに付けたブックマークを消去する手段を含むことを特徴とする広域情報システム。３６．クライアントと、音声データを複数のページとして格納したサーバとを備え、前記クライアントと前記サーバとがそれらの間に少なくともときどき音声データ転送接続を有するように構成された広域情報システムにおいて、音声データ転送接続がクライアントとサーバとの間で確立される接続ステップと、クライアントが音声データの要求をサーバに送る要求ステップと、前記要求ステップにおいてクライアントが要求した音声データをサーバが送る応答ステップと、クライアントとサーバとの間の前記音声データ転送接続が解消される終了ステップと、を有することを特徴とする音声データプロトコル。３７．請求項３６に記載の音声データ転送プロトコルにおいて、前記要求ステップにおいて、クライアントは音声データのみを受け取り、前記音声データはページの形態を有し、および音声データのページを、繰り返し音声トラックに対応する音声データを含むディレクトリ・ページとして、あるいは線形に再生される音声トラックに対応する音声データを含む非ディレクトリ・ページとして識別するためのページ・タイプ識別子と、サーバから送られ且つ音声トラックに対応する前記音声データとを有することを特徴とする音声データプロトコル。３８．請求項３７に記載の音声データ転送プロトコルにおいて、前記ページはさらに別のページに関連付けられた少なくとも１つの相互参照に対応する少なくとも１つのデータ・クラスタを含み、前記データ・クラスタは、前記少なくとも１つの相互参照を識別するためのインデックス番号と、前記音声データにおける前記相互参照の開始位置を、前記音声トラックの再生経過時間として示す時間インデックスと、前記音声データにおける前記相互参照の終了位置を、前記音声トラックの再生経過時間として示す時間インデックスと、相互参照が示すページのアドレスとを含むことを特徴とする音声データプロトコル。３９．請求項１に記載の広域情報システムにおいて、前記クライアントはラジオ・トランシーバであり、前記少なくとも１つのサーバはラジオ送受信局であり、前記音声データは前記ラジオ送受信局からラジオ送信を介して前記ラジオ・トランシーバに選択的に送信されることを特徴とする広域情報システム。４０．請求項３９に記載の広域情報システムにおいて、前記ラジオ・トランシーバは前記音声データ転送を制御するためにラジオ送信を介してラジオ送受信局へコマンドを送るように構成されていることを特徴とする広域情報システム。４１．複数の項目から１つの項目を選択するための選択メニューを提供する方法において、順番に第１の複数項目を提示するステップと、前記複数項目の提示を停止するステップと、前記停止ステップで前記第１の複数項目の提示を停止した、前記順番のポイントにしたがって、前記第１の複数項目から選択した第２の複数項目を提示するステップとを有することを特徴とする方法。４２．サーバに格納された音声データを選択的にサーバからクライアントに転送する方法において、前記サーバと前記クライアントとの間にデータ転送接続を確立するステップと、音声データを選択的に前記サーバから前記クライアントに転送するステップと、前記転送ステップの後に、前記サーバと前記クライアントとの間のデータ転送接続を解消するステップとを有することを特徴とする方法。４３．請求項４２に記載の方法において、前記転送ステップにおいて転送される音声データを指定するステップをさらに含むことを特徴とする方法。４４．請求項４３に記載の方法において、前記指定するステップは、それぞれが音声データ部分に対応する複数の選択肢を識別する選択メニューを前記クライアントにおいて提供するステップと、前記選択メニューから前記複数の選択肢の１つを選択するステップと、前記選択された選択肢に対応する音声データが前記サーバから前記クライアントに転送されるように前記選択された選択肢を前記クライアントから前記サーバへ転送するステップとを有することを特徴とする方法。４５．請求項４４に記載の方法において、前記選択メニューを提供するステップは、順番に第１の複数選択肢を提示するステップと、前記第１の複数選択肢の提示を停止するステップと、一連の前記第１の複数選択肢の中から第２の複数選択肢を提示するステップとを有し、前記第２の複数選択肢は前記第１の複数選択肢の提示が停止された、前記第１の複数選択肢における点にしたがって選択され、それによって選択メニューを形成することを特徴とする方法。４６．請求項４２に記載の方法において、前記選択的に転送された音声データを可聴音信号に変換するステップをさらに有することを特徴とする方法。