JP2002358194A - 音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 - Google Patents
音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体Info
- Publication number
- JP2002358194A JP2002358194A JP2001167173A JP2001167173A JP2002358194A JP 2002358194 A JP2002358194 A JP 2002358194A JP 2001167173 A JP2001167173 A JP 2001167173A JP 2001167173 A JP2001167173 A JP 2001167173A JP 2002358194 A JP2002358194 A JP 2002358194A
- Authority
- JP
- Japan
- Prior art keywords
- information
- voice
- web
- internet
- script
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
声化したインターネット情報の提供を行なうことができ
る音声情報提供システムを提供することを目的とする。 【解決手段】 本発明の課題は、インターネットに接続
してインターネット上で提供されるWeb表示形式を示
すWebファイルによって表示されるWeb情報を、電
話回線網を経由して接続される情報要求元に音声によっ
て情報提供を行う音声情報提供システムにおいて、上記
Web情報の読み方順を定義するスクリプトファイルを
解析して、読み上げ情報を生成するスクリプト解析手段
と、上記スクリプト解析手段によって生成された読み上
げ情報を音声化して、電話回線網を経由して情報要求元
に該Web情報を音声で提供する電話情報提供手段とを
有する音声情報提供システムにて達成される。
Description
で提供されるWeb情報を情報要求元に音声によって情
報提供を行う音声情報提供システムに係り、詳しくは、
電話回線網を利用して、音声化したインターネット情報
の提供を行なうことができる音声情報提供システムを提
供するものである。
方法及びそのシステムでの処理をコンピュータに行なわ
せるためのプログラムを格納した記憶媒体に関する。
ンターネットへの情報発信、及び、インターネットから
の情報取得が、随時頻繁に行われるようになった。ま
た、パソコンの低価格化により家庭へのインターネット
の普及が進み、ビジネスのみならず個人レベルのインタ
ーネットへの情報発信、及び、インターネットからの情
報取得がより頻繁に行われるようになった。
画像及び音声を同時に提供することを可能とし、利用者
は、家庭に設置されたパソコンをインターネットに接続
することによって、24時間必要なときに必要な情報を
取得できるという特性を有している。その特性によっ
て、インターネットは、健常者のみならず障害者にとっ
ても有効な情報発信及び情報取得の場となってきた。
来におけるインターネットによる情報提供システムにお
いては、以下に述べる問題点がある。
情報)を利用するには、インターネット情報を表示する
ためのソフトウェアであるブラウザをパソコンへインス
トールし、電話回線又は専用線を介してインターネット
網に接続する。そのため、視覚に何らかの障害を持つ利
用者や、パソコンが不得意とする利用者にとって、イン
ターネットから情報を取得することは困難である。ま
た、インターネットに不都合のない利用者にとっても、
外出先等での、パソコン及びPDAなどの携帯端末を使
用できない場合、インターネットの利用は不可能であ
る。
ィアを伝えることが可能であるが、一般には、画像や文
字を中心とした「見る」事を前提としている場合が多
く、視覚障害者にとっては、必ずしも有効な情報発信及
び情報取得の場とはならない。そこで、従来より、イン
ターネット情報を読み上げるソフトウェアが提案されて
いる。
フト(以下、読み上げソフトと言う)は、画面を構成す
るWebファイルのプログラムを解析し、そのプログラ
ムの中から読み上げる項目を割り出し音声変換を行うこ
とによって、視聴覚障害者にインターネット上の情報提
供を可能にしている。しかしながら、フレーム機能を使
用しているWebファイルはそのフレーム内で使用して
いるWebファイルのファイル名のみを音声化してフレ
ーム内のWebファイルへ接続する、ダウンロードサイ
トへリンクする手段がないためダウンロードサイトの利
用が不可能である、また、音声化された内容から使用者
がWebファイルの構成を理解しづらいという問題があ
る。
な場合、閲覧時の視点の流れは内容61から71への順
になるのに対して、従来の読み上げソフトは、内容61
「ニュース」、内容62「タレントの○○△さん死去
(□□スポーツ)」、内容63「△○×カンヌ映画祭に
出現。各国から絶賛。△△新聞社」、内容64「今日の
天気(主要都市)」、内容68「経済情報」、内容65
「札幌 雨・東京 曇りのち晴・大阪 晴」、内容69
「日経平均 15000.55」、内容66「降水確率
100%・降水確率20%・降水確率0%」、内容70
「円相場110.55」、内容67「その他の地域」、
内容70「マネー情報」のように読み上げられる。従っ
て、このような読み上げ順では、音声のみでWeb画像
の構成を認識するのは困難である。
又は、絵画と同様に「表現の場」でもある。よって、ホ
ームページ作成者にとって、読み上げソフトの仕様に合
わせ、Webファイルの構成を一定の書式で記述すると
いうことは、数多い表現の手法を制限すると同時にイン
ターネット上で有効な最新のプログラム技術を使用でき
ないという不都合を生じる。このような現状において、
読み上げソフトの作成者がガイドラインを推奨しても、
ホームページ作成者に認知され難い。
は、パソコンの使用を前提としており、前述より、パソ
コンの使用に不都合が有る場合はWeb情報を取得し難
い。さらに、読み上げソフトのインストール及びソフト
の使用方法を習得することは、視覚障害者等の利用者に
よって大変困難である。
ジの作成に制限を与えることなく、かつ、利用者にパソ
コンの使用を前提としない、例えば、電話機によって、
音声化したインターネット情報の提供を可能とするよう
な音声情報提供システムが望まれている。
網を利用して、音声化したインターネット情報の提供を
行なうことができる音声情報提供システムを提供するこ
とである。
声情報提供方法を提供することである。
様に、上記のようなシステムでの処理をコンピュータに
行なわせるためのプログラムを格納した記憶媒体を提供
することである。
イルがアクセスされた際、表示情報の読み方順を定義す
るスクリプトファイルの提供を可能とするWebファイ
ルを提供することである。
るため、本発明は、請求項1に記載されるように、イン
ターネットに接続してインターネット上で提供されるW
eb表示形式を示すWebファイルによって表示される
Web情報を、電話回線網を経由して接続される情報要
求元に音声によって情報提供を行う音声情報提供システ
ムにおいて、上記Web情報の読み方順を定義するスク
リプトファイルを解析して、読み上げ情報を生成するス
クリプト解析手段と、上記スクリプト解析手段によって
生成された読み上げ情報を音声化して、電話回線網を経
由して情報要求元に該Web情報を音声で提供する電話
情報提供手段とを有するように構成される。
上で提供されるWeb情報を読み方順に基づいて、電話
回線網を経由して情報要求元に提供することができる。
ターネット上で提供されるWeb情報を取得することが
できるため、コンピュータを使う手間を省くことが可能
となる。特に、利用者が視覚障害者である場合、コンピ
ュータを使用することなく、インターネット上で提供さ
れるWeb情報を電話機の操作のみで容易に取得するこ
とができる。また、読み方順に基づいて読み上げ情報が
生成されるため、効率的な音声による情報提供を行なう
ことができる。
電話機等を利用する利用者である。
開されるホームページ等である。
読み方(読む方向、音声の強弱)と読む順番を示す。
理を行うCTI(Computer Telephony Integration)ボ
ード等を制御するプログラムより実現する。
するという観点から、本発明は、請求項2に記載される
ように、請求項2記載の音声情報提供システムにおい
て、上記スクリプト解析手段は、上記スクリプトファイ
ルによって他Web情報へリンクを示すリンク表示情報
の読み方順が定義されている場合、該リンク表示情報で
あることを示す読み上げ情報を生成するように構成する
ことができる。
リンクを示すリンク表示情報の読み方順の定義を解析し
た読み上げ情報に基づいて音声化されるため、利用者
は、音声にてリンクがあることを区別することができ
る。
判断することができるという観点から、本発明は、請求
項3に記載されるように、請求項1又は2記載の音声情
報提供システムにおいて、上記スクリプト解析手段は、
上記スクリプトファイルによってデータの入力を示す入
力表示情報の読み方順が定義されている場合、該入力表
示情報であることを示す読み上げ情報を生成するように
構成することができる。
示す入力表示情報の読み方順の定義を解析した読み上げ
情報に基づいて音声化されるため、利用者は、音声にて
データの入力があることを区別することができる。
とができるという観点から、本発明は、請求項4に記載
されるように、請求項1乃至3のいずれか一項記載の音
声情報提供システムにおいて、上記スクリプト解析手段
は、上記スクリプトファイルによって、上記表示情報に
おいて同一行内の複数の項目毎に、次の項目分けがされ
ている行までをブロック化したブロック情報によって読
み方順が定義されている場合、該読み方順に基づいてブ
ロック毎に読み上げ情報を生成するように構成すること
ができる。
ロック毎に読み上げ情報が生成され音声化されるため、
異なる分類の項目内容を混在させて音声化することがな
い。
声にて取得することができる。
を効率的に行なうという観点から、本発明は、請求項5
に記載されるように、請求項1乃至4のいずれか一項記
載の音声情報提供システムにおいて、情報要求元による
音声を認識してデータ化すると共に、該音声を正しく認
識したかを該情報要求元に確認する音声認識手段と、検
索情報をジャンル毎に分類するジャンルテーブルと、ジ
ャンルに応じて検索するWeb情報を対応させた検索W
ebテーブルとを、該ジャンルを識別するジャンル識別
情報に基づいて関連付けして管理する検索情報管理手段
と、上記音声認識手段によって正しく認識された情報要
求元の所望の検索情報に応じて、上記検索情報管理手段
によって管理される上記ジャンルテーブルと上記検索W
ebテーブルとを検索することによって取得したWeb
情報に基づいて、インターネットに接続するインターネ
ット接続手段とを有する構成することができる。
ルと検索Webテーブルとを管理する検索情報管理手段
を有し、インターネットへ接続する際に、情報要求元の
所望の検索情報に応じたWeb情報を予め取得する。
得を効率よく行なうことができる。
報提供をするという観点から、本発明は、請求項6に記
載されるように、請求項1乃至4のいずれか一項記載の
音声情報提供システムにおいて、情報要求元を認証する
認証情報を登録し管理する認証情報管理手段と、上記認
証情報管理手段によって管理された認証情報に基づい
て、電話回線網を経由して接続される上記情報要求元を
認証する認証手段とを有し、上記電話情報提供手段は、
上記認証手段による認証結果に応じて、上記スクリプト
解析手段によって生成された読み上げ情報に基づいて、
電話回線網を経由して情報要求元に該Web情報を音声
で提供する電話情報提供手段とを有するように構成する
ことができる。
求元を認証する認証情報に基づいて、電話回線網を経由
して接続される情報要求元を認証することができる。
証を可能とし、かつ、Web情報の提供を受けることが
できる。
は、インターネットに接続してインターネット上で提供
されるWeb表示形式を示すWebファイルによって表
示されるWeb情報を、電話回線網を経由して接続され
る情報要求元に音声によって情報提供を行う音声情報提
供方法において、上記Web情報の読み方順を定義する
スクリプトファイルを解析して、読み上げ情報を生成す
るスクリプト解析手順と、上記スクリプト解析手順によ
って生成された読み上げ情報を音声化して、電話回線網
を経由して情報要求元に該Web情報を音声で提供する
電話情報提供手順とを有するように構成される。
ネット上で提供されるWeb情報を電話回線網を経由し
て情報要求元に提供することを可能とする。
は、インターネットに接続してインターネット上で提供
されるWeb表示形式を示すWebファイルによって表
示されるWeb情報を、電話回線網を経由して接続され
る情報要求元に音声によって情報提供を行う音声情報提
供システムインターネット上で提供されるWeb情報を
情報要求元に音声によって情報提供を行う音声情報提供
システムでの処理をコンピュータに行なわせるためのプ
ログラムを格納した記憶媒体において、上記Web情報
の読み方順を定義するスクリプトファイルを解析して、
読み上げ情報を生成するスクリプト解析手順と、上記ス
クリプト解析手順によって生成された読み上げ情報を音
声化して、電話回線網を経由して情報要求元に該Web
情報を音声で提供する電話情報提供手順とを有するよう
に構成される。
は、コンピュータに、インターネット上で提供されるW
eb情報を電話回線網を経由して情報要求元に提供する
ことを可能とする。
は、請求項9に記載されるように、インターネットへ情
報提供を行なうWeb表示形式を示すWebファイルに
おいて、上記表示形式によって表示される表示情報の読
み方順を定義するスクリプトファイルと関連付けるスク
リプトファイル関連付け手段を有し、該Webファイル
がアクセスされた際、関連付け手段によって関連付けら
れるスクリプトファイルを提供するように構成される。
定義されたスクリプトファイルを提供することができる
ため、Webファイルの表示情報を読み方順に基づいて
音声化することが可能となる。
に基づいて説明する。
テムの構成概要は、例えば、図2に示すようになってい
る。
の機能構成の例を示す図である。
ンターネット情報音声変換装置100は、サーバーコン
ピュータとして機能する請求項1記載の音声情報提供シ
ステムに対応し、主に、音声処理を行うCTI(Comput
er Telephony Integration)ボード110と、利用者の
認証及び指定のホームページを検索するコンテンツ処理
部120と、インターネットへのアクセスに関するデー
タベース130と、インターネットに接続するインター
ネット接続部140と、ホームページのスクリプトを解
析するスクリプト解析部150とを有する。
線20を経由してインターネット情報音声変換装置10
0に接続し、該インターネット情報音声変換装置100
からインターネット上の情報を音声で提供を受ける。
0によって接続した利用者の音声を認識しディジタル化
する音声認識処理部111と、インターネット上の提供
情報を音声化する音声合成処理部112等とを有する。
識処理部111によってディジタル化された情報に基づ
いて操作の確認を行なう操作内容確認部121と、イン
ターネットの検索項目を入力する検索入力部122と、
電話機10によって接続した利用者が会員であるかを認
証する認証処理部123と、Webに接続中であること
を利用者に案内するWeb接続待機案内部124と、検
索結果を通知する検索結果案内部125とを有し、イン
ターネット情報音声変換装置100の全体を制御する。
コンテンツ処理部120による入力された音声による操
作指示の確認のためのフィードバック、および、インタ
ーネット情報の提供等は、CTIボード110の音声合
成処理部112によって音声化され、電話機10を利用
している利用者へ提供される。
ット上の情報検索を行なうWebが登録された検索項目
データベース131と、利用者情報が登録され利用者の
認証を行なう認証データベース132とを有する。検索
項目データベース131には、例えば、主な検索エンジ
ンを提供するWebアドレスが登録されている。
よって制御され、データベース130のデータベース情
報は、該コンピュータが制御するハードディスク等の補
助記憶装置等に格納される。
電話回線20を経由しインターネット情報音声変換装置
100に接続する。この接続によって、利用者の認証を
行なうため認証処理部123が起動する。認証処理部1
23は、利用者情報に応じてデータベース130の認証
データベースを検索し利用者を認証する。
理部120の認証処理部部121の認証指示に応じて電
話機10から入力された認証番号等である。
111によって利用者のディジタル化された音声情報を
繰り返し利用者に提供することによって利用者への確認
(フィードバック)を行なう。
操作指示に従って、利用者は、Webを検索するキーワ
ードを電話10から音声で入力する。
2は、利用者によって入力されたキーワードに基づい
て、データベース130の検索項目データベース131
から検索に適した検索エンジンのWebアドレスを抽出
する。コンテンツ処理部120は、抽出した検索エンジ
ンのWebアドレスに基づいて、インターネット接続部
140によってインターネット30へ接続を行なう。
じた検索結果を提供するまでの間、コンテンツ処理部1
20のWeb接続待機案内部124は、利用者へ待機案
内をし続ける。
エンジンのWebアドレスへの接続が完了すると、利用
者のキーワードに基づいて、情報検索を行なう。該検索
エンジンによって検索されたWebファイル(HTM
L)40のスクリプトファイル41をダウンロードす
る。
1は、スクリプト解析部150で解析される。
部150による解析結果に応じて、音声化データを生成
し、音声合成処理部112へ該音声化データを通知す
る。
化データの音声合成処理を行い、電話機10へ情報を出
力する。
声変換装置による処理の概要を示すフローチャート図で
ある。
話機10を用いてインターネット情報音声変換装置10
0に接続する(ステップ(A−1))。接続通知をCT
Iボード110から受けたコンテンツ処理部120は、
音声合成処理112を経由して、認証に関する目次情報
を利用者の電話機10に提供する(ステップ(B−
1))。利用者は、音声提供された該当目次情報に基づ
いて、電話機10から情報を入力する(ステップ(A−
2))。登録済みの利用者である場合にはIDを入力し
(ステップ(A−4))、新規の利用者である場合には
該目次情報で指定された番号を電話機10から入力する
(ステップ(A−2))。
コンテンツ処理部120の認証処理部123は、受信し
た利用者からの情報が新規利用者の登録であるかを判断
する(ステップ(B−2))。利用者のIDが通知され
た場合、ステップ(B−5)に進む。一方、新規利用者
の登録である場合、認証処理部123は、利用者に個人
情報の登録を指示する(ステップ(B−22)。
置100からの個人情報の登録指示に従い、氏名、電話
番号又はパスワード等の個人情報の入力を行なう(ステ
ップ(A−3))。
データベース130の認証データベース132へ該個人
情報を登録する(ステップ(B−3)。続けて、認証処
理部123は、利用者へIDの入力を指示する(ステッ
プ(B−4))。
ップ(A−4))。
Dを認証データベース132に問い合わせし、登録され
ているかを判断する(ステップ(B−5))。利用者の
登録データがない場合、再度、ID入力を指示しステッ
プ(B−4)に戻り(ステップ(B−7))、再ID入
力が所定回数を超えた場合は情報提供処理を終了する。
登録データがある場合、利用者に対し閲覧したいインタ
ーネット情報の検索操作を音声で指示する(ステップ
(B−6))。
を検索するキーワードを音声で指示する(ステップ(A
−5))。
て、CTIボード110の音声認識処理部111は、利
用者によって指示された音声キーワードを認識しディジ
タル化する。コンテンツ処理部120では、ディジタル
化された音声キーワードを繰り返して、利用者にフィー
ドバックし認識が正しかったかを利用者に判断を依頼す
る(ステップ(B−8))。
ワードを確認し、確認結果を通知する(ステップ(A−
6))。
おいて、コンテンツ処理部120は、利用者の確認結果
について判断する(ステップ(B−9))。利用者の確
認結果の通知に基づいて、フィードバックした音声キー
ワードで問題ない場合、次のステップ(B−92)へ進
む。一方、フィードバックした音声キーワードが正しく
認識されていなかった場合、ステップ(B−6)へ戻
り、閲覧したいインターネット情報の検索操作(キーワ
ードの設定)を利用者に音声で指示する。
ツ処理部120の検索入力部122は、利用者が指定し
たキーワードに基づいて、検索項目データベース131
から関連するWebアドレスを含むWeb情報を取得す
る。検索項目データベース131から取得した該Web
情報は、検索結果案内部125によって、利用者へ検索
結果案内として提供される(ステップ(B−92))。
情報音声変換装置100から受ける(ステップ(A−6
2))。
コンテンツ処理部100は、検索したWebホームペー
ジが提供されるインターネットへの接続を行なうかを、
利用者に音声で質問する(ステップ(B−10))。
否かを操作指示する(ステップ(A−7))。利用者に
よる操作指示は、音声または電話機10(プッシュホ
ン)のダイヤルで行なう。
Webホームページ情報に従ってインターネットへ接続
をする場合、次のステップ(B−112)へ進み、接続
しない場合、ステップ(B−10)へ戻る。
ンツ処理部120は、利用者によって接続指示のあった
ホームページ情報に基づいて、接続要求をインターネッ
ト接続部140へ行なう(ステップ(B−112))。
該接続要求を受けたインターネット接続部140は、イ
ンターネットに接続し、該Webホームページ情報で指
定されるURL(Uniform Resource Locator)へ接続す
る。URLへの接続が完了するまで、利用者へ接続中で
あることを音声で通知する(ステップ(B−12))。
置100から音声で接続中であることを聞く(ステップ
(A−8))。
00によるインターネット接続によって、該URLに応
じたWebファイル40のHTMLが記載されたScr
iptファイル41がインターネット情報音声変換装置
100へダウンロードされる(ステップ(C−1))。
スクリプト解析部150は、ダウンロードしたScri
ptファイル41の内容を解析し、音声に変換する(ス
テップ(B−13))。
tファイル41の解析結果に基づいて、CTIボード1
10の音声合成処理部112は、音声合成した情報を電
話機10へ提供する(ステップ(B−14))。
置100から提供される音声によるインターネット情報
を聞く(ステップ(A−9))。
スクリプト解析部150は、Webファイル40内のリ
ンク先への接続を行なうか否かの接続選択を利用者に音
声で質問する(ステップ(B−15))。つまり、スク
リプト解析部150は、利用者へのスクリプトファイル
41の音声による情報提供の際、リンク先がある場合に
は、その都度、利用者が接続するか否かを選択できるよ
うに音声案内を行なう。
の接続を行なうか否かをインターネット音声変換装置1
00へ指示する(ステップ(A−10))。
コンテンツ処理部120は、利用者がリンク先への接続
を指示したか否かを判断する(ステップ(B−1
6))。接続を指示した場合、ステップ(B−112)
へ移行しインターネット接続部140に該リンク先への
接続を指示する。接続を指示しなかった場合、ステップ
(B−13)へ移行しスクリプトファイルの内容を継続
して情報提供を行なう。
音声による提供が終了した場合、或いは、音声による提
供の途中で次の検索結果の情報を取得する場合、利用者
は、次の検索結果の接続情報をインターネット情報音声
変換装置100へ指示する(ステップ(A−11))。
コンテンツ処理部120は、次の検索結果の情報を取得
の要求を受けると、ステップ(B−10)へ移行し、ス
テップB−92において検索した次のWebホームペー
ジに接続するかを利用者に指示する。
0での処理は、電話機10によって接続された回線の切
断によって終了する。
入力部112によって実行される検索処理について説明
する。
は、ジャンルテーブル51と、検索エンジンテーブル5
2等とを有する。ジャンルテーブル51と検索エンジン
テーブル52とはジャンルコードによって関連付けられ
ている。
処理は、利用者に確認済みのキーワードに基づいて、ジ
ャンルテーブル51から該キーワードが分類されるジャ
ンルを検索する。例えば、該キーワードが「音楽」の場
合、該キーワードはジャンル「音楽」および「教育」等
の複数のジャンルに分類される。また、例えば、該キー
ワードが「スポーツ」の場合、該キーワードはジャンル
「スポーツ」および「ニュース」等に分類される。
複数のジャンルのジャンルコードに応じた接続先情報お
よび接続先名称等の関連情報を、検索エンジンテーブル
52から取得する。接続先情報は、例えば、Webホー
ムページのアドレス等である。接続先名称は、例えば、
Webホームページのタイトル名等であり、利用者への
検索結果の案内時に使用される。
した最大件数に応じて、利用者へ提供するようにすれば
よい。例えば、最大件数が10件であれば、検索エンジ
ンテーブル52から検索された順に、最初から10件を
検索結果案内として提供する。
らステップ(B−15)におけるスクリプト解析部15
0によるスクリプト解析処理について説明する。
て、図6で説明する。
フローチャート図である。
識する順番と同じように読み上げる為の方法が記述して
あるスクリプトファイルに基づいて、図2のスクリプト
解析部150は、1つのページが複数に区切られている
フレームを使用しているかを判断する(S101)。複
数のフレームに区切られていない場合、ステップS10
3を実行する。複数のフレームに区切られている場合、
ステップS102を実行する。
部、左部分に位置するフレームに対応するWebファイ
ルから認識して読み上げる。
ルの上部より、左部から右部へ移動しながら認識し、W
ebファイル下部まで文字部分を読み上げる。
は、リンクとわかるように、通常の文字部分とは区別し
て読み上げる。例えば、読み上げる音声のピッチを変え
るか、読み上げるときに「リンクします。」を加える
か、もしくは、警告音などを加えるようにする。
の利用者に入力を示唆する部分は、フォームなど利用者
に入力を示唆する部分であることがわかるように、通常
の文字部分とは区別して読み上げる。例えば、リンク部
分の読み上げ方法と同様に、読み上げる音声のピッチを
変えるか、読み上げるときに「リンクします。」を加え
るか、もしくは、警告音などを加えるようにする。
毎に読み上げる。つまり、テーブルの使用の有無を問わ
ず、ブロックで指定される範囲を認識し、そのブロック
毎に読み上げる(詳細は後述される)。
ァイル41で指定することによって、スクリプト解析部
150は、スクリプトファイル41の記述に従って、W
ebファイルの内容を読み上げることができる。このス
クリプトファイル41では、例えば、読み上げが必要な
順に、フレームの順番を指定することも可能である。
毎、又は、フレーム毎に添付されることによって、読み
上げ途中で、フォーム又はリンクが指定された場合に
も、指定される読み上げ順に従って音声提供を行なうこ
とができる。
ックに区切った場合を説明する。
切った場合の例を示す図である。
ックで区切った場合が示される。
記述してある場合に、項目毎にブロックによって区切ら
れる。この場合、行1に、項目「今日の天気(主要都
市)」と項目「経済情報」とが記述されている。
目分けがされていない行までをブロックの行範囲とす
る。この場合、行1から行5までの5行が行範囲とな
る。
を空白部分も含めて数え、最大の文字数を文字範囲とし
て認識する。この場合、ブロック1の文字範囲は、およ
そ30文字であって、ブロック2の文字範囲は、およそ
20文字である。
2は、例えば、スクリプトファイルに、BLOCK(行
内のブロック数,行範囲,文字範囲)のように記述され
る。従って、ブロック1は、BLOCK(2,5,3
0)のように記述され、ブロック2は、BLOCK
(2,5,20)のように記述される。
K()スクリプトで記述されるブロック範囲を、スクリ
プトファイルで指定される読み上げ順に従って、例え
ば、左部分から1ブロックづつ読み上げる毎に右へ移動
し、次のブロックを読み上げる。この場合、ブロック1
が最初に読み上げられ、内容64「今日の天気(主要都
市)」、内容65「札幌 雨・東京 曇りのち晴・大阪
晴」、内容66「降水確率100%・降水確率20%
・降水確率0%」、内容67「その他の地域」の順に利
用者へ音声提供される。次に、ブロック2が読み上げら
れ、内容68「日経情報」、内容69「日経平均 15
000.55」、内容70「円相場110.55」、内
容71「マネー情報」のように読み上げられる。
ある場合、内容67は「リンク1、その他の地域」、内
容71は「リンク2、マネー情報」として読み上げるこ
とによって、利用者にリンク情報であることを音声で提
供することができる。利用者、リンクの番号を利用者の
電話機10から入力することによって、指定のリンク先
へジャンプすることができる。
K()スクリプトを記述することによって、ブロックを
スクリプト解析部150に認識させることができる。ま
た、スクリプト解析部150自身が、上述のようなBL
OCK()スクリプトを生成する仕組みを持つことで、
Web画面上のブロックを認識するようにし、スクリプ
トファイル41では、BLOCK()の読み上げ規則を
指定するのみとしても良い。
上げ順を図6の解析処理に従って説明する。
示す図である。Web画面がフレーム1及び2によって
縦に分割された例を示す。
は、図6の解析処理に従って、ステップS101にてフ
レームを使用していると判断する(ステップS10
1)。よって、ステップS102が実行され、フレーム
1から順に読み上げを開始する。
03に従い、フレーム1の上部より左部から右部へ移動
しながら文字部分を読み上げる。
示す図である。
部150は、上部から読み上げを開始し、表示内容20
7および208に対応して、「テキスト入力域」「検索
ボタン」のように利用者へ音声提供をする。さらに、ス
テップS104に従い、表示内容210、211、およ
び、212に対応し、「リンク1、ニュース」「リンク
2、天気」「リンク3、経済」のように利用者がリンク
を選択できるように音声提供される。利用者は、図3の
ステップ(A−10)で、例えば、リンク番号を選択す
ることによって、リンク先のWebホームページへ接続
し、インターネット情報を音声によって提供を受けるこ
とができる。以下同様とする。
容213および214に対応して、「新規加入受付中」
「抽選で豪華賞品プレゼント」として利用者へ音声提供
する。
部150は、フォーム2によって表示される表示内容2
16、表示内容217、表示内容218、表示内容21
9、表示内容220、表示内容221、表示内容22
2、および、表示内容223に対応して、「お名前」
「テキスト入力域」「メールアドレス」「テキスト入力
域」「性別」「ラジオボタン、オフ、男性」「ラジオボ
タン、オフ、女性」「ラジオボタン、オフ、その他」の
ように利用者へ音声提供を行なう。
表示内容224及び表示内容225に対応して、「年
齢」「選択域」のように選択域であることが分かるよう
に、利用者へ音声提供を行なう。同様に、表示内容22
6及び表示内容227に対応して「職業」「選択域」、
表示内容228及び表示内容229に対応して「住ま
い」「選択域」のように、利用者へ音声提供を行なわれ
る。
8及び表示内容240に対応して、「ご感想など」「テ
キスト入力域、なんでもご自由にお書きください。」の
ように音声提供を行なう。
に対応して、「送信ボタン」「書き直しボタン」のよう
に、クリックボタンであることがわかるように利用者へ
音声提供される。
ム1が読み終わるとフレーム2を順に読み上げ始める。
を示す図である。
同様に、ステップS103に従って、上部より左部から
右部へと読み上げる。図10より、スクリプト解析部1
50は、表示内容245及び246に対応して、「祝つ
いに開設しました。お早う。今日もがんばろう。」「ホ
ームページ検索エンジン」のように利用者へ音声提供さ
れる。
析部150は、表示内容247、248、249及び2
50に対応して、「このサービスに」「リンク4、ログ
イン」「リンク5、新規登録」「リンク6、ヘルプ」の
ように、利用者がリンクを選択できるように音声提供さ
れる。リンク番号は、ページ内又はフレーム内で一意に
採番されるようにすれば良い。利用者は、図3のステッ
プ(A−10)で、リンク番号を選択することによっ
て、リンク先のWebホームページへ接続し、インター
ネット情報を音声によって提供を受けることができる。
析部150は、フォーム1にて表示される表示内容25
2、253及び254に対応して、「テキスト入力域」
「検索ボタン」「検索条件指定」のように利用者へ音声
提供される。
析部150は、表示内容256、257、258に対応
して、「リンク7、ニュース」「リンク8、天気」「リ
ンク9、経済」のように利用者へ音声提供される。以
下、表示内容259までの下線が引かれた表示内容につ
いても同様に、リンク番号と共に音声提供される。
キャンペーン」のように利用者へ音声提供される。ま
た、表示内容260及び261に対応して、「トピック
ス」リンク24、激増する10代の犯罪」のように利用
者へ音声提供される。
ステップS104に従って、「ニュース」「リンク2
7、タレントの○○△さん死去(□□スポーツ)」「リ
ンク28、「△○×」カンヌ映画祭に出展。各国から絶
賛(△△新聞社)」のように利用者へ音声提供される。
プト解析部150は、図7で示されるように、表示内容
64から71を2つのブロックとして認識する。そし
て、ブロック1が最初に読み上げ、表示内容64「今日
の天気(主要都市)」、表示内容65「札幌 雨・東京
曇りのち晴・大阪 晴」、表示内容66「降水確率1
00%・降水確率20%・降水確率0%」、表示内容6
7「その他の地域」の順に利用者へ音声提供される。次
に、ブロック2が読み上げ、表示内容68「日経情
報」、表示内容69「日経平均 15000.55」、
表示内容70「円相場110.55」、表示内容71
「マネー情報」のように読み上げられる。
上記同様に、リンク番号と共に音声提供される。
の例を示す図である。Web画面がフレーム2及び3に
よって横に分割された例を示す。
図6の解析処理に従って、ステップS101にてフレー
ムを使用していると判断する(ステップS101)。よ
って、ステップS102が実行され、フレーム2から順
に読み上げを開始する。
03に従い、フレーム2の上部より左部から右部へ移動
しながら文字部分を読み上げる。フレーム2の表示内容
の音声提供は、図10での説明と同様である。
表示内容を最後まで音声提供すると、フレーム3を図6
の解析処理に従って、上記同様に、上部より左部から右
部へと下部まで文字部分を読み上げる。つまり、この場
合、ステップS105に従って、スクリプト解析部15
0は、フォーム2にて表示される表示内容271及び2
72に対応して、「テキスト入力域」「検索ボタン」の
ように利用者へ音声提供される。
合においても同様の手順によって音声提供される。
な読み方順をスクリプトファイル41にて提供すること
によって、表現の場であるホームページの作成方法を変
更することなく、利用者へインターネット情報を音声に
て提供することが可能となる。
インターネット情報を取得することが可能となる。
号をダイアルするのみで所望のホームページへとジャン
プすることができる。
る。
音声変換装置100は、CPU(Central Processing U
nit)11、メモリユニット12、出力ユニット13、
入力ユニット14、表示ユニット15、補助記憶装置1
6、CD−ROM(Compact Disc Read Only Memory)ド
ライブユニット17及び通信ユニット18を有してい
る。これらの各ユニット11、12、13、14、1
5、16、17及び18は、バスBに接続されている。
されたプログラムに従って当該インターネット情報音声
変換装置100を制御すると共に、上述されたインター
ネット情報音声変換装置100での処理を行う。メモリ
ユニット12は、RAM(Random Access Memory)及びR
OM(Read Only Memory)にて構成され、CPU11にて
実行されるプログラム、CPU11での処理に必要なデ
ータ、CPU11での処理にて得られたデータ等を格納
する。また、メモリユニット12の一部の領域が、CP
U11での処理に利用されるワークエリアとして割り付
けられている。
等を有し、上記インターネット情報音声変換装置100
での処理を行なうためのデータ入力や入力したデータの
変更等、必要な各種情報を入力するために用いられる。
表示ユニット15は、CPU11の制御のもとに該イン
ターネット情報音声変換装置100の管理者等に必要な
各種情報を表示する。
スクユニットにて構成され、各種ファイル、データ、テ
ーブル、プログラムを格納する。
での処理に係るプログラムは、例えば、CD−ROM(C
ompact Disc Read Only Memory)19によって当該シス
テムに提供される。即ち、該インターネット情報音声変
換装置100での処理に係るプログラムが保存されたC
D−ROM19がCD−ROMドライブユニット17に
セットされると、CD−ROMドライブユニット17が
CD−ROM19から当該プログラムを読み出し、その
読み出されたプログラムがバスBを介して補助記憶装置
16にインストールされる。そして、この該インターネ
ット情報音声変換装置100での処理が起動されると、
補助記憶装置16にインストールされた当該プログラム
に従ってCPU11がその処理を開始する。尚、当該プ
ログラムを格納する媒体としてCD−ROM19に限定
するものではなく、コンピュータが読み取り可能な媒体
であればよい。
接続部140及び上述CTIボード110を有し、イン
ターネットへの接続及びインターネット上で提供される
情報のダウンロード、または、該CTIボード110に
接続された電話機10への音声化された情報の提供等を
行なう。
00によって、利用者は、インターネット情報を電話機
10から取得することが可能となり、コンピュータの操
作に煩わされることがない。また、インターネット情報
音声変換装置100は、音声化に対応していないインタ
ーネット情報を、利用者に電話回線網を経由して提供す
ることができる。
って実行されるスクリプト解析処理は、ダウンロードし
たスクリプトファイル41からスクリプトを読み込み、
読み込んだスクリプトに記載されたルールに基づいて、
Webファイルの情報を音声で提供する。
プト解析部150での処理が請求項1のスクリプト解析
手段に対応し、図2に示す音声合成処理部112での処
理が請求項1の電話情報提供手段に対応する。
よれば、利用者は、電話機を利用してインターネット上
で提供されるWeb情報を取得することができるため、
コンピュータを利用しなくてもWeb情報を取得するこ
とが可能となる。従って、音声と電話機の操作のみによ
り幅広いWeb情報を取得することが可能となる。
上で提供されるWeb情報を電話回線網を経由して情報
要求元に提供することを可能とし、また、音声化を対象
としていないWeb情報の提供も行なえる音声情報提供
方法を提供することができる。
声情報提供システムでの処理をコンピュータに行なわせ
るためのプログラムを格納した記憶媒体を提供すること
ができる。
能構成の例を示す図である。
る処理概要を示すフローチャート図である。
る処理概要を示すフローチャート図である。
ーチャート図である。
た例を示す図である。
図である。
図である。
示す図である。
例を示す図である。
る。
Claims (9)
- 【請求項1】 インターネットに接続してインターネッ
ト上で提供されるWeb表示形式を示すWebファイル
によって表示されるWeb情報を、電話回線網を経由し
て接続される情報要求元に音声によって情報提供を行う
音声情報提供システムにおいて、 上記Web情報の読み方順を定義するスクリプトファイ
ルを解析して、読み上げ情報を生成するスクリプト解析
手段と、 上記スクリプト解析手段によって生成された読み上げ情
報を音声化して、電話回線網を経由して情報要求元に該
Web情報を音声で提供する電話情報提供手段とを有す
る音声情報提供システム。 - 【請求項2】 請求項1記載の音声情報提供システムに
おいて、 上記スクリプト解析手段は、上記スクリプトファイルに
よって他Web情報へリンクを示すリンク表示情報の読
み方順が定義されている場合、該リンク表示情報である
ことを示す読み上げ情報を生成するようにした音声情報
提供システム。 - 【請求項3】 請求項1又は2記載の音声情報提供シス
テムにおいて、 上記スクリプト解析手段は、上記スクリプトファイルに
よってデータの入力を示す入力表示情報の読み方順が定
義されている場合、該入力表示情報であることを示す読
み上げ情報を生成するようにした音声情報提供システ
ム。 - 【請求項4】 請求項1乃至3のいずれか一項記載の音
声情報提供システムにおいて、 上記スクリプト解析手段は、上記スクリプトファイルに
よって、上記表示情報において同一行内の複数の項目毎
に、次の項目分けがされている行までをブロック化した
ブロック情報によって読み方順が定義されている場合、
該読み方順に基づいてブロック毎に読み上げ情報を生成
するようにした音声情報提供システム。 - 【請求項5】 請求項1乃至4のいずれか一項記載の音
声情報提供システムにおいて、 情報要求元による音声を認識してデータ化すると共に、
該音声を正しく認識したかを該情報要求元に確認する音
声認識手段と、 検索情報をジャンル毎に分類するジャンルテーブルと、
ジャンルに応じて検索するWeb情報を対応させた検索
Webテーブルとを、該ジャンルを識別するジャンル識
別情報に基づいて関連付けして管理する検索情報管理手
段と、 上記音声認識手段によって正しく認識された情報要求元
の所望の検索情報に応じて、上記検索情報管理手段によ
って管理される上記ジャンルテーブルと上記検索Web
テーブルとを検索することによって取得したWeb情報
に基づいて、インターネットに接続するインターネット
接続手段とを有する音声情報提供システム。 - 【請求項6】 請求項1乃至5のいずれか一項記載の音
声情報提供システムにおいて、 情報要求元を認証する認証情報を登録し管理する認証情
報管理手段と、 上記認証情報管理手段によって管理された認証情報に基
づいて、電話回線網を経由して接続される上記情報要求
元を認証する認証手段とを有し、 上記電話情報提供手段は、上記認証手段による認証結果
に応じて、上記スクリプト解析手段によって生成された
読み上げ情報に基づいて、電話回線網を経由して情報要
求元に該Web情報を音声で提供する電話情報提供手段
とを有する音声情報提供システム。 - 【請求項7】 インターネットに接続してインターネッ
ト上で提供されるWeb表示形式を示すWebファイル
によって表示されるWeb情報を、電話回線網を経由し
て接続される情報要求元に音声によって情報提供を行う
音声情報提供方法において、 上記Web情報の読み方順を定義するスクリプトファイ
ルを解析して、読み上げ情報を生成するスクリプト解析
手順と、 上記スクリプト解析手順によって生成された読み上げ情
報を音声化して、電話回線網を経由して情報要求元に該
Web情報を音声で提供する電話情報提供手順とを有す
る音声情報提供方法。 - 【請求項8】 インターネットに接続してインターネッ
ト上で提供されるWeb表示形式を示すWebファイル
によって表示されるWeb情報を、電話回線網を経由し
て接続される情報要求元に音声によって情報提供を行う
音声情報提供システムインターネット上で提供されるW
eb情報を情報要求元に音声によって情報提供を行う音
声情報提供システムでの処理をコンピュータに行なわせ
るためのプログラムを格納した記憶媒体において、 上記Web情報の読み方順を定義するスクリプトファイ
ルを解析して、読み上げ情報を生成するスクリプト解析
手順と、 上記スクリプト解析手順によって生成された読み上げ情
報を音声化して、電話回線網を経由して情報要求元に該
Web情報を音声で提供する電話情報提供手順とを有す
るプログラムを格納した記憶媒体。 - 【請求項9】 インターネットへ情報提供を行なうWe
b表示形式を示すWebファイルにおいて、 上記表示形式によって表示される表示情報の読み方順を
定義するスクリプトファイルと関連付けるスクリプトフ
ァイル関連付け手段を有し、 該Webファイルがアクセスされた際、関連付け手段に
よって関連付けられるスクリプトファイルを提供するW
ebファイル。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001167173A JP2002358194A (ja) | 2001-06-01 | 2001-06-01 | 音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001167173A JP2002358194A (ja) | 2001-06-01 | 2001-06-01 | 音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2002358194A true JP2002358194A (ja) | 2002-12-13 |
Family
ID=19009599
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001167173A Pending JP2002358194A (ja) | 2001-06-01 | 2001-06-01 | 音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2002358194A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006201977A (ja) * | 2005-01-19 | 2006-08-03 | Kyocera Corp | 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム |
| JP2007087267A (ja) * | 2005-09-26 | 2007-04-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声ファイル生成装置、音声ファイル生成方法およびプログラム |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10164249A (ja) * | 1996-12-03 | 1998-06-19 | Sony Corp | 情報処理装置 |
| JPH10274998A (ja) * | 1997-03-31 | 1998-10-13 | Sanyo Electric Co Ltd | 文書読み上げ方法および文書読み上げ装置 |
| JP2000137596A (ja) * | 1998-10-06 | 2000-05-16 | Lucent Technol Inc | 対話型音声応答システム |
-
2001
- 2001-06-01 JP JP2001167173A patent/JP2002358194A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10164249A (ja) * | 1996-12-03 | 1998-06-19 | Sony Corp | 情報処理装置 |
| JPH10274998A (ja) * | 1997-03-31 | 1998-10-13 | Sanyo Electric Co Ltd | 文書読み上げ方法および文書読み上げ装置 |
| JP2000137596A (ja) * | 1998-10-06 | 2000-05-16 | Lucent Technol Inc | 対話型音声応答システム |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006201977A (ja) * | 2005-01-19 | 2006-08-03 | Kyocera Corp | 携帯端末装置、およびその音声読み上げ方法、並びに音声読み上げプログラム |
| JP2007087267A (ja) * | 2005-09-26 | 2007-04-05 | Nippon Telegr & Teleph Corp <Ntt> | 音声ファイル生成装置、音声ファイル生成方法およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8781840B2 (en) | Retrieval and presentation of network service results for mobile device using a multimodal browser | |
| US7593854B2 (en) | Method and system for collecting user-interest information regarding a picture | |
| US6377927B1 (en) | Voice-optimized database system and method of using same | |
| US6658414B2 (en) | Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals | |
| US8296259B1 (en) | Methods and systems for inventory management | |
| JP4398098B2 (ja) | グラマーテンプレートクエリシステム | |
| US20040176954A1 (en) | Presentation of data based on user input | |
| US20060026206A1 (en) | Telephony-data application interface apparatus and method for multi-modal access to data applications | |
| JP2013521567A (ja) | クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法 | |
| GB2383736A (en) | Interaction with multi-modal picture through image feature selection and voice query | |
| CN1171579A (zh) | 信息处理设备和信息处理方法 | |
| JP3789614B2 (ja) | ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体 | |
| US8200485B1 (en) | Voice interface and methods for improving recognition accuracy of voice search queries | |
| JP2002278977A (ja) | 質問回答装置、質問回答方法及び質問回答プログラム | |
| Sa et al. | Examining user perception and usage of voice search | |
| US20060190240A1 (en) | Method and system for locating language expressions using context information | |
| KR20000024318A (ko) | 인터넷을 이용한 tts 시스템 및 tts 서비스 방법 | |
| KR100381606B1 (ko) | Vxml을 이용한 음성 웹 호스팅 시스템 | |
| JP2002358194A (ja) | 音声情報提供システム、音声情報提供方法及びそのシステムでの処理をコンピュータに行なわせるためのプログラムを格納した記憶媒体 | |
| CN1316076A (zh) | 通过用户轮廓文件驱动将超级链接变换成统一资源定位符 | |
| JPH10164249A (ja) | 情報処理装置 | |
| JP4756764B2 (ja) | プログラム及び情報処理装置並びに情報処理方法 | |
| JP2003319085A (ja) | 音声情報検索装置および音声情報検索方法 | |
| JP2002163171A (ja) | ユーザ支援装置およびシステム | |
| JP2003521762A (ja) | ユーザ・プロファイルに基づいた音声のurl上へのマッピング |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071101 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080213 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090914 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091127 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101207 |