JP2006054517A - Information presenting apparatus, method, and program - Google Patents
Information presenting apparatus, method, and program Download PDFInfo
- Publication number
- JP2006054517A JP2006054517A JP2004232760A JP2004232760A JP2006054517A JP 2006054517 A JP2006054517 A JP 2006054517A JP 2004232760 A JP2004232760 A JP 2004232760A JP 2004232760 A JP2004232760 A JP 2004232760A JP 2006054517 A JP2006054517 A JP 2006054517A
- Authority
- JP
- Japan
- Prior art keywords
- information
- signal
- character information
- video signal
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000005236 sound signal Effects 0.000 claims description 92
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 17
- 239000000284 extract Substances 0.000 description 5
- 230000008520 organization Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
Description
本発明は情報提示装置、方法及びプログラムに係り、特に、放送された映像信号又は音声信号を記録する機能を備えた情報提示装置、該情報提示装置に適用可能な情報提示方法、及び、コンピュータを前記情報提示装置として機能させるための情報提示プログラムに関する。 The present invention relates to an information presentation apparatus, method, and program, and more particularly to an information presentation apparatus having a function of recording a broadcast video signal or audio signal, an information presentation method applicable to the information presentation apparatus, and a computer. The present invention relates to an information presentation program for causing the information presentation apparatus to function.
テレビジョン放送番組録画装置(VTR)によって所望のテレビジョン番組の録画を予約する場合、所望の番組の録画予約に必要な各種の情報、すなわちチャンネルや日付(月日)、録画開始時刻及び録画終了時刻をキー入力する方法が一般的であるが、この方法は操作が煩雑な上に入力誤りが生じ易いという欠点があり、従来より種々の録画予約方法が提案されている。 When reserving recording of a desired television program by a television broadcast program recording device (VTR), various information necessary for reserving recording of the desired program, that is, channel, date (month / day), recording start time and recording end A method of keying in the time is common, but this method has the disadvantages that the operation is complicated and an input error tends to occur, and various recording reservation methods have been proposed.
例えば特許文献1には、放送番組に関する番組情報を取得すると共に、利用者の過去の番組視聴についての視聴履歴情報を取得し、番組情報と視聴履歴情報から利用者が視聴する番組の嗜好を学習し、当該学習の結果を用いて将来放送予定の番組の中から視聴可能性のある番組を検索し、視聴可能性が高く重複のない録画候補となる番組を決定し、その録画候補を自動的に録画予約することで、煩雑な録画予約操作を行うことなく、利用者の嗜好に合致した番組を自動的に録画予約する技術が開示されている。
For example,
また、上記に関連して特許文献2には、キーボードやマイクロフォンを介してキー音源を事前に登録しておき、テレビジョン信号に含まれる音声信号とキー音源とを比較し、音声信号とキー音源との一致を示す検出信号に基づいて音声信号記憶部及び映像信号記憶部を制御することで、番組のハイライトシーン等の所望の場面のみを自動的に抜き出して記録するダイジェスト録画を実現する技術が開示されている。 In relation to the above, in Patent Document 2, a key sound source is registered in advance via a keyboard or a microphone, and the audio signal included in the television signal is compared with the key sound source. That realizes digest recording by automatically extracting and recording only desired scenes such as program highlight scenes by controlling the audio signal storage unit and the video signal storage unit based on a detection signal indicating a match with Is disclosed.
また特許文献3には、入力映像信号を記憶すると共に、映像信号から検索に適した形の特徴値(例えば代表フレームを4分割した個々のブロック毎の色平均値や、音声信号に対して音声解析を行うことで得られたテキストデータから選出したキーワード)を算出して映像特徴値記憶装置に記録し、算出した特徴値が既に記録されている別の映像信号の特徴値の何れかと類似していた場合には、これらの特徴値が関連していることを示す映像関連情報を映像関連情報記憶装置に記録しておき、映像信号を視聴しているユーザから関連映像の視聴が要求された場合に、関連映像信号を再生表示装置で表示する技術が開示されている。
しかしながら、ユーザが視聴を所望する番組は常に一定の基準(ユーザの嗜好等)に従って選択されるとは限らず、ユーザが、通常時のユーザの嗜好等とは合致しない番組の視聴を所望する場合もある。例えば或る日突発的に大きな事件が発生した場合、漏れ伝わる断片的な報道で当該事件の発生を知り興味を持ったユーザは、その日の帰宅後に前記事件の詳細を確認するために、前記事件を報道している番組の視聴を所望する可能性が高い。これに対して特許文献1及び特許文献2に記載の技術は、何れも事前に設定した情報(視聴履歴情報から学習した結果又は事前に登録したキー音源)に基づいて録画予約を行う技術であるので、上記のようにユーザが視聴したい番組が突発的に発生したとしても、当該番組の録画を予約することは不可能である。
However, the program that the user desires to watch is not always selected according to a certain standard (user preference or the like), and the user desires to watch a program that does not match the user's preference or the like at normal times. There is also. For example, when a large incident occurs suddenly on a certain day, a user who is interested in knowing the occurrence of the incident through a fragmented report that leaks out can confirm the details of the incident after returning home on that day. There is a high possibility of wanting to watch a program that reports on On the other hand, the techniques described in
また、ユーザが外出先から録画予約を設定することを可能とする技術も提案されているが、例えば上記のように大きな事件が発生した等の場合には、発生した事件を詳細に報道する特別番組が急遽放送される等のように番組編成が変更され、事前に配布された番組表とは異なる番組編成で放送がされることも多い。そして、変更後の番組編成をユーザが知ることは容易ではないので、上記技術を利用したとしても、番組編成の変更を伴って急遽放送される番組が正しく録画されるように録画予約を設定することは困難である。
また、特許文献3に記載の技術は、或る映像を視聴しているユーザが視聴中の映像に関連する映像の視聴を所望した場合には、ユーザが視聴を所望している映像を提示することができるが、ユーザが所望している映像が視聴中の映像と関連の無い映像であった場合、或いはユーザが映像を視聴していない状態では、ユーザが所望している映像を提示することは不可能である。このため、或る映像を視聴したい場合に、まず視聴したい映像又はそれに関連する映像をユーザ自身が探し出して視聴する必要があり、使い勝手が非常に悪いという問題がある。また、例えば大きな事件の発生を知ったときに、或るユーザはその事件を報道している番組の視聴を所望する一方、別のユーザの関心事はその事件に関係する企業の株価の動向である等、ユーザが視聴を所望する映像はユーザによって大きく相違する。これに対して特許文献3に記載の技術では、自動的に算出した特徴値に基づいて映像信号同士の関連を判断しているので、関連映像として検索・抽出した映像の中にユーザが視聴を所望している映像が含まれていなかったり、これを回避するために検索条件を緩くすると(例えば個々の映像の特徴値としてより多数のキーワードを記録しておき、何れか1つのキーワードが特徴値として記録されている映像を検索する等)、ユーザが視聴を所望している映像と異なる多数の映像が関連映像として検索・抽出されるという問題が生ずる。
In addition, a technology that allows a user to set a recording reservation from the outside is also proposed. For example, when a major incident occurs as described above, a special report that reports the incident in detail is provided. In many cases, the program organization is changed, such as when a program is broadcast suddenly, and the program organization is different from the program table distributed in advance. And since it is not easy for the user to know the program organization after the change, even if the above technique is used, the recording reservation is set so that the program broadcast suddenly with the program organization change is correctly recorded. It is difficult.
Further, the technology described in Patent Document 3 presents a video that the user desires to view when a user who is viewing a video desires to view a video related to the video that is being viewed. However, when the video desired by the user is not related to the video being viewed, or when the user is not viewing the video, the video desired by the user is presented. Is impossible. For this reason, when a user wants to view a certain video, the user first has to search for and view the video he / she wants to watch or a video related thereto, which is very inconvenient. For example, when a user knows that a major incident has occurred, one user wants to watch a program reporting the incident, while another user's interest is the stock price trend of the company related to the incident. For example, the video that the user desires to view varies greatly depending on the user. On the other hand, in the technique described in Patent Document 3, since the relation between the video signals is determined based on the automatically calculated feature value, the user can watch the video searched and extracted as the related video. If the desired video is not included or the search conditions are relaxed to avoid this (for example, a larger number of keywords are recorded as feature values of individual videos, and any one keyword is a feature value. For example, a video that is recorded as a video) is searched and extracted as a related video.
また、上記の問題はテレビジョン放送等で放送された映像を視聴する場合に限られるものではなく、ラジオ放送等で放送された音声を聴取する場合にも同様に生じ得る問題である。 In addition, the above problem is not limited to the case of viewing a video broadcast by a television broadcast or the like, but may also occur when listening to a sound broadcast by a radio broadcast or the like.
本発明は上記事実を考慮して成されたもので、放送された映像又は音声のうちユーザが所望した映像又は音声を簡単かつ確実に視聴又は聴取させることが可能な情報提示装置、情報提示方法及び情報提示プログラムを得ることが目的である。 The present invention has been made in consideration of the above facts, and is an information presentation apparatus and an information presentation method capable of easily and surely viewing or listening to a desired video or audio among broadcasted video or audio. And to obtain an information presentation program.
上記目的を達成するために請求項1記載の発明に係る情報提示装置は、放送中の映像信号又は音声信号を受信する受信手段と、前記受信手段によって受信された映像信号又は音声信号を記録媒体へ記録する記録手段と、前記受信された映像信号に含まれる音声信号又は前記受信された音声信号を音声認識によって文字情報へ変換する音声認識手段と、前記音声認識手段による音声認識によって得られた文字情報を、前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録する文字情報記録手段と、前記文字情報記録手段によって記録媒体に記録された文字情報に対し、ユーザによって指定された検索対象語句を検索する検索手段と、前記検索手段による検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示する提示手段と、を含んで構成されている。
In order to achieve the above object, an information presentation apparatus according to the invention described in
請求項1記載の発明では、放送中の映像信号又は音声信号が受信手段によって受信され、受信手段によって受信された映像信号又は音声信号は記録手段によって記録媒体へ記録される。なお、放送中の映像信号としては、例えばアナログ又はデジタルのテレビジョン信号を適用することができる。この場合、記録手段は、例えば請求項2に記載したように、受信手段によって受信されたテレビジョン信号を、圧縮されたデジタルの映像信号へ変換した後に記録媒体へ記録するように構成することが好ましい。圧縮された映像信号を記録することで、記録媒体へ記録する映像信号のデータ量を削減することができ、映像信号を記録するために必要な記録媒体の容量を節減することができる。また、放送中の音声信号としては、例えばラジオ信号を適用することもできる。この場合も、受信されたラジオ信号を圧縮されたデジタルの音声信号へ変換した後に記録媒体へ記録するように記録手段を構成することが好ましい。また、記録媒体としては、例えばハードディスク等のランダムアクセス可能な記録媒体が好ましい。 According to the first aspect of the present invention, the video signal or audio signal being broadcast is received by the receiving means, and the video signal or audio signal received by the receiving means is recorded on the recording medium by the recording means. For example, an analog or digital television signal can be applied as the video signal being broadcast. In this case, the recording means may be configured to record the television signal received by the receiving means on a recording medium after converting the television signal received by the receiving means into a compressed digital video signal. preferable. By recording the compressed video signal, the data amount of the video signal to be recorded on the recording medium can be reduced, and the capacity of the recording medium necessary for recording the video signal can be reduced. Further, for example, a radio signal can be applied as an audio signal during broadcasting. In this case as well, it is preferable to configure the recording means so that the received radio signal is converted into a compressed digital audio signal and then recorded on the recording medium. The recording medium is preferably a randomly accessible recording medium such as a hard disk.
また、請求項1記載の発明は、受信手段によって受信された映像信号に含まれる音声信号又は受信手段によって受信された音声信号を音声認識によって文字情報へ変換する音声認識手段を備えており、音声認識手段による音声認識によって得られた文字情報は、文字情報記録手段により、記録手段によって記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録される。従って、受信手段によって映像信号が受信される場合には、受信された映像信号(及び該映像信号に含まれる音声信号)と該映像信号に含まれる音声信号が表す音声を文字化した文字情報が対応付けられて記録媒体へ各々記録され、受信手段によって音声信号が受信される場合には、受信された音声信号と該音声信号が表す音声を文字化した文字情報が対応付けられて記録媒体へ各々記録されることになる。
Further, the invention described in
そして請求項1記載の発明では、文字情報記録手段によって記録媒体に記録された文字情報に対し、ユーザによって指定された検索対象語句を検索手段が検索し、提示手段は、検索手段による検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示する。これにより、検索対象語句として特定の語句をユーザが指定すれば、前記特定の語句を発声する音声が含まれる映像信号又は音声信号が検索され、該当する映像信号又は音声信号が存在していた場合にはこの映像信号又は音声信号が抽出されることで、該当する映像信号又は音声信号の再生又は該当する映像信号又は音声信号を特定可能な情報の提示が行われることになる。 According to the first aspect of the present invention, the search means searches for the search target phrase specified by the user for the character information recorded on the recording medium by the character information recording means, and the presentation means searches by the search by the search means. When character information in which the target word / phrase exists is extracted, a video signal or audio signal corresponding to the character information is read out from the recording medium and reproduced, or presented in the character information in which the search target word / phrase exists. Information that can identify the corresponding video signal or audio signal is presented. Thereby, if the user designates a specific phrase as a search target phrase, a video signal or an audio signal including the voice that utters the specific phrase is searched, and the corresponding video signal or audio signal exists When the video signal or audio signal is extracted, the corresponding video signal or audio signal is reproduced or information that can identify the corresponding video signal or audio signal is presented.
このように、請求項1記載の発明では、受信手段が受信した映像信号及び音声信号を、通常時のユーザの嗜好を表す情報等に基づく記録対象の絞り込み等を行うことなく記録媒体に記録しておき、音声認識によって得られた文字情報に対して指定された検索対象語句を検索することで、指定された検索対象語句を発声する音声が含まれる映像信号又は音声信号を検索するので、ユーザが突発的に新たな事柄に興味を持った等の場合にも、興味を持った事柄に関連する語句を検索対象語句として指定すれば、前記検索対象語句を発声する音声が含まれる映像信号又は音声信号が放送されていれば、該映像信号又は音声信号の再生又は該映像信号又は音声信号を特定可能な情報が提示されることで、ユーザが前記映像信号又は音声信号を視聴することができる。 Thus, according to the first aspect of the present invention, the video signal and the audio signal received by the receiving unit are recorded on the recording medium without performing the narrowing down of the recording target based on the information indicating the user's preference at the normal time. In addition, by searching for the specified search target phrase with respect to the character information obtained by voice recognition, the video signal or the audio signal including the voice that utters the specified search target phrase is searched. Even if the user suddenly becomes interested in a new matter, if a word or phrase related to the matter of interest is designated as a search target word, a video signal containing audio that utters the search target word or If the audio signal is broadcast, the user views the video signal or the audio signal by reproducing the video signal or the audio signal or presenting information that can identify the video signal or the audio signal. Door can be.
また、例えば大きな事件の発生を知ったときに、ユーザがその事件を報道している番組の視聴又は聴取を所望している場合には、検索対象語句として発生した事件を特定する語句を指定すれば、発生した事件を報道している番組の映像信号又は音声信号のみが検索され、ユーザの関心事がその事件に関係する企業の株価の動向である場合には、検索対象語句として前記企業の名称を指定すれば、前記企業について報道している番組の映像信号又は音声信号のみが確実に検索される。従って、ユーザが視聴又は聴取を所望している映像信号又は音声信号が検索されなかったり、逆に、ユーザが視聴又は聴取を所望していない映像信号又は音声信号を含む大量の映像信号又は音声信号が検索されることも回避することができる。従って、請求項1記載の発明によれば、放送された映像又は音声のうちユーザが所望した映像又は音声を簡単かつ確実に視聴又は聴取させることが可能となる。 Also, for example, when a user knows that a major incident has occurred, and the user wants to watch or listen to a program reporting the incident, the phrase that identifies the incident that occurred is specified as the search target phrase. For example, if only the video signal or audio signal of the program reporting the incident that occurred is searched, and the user's interest is the trend of the stock price of the company related to the incident, If the name is designated, only the video signal or audio signal of the program reporting on the company is surely searched. Therefore, a video signal or audio signal that the user wants to watch or listen to is not searched, or conversely, a large amount of video signal or audio signal including a video signal or audio signal that the user does not want to watch or listen to Can also be avoided. Therefore, according to the first aspect of the present invention, it is possible to easily and reliably view or listen to the video or audio desired by the user among the broadcast video or audio.
なお、請求項1記載の発明において、例えば請求項3に記載したように、文字情報を映像信号又は音声信号と対応付ける情報を、文字情報へ変換される前の音声信号が放送された日時を表す日時情報を含んで構成し、提示手段をは、検索対象語句が存在する文字情報が抽出された場合に、抽出された文字情報と共に記録されている日時情報に基づき、当該日時情報が表す日時に放送された映像信号又は音声信号を再生・提示するか、又は、対応する映像信号又は音声信号を特定可能な情報として、抽出された文字情報と共に記録されている日時情報を含む情報を提示するように構成することができる。 In the first aspect of the invention, as described in the third aspect, for example, the date and time when the audio signal before the conversion of the information that associates the character information with the video signal or the audio signal is broadcast to the character information is broadcast. When the character information in which the search target phrase exists is extracted, the presenting means includes the date information that is recorded together with the extracted character information. The broadcasted video signal or audio signal is reproduced / presented, or the information including date and time information recorded together with the extracted character information is presented as information that can identify the corresponding video signal or audio signal. Can be configured.
また、請求項1記載の発明において、ユーザが視聴する可能性のある映像又は音声のチャンネルが複数存在している等の場合には、例えば請求項4に記載したように、受信手段、記録手段、音声認識手段及び文字情報記録手段を、記録対象の映像信号又は音声信号のチャンネル数と同数設け、検索手段は、個々の文字情報記録手段によって記録媒体に記録された文字情報に対し、指定された検索対象語句を各々検索するように構成すればよい。これにより、記録対象の映像信号又は音声信号(例えばユーザが視聴する可能性のある全てのチャンネルの映像又は音声)が記録媒体に各々記録されると共に、記録された映像信号に含まれる音声信号又は記録された音声信号が音声認識によって文字情報へ各々変換され、得られた文字情報が記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ各々記録される。そして検索手段は、個々の文字情報記録手段によって記録媒体に記録された文字情報に対し、指定された検索対象語句を各々検索するので、記録された複数のチャンネルの映像信号又は音声信号を検索対象として、指定された検索対象語句を発声する音声が含まれる映像信号又は音声信号が全て抽出される。従って、請求項4記載の発明によれば、記録対象の複数のチャンネルで放送された映像又は音声のうち、検索対象語句を発声する音声が含まれる全ての映像又は音声を、ユーザに視聴させることが可能となる。 Further, in the first aspect of the invention, when there are a plurality of video or audio channels that the user may watch, for example, as described in claim 4, the receiving means, the recording means The voice recognition means and the character information recording means are provided in the same number as the number of channels of the video signal or audio signal to be recorded, and the search means is designated for the character information recorded on the recording medium by the individual character information recording means. What is necessary is just to comprise so that each search object phrase may be searched. As a result, the video signal or audio signal to be recorded (for example, the video or audio of all channels that the user may watch) is recorded on the recording medium, and the audio signal included in the recorded video signal or The recorded voice signal is converted into character information by voice recognition, and the obtained character information is recorded on a recording medium together with information associated with the recorded video signal or voice signal. And the search means searches the specified search target word / phrase for the character information recorded on the recording medium by the individual character information recording means, so the video signal or audio signal of a plurality of recorded channels is searched. As a result, all the video signals or audio signals including the voice that utters the designated search target phrase are extracted. Therefore, according to the fourth aspect of the present invention, the user can watch all the video or audio including the audio that utters the search target phrase among the video or audio broadcast on a plurality of channels to be recorded. Is possible.
なお、請求項1記載の発明において、ユーザによる検索対象語句の指定は、例えば請求項5に記載したように、ユーザが入力手段を介して検索対象語句を入力するか、又はユーザが検索対象語句を発声することによって行うことができる。ユーザが検索対象語句を発声することで検索対象語句が指定される場合、検索手段による検索対象語句の検索は、ユーザが検索対象語句を発声したときの音声に対して音声認識を行い、該音声認識によって得られる文字情報を用いることで実現できる。 In the first aspect of the invention, the search target word / phrase is specified by the user, for example, as described in claim 5, when the user inputs the search target word / phrase via the input means, or the user inputs the search target word / phrase. Can be done by speaking. When a search target phrase is specified by the user speaking the search target phrase, the search target phrase search by the search means performs voice recognition on the voice when the user utters the search target phrase, and the voice This can be realized by using character information obtained by recognition.
請求項6記載の発明に係る情報提示方法は、放送中の映像信号又は音声信号を受信し、受信した映像信号又は音声信号を記録媒体へ記録すると共に、前記受信した映像信号に含まれる音声信号又は前記受信した音声信号を音声認識によって文字情報へ変換し、音声認識によって得られた文字情報を前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録しておき、記録媒体に記録した文字情報に対し、ユーザによって指定された検索対象語句を検索し、前記検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を、記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定するための情報を提示するので、請求項1記載の発明と同様に、放送された映像又は音声のうちユーザが所望した映像又は音声を簡単かつ確実に視聴又は聴取させることが可能となる。
According to a sixth aspect of the present invention, there is provided an information presentation method for receiving a video signal or audio signal being broadcast, recording the received video signal or audio signal on a recording medium, and an audio signal included in the received video signal. Alternatively, the received voice signal is converted into character information by voice recognition, and the character information obtained by voice recognition is recorded on the recording medium together with information associated with the video signal or voice signal recorded on the recording medium, and recorded. A search target phrase specified by a user is searched for character information recorded on a medium, and when character information including the search target phrase is extracted by the search, a video signal or an audio signal corresponding to the character information is extracted. Is read out from the recording medium and reproduced, or a video signal or an audio signal corresponding to the character information in which the search target phrase exists exists. Since presenting the information to a constant, as in the invention of
請求項7記載の発明に係る情報提示プログラムは、放送中の映像信号又は音声信号を受信する受信手段及び記録媒体を備えたコンピュータを、前記受信手段によって受信された映像信号又は音声信号を記録媒体へ記録する記録手段、前記受信された映像信号に含まれる音声信号又は前記受信された音声信号を音声認識によって文字情報へ変換する音声認識手段、前記音声認識手段による音声認識によって得られた文字情報を、前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録する文字情報記録手段、前記文字情報記録手段によって記録媒体に記録された文字情報に対し、ユーザによって指定された検索対象語句を検索する検索手段、及び、前記検索手段による検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示する提示手段として機能させる。 According to a seventh aspect of the present invention, there is provided an information presentation program comprising: a computer having receiving means and a recording medium for receiving a video signal or audio signal being broadcast; and a recording medium for receiving the video signal or the audio signal received by the receiving means. Recording means for recording to, voice signal included in the received video signal or voice recognition means for converting the received voice signal into character information by voice recognition, character information obtained by voice recognition by the voice recognition means Is recorded on the recording medium together with information associated with the video signal or audio signal recorded on the recording medium, and the character information recorded on the recording medium by the character information recording means is designated by the user. Search means for searching for a search target phrase, and characters in which the search target phrase is present by the search by the search means When the information is extracted, the video signal or the audio signal corresponding to the character information is read out from the recording medium and reproduced, or the video signal corresponding to the character information in which the search target phrase is present or It functions as a presentation means for presenting information that can identify the audio signal.
請求項7記載の発明に係るプログラムは、上記の受信手段及び記録媒体を備えたコンピュータを、上記の記録手段、音声認識手段、文字情報記録手段、検索手段及び提示手段として機能させるためのプログラムであるので、上記コンピュータが請求項7記載の発明に係る情報提示プログラムを実行することにより、上記コンピュータが請求項1に記載の情報提示装置として機能することになり、請求項1記載の発明と同様に、放送された映像又は音声のうちユーザが所望した映像又は音声を簡単かつ確実に視聴又は聴取させることが可能となる。
A program according to a seventh aspect of the invention is a program for causing a computer including the receiving unit and the recording medium to function as the recording unit, the voice recognition unit, the character information recording unit, the search unit, and the presentation unit. Therefore, when the computer executes the information presentation program according to the invention described in claim 7, the computer functions as the information presentation apparatus according to
以上説明したように本発明は、放送中の映像信号又は音声信号を受信して記録媒体へ記録すると共に、受信した映像信号に含まれる音声信号又は受信した音声信号を音声認識によって文字情報へ変換し、得られた文字情報を記録した映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録し、記録した文字情報に対しユーザによって指定された検索対象語句を検索し、検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示するようにしたので、放送された映像又は音声のうちユーザが所望した映像又は音声を簡単かつ確実に視聴又は聴取させることが可能となる、という優れた効果を有する。 As described above, the present invention receives a video signal or audio signal being broadcast and records it on a recording medium, and converts the audio signal contained in the received video signal or the received audio signal into character information by voice recognition. Then, the obtained character information is recorded on a recording medium together with information associated with the recorded video signal or audio signal, the search target phrase specified by the user is searched for the recorded character information, and the character in which the search target phrase exists When information is extracted, a video signal or audio signal corresponding to the character information is read out from a recording medium and reproduced, or presented, or a video signal or audio corresponding to character information in which a search target phrase exists Since information that can identify the signal is presented, it is possible to easily and reliably view or listen to the desired video or audio of the broadcast video or audio. It is possible to have an excellent effect that.
以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係る動画記録再生装置10が示されている。なお、動画記録再生装置10は本発明に係る情報提示装置(詳しくは請求項2に記載の情報提示装置)に対応しており、例えばユーザの自宅等に設置される。 Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a moving image recording / reproducing apparatus 10 according to the present embodiment. The moving image recording / reproducing apparatus 10 corresponds to the information presenting apparatus according to the present invention (specifically, the information presenting apparatus described in claim 2), and is installed at the user's home, for example.
動画記録再生装置10はアンテナ12に接続されたTVチューナ14を備えている。アンテナ12によってVHFやUHF等のTV周波数帯域の電磁波が受信されることで、アンテナ12からTVチューナ14へはTV周波数帯域の信号が入力され、TVチューナ14は入力されたTV周波数帯域の信号に基づき、予め設定されたチャンネルの放送局が放送しているアナログのテレビジョン信号(TV信号)の復調を行う。また、TVチューナ14はタイマを内蔵しており、予め設定されたチャンネルのTV信号の復調(受信)を、予め設定された受信開始時刻から受信終了時刻の間継続する。アンテナ12及びTVチューナ14は本発明に係る受信手段に対応している。TVチューナ14には信号処理部16と音声認識部18が接続されており、TVチューナ14で復調されたTV信号は信号処理部16へ順次入力され、復調されたTV信号に含まれる映像信号と音声信号のうち音声信号のみは音声認識部18へ順次入力される。
The moving image recording / reproducing apparatus 10 includes a
信号処理部16は、TVチューナ14から順次入力されるアナログのTV信号をデジタルの動画像データへ変換し、変換後の動画像データを一定時間毎(例えば1時間等)に分割すると共に、分割した動画像データを所定の動画像圧縮形式(例えばmpeg1/2/4等)に従って各々圧縮(エンコード)することで、所定の動画像圧縮形式に準拠した圧縮動画ファイルを順次生成する。なお、上記の圧縮動画ファイルは、動画像(映像及び音声)の再生時に映像と音声の同期をとることを目的として、圧縮動画ファイルの生成時に、圧縮画像ファイルを先頭から再生した際の経過時間を表す時刻情報(タイムスタンプ)が、信号処理部16によって圧縮画像ファイルに含まれる圧縮映像データ及び圧縮音声データに順次挿入される。また信号処理部16は、個々の圧縮動画ファイルのヘッダに、TVチューナ14から個々の圧縮動画ファイルに対応するTV信号の入力が開始された時点での日時を表す受信開始日時情報を設定する。
The
なお、圧縮映像データ及び圧縮音声データへ圧縮される前のTV信号の放送日時(受信日時)は、圧縮映像データ及び圧縮音声データに順次挿入された時刻情報と、圧縮動画ファイルのヘッダに設定された受信開始日時情報から判断可能であり、これらの情報は請求項3に記載の日時情報に対応している。 Note that the broadcast date / time (reception date / time) of the TV signal before being compressed into compressed video data and compressed audio data is set in the time information sequentially inserted into the compressed video data and compressed audio data and the header of the compressed video file. It can be determined from the reception start date / time information, and these information correspond to the date / time information described in claim 3.
またTVチューナ14は、信号処理部16へのTV信号出力時に、出力するTV信号のチャンネルを表す受信チャンネル情報も同時に出力する。信号処理部16は、TVチューナ14から入力された受信チャンネル情報を、生成した圧縮動画ファイルのヘッダに設定する。従って、TVチューナ14から入力された信号(情報)に基づき、例として図2(A)に示すようなフォーマットの圧縮動画ファイルが信号処理部16によって生成されることになる。信号処理部16はHDD(ハードディスクドライブ)20に接続されており、このHDD20には上記の圧縮動画ファイルを蓄積記憶するための動画ファイルDB(データベース)22が記憶されている。信号処理部16は生成した圧縮画像ファイルをHDD20の動画ファイルDB22に順次蓄積記憶させる。従って、HDD20の動画ファイルDB22には、TVチューナ14によって受信されたTV信号が、通常時のユーザの嗜好を表す情報等に基づく記録対象の絞り込み等を行うことなく、圧縮動画ファイルとして動画ファイルDB22に記録されることになる。このように、信号処理部16は本発明に係る記録手段に対応している。
Further, the
一方、音声認識部18には音声辞書26が接続されており、この音声辞書26には、音声認識処理時にパターンマッチングのために参照されるパターンデータが多数記憶されている。音声認識部18は、TVチューナ14から順次入力される音声信号をデジタルの音声データへ変換した後に、変換によって得られた音声データから1文節又は1単語分の音声データを順に取り出し、取り出した音声データを音声辞書26に記憶されているパターンデータと照合(パターンマッチング)することで音声認識を行い、認識結果を表す文字データ(テキストデータ)を生成することを繰り返す。これにより、入力された音声信号が表す音声の内容を表す文字データが得られることになる。音声認識部18は、上記の音声認識によって得られた文字データを、一定時間分の音声データに対応する文字データ毎に分割し、分割した個々の文字データに、対応する音声信号がTVチューナ14から入力された日時(≒TVチューナ14による受信日時)を表す日時情報を付加する。
On the other hand, a
また音声認識部18は、音声認識処理によって得られた文字データ及び該文字データに付加した日時情報を、一定時間分(例えば1時間分)の情報を単位としてファイル化し、個々のファイル(文字データファイル)のヘッダに、TVチューナ14から個々の文字データファイルに対応する音声信号の入力が開始された時点での日時を表す受信開始日時情報を設定する。なお、文字データの生成に用いられた音声データに対応する音声信号を含むTV信号の放送日時(受信日時)は、文字データに付加された日時情報から判断可能であり、この日時情報も請求項3に記載の日時情報に対応している。
In addition, the
またTVチューナ14は、音声認識部18へ音声信号を出力する際に、出力する音声信号に対応するTV信号のチャンネルを表す受信チャンネル情報も同時に出力し、音声認識部18へはTVチューナ14から入力された受信チャンネルを個々の文字データファイルのヘッダに設定する。従って、TVチューナ14から入力された信号(情報)に基づき、例として図2(B)に示すようなフォーマットの文字データファイルが音声認識部18によって生成されることになる。音声認識部18はHDD20に接続されており、このHDD20には上記の文字データファイルを蓄積記憶するための文字データDB24が記憶されている。音声認識部18は生成した文字データファイルをHDD20の文字データDB24に順次蓄積記憶させる。このように、音声認識部18は本発明に係る音声認識手段及び文字情報記録手段に各々対応している。
When the
なお、HDD20に蓄積記憶された圧縮動画ファイル及び文字データファイルの消去に関しては、例えばHDD20が満杯になった時点で、ヘッダに設定されている受信開始日時情報が表す受信開始日時が古い情報から順に消去する等、任意の方式で行うことができる。
Regarding the deletion of the compressed moving image file and the character data file stored and stored in the
また、HDD20には動画再生部28と文字データ検索部34が接続されている。動画再生部28には画像(映像)を再生表示するためのディスプレイ30と、音声を再生出力するためのスピーカ32が接続されている。なお、ディスプレイ30及びスピーカ32としては、例えばテレビ受像機に内蔵されているディスプレイとスピーカを適用することができる。動画再生部28は、再生対象の圧縮動画ファイルを指定する情報が入力されると、指定された再生対象の圧縮動画ファイルをHDD20の動画ファイルDB22から読み出して順にデコードし、デコードによって得られた映像データが表す映像をディスプレイ30に表示させると共に、デコードによって得られた音声データが表す音声をスピーカ32から出力させることで、再生対象の圧縮動画ファイルが表す動画像(映像及び音声)を再生させる。
Further, the
一方、文字データ検索部34はマイクロコンピュータ等を含んで構成されており、後述する検索・再生処理を行う。また、文字データ検索部34にはユーザが各種の情報を入力するための指定部36が接続されている。指定部36はキーボード等の情報入力手段を含んで構成されており、TVチューナ14の受信開始時刻及び受信終了時刻、受信チャンネル、文字データ検索部34による検索における検索語句等の情報がユーザによって入力される。
On the other hand, the character
次に本実施形態の作用として、文字データ検索部34で実行される検索・再生処理について、図3のフローチャートを参照しながら説明する。なお、この検索・再生処理は、例えばユーザが特定の事柄に興味を持ち、興味を持った事柄に触れているTV番組の有無を確認すると共に、該当するTV番組があれば視聴することを所望している等の場合に、指定部36を介してTV番組(圧縮動画ファイル)の検索がユーザから指示されることで実行される。
Next, as an operation of this embodiment, search / reproduction processing executed by the character
ステップ100では、検索語句及び検索対象の日時範囲の入力を要請するメッセージを動画再生部28によってディスプレイ30へ表示させることで、ユーザに対して検索語句の入力を要請する。次のステップ102では検索語句が入力されたか否か判定し、判定が肯定される迄ステップ102の判定を繰り返す。ディスプレイ30に表示されたメッセージを確認することで検索語句及び検索対象の日時範囲の入力が要請されていることを認識したユーザは、指定部36を介して検索語句(例えば自身が興味を持った事柄に関連する語句)を入力する。なお、例えば動画ファイルDB22に蓄積記憶されている全ての圧縮動画ファイルを検索対象とする等の場合は、検索対象の日時範囲の指定を省略することも可能である。
In
ユーザによって検索語句及び検索対象の日時範囲が入力されると、ステップ102の判定が肯定されてステップ104へ移行し、文字データDB24から単一の文字データファイルを取り出し、取り出した文字データファイルのヘッダに設定されている受信開始日時に基づき、取り出した文字データファイルに対応するTV信号の放送日時範囲が指定された検索対象の日時範囲内か否かを判定し、放送日時範囲が検索対象の日時範囲から外れていた場合には、次の文字データファイルを取り出すことを繰り返すことで、指定された検索対象の日時範囲内に放送された番組に対応する文字データファイルを検索し、該当する文字データファイルの取り込みを行う。ステップ106では取り込んだ文字データファイルに含まれる全ての文字データを検索語句と比較し、次のステップ108において、取り込んだ文字データファイルの中に、検索語句が文字列として含まれている文字データが存在していたか否か判定する。
When the search phrase and the date / time range to be searched are input by the user, the determination in
ステップ108の判定が否定された場合は何ら処理を行うことなくステップ112へ移行するが、判定が肯定された場合はステップ110へ移行し、再生候補動画の情報として、先にステップ104で取り込んだ文字データファイルのヘッダに設定されている受信チャンネル情報と、検索語句と一致した文字データ(検索語句が文字列として含まれている文字データ)に付加されている日時情報(図2(B)参照)を、動画再生部28によってディスプレイ30に表示させた後にステップ112へ移行する。なお、検索語句が文字列として含まれている文字データ(例えば検索語句を中心として前後数行程度)も併せてディスプレイ30に表示させるようにしてもよい。
ステップ112では、先のステップ104において、文字データDB24に蓄積記憶されている全ての文字データファイルのヘッダを参照したか否かを判断することで、検索語句の検索が完了したか否か判定する。判定が否定された場合はステップ104に戻り、ステップ112の判定が肯定される迄ステップ104〜112を繰り返す。これにより、検索語句が文字列として含まれている文字データが複数抽出された場合には、抽出された個々の文字データに対応する再生候補動画の情報がディスプレイ30に一覧表示されることになる。
If the determination in step 108 is negative, the process proceeds to step 112 without performing any processing. However, if the determination is affirmative, the process proceeds to step 110 and is previously captured in
In
ステップ112の判定が肯定されると、検索終了を通知するメッセージを動画再生部28によってディスプレイ30に表示させた後にステップ114へ移行し、上述したステップ104〜112の処理により、検索語句が文字列として含まれている文字データが抽出されたか否か判定する。判定が否定された場合はステップ122へ移行し、指定された検索語句を発声する音声が含まれるTV番組(動画像)が存在していない旨をユーザへ通知するエラーメッセージを動画再生部28によってディスプレイ30に表示させた後に、検索・再生処理を終了する。
If the determination in
一方、検索語句が文字列として含まれている文字データが抽出された場合には、ステップ114の判定が肯定されてステップ116へ移行し、ディスプレイ30に情報が表示されている再生候補動画が選択されて再生が指示されたか否か判定する。判定が否定された場合はステップ120へ移行し、検索・再生処理の終了が指示されたか否か判定する。判定が否定された場合はステップ116に戻り、何れかの判定が肯定される迄ステップ116、120を繰り返す。検索終了を通知するメッセージがディスプレイ30に表示された時点で再生候補動画の情報がディスプレイ30に表示されていた場合、ユーザは指定部36を介し、ディスプレイ30に表示されている再生候補動画の情報のうち、視聴したい再生候補動画の情報を再生対象として選択し、選択した再生対象動画の再生を指示する。再生対象動画が選択されて再生が指示されると、ステップ116の判定が肯定されてステップ118へ移行し、再生対象として選択された再生候補動画の情報(受信チャンネル情報、文字データに付加されていた日時情報)を再生対象動画の情報として動画再生部28へ通知することで、動画再生部28に対して再生対象動画の再生を指示した後に、ステップ120へ移行する。
On the other hand, when character data including a search phrase as a character string is extracted, the determination in
これにより、動画再生部28は、まず動画ファイルDB22から単一の圧縮動画ファイルを取り出し、取り出した圧縮動画ファイルのヘッダに設定されている受信開始日時に基づき、文字データ検索部34から通知された日時情報が表す日時(視聴時に検索語句が音声として発声されるTV信号を受信した日時)が、取り出した圧縮動画ファイルに対応するTV信号が放送された日時範囲内に含まれており、かつ取り出した圧縮動画ファイルのヘッダに設定されている受信チャンネルが通知された受信チャンネルに一致しているか否かを判定し、取り出した圧縮動画ファイルが上記の条件に合致しない場合は次の圧縮動画ファイルを取り出すことを繰り返すことで、上記の条件に合致する圧縮動画ファイルを検索する。上記の条件に合致する再生対象の圧縮動画ファイルが抽出されると、次に動画再生部28は、通知された日時情報に基づいて、再生対象の圧縮動画ファイルに対して動画像として再生する範囲を決定する。この再生範囲は、例えば通知された日時情報が表すタイミング(再生対象の圧縮動画ファイルが表す動画像の再生時に検索語句が音声として発せられるタイミング)を中心として前後数分間の動画像のみが再生されるように決定することができる。
Thereby, the moving
続いて動画再生部28は、再生対象の圧縮動画ファイルに含まれる圧縮映像データ及び圧縮音声データに挿入された時刻情報を順次参照し、参照した時刻情報が表す時刻が決定した再生範囲内に相当する時刻であれば、対応する圧縮映像データ又は圧縮音声データを抽出することを繰り返すことで、決定した再生範囲内に相当する圧縮映像データ及び圧縮音声データのみを抽出する。そして動画再生部28は、抽出した圧縮映像データ及び圧縮音声データを時系列に並べて順にデコードし、デコードによって得られた映像データが表す映像をディスプレイ30に表示させると共に、デコードによって得られた音声データが表す音声をスピーカ32から出力させることで、決定した再生範囲内に相当する動画像(映像及び音声)を再生させる。これにより、ユーザは、放送されたTV番組のうち、興味を持った事柄に触れている部分のみを動画像として視聴することができる。このように、文字データ検索部34は本発明に係る検索手段に対応しており、文字データ検索部34及び動画再生部28は、本発明に係る提示手段に対応している。
Subsequently, the
また、再生候補動画の情報がディスプレイ30に複数表示されていた場合には、上記の視聴を終えたユーザが他の再生候補動画の情報を選択して再生を指示すれば、ステップ116の判定が再度肯定され、選択された再生候補動画に対して上述の処理が繰り返されることで、放送されたTV番組のうち興味を持った事柄に触れている別の部分を動画像として視聴することができる。
If a plurality of playback candidate video information are displayed on the
このように、本実施形態によれば、ユーザが突発的に新たな事柄に興味を持った等の場合にも、興味を持った事柄に関連する語句を検索語句として指定すれば、指定した検索語句を発声する音声が含まれるTV番組が放送されていれば、このTV番組をユーザが簡単かつ確実に視聴することができる。また、本実施形態では、放送されたTV番組のうち、指定された検索語句が音声として発せられるタイミングを中心として前後数分間の動画像のみが再生されるので、検索語句が音声として発せられている箇所をユーザが探したりする手間も省け、視聴に要する時間を節約することができる。また、本実施形態では、音声信号を音声認識によって文字データに変換し、変換後の文字データに対して指定された検索語句の検索を行うことで、指定された検索語句が音声として発せられた動画像(TV番組)の検索を行うので、番組表等を利用する場合と比較して、ユーザが興味を持った事柄に触れている動画像(TV番組)を確実に抽出・提示することができる。 As described above, according to the present embodiment, even when the user suddenly becomes interested in a new matter, etc., if a phrase related to the matter of interest is designated as a search term, the designated search is performed. If a TV program including a voice that utters a phrase is broadcast, the user can easily and reliably view the TV program. Further, in the present embodiment, in the broadcast TV program, only the moving images for several minutes around the timing when the specified search word / phrase is uttered as voice are reproduced, so that the search word / phrase is uttered as voice. This saves the user from having to search for a location and saves the time required for viewing. Further, in the present embodiment, the specified search word is uttered as a voice by converting the voice signal into character data by voice recognition and performing a search for the specified search word with respect to the converted character data. Since a search for a moving image (TV program) is performed, it is possible to reliably extract and present a moving image (TV program) touching a matter that the user is interested in, as compared with the case of using a program guide or the like. it can.
なお、上記では指定された検索語句が音声として発せられるタイミングを中心として前後数分間の動画像のみを再生する例を説明したが、本発明はこれに限定されるものではなく、指定された検索語句が音声として発せられるTV番組全体を再生するようにしてもよいし、動画像の再生範囲をユーザが任意に設定できるようにしてもよい。 In the above description, an example in which only a moving image for several minutes before and after the timing at which the specified search phrase is uttered as a voice is reproduced has been described. However, the present invention is not limited to this, and the specified search is performed. The entire TV program in which the phrase is uttered as sound may be played, or the playback range of the moving image may be arbitrarily set by the user.
また、上記では再生候補動画(指定された検索語句が音声として発せられる動画像)の情報として、受信チャンネル情報と日時情報をディスプレイ30に表示させる例を説明したが、本発明はこれに限定されるものではなく、例えばインターネット上で公開されている電子番組表を参照する等により、番組名等の他の情報も取得・表示させるようにしてもよい。
In the above description, an example in which reception channel information and date / time information are displayed on the
また、本実施形態に係る動画記録再生装置10は、例えばHDDレコーダとパーソナル・コンピュータ(PC)で構成することができるが、これに限られるものではなく、例えば放送中の映像信号又は音声信号を受信する受信手段(例えばアンテナに接続されたTVチューナ)を内蔵したPCであれば、該PCに所定のプログラムを実行させることで、本実施形態に係る動画記録再生装置10として機能させることも可能である。この場合、上記所定のプログラムが請求項7に記載の情報提示プログラムに対応することになる。 In addition, the moving image recording / reproducing apparatus 10 according to the present embodiment can be configured by, for example, an HDD recorder and a personal computer (PC), but is not limited to this. For example, a video signal or an audio signal being broadcast is received. If the PC has a receiving means for receiving (for example, a TV tuner connected to an antenna), the PC can also function as the moving picture recording / reproducing apparatus 10 according to the present embodiment by causing the PC to execute a predetermined program. It is. In this case, the predetermined program corresponds to the information presentation program according to the seventh aspect.
更に、上記ではTVチューナ14、信号処理部16及び音声認識部18が各々1個づつ設けられた構成を説明したが、これに限定されるものではなく、例として図4に示すように、上記のTVチューナ14、信号処理部16及び音声認識部18から成る動画ファイル/文字データ生成・記録部40を複数設け、個々の動画ファイル/文字データ生成・記録部40で互いに異なるチャンネルのTV信号について、受信・圧縮動画ファイルの生成及び記録・音声信号に対する音声認識及び文字データファイルの記録を並列に実行する構成を採用してもよい。この場合、文字データ検索部34は指定された検索語句の検索を全チャンネルの文字データファイルに対して行うように構成すればよい。これにより、異なるチャンネルで同一時間帯に放送されたTV番組が、ユーザが興味を持った事柄に各々触れていた等の場合にも、各TV番組を確実に抽出・提示することができる。
Furthermore, in the above description, the configuration in which one
また、上記では本実施形態に係る動画記録再生装置10がユーザの自宅に設置される例を説明したが、これに限定されるものではなく、動画記録再生装置10をインターネット等のコンピュータ・ネットワークに直接接続するか、或いはサーバを介して接続し、ユーザからコンピュータ・ネットワーク経由で検索語句が指定されると、検索結果や再生が指示された動画像のデータをコンピュータ・ネットワーク経由でユーザへ送信するサービスを提供するようにしてもよい。特に図4の構成を採用した場合、装置が大規模かつ高価となる可能性もあるが、上記のようにコンピュータ・ネットワークを利用することで、単一の動画記録再生装置10を複数のユーザが利用可能となるので好適である。 Further, the example in which the moving picture recording / reproducing apparatus 10 according to the present embodiment is installed at the user's home has been described above. However, the present invention is not limited to this, and the moving picture recording / reproducing apparatus 10 is connected to a computer network such as the Internet. When a search term is specified from a user via a computer network, either directly or via a server, the search result or moving image data instructed to be played is transmitted to the user via the computer network. A service may be provided. In particular, when the configuration of FIG. 4 is adopted, the apparatus may be large and expensive. However, by using the computer network as described above, a single moving image recording / reproducing apparatus 10 can be used by a plurality of users. This is preferable because it can be used.
また、上記では圧縮動画ファイルの圧縮映像データ及び圧縮音声データに、圧縮画像ファイルを先頭から再生した際の経過時間を表す時刻情報(タイムスタンプ)が順次挿入される態様を説明したが、本発明はこれに限定されるものではなく、圧縮映像データ及び圧縮音声データへ圧縮される前のTV信号の放送日時(受信日時)を表す日時情報を順次挿入するようにしてもよい。この態様において、上記の日時情報は請求項3に記載の日時情報に対応している。 In the above description, the mode in which time information (time stamp) indicating the elapsed time when the compressed image file is reproduced from the beginning is sequentially inserted into the compressed video data and the compressed audio data of the compressed moving image file has been described. However, the present invention is not limited to this, and date / time information indicating the broadcast date / time (reception date / time) of the TV signal before being compressed into compressed video data and compressed audio data may be sequentially inserted. In this aspect, the date and time information corresponds to the date and time information described in claim 3.
更に、上記では検索結果(指定された検索語句が音声として発声される再生候補動画の情報)を表示した後に、再生候補動画が選択されて再生が指示されると選択された動画像の再生を行う例を説明したが、これに限定されるものではなく、検索結果の表示(提示)のみを行う態様も本発明に含まれる。 Further, in the above, after displaying the search result (information of the playback candidate video in which the designated search phrase is uttered as sound), when the playback candidate video is selected and playback is instructed, the selected moving image is played back. Although the example to perform was demonstrated, it is not limited to this, The aspect which displays only a search result (presentation) is also contained in this invention.
また、上記では無線放送で送信されるアナログのTV信号を受信する例を説明したが、本発明はこれに限定されるものではなく、有線放送のTV信号を受信する場合、デジタルのTV信号を受信する場合、TV放送に代えてラジオ放送の信号を受信する場合(この場合、TVチューナ14に代えてAM/FMチューナ等を設ければよい)にも適用可能であることは言うまでもない。 In the above description, an example of receiving an analog TV signal transmitted by wireless broadcasting has been described. However, the present invention is not limited to this, and when receiving a TV signal of wired broadcasting, a digital TV signal is received. In the case of reception, it goes without saying that the present invention can also be applied to the case of receiving a radio broadcast signal instead of the TV broadcast (in this case, an AM / FM tuner or the like may be provided instead of the TV tuner 14).
10 動画記録再生装置
12 アンテナ
14 TVチューナ
16 信号処理部
18 音声認識部
20 HDD
28 動画再生部
30 ディスプレイ
32 スピーカ
34 文字データ検索部
38 動画再生部
40 動画ファイル/文字データ生成・記録部
DESCRIPTION OF SYMBOLS 10 Movie recording / reproducing apparatus 12
28
Claims (7)
前記受信手段によって受信された映像信号又は音声信号を記録媒体へ記録する記録手段と、
前記受信された映像信号に含まれる音声信号又は前記受信された音声信号を音声認識によって文字情報へ変換する音声認識手段と、
前記音声認識手段による音声認識によって得られた文字情報を、前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録する文字情報記録手段と、
前記文字情報記録手段によって記録媒体に記録された文字情報に対し、ユーザによって指定された検索対象語句を検索する検索手段と、
前記検索手段による検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示する提示手段と、
を含む情報提示装置。 Receiving means for receiving a video signal or audio signal being broadcast;
Recording means for recording the video signal or audio signal received by the receiving means on a recording medium;
An audio signal included in the received video signal or an audio recognition means for converting the received audio signal into character information by audio recognition;
Character information recording means for recording character information obtained by voice recognition by the voice recognition means together with information associated with a video signal or a voice signal recorded on the recording medium, on a recording medium;
Search means for searching for a search target phrase specified by a user for character information recorded on a recording medium by the character information recording means;
When character information including a search target phrase is extracted by the search by the search means, a video signal or an audio signal corresponding to the character information is read out from a recording medium and reproduced, or presented. Presenting means for presenting information capable of specifying a video signal or an audio signal corresponding to character information in which the target phrase exists;
An information presentation device.
前記提示手段は、前記検索対象語句が存在する文字情報が抽出された場合に、抽出された文字情報と共に記録されている日時情報に基づき、当該日時情報が表す日時に放送された映像信号又は音声信号を再生・提示するか、又は、前記対応する映像信号又は音声信号を特定可能な情報として、前記抽出された文字情報と共に記録されている日時情報を含む情報を提示することを特徴とする請求項1記載の情報提示装置。 The information associating the character information with the video signal or the audio signal includes date and time information indicating the date and time when the audio signal before being converted into the character information was broadcast,
When the character information in which the search target word / phrase exists is extracted, the presenting means is based on the date / time information recorded together with the extracted character information, and the video signal or audio broadcast on the date / time indicated by the date / time information A signal is reproduced / presented, or information including date and time information recorded together with the extracted character information is presented as information that can identify the corresponding video signal or audio signal. Item 1. An information presentation device according to Item 1.
前記受信した映像信号に含まれる音声信号又は前記受信した音声信号を音声認識によって文字情報へ変換し、音声認識によって得られた文字情報を前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録しておき、
記録媒体に記録した文字情報に対し、ユーザによって指定された検索対象語句を検索し、
前記検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を、記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定するための情報を提示する
情報提示方法。 Receiving the video signal or audio signal being broadcast, recording the received video signal or audio signal to the recording medium,
Information that converts the audio signal included in the received video signal or the received audio signal into character information by voice recognition, and associates the character information obtained by voice recognition with the video signal or audio signal recorded on the recording medium Along with a recording medium,
Search the search target words specified by the user against the character information recorded on the recording medium,
When character information including a search target word is extracted by the search, a video signal or an audio signal corresponding to the character information is read out from a recording medium and reproduced, or the search target word is displayed. An information presentation method for presenting information for specifying a video signal or an audio signal corresponding to character information in which there is a character.
前記受信手段によって受信された映像信号又は音声信号を記録媒体へ記録する記録手段、
前記受信された映像信号に含まれる音声信号又は前記受信された音声信号を音声認識によって文字情報へ変換する音声認識手段、
前記音声認識手段による音声認識によって得られた文字情報を、前記記録媒体に記録された映像信号又は音声信号と対応付ける情報と共に記録媒体へ記録する文字情報記録手段、
前記文字情報記録手段によって記録媒体に記録された文字情報に対し、ユーザによって指定された検索対象語句を検索する検索手段、
及び、前記検索手段による検索によって検索対象語句が存在する文字情報が抽出された場合に、該文字情報に対応する映像信号又は音声信号を記録媒体から読み出して再生することで提示するか、又は、前記検索対象語句が存在する文字情報に対応する映像信号又は音声信号を特定可能な情報を提示する提示手段
として機能させる情報提示プログラム。 A computer comprising a receiving means and a recording medium for receiving a video signal or audio signal being broadcast,
Recording means for recording the video signal or audio signal received by the receiving means on a recording medium;
An audio signal included in the received video signal or an audio recognition means for converting the received audio signal into character information by audio recognition;
Character information recording means for recording character information obtained by voice recognition by the voice recognition means together with information associated with a video signal or a voice signal recorded on the recording medium, on a recording medium;
Search means for searching for a search target phrase specified by a user for character information recorded on a recording medium by the character information recording means;
And, when the character information in which the search target phrase exists is extracted by the search by the search means, the video signal or the audio signal corresponding to the character information is read out from the recording medium and reproduced, or presented, An information presentation program that functions as a presentation unit that presents information that can identify a video signal or an audio signal corresponding to character information in which the search target word is present.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004232760A JP2006054517A (en) | 2004-08-09 | 2004-08-09 | Information presenting apparatus, method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004232760A JP2006054517A (en) | 2004-08-09 | 2004-08-09 | Information presenting apparatus, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006054517A true JP2006054517A (en) | 2006-02-23 |
Family
ID=36031725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004232760A Pending JP2006054517A (en) | 2004-08-09 | 2004-08-09 | Information presenting apparatus, method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006054517A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008044669A1 (en) * | 2006-10-10 | 2008-04-17 | Toshifumi Okuhara | Audio information search program and its recording medium, audio information search system, and audio information search method |
JP2008167373A (en) * | 2007-01-05 | 2008-07-17 | Brother Ind Ltd | Information presentation device |
JP2018060568A (en) * | 2007-08-16 | 2018-04-12 | クリムソン コーポレイション | Voice enabled telnet interface |
US10873621B1 (en) | 2014-08-20 | 2020-12-22 | Ivanti, Inc. | Terminal emulation over html |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
JP2022075662A (en) * | 2020-10-27 | 2022-05-18 | 株式会社I’mbesideyou | Information extraction device |
WO2022145039A1 (en) * | 2020-12-31 | 2022-07-07 | 株式会社I’mbesideyou | Video meeting evaluation terminal, video meeting evaluation system and video meeting evaluation program |
-
2004
- 2004-08-09 JP JP2004232760A patent/JP2006054517A/en active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008044669A1 (en) * | 2006-10-10 | 2008-04-17 | Toshifumi Okuhara | Audio information search program and its recording medium, audio information search system, and audio information search method |
JP2008167373A (en) * | 2007-01-05 | 2008-07-17 | Brother Ind Ltd | Information presentation device |
JP2018060568A (en) * | 2007-08-16 | 2018-04-12 | クリムソン コーポレイション | Voice enabled telnet interface |
US10938886B2 (en) | 2007-08-16 | 2021-03-02 | Ivanti, Inc. | Scripting support for data identifiers, voice recognition and speech in a telnet session |
US10873621B1 (en) | 2014-08-20 | 2020-12-22 | Ivanti, Inc. | Terminal emulation over html |
US11100278B2 (en) | 2016-07-28 | 2021-08-24 | Ivanti, Inc. | Systems and methods for presentation of a terminal application screen |
JP2022075662A (en) * | 2020-10-27 | 2022-05-18 | 株式会社I’mbesideyou | Information extraction device |
JP7096626B2 (en) | 2020-10-27 | 2022-07-06 | 株式会社I’mbesideyou | Information extraction device |
WO2022145039A1 (en) * | 2020-12-31 | 2022-07-07 | 株式会社I’mbesideyou | Video meeting evaluation terminal, video meeting evaluation system and video meeting evaluation program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101202864B (en) | Animation reproduction device | |
US8260108B2 (en) | Recording and reproduction apparatus and recording and reproduction method | |
CA2774985C (en) | Caption and/or metadata synchronization for replay of previously or simultaneously recorded live programs | |
JP3953886B2 (en) | Subtitle extraction device | |
KR101419937B1 (en) | A symbol extracting apparatus, a symbol extracting method, and a computer readable recording medium on which a symbol extracting program is recorded | |
JP5135024B2 (en) | Apparatus, method, and program for notifying content scene appearance | |
CN101605223B (en) | Method for selecting program and apparatus thereof | |
US11803589B2 (en) | Systems, methods, and media for identifying content | |
KR20110002792A (en) | Facility for processing verbal feedback and updating digital video recorder (DVR) recording patterns | |
US20060222318A1 (en) | Information processing apparatus and its method | |
US20080120636A1 (en) | Method and System for User Customizable Rating of Audio/Video Data | |
JP5209129B1 (en) | Information processing apparatus, broadcast receiving apparatus, and information processing method | |
JP2006054517A (en) | Information presenting apparatus, method, and program | |
KR101100191B1 (en) | Multimedia playback device and multimedia data retrieval method using the same | |
JP2007294020A (en) | Recording and reproducing method, recording and reproducing device, recording method, recording device, reproducing method, and reproducing device | |
JP5703321B2 (en) | Information processing apparatus and information processing method | |
JP2007201680A (en) | Information management apparatus and method, and program | |
JP5105109B2 (en) | Search device and search system | |
JP4364850B2 (en) | Audio playback device | |
JP2002252813A (en) | Program retrieving unit and program retrieving program | |
JPWO2008090609A1 (en) | Preference program extraction device | |
JP4312167B2 (en) | Content playback device | |
CN1705362A (en) | Display device and method for recording and playing back broadcast programs | |
JP2003274340A (en) | Device and method for gathering information | |
JP2010166123A (en) | Apparatus and method for processing information and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060921 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070227 |