[go: up one dir, main page]

JP2003169298A - Video abbreviated playback device, video abbreviated playback method, program for this method, and recording medium storing this program - Google Patents

Video abbreviated playback device, video abbreviated playback method, program for this method, and recording medium storing this program

Info

Publication number
JP2003169298A
JP2003169298A JP2001369674A JP2001369674A JP2003169298A JP 2003169298 A JP2003169298 A JP 2003169298A JP 2001369674 A JP2001369674 A JP 2001369674A JP 2001369674 A JP2001369674 A JP 2001369674A JP 2003169298 A JP2003169298 A JP 2003169298A
Authority
JP
Japan
Prior art keywords
video
sound
image
information
shortening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001369674A
Other languages
Japanese (ja)
Other versions
JP3848144B2 (en
Inventor
Shigeki Aoyanagi
滋己 青柳
Koji Sato
孝治 佐藤
Toshihiro Takada
敏弘 高田
Toshiharu Sugawara
俊治 菅原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001369674A priority Critical patent/JP3848144B2/en
Publication of JP2003169298A publication Critical patent/JP2003169298A/en
Application granted granted Critical
Publication of JP3848144B2 publication Critical patent/JP3848144B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

(57)【要約】 【課題】 映像を短縮して再生するのに、ユーザが見て
現在のシーンを理解し易く、かつ重要なシーンを見逃す
ことを少なくして映像情報を高速再生でき、さらにユー
ザの指定した時間以内に再生できるようにする。 【解決手段】 音・映像分離回路1は映像情報から音情
報と画像情報に分離し、音認識手段2は分離された音情
報の中から人の声を認識し、画像認識手段3は分離され
た画像情報の中からシーンの移り変わり部分を認識す
る。映像制御手段4は、ユーザからの総再生時間の指定
に対して、認識された音情報の区間パワーに対する閾値
を増減し、閾値より上の部分の区間の総和がユーザ指定
の総再生時間よりも短いもので、最大の再生時間になる
よう閾値を設定して音情報を選択し、この音情報と認識
された画像情報の両方の情報をまとめ、映像部分内の再
生に必要な画像部分を決定する。音・画像同期手段5は
映像制御手段により制御された音と画像の同期をとり再
生する。
(57) [Summary] [Problem] To shorten and reproduce a video, it is easy for a user to see the current scene, and it is possible to reproduce video information at high speed by reducing missing important scenes. Enable playback within the time specified by the user. SOLUTION: A sound / video separating circuit 1 separates sound information and image information from video information, a sound recognizing means 2 recognizes a human voice from the separated sound information, and an image recognizing means 3 is separated. The transition part of the scene is recognized from the image information. The video control means 4 increases or decreases the threshold value for the section power of the recognized sound information in response to the user's designation of the total playback time, and the sum of the sections above the threshold is longer than the user-specified total playback time. Select a sound information by setting a threshold so that it is the shortest and the maximum playback time, combine both the sound information and the recognized image information, and determine the image part necessary for playback in the video part I do. The sound / image synchronizing means 5 synchronizes and reproduces the sound and the image controlled by the video control means.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、映像情報の再生時
間を短縮編集するための計算機構を備えた映像短縮再生
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video shortening / reproducing apparatus equipped with a calculation mechanism for shortening and editing the reproduction time of video information.

【0002】[0002]

【従来の技術】従来のビデオデッキや映像再生ツールで
は、高速再生や早送り再生時には映像は速度固定で再生
される。その速度は標準速度の2倍速度〜20倍速度で
ある。その際、音は全く再生されない場合が多く、再生
される場合は音の一部だけを途切れ途切れに再生するも
のがある。
2. Description of the Related Art In a conventional VCR or video playback tool, video is played back at a fixed speed during high speed playback or fast forward playback. The speed is 2 to 20 times the standard speed. At that time, the sound is often not reproduced at all, and when it is reproduced, there is a case where only a part of the sound is reproduced intermittently.

【0003】また、SANYO製ビデオの時短機能で
は、映像は一定速度で高速再生し、音は無音区間を除い
た部分を高速化することで、再生できない音ができるだ
け少なくなるようにしている。
In addition, in the time saving function of the SANYO video, the image is reproduced at a high speed at a constant speed, and the sound is speeded up except for the silent section so that the unreproducible sound is reduced as much as possible.

【0004】この他、映像を要約する研究なども行われ
ている。例えば、「Michael A.Smith and Takeo Kanad
e,Video Skimming and Characteriza-tion through the
Combination of Image and Language Understanding T
echniques、Proceedings of Computer Vision and Patt
ern Recognition,pp.775-781,June 1997」がある。
[0004] In addition to this, research for summarizing video is also being conducted. For example, `` Michael A. Smith and Takeo Kanad
e, Video Skimming and Characteriza-tion through the
Combination of Image and Language Understanding T
echniques, Proceedings of Computer Vision and Patt
ern Recognition, pp.775-781, June 1997 ”.

【0005】[0005]

【発明が解決しようとする課題】従来のシステムにおけ
る高速再生は映像を重視しており、映像を常に一定速度
で高速再生し、音声はそれに応じて早回し再生させた
り、無音部分を飛ばして再生させたりしていた。
The high-speed reproduction in the conventional system attaches importance to the image, and the image is always reproduced at a high speed at a constant speed, and the audio is reproduced in a fast-moving manner or the silent part is skipped. I was doing it.

【0006】音声の早回し再生を用いた場合では、人問
が聞き取れる早回し再生というのはせいぜい2倍速程度
であり、元の音声によっては聞き取れないことも多かっ
た。
In the case of using the fast-forwarding reproduction of the voice, the fast-forwarding reproduction in which a human question can be heard is about double speed at the most, and it is often impossible to hear the original voice.

【0007】また、無音部分を飛ばす方式の場合には、
画像部分は常に一定速度で高速再生され、音は映像と同
期をとらずに再生されるため、音声と映像が一致せず理
解を妨げる要因となっていた。
Also, in the case of the method of skipping the silent part,
The image part is always played at a high speed at a constant speed, and the sound is played without being synchronized with the image, so that the sound and the image do not match, which is a factor that hinders understanding.

【0008】また、従来の映像を要約するシステムで
は、映像の構造情報を生成することに主眼が置かれてお
り、ユーザに代表シーンの画像やテキストなどを表示し
選択してもらい、選択されたシーンを再生する方式が主
流である。この場合、ユーザがまだ一度も見たことない
映像の場合には、画像を見ても中がわからない場合が多
いし、初めて見る映像の場合に代表シーン等を見てしま
うと内容が推測できてしまい、本編を見たいという欲求
が薄れてしまう可能性もある。
Further, in the conventional video summarizing system, the main purpose is to generate the structural information of the video, and the user is asked to display and select an image or text of the representative scene. The mainstream method is to reproduce the scene. In this case, in the case of a video that the user has never seen, even if the user looks at the image, there is often no way to understand the inside. There is also the possibility that the desire to see the main part will fade away.

【0009】さらに、総再生時間をユーザが指定し、そ
の時間内に映像をまとめることはできない。
Furthermore, it is not possible for the user to specify the total reproduction time and to collect the images within that time.

【0010】本発明の目的は、ユーザが見て現在のシー
ンを理解し易く、かつ重要なシーンを見逃すことを少な
くして映像情報を高速再生でき、さらにユーザの指定し
た時間以内に再生できるようにした映像短縮再生装置、
方法、プログラムおよび記録媒体を提供することにあ
る。
An object of the present invention is to enable a user to easily understand a current scene, to reduce the possibility of missing an important scene, to reproduce video information at high speed, and to reproduce it within a time designated by the user. Video shortening playback device,
A method, a program, and a recording medium are provided.

【0011】[0011]

【課題を解決するための手段】本発明では音声を重視す
る。まず、音情報のうちから人の声が入っているの区間
を抽出する。人の声が発せられている区間は重要である
ことが多く、またその声が発せられている区間の映像も
また重要であることが多いからである。
In the present invention, importance is attached to voice. First, a section containing a human voice is extracted from the sound information. This is because the section where the human voice is uttered is often important, and the image of the section where the voice is uttered is also often important.

【0012】次に、人の声の区間を抽出後、今度はその
区間の声のパワー(エネルギー)を計算する。人の声や
BGMなどでもあてはまるのだが、重要な部分の声や音
楽はまわりの部分と比べてパワーが大きくなる傾向にあ
るので、それを利用する。この区間のパワーがある閾値
を超える値を持つ区間は再生し、それ以下の区間につい
ては再生しないようにし、この閾値の値を増減すること
により、総再生時間を調節する。つまり、閾値を下げれ
ばより多くの区間が再生されることになり総再生時間が
長くなり、閾値を上げると再生される区間が少なくな
り、結果として総再生時間も短くなる。よって、この閾
値を調節することにより、ユーザが指定した時間内に再
生時間を調節する。
Next, after extracting the human voice section, the power (energy) of the voice of the section is calculated this time. This applies to human voices and BGM as well, but voices and music in important parts tend to have higher power than surrounding parts, so we use them. The power of this section is played back in a section having a value exceeding a certain threshold value, and the sections below that are not played back, and the total playback time is adjusted by increasing or decreasing the value of this threshold value. That is, if the threshold value is lowered, more sections are played back and the total playback time becomes longer, and if the threshold value is raised, less sections are played back, and as a result, the total playback time becomes shorter. Therefore, by adjusting this threshold value, the reproduction time is adjusted within the time specified by the user.

【0013】閾値を変更した場合、必ずしもユーザが指
定した時間ちょうどになるとは限らず、その時間よりも
短くなる場合が多い。また、閾値を超えた音声区間が映
像中にとびとびに現れる。再生する音声区間が決まった
ら、今度は画像情報からシーンチェンジの場所を調べて
おき、再生する音の区間とシーンの関係を調べ、再生す
る音の区間は実はシーンの一部であり、かつそのシーン
全部を再生してもユーザが指定した総再生時間を超えな
い場合、その音の区間だけでなく、シーン全体を再生対
象にする。このようにして、総再生時間を超えない範囲
で、閾値を超えた各音声区間を調べ、シーンによる再生
する区間の補正を行う。
When the threshold value is changed, it does not always reach the time designated by the user, but it often becomes shorter than that time. In addition, the voice section that exceeds the threshold appears in the video. Once the audio section to be played back is decided, this time the location of the scene change is checked from the image information, the relationship between the section of the sound to be played and the scene is checked, and the section of the sound to be played is actually a part of the scene, and If the total reproduction time specified by the user is not exceeded even if the entire scene is reproduced, not only the section of the sound but the entire scene is targeted for reproduction. In this way, each voice section exceeding the threshold value is examined within the range not exceeding the total reproduction time, and the section to be reproduced by the scene is corrected.

【0014】このようにして、再生する区間を決定した
ら実際に再生を行う。その際、画像は本来の映像におい
て再生している音に対応する画像を再生する。これによ
り、音と画像がずれることなく再生される。
When the section to be reproduced is determined in this way, the reproduction is actually performed. At that time, the image reproduces the image corresponding to the sound reproduced in the original video. As a result, the sound and the image are reproduced without any deviation.

【0015】以上の映像短縮再生方式により、本発明で
は、比較的重要と思われる音声を含んだ部分を中心に再
生を行い、その際、音と映像の同期を常に保つことで会
話などのシーンでも不自然さが目立たない再生可能とす
る。さらに、音声部分を少し高速再生させることによ
り、通常よりは早い時間で見ることを可能とする。ま
た、音のない映像の場合でもシーンの移り変わりの冒頭
部分を再生することにより、ユーザが重要なシーンを見
逃す可能性が少なくする。また、ユーザが設定した時間
内に映像を短縮し、忙しいユーザが少しの空き時間を使
って映像を確実に見ることができ、有効に時間を使うこ
とも可能とするもので、以下の装置、方法、プログラム
および記録媒体を特徴とする。
According to the above video shortening reproduction system, in the present invention, reproduction is mainly performed on a portion including a sound which is considered to be relatively important, and at that time, a scene such as a conversation is kept by keeping the sound and the video synchronized at all times. However, it makes it possible to reproduce the image without unnaturalness. Furthermore, by playing back the audio part at a slightly higher speed, it is possible to view the audio part at a faster time than usual. Further, even in the case of a video without sound, the possibility that the user misses an important scene is reduced by reproducing the beginning portion of the scene transition. Also, by shortening the image within the time set by the user, busy users can certainly see the image with a little free time, and it is also possible to effectively use the time. It features a method, a program and a recording medium.

【0016】(1)映像情報を短縮して再生する映像短
縮再生装置であって、映像情報から音情報と画像情報に
分離する音・映像分離手段と、前記分離された音情報の
中から人の声を認識する音認識手段と、前記分離された
画像情報の中からシーンの移り変わり部分を認識する画
像認識手段と、ユーザからの総再生時間の指定に対し
て、前記認識された音情報の区間パワーに対する閾値を
増減し、閾値より上の部分の区間の総和がユーザ指定の
総再生時間よりも短いもので、最大の再生時間になるよ
う閾値を設定して音情報を選択し、この音情報と前記認
識された画像情報の両方の情報をまとめ、映像部分内の
再生に必要な画像部分を決定する映像制御手段と、前記
映像制御手段により制御された音と画像の同期をとり再
生する音・画像同期手段とを備えたことを特徴とする映
像短縮再生装置。
(1) A video shortening / reproducing device for shortening and reproducing video information, wherein a sound / video separating means for separating the video information into sound information and image information, and a person from the separated sound information. Sound recognition means for recognizing the voice, an image recognition means for recognizing a transition part of a scene from the separated image information, and a sound reproduction of the recognized sound information in response to designation of a total reproduction time from a user. Increase or decrease the threshold for the section power, and if the sum of the sections above the threshold is shorter than the total playback time specified by the user, set the threshold so that the maximum playback time is reached and select sound information. Video control means for collecting both information and the recognized image information and determining an image portion required for reproduction in the video portion, and reproducing the sound and image controlled by the video control means in synchronization with each other. Sound / image synchronization Video shortening reproducing apparatus characterized by comprising a stage.

【0017】(2)映像情報を短縮して再生する映像短
縮再生方法であって、映像情報から音情報と画像情報に
分離する音・映像分離過程と、前記分離された音情報の
中から人の声を認識する音認識過程と、前記分離された
画像情報の中からシーンの移り変わり部分を認識する画
像認識過程と、ユーザからの総再生時間の指定に対し
て、前記認識された音情報の区間パワーに対する閾値を
増減し、閾値より上の部分の区間の総和がユーザ指定の
総再生時間よりも短いもので、最大の再生時間になるよ
う閾値を設定して音情報を選択し、この音情報と前記認
識された画像情報の両方の情報をまとめ、映像部分内の
再生に必要な画像部分を決定する映像制御過程と、前記
映像制御過程により制御された音と画像の同期をとり再
生する音・画像同期過程とを有することを特徴とする映
像短縮再生方法。
(2) A video shortening reproduction method for shortening and reproducing video information, wherein a sound / video separation process of separating video information into sound information and image information, and a person from the separated sound information. Of the recognized sound information in response to the sound recognition process of recognizing the voice, the image recognition process of recognizing the transition part of the scene from the separated image information, and the designation of the total reproduction time from the user. Increase or decrease the threshold for the section power, and if the sum of the sections above the threshold is shorter than the total playback time specified by the user, set the threshold so that the maximum playback time is reached and select the sound information. Both the information and the recognized image information are put together, and a video control process for determining an image part necessary for reproduction in the video part and a sound and an image controlled by the video control process are reproduced in synchronization with each other. Sound / image synchronization Video shortened playback method characterized by having a degree.

【0018】(3)上記の映像短縮再生方法における処
理手順をコンピュータが実行できるプログラムとして構
成したことを特徴とする映像短縮再生方法のプログラ
ム。
(3) A program for a video shortening reproduction method, characterized in that the processing procedure in the video shortening reproduction method is configured as a program that can be executed by a computer.

【0019】(4)上記の映像短縮再生方法における処
理手順をコンピュータに実行させるためのプログラム
を、該コンピュータが読み取り可能な記録媒体に記録し
たことを特徴とする映像短縮再生方法を記録した記録媒
体。
(4) A recording medium recorded with a video shortening reproducing method, characterized in that a program for causing a computer to execute the processing procedure in the video shortening reproducing method is recorded on a recording medium readable by the computer. .

【0020】[0020]

【発明の実施の形態】以下、この発明の一実施形態を図
面により説明する。図1は、本実施形態のブロック構成
図である。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block configuration diagram of this embodiment.

【0021】同図において、普通の映像情報では音と画
像情報が混ざっているので、まず音・映像分離回路1に
おいてそれらを分離する。この分離回路1は、テレビジ
ョンにおける音声・映像分離方式を利用することができ
る。
In the figure, since sound and image information are mixed in ordinary video information, they are first separated in the sound / video separation circuit 1. The separation circuit 1 can use the audio / video separation system in television.

【0022】次に、分離した音については、音認識手段
2により、人間の声を含む部分を抜き出す。この音認識
手段2は、人の音声帯域に通過帯域をもつフィルタを通
すことで実現される。
Next, with respect to the separated sounds, the sound recognizing means 2 extracts a part including a human voice. The sound recognition means 2 is realized by passing a filter having a pass band in the human voice band.

【0023】また、分離した画像については、画像認識
手段3により、シーンの移り変わり部分を検出する。こ
の画像認識手段3は、例えば、輝度やそのパターンの変
化量が大きくなるか否かで判定することができる。
With respect to the separated images, the image recognition means 3 detects the transitional part of the scene. The image recognition unit 3 can make a determination based on whether or not the amount of change in luminance or its pattern becomes large, for example.

【0024】次に、映像制御手段4において、音認識手
段2で分離した音(音声)と、画像認識手段3で抽出し
た画像の両方の情報をまとめ、映像部分内の再生に必要
な画像部分を決定する。再生に必要な画像部分として
は、検出されたシーンの移り変わりの冒頭部分と、その
抽出された音が発せられている部分の画像である。
Next, in the video control means 4, the information of both the sound (sound) separated by the sound recognition means 2 and the image extracted by the image recognition means 3 is put together, and the image portion necessary for reproduction within the video portion is collected. To decide. The image portion necessary for reproduction is the beginning portion of the detected scene transition and the image of the portion where the extracted sound is emitted.

【0025】さらに、映像制御手段4は、ユーザからの
総再生時間の指定に対して、分離された音に対して、音
の区間パワーに対する閾値を増減し、閾値より上の部分
の区間の総和がユーザ指定の総再生時間よりも短いもの
で、最大の値に閾値を設定する。具体的には、以下の処
理を行う。
Further, the video control means 4 increases or decreases the threshold value for the section power of the sound with respect to the separated sound in response to the designation of the total reproduction time from the user, and sums the sections above the threshold value. Is shorter than the total playback time specified by the user, and the threshold is set to the maximum value. Specifically, the following processing is performed.

【0026】・閾値設定によって選ばれた再生すべき各
区間から1つを選ぶ。その区間に対応する画像情報から
得られたシーンチェンジの情報を調べる。再生する区間
があるシーンの一部分であり、かつそのシーン全てを再
生しても、ユーザ指定の総再生時間より短い場合、再生
する部分をシーン全体に設定する。
Select one from each section to be reproduced selected by the threshold setting. The scene change information obtained from the image information corresponding to the section is examined. If the section to be played back is a part of a scene, and even if all the scenes are played back, if the total playback time specified by the user is shorter, the playback part is set to the entire scene.

【0027】・別の再生区間についても上記の処理を順
次実行し、総再生時間以内で最も再生時間が長くなるよ
うに設定する。
The above process is sequentially executed for another reproduction section, and the reproduction time is set to be the longest within the total reproduction time.

【0028】図2は、閾値の変更による総再生時間の増
減の例を示し、音パワー信号に対して、閾値を低くする
と再生する区間が長くなり、閾値を高くすると差いせさ
れる区間が短くなる。
FIG. 2 shows an example of the increase / decrease in the total reproduction time by changing the threshold value. With respect to the sound power signal, the lower the threshold value, the longer the reproduction section, and the higher the threshold value, the shorter the difference section. Become.

【0029】最後に、音・画像同期手段5により、音と
映像の同期をとり、時間短縮して再生した映像として出
力する。音と必要な画像部分の同期をとる方法として
は、基の映像情報の初めからの当該音の時刻と当該画像
部分の時刻が合致するように、再生画像を構成する。
Finally, the sound / image synchronizing means 5 synchronizes the sound and the image, and outputs the reproduced image with the time shortened. As a method of synchronizing the sound with the necessary image portion, the reproduced image is configured so that the time of the sound from the beginning of the original video information matches the time of the image portion.

【0030】図3は、本発明の方法の一実施形態例であ
るアルゴリズムを示すフローチャートである。そのアル
ゴリズムは次のようになる。
FIG. 3 is a flowchart showing an algorithm which is an embodiment of the method of the present invention. The algorithm is as follows.

【0031】(S1)音・映像分離 映像情報の中から音情報と画像情報を分離する。(S1) Sound / video separation The sound information and the image information are separated from the video information.

【0032】(S2)音認識と画像認識 分離した音情報と画像情報、それぞれに対して次のよう
な処理を行う。
(S2) Sound Recognition and Image Recognition The following processing is performed on each of the separated sound information and image information.

【0033】・音情報については音情報の中から音声部
分を検出する。
Regarding the sound information, the voice part is detected from the sound information.

【0034】・画像情報についてはシーンチェンジを検
出する。
A scene change is detected for image information.

【0035】(S3)映像制御 検出された音声と画像の両方の情報をまとめ、映像部分
内の再生に必要な画像部分を決定する。さらに、ユーザ
からの総再生時間の指定に対して、音の区間パワーに対
する最大の閾値を設定する。
(S3) Video control Information about both the detected voice and image is put together to determine the image portion required for reproduction in the video portion. Further, the maximum threshold for the section power of the sound is set in response to the designation of the total reproduction time from the user.

【0036】(S4)音・画像同期 音と画像の同期を取りながら再生する。(S4) Sound / image synchronization Play while synchronizing the sound and image.

【0037】なお、本発明は、図3に示した方法の一部
又は全部の処理機能をプログラムとして構成してコンピ
ュータを用いて実現させることができる。また、コンピ
ュータでその各部の処理機能を実現するためのプログラ
ム、あるいはコンピュータにその処理手順を実行させる
ためのプログラムを、そのコンピュータが読み取り可能
な記録媒体、例えば、FD(フロッピーディスク:登録
商標)、MO、ROM、メモリカード、CD、DVD、
リムーバブルディスクなどに記録して、保存したり、提
供したりすることが可能であり、また、インターネット
のような通信ネットワークを介して配布したりすること
が可能である。
The present invention can be realized by using a computer by configuring some or all of the processing functions of the method shown in FIG. 3 as a program. A computer-readable recording medium, such as an FD (floppy disk: registered trademark), stores a program for realizing the processing function of each part of the computer or a program for causing the computer to execute the processing procedure. MO, ROM, memory card, CD, DVD,
The data can be recorded on a removable disk or the like and can be saved or provided, and can be distributed via a communication network such as the Internet.

【0038】[0038]

【発明の効果】以上のとおり、本発明によれば、ユーザ
が指定した任意の時間内に映像を短縮できるため、次の
会議が始まるまでの時間に映像内容を確認するといった
ビジネス用途や、次の番組が始まるまでに先週の放送内
容をもう一度見ておく、などの家庭用途向けにも用いる
ことができる。
As described above, according to the present invention, the video can be shortened within an arbitrary time designated by the user, so that the video content can be confirmed by the time before the next conference starts, and Can be used for home use, such as watching the contents of the broadcast last week again before the program starts.

【0039】また、従来の要約システムなどと異なり、
システムが自動的に要約するため、映像の中を見ずに短
縮された映像をいきなり見ることが可能である。
Also, unlike the conventional summarization system,
Since the system automatically summarizes, it is possible to suddenly see a shortened video without looking inside the video.

【0040】また、本発明により再生される映像の音と
画像は常に一致して再生されるため、理解し易い映像を
見ることが可能である。
Further, since the sound and the image of the image reproduced according to the present invention are always reproduced in coincidence with each other, it is possible to see the image which is easy to understand.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施形態を示すブロック構成図。FIG. 1 is a block diagram showing an embodiment of the present invention.

【図2】実施形態における閾値の変更による総再生時間
の増減例。
FIG. 2 is an example of increase / decrease in total reproduction time due to change in threshold value in the embodiment.

【図3】本発明の実施形態を示すフローチャート。FIG. 3 is a flowchart showing an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1…音・映像分離回路 2…音認識手段 3…画像認識手段 4…映像制御手段 5…音・画像同期手段 1 ... Sound / video separation circuit 2 ... Sound recognition means 3 ... Image recognition means 4 ... Image control means 5. Sound / image synchronization means

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/7826 H04N 5/91 C 5/91 5/782 A (72)発明者 高田 敏弘 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 菅原 俊治 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5C018 AB03 AB13 5C052 AA01 AC01 DD04 DD06 5C053 FA14 HA21 HA27 LA06 5D015 DD05 KK02 ─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) H04N 5/7826 H04N 5/91 C 5/91 5/782 A (72) Inventor Toshihiro Takada Chiyoda-ku, Tokyo 2-3-1, Otemachi Nippon Telegraph and Telephone Corporation (72) Inventor Shunji Sugawara 2-3-1, Otemachi, Chiyoda-ku, Tokyo Nihon Telegraph and Telephone Corporation F-term (reference) 5C018 AB03 AB13 5C052 AA01 AC01 DD04 DD06 5C053 FA14 HA21 HA27 LA06 5D015 DD05 KK02

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 映像情報を短縮して再生する映像短縮再
生装置であって、 映像情報から音情報と画像情報に分離する音・映像分離
手段と、 前記分離された音情報の中から人の声を認識する音認識
手段と、 前記分離された画像情報の中からシーンの移り変わり部
分を認識する画像認識手段と、 ユーザからの総再生時間の指定に対して、前記認識され
た音情報の区間パワーに対する閾値を増減し、閾値より
上の部分の区間の総和がユーザ指定の総再生時間よりも
短いもので、最大の再生時間になるよう閾値を設定して
音情報を選択し、この音情報と前記認識された画像情報
の両方の情報をまとめ、映像部分内の再生に必要な画像
部分を決定する映像制御手段と、 前記映像制御手段により制御された音と画像の同期をと
り再生する音・画像同期手段とを備えたことを特徴とす
る映像短縮再生装置。
1. A video shortening / reproducing device for shortening and playing back video information, comprising sound / video separating means for separating the video information into sound information and image information; Sound recognition means for recognizing a voice, image recognition means for recognizing a transitional part of a scene from the separated image information, and a section of the recognized sound information in response to designation of a total reproduction time from a user. Increase or decrease the threshold for power, and if the sum of the sections above the threshold is shorter than the total playback time specified by the user, set the threshold so that the maximum playback time is reached and select sound information. And a video control unit that collects both of the recognized image information and determines an image portion required for reproduction in the video portion, and a sound that is reproduced in synchronization with the sound controlled by the video control unit and the image.・ Image synchronizer Video shortening reproducing apparatus characterized by comprising and.
【請求項2】 映像情報を短縮して再生する映像短縮再
生方法であって、 映像情報から音情報と画像情報に分離する音・映像分離
過程と、 前記分離された音情報の中から人の声を認識する音認識
過程と、 前記分離された画像情報の中からシーンの移り変わり部
分を認識する画像認識過程と、 ユーザからの総再生時間の指定に対して、前記認識され
た音情報の区間パワーに対する閾値を増減し、閾値より
上の部分の区間の総和がユーザ指定の総再生時間よりも
短いもので、最大の再生時間になるよう閾値を設定して
音情報を選択し、この音情報と前記認識された画像情報
の両方の情報をまとめ、映像部分内の再生に必要な画像
部分を決定する映像制御過程と、 前記映像制御過程により制御された音と画像の同期をと
り再生する音・画像同期過程とを有することを特徴とす
る映像短縮再生方法。
2. A video shortening reproducing method for shortening and reproducing video information, comprising a sound / video separation process of separating video information into sound information and image information, and a human being selected from the separated sound information. A sound recognition step of recognizing a voice, an image recognition step of recognizing a transition part of a scene from the separated image information, and a section of the recognized sound information in response to a user's designation of a total reproduction time. Increase or decrease the threshold for power, and if the sum of the sections above the threshold is shorter than the total playback time specified by the user, set the threshold so that the maximum playback time is reached and select sound information. And a video control process that determines both of the recognized image information and the image part required for reproduction within the video part, and a sound that is reproduced by synchronizing the image and the sound controlled by the video control process.・ Image sync error Video shortened playback method characterized by comprising and.
【請求項3】 請求項2に記載の映像短縮再生方法にお
ける処理手順をコンピュータが実行できるプログラムと
して構成したことを特徴とする映像短縮再生方法のプロ
グラム。
3. A program for a video shortening reproduction method, characterized in that the processing procedure in the video shortening reproduction method according to claim 2 is configured as a program that can be executed by a computer.
【請求項4】 請求項2に記載の映像短縮再生方法にお
ける処理手順をコンピュータに実行させるためのプログ
ラムを、該コンピュータが読み取り可能な記録媒体に記
録したことを特徴とする映像短縮再生方法を記録した記
録媒体。
4. A video shortening and reproducing method, characterized in that a program for causing a computer to execute the processing procedure in the video shortening and reproducing method according to claim 2 is recorded in a recording medium readable by the computer. Recording medium.
JP2001369674A 2001-12-04 2001-12-04 Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program Expired - Fee Related JP3848144B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001369674A JP3848144B2 (en) 2001-12-04 2001-12-04 Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001369674A JP3848144B2 (en) 2001-12-04 2001-12-04 Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program

Publications (2)

Publication Number Publication Date
JP2003169298A true JP2003169298A (en) 2003-06-13
JP3848144B2 JP3848144B2 (en) 2006-11-22

Family

ID=19179026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001369674A Expired - Fee Related JP3848144B2 (en) 2001-12-04 2001-12-04 Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program

Country Status (1)

Country Link
JP (1) JP3848144B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007171267A (en) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium
JP2007228334A (en) * 2006-02-24 2007-09-06 Fujifilm Corp Moving image control apparatus, method, and program
US7630021B2 (en) 2004-03-17 2009-12-08 Seiko Epson Corporation Image processing device and image processing method
JP2010093614A (en) * 2008-10-09 2010-04-22 Mitsubishi Electric Corp Video signal playback apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7630021B2 (en) 2004-03-17 2009-12-08 Seiko Epson Corporation Image processing device and image processing method
JP2007171267A (en) * 2005-12-19 2007-07-05 Nippon Telegr & Teleph Corp <Ntt> Continuous media data shortening reproduction method, composite media data shortening reproduction method and apparatus, program, and computer-readable recording medium
JP2007228334A (en) * 2006-02-24 2007-09-06 Fujifilm Corp Moving image control apparatus, method, and program
JP2010093614A (en) * 2008-10-09 2010-04-22 Mitsubishi Electric Corp Video signal playback apparatus

Also Published As

Publication number Publication date
JP3848144B2 (en) 2006-11-22

Similar Documents

Publication Publication Date Title
JP4615166B2 (en) Video information summarizing apparatus, video information summarizing method, and video information summarizing program
US7548951B2 (en) Minute file creation method, minute file management method, conference server, and network conference system
JP5173337B2 (en) Abstract content generation apparatus and computer program
JP3772117B2 (en) Information signal processing apparatus and information signal processing method
JP3615195B2 (en) Content recording / playback apparatus and content editing method
JPH10172245A (en) Information recording apparatus and method, and information reproducing apparatus and method
JP2008294584A (en) Digest playback apparatus and method
JP2002125199A (en) Frame information description method, frame information generation device and method, video reproduction device and method, and recording medium
JP2018189924A (en) Information processing device, information processing method, and program
JP3877371B2 (en) Video playback device
JP2001236205A (en) INFORMATION PROCESSING DEVICE AND INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM RECORDING INFORMATION PROCESSING PROGRAM
JPWO2007029489A1 (en) Content replay device, content playback device, content replay method, content playback method, program, and recording medium
JP3848144B2 (en) Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program
JP4198331B2 (en) Recording device
CN102611863B (en) Motion picture recording/reproducing apparatus
CN114930865A (en) Computer-implemented method, apparatus, and computer program product for setting playback speed of media content including audio
JP2002084505A (en) Video browsing time reduction apparatus and method
JP4348614B2 (en) Movie reproducing apparatus, imaging apparatus and program thereof
JP2002262228A (en) Digest creation device
JP2006186920A (en) Information reproducing apparatus and information reproducing method
JP4086886B2 (en) Movie playback apparatus, movie playback method and computer program thereof
JP2002016858A (en) Digital broadcast receiver
EP1172814A2 (en) Automatic level control for changing audio mode of digital video recording apparatus
JP3970080B2 (en) Movie playback apparatus, movie playback method and computer program thereof
JP4509188B2 (en) Movie playback apparatus, movie playback method and computer program thereof

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060824

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110901

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees