[go: up one dir, main page]

JP2013016030A - Program reproduction apparatus and program reproduction method - Google Patents

Program reproduction apparatus and program reproduction method Download PDF

Info

Publication number
JP2013016030A
JP2013016030A JP2011148395A JP2011148395A JP2013016030A JP 2013016030 A JP2013016030 A JP 2013016030A JP 2011148395 A JP2011148395 A JP 2011148395A JP 2011148395 A JP2011148395 A JP 2011148395A JP 2013016030 A JP2013016030 A JP 2013016030A
Authority
JP
Japan
Prior art keywords
image
program
image data
information
search key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011148395A
Other languages
Japanese (ja)
Inventor
Tomohiro Morita
知宏 森田
Isao Otsuka
功 大塚
Satoru Tokuyama
悟 徳山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011148395A priority Critical patent/JP2013016030A/en
Publication of JP2013016030A publication Critical patent/JP2013016030A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】番組の映像に含まれている複数の対象から視聴者が所望の対象を簡単に選択して、その対象の情報をネットワーク経由で速やかに得ることができる番組再生装置を実現する。
【解決手段】1つのフレームから1箇所または複数の領域を画像データとして抽出する画像抽出手段と、抽出した画像データの位置を明示するマーカーを生成するGUI制御手段と、マーカーを1つのフレームに重畳して表示する表示制御手段と、視聴者によってマーカーを用いて1つの画像データが選択される操作手段と、番組配列情報および番組特定情報から画像検索キーを生成する画像検索キー生成手段と、画像検索キーを用いて外部のサーバーから参照画像を取得して画像データと照合する画像検索照合手段と、照合結果に基づいて画像データの属性を示す情報検索キーを生成し、ネットワーク経由で画像データに関連する情報を取得する情報検索手段とを備えたものである。
【選択図】図1
[PROBLEMS] To realize a program reproducing apparatus in which a viewer can easily select a desired target from a plurality of targets included in a program video and quickly obtain information on the target via a network.
Image extraction means for extracting one or a plurality of regions from one frame as image data, GUI control means for generating a marker that clearly indicates the position of the extracted image data, and a marker superimposed on one frame Display control means for displaying, operation means for selecting one image data by using a marker by a viewer, image search key generating means for generating an image search key from program sequence information and program specifying information, An image search / collation unit that obtains a reference image from an external server using a search key and collates it with image data, and generates an information search key that indicates the attribute of the image data based on the collation result. And information retrieval means for acquiring related information.
[Selection] Figure 1

Description

本発明は、文字、静止画、動画、音声などで構成される番組を再生することができるとともに、番組に関連する情報の検索ができる番組再生装置に関するものである。   The present invention relates to a program reproducing apparatus capable of reproducing a program composed of characters, still images, moving images, sounds, and the like and searching for information related to the program.

デジタル放送やネットワーク配信される番組を視聴している際に、視聴者が未知の出演者を見つけた場合、出演者の名前やプロフィールをその場で知りたくなることがある。例えばデジタル放送においては、放送ストリームに番組配列情報(Service Information:以降SI情報と称する)が含まれているので、受像機側でこのSI情報を用いて電子番組表(Electronic Program Guide:以降EPGと称する)画面を生成する。視聴者はこのEPGを参照することで視聴中の番組の主な出演者名を見ることができる。   When viewing a digital broadcast or network-delivered program, if the viewer finds an unknown performer, he may want to know the name and profile of the performer on the spot. For example, in digital broadcasting, program arrangement information (Service Information: hereinafter referred to as SI information) is included in a broadcast stream, and therefore, the electronic program guide (Electronic Program Guide: hereinafter referred to as EPG) is used on the receiver side using this SI information. A screen). The viewer can see the names of the main performers of the program being viewed by referring to the EPG.

しかし、視聴者は、そもそも出演者の顔を知らないこともあるので、どの出演者がEPGに記載された出演者名であるかがわからない場合が多い。名前と顔とを一致させるためには、例えばパソコンなどを介して、Webの検索サイトを利用して出演者の名前で検索して出演者の顔を知る必要がある。例えば、EPGの出演者名を順次検索することで当該出演者名に対応した顔画像をパソコンの画面に呼び出して、この顔画像と番組の出演者映像とを照合することが考えられるが、視聴者にとっては非常に煩雑である。また、パソコンなどの検索環境が手元にない場合には、視聴者は、結局誰だか分からずにあきらめる可能性がある。また、SI情報には主要な出演者名しか含まれていないため、当該の出演者名がEPGに記載されてない可能性もある。   However, since the viewer may not know the face of the performer in the first place, it is often difficult to know which performer is the name of the performer described in the EPG. In order to match the name and the face, it is necessary to know the performer's face by searching for the name of the performer using a Web search site via a personal computer, for example. For example, it is conceivable to search for the name of an EPG performer in order to call a face image corresponding to the performer name on the screen of the personal computer, and collate the face image with the performer video of the program. It is very complicated for the person. In addition, if a search environment such as a personal computer is not at hand, the viewer may eventually give up without knowing who he is. Moreover, since only the main performer names are included in the SI information, the performer names may not be described in the EPG.

このような課題を解決するために、放送映像に含まれる顔画像データを抽出した上で、抽出した顔画像データを、データベース化された基準画像と照合する装置に転送することで、抽出した顔画像に対応する情報(名前、性別、プロフィールなど)を取得して受像機の画面に表示することで、視聴者が未知の出演者を特定する事を可能とする方法が開示されている(例えば、特許文献1参照)。   In order to solve such a problem, the face image data included in the broadcast video is extracted, and the extracted face image data is transferred to a device that collates with a reference image stored in a database. A method is disclosed that enables viewers to identify unknown performers by acquiring information (name, gender, profile, etc.) corresponding to an image and displaying it on the screen of the receiver (for example, , See Patent Document 1).

特開2009−118411号公報(第4−9頁、図6)JP 2009-118411 A (page 4-9, FIG. 6)

しかしながら、上記のような従来の方法においては、画像から対象となる顔画像を切り出すために、領域を示すフレームを画面に表示させ、視聴者がリモコン操作などでフレームを移動させる方法と、顔画像検出処理によってフレームを自動的に顔の範囲に表示する方法とが示されているが、いずれの方法であっても1つの画面に複数の人物が映っている場面から所望の顔画像を切り出すことは困難である。また、画像サイズが小さい、顔が横を向いている、輝度やコントラストが不十分など、顔の照合に不適切な品質の画像が切り出される可能性もあり、このような場合、顔画面の切り出し以降の照合処理が困難になるという問題がある。   However, in the conventional method as described above, in order to cut out the target face image from the image, a frame indicating the region is displayed on the screen, and the viewer moves the frame by remote control operation, etc. Although a method of automatically displaying a frame in a face range by a detection process is shown, any method can cut out a desired face image from a scene in which a plurality of persons are shown on one screen. It is difficult. In addition, there is a possibility that an image of inappropriate quality for face matching, such as small image size, face facing sideways, insufficient brightness and contrast, may be cut out. There is a problem that subsequent verification processing becomes difficult.

この発明は、上述のような課題を解決するためになされたもので、デジタル放送やネットワーク配信される番組の映像に含まれている複数の対象から視聴者が所望の対象を簡単に選択して、その対象の情報を速やかに得ることができる番組再生装置を実現することを目的とする。   The present invention has been made to solve the above-described problems, and allows a viewer to easily select a desired target from a plurality of targets included in a video of a digital broadcast or network-delivered program. An object of the present invention is to realize a program reproducing apparatus capable of quickly obtaining the target information.

この発明に係る番組再生装置は、受信した番組を再生する番組再生装置であって、ネットワークを経由して外部のサーバーと通信する通信手段と、前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、前記マーカーを前記1つのフレームに重畳して表示する表示制御手段と、視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出手段と、前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えたものである。   The program playback apparatus according to the present invention is a program playback apparatus for playing back a received program, wherein a communication means for communicating with an external server via a network, a transmission stream of the program as a video stream, an audio stream and data Demultiplexing means for separating into sections, video decoding means for decoding the video stream and converting it into a video signal, and extracting one or a plurality of areas from one frame included in the video signal as image data An image extracting means for generating, a GUI control means for generating a marker for clearly indicating the position of the extracted one or a plurality of image data in the one frame, and displaying the marker superimposed on the one frame. The display control means and the viewer using the marker or the one place or Operation means for selecting one image data from a plurality of image data, program data extraction means for extracting program arrangement information and program identification information included in the data section, and reference from the program arrangement information and the program identification information An image search key generating means for generating an image search key for searching for an image, and using the image search key, the communication means acquires the reference image from the external server via the network, and the image data And an image search / collation unit for collating the reference image with the reference image, and generating an information search key indicating an attribute of the image data based on the collation result, and the image via the network by the communication unit using the information search key. And an information search means for acquiring information related to the data.

この発明は、番組の映像から抽出した1枚もしくは複数の画像データの位置を明示するマーカーを、画像データを抽出した元のフレームに重ねて表示し、視聴者がマーカーを基に1枚の画像データを選択してその画像データを参照画像と照合することで、視聴者が選択した画像データの属性を特定して、その属性を基にネットワーク経由で視聴者が選択した画像データの情報を取得するように構成することで、視聴者は番組の映像に含まれている複数の対象から特定の対象を簡単に選択して、その対象の情報を速やかに得ることが可能となる。   The present invention displays a marker that clearly indicates the position of one or a plurality of image data extracted from a video of a program so as to be superimposed on the original frame from which the image data has been extracted. By selecting the data and comparing the image data with the reference image, the attribute of the image data selected by the viewer is specified, and the information of the image data selected by the viewer is acquired via the network based on the attribute. With this configuration, the viewer can easily select a specific target from a plurality of targets included in the video of the program, and quickly obtain information on the target.

この発明の実施の形態1における番組再生装置を示すブロック構成図である。It is a block block diagram which shows the program reproduction apparatus in Embodiment 1 of this invention. この発明の実施の形態1におけるネットワーク構成図である。It is a network block diagram in Embodiment 1 of this invention. この発明の実施の形態1における番組再生装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the program reproduction apparatus in Embodiment 1 of this invention. この発明の実施の形態1における操作入力部の外観例である。It is an external appearance example of the operation input part in Embodiment 1 of this invention. この発明の実施の形態1における設定画面の構成例である。It is an example of a structure of the setting screen in Embodiment 1 of this invention. この発明の実施の形態1における設定画面のフォーカス移動例である。It is an example of a focus movement of the setting screen in Embodiment 1 of this invention. この発明の実施の形態1における番組再生画面例である。It is an example of the program reproduction | regeneration screen in Embodiment 1 of this invention. この発明の実施の形態1における顔画像切り出し領域例である。It is an example of the face image cut-out area | region in Embodiment 1 of this invention. この発明の実施の形態1における抽出画像テーブル例である。It is an example of the extraction image table in Embodiment 1 of this invention. この発明の実施の形態1における抽出画像領域の選択画面例である。It is an example of the selection screen of the extraction image area | region in Embodiment 1 of this invention. この発明の実施の形態1における抽出画像領域に対するマーカー設定例である。It is an example of the marker setting with respect to the extraction image area | region in Embodiment 1 of this invention. この発明の実施の形態1における画像検索キーリストの例である。It is an example of the image search key list in Embodiment 1 of this invention. この発明の実施の形態1における参照画像取得要求メッセージおよび参照画像取得応答メッセージの例である。It is an example of the reference image acquisition request message and reference image acquisition response message in Embodiment 1 of this invention. この発明の実施の形態1における情報取得要求メッセージの例である。It is an example of the information acquisition request message in Embodiment 1 of this invention. この発明の実施の形態1における情報取得応答メッセージの例である。It is an example of the information acquisition response message in Embodiment 1 of this invention. この発明の実施の形態1における情報表示画面の例である。It is an example of the information display screen in Embodiment 1 of this invention. この発明の実施の形態2における番組再生装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the program reproduction apparatus in Embodiment 2 of this invention. この発明の実施の形態2における抽出画像テーブル例である。It is an example of the extraction image table in Embodiment 2 of this invention. この発明の実施の形態2における抽出画像領域の選択画面例である。It is an example of the selection screen of the extraction image area | region in Embodiment 2 of this invention. この発明の実施の形態3における番組再生装置を示すブロック構成図である。It is a block block diagram which shows the program reproduction apparatus in Embodiment 3 of this invention. この発明の実施の形態3における画像検索キーデータベースの例である。It is an example of the image search key database in Embodiment 3 of this invention.

実施の形態1.
図1は、この発明を実施するための実施の形態1における番組再生装置1の構成の一形態を示すブロック構成図である。番組再生装置1は、主な要素としてチューナー/復調部10、デスクランブル部11、デマルチプレクス部12、映像デコード部13、番組データ抽出部14、画像検索キー生成部16、画像抽出部17、画像検索照合部18、情報検索制御部19、通信プロトコル処理部20、ネットワーク通信部21、GUI(Graphical User Interface)制御部22、操作入力部23、操作解析部24、表示制御部25、表示部26、音声デコード部27および音声出力部28から構成される。
Embodiment 1 FIG.
FIG. 1 is a block configuration diagram showing an example of the configuration of a program playback device 1 according to Embodiment 1 for carrying out the present invention. The program playback device 1 includes a tuner / demodulator 10, a descrambler 11, a demultiplexer 12, a video decoder 13, a program data extractor 14, an image search key generator 16, an image extractor 17, as main elements. Image search collation unit 18, information search control unit 19, communication protocol processing unit 20, network communication unit 21, GUI (Graphical User Interface) control unit 22, operation input unit 23, operation analysis unit 24, display control unit 25, display unit 26, an audio decoding unit 27 and an audio output unit 28.

チューナー/復調部10は、放送を受信するためのフロントエンド処理を行う部分であり、放送を選局して復調することで放送波からストリームデータを抽出する。チューナー/復調部10によって放送波から抽出されたストリームデータは、暗号化されているためデスクランブル部11で復号化される。デマルチプレクス部12は、デスクランブル部11で復号化されたストリームデータから映像ストリーム、音声ストリーム、およびSI情報、番組特定情報などのデータを含んだセクションに分離する。   The tuner / demodulator 10 is a part that performs front-end processing for receiving a broadcast, and extracts stream data from the broadcast wave by selecting and demodulating the broadcast. Since the stream data extracted from the broadcast wave by the tuner / demodulator 10 is encrypted, it is decrypted by the descrambler 11. The demultiplexing unit 12 separates the stream data decoded by the descrambling unit 11 into a section including a video stream, an audio stream, and data such as SI information and program identification information.

映像デコード部13は、MPEG−2(Moving Picture Experts Group phase 2)などの形式で圧縮符号化されている映像ストリームを復号化することでビデオ信号に変換する。番組データ抽出部14は、セクションからSI情報、番組特定情報などのデータを抽出する。画像検索キー生成部16は、画像を検索する際の検索キーを生成する。画像抽出部17は映像デコード部13が復号化したビデオ信号から顔画像の切り出しを行う。画像検索照合部18は、画像抽出部17で切り出された顔画像データを参照画像データと比較して顔の照合を行い、情報検索のための検索キーを生成する。   The video decoding unit 13 decodes a video stream that has been compression-encoded in a format such as MPEG-2 (Moving Picture Experts Group phase 2) and converts it into a video signal. The program data extracting unit 14 extracts data such as SI information and program specifying information from the section. The image search key generation unit 16 generates a search key for searching for an image. The image extraction unit 17 cuts out a face image from the video signal decoded by the video decoding unit 13. The image search collation unit 18 compares the face image data cut out by the image extraction unit 17 with the reference image data, collates the face, and generates a search key for information retrieval.

情報検索制御部19は、ネットワーク経由で検索キーを基に検索を行う。通信プロトコル処理部20は、必要なプロトコルに応じた送信メッセージの生成および受信メッセージの解析を行う。ネットワーク通信部21は、ネットワーク経由でパケットの送受信を行う。   The information search control unit 19 performs a search based on the search key via the network. The communication protocol processing unit 20 generates a transmission message and analyzes a received message according to a necessary protocol. The network communication unit 21 transmits and receives packets via the network.

GUI制御部22は、各種操作画面や状態通知画面の生成、入力コマンドに応じた画面の切り替えなどを行う。操作入力部23は、リモコン、キーボード、マウスなどであり、ユーザーが操作の指示を入力するための入力デバイスの総称である。操作解析部24は、操作入力部23から入力されたコマンドを解析してGUI制御部22に通知する。表示制御部25は、映像デコード部13で復号化されたビデオ信号やGUI制御部22で生成された各種画面の表示制御を行う。表示部26は、表示制御部25の表示制御にしたがって適切な映像を表示するディスプレイである。   The GUI control unit 22 generates various operation screens and status notification screens, and switches screens according to input commands. The operation input unit 23 is a remote controller, a keyboard, a mouse, or the like, and is a generic name for input devices for a user to input operation instructions. The operation analysis unit 24 analyzes the command input from the operation input unit 23 and notifies the GUI control unit 22 of the command. The display control unit 25 performs display control of the video signal decoded by the video decoding unit 13 and various screens generated by the GUI control unit 22. The display unit 26 is a display that displays an appropriate video according to the display control of the display control unit 25.

音声デコード部27は、AAC(Advanced Audio Codec)などの形式で圧縮符号化されている音声ストリームを復号化することで音声信号データに変換する。音声出力部28は、音声デコード部27で復号化された音声信号データをアナログ信号に変換し、増幅してスピーカーから出力する。   The audio decoding unit 27 decodes an audio stream that has been compression-encoded in a format such as AAC (Advanced Audio Codec) and converts it into audio signal data. The audio output unit 28 converts the audio signal data decoded by the audio decoding unit 27 into an analog signal, amplifies it, and outputs it from the speaker.

図2は、本実施の形態の番組再生装置1がネットワークに接続された状態を示すネットワーク構成図である。番組再生装置1は、ネットワーク通信部21を介して、図2に示すとおりネットワーク2に接続されている。この図におけるネットワーク2の代表的なものとしてインターネットであるが、その他専用のイントラネットやホームネットワークなどの場合もある。   FIG. 2 is a network configuration diagram showing a state in which the program playback device 1 of the present embodiment is connected to the network. The program playback device 1 is connected to the network 2 as shown in FIG. A typical network 2 in this figure is the Internet, but there may be other dedicated intranets and home networks.

ネットワーク2には画像データベースサーバー3と情報データベースサーバー4とが接続されている。画像データベースサーバー3には顔照合に必要な参照画像データと、参照画像の内容を説明する属性情報(例えば、人物画像の場合はその人物の名前、性別、年齢などの情報)を対応付けたデータベースとが格納されている。情報データベースサーバー4には特定の人物のプロフィールなど詳細な情報が格納されている。   An image database server 3 and an information database server 4 are connected to the network 2. The image database server 3 is a database in which reference image data necessary for face matching is associated with attribute information explaining the contents of the reference image (for example, in the case of a person image, information such as the name, gender, and age of the person). And are stored. The information database server 4 stores detailed information such as the profile of a specific person.

なお、図2において、画像データベースサーバー3と情報データベースサーバー4とをそれぞれ1台ずつ別のものとして記載しているが、物理的に同じサーバーに統合されていてもよい。また、図2において、番組再生装置1と画像データベースサーバー3と情報データベースサーバー4とをそれぞれ1台ずつ記載してあるが、それぞれが複数台接続されていてもよい。   In FIG. 2, the image database server 3 and the information database server 4 are described as separate servers, but may be integrated into the same physical server. In FIG. 2, one program playback apparatus 1, one image database server 3, and one information database server 4 are shown, but a plurality of each may be connected.

次に、本実施の形態における、番組再生装置1の動作について説明する。図3は、本実施の形態における番組再生装置1の動作のフローを示す図である。図4に、本実施の形態における番組再生装置1の操作に用いる操作入力部23の一例である。図4に示す通り、操作入力部23としてリモコンを例として説明を行う。   Next, the operation of the program playback device 1 in the present embodiment will be described. FIG. 3 is a diagram showing a flow of the operation of the program playback device 1 in the present embodiment. FIG. 4 shows an example of the operation input unit 23 used for the operation of the program playback device 1 in the present embodiment. As shown in FIG. 4, the operation input unit 23 will be described using a remote control as an example.

操作入力部23にはリモコンキーが配列されている。本実施の形態で使用するキーとして、チャンネル番号の直接選択や数字を入力するためのキーが3列×4行の形状で配置されている。これらのキーの名称は、それぞれ数字1キー41、数字2キー42、数字3キー43、数字4キー44、数字5キー45、数字6キー46、数字7キー47、数字8キー48、数字9キー49、数字10/0キー50、数字11キー51および数字12キー52とする。また、上記の12個のキーを総称して数字キーと称する。   Remote control keys are arranged in the operation input unit 23. As keys used in this embodiment, keys for directly selecting channel numbers and inputting numbers are arranged in a shape of 3 columns × 4 rows. The names of these keys are number 1 key 41, number 2 key 42, number 3 key 43, number 4 key 44, number 5 key 45, number 6 key 46, number 7 key 47, number 8 key 48, number 9 respectively. The key 49, the number 10/0 key 50, the number 11 key 51, and the number 12 key 52 are used. The twelve keys are collectively referred to as numeric keys.

番組再生装置1において、チャンネル指定、音量変更などリモコンキーを押下することで直接実行される操作ではなく、表示部26に表示されたメニュー画面等のGUI画面(設定画面)を見ながら実行する操作の場合、ユーザーは、設定画面の選択可能な項目が表示されている部分にフォーカスを当てることで所望の項目を選択する。ここで言う「フォーカスを当てる」とは、表示画面に含まれている選択可能な箇所から任意の箇所を特定していることを示す。   In the program playback apparatus 1, operations that are performed while viewing a GUI screen (setting screen) such as a menu screen displayed on the display unit 26, rather than operations directly performed by pressing a remote control key such as channel designation and volume change. In this case, the user selects a desired item by focusing on a portion of the setting screen where selectable items are displayed. Here, “focus” indicates that an arbitrary location is specified from selectable locations included in the display screen.

図5は、本実施の形態における設定画面の構成例である。図5に示すようにフォーカスが当っている領域の色やトーンを変えたり、枠で囲んだりする。図5は「ネットワーク設定」にフォーカスが当っていることを示している。フォーカスの移動は、リモコンの「十字キー(上下左右の矢印キー)」を用いて、選択可能な箇所を順番に移動する方法が用いられる。   FIG. 5 is a configuration example of a setting screen in the present embodiment. As shown in FIG. 5, the color or tone of the focused area is changed or surrounded by a frame. FIG. 5 shows that “network setting” is focused. For the movement of the focus, a method is used in which the selectable portions are sequentially moved using the “cross key (up / down / left / right arrow keys)” of the remote controller.

図4に示す操作入力部23にはフォーカスを移動するための十字キーが配列されている。十字キーは、実際には上側に移動するキー、下側に移動するキー、右側に移動するキーおよび左側に移動するキーの4種類で構成されている。これらのキーは、それぞれ図4の31、32、33および34に相当し、以降は便宜的に上キー31、下キー32、右キー33および左キー34と称する。また、上キー31、下キー32、右キー33および左キー34の4つのキーを総称する場合は十字キーと称する。図6は、本実施の形態における設定画面のフォーカス移動例である。図6の例では、「受信設定」にフォーカスが当っている状態から「ネットワーク設定」にフォーカスを移動する場合を示しており、この移動には下キー32を2回押下する必要がある。上記のキーに加えて操作入力部23には図4の通り顔検索キー36が配置されている。   A cross key for moving the focus is arranged in the operation input unit 23 shown in FIG. The cross key is actually composed of four types: a key that moves upward, a key that moves downward, a key that moves right, and a key that moves left. These keys correspond to 31, 32, 33 and 34 in FIG. 4, respectively, and are hereinafter referred to as an upper key 31, a lower key 32, a right key 33 and a left key 34 for convenience. The four keys of the upper key 31, the lower key 32, the right key 33, and the left key 34 are collectively referred to as a cross key. FIG. 6 is an example of focus movement on the setting screen in the present embodiment. The example of FIG. 6 shows a case where the focus is moved to the “network setting” from the state where the “reception setting” is focused, and it is necessary to press the down key 32 twice for this movement. In addition to the above keys, a face search key 36 is arranged in the operation input unit 23 as shown in FIG.

番組再生装置1は、チューナー/復調部10で放送波の同調および復調を行い、復調したストリームをデスクランブル部11で暗号解除を行った後、暗号解除されたストリームデータからデマルチプレクス部12によって映像ストリーム、音声ストリーム、およびSI情報、番組特定情報などのデータを含んだセクションに分離する。なお、ストリームデータは、データストリーム(例えば、字幕に関するデータなど)を含んでいる場合があり、その場合にはデマルチプレクス部12は、このデータストリームも分離する。映像ストリームは映像デコード部13によって映像信号に復号化され、映像信号は表示制御部25を経由して表示部26に表示される。   The program reproducing apparatus 1 performs tuning and demodulation of the broadcast wave by the tuner / demodulator 10, decrypts the demodulated stream by the descrambler 11, and then demultiplexes the decrypted stream data by the demultiplexer 12. A video stream, an audio stream, and a section including data such as SI information and program identification information are separated. Note that the stream data may include a data stream (for example, data related to captions). In this case, the demultiplexing unit 12 also separates this data stream. The video stream is decoded into a video signal by the video decoding unit 13, and the video signal is displayed on the display unit 26 via the display control unit 25.

図7は、本実施の形態における番組再生画面例である。これ以降、図3を用いて本実施の形態における番組再生装置1の動作を説明する。視聴者は、図7に示す通り4名の人物が映っている番組を視聴している状態で、ステップS101において番組再生装置1の操作入力部23の顔検索キー36を押下する。操作入力部23は、操作解析部24に対して押下されたキーのコード情報を送信する。操作解析部24は、受信したキーコード情報から顔検索機能のGUI画面を有効にするようにGUI制御部22に要求を行う。GUI制御部22は、画像抽出部17に対して出画中の映像から顔画像の切り出しを行うように要求を行うと同時に、表示制御部25に対して画像静止の要求を行う。   FIG. 7 shows an example of a program playback screen in the present embodiment. Hereinafter, the operation of the program reproducing apparatus 1 in the present embodiment will be described with reference to FIG. As shown in FIG. 7, the viewer presses the face search key 36 of the operation input unit 23 of the program playback device 1 in step S101 while viewing a program in which four persons are shown. The operation input unit 23 transmits the code information of the pressed key to the operation analysis unit 24. The operation analysis unit 24 requests the GUI control unit 22 to validate the GUI screen of the face search function from the received key code information. The GUI control unit 22 requests the image extraction unit 17 to cut out a face image from the video being output, and simultaneously requests the display control unit 25 to freeze the image.

ステップS102において、画像抽出部17は、映像デコード部13によって復号化された映像信号に含まれる任意のフレームから顔画像の切り出しを行う。図8は、本実施の形態における顔画像切り出し領域例である。この例では4つの顔を検出して、図8に示す4つの領域A1、A2、A3およびA4を切り出したとする。画像抽出部17は、この切り出した領域が画面中のどこに位置するかを示す座標値を含んだ抽出画像テーブルを生成する。また、併せて切り出した4つの領域の画像をそれぞれ個別の抽出画像ファイルとして生成する。   In step S <b> 102, the image extraction unit 17 cuts out a face image from an arbitrary frame included in the video signal decoded by the video decoding unit 13. FIG. 8 shows an example of a face image cutout area in the present embodiment. In this example, it is assumed that four faces are detected and the four areas A1, A2, A3, and A4 shown in FIG. 8 are cut out. The image extraction unit 17 generates an extracted image table including coordinate values indicating where the cut-out area is located on the screen. In addition, images of four regions cut out together are generated as individual extracted image files.

図9は、本実施の形態における抽出画像テーブル例である。抽出画像テーブルの要素としては、この画面内におけるA1〜A4領域それぞれの左上角の位置を示すための水平座標位置および垂直座標位置、領域A1〜A4それぞれのサイズを示すための水平サイズおよび垂直サイズ、並びに領域A1〜A4のそれぞれを特定するための画像IDから構成される。また、一番右側の列には説明の便宜上、領域を区別する符号番号を示しているが実際の抽出画像テーブルの要素としては不要である。座標は、図8に示す通り、画面全体の左上を原点(座標0)として、水平方向は右側に進むにつれ座標値は増加する。また垂直方向は下側に進むにつれ座標値は増加する。   FIG. 9 is an example of an extracted image table in the present embodiment. The elements of the extracted image table include a horizontal coordinate position and a vertical coordinate position for indicating the position of the upper left corner of each of the A1 to A4 areas in the screen, and a horizontal size and a vertical size for indicating the sizes of the areas A1 to A4. And image IDs for specifying each of the areas A1 to A4. The rightmost column shows a code number for distinguishing the region for convenience of explanation, but it is not necessary as an element of the actual extracted image table. As shown in FIG. 8, the coordinate value increases as the horizontal direction advances to the right with the upper left corner of the entire screen as the origin (coordinate 0). In the vertical direction, the coordinate value increases as it goes downward.

座標は画素数を単位としている。この例ではフルハイビジョン(水平方向:1920画素×垂直方向:1080画素)の画像を想定しているので、右端の水平位置座標は1919、下端の垂直位置座標は1079となる。図9の抽出画像テーブルにおいて、領域A1は、画像IDが1、左上角の位置座標が水平位置座標=320、垂直位置座標=212、水平サイズ=330画素、垂直サイズ340画素であることを示している。また、この抽出画像テーブルにおいて、番組中のどのフレームに相当するかを示すためにフレームIDと抽出画像テーブルとの対応付けが行われる。フレームIDはある程度長い期間中(例えば番組単位)でそれぞれのフレームがユニークに特定できるように割り付けた番号である。例えばデコード時にフレーム1枚ごとに1ずつ増加させるカウンター値を割り付けることで実現できる。   The coordinates are based on the number of pixels. In this example, an image of full high-definition (horizontal direction: 1920 pixels × vertical direction: 1080 pixels) is assumed, so the horizontal position coordinate at the right end is 1919 and the vertical position coordinate at the lower end is 1079. In the extracted image table of FIG. 9, area A1 indicates that the image ID is 1, the position coordinates of the upper left corner are horizontal position coordinates = 320, vertical position coordinates = 212, horizontal size = 330 pixels, and vertical size 340 pixels. ing. Further, in this extracted image table, the frame ID and the extracted image table are associated with each other in order to indicate which frame in the program corresponds to. The frame ID is a number assigned so that each frame can be uniquely specified in a certain long period (for example, a program unit). For example, this can be realized by assigning a counter value that is incremented by 1 for each frame during decoding.

ステップS103において、GUI制御部22は、抽出画像テーブルを参照して、視聴者が顔画像を区別して選択できるように、顔が表示されている領域を区別するためのマーカーのグラフィックスデータを生成し、生成したマーカーを重畳表示するフレームを指定するために、抽出画像テーブルに対応付けられたフレームIDとともにマーカーのグラフィックスデータを表示制御部25に引き渡す。表示制御部25は受け取ったフレームIDに対応するフレームを静止画として表示部26に表示するとともに、マーカーのグラフィックスデータをこのフレームに重ねて表示する。図10は、このようにしてグラフィックスデータがフレームに重畳して表示された、抽出画像領域の選択画面例である。   In step S103, the GUI control unit 22 refers to the extracted image table, and generates marker graphics data for distinguishing the region where the face is displayed so that the viewer can distinguish and select the face image. Then, in order to designate a frame in which the generated marker is superimposed and displayed, the graphics data of the marker is delivered to the display control unit 25 together with the frame ID associated with the extracted image table. The display control unit 25 displays a frame corresponding to the received frame ID on the display unit 26 as a still image, and displays the graphic data of the marker on the frame. FIG. 10 is an example of an extraction image area selection screen in which graphics data is displayed superimposed on a frame in this way.

図10の例では、顔の周辺を囲む楕円形を配置し、視聴者が区別できるようにそれぞれに「1」、「2」、「3」および「4」の番号を付加して表示している。図11は、抽出画像領域に対するマーカー設定例である。この楕円形は、図11に示す通り、抽出画像テーブルにおける水平座標位置、垂直座標位置、水平サイズおよび垂直サイズの4つの変数から領域A2の長方形に内接する楕円として算出されて表示されている。この方法により、顔が近接している場面でもマーカー同士が重なりにくくなり視聴者による視認性が高まる効果が得られる。   In the example of FIG. 10, an ellipse surrounding the periphery of the face is arranged, and numbers “1”, “2”, “3”, and “4” are added and displayed so that the viewer can distinguish them. Yes. FIG. 11 is an example of marker setting for the extracted image region. As shown in FIG. 11, this ellipse is calculated and displayed as an ellipse inscribed in the rectangle of the area A2 from four variables of the horizontal coordinate position, the vertical coordinate position, the horizontal size, and the vertical size in the extracted image table. According to this method, even in a scene where faces are close to each other, it is difficult for the markers to overlap each other, and an effect of increasing the visibility by the viewer can be obtained.

ステップS104において、視聴者は検索したい顔の選択を行う。具体的な操作としては、図10に示す抽出画像領域の選択画面を見ながら、所望の顔に該当する番号を操作入力部23の数字キーを押下することで選択する。例えば、数字2キー42を押下すると、領域A2に対応する顔の選択を行ったことになる。この方法により視聴者は操作入力部23のリモコンボタンの1つを1回押すだけで所望の顔を選択することが可能となり、操作が容易になるという効果が得られる。例えば、図10の画面のように顔が縦一列もしくは横一列に並んでいないような場面では、十字キーを押したときにフォーカスが移動する方向が分かりにくいという問題がある(例えば、1にフォーカスが当たっている場合に右キー33を押下したら2と3のどちらにフォーカスが移動するか分かりにくい)。しかしながら、本実施の形態のようにマーカーに個別の番号が付与されており、ユーザーはこの番号を数字キーで直接入力することができるので、視聴者が迷うことなく所望の顔を選択できる効果が得られる。   In step S104, the viewer selects a face to be searched. As a specific operation, a number corresponding to a desired face is selected by pressing a number key of the operation input unit 23 while viewing the selection screen of the extracted image area shown in FIG. For example, when the number 2 key 42 is pressed, the face corresponding to the area A2 is selected. With this method, the viewer can select a desired face only by pressing one of the remote control buttons of the operation input unit 23 once, and an effect that the operation becomes easy can be obtained. For example, in the scene where the faces are not aligned vertically or horizontally as in the screen of FIG. 10, there is a problem that it is difficult to know the direction in which the focus moves when the cross key is pressed (for example, the focus is 1). If the right key 33 is pressed when the key is hit, it is difficult to know whether the focus moves to 2 or 3.) However, an individual number is assigned to the marker as in the present embodiment, and the user can directly input this number with the numeric keys, so that the viewer can select a desired face without hesitation. can get.

このステップS104において、操作解析部24は、押下された数字キーのコードを受信して、受信したキーコード情報からGUI制御部22に数字の「2」が選択されたことを通知する。GUI制御部22は、数字の「2」が選択された通知に従って、視聴者が選択した抽出画像の画像IDを画像検索照合部18に引き渡す。また、これと同時にGUI制御部は、表示制御部25に対して画像静止終了の要求を行う、この要求を受けて表示制御部25は、マーカーのグラフィックスの重畳表示を終了するとともに番組映像の再生表示を再開する。これにより視聴者が自身の選択操作が受付けられたことを認識できるという効果が得られる。   In step S104, the operation analysis unit 24 receives the code of the pressed numeric key and notifies the GUI control unit 22 that the number “2” has been selected from the received key code information. The GUI control unit 22 delivers the image ID of the extracted image selected by the viewer to the image search collation unit 18 in accordance with the notification that the number “2” is selected. At the same time, the GUI control unit requests the display control unit 25 to end image stillness. Upon receiving this request, the display control unit 25 ends the superimposed display of the marker graphics and displays the program video. Resume playback display. As a result, the viewer can recognize that his / her selection operation has been accepted.

ステップS105において、画像検索照合部18は、画像検索キー生成部16に対して画像検索キーの生成要求を行う。画像検索キー生成部16は、番組データ抽出部14でセクションデータから抽出された番組特定情報を入手して、現在視聴中の番組を特定した上で、同じく番組データ抽出部14でセクションデータから抽出された番組配列情報(SI情報)を参照して出演者名の一覧から構成される画像検索キーリストを生成する。図12は、本実施の形態における画像検索キーリストの例である。画像検索キー生成部16は、画像検索照合部18に生成した画像検索キーリストを引き渡す。   In step S <b> 105, the image search collation unit 18 requests the image search key generation unit 16 to generate an image search key. The image search key generation unit 16 obtains the program identification information extracted from the section data by the program data extraction unit 14, identifies the program currently being viewed, and similarly extracts from the section data by the program data extraction unit 14. An image search key list including a list of performer names is generated with reference to the program arrangement information (SI information). FIG. 12 is an example of an image search key list in the present embodiment. The image search key generation unit 16 delivers the generated image search key list to the image search collation unit 18.

ステップS106において、画像検索キー生成部16は、画像検索キーリストを参照して、まず先頭に登録されている出演者名(図12の例では画像検索キー番号1の「小田健二」)をキーとして、通信プロトコル処理部20に参照画像取得要求のメッセージ作成コマンドを発行する。通信プロトコル部20は、所定のプロトコルに従った参照画像取得要求メッセージを生成する。この場合の所定のプロトコルとは例えばHTTP(Hypertext Transfer protocol)に従って構成されたGETメソッドなどである。図13は、参照画像取得要求メッセージおよび参照画像取得応答メッセージの例である。このメッセージではrefimg.bmpという名称の参照画像を要求している。この後に通信プロトコル部20は、ネットワーク通信部21を介してネットワーク経由で画像データベース3に対してこの参照画像取得要求メッセージを送信する。   In step S106, the image search key generation unit 16 refers to the image search key list, and first selects the name of the performer registered at the top (“Kenji Oda” of the image search key number 1 in the example of FIG. 12). The message creation command for the reference image acquisition request is issued to the communication protocol processing unit 20. The communication protocol unit 20 generates a reference image acquisition request message according to a predetermined protocol. The predetermined protocol in this case is, for example, a GET method configured according to HTTP (Hypertext Transfer Protocol). FIG. 13 is an example of a reference image acquisition request message and a reference image acquisition response message. In this message, refimg. A reference image named bmp is requested. Thereafter, the communication protocol unit 20 transmits this reference image acquisition request message to the image database 3 via the network communication unit 21 via the network.

画像データベース3は、受信した参照画像取得要求メッセージを解析して、「小田健二」に合致する参照画像データを参照画像取得応答メッセージとして番組再生装置1のネットワーク通信部21に送信する。図13には参照画像取得応答メッセージの例も示している。このメッセージでは、HTTPのGETメソッドに対するレスポンスメッセージの形式を採用している。通常、参照画像データは1枚であるが、照合精度を向上させるために複数枚用いてもよい。   The image database 3 analyzes the received reference image acquisition request message, and transmits the reference image data matching “Kenji Oda” to the network communication unit 21 of the program playback device 1 as a reference image acquisition response message. FIG. 13 also shows an example of a reference image acquisition response message. This message adopts a response message format for the HTTP GET method. Usually, one reference image data is used, but a plurality of reference image data may be used in order to improve collation accuracy.

ステップS107において、番組再生装置1の通信プロトコル処理20は、ネットワーク通信部21を介して、参照画像取得応答メッセージを受信する。通信プロトコル処理20は、参照画像取得応答メッセージから参照画像データのみを抽出して画像検索照合部18に引き渡す。画像検索照合部18は、ステップS102で画像抽出部17が生成した抽出画像ファイルおよび抽出画像テーブルを基に、ステップS104でGUI制御部22から引き渡された抽出画像の画像IDからステップS106で取得した参照画像データとの照合を行う1つの抽出画像ファイルを決定し、この参照画像データとの照合判定を行う。   In step S <b> 107, the communication protocol process 20 of the program playback device 1 receives the reference image acquisition response message via the network communication unit 21. The communication protocol process 20 extracts only the reference image data from the reference image acquisition response message and delivers it to the image search collation unit 18. Based on the extracted image file and the extracted image table generated by the image extracting unit 17 in step S102, the image search collating unit 18 acquired in step S106 from the image ID of the extracted image delivered from the GUI control unit 22 in step S104. One extracted image file to be collated with the reference image data is determined, and collation with the reference image data is determined.

抽出画像ファイルと参照画像データとの照合判定の方法としては、一般に顔照合処理技術して知られている、例えば、固有顔法、LFA(Local Feature Analysys)法などのアルゴリズムを適用することができる。これらの方法においては、抽出画像ファイルと参照画像データとの類似度など照合結果のスコア値がある一定の閾値以上であれば一致すると判定する。   As a method for collation determination between the extracted image file and the reference image data, an algorithm such as a proper face method or an LFA (Local Feature Analysis) method, which is generally known as a face collation processing technique, can be applied. . In these methods, if the score value of the collation result, such as the similarity between the extracted image file and the reference image data, is equal to or greater than a certain threshold, it is determined that they match.

ステップS108において、照合判定結果が「参照画像と合致しない」となった場合、すなわち照合結果のスコアが所定の閾値を越えなかった場合はステップS109に遷移する。ステップS109では、画像検索キー番号が画像検索キーリストの最後の画像を示す値ではなかった場合、例えば図12の画像検索キーリストにおける画像検索キー番号が1から8のいずれかの場合は、ステップS110に遷移する。ステップS110において、画像検索キー番号を+1増加させて再度ステップS106に遷移する。   If the collation determination result is “does not match the reference image” in step S108, that is, if the collation result score does not exceed the predetermined threshold, the process proceeds to step S109. In step S109, if the image search key number is not a value indicating the last image in the image search key list, for example, if the image search key number in the image search key list in FIG. The process proceeds to S110. In step S110, the image search key number is incremented by 1, and the process proceeds to step S106 again.

ステップS108において、照合判定結果が「参照画像と合致する」となった場合、すなわち照合結果のスコアが所定の閾値を越えた場合はステップS111に遷移する。   If the collation determination result is “matches reference image” in step S108, that is, if the collation result score exceeds a predetermined threshold, the process proceeds to step S111.

ステップS111において、画像検索照合部18は、情報検索制御部19に参照画像と合致した検索キーを引渡し、情報検索要求を行う。   In step S111, the image search collation unit 18 delivers a search key that matches the reference image to the information search control unit 19, and makes an information search request.

ステップS112において、情報検索制御部19は、受け取った検索キーをベースとして、通信プロトコル処理部20に対して情報取得要求のメッセージ作成コマンドを発行する。通信プロトコル部20は、所定のプロトコルに従った情報取得要求メッセージを生成する。この場合の所定のプロトコルとは例えばHTTPに従って構成されたPOSTメソッドなどである。図14は、情報取得要求メッセージの一例である。この例では、XML(eXtended Markup Language)形式の文書に検索キーを埋め込む形でメッセージを生成している。この後に通信プロトコル部20は、ネットワーク通信部21を介してネットワーク経由で情報データベース4に対してこの情報取得要求メッセージを送信する。   In step S112, the information search control unit 19 issues an information acquisition request message creation command to the communication protocol processing unit 20 based on the received search key. The communication protocol unit 20 generates an information acquisition request message according to a predetermined protocol. The predetermined protocol in this case is, for example, a POST method configured according to HTTP. FIG. 14 is an example of an information acquisition request message. In this example, a message is generated by embedding a search key in an XML (eXtended Markup Language) format document. Thereafter, the communication protocol unit 20 transmits this information acquisition request message to the information database 4 via the network via the network communication unit 21.

情報データベース4は、受信した情報取得要求メッセージを解析して、例えば「小田健二」に合致するプロフィールデータを情報取得応答メッセージとして番組再生装置1に送信する。図15は、情報取得要求応答メッセージの一例である。この例では、メッセージはHTTPのPOSTメソッドに対するレスポンスメッセージの形式を採用している。プロフィールデータは、XML形式のテキスト文書の構成が採用されており、このXML文書の中に、本名、年齢、性別、経歴、代表作などの情報がタグにより構造化されたデータとして埋め込まれている。   The information database 4 analyzes the received information acquisition request message, and transmits, for example, profile data matching “Oda Kenji” as an information acquisition response message to the program playback device 1. FIG. 15 is an example of an information acquisition request response message. In this example, the message adopts a response message format for the HTTP POST method. The profile data employs an XML text document structure, and information such as the real name, age, sex, career, and representative work is embedded in the XML document as data structured by tags.

ステップS113において、番組再生装置1の通信プロトコル処理部20は、ネットワーク通信部21を介して、情報取得応答メッセージを受信する。通信プロトコル処理部20は、情報取得応答メッセージからXML形式のプロフィールデータのみを抽出して画像検索照合部18に引き渡す。   In step S <b> 113, the communication protocol processing unit 20 of the program reproduction device 1 receives the information acquisition response message via the network communication unit 21. The communication protocol processing unit 20 extracts only the profile data in the XML format from the information acquisition response message and passes it to the image search collation unit 18.

画像検索照合部18は、受け取ったXML形式のプロフィールデータを解析し、タグで囲まれている個別の要素を取り出してGUI制御部22に引き渡す。GUI表示部22は、プロフィールを表示するグラフィックスデータを生成して、表示制御部25に引き渡す。表示制御部25は、番組再生画面に重ねてプロフィール表示のグラフィックスデータを表示する。図16は、本実施の形態における情報表示画面の一例である。   The image search / collation unit 18 analyzes the received profile data in the XML format, extracts individual elements surrounded by tags, and delivers them to the GUI control unit 22. The GUI display unit 22 generates graphics data for displaying the profile and delivers it to the display control unit 25. The display control unit 25 displays the graphic data of the profile display so as to overlap the program reproduction screen. FIG. 16 is an example of an information display screen in the present embodiment.

このように構成された番組再生装置においては、番組の映像から抽出した1枚もしくは複数の画像データの位置を明示するマーカー表示を、画像データを抽出した元のフレームに重ねて表示し、視聴者がマーカー表示を基に1枚の画像データを選択してその画像データを参照画像と照合することで、視聴者が選択した画像データの属性を特定して、その属性を基にネットワーク経由で視聴者が選択した画像データの情報を取得することができるので、視聴者は番組の映像に含まれている複数の対象から特定の対象を簡単に選択して、その対象の情報を速やかに得ることが可能となる。   In the program playback apparatus configured as described above, a marker display that clearly indicates the position of one or a plurality of image data extracted from the video of the program is displayed so as to overlap the original frame from which the image data is extracted. Selects one image data based on the marker display and collates the image data with the reference image to identify the attribute of the image data selected by the viewer and view it via the network based on the attribute. Since the information of the image data selected by the viewer can be acquired, the viewer can easily select a specific target from a plurality of targets included in the video of the program and quickly obtain the information of the target Is possible.

実施の形態2.
実施の形態1において、図3に示すステップS102では、画像抽出部17は映像デコード部13によって復号化された映像信号に含まれる任意のフレームからから顔画像の切り出しを行うが、この際に切り出しを行った顔画像が例えばサイズが小さいなど顔照合に適さない場合がある。このような場合、これ以降のステップS107において実行される抽出画像と参照画像データと照合判定においてエラーが発生することがありうる。実施の形態2においては、このような課題を事前に回避することができる方法について説明する。
Embodiment 2. FIG.
In the first embodiment, in step S102 shown in FIG. 3, the image extraction unit 17 cuts out a face image from an arbitrary frame included in the video signal decoded by the video decoding unit 13. In some cases, the face image subjected to the correction is not suitable for face collation, such as a small size. In such a case, an error may occur in the collation determination between the extracted image and the reference image data executed in the subsequent step S107. In the second embodiment, a method capable of avoiding such a problem in advance will be described.

図17は本実施の形態の番組再生装置の動作フローを示した図である。ステップS101において、視聴者は、図7に示す通り4名の人物が映っている番組を視聴している状態で、番組再生装置1の操作入力部23の顔検索キー36を押下する。操作入力部23は、操作解析部24に対して押下されたキーのコード情報を送信する。操作解析部24は、受信したキーコード情報から顔検索機能のGUI画面を有効にするようにGUI制御部22に要求を行う。GUI制御部22は、画像抽出部17に対して出画中の映像から顔画像の切り出しを行うように要求を行うと同時に、表示制御部25に対して画像静止の要求を行う。   FIG. 17 is a diagram showing an operation flow of the program reproducing apparatus of the present embodiment. In step S <b> 101, the viewer presses the face search key 36 of the operation input unit 23 of the program playback device 1 while viewing a program in which four people are shown as shown in FIG. 7. The operation input unit 23 transmits the code information of the pressed key to the operation analysis unit 24. The operation analysis unit 24 requests the GUI control unit 22 to validate the GUI screen of the face search function from the received key code information. The GUI control unit 22 requests the image extraction unit 17 to cut out a face image from the video being output, and simultaneously requests the display control unit 25 to freeze the image.

ステップS102において、画像抽出部17は、映像デコード部13によって復号化された映像信号に含まれる任意のフレームからから顔画像の切り出しを行う。本実施の形態では、実施の形態1と同様に4つの顔を検出して、図8に示す4つの領域A1、A2、A3およびA4を切り出したとする。画像抽出部17は、この切り出した領域が画面中のどこに位置するかを示す座標値を含んだ抽出画像テーブルを生成する。また、併せて切り出した4つの領域の画像を個別の抽出画像ファイルとして生成する。   In step S102, the image extraction unit 17 cuts out a face image from an arbitrary frame included in the video signal decoded by the video decoding unit 13. In the present embodiment, it is assumed that four faces are detected and the four areas A1, A2, A3, and A4 shown in FIG. The image extraction unit 17 generates an extracted image table including coordinate values indicating where the cut-out area is located on the screen. In addition, images of four regions cut out together are generated as individual extracted image files.

画像抽出部17は、切り出した4つの抽出画像ファイルそれぞれに対して、参照画像データとの照合に適切かどうかの評価を行う。評価パラメータおよび判断基準は照合を行う画像検索照合部18の性能に応じて適当なものを使用する。例えば抽出画像の画素数、平均輝度などである。評価パラメータとして抽出画像のサイズを使用する場合、画像における水平方向の画素数および垂直方向の画素数の閾値として、それぞれPHrefおよびPVrefと定め、抽出画像の水平方向の画素数をPHext、垂直方向の画素数をPVextとしたとき、下記の不等式(1)もしくは不等式(29に示す条件のいずれか一方もしくは両方が満たされない場合、照合に適切ではないと判断する。   The image extraction unit 17 evaluates whether each of the extracted four extracted image files is appropriate for matching with reference image data. Appropriate evaluation parameters and determination criteria are used according to the performance of the image search / collation unit 18 for collation. For example, the number of pixels of the extracted image, average luminance, and the like. When the size of the extracted image is used as the evaluation parameter, PHref and PVref are set as threshold values for the number of pixels in the horizontal direction and the number of pixels in the vertical direction, respectively, and the number of pixels in the horizontal direction of the extracted image is PHext, When the number of pixels is PVext, if one or both of the following inequality (1) or inequality (29) is not satisfied, it is determined that it is not appropriate for collation.

PHref > PHext ・・・・ (1)
PVref > PVext ・・・・ (2)
PHref> PHext (1)
PVref> PVext (2)

評価パラメータとして平均輝度を使用する場合、画像中の全画素における輝度値の平均値を平均輝度とする。平均輝度の閾値としてBrefと定め、抽出画像の平均輝度をBextとした時、下記の不等式(3)に示す条件が満たされない場合、照合に適切ではないと判断する。   When average luminance is used as the evaluation parameter, the average luminance value of all pixels in the image is defined as average luminance. When the threshold value of the average luminance is set to Bref and the average luminance of the extracted image is set to Bext, if the condition shown in the following inequality (3) is not satisfied, it is determined that it is not appropriate for collation.

Bref > Bext ・・・・・・ (3) Bref> Bext (3)

上記の(1)、(2)および(3)の3つの不等式を組み合わせて、全ての条件を満たした場合のみ照合に適切と判断し、それ以外の場合は照合に適切でないと判断してもよい。   Combining the above three inequalities (1), (2), and (3), only when all the conditions are satisfied, it is determined that it is appropriate for collation, otherwise it is determined that it is not appropriate for collation Good.

ステップS201において、画像抽出部17は、切り出した4つの抽出画像ファイルそれぞれに対して、参照画像データとの照合に適切かどうかの判定を行い、照合に適切と判断した場合、ステップS202に進み抽出画像テーブルの照合有効フラグにONを設定する。また、照合に適切ではないと判断した場合、ステップS203に進み抽出画像テーブルの照合有効フラグにOFFを設定する。   In step S201, the image extraction unit 17 determines whether each of the extracted four extracted image files is appropriate for matching with reference image data. If it is determined that matching is appropriate for matching, the process proceeds to step S202 and extraction is performed. Set the collation valid flag of the image table to ON. If it is determined that it is not appropriate for collation, the process proceeds to step S203, and the collation valid flag of the extracted image table is set to OFF.

図18は、本実施の形態における抽出画像テーブル例である。この例では、領域A1、領域A2および領域A4は照合に適切と判断され、領域A3は照合に適切ではないと判断されている。   FIG. 18 is an example of an extracted image table in the present embodiment. In this example, the area A1, the area A2, and the area A4 are determined to be appropriate for collation, and the area A3 is determined to be inappropriate for collation.

ステップS103において、GUI制御部22は、抽出画像テーブルを参照して、視聴者が顔画像を区別して選択できるように、顔が表示されている領域を区別するためのマーカーのグラフィックスデータを生成する。この際にマーカーは照合に適切と判断された領域A1、領域A2および領域A4のみについて生成する。   In step S103, the GUI control unit 22 refers to the extracted image table, and generates marker graphics data for distinguishing the region where the face is displayed so that the viewer can distinguish and select the face image. To do. At this time, the markers are generated only for the areas A1, A2, and A4 that are determined to be appropriate for collation.

この後、GUI制御部22は、生成したマーカーを重畳表示するフレームを指定するために、抽出画像テーブルに対応付けられたフレームIDとともにマーカーのグラフィックスデータを表示制御部25に引き渡す。表示制御部25は、受け取ったフレームIDに対応するフレームを静止画として表示部26に表示するとともに、マーカーのグラフィックスデータをこのフレームに重ねて表示する。その後ステップS104に遷移し、以降は実施の形態1の図3で説明した手順と同様である。   Thereafter, the GUI control unit 22 delivers the graphics data of the marker to the display control unit 25 together with the frame ID associated with the extracted image table in order to designate a frame in which the generated marker is displayed in a superimposed manner. The display control unit 25 displays a frame corresponding to the received frame ID on the display unit 26 as a still image, and displays the marker graphics data on the frame. Thereafter, the process proceeds to step S104, and the subsequent steps are the same as those described in FIG. 3 of the first embodiment.

図19は、本実施の形態における抽出画像領域の選択画面例である。実施の形態1と異の図10に示された符号3の領域A3は、本実施の形態においては照合に適切ではないと判断されている。その結果、図19に示すように、図10に示された符号3マーカーは表示されず、視聴者は、この画像(顔)を選択することができない。   FIG. 19 shows an example of an extraction image region selection screen in the present embodiment. A region A3 indicated by reference numeral 3 shown in FIG. 10 different from the first embodiment is determined not to be suitable for collation in the present embodiment. As a result, as shown in FIG. 19, the code 3 marker shown in FIG. 10 is not displayed, and the viewer cannot select this image (face).

このように構成された番組再生装置においては、ステップS104で視聴者が検索したい顔の選択を行う場合に、照合に適切ではないと判断された領域の顔を選ぶことができないため、ステップS107において実行される抽出画像と参照画像データと照合判定においてエラーが発生することを回避できる。   In the program reproducing apparatus configured as described above, when the viewer selects a face to be searched in step S104, it is impossible to select a face in an area determined to be unsuitable for matching. It is possible to avoid the occurrence of an error in the collation determination with the extracted image and reference image data to be executed.

実施の形態3.
図20は、この発明の実施の形態3における番組再生装置1の構成の一形態を示すブロック構成図である。本実施の形態の番組再生装置は、実施の形態1で示した番組再生装置に対して、画像検索キー生成部16に画像検索キーデータベース15が追加されたものである。画像検索キーデータベース15は、ネットワーク等の手段で随時更新可能な特定の番組に対する出演者のリストであり、メモリーなどに保持されている。図21は、本実施の形態における画像検索キーデータベースの例である。
Embodiment 3 FIG.
FIG. 20 is a block configuration diagram showing an example of the configuration of the program playback device 1 according to Embodiment 3 of the present invention. The program playback device of the present embodiment is obtained by adding an image search key database 15 to the image search key generation unit 16 with respect to the program playback device shown in the first embodiment. The image search key database 15 is a list of performers for a specific program that can be updated at any time by means such as a network, and is held in a memory or the like. FIG. 21 is an example of an image search key database in the present embodiment.

実施の形態1の図3に示すフローチャートにおけるステップS105において、画像検索照合部18は、画像検索キー生成部16に対して画像検索キーの生成要求を行う。画像検索キー生成部16は番組データ抽出部14がセクションデータから抽出した番組特定情報を入手して、現在視聴中の番組を特定した上で、画像検索キーデータベース15に対して視聴中の番組の出演者名のリスト検索要求を行う。画像検索キーデータベース15は、指定された番組名をキーにして検索した当該番組の出演者リストを画像検索キー生成部16に引き渡す。この出演者リストを基に画像検索キー生成部16は出演者名の一覧から構成される画像検索キーリストを生成する。以降は実施の形態1の図3で説明した手順と同様である。   In step S105 in the flowchart shown in FIG. 3 according to the first embodiment, the image search collating unit 18 requests the image search key generating unit 16 to generate an image search key. The image search key generation unit 16 obtains the program identification information extracted from the section data by the program data extraction unit 14 to identify the currently viewed program, and then the program of the currently viewed program with respect to the image search key database 15. Perform a list search request for performers. The image search key database 15 delivers the performer list of the program searched using the designated program name as a key to the image search key generation unit 16. Based on this performer list, the image search key generating unit 16 generates an image search key list composed of a list of performer names. The subsequent steps are the same as those described in FIG. 3 of the first embodiment.

このように構成された番組再生装置においては、画像検索キーデータベース15が特定の番組に対する出演者のリストをネットワーク等の手段で随時更新可能であるため、番組配列情報に含まれる情報よりも豊富に(例えば端役の出演者名を含むなど)画像検索キーの情報を入手できるので、より多くの出演者を特定することができる。   In the program playback apparatus configured in this way, the image search key database 15 can update the list of performers for a specific program at any time by means of a network or the like, so that it is more abundant than the information included in the program sequence information. Since the information of the image search key can be obtained (for example, including the name of the performer of the end role), more performers can be specified.

1 番組再生装置
2 ネットワーク
3 画像データベース
4 情報データベース
10 チューナー/復調部
11 デスクランブル部
12 デマルチプレクス部
13 映像デコード部
14 番組データ抽出部
15 画像検索キーデータベース
16 画像検索キー生成部
17 画像抽出部
18 画像検索照合部
19 情報検索制御部
20 通信プロトコル処理部
21 ネットワーク通信部
22 GUI制御部
23 操作入力部
24 操作解析部
25 表示制御部
26 表示部
27 音声デコード部
28 音声出力部
31 上キー
32 下キー
33 左キー
34 右キー
35 決定キー
36 顔検索キー
41〜52 数字キー
DESCRIPTION OF SYMBOLS 1 Program reproduction apparatus 2 Network 3 Image database 4 Information database 10 Tuner / demodulation part 11 Descramble part 12 Demultiplex part 13 Video decoding part 14 Program data extraction part 15 Image search key database 16 Image search key generation part 17 Image extraction part DESCRIPTION OF SYMBOLS 18 Image search collation part 19 Information search control part 20 Communication protocol processing part 21 Network communication part 22 GUI control part 23 Operation input part 24 Operation analysis part 25 Display control part 26 Display part 27 Voice decoding part 28 Voice output part 31 Up key 32 Down key 33 Left key 34 Right key 35 Enter key 36 Face search keys 41-52 Number keys

Claims (18)

受信した番組を再生する番組再生装置であって、
ネットワークを経由して外部のサーバーと通信する通信手段と、
前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、
前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、
前記マーカーを前記1つのフレームに重畳して表示する表示制御手段と、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、
前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出手段と、
前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、
前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、
前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えることを特徴とする番組再生装置。
A program playback device for playing back a received program,
A communication means for communicating with an external server via a network;
Demultiplexing means for separating the transmission stream of the program into a video stream, an audio stream and a data section;
Video decoding means for decoding the video stream and converting it into a video signal;
Image extracting means for cutting out one or a plurality of regions from one frame included in the video signal and extracting them as image data;
GUI control means for generating a marker that clearly indicates the position of the extracted one or a plurality of image data in the one frame;
Display control means for displaying the marker superimposed on the one frame;
An operation means for selecting one image data from the one place or a plurality of image data using the marker by a viewer;
Program data extraction means for extracting program arrangement information and program identification information included in the data section;
Image search key generation means for generating an image search key for searching for a reference image from the program arrangement information and the program identification information;
Using the image search key, the communication means obtains the reference image from the external server via the network, and the image search collating means for collating the image data with the reference image;
Information search means for generating an information search key indicating an attribute of the image data based on the collation result, and acquiring information related to the image data via the network by the communication means using the information search key. A program playback apparatus characterized by that.
画像抽出手段によって切り出される画像データの領域は矩形形状であり、
GUI制御手段によって生成されるマーカーは、画像データの矩形形状の領域に内接する円形形状であることを特徴とするとする請求項1に記載の番組再生装置。
The area of the image data cut out by the image extraction means is rectangular,
2. The program reproducing apparatus according to claim 1, wherein the marker generated by the GUI control means has a circular shape inscribed in a rectangular area of the image data.
GUI制御手段によって生成されるマーカーは、抽出された1箇所または複数の画像データにそれぞれ個別の番号が付与されることを特徴とする請求項1または2に記載の番組再生装置。 3. The program reproducing apparatus according to claim 1, wherein the marker generated by the GUI control unit is assigned an individual number to one or a plurality of extracted image data. GUI制御手段によってマーカーが生成された後、
操作手段によって選択画面データが選択されるまでは、表示制御手段によって表示される1つのフレームが静止画として表示されることを特徴とするとする請求項1〜3のいずれか1項に記載の番組再生装置。
After the marker is generated by the GUI control means,
4. The program according to claim 1, wherein one frame displayed by the display control means is displayed as a still image until selection screen data is selected by the operation means. Playback device.
画像抽出手段は、画像データの水平方向の画素数および前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。 When at least one of the number of pixels in the horizontal direction of the image data and the number of pixels in the vertical direction of the image data is equal to or less than a predetermined threshold, the image extraction means is not suitable for collation with the reference image The program playback device according to claim 1, wherein the program playback device is determined. 画像抽出手段は、画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。 The image extraction means determines that the image data is not suitable for collation with a reference image when the average luminance of the image data is equal to or less than a predetermined threshold value. The program playback device according to Item. 画像抽出手段は、画像データの水平方向の画素数、前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合、あるいは前記画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項1〜4のいずれか1項に記載の番組再生装置。 The image extraction means is configured to detect when at least one of the number of pixels in the horizontal direction of the image data and the number of pixels in the vertical direction of the image data is equal to or smaller than a predetermined threshold value, or when the average luminance of the image data is equal to or smaller than a predetermined threshold value. The program playback apparatus according to claim 1, wherein the image data is determined not to be suitable for collation with a reference image. 画像抽出手段によって画像データが参照画像との照合に適切ではないと判断された場合、
GUI制御手段は、照合に適切ではないと判断された前記画像データに対応したマーカー表示を生成しないことを特徴とするとする請求項5〜7のいずれか1項に記載の番組再生装置。
If the image extraction means determines that the image data is not appropriate for matching with the reference image,
8. The program reproducing apparatus according to claim 5, wherein the GUI control unit does not generate a marker display corresponding to the image data determined not to be suitable for collation. 9.
受信した番組を再生する番組再生装置であって、
ネットワークを経由して外部のサーバーと通信する通信手段と、
前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクス手段と、
前記映像ストリームをデコードして映像信号に変換する映像デコード手段と、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出手段と、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御手段と、
前記ママーカーを前記1つのフレームに重畳して表示する表示制御手段と、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの画像データが選択される操作手段と、
前記データセクションに含まれる番組特定情報を抽出する番組データ抽出手段と、
前記番組に関する番組情報をデータベースとして保持するデータベース保持手段と、
前記データベースおよび前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成手段と、
前記画像検索キーを用いて、前記通信手段によって前記ネットワーク経由で前記外部のサーバーから前記参照画像を取得し、前記画像データと前記参照画像とを照合する画像検索照合手段と、
前記照合結果に基づいて前記画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記通信手段によって前記ネットワーク経由で前記画像データに関連する情報を取得する情報検索手段とを備えることを特徴とする番組再生装置。
A program playback device for playing back a received program,
A communication means for communicating with an external server via a network;
Demultiplexing means for separating the transmission stream of the program into a video stream, an audio stream and a data section;
Video decoding means for decoding the video stream and converting it into a video signal;
Image extracting means for cutting out one or a plurality of regions from one frame included in the video signal and extracting them as image data;
GUI control means for generating a marker that clearly indicates the position of the extracted one or a plurality of image data in the one frame;
Display control means for displaying the marker in a superimposed manner on the one frame;
An operation means for selecting one image data from the one place or a plurality of image data using the marker by a viewer;
Program data extracting means for extracting program specific information included in the data section;
Database holding means for holding program information relating to the program as a database;
Image search key generation means for generating an image search key for searching for a reference image from the database and the program specifying information;
Using the image search key, the communication means obtains the reference image from the external server via the network, and the image search collating means for collating the image data with the reference image;
Information search means for generating an information search key indicating an attribute of the image data based on the collation result, and acquiring information related to the image data via the network by the communication means using the information search key. A program playback apparatus characterized by that.
番組を受信する受信ステップと、
受信した前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクスステップと、
前記映像ストリームをデコードして映像信号に変換する映像デコードステップと、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出ステップと、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御ステップと、
前記マーカーを前記1つのフレームに重畳して表示する表示制御ステップと、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの選択画像データが選択される操作ステップと、
前記データセクションに含まれる番組配列情報および番組特定情報を抽出する番組データ抽出ステップと、
前記番組配列情報および前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成ステップと、
前記画像検索キーを用いて、ネットワーク経由で外部のサーバーから前記参照画像を取得し、前記選択画像データと前記参照画像とを照合する画像検索照合ステップと、
前記照合結果に基づいて前記選択画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記ネットワーク経由で前記選択画像データに関連する情報を取得する情報検索ステップとを備えたことを特徴とする番組再生方法。
A receiving step for receiving a program;
A demultiplexing step of separating the received transmission stream of the program into a video stream, an audio stream and a data section;
A video decoding step of decoding the video stream and converting it into a video signal;
An image extraction step of cutting out one or a plurality of regions from one frame included in the video signal and extracting them as image data;
A GUI control step of generating a marker that clearly indicates the position of the extracted one or more image data in the one frame;
A display control step of displaying the marker superimposed on the one frame;
An operation step in which one selected image data is selected from the one place or a plurality of image data using the marker by a viewer;
A program data extraction step for extracting program arrangement information and program identification information included in the data section;
An image search key generating step for generating an image search key for searching for a reference image from the program arrangement information and the program specifying information;
Using the image search key, obtaining the reference image from an external server via a network, and an image search collating step of collating the selected image data with the reference image;
An information search step of generating an information search key indicating an attribute of the selected image data based on the matching result, and acquiring information related to the selected image data via the network using the information search key. A program playback method characterized by the above.
画像抽出ステップによって切り出される画像データの領域は矩形形状であり、
GUI制御ステップによって生成されるマーカー表示は、画像データの矩形形状の領域に内接する円形形状であることを特徴とするとする請求項10に記載の番組再生方法。
The area of the image data cut out by the image extraction step is a rectangular shape,
11. The program reproducing method according to claim 10, wherein the marker display generated by the GUI control step has a circular shape inscribed in a rectangular region of the image data.
GUI制御ステップによって生成されるマーカーは、抽出された1箇所または複数の画像データにそれぞれ個別の番号が付与されることを特徴とする請求項10または11に記載の番組再生方法。 12. The program reproduction method according to claim 10 or 11, wherein the marker generated by the GUI control step is assigned an individual number to one or a plurality of extracted image data. GUI制御ステップによってマーカーが生成された後、
操作ステップによって選択画面データが選択されるまでは、表示制御ステップによって表示される1つのフレームが静止画として表示されることを特徴とするとする請求項10〜12のいずれか1項に記載の番組再生方法。
After the marker is generated by the GUI control step,
13. The program according to claim 10, wherein one frame displayed by the display control step is displayed as a still image until selection screen data is selected by the operation step. Playback method.
画像抽出ステップは、画像データの水平方向の画素数および前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。 In the image extraction step, if at least one of the number of pixels in the horizontal direction of the image data and the number of pixels in the vertical direction of the image data is equal to or less than a predetermined threshold, the image data is not suitable for collation with the reference image. The program playback method according to claim 10, wherein the program playback method is determined. 画像抽出ステップは、画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。 The image extracting step determines that the image data is not suitable for collation with a reference image when the average luminance of the image data is equal to or less than a predetermined threshold value. The program playback method according to item. 画像抽出ステップは、画像データの水平方向の画素数、前記画像データの垂直方向の画素数の少なくとも1方が所定の閾値以下の場合、あるいは前記画像データの平均輝度が所定の閾値以下の場合には、前記画像データが参照画像との照合に適切ではないと判定することを特徴とする請求項10〜13のいずれか1項に記載の番組再生方法。 The image extraction step is performed when at least one of the number of pixels in the horizontal direction of the image data and the number of pixels in the vertical direction of the image data is equal to or smaller than a predetermined threshold value, or when the average luminance of the image data is equal to or smaller than the predetermined threshold value. The program playback method according to claim 10, wherein the image data is determined not to be suitable for collation with a reference image. 画像抽出ステップによって画像データが参照画像との照合に適切ではないと判断された場合、
GUI制御ステップは、照合に適切ではないと判断された前記画像データに対応したマーカーを生成しないことを特徴とするとする請求項14〜16のいずれか1項に記載の番組再生方法。
If the image extraction step determines that the image data is not suitable for matching with the reference image,
The program reproduction method according to any one of claims 14 to 16, wherein the GUI control step does not generate a marker corresponding to the image data determined not to be suitable for collation.
番組を受信する受信ステップと、
受信した前記番組の伝送ストリームを映像ストリーム、音声ストリームおよびデータセクションに分離するデマルチプレクスステップと、
前記映像ストリームをデコードして映像信号に変換する映像デコードステップと、
前記映像信号に含まれる1つのフレームから1箇所または複数の領域を切り出して画像データとして抽出する画像抽出ステップと、
前記1つのフレーム内において、前記抽出した1箇所または複数の画像データの位置を明示するマーカーを生成するGUI制御ステップと、
前記マーカーを前記1つのフレームに重畳して表示する表示制御ステップと、
視聴者によって前記マーカーを用いて前記1箇所または複数の画像データから1つの選択画像データが選択される操作ステップと、
前記データセクションに含まれる番組特定情報を抽出する番組データ抽出ステップと、
前記番組に関する番組情報をデータベースとして保持するデータベース保持ステップと、
前記データベースおよび前記番組特定情報から参照画像を検索するための画像検索キーを生成する画像検索キー生成ステップと、
前記画像検索キーを用いて、ネットワーク経由で外部のサーバーから前記参照画像を取得し、前記選択画像データと前記参照画像とを照合する画像検索照合ステップと、
前記照合結果に基づいて前記選択画像データの属性を示す情報検索キーを生成し、前記情報検索キーを用い前記ネットワーク経由で前記選択画像データに関連する情報を取得する情報検索ステップとを備えたことを特徴とする番組再生方法。
A receiving step for receiving a program;
A demultiplexing step of separating the received transmission stream of the program into a video stream, an audio stream and a data section;
A video decoding step of decoding the video stream and converting it into a video signal;
An image extraction step of cutting out one or a plurality of regions from one frame included in the video signal and extracting them as image data;
A GUI control step of generating a marker that clearly indicates the position of the extracted one or more image data in the one frame;
A display control step of displaying the marker superimposed on the one frame;
An operation step in which one selected image data is selected from the one place or a plurality of image data using the marker by a viewer;
A program data extraction step for extracting program specific information included in the data section;
A database holding step of holding program information relating to the program as a database;
An image search key generation step of generating an image search key for searching for a reference image from the database and the program specifying information;
Using the image search key, obtaining the reference image from an external server via a network, and an image search collating step of collating the selected image data with the reference image;
An information search step of generating an information search key indicating an attribute of the selected image data based on the matching result, and acquiring information related to the selected image data via the network using the information search key. A program playback method characterized by the above.
JP2011148395A 2011-07-04 2011-07-04 Program reproduction apparatus and program reproduction method Pending JP2013016030A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011148395A JP2013016030A (en) 2011-07-04 2011-07-04 Program reproduction apparatus and program reproduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011148395A JP2013016030A (en) 2011-07-04 2011-07-04 Program reproduction apparatus and program reproduction method

Publications (1)

Publication Number Publication Date
JP2013016030A true JP2013016030A (en) 2013-01-24

Family

ID=47688661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011148395A Pending JP2013016030A (en) 2011-07-04 2011-07-04 Program reproduction apparatus and program reproduction method

Country Status (1)

Country Link
JP (1) JP2013016030A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521390A (en) * 2013-03-14 2016-07-21 グーグル インコーポレイテッド Method, system, and recording medium for providing portable content corresponding to media content
US10002191B2 (en) 2013-12-31 2018-06-19 Google Llc Methods, systems, and media for generating search results based on contextual information
US10333767B2 (en) 2013-03-15 2019-06-25 Google Llc Methods, systems, and media for media transmission and management
US10448110B2 (en) 2013-12-31 2019-10-15 Google Llc Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US10924818B2 (en) 2013-12-31 2021-02-16 Google Llc Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
CN117278986A (en) * 2023-11-23 2023-12-22 浙江小遛信息科技有限公司 Data processing method and data processing equipment for sharing travel

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189724A (en) * 2000-12-20 2002-07-05 Victor Co Of Japan Ltd Image data retrieval device
JP2008131405A (en) * 2006-11-21 2008-06-05 Sony Corp Imaging apparatus, image processing apparatus, image processing method therefor, and program causing computer to execute the method
JP2008129884A (en) * 2006-11-22 2008-06-05 Nec Corp Information retrieval system, its method, and broadcast receiver used therefor
JP2009296346A (en) * 2008-06-05 2009-12-17 Sony Corp Program recommendation device, method for recommending program and program for recommending program
JP2010016757A (en) * 2008-07-07 2010-01-21 Canon Inc Moving picture display system, control method thereof, server and display device used for the moving picture display system
JP2010103764A (en) * 2008-10-23 2010-05-06 Toshiba Corp Information processing apparatus, and content display method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189724A (en) * 2000-12-20 2002-07-05 Victor Co Of Japan Ltd Image data retrieval device
JP2008131405A (en) * 2006-11-21 2008-06-05 Sony Corp Imaging apparatus, image processing apparatus, image processing method therefor, and program causing computer to execute the method
JP2008129884A (en) * 2006-11-22 2008-06-05 Nec Corp Information retrieval system, its method, and broadcast receiver used therefor
JP2009296346A (en) * 2008-06-05 2009-12-17 Sony Corp Program recommendation device, method for recommending program and program for recommending program
JP2010016757A (en) * 2008-07-07 2010-01-21 Canon Inc Moving picture display system, control method thereof, server and display device used for the moving picture display system
JP2010103764A (en) * 2008-10-23 2010-05-06 Toshiba Corp Information processing apparatus, and content display method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
松尾 賢治、外2名: "テレビ視聴環境を利用した顔認識のための変動学習", 情報処理学会研究報告, vol. 第2009巻,第23号, JPN6014051556, 26 February 2009 (2009-02-26), JP, pages 55 - 60, ISSN: 0002958180 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521390A (en) * 2013-03-14 2016-07-21 グーグル インコーポレイテッド Method, system, and recording medium for providing portable content corresponding to media content
US10333767B2 (en) 2013-03-15 2019-06-25 Google Llc Methods, systems, and media for media transmission and management
US10997235B2 (en) 2013-12-31 2021-05-04 Google Llc Methods, systems, and media for generating search results based on contextual information
US10448110B2 (en) 2013-12-31 2019-10-15 Google Llc Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US10924818B2 (en) 2013-12-31 2021-02-16 Google Llc Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
US10992993B2 (en) 2013-12-31 2021-04-27 Google Llc Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US10002191B2 (en) 2013-12-31 2018-06-19 Google Llc Methods, systems, and media for generating search results based on contextual information
US11350182B2 (en) 2013-12-31 2022-05-31 Google Llc Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
US11743557B2 (en) 2013-12-31 2023-08-29 Google Llc Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
US11941046B2 (en) 2013-12-31 2024-03-26 Google Llc Methods, systems, and media for generating search results based on contextual information
US12063419B2 (en) 2013-12-31 2024-08-13 Google Llc Methods, systems, and media for presenting supplemental information corresponding to on-demand media content
US12219223B2 (en) 2013-12-31 2025-02-04 Google Llc Methods, systems, and media for presenting supplemental content relating to media content based on state information that indicates a subsequent visit to the content interface
CN117278986A (en) * 2023-11-23 2023-12-22 浙江小遛信息科技有限公司 Data processing method and data processing equipment for sharing travel
CN117278986B (en) * 2023-11-23 2024-03-15 浙江小遛信息科技有限公司 Data processing method and data processing equipment for sharing travel

Similar Documents

Publication Publication Date Title
US10148928B2 (en) Generating alerts based upon detector outputs
KR101644789B1 (en) Apparatus and Method for providing information related to broadcasting program
US8060609B2 (en) Systems and methods for determining attributes of media items accessed via a personal media broadcaster
JP2021525031A (en) Video processing for embedded information card locating and content extraction
US20150248918A1 (en) Systems and methods for displaying a user selected object as marked based on its context in a program
US20050253966A1 (en) System for processing video signals
KR20130083457A (en) Method for transceiving media files and device for transmitting/receiving using same
JP2013016030A (en) Program reproduction apparatus and program reproduction method
US20220329908A1 (en) Display Apparatus and Method for Displaying Image Recognition Result
KR20150083355A (en) Augmented media service providing method, apparatus thereof, and system thereof
US12413815B2 (en) Information processing device and information processing method
US9066045B2 (en) Display control device, display control method and program
KR102893326B1 (en) Display apparatus, method of controlling display apparatus and information providing system
KR20200008341A (en) Media play device and method for controlling screen and server for analyzing screen
JP4525711B2 (en) Program information processing apparatus and program information processing method
US20110116552A1 (en) Content reception apparatus and content reception apparatus control method
CN103051934A (en) Intelligent television human-machine interaction method, device and system
JP2011239247A (en) Digital broadcast receiver and related information presentation program
JP2006140603A (en) Information processor, information processing method and program, and recording medium with the program recorded thereon, and display controller
EP3178235B1 (en) Video display device and method of controlling the device
EP2463787B1 (en) Method for displaying graphical signatures of users in a menu, and related terminals
US20170347154A1 (en) Video display apparatus and operating method thereof
JP4554399B2 (en) Digital broadcast receiving apparatus, digital broadcast system, digital broadcast receiving method and digital broadcast method
KR102263146B1 (en) Video display apparatus and operating method thereof
KR102718157B1 (en) Module and method for recommending video based on location

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20140326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150407