[go: up one dir, main page]

WO2011089982A1 - 受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム - Google Patents

受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム Download PDF

Info

Publication number
WO2011089982A1
WO2011089982A1 PCT/JP2011/050548 JP2011050548W WO2011089982A1 WO 2011089982 A1 WO2011089982 A1 WO 2011089982A1 JP 2011050548 W JP2011050548 W JP 2011050548W WO 2011089982 A1 WO2011089982 A1 WO 2011089982A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
image signal
image frame
video
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2011/050548
Other languages
English (en)
French (fr)
Inventor
塚越 郁夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to RU2012130007/08A priority Critical patent/RU2012130007A/ru
Priority to KR1020127018332A priority patent/KR20120127409A/ko
Priority to US13/521,791 priority patent/US20120307006A1/en
Priority to JP2011550892A priority patent/JPWO2011089982A1/ja
Priority to BR112012017469A priority patent/BR112012017469A2/pt
Priority to CN2011800139644A priority patent/CN102804791A/zh
Priority to EP11734589.2A priority patent/EP2528334A4/en
Publication of WO2011089982A1 publication Critical patent/WO2011089982A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/003Aspects relating to the "2D+depth" image format

Definitions

  • the present invention relates to a receiving apparatus, a transmitting apparatus, a communication system, a receiving apparatus control method, and a program.
  • an object of the present invention is to provide a new and improved receiver and transmitter capable of viewing 3D video with a simple configuration.
  • a communication system, a control method for a receiving apparatus, and a program are provided.
  • a first decoding unit that decodes a first image signal, and at least a part of a first image frame based on the first image signal
  • a second decoding unit that decodes a second image signal corresponding to an image in the region
  • an information acquisition unit that acquires object indication information including spatial position information of the region with respect to the first image frame
  • a video synthesizing unit that generates a second image frame by synthesizing the image of the region with the first image frame based on the position information.
  • a display unit that periodically displays an image based on the first image frame and an image based on the second image frame may be provided.
  • the first image frame is a moving image frame
  • the object instruction information includes temporal synchronization information of an image of the region with respect to the first image frame
  • the video composition unit includes the position information The image of the region may be synthesized with the first image frame based on the synchronization information.
  • the object instruction information may be included in a picture header of an image frame based on the first image signal or the second image signal.
  • the object instruction information is transmitted in a stream different from the first image signal and the second image signal, and is associated with the first image signal and the second image signal by a time stamp. It may be a thing.
  • the information acquisition unit does not acquire the object instruction information. There may be.
  • first decoding unit and the second decoding unit may perform respective decoding by different decoding methods.
  • a first encoding unit that encodes a first image signal, and at least a part of an image frame based on the first image signal
  • a second encoding unit that encodes a second image signal corresponding to an image of the region, and the region of the region for the encoded first image signal, the second image signal, and the image frame
  • a transmission unit that transmits object instruction information including spatial position information.
  • the image frame may be a moving image frame
  • the object instruction information may include temporal synchronization information of the image of the region with respect to the image frame.
  • the object instruction information may be inserted into a picture header of an image frame based on the first image signal or the second image signal.
  • the object instruction information is transmitted in a stream different from the first image signal and the second image signal, and is associated with the first image signal and the second image signal by a time stamp. It may be a thing.
  • An image separation unit that separates the image of the region from the image frame; and the second encoding unit receives the second image signal corresponding to the image of the region separated by the image separation unit. It may be encoded.
  • the image separation unit may separate the image of the region from the image frame while changing the position of the region in the image frame in accordance with the movement of the object corresponding to the region. Good.
  • the transmission unit does not transmit the object instruction information. May be.
  • first encoding unit and the second encoding unit may perform encoding by different encoding methods.
  • a first encoding unit that encodes a first image signal, and at least a part of an image frame based on the first image signal
  • a second encoding unit that encodes a second image signal corresponding to an image of the region, and the region of the region for the encoded first image signal, the second image signal, and the image frame
  • a transmission unit that transmits object indication information including spatial position information, a first decoding unit that decodes the first image signal, and a decoding unit that decodes the second image signal.
  • a first decoding unit an information acquisition unit for acquiring the object instruction information, and a first image frame based on the first image signal based on the position information included in the object instruction information.
  • Composite image of the area A video synthesizing unit which generates a second image frame, the Te, and the receiving device, the communication system comprising a provided.
  • a step of decoding a first image signal, and at least a partial region of a first image frame based on the first image signal Decoding a second image signal corresponding to the first image, obtaining object instruction information including spatial position information of the region with respect to the first image frame, And generating a second image frame by synthesizing the image of the region with the first image frame based on the position information.
  • a first decoding unit for decoding a first image signal, and a first image frame based on the first image signal.
  • the information acquisition unit that acquires the spatial position information of at least a part of the area, the object instruction information including the offset amount of the area with respect to the first image frame,
  • a receiving device comprising: a video composition unit that composes an image of the region with an image frame to generate a second image frame.
  • a first decoding for decoding a first image signal corresponding to a first image cut out from a source image of a still image.
  • a second decoding unit that decodes a second image signal corresponding to a second image cut out from the source image of the still image, and a space between the first image and the second image
  • a position information acquisition unit that acquires typical position information, and a display unit that periodically displays the first image and the second image in a state of being relatively offset based on the position information.
  • the present invention it is possible to provide a receiving device, a transmitting device, a communication system, a receiving device control method, and a program capable of viewing 3D video with a simple configuration.
  • FIG. 1 It is a schematic diagram which shows the information designated by Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position in FIG. It is a schematic diagram which shows the example which adds 3D information to a primary image
  • FIG. 1 is a schematic diagram showing a configuration of a stereoscopic image display observation system according to an embodiment of the present invention.
  • the system according to the present embodiment includes a transmission device 100 that transmits video content or the like in a digital broadcast format, a television receiver (reception device) 200 that includes a display panel that includes, for example, an LCD, and the like, and display image viewing glasses. 300.
  • FIG. 1 shows a receiving device 200 and display image viewing glasses 300.
  • the receiving device 200 is a television receiver that receives terrestrial digital broadcasts, and receives a bit stream of video data, decodes it, and displays it on a display panel. Based on the video data sent from the transmitting device, the receiving device 200 time-divides the video and displays it alternately on the entire screen in a very short cycle. In addition, the receiving apparatus 200 can provide the left eye and the right eye separately in synchronization with the display cycle of the left eye video and the right eye video. For example, the receiving device 200 alternately displays the right-eye image R and the left-eye image L for each field.
  • the display image viewing glasses 300 are provided with a pair of liquid crystal shutters 300a and 300b in a portion corresponding to a lens.
  • the liquid crystal shutters 300a and 300b alternately open and close in synchronization with image switching for each field of the receiving device 200. That is, in the field where the right-eye image R is displayed on the receiving device 200, the left-eye liquid crystal shutter 300b is in a closed state, and the right-eye liquid crystal shutter is in an open state 300a. In the field where the left-eye image L is displayed, the reverse operation is performed. As described above, the receiving apparatus 200 alternately displays the left-eye video L and the right-eye video R on the entire screen at a very short cycle, and at the same time, the display cycle of the left-eye video L and the right-eye video R. Synchronously, video is separated and provided to the left and right eyes.
  • the receiving apparatus 200 can also display a normal two-dimensional image when the user is not using the viewing glasses 300. In this case, switching between the right-eye image R and the left-eye image L is performed. Absent.
  • FIG. 1 illustrates the system including the display image viewing glasses 300, but the present embodiment is not limited to this, and is applied to a stereoscopic image display observation system that does not use the glasses 300 such as a polarizing plate method. It is also possible.
  • the television receivers that are currently used in homes are assumed to be capable of decoding in 2D.
  • 3D video can be viewed even on television receivers that have already been used until the spread of television receivers that are intended for viewing 3D video.
  • a method is considered in which 2D video data currently transmitted on a broadcast wave is used as one of the left and right video data, and the same amount of video data is sent as the other video data of the left and right videos. It is done.
  • the transmission band is doubled and the transmission band of the broadcast wave is limited, it is difficult to realize viewing of 3D video by sending additional video data. .
  • the decoder load is equivalent to two channels. Therefore, it is assumed that the decoder is overloaded and cannot be normally decoded. For this reason, even if additional video data is sent, it is assumed that a normal television receiver cannot handle it as a 3D format.
  • the portion to be displayed in 3D is extracted on the transmission device 100 side, the portion is cut out, and encoded with the relative position information with respect to the basic view.
  • the video data is transmitted to the receiving apparatus 200 as additional view video data. All the video data of the basic view is transmitted.
  • the additional view only video data cut out from the basic view is transmitted. For this reason, a video that has no parallax with respect to the basic view is not transmitted in the additional view, and the receiving device 200 copies the video in the basic view to the additional view for the video that has no parallax. To use.
  • the receiving apparatus 200 can also perform decoding with a surplus load by the CPU, and can decode 3D video data with a very simple configuration.
  • the video data is not limited to moving images, and still images can be added as additional views to the basic view moving images.
  • each of the basic view and the additional view can be applied to a slide show display as a still image.
  • the encoding method does not depend on the video data format, and the encoding method of the basic view and that of the additional view may be the same method or different encoding methods. It doesn't matter.
  • FIG. 2 is a schematic diagram illustrating a configuration example of the transmission device 100 according to an embodiment of the present invention.
  • the transmission device 100 is a device on the broadcast station side that provides video content such as a television program.
  • the transmission device 100 provides video content to a television receiver in a data format such as a digital broadcast format.
  • the transmission device 100 includes a CPU 102, a video acquisition unit (Image Capture) 104, a target separation unit (Target Separation) 106, a first encoder 108, a second encoder 110, a multiplexer (Multiplexer) 112, An output unit 114 is provided.
  • an area to be displayed in 3D is extracted on the transmission side with respect to a source image composed of two or more views (views), the part is cut out, and the area is separately added together with relative position information with respect to the basic view. Pass to encoder.
  • the target separation unit 106 receives the specification of the cut target area (object size) from the CPU 102, and A region to be 3D displayed is cut out from the basic view video.
  • the target separation unit 106 sends control information (object control information) of the cut-out area to the CPU 102, and the instruction data of the cut-out area and data (object instruction information) specifying the display period are sent from the CPU 102 to the encoders 108 and 110.
  • FIG. 3 is a schematic diagram showing the configuration of the target separation unit 106 in detail.
  • the target separation unit 106 includes a blocking unit 122, a frame delay unit 124, a block matching unit 126, a position moving unit 128, a target object block separation unit 130, and a selector 132.
  • Each of the functional blocks shown in FIGS. 2 and 3 can be configured by a circuit (hardware) or a CPU 102 and software (program) for causing the CPU 102 to function.
  • the program can be stored in a recording medium such as a memory provided in the transmission apparatus 100 or a recording medium outside the transmission apparatus 100.
  • the video of the basic view is referred to as a primary video
  • the video of another view obtained by cutting out from the primary video is referred to as a secondary video.
  • the primary video that is the basic view can be a normal 2D video.
  • the target separation unit 106 detects the movement of the area to be cut out from the primary video, and changes the area to be cut out according to the movement. As a result, for example, when only a human face is cut out from the basic view, it is possible to change the area to be cut out in accordance with the movement of the face. The face can be displayed while moving in the screen direction.
  • the primary video as the basic view is input to the blocking unit 122 and the frame delay unit 124 in FIG.
  • the blocking unit 122 receives information designating a target region (or object) to be cut out from the CPU 102 for cutting out the secondary video.
  • the blocking unit 122 performs processing to block the current picture in the cut target area 150 based on a command from the CPU 102. As a result, the current picture in the target area 150 is divided into a plurality of rectangular blocks.
  • the frame delay unit 124 delays the frame, and the block matching unit 126 performs block matching between the current picture that has been blocked and the delayed previous picture, and a motion vector that represents the motion of each block.
  • the position moving unit 128 is a block that moves the target area based on the motion vector.
  • the position moving unit 128 includes the majority of the motion vectors corresponding to each block according to the processing result of the block matching unit 126, and within a range that does not exceed the size of the target region. Determines the offset amount OFS moved from the previous picture, and sends the offset amount OFS to the next stage. Further, the position moving unit 128 sends the offset amount OFS to the CPU 102 as object control information.
  • Video data for each frame is input to the target object block separation unit 130.
  • the target object block separation unit 130 cuts out the target area for each frame according to the offset amount OFS, and then sends it to the selector 132. Further, the primary video that is the basic view is input to the selector 132.
  • the selector 132 alternately switches the video input from the target object block separation unit 130 and the original primary video, and sends them to the first and second encoders 108 and 110.
  • the original primary video is input to the first encoder 108, and the video clipped by the target object block separation unit 130 is sent to the second encoder 110.
  • the first encoder 108 encodes the primary video data that is the original video
  • the second encoder 110 encodes the extracted secondary video data.
  • the cut-out video sent to the second encoder 110 changes in accordance with the movement of the target area 150, the target area for 3D display or the target object for 3D display is accompanied by movement. Even if it exists, it is possible to always perform 3D display according to the movement of the area or the object.
  • the primary and secondary video data encoded by the first encoder 108 and the second encoder 110 are multiplexed by the multiplexer 112 and sent to the output unit 114 together with audio data, character data, and the like.
  • the output unit 114 transmits video data, audio data, and character data multiplexed in the digital broadcast signal format to the receiving device 200.
  • the transmission device 100 transmits only the primary video to the reception device 200. In this case, the secondary video is not cut out.
  • the receiving device 200 only a region in which 3D display is performed is cut out from the primary video (for example, normal 2D video) and transmitted to the receiving device 200 side, which is necessary for 3D display. Only minimal data can be sent to the receiving device 200. Therefore, the configuration of the decoder in the receiving apparatus 200 can be minimized, and decoding can be performed with the surplus of the CPU of the receiving apparatus 200. Therefore, the receiving device 200 can be configured simply.
  • the primary video for example, normal 2D video
  • the receiving apparatus 200 that has received the primary video and the secondary video uses the primary video as the 1st view and uses the video obtained by combining the secondary video with the primary video as the 2nd view. Then, the receiving apparatus 200 performs 3D display by alternately displaying the 1st view and the 2nd view.
  • the transmitting apparatus 100 transmits the primary video and the secondary video to the receiving apparatus 200, and also transmits relative position information specifying the position of the secondary video with respect to the primary video.
  • the relative position information of the secondary video with respect to the primary video is inserted into, for example, the auxiliary data area of the picture layer of the encoded stream.
  • the receiving apparatus 200 determines that the picture is the same as the top and left images of the basic view picture.
  • the encoding of the secondary video data stream does not change significantly with respect to the playback image quality of the basic view which is the primary video.
  • the encoding of the secondary video stream may be the same as the primary encoding method, or another video codec, still image codec, or the like may be selected and encoded.
  • the primary video may be encoded with MPEG-4 AVC, and the secondary video may be encoded with MPEG2.
  • the addition at the time of decoding the secondary video can be reduced.
  • an increase in transmission bandwidth due to an additional view may be reduced by encoding the primary video with MPEG2 video and the secondary video with MPEG-4 AVC.
  • the primary video may be encoded with MPEG-4 AVC or MPEG2 video
  • the secondary video may be encoded with JPEG as a still image.
  • FIG. 4 shows an example in which images of two views are combined into one frame and encoded.
  • the 1st view and the 2nd view are each compressed in the horizontal direction of the screen, and are combined into one frame and encoded. This process is the same as a normal side-by-side process.
  • FIG. 5 is a schematic diagram showing the codec of the cutout areas of the 1st view and the 2nd view in the present embodiment.
  • the 2nd view is encoded and added as an enhanced layer.
  • the compatible layer (Compatible Layer) shown in FIG. 5 indicates primary video data that is normal 2D video data.
  • the compatible layer can be sent with the same image quality as normal 2D video data. Since the enhanced layer corresponds to the minimum necessary cutout area, the amount of data is smaller than that of the compatible layer.
  • the primary video and the secondary video are specified by PID or video track information.
  • FIG. 6 is a schematic diagram showing an encoding method by cutout processing according to the present embodiment.
  • the primary video is encoded by the first encoder 108 and transmitted to the receiving apparatus 200.
  • the lower part of FIG. 6 shows a case where the video of the region cut out from the primary video is encoded as the 2nd view by the method of the present embodiment described above.
  • the amount of encoded data in the clipped area in the 2nd view is significantly reduced compared to the amount of data encoded in the 1st view (Coded Video Data). it can. Therefore, on the receiving apparatus 200 side, it is possible to minimize the decoding load.
  • the multiplexer 112 shown in FIG. 1 multiplexes a video stream of a basic view (corresponding to a normal 2D video signal) and a secondary video stream in the multiplexed stream of the entire system.
  • a video stream of a basic view corresponding to a normal 2D video signal
  • a secondary video stream in the multiplexed stream of the entire system.
  • the primary video and the secondary video can be linked with the ID.
  • the time stamp is applied with the same synchronization method as the time stamp of the video data of the basic view.
  • System management at the time of multiplexing is performed in the PMT (Program Map Table) table defined in the header of the transport stream (TS) in the CPU 102.
  • the primary video is defined as a 2D video stream
  • an additional view (secondary video) stream is defined to be added to the 2D video stream under the PMT as follows, and is managed with an ID.
  • the primary video and the secondary video can be linked with the PES ID without changing the current mechanism of the transport stream.
  • PMT PID designation of each encoded signal, ES type and state, PCR PID of program, etc. are designated.
  • a desired display can be performed by linking the primary video and the secondary video using the current mechanism and performing the process opposite to the above encoding process.
  • the multiplexer 112 multiplexes the data encoded by the first encoder 108 and the data encoded by the second encoder 110.
  • the multiplexed data is transmitted from the output unit 114 to the receiving device 200 side.
  • FIG. 7 is a schematic diagram showing object instruction information (hereinafter sometimes referred to as 3D information) for displaying a 3D object.
  • the object instruction information shown in FIG. 7 is sent to the first encoder 108, the second encoder 110, and the multiplexer 112, and inserted into the video data.
  • the object instruction information can be sent as one elementary stream.
  • the primary video, the secondary video, and the object instruction information can be associated by a time stamp.
  • the object instruction information can be inserted in units of pictures of the primary video or secondary video (user data area of the picture header).
  • Data_Length is information indicating the data amount of the object instruction information.
  • Number_of_VideoViews N is information indicating the number of secondary videos cut out from one primary video. In the present embodiment, an example in which one secondary video is cut out from one primary video is shown as an example, but two or more secondary videos may be cut out, and N secondary videos can be cut out.
  • Target_videoView (i) is information indicating the Elementary PID of the view (View) handled by this information. With this information, the primary video for the secondary video is specified by the identification information ID, and the primary video can be associated with the secondary video for each temporal frame.
  • Target_videoView corresponds to the primary video view, and specifies the PID of the corresponding view.
  • Picture_ID is a value counted up for each picture, and is used as a time-series identifier for still images.
  • a plurality of flags Object_Offset_position_flag and Status_Count_flag are set to specify position information for specifying the spatial position of the secondary video (position in the screen) with respect to the primary video, the display period of the secondary video, and the like.
  • the cut-out area is specified by the Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position data. These pieces of information are data that specify the start position and end position of the object area of Partner_ViewoView with respect to the start point (0,0) of Target_videoView.
  • Duration_Counter specifies the display duration in terms of the number of frames after the display is started. In the case of a moving image, by inserting object instruction information into each picture, the receiving apparatus 200 can recognize the display duration of the secondary video. Duration_Counter is effective when a display duration is specified, particularly when a still image is sent.
  • the transmission device 100 may transmit information about the cut-out area from the primary video and the amount of parallax with respect to the primary video, without sending the secondary video data itself.
  • a cutout area is designated by each data of Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position, and information indicating the amount of parallax is transmitted.
  • the receiving apparatus 200 cuts out areas indicated by the Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position data from the primary video, and generates a secondary video with parallax. For an area without parallax other than the cut-out area, a primary video is copied to generate a secondary video. Thereby, the receiving device 200 can generate a 3D video composed of a primary video and a secondary video.
  • object instruction information transmission method shown in FIG. 7 may be transmitted as an independent elementary stream, or may be transmitted as picture data user data.
  • PMT Program Map Table
  • PSI Program System Information
  • FIG. 9 is a schematic diagram showing information specified by Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position in FIG.
  • X indicates the horizontal size of the primary video (Primary video Picture Horizontal Size), and Y indicates the vertical size of the primary video (Primary video Picture Vertical Size).
  • (Hs, vs) indicates the coordinate position of the start point P1 of the secondary video
  • (he, ve) indicates the coordinate position of the end point P2 of the secondary video.
  • a video clipped as a secondary video is a rectangular area having (hs, vs) as the upper left vertex and (he, ve) as the lower right vertex. Note that the size of the object area may be sent instead of (he, ve). Further, the 3D information may be sent by a transmission method using header information in the encoded stream.
  • the cutout range of the secondary video from the primary video is specified by the information specified by Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, Horizontal_End_Position.
  • the still image source image A predetermined range is cut out and transmitted. For this reason, in the transmission of a still image, various types of information shown in FIG.
  • both the primary image and the secondary image are cut out from the source image, sent to the receiving device 200, and the primary image and the secondary image are alternately displayed on the receiving device 200 side, so that the 3D video of the still image is displayed. Viewing is possible.
  • FIG. 10 is a schematic diagram showing an example of adding 3D information to a primary video when 3D information is added to a bit stream of video data.
  • FIG. 9 shows an example in which the primary video and the secondary video are synchronized in units of pictures in the case of 3D display of a moving image. Synchronization is performed frame by frame using a time stamp.
  • the first encoder 108 inserts 3D information for each picture of the primary video.
  • 3D information can be inserted into the header of the encoded video in synchronization with a GOP (Group of Pictures) or I picture of the encoded video.
  • GOP Group of Pictures
  • FIG. 11 is a schematic diagram showing an example in which 3D information is added to the primary video when the secondary video is a still image or the like and the display time is variable.
  • the first encoder 108 inserts 3D information for each predetermined number of pictures according to the display time of the secondary video.
  • the display time of the secondary video is specified by the Duration Counter described with reference to FIG.
  • FIG. 12 is a schematic diagram showing an example of adding 3D information to a secondary video, and shows an example of synchronizing a primary video and a secondary video in units of moving picture pictures.
  • the second encoder 110 inserts 3D information for each secondary picture.
  • 3D information can be inserted in synchronization with a GOP or I picture of encoded video.
  • FIG. 13 is a schematic diagram showing an example in which 3D information is added to the secondary video when the secondary video is a still image or the like and the display time is variable.
  • the second encoder 110 since the secondary video does not change during a predetermined display time, the second encoder 110 inserts 3D information for each predetermined number of pictures according to the display time. Even in this case, the display time of the secondary video is specified by the Duration Counter described with reference to FIG.
  • FIG. 14 is a schematic diagram illustrating a configuration example of the receiving device 200.
  • the reception device 200 includes a CPU 202, a demultiplexer 204, a first decoder 206, a second decoder 208, an object playback unit 210, and a 3D processing unit (3D Processing View Interleaving). ) 212.
  • the receiving device 200 includes a display unit that includes a liquid crystal display panel or the like.
  • Each functional block shown in FIG. 14 can be configured by a circuit (hardware) or a CPU 202 and software (program) for causing the CPU 202 to function.
  • the program can be stored in a recording medium such as a memory included in the receiving apparatus 200 or a recording medium external to the receiving apparatus 200.
  • the demultiplexer 204 receives a bit stream or video file output sent from the transmission device 100.
  • the demultiplexer 204 separates the input data into video data, audio data, character data, and the like, and sends the video data to the first decoder 108 and the second decoder 110. Further, the demultiplexer 204 extracts object instruction information from the bit stream and sends it to the CPU 202.
  • the demultiplexer 204 separates the primary video data and the secondary video data, and sends the primary video data to the first decoder 206 and the secondary video data to the second decoder 208.
  • the format of input to the first and second decoders 206 and 208 is basically the same as that in the case of decoding of existing 2D video, so that decoding is performed using the current digital video signal format mechanism. Can do. When it is not necessary to view 3D video, it is possible to view 2D video by decoding only the primary video. When there is no secondary video, the first decoder 206 decodes normal 2D video data.
  • the CPU 202 controls the first decoder 206 and the second decoder 208 based on the object instruction information sent from the demultiplexer 204.
  • the CPU 202 sends information specifying a display period to the second decoder 208.
  • the second decoder 208 recognizes that the secondary video exists during the designated display period, and decodes the secondary video.
  • the object playback unit 210 copies video data between the 1st view and the 2nd view, and synthesizes the video at the position of the object. As a result, the decoded primary video and secondary video are combined to generate a 2nd view video. For the primary video, the video data decoded by the first decoder 206 is input to the 3D processing unit 212.
  • FIG. 15 is a schematic diagram showing processing in the object playback unit 210.
  • the primary video data of the first view is decoded by the first decoder 206 to obtain the primary video 400. This process can be processed by the legacy receiving apparatus 200.
  • the secondary video data is decoded by the second decoder, and the secondary video 410 is obtained.
  • the object playback unit 210 outputs the primary video 400 as the first view.
  • the object playback unit 210 copies the primary video 400, shifts the secondary video 410 with respect to the primary video 400, synthesizes (overwrites) it, and outputs it as video data of the 2nd view.
  • the offset amount is designated by the above-described Vertical_Start_Position, Horizontal_Start_Position, Vertical_End_Position, and Horizontal_End_Position, and is sent from the demultiplexer 204 to the CPU 202. Further, when the object instruction information is inserted in units of pictures, it may be acquired from the first and second decoders 206 and 208. Also, the object playback unit 210 performs temporal synchronization of the primary video 400 and the secondary video 410 based on the time stamp of the elementary stream and the identification ID (PID) of the primary video and the secondary video.
  • PID identification ID
  • the reception device 200 is based on the cutout region.
  • a secondary image 410 is generated on the side.
  • the object playback unit 210 combines the generated secondary video 410 with the primary video 400 while shifting the amount of the parallax by the amount of parallax, and outputs the resultant video as a 2nd view video.
  • the object playback unit 210 shifts the primary image and the secondary image cut out from the source image by the offset amount to the 1st view. 2nd view video is output. Thereby, viewing of a 3D image of a still image becomes possible by alternately displaying a primary image and a secondary image.
  • the 1D view and 2nd view video data output from the object playback unit 210 is input to the 3D processing unit 212, and a high frame rate or the like is set for the input 1st view image data and 2nd view image data. Is output to the display panel.
  • the first view is the left-eye image L
  • the second view is the right-eye image R
  • the left-eye image L and the right-eye image R are alternately displayed at a predetermined frame rate on the display panel. Since the left eye image L is displayed when the liquid crystal shutter 300b of the ornamental glasses 300 is opened and the right eye image R is displayed when the liquid crystal shutter 300a is opened, the left eye image having parallax in both eyes of the user.
  • the image L for L and the right eye R are visually recognized, thereby realizing 3D display.
  • the 3D area is limited to the cut-out area, it is possible to minimize the request for the transmission band.
  • the increase in the load on the decoder in the receiving apparatus 200 is limited to the area corresponding to the stereoscopic display of the additional view to be added to the 2D video, so that the 2D display on the existing legacy television receiver, 3D Display is possible. Therefore, the backward compatibility with the existing legacy television receiver can be maintained by using the mechanism of the existing digital video signal format.
  • only the corresponding area of the additional additional view needs to be additionally decoded on the receiving apparatus 200 side, it is possible to minimize the decoding load added to the existing 2D decoding. This makes it possible to distribute the load on the system premise by handling the additional decoding load by a CPU other than the decoder.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

 本発明に係る受信装置は、第1の画像信号を復号化する第1のデコーダ(206)と、第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化する第2のデコーダ(208)と、第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得するCPU(202)と、前記位置情報に基づいて、第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成するオブジェクト再生部(210)と、を備える。

Description

受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム
 本発明は、受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラムに関する。
 従来から、立体映像(3D映像)を表示するシステムとして様々なものが知られている。例えば下記の特許文献1~3に記載されているように、視差を有する左目用画像及び右目用画像を所定周期で交互にディスプレイに供給し、この画像を所定周期に同期して駆動される液晶シャッターを備える眼鏡で観察する方法が知られている。
特開平9-138384号公報 特開2000-36969号公報 特開2003-45343号公報
 3D映像を放送局から送信するためには、左目用画像及び右目用画像の双方を送信する必要があるため、既存の2D映像と同等の画質を確保しようとすると、2倍のデータを送る必要が生じ、伝送帯域も2D映像に対して2倍必要となる。しかしながら、放送波あるいはネットワークによる配信データの伝送帯域が限られているため、伝送帯域を増大することには困難が伴う。また、2倍のデータを送信した場合、受信装置側でのデコーダが過負荷になる問題がある。
 また、3D映像を送信するフォーマットとして、1フレームを複数のビューに分割して送信する、サイドバイサイド方式などの手法が知られているが、1フレームが複数のビューに分割されるため、画質の劣化を避けることができない。更に、このような3D映像のフォーマットで映像データを送信すると、既にユーザに行き渡っている2D映像のテレビ受像機では、正しい表示ができないため、ユーザは2D映像、3D映像のいずれも適正に視聴することはできない。
 そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、簡素な構成で3D映像を視聴することが可能な、新規かつ改良された受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラムを提供することにある。
 上記課題を解決するために、本発明のある観点によれば、第1の画像信号を復号化する第1の復号化部と、前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化する第2の復号化部と、前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得する情報取得部と、前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、を備える、受信装置が提供される。
 また、前記第1の画像フレームによる画像と前記第2の画像フレームによる画像を周期的に表示する表示部を備えるものであってもよい。
 また、前記第1の画像フレームは動画のフレームであり、前記オブジェクト指示情報は、前記第1の画像フレームに対する前記領域の画像の時間的な同期情報を含み、前記映像合成部は、前記位置情報及び前記同期情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成するものであってもよい。
 また、前記オブジェクト指示情報は、前記第1の画像信号又は前記第2の画像信号による画像フレームのピクチャヘッダに含まれるものであってもよい。
 また、前記オブジェクト指示情報は、前記第1の画像信号及び前記第2の画像信号とは別のストリームで送信され、タイムスタンプにより前記第1の画像信号及び前記第2の画像信号と対応付けられるものであってもよい。
 また、前記第1の画像信号による前記第1の画像フレームのサイズと前記第2の画像信号による画像フレームのサイズが同一の場合、前記情報取得部による前記オブジェクト指示情報の取得を行わないものであってもよい。
 また、前記第1の復号化部と前記第2の復号化部は、異なる復号化方式によりそれぞれの復号化を行うものであってもよい。
 また、上記課題を解決するために、本発明の別の観点によれば、第1の画像信号を符号化する第1の符号化部と、前記第1の画像信号による画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を符号化する第2の符号化部と、符号化された前記第1の画像信号、前記第2の画像信号、及び前記画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を送信する送信部と、を備える、送信装置が提供される。
 また、前記画像フレームは動画のフレームであり、前記オブジェクト指示情報は、前記画像フレームに対する前記領域の画像の時間的な同期情報を含むものであってもよい。
 また、前記オブジェクト指示情報は、前記第1の画像信号又は前記第2の画像信号による画像フレームのピクチャヘッダに挿入されるものであってもよい。
 また、前記オブジェクト指示情報は、前記第1の画像信号及び前記第2の画像信号とは別のストリームで送信され、タイムスタンプにより前記第1の画像信号及び前記第2の画像信号と対応付けられるものであってもよい。
 また、前記領域の画像を前記画像フレームから分離する画像分離部を備え、前記第2の符号化部は、前記画像分離部で分離された前記領域の画像に対応する前記第2の画像信号を符号化するものであってもよい。
 また、前記画像分離部は、前記領域に対応するオブジェクトの動きに合わせて、前記画像フレーム内での前記領域の位置を変化させながら前記領域の画像を前記画像フレームから分離するものであってもよい。
 また、前記第1の画像信号による前記第1の画像フレームのサイズと前記第2の画像信号による画像フレームのサイズが同一の場合、前記送信部は前記オブジェクト指示情報の送信を行わないものであってもよい。
 また、前記第1の符号化部と前記第2の符号化部は、異なる符号化方式によりそれぞれの符号化を行うものであってもよい。
 また、上記課題を解決するために、本発明の別の観点によれば、第1の画像信号を符号化する第1の符号化部と、前記第1の画像信号による画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を符号化する第2の符号化部と、符号化された前記第1の画像信号、前記第2の画像信号、及び前記画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を送信する送信部と、を有する送信装置と、前記第1の画像信号を復号化する第1の復号化部と、前記第2の画像信号を復号化する第2の復号化部と、前記オブジェクト指示情報を取得する情報取得部と、前記オブジェクト指示情報に含まれる前記位置情報に基づいて、前記第1の画像信号による第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、を有する、受信装置と、を備える通信システムが提供される。
 また、上記課題を解決するために、本発明の別の観点によれば、第1の画像信号を復号化するステップと、前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化するステップと、前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得するステップと、
 前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成するステップと、を備える、受信装置の制御方法が提供される。
 また、上記課題を解決するために、本発明の別の観点によれば、第1の画像信号を復号化する手段、前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化する手段、前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得する手段、前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する手段、としてコンピュータを機能させるためのプログラムが提供される。
 また、上記課題を解決するために、本発明の別の観点によれば、第1の画像信号を復号化する第1の復号化部と、前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の空間的な位置情報と、前記第1の画像フレームに対する前記領域のオフセット量を含むオブジェクト指示情報を取得する情報取得部と、前記オブジェクト指示情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、を備える、受信装置が提供される。
 また、上記課題を解決するために、本発明の別の観点によれば、静止画のソース画像から切り出された第1の画像に対応する第1の画像信号を復号化する第1の復号化部と、静止画のソース画像から切り出された第2の画像に対応する第2の画像信号を復号化する第2の復号化部と、前記第1の画像と前記第2の画像との空間的な位置情報を取得する位置情報取得部と、前記位置情報に基づいて、前記第1の画像と前記第2の画像を相対的にオフセットさせた状態で周期的に表示する表示部と、を備える、受信装置が提供される。
 本発明によれば、簡素な構成で3D映像を視聴することが可能な受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラムを提供することができる。
本発明の一実施形態に係る立体画像表示観察システムの構成を示す模式図である。 本発明の一実施形態にかかる送信装置の構成例を示す模式図である。 ターゲット分離部の構成を詳細に示す模式図である。 送信装置におけるエンコードの処理を説明するための模式図である。 送信装置におけるエンコードの処理を説明するための模式図である。 送信装置におけるエンコードの処理を説明するための模式図である。 3Dオブジェクト表示のためのオブジェクト指示情報を示す模式図である。 3D_descriptorの定義を示す模式図である。 図7におけるVertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionによって指定される情報を示す模式図である。 映像データのビットストリームに3D情報を付加する場合に、プライマリーの映像に3D情報を付加する例を示す模式図である。 セカンダリー映像が静止画などで表示時間が可変である場合に、プライマリーの映像に3D情報を付加する例を示す模式図である。 セカンダリーの映像に3D情報を付加する例を示す図であり、動画のピクチャ単位でプライマリー映像とセカンダリー映像を同期させる例を示す模式図である。 セカンダリー映像が静止画などで表示時間が可変の場合に、セカンダリーの映像に3D情報を付加する例を示す模式図である。 受信装置の構成例を示す模式図である。 オブジェクト再生部における処理を示す模式図である。
 以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
 なお、説明は以下の順序で行うものとする。
1.システム構成例
2.送信装置の構成例
3.3Dオブジェクト表示のための情報
4.受信装置の構成例
[1.システム構成例]
 図1は、本発明の一実施形態に係る立体画像表示観察システムの構成を示す模式図である。本実施形態に係るシステムは、映像コンテンツなどをデジタル放送フォーマットなどにより送信する送信装置100と、例えばLCD等から構成される表示パネルを備えるテレビ受像機(受信装置)200と、表示画像鑑賞用メガネ300とを備える。図1では、受信装置200と表示画像鑑賞用メガネ300を示している。
  受信装置200は、地上デジタル放送などを受信するテレビ受像機であり、映像データのビットストリームを受信し、これ復号化して表示パネルに表示させるものである。受信装置200は、送信装置から送られた映像データに基づいて、映像を時分割して非常に短い周期で画面全体に交互にディスプレイする。また、受信装置200は、左眼用映像及び右眼用映像のディスプレイ周期に同期して左眼及び右眼に映像を分離して提供することができる。受信装置200は、例えば、フィールド毎に右目用画像Rと左目用画像Lを交互に表示する。表示画像鑑賞用メガネ300には、レンズに相当する部分に一対の液晶シャッター300a,300bが設けられている。液晶シャッター300a,300bは、受信装置200のフィールド毎の画像切り換えに同期して交互に開閉動作を行う。すなわち、受信装置200に右目用画像Rが表示されるフィールドでは、左目用の液晶シャッター300bが閉鎖状態となり、右目用の液晶シャッターが開放状態300aとなる。また、左目用画像Lが表示されるフィールドでは、これと逆の動作を行う。このように、受信装置200は、左眼用映像L及び右眼用映像Rを非常に短い周期で画面全体に交互にディスプレイすると同時に、左眼用映像L及び右眼用映像Rのディスプレイ周期に同期して左眼及び右眼に映像を分離して提供する。
 このような動作により、鑑賞用メガネ300を掛けて受信装置200を見るユーザの右目には右目用画像Rのみが、また、左目には左目用画像Lのみが入射される。このため、鑑賞者の目の内部で右目用と左目用の画像が合成され、受信装置200に表示される画像が立体的に認識される。また、受信装置200は、ユーザが鑑賞用メガネ300を使用していない場合は、通常の2次元画像を表示することもでき、この場合、右目用画像Rと左目用画像Lの切り換えは行われない。
 なお、図1では、表示画像鑑賞用メガネ300を備えるシステムを例示したが、本実施形態はこれに限定されるものではなく、偏光板方式などメガネ300を用いない立体画像表示観察システムに適用することも可能である。
 ところで、現時点で家庭などに行き渡っているテレビ受像機(以下、レガシーのテレビ受像機と称する場合がある)は、2Dに対応したデコードを想定している。このため、3D映像の視聴を想定したテレビ受像機が普及するまでの間は、既に行き渡っているテレビ受像機においても、3D映像を視聴できることが望ましい。このため、例えば現在放送波で送られている2Dの映像データを左右映像のうちの一方の映像データとし、更に同じデータ量の映像データを送って左右映像の他方の映像データとする方法が考えられる。しかし、この場合、伝送帯域が現在の2倍となってしまい、放送波は伝送帯域が限られているため、付加的な映像データを送ることで3D映像の視聴を実現することは困難である。また、この場合、通常のテレビ受像機で受信したデータをデコードしようとすると、デコーダ負荷が2チャンネル分になるため、デコーダに過負荷がかかり、正常にデコードできないことが想定される。このため、付加的な映像データを送ったとしても、通常のテレビ受像機では、3Dフォーマットとして扱うことができないことが想定される。
 このため、既にユーザに行き渡っているテレビ受像機を利用して3D視聴を実現するためには、付加的な映像データを最小限にして送信することで、3D表示を実現する必要がある。これにより、3Dテレビ受像機が一般に行き渡るまでの導入期において、2D対応のテレビ受像機においても3D視聴が可能となり、3D映像を広く一般向けに提供することが可能となる。
 一方、左目用画像Lと右眼用画像Rを伝送する際のフォーマットとして、サイドバイサイド、トップアンドボトムなどのように、複数のビューで画面を分割して送信する手法が知られている。しかし、既に一般に行き渡っている2D視聴用のテレビ受像機はこのようなフォーマットには対応していないため、正しい3D表示をすることはできない。また、このフォーマットに対応したテレビ受像機においても、1フレームに左右映像のデータが含まれるため、通常の2D画像を送信する場合と比較すると画質が1/2に低下してしまう。
 本実施形態では、2つ以上のビューからなるソース画像に対して、3D表示させる領域のみを送信装置100側で抽出して、その部分を切り出し、基本となるビューに対する相対位置情報とともにエンコードして、付加的(additional)なビューの映像データとして受信装置200側に送信する。基本となるビューについてはその映像データが全て送信される。一方、付加的なビューでは、基本となるビューから切り出した映像のデータのみを送信する。このため、基本となるビューに対して視差のない映像については、付加的なビューでは送信されず、受信装置200側では、視差のない映像については基本ビューの映像を付加的なビューにコピーして使用する。従って、受信装置200側では、付加的なビューについては基本となるビューから切り出した映像データのみをデコードすれば良く、デコードに係る処理を大幅に低下させることが可能となる。このため、受信装置200は、CPUで余剰となった負荷でデコードすることも可能となり、非常に簡素な構成で3Dの映像データをデコードすることができる。
 なお、以下に説明する本実施形態では、映像データは動画に限られるものではなく、基本ビューの動画に付加的なビューとして静止画を付加することもできる。また、基本ビューと付加的なビューのそれぞれを静止画としてスライドショーの表示に適用することもできる。その際、符号化方式は、映像データの形式に依存せずに、基本ビューの符号化方式と付加的なビューのそれとは、同じ方式であっても良いし、あるいは別の符号化方式であっても構わない。
[2.送信装置の構成例]
 図2は、本発明の一実施形態にかかる送信装置100の構成例を示す模式図である。送信装置100は、例えばテレビ番組などの映像コンテンツを提供する放送局側の機器である。送信装置100は、デジタル放送フォーマット等のデータフォーマットによりテレビ受像機に対して映像コンテンツを提供する。
 図2に示すように、送信装置100は、CPU102、映像取得部(Image Capture)104、ターゲット分離部(Target Separation)106、第1のエンコーダ108、第2のエンコーダ110、マルチプレクサ(Multiplexer)112、出力部114を備える。
 本実施形態では、2つ以上のビュー(view)からなるソース画像に対して、3D表示させる領域を送信側で抽出し、その部分を切り出し、基本となるviewに対する相対位置情報と共にその領域を別途エンコーダへ渡す。
 具体的には、映像取得部104で取得されたライブ映像、または映像ファイルの入力に対して、ターゲット分離部106は、CPU102から切り取り対象領域の指定(オブジェクトの大きさ)の指定を受けて、基本となるビューの映像から3D表示させる領域の切り出し処理を行う。ターゲット分離部106は、切り出した領域の制御情報(オブジェクト制御情報)をCPU102へ送り、CPU102からエンコーダ108,110へ切り出し領域の指示データ、表示期間を指定するデータ(オブジェクト指示情報)が送られる。
 図3は、ターゲット分離部106の構成を詳細に示す模式図である。図3に示すように、ターゲット分離部106は、ブロック化部122、フレーム遅延化部124、ブロックマッチング部126、ポジション移動部128、ターゲットオブジェクトブロック分離部130、セレクタ132を備える。なお、図2及び図3に示す各機能ブロックは、回路(ハードウェア)、またはCPU102とこれを機能させるためのソフトウェア(プログラム)によって構成することができる。この場合において、そのプログラムは、送信装置100が備えるメモリなどの記録媒体、または送信装置100の外部の記録媒体に格納されることができる。
 本実施形態では、基本ビューの映像をプライマリーの映像と称し、プライマリーの映像から切り出して得られた別のビューの映像をセカンダリーの映像と称することとする。一例として、基本ビューであるプライマリー映像は、通常の2D映像とすることができる。ターゲット分離部106は、プライマリー映像から切り出す領域の動きを検出して、動きに応じて切り出す領域を変化させる。これにより、例えば基本ビューから人の顔のみを切り出す場合、顔の動きに合わせて切り出す領域を変更していく処理が可能になり、受信装置200においては、3D効果により手前に飛び出して表示される顔を画面方向に移動しながら表示することができる。
 図3のブロック化部122およびフレーム遅延部124には、基本ビューであるプライマリー映像が入力される。ブロック化部122は、セカンダリー映像の切り出しのため、CPU102から切り出しの対象領域(またはオブジェクト)を指定する情報を受け取る。ブロック化部122では、CPU102からの指令に基づいて、切り出しのターゲット領域150の現在のピクチャをブロック化する処理を行う。これにより、ターゲット領域150の現在のピクチャが複数の矩形のブロックに分割される。
 フレーム遅延化部124では、フレームを遅延させ、ブロックマッチング部126において、ブロック化された現在のピクチャと遅延された1つ前のピクチャとのブロックマッチングが行われ、各ブロックの動きを表す動きベクトルを求める。ポジション移動部128では、動きベクトルに基づいて対象領域を移動させるブロックである。ポジション移動部128は、ブロックマッチング部126の処理結果に応じて、各ブロックに対応する複数の動きベクトルのうち、大多数のベクトルを含み、かつ対象領域の大きさを超えない範囲で、対象領域が一つ前のピクチャから動いたオフセット量OFSを判定して、次段へオフセット量OFSを送る。また、ポジション移動部128は、オフセット量OFSをオブジェクト制御情報としてCPU102へ送る。
 ターゲットオブジェクトブロック分離部130には、フレーム毎の映像データが入力される。ターゲットオブジェクトブロック分離部130では、オフセット量OFSに応じてフレーム毎に対象領域の切り取りを行った後、セレクタ132へ送る。また、セレクタ132には、基本ビューであるプライマリー映像が入力される。セレクタ132は、ターゲットオブジェクトブロック分離部130から入力された映像と、元のプライマリー映像とを交互に切り換えて、第1及び第2のエンコーダ108,110へ送る。
 この際、第1のエンコーダ108には元のプライマリー映像が入力され、第2のエンコーダ110にはターゲットオブジェクトブロック分離部130で切り取られた映像が送られる。第1のエンコーダ108は、元の映像であるプライマリーの映像データのエンコードを行い、第2のエンコーダ110は、切り出されたセカンダリーの映像データのエンコードを行う。ここで、第2のエンコーダ110に送られる切り出し後の映像は、ターゲット領域150の動きに応じてその領域が変化するため、3D表示の対象領域、または3D表示の対象オブジェクトが動きを伴うものであっても、常にその領域、またはオブジェクトの動きに応じた3D表示を行うことが可能である。
 第1のエンコーダ108、および第2のエンコーダ110でエンコードされたプライマリー、セカンダリーの映像データは、マルチプレクサ112にて多重化され、音声データ、文字データ等とともに出力部114に送られる。出力部114は、デジタル放送信号フォーマットにより多重化された映像データ、音声データ、文字データを受信装置200に対して送信する。
 なお、送信装置100は、通常の2Dの映像を送信する場合は、プライマリー映像のみを受信装置200に送る。この場合、セカンダリー映像の切り出しは特に行われない。
 以上のように、本実施形態では、プライマリー映像(一例として、通常の2Dの映像)に対して、3D表示が行われる領域のみを切り出して受信装置200側へ送信するため、3D表示に必要な最小限のデータのみを受信装置200に送ることができる。従って、受信装置200におけるデコーダの構成を最小限に抑えることができ、受信装置200のCPUの余剰分でデコードを行うことも可能になる。従って、受信装置200を簡素に構成することが可能である。
 次に、プライマリーの映像に対するセカンダリーの映像の相対位置情報について説明する。後で詳細に説明するが、プライマリー映像とセカンダリー映像を受信した受信装置200は、1stビューとしてプライマリー映像を使用し、2ndビューとしてプライマリー映像にセカンダリー映像を合成した映像を使用する。そして、受信装置200は、1stビューと2ndビューを交互に表示することで3D表示を行う。
 このため、送信装置100は、受信装置200に対して、プライマリー映像およびセカンダリー映像を送ると共に、プライマリー映像に対するセカンダリー映像の位置を指定する相対位置情報を送る。これにより、受信装置200側では、プライマリーの映像に対して適正な位置にセカンダリーの映像を重ねることができる。プライマリー映像に対するセカンダリー映像の相対位置情報は、例えば符号化ストリームのピクチャ(picture)レイヤの補助データ領域に挿入する。ここで、補助データ領域に相対位置情報が存在しない場合、受信装置200側では、基本ビュー(view)のピクチャのトップ(top)&レフト(left)の画像に等しいと判断する。プライマリー映像およびセカンダリー映像のサイズが同一である場合は、送信装置100は相対位置情報を送信を省略することが可能であり、受信装置200は相対位置情報を受信を省略できる。
 セカンダリーの映像データのストリームの符号化は、プライマリー映像である基本ビュー(basic view)の再生画質に対して著しく変わらないようする。セカンダリー映像のストリームの符号化は、プライマリーの符号化方法と同等でもよいし、あるいは別の動画コーデック、静止画コーデックなどを選択してエンコードするようにしてもよい。例えば、プライマリー映像をMPEG-4 AVCで符号化し、セカンダリー映像をMPEG2で符号化してもよい。この場合、セカンダリー映像をデコードする際の付加を依り低減できる。あるいは、プライマリー映像をMPEG2ビデオで、セカンダリー映像をMPEG―4 AVCで符号化することで、付加的なビューによる伝送帯域の増加を低減するようにしてもよい。また、プライマリー映像をMPEG-4 AVCあるいはMPEG2ビデオで符号化し、セカンダリー映像を静止画としてJPEGで符号化するなどしてもよい。
 図4、図5及び図6は、送信装置100におけるエンコードの処理を説明するための模式図である。ここで、図4は、2つのビューの画像を1フレームに合体してエンコードする例を示している。この場合、1stビューと2ndビューはそれぞれ画面水平方向に圧縮処理が成され、1フレームに合体されてエンコードされる。この処理は、通常のサイドバイサイド(side by side)の処理と同様である。
 また、図5は、本実施形態における、1stビューと、2ndビューの切り出し領域のコーデックを示す模式図である。この場合、2ndビューは、エンコードされてエンハンスドレイヤー(Enhanced Layer)として付加される。図5に示すコンパチブルレイヤー(Compatible Layer)は、通常の2D映像データであるプライマリーの映像データを示している。コンパチブルレイヤーは通常の2D映像データと同等の画質で送ることができる。エンハンスドレイヤーは必要最小限の切り出し領域に対応するため、コンパチブルレイヤーのデータ量よりも少なくなる。図5に示すように、プライマリー映像、セカンダリー映像は、PID若しくはビデオトラック(Video Track)の情報によって指定される。
 図6は、本実施形態による切り出し処理によるエンコードの手法を示す模式図である。図6の上段に示すように、2D映像として1stビューの映像のみを送る場合、1stビューの映像データのみがエンコードされる。この場合、第1のエンコーダ108でプライマリー映像が符号化されて、受信装置200に送信される。図6の下段は、上述した本実施形態の手法により、2ndビューとしてプライマリー映像から切り出した領域の映像をエンコードする場合を示している。
 図6の下段に示すように。本実施形態では、1stビューについては、1フレームのデータがそのまま第1のエンコーダ108にてエンコードされる。一方、2ndビューについては、1stビューからの切り出し領域のみが第2のエンコーダ110にてエンコードされる。このため、図6の下段に示すように、2ndビューにおける、切り出した領域の符号化データのデータ量は、1stビューの符号化されたデータ(Coded Video Data)のデータ量に比べて大幅に低減できる。従って、受信装置200側においては、デコードの負荷を最小限に抑えることが可能である。
 図1に示すマルチプレクサ112は、システム全体の多重化ストリームの中で、基本のビュー(通常の2Dのビデオ信号に相当)のビデオストリーム、セカンダリー映像のストリームとしてIDを付し、多重化する。これにより、多重化されたストリームの中で、プライマリー映像とセカンダリー映像をIDで紐付けすることができる。
 また、タイムスタンプは、基本ビューの映像データのタイムスタンプと同様の同期方法を適用する。多重化の際のシステム管理は、CPU102において、トランスポートストリーム(TS)のヘッダに定義されるPMT(Program Map Table)のテーブルにおいて行う。その際は、プライマリー映像を2Dのビデオストリームとし、追加ビュー(セカンダリー映像)のストリームを、以下のようにPMTの下で2Dのビデオストリームに付加するように定義し、IDを付けて管理する。このような手法によれば、現状のトランスポートストリームの仕組みを変えることなく、プライマリー映像とセカンダリー映像をPESのIDで紐付けすることができる。
   PAT------PMT1-----------Video (2D Basic)
             -----------Audio
             -----------Video (Secondary enhancement)
      ------PMT2
 PMTでは、各符号化信号のPID指定、ESの種類や状態、プログラムのPCRのPIDなどを指定する。受信装置200側では、現状の仕組みを利用して、プライマリー映像とセカンダリー映像を紐付けし、上記の符号化過程とは反対の処理を行うことで、所望の表示を行うことができる。
 マルチプレクサ112では、第1のエンコーダ108でエンコードされたデータと、第2のエンコーダ110でエンコードされたデータとを多重化する。多重化されたデータは出力部114から受信装置200側へ送信される。
[3.3Dオブジェクト表示のための情報]
 図7は、3Dオブジェクト表示のためのオブジェクト指示情報(以下、3D情報と称する場合がある)を示す模式図である。図7に示すオブジェクト指示情報は、第1のエンコーダ108、第2のエンコーダ110、マルチプレクサ112に送られて、映像データに挿入される。オブジェクト指示情報は、1つのエレメンタリーストリームとして送ることができる。この場合、プライマリー映像、セカンダリー映像、及びオブジェクト指示情報は、タイムスタンプによって対応付けすることができる。また、後述するように、オブジェクト指示情報は、プライマリー映像またはセカンダリー映像のピクチャ単位(ピクチャヘッダのユーザデータ領域)に挿入することができる。
 図7に示す各情報を説明すると、Data_Lengthは、オブジェクト指示情報のデータ量を示す情報である。Number_of_VideoViews Nは、1のプライマリー映像から切り出されるセカンダリー映像の数を示す情報である。本実施形態では、一例として1のプライマリー映像から1のセカンダリー映像を切り出す例を示すが、2以上のセカンダリー映像を切り出しても良く、N個のセカンダリー映像を切り出すことができる。Target_videoView(i)は、本情報が扱うビュー(View)のElementary PIDを示す情報である。この情報によって、セカンダリー映像に対するプライマリー映像が識別情報であるIDによって指定され、セカンダリー映像に対するプライマリー映像の時間的なフレーム毎の対応付けを行うことができる。
 図7において、Target_videoViewは、プライマリー映像のビューに対応し、対応するビューのPIDを指定する。Partner_videoViewは、セカンダリー映像のビューに対応し、対応するビューのPIDを指定する。例えば、Target_videoView=PID1、Partner_ViewoView=PID0とすることで、対応するビューを指定する。Picture_IDは、ピクチャ毎にカウントアップされる値で、静止画の時系列順の識別子に用いる。
 また、各々のビューには、プライマリー映像に対するセカンダリー映像の空間的な位置(画面内の位置)を指定する位置情報、セカンダリー映像の表示期間等を指定するため、複数のフラグObject_Offset_position_flag、Status_Count_flagが設定される。
 Object_Offset_position_flagが“1”の場合、Vertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionの各データにより切り出し領域が指定される。これらの情報は、Target_videoViewの始点(0,0)に対するPartner_ViewoViewのオブジェクト(object)領域の開始位置、終了位置を指定するデータである。
 Pixel_ratioは、Target_videoViewの解像度に対する、Partner_ViewoViewのオブジェクト領域の解像度比を指定する情報である。Pixel_ratio=0x0の場合は、解像度変換が不要であることを示す。
 Status_Count _flagが“1”の場合、All_VideoView、DurationCounterにより、セカンダリー映像を使用した3D表示継続期間が指定される。All_VideoViewが“1”の場合は、Target_VideoViewのみならず、全てのvideoviewに関してDuration_Counterによる表示継続時間制御を適用する。Duration_Counterは、表示開始後、表示継続時間をフレーム数で指定する。なお、動画の場合は、各ピクチャにオブジェクト指示情報を挿入することで、受信装置200側では、セカンダリー映像の表示継続期間を認識することができる。Duration_Counterは、特に静止画を送る場合に、表示継続期間を指定する際に有効である。
 なお、送信装置100は、セカンダリーの映像データ自体は送らずに、プライマリー映像からの切り出し領域と、プライマリー映像に対する視差量の情報を送信するようにしても良い。この場合、Vertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionの各データにより切り出し領域を指定するとともに、視差量を示す情報を送信する。受信装置200は、プライマリー映像からVertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionの各データで示される領域を切り出して、視差をつけてセカンダリー映像を生成する。切り出し領域以外の視差のない領域については、プライマリー映像をコピーしてセカンダリー映像を生成する。これにより、受信装置200は、プライマリー映像とセカンダリー映像とからなる3D映像を生成することができる。
 なお、図7に示すオブジェクト指示情報の伝送方法は、独立エレメンタリーストリームで伝送しても良いし、あるいは映像データのピクチャ単位のユーザデータとして伝送しても良い。
 上述のようにMPEGでは、伝送するコンテンツのストリーム情報を記述するPSI(Program System Information)として、PMT(Program map table)がある。PMTのストリーム情報には、オーディオやビデオなどのパケットを選択するためのPID(Packet ID)、stream_typeやdescriptorなどが含まれ、ビデオのコーデックやオーディオのコーデックが何を用いて符号化されているかを知ることができる。図7に示す3D情報をトランスポートストリーム(Transport Stream)内で多重化する場合、ビュー間のリンク情報として、Program Map Section(TS Table ID=0x02)において、3D_descriptorによって指定することができる。この場合、3D_descriptorを図8で示すように定義する。
 図9は、図7におけるVertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionによって指定される情報を示す模式図である。
 図9において、Xはプライマリー映像の水平方向のサイズ(Primary video Picture Horizontal Size)を、Yはプライマリー映像の垂直方向のサイズ(Primary video Picture Vertical Size)を示している。HDサイズの場合、X=1920ピクセル、Y=1080ピクセルである。また、(hs,vs)は、セカンダリー映像の始点P1の座標位置を、(he,ve)はセカンダリー映像の終点P2の座標位置を示している。図9の例では、セカンダリー映像(secondary video)として切り出される映像は、(hs,vs)を左上の頂点とし(he,ve)を右下の頂点とする矩形領域である。なお、(he,ve)の代わりに、オブジェクト領域のサイズを送っても良い。また、3D情報は、符号化ストリーム内のヘッダ情報による伝送法で送っても良い。
 上述の例では、Vertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionによって指定される情報によって、プライマリー映像からのセカンダリー映像の切り出し範囲が指定される。一方、例えば送信装置100から静止画を送信する場合、一般的に静止画像の画素数は動画フレームによって表示される表示パネル(フルHDサイズなど)の画素数よりも多いため、静止画のソース画像から所定の範囲を切り出して伝送することになる。このため、静止画の伝送においては、図7に示す各種情報を、ソース画像からの切り出し範囲を指定する情報として用いても良い。この場合、プライマリー画像、セカンダリー画像の双方がソース画像から切り出されて、受信装置200に送られて、受信装置200側でプライマリー画像とセカンダリー画像を交互に表示することで、静止画の3D映像の視聴が可能となる。
 図10は、映像データのビットストリームに3D情報を付加する場合に、プライマリーの映像に3D情報を付加する例を示す模式図である。図9は、動画の3D表示の場合にピクチャ単位でプライマリー映像とセカンダリー映像を同期させる例を示している。同期は、タイムスタンプを用いて、フレームバイフレームで行う。この場合、第1のエンコーダ108において、プライマリー映像のピクチャ毎に3D情報が挿入される。一例として、3D情報を符号化ビデオのGOP(Groupe of Picture)あるいはIピクチャに同期させて、そのヘッダに挿入することができる。
 図11は、セカンダリー映像が静止画などで表示時間が可変である場合に、プライマリーの映像に3D情報を付加する例を示す模式図である。この場合、セカンダリー映像は所定の表示時間の間は変化しないため、ピクチャ毎に3D情報を挿入する必要はない。このため、第1のエンコーダ108において、セカンダリー映像の表示時間に応じて、所定数のピクチャ毎に3D情報を挿入する。セカンダリー映像の表示時間は、図7で説明したDuration Counterによって指定される。
 図12は、セカンダリーの映像に3D情報を付加する例を示す模式図であり、動画のピクチャ単位でプライマリー映像とセカンダリー映像を同期させる例を示している。この場合、第2のエンコーダ110において、セカンダリーのピクチャ毎に3D情報が挿入される。一例として、3D情報を符号化ビデオのGOPあるいはIピクチャに同期させて挿入することができる。
 図13は、セカンダリー映像が静止画などで表示時間が可変の場合に、セカンダリーの映像に3D情報を付加する例を示す模式図である。この場合、セカンダリー映像は所定の表示時間の間は変化しないため、第2のエンコーダ110において、表示時間に応じて、所定数のピクチャ毎に3D情報を挿入する。この場合においても、セカンダリー映像の表示時間は、図7で説明したDuration Counterによって指定される。
[4.受信装置の構成例]
 次に、受信装置200の構成について説明する。図14は、受信装置200の構成例を示す模式図である。図14に示すように、受信装置200は、CPU202、デマルチプレクサ(Demultiplexer)204、第1のデコーダ206、第2のデコーダ208、オブジェクト再生部(Object Reconstruction)210、3D処理部(3D Processing View Interleaving)212を有して構成される。また、受信装置200は、液晶表示パネル等から構成される表示部を備える。なお、図14に示す各機能ブロックは、回路(ハードウェア)、またはCPU202とこれを機能させるためのソフトウェア(プログラム)によって構成することができる。この場合において、そのプログラムは、受信装置200が備えるメモリなどの記録媒体、または受信装置200の外部の記録媒体に格納されることができる。
 デマルチプレクサ204には、送信装置100から送られたビットストリーム、または映像ファイルの出力が入力される。デマルチプレクサ204は、入力されたデータを映像データ、音声データ、文字データ等に分離し、映像データを第1のデコーダ108、第2のデコーダ110へ送る。また、デマルチプレクサ204は、オブジェクト指示情報をビットストリームから抽出し、CPU202へ送る。
 デマルチプレクサ204は、プライマリー映像のデータとセカンダリー映像のデータを分離して、プライマリー映像のデータについては第1のデコーダ206へ、セカンダリー映像のデータについては第2のデコーダ208へ送る。
 第1及び第2のデコーダ206,208に対する入力のフォーマットは、既存の2D映像のデコードの場合と基本的に同じであるため、現在のデジタル映像信号フォーマットの仕組みを利用して、デコードを行うことができる。3Dの映像を見る必要がない場合は、プライマリー映像のみをデコードすることで、2D映像の視聴が可能である。セカンダリー映像が存在しない場合、第1のデコーダ206で通常の2D映像データのデコードが行われる。
 CPU202は、デマルチプレクサ204から送られたオブジェクト指示情報に基づいて、第1のデコーダ206及び第2のデコーダ208を制御する。CPU202は、第2のデコーダ208に対して表示期間を指定する情報を送る。これにより、第2のデコーダ208は、指定された表示期間の間はセカンダリー映像が存在するものと認識して、セカンダリー映像のデコードを行う。
 オブジェクト再生部210は、1stビューと2ndビュー間で映像データをコピーして、オブジェクトの位置で映像を合成する。これにより、デコードされたプライマリー映像及びセカンダリー映像を合成して2ndビューの映像が生成される。プライマリー映像については、第1のデコーダ206でデコードされた映像データが3D処理部212へ入力される。
 図15は、オブジェクト再生部210における処理を示す模式図である。図15に示すように、1stビューのプライマリー映像のデータは第1のデコーダ206でデコードされて、プライマリー映像400が得られる。この処理は、レガシーの受信装置200で処理可能である。一方、セカンダリー映像のデータは第2のデコーダでデコードされて、セカンダリー映像410が得られる。オブジェクト再生部210では、1stビューとしてプライマリー映像400を出力する。また、オブジェクト再生部210は、プライマリー映像400をコピーして、これに対してセカンダリー映像410を、オフセット分だけずらして合成(Overwrtie)して、2ndビューの映像データとして出力する。ここで、オフセット量は上述したVertical_Start_Position、Horizontal_Start_Position、Vertical_End_Position、Horizontal_End_Positionによって指定され、デマルチプレクサ204からCPU202へ送られる。また、オブジェクト指示情報がピクチャ単位で挿入されている場合、第1及び第2のデコーダ206,208から取得しても良い。また、オブジェクト再生部210は、エレメンタリーストリームのタイムスタンプ、プライマリー映像とセカンダリー映像の識別ID(PID)に基づいて、プライマリー映像400とセカンダリー映像410の時間的な同期を行う。
 なお、上述したように、送信装置100からセカンダリーの映像データ自体は送られず、プライマリー映像からの切り出し領域と、プライマリー映像に対する視差量の情報が送信された場合、切り出し領域に基づいて受信装置200側でセカンダリー映像410を生成する。そして、オブジェクト再生部210は、プライマリー映像400に対して、生成したセカンダリー映像410を視差量だけずらして合成し、2ndビューの映像として出力する。
 また、送信装置100においてプライマリー画像、セカンダリー画像の双方がソース画像から切り出されて送信された場合、オブジェクト再生部210は、ソース画像から切り出されたプライマリー画像、セカンダリー画像をオフセット分だけずらして1stビュー、2ndビューの映像として出力する。これにより、プライマリー画像とセカンダリー画像を交互に表示することで、静止画の3D映像の視聴が可能となる。
 3D処理部212には、オブジェクト再生部210から出力された1stビュー及び2ndビューの映像データが入力され、入力された1stビューの画像データ及び2ndビューの画像データに対してハイフレームレートなどの所定の処理を行い、表示パネルへ出力する。1stビューを左目用画像L、2ndビューを右眼用画像Rとした場合、表示パネルにおいては、左目用画像Lと右眼用画像Rが所定のフレームレートで交互に表示される。そして、観賞用メガネ300の液晶シャッター300bが開くタイミングで左目用画像Lが表示され、液晶シャッター300aが開くタイミングでは右目用画像Rが表示されるため、ユーザの両目には視差のある左目用画像L及び右眼用画像Rが視認され、これによって3D表示が実現される。
 以上説明したように本実施形態によれば、また、3Dの領域を切り出し領域に限定するので、伝送帯域への要求を必要最小限にすることが可能である。また、受信装置200におけるデコーダの負荷の増加は、2D映像に追加する付加的なビューの立体表示に該当する領域の分に限定されるため、既存のレガシーのテレビ受像機での2D表示、3D表示が可能となる。従って、既存のデジタル映像信号フォーマットの仕組みを利用して、既存のレガシーのテレビ受像機との後方互換性が維持できる。更に、受信装置200側では、付加的な追加ビューの該当する領域のみを追加でデコードすれば良いので、既存の2Dデコードに対して追加されるデコード負荷を最小限に抑えることが可能である。これにより、追加のデコード負荷をデコーダ以外のCPUなどで担当することでシステム前提での負荷分散を図ることが可能になる。
 以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
 100  送信装置
 108  第1のエンコーダ
 110  第2のエンコーダ
 114  出力部
 200  受信装置
 206  第1のエンコーダ
 208  第2のエンコーダ
 202  CPU
 210  オブジェクト再生部

Claims (20)

  1.  第1の画像信号を復号化する第1の復号化部と、
     前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化する第2の復号化部と、
     前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得する情報取得部と、
     前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、
     を備える、受信装置。
  2.  前記第1の画像フレームによる画像と前記第2の画像フレームによる画像を周期的に表示する表示部を備える、請求項1に記載の受信装置。
  3.  前記第1の画像フレームは動画のフレームであり、前記オブジェクト指示情報は、前記第1の画像フレームに対する前記領域の画像の時間的な同期情報を含み、
     前記映像合成部は、前記位置情報及び前記同期情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成する、請求項1に記載の受信装置。
  4.  前記オブジェクト指示情報は、前記第1の画像信号又は前記第2の画像信号による画像フレームのピクチャヘッダに含まれる、請求項3に記載の受信装置。
  5.  前記オブジェクト指示情報は、前記第1の画像信号及び前記第2の画像信号とは別のストリームで送信され、タイムスタンプにより前記第1の画像信号及び前記第2の画像信号と対応付けられる、請求項3に記載の受信装置。
  6.  前記第1の画像信号による前記第1の画像フレームのサイズと前記第2の画像信号による画像フレームのサイズが同一の場合、前記情報取得部による前記オブジェクト指示情報の取得を行わない、請求項1に記載の受信装置。
  7.  前記第1の復号化部と前記第2の復号化部は、異なる復号化方式によりそれぞれの復号化を行う、請求項1に記載の受信装置。
  8.  第1の画像信号を符号化する第1の符号化部と、
     前記第1の画像信号による画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を符号化する第2の符号化部と、
     符号化された前記第1の画像信号、前記第2の画像信号、及び前記画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を送信する送信部と、
     を備える、送信装置。
  9.  前記画像フレームは動画のフレームであり、前記オブジェクト指示情報は、前記画像フレームに対する前記領域の画像の時間的な同期情報を含む、請求項8に記載の送信装置。
  10.  前記オブジェクト指示情報は、前記第1の画像信号又は前記第2の画像信号による画像フレームのピクチャヘッダに挿入される、請求項8に記載の送信装置。
  11.  前記オブジェクト指示情報は、前記第1の画像信号及び前記第2の画像信号とは別のストリームで送信され、タイムスタンプにより前記第1の画像信号及び前記第2の画像信号と対応付けられる、請求項8に記載の送信装置。
  12.  前記領域の画像を前記画像フレームから分離する画像分離部を備え、
     前記第2の符号化部は、前記画像分離部で分離された前記領域の画像に対応する前記第2の画像信号を符号化する、請求項8に記載の送信装置。
  13.  前記画像分離部は、前記領域に対応するオブジェクトの動きに合わせて、前記画像フレーム内での前記領域の位置を変化させながら前記領域の画像を前記画像フレームから分離する、請求項12に記載の送信装置。
  14.  前記第1の画像信号による前記第1の画像フレームのサイズと前記第2の画像信号による画像フレームのサイズが同一の場合、前記送信部は前記オブジェクト指示情報の送信を行わない、請求項8に記載の送信装置。
  15.  前記第1の符号化部と前記第2の符号化部は、異なる符号化方式によりそれぞれの符号化を行う、請求項8に記載の送信装置。
  16.  第1の画像信号を符号化する第1の符号化部と、前記第1の画像信号による画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を符号化する第2の符号化部と、符号化された前記第1の画像信号、前記第2の画像信号、及び前記画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を送信する送信部と、を有する送信装置と、
     前記第1の画像信号を復号化する第1の復号化部と、前記第2の画像信号を復号化する第2の復号化部と、前記オブジェクト指示情報を取得する情報取得部と、前記オブジェクト指示情報に含まれる前記位置情報に基づいて、前記第1の画像信号による第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、を有する、受信装置と、
     を備える通信システム。
  17.  第1の画像信号を復号化するステップと、
     前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化するステップと、
     前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得するステップと、
     前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成するステップと、
     を備える、受信装置の制御方法。
  18.  第1の画像信号を復号化する手段、
     前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の画像に対応する第2の画像信号を復号化する手段、
     前記第1の画像フレームに対する前記領域の空間的な位置情報を含むオブジェクト指示情報を取得する手段、
     前記位置情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する手段、
     としてコンピュータを機能させるためのプログラム。
  19.  第1の画像信号を復号化する第1の復号化部と、
     前記第1の画像信号による第1の画像フレームの少なくとも一部の領域の空間的な位置情報と、前記第1の画像フレームに対する前記領域のオフセット量を含むオブジェクト指示情報を取得する情報取得部と、
     前記オブジェクト指示情報に基づいて、前記第1の画像フレームに対して前記領域の画像を合成して第2の画像フレームを生成する映像合成部と、
     を備える、受信装置。
  20.  静止画のソース画像から切り出された第1の画像に対応する第1の画像信号を復号化する第1の復号化部と、
     静止画のソース画像から切り出された第2の画像に対応する第2の画像信号を復号化する第2の復号化部と、
     前記第1の画像と前記第2の画像との空間的な位置情報を取得する位置情報取得部と、
     前記位置情報に基づいて、前記第1の画像と前記第2の画像を相対的にオフセットさせた状態で周期的に表示する表示部と、
     を備える、受信装置。
PCT/JP2011/050548 2010-01-22 2011-01-14 受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム Ceased WO2011089982A1 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
RU2012130007/08A RU2012130007A (ru) 2010-01-22 2011-01-14 Приемное устройство, передающее устройство, система связи, способ управления приемным устройством и программа
KR1020127018332A KR20120127409A (ko) 2010-01-22 2011-01-14 수신 장치, 송신 장치, 통신 시스템, 수신 장치의 제어 방법, 및 프로그램
US13/521,791 US20120307006A1 (en) 2010-01-22 2011-01-14 Receiving apparatus, transmitting apparatus, communication system, receiving apparatus control method, and program
JP2011550892A JPWO2011089982A1 (ja) 2010-01-22 2011-01-14 受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム
BR112012017469A BR112012017469A2 (pt) 2010-01-22 2011-01-14 aparelho receptor e transmissor, sistema de comunicação,e, método de controle de aparelho receptor
CN2011800139644A CN102804791A (zh) 2010-01-22 2011-01-14 接收装置、发送装置、通信系统、接收装置控制方法和程序
EP11734589.2A EP2528334A4 (en) 2010-01-22 2011-01-14 RECEIVING DEVICE, SENDING DEVICE, COMMUNICATION SYSTEM, METHOD FOR CONTROLLING THE RECEIVER AND PROGRAM

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010012204 2010-01-22
JP2010-012204 2010-01-22

Publications (1)

Publication Number Publication Date
WO2011089982A1 true WO2011089982A1 (ja) 2011-07-28

Family

ID=44306785

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/050548 Ceased WO2011089982A1 (ja) 2010-01-22 2011-01-14 受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム

Country Status (8)

Country Link
US (1) US20120307006A1 (ja)
EP (1) EP2528334A4 (ja)
JP (1) JPWO2011089982A1 (ja)
KR (1) KR20120127409A (ja)
CN (1) CN102804791A (ja)
BR (1) BR112012017469A2 (ja)
RU (1) RU2012130007A (ja)
WO (1) WO2011089982A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012049611A (ja) * 2010-08-24 2012-03-08 Sony Corp 画像処理装置と画像処理方法
CN103517062A (zh) * 2012-06-15 2014-01-15 晨星软件研发(深圳)有限公司 影像的同步方法及其装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105493101B (zh) * 2013-09-26 2019-09-10 英特尔公司 包括在辅助对象定位中使用加速数据的图像帧处理
CN104851119B (zh) * 2014-02-13 2019-04-12 腾讯科技(深圳)有限公司 一种动画可移植网络图形图片的生成方法和装置
US11245929B2 (en) * 2017-07-20 2022-02-08 Saturn Licensing Llc Transmission device, transmission method, reception device, and reception method
EP3843376B1 (en) 2018-08-20 2025-02-12 Sony Semiconductor Solutions Corporation Image processing device, and image processing system
JP7327083B2 (ja) * 2019-10-30 2023-08-16 富士通株式会社 領域切り出し方法および領域切り出しプログラム
CN110868600B (zh) * 2019-11-11 2022-04-26 腾讯云计算(北京)有限责任公司 目标跟踪视频推流方法、显示方法、装置和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138384A (ja) * 1995-11-15 1997-05-27 Sanyo Electric Co Ltd 立体画像観察用眼鏡の制御方法
JPH1139507A (ja) * 1997-07-23 1999-02-12 Sanyo Electric Co Ltd 立体画像表示装置
JP2004248212A (ja) * 2003-02-17 2004-09-02 Kazunari Era 立体視画像表示装置
JP2007228390A (ja) * 2006-02-24 2007-09-06 Optrex Corp 画像表示装置及び画像処理方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003092305A1 (fr) * 2002-04-25 2003-11-06 Sharp Kabushiki Kaisha Codeur d'images, decodeur d'images, support d'enregistrement et enregistreur d'images
US7636088B2 (en) * 2003-04-17 2009-12-22 Sharp Kabushiki Kaisha 3-Dimensional image creation device, 3-dimensional image reproduction device, 3-dimensional image processing device, 3-dimensional image processing program, and recording medium containing the program
US9667980B2 (en) * 2005-03-01 2017-05-30 Qualcomm Incorporated Content-adaptive background skipping for region-of-interest video coding
CN101164342B (zh) * 2005-03-01 2011-03-02 高通股份有限公司 使用ρ域位分配的视频电话中的关注区编码方法及装置
US7982733B2 (en) * 2007-01-05 2011-07-19 Qualcomm Incorporated Rendering 3D video images on a stereo-enabled display
RU2487488C2 (ru) * 2007-06-26 2013-07-10 Конинклейке Филипс Электроникс Н.В. Способ и система для кодирования сигнала трехмерного видео, инкапсулированный сигнал трехмерного видео, способ и система для декодера сигнала трехмерного видео
CN101453639B (zh) * 2007-11-29 2012-05-30 展讯通信(上海)有限公司 支持roi区域的多路视频流的编码、解码方法和系统
US9113161B2 (en) * 2009-04-14 2015-08-18 Panasonic Intellectual Property Management Co., Ltd. Video display apparatus, video viewing glasses, and system comprising the display apparatus and the glasses

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09138384A (ja) * 1995-11-15 1997-05-27 Sanyo Electric Co Ltd 立体画像観察用眼鏡の制御方法
JPH1139507A (ja) * 1997-07-23 1999-02-12 Sanyo Electric Co Ltd 立体画像表示装置
JP2004248212A (ja) * 2003-02-17 2004-09-02 Kazunari Era 立体視画像表示装置
JP2007228390A (ja) * 2006-02-24 2007-09-06 Optrex Corp 画像表示装置及び画像処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2528334A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012049611A (ja) * 2010-08-24 2012-03-08 Sony Corp 画像処理装置と画像処理方法
CN103517062A (zh) * 2012-06-15 2014-01-15 晨星软件研发(深圳)有限公司 影像的同步方法及其装置

Also Published As

Publication number Publication date
CN102804791A (zh) 2012-11-28
BR112012017469A2 (pt) 2016-04-19
EP2528334A1 (en) 2012-11-28
EP2528334A4 (en) 2014-01-15
US20120307006A1 (en) 2012-12-06
RU2012130007A (ru) 2014-01-20
JPWO2011089982A1 (ja) 2013-05-23
KR20120127409A (ko) 2012-11-21

Similar Documents

Publication Publication Date Title
US10341636B2 (en) Broadcast receiver and video data processing method thereof
JP5482254B2 (ja) 受信装置、送信装置、通信システム、表示制御方法、プログラム、及びデータ構造
CN104822071B (zh) 提供立体视频广播服务的数据流的发送方法和接收方法
US9210354B2 (en) Method and apparatus for reception and transmission
EP1734766A2 (en) Transport stream structure including image data and apparatus and method for transmitting and receiving image data
WO2011089982A1 (ja) 受信装置、送信装置、通信システム、受信装置の制御方法、及びプログラム
CN102883172A (zh) 接收装置、接收方法和发送接收方法
CN102342112A (zh) 立体图像数据发送装置、立体图像数据发送方法、立体图像数据接收装置和立体图像数据接收方法
CN103416069A (zh) 发送设备、发送方法、接收设备以及接收方法
KR20140000136A (ko) 화상 데이터 송신 장치, 화상 데이터 송신 방법, 화상 데이터 수신 장치 및 화상 데이터 수신 방법
US20140078256A1 (en) Playback device, transmission device, playback method and transmission method
WO2013073455A1 (ja) 画像データ送信装置、画像データ送信方法、画像データ受信装置および画像データ受信方法
EP2512143A1 (en) Image data transmission device, image data transmission method, image data reception device, and image data reception method
US9693033B2 (en) Transmitting apparatus, transmitting method, receiving apparatus and receiving method for transmission and reception of image data for stereoscopic display using multiview configuration and container with predetermined format
WO2013011834A1 (ja) 送信装置、送信方法および受信装置
WO2011155418A1 (ja) 立体画像データ送信装置、立体画像データ送信方法、立体画像データ受信装置および立体画像データ受信方法
CN103843330A (zh) 发送设备、发送方法、接收设备以及接收方法
JP2013021683A (ja) 映像信号処理装置及び映像信号処理方法、映像表示装置及び映像表示方法、並びに映像処理システム
JP2013106341A (ja) 送信装置、送信方法、受信装置および受信方法
KR101556149B1 (ko) 수신 시스템 및 데이터 처리 방법
GB2470402A (en) Transmitting three-dimensional (3D) video via conventional monoscopic (2D) channels as a multiplexed, interleaved data stream

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180013964.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11734589

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011550892

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13521791

Country of ref document: US

Ref document number: 2011734589

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 20127018332

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 6160/CHENP/2012

Country of ref document: IN

Ref document number: 2012130007

Country of ref document: RU

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112012017469

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 112012017469

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20120713