JP2016072858A - Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program - Google Patents
Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program Download PDFInfo
- Publication number
- JP2016072858A JP2016072858A JP2014201832A JP2014201832A JP2016072858A JP 2016072858 A JP2016072858 A JP 2016072858A JP 2014201832 A JP2014201832 A JP 2014201832A JP 2014201832 A JP2014201832 A JP 2014201832A JP 2016072858 A JP2016072858 A JP 2016072858A
- Authority
- JP
- Japan
- Prior art keywords
- data
- media data
- segment
- file
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明は、映像や音声等のメディアのデータを配信する技術に関連するものである。 The present invention relates to a technique for distributing media data such as video and audio.
映像データをストリーミング配信する技術として、HLS(HTTP Live Streaming)方式やISO/IECで国際標準化されているMPEG−DASH (dynamic adaptive streaming over HTTP)方式がある。これらはどちらも、元の映像データを10秒程度の細切れのファイル(メディアセグメント)に分割し、再生順序が記載されたプレイリストとともに用いられる。 As a technique for streaming video data, there are an HLS (HTTP Live Streaming) system and an MPEG-DASH (dynamic adaptive streaming over HTTP) system internationally standardized by ISO / IEC. Both of these are used with a playlist that divides the original video data into files (media segments) of about 10 seconds and describes the playback order.
クライアントとなるプレイヤは、プレイリストを基に細切れのファイルを再生順にサーバから取得するが、この際、サーバ側に複数のビットレートのファイルが用意されていれば、クライアントプレイヤは、NWの状態(主に通信速度)を監視しながら、最適なビットレートの映像データをサーバから取得し再生することで、映像をできるだけ途切れさせることなく再生することが可能となる。以下、これらの技術をABR(Adaptive BitRate)技術と呼ぶことにする。 A player who becomes a client obtains a fragmented file from the server in the playback order based on the playlist. At this time, if a plurality of bit rate files are prepared on the server side, the client player is in the NW state ( It is possible to reproduce the video without interruption as much as possible by acquiring and reproducing the video data of the optimum bit rate from the server while mainly monitoring the communication speed). Hereinafter, these techniques are referred to as ABR (Adaptive BitRate) techniques.
1つ1つの映像データファイルは、プログレッシブダウンロードとして読み込まれる。そのため、映像データを細切れにする場合に、映像データをどの程度の長さ毎に分割するかが1つのポイントとなるが、短く分割しすぎてしまうと、クライアントのサーバアクセスが増大しサーバ側に負荷がかかったり、ファイル数が増大することで、長時間コンテンツなどの場合は特に、ファイルの管理が煩雑になってしまう問題がある。逆に、長い時間で分割をしてしまうと、その1つの細切れファイルのダウンロード途中で通信速度が低下してしまうと、プレイヤ内の映像再生バッファが枯渇してしまい、映像がかくつき、最悪止まるか見えなくなってしまう。そのため、一般的に映像データ分割の長さは10秒程度とすることが推奨されている。 Each video data file is read as progressive download. Therefore, when video data is shredded, one point is how long the video data is divided. However, if the video data is divided too short, client access to the server increases and the server side is increased. There is a problem that file management becomes complicated especially in the case of content for a long time due to the load or the increase in the number of files. On the other hand, if the file is divided for a long time, if the communication speed is reduced during the downloading of the one fragmented file, the video playback buffer in the player is depleted, and the video gets stuck and stops at worst. I can't see it. Therefore, it is generally recommended that the video data division length is about 10 seconds.
ここで、HLS方式では、一般にABRを行う際は、映像データのセグメントファイルの長さごとにビットレートの変更要否を判断する。しかし、NW通信速度は一般に、時々刻々と変化してしまう(特にモバイル環境では顕著)ので、映像データファイルのセグメント長を数秒〜10秒程度の長さにしたとしても、様々なNW環境下でも映像を途切れさせることなく、かつなるべく高品質に配信することは、ABRを用いても大変困難である。 Here, in the HLS system, when ABR is generally performed, it is determined whether or not the bit rate needs to be changed for each length of the segment file of video data. However, since the NW communication speed generally changes from moment to moment (particularly in the mobile environment), even if the segment length of the video data file is set to a length of several seconds to 10 seconds, even under various NW environments. Even if ABR is used, it is very difficult to distribute video with high quality without interruption.
MPEG−DASH方式では、セグメントファイル中のある特定の地点を参照可能なインデックスファイルと呼ばれるものが新たに定義されている。このインデックスファイルに、映像中の何枚かのフレームを一かたまりとしたGOP(Group of Pictures)単位(通常、0.5秒〜1秒程度)でアクセス可能とするための情報を書き込むことで、セグメントファイルの長さにとらわれずに、ABRの制御を行うことが可能となる。 In the MPEG-DASH system, a so-called index file that can refer to a specific point in a segment file is newly defined. By writing information for making this index file accessible in GOP (Group of Pictures) unit (usually about 0.5 seconds to 1 second), which is a group of several frames in the video, ABR can be controlled without being limited by the length of the segment file.
また、インデックスファイルには、GOPの先頭フレームに位置する、映像にランダムアクセス可能(=他のフレームに依存せず、このフレームのストリームデータのみでデコード可能)なフレーム情報も記載することで、トリックプレイ(早送り、巻き戻し、ジャンプなどの操作)を行う際に、再生に必要なフレームデータのみをサーバから取得することができ、NWトラフィックを大幅に軽減することが可能となる。 The index file also contains frame information that is located in the first frame of the GOP and that can be accessed randomly (= decodes only with stream data of this frame without depending on other frames). When playing (operations such as fast forward, rewind, and jump), only frame data necessary for reproduction can be acquired from the server, and NW traffic can be greatly reduced.
ところで、映像データ配信で用いられる映像データのファイル形式には、多くは地上デジタル放送などで用いられているMPEG−2 TS形式(ISO/IEC 13818)と、PCでのファイル形式で用いられているMP4形式(ISO/IEC 14496−15)などがある。HLS方式では映像データのファイル形式としてMPEG−2 TS形式にのみ対応し、MPEG−DASH方式では、MPEG−2 TS形式とMP4形式の両方に対応しているが、MPEG−DASH形式では、MP4形式を用いることが主流である。 By the way, the file format of video data used for video data distribution is mostly used in the MPEG-2 TS format (ISO / IEC 13818) used in digital terrestrial broadcasting and the file format on a PC. MP4 format (ISO / IEC 14496-15) is available. The HLS format supports only the MPEG-2 TS format as the video data file format, and the MPEG-DASH format supports both the MPEG-2 TS format and the MP4 format. The MPEG-DASH format supports the MP4 format. Is the mainstream.
MPEG−2 TS形式は動画・音声データを固定長のパケットに分割して送受信するための形式であり、もともとメディアをストリーム配信することを想定した方式であるため、例えば、特許文献1、2の技術を適用することで、上述したABR制御やトリックプレイを実現することが可能である。 The MPEG-2 TS format is a format for transmitting and receiving moving image / audio data by dividing it into fixed-length packets, and is originally a method that assumes that media is streamed. By applying the technology, the above-described ABR control and trick play can be realized.
一方、MP4形式は、コンピュータ等へのファイル格納を主眼としたものであり、MP4形式のファイルを用いてMPEG−DASH方式のストリーミングを行う場合には以下で説明するような問題がある。 On the other hand, the MP4 format is mainly intended for file storage in a computer or the like, and there is a problem as described below when MPEG-DASH streaming is performed using an MP4 format file.
図1に示すように、MP4形式では、ファイルの構造として、1つのファイルの中で、音声トラックと映像トラックが完全に分離された構造をとり、更に、それぞれのトラックにおけるヘッダ情報と実データも分離された構造となっている。これは、MP4を細切れに分割してセグメント化した場合も同様である。このファイル構造の場合、次の問題がある。 As shown in FIG. 1, in the MP4 format, as a file structure, an audio track and a video track are completely separated in one file, and header information and actual data in each track are also included. It has a separated structure. The same applies to the case where MP4 is divided into segments and segmented. This file structure has the following problems:
(1)映像音声が分離された構造のため、ファイルの中身にアクセスする際に、映像と音声と2回に分けてアクセスする必要があり、インデックスファイルにランダムアクセスポイントを記述する際、映像データのポイントと、それに同期する映像データのポイントの2つを記述する必要がある。MPEG−2 TS形式の場合、映像データと音声データが交互に配置される構成のため、このような問題は生じない。 (1) Due to the structure in which video and audio are separated, it is necessary to access video and audio twice when accessing the contents of the file. It is necessary to describe two points, i.e., the point of the video data and the point of video data synchronized with the point. In the case of the MPEG-2 TS format, such a problem does not occur because video data and audio data are alternately arranged.
(2)GOP単位にABRをしようとした際には、GOPは一般に0.5秒〜1秒程度で構成されるため、この短い時間内に映像データと音声データの両方のアクセスを、同期して行う上では、サーバ側、クライアント側に高いパフォーマンスが要求されてしまい、幅広い端末やサーバ環境での動作に適さない。 (2) When an ABR is attempted on a GOP basis, the GOP is generally composed of about 0.5 seconds to 1 second. Therefore, access to both video data and audio data is synchronized within this short time. Therefore, high performance is required on the server side and client side, which is not suitable for operation in a wide range of terminals and server environments.
GOP単位の長さでファイル分割しセグメント化を行えば、これらの問題は解決されうるが、冒頭に述べた通り、サーバアクセスが膨大になる問題、ファイル数が増大し、管理が複雑になる問題が発生してしまい、現実的ではない。 These problems can be solved by dividing the file into GOP lengths and segmenting, but as mentioned at the beginning, the problem is that the server access is enormous, the number of files increases, and the management becomes complicated Will occur and is not realistic.
(3)トリックプレイを行う際に用いるIフレームに相当する情報は、通常用いられるコンテナには識別するための情報がなく、映像データファイル中からIフレームのみを抽出し表示するようなトリックプレイ動作の実現が難しい問題がある。一般に、GOP単位でアクセスすることは可能だが、Iフレームのみにアクセスすることは困難である。 (3) The information corresponding to the I frame used when performing trick play does not include information for identifying a normally used container, and the trick play operation is to extract and display only the I frame from the video data file. There are problems that are difficult to realize. In general, it is possible to access in GOP units, but it is difficult to access only I frames.
なお、上記の問題は、MP4のファイル形式を用いてMPEG−DASHによりストリーミング配信を行う場合に限らずに生じ得る問題である。 The above problem is not limited to the case where streaming delivery is performed by MPEG-DASH using the MP4 file format.
本発明は上記の点に鑑みてなされたものであり、インデックス情報に基づき特定の時間位置へのアクセスを容易に行うことを可能とするストリーミングメディアのデータを提供することを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to provide streaming media data that allows easy access to a specific time position based on index information.
本発明の実施の形態によれば、コンピュータにおいて、インデックス情報に基づき特定の時間位置へのアクセスが可能であるストリーミングメディアのデータを生成するメディアデータ生成方法であって、
所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成するステップと、
前記シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成するステップと、を有することを特徴とするメディアデータ生成方法が提供される。
According to an embodiment of the present invention, there is provided a media data generation method for generating streaming media data capable of accessing a specific time position based on index information in a computer,
Acquiring unit data that can be reproduced as content from given content data, and generating single segment data using the data; and
There is provided a method of generating media data, comprising the step of connecting the single segment data and generating a segment file that is a unit of data that can be distributed as streaming media data.
本発明の実施の形態によれば、インデックス情報に基づき特定の時間位置へのアクセスを容易に行うことを可能とするストリーミングメディアのデータを提供することが可能となる。 According to the embodiment of the present invention, it is possible to provide streaming media data that allows easy access to a specific time position based on index information.
以下、図面を参照して本発明の実施の形態を説明する。なお、以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。例えば、本実施の形態ではメディアデータ配信方式としてMPEG DASHを用いることとしているが、本発明を適用可能なメディアデータ配信方式はMPEG DASHに限られるわけではない。 Embodiments of the present invention will be described below with reference to the drawings. The embodiment described below is only an example, and the embodiment to which the present invention is applied is not limited to the following embodiment. For example, in this embodiment, MPEG DASH is used as the media data distribution method, but the media data distribution method to which the present invention can be applied is not limited to MPEG DASH.
本明細書において、ストリーミングによるデータ配信によりユーザ端末(プレイヤ)において再生・出力される映像、音声、文字等を総称して「メディア」と呼び、ストリーミングにより配信されるデータをメディアデータと呼ぶ。また、「ファイル」は「データ」の一形態である。 In this specification, video, audio, characters, and the like that are played back and output by a user terminal (player) by streaming data distribution are collectively referred to as “media”, and data distributed by streaming is referred to as media data. “File” is a form of “data”.
(システム構成)
図2に、本発明の実施の形態に係るシステムの構成図を示す。図2に示すように、本実施の形態に係るシステムは、メディアデータ配信装置200及びユーザ端末300を含む。メディアデータ配信装置200及びユーザ端末300はそれぞれネットワーク400(例:インターネット)に接続されており、相互に通信可能である。
(System configuration)
FIG. 2 shows a configuration diagram of a system according to the embodiment of the present invention. As shown in FIG. 2, the system according to the present embodiment includes a media
また、図2には、メディアデータ生成装置100が示されている。メディアデータ生成装置100は、元となるコンテンツデータからメディアデータを生成し、例えばメディアデータ配信装置200に対して当該メディアデータを提供する装置である。メディアデータ生成装置100はネットワーク400に接続されていてもよいし、ネットワーク400に接続されていない独立の装置であってもよい。また、メディアデータ配信装置200にメディアデータ生成装置100の機能を含めることとしてもよい。
FIG. 2 shows the media
メディアデータ配信装置200は、ユーザ端末300からの要求に基づいて、ユーザ端末300にメディアデータを配信する。ユーザ端末300はメディアデータ配信装置200にメディアデータを要求し、メディアデータ配信装置200からメディアデータを受信し、当該メディアデータの再生を行ってメディアを出力する。
The media
次に、各装置の機能構成を説明する。以下では、構成と機能概要を説明し、詳細な動作例等についてはその後に説明する。 Next, the functional configuration of each device will be described. In the following, an outline of the configuration and functions will be described, and detailed operation examples will be described later.
図3に示すように、メディアデータ生成装置100は、元ファイル入力部101、元ファイル格納部102、元ファイル解析部103、セグメントファイル生成部104、セグメントファイル格納部105、インデックスファイル生成部106、パッケージ生成部107を有する。
As shown in FIG. 3, the media
元ファイル入力部101は、セグメントファイル等を生成する対象となるコンテンツの元ファイルを入力し、当該元ファイルを元ファイル格納部102に格納する。元ファイル解析部103は、元ファイル格納部102に格納された元ファイルのデータを解析し、少なくとも、ビットレートの情報、Iフレームの情報(バイト位置、時間位置等)、GOP単位の情報(バイト位置、時間位置等)等を取得する。解析により得られた情報は、セグメントファイルの生成に利用されるととともに、インデックスファイルの生成を含む配信パッケージの生成にも利用される。
The original
セグメントファイル生成部104は、元ファイル解析部103による解析結果を利用して、後述するように、マルチセグメント形式のセグメントファイル(の集合)を生成し、セグメントファイル格納部105に格納する。また、セグメントファイル格納部105には、元ファイル解析部103での解析結果も格納されている。インデクスファイル生成部106は、当該解析結果を利用して、インデックスファイルを生成する。
The segment
パッケージ生成部107は、MPDファイル、インデックスファイル、セグメントファイル等を含む配信パッケージを生成する。なお、MPD(Media Presentation Description)ファイルとは、ストリーミング配信/再生に必要なメディアデータ等の情報が記載されたメタデータを格納したファイルである。
The
次に、図4を参照してメディアデータ配信装置200の構成例を説明する。図4に示すように、メディアデータ配信装置200は、データ配信制御部201、セグメントファイル格納部202、MPDファイル格納部203を有する。セグメントファイル格納部202にはセグメントファイル(の集合)が格納され、MPDファイル格納部203には、MPDファイル、インデックスファイル等が格納される。データ配信制御部201は、セグメントファイルのデータ及びMPDファイル等のデータをユーザ端末300に配信する。なお、メディアデータ配信装置200は、例えばWWWサーバにより実現される。
Next, a configuration example of the media
次に、図5を参照してユーザ端末300の構成例を説明する。なお、ユーザ端末300を「メディアデータ再生装置」と呼んでもよい。なお、ユーザ端末300は特定の装置に限定されないが、例えばPC、スマートフォン、タブレット等によりユーザ端末300が実現される。
Next, a configuration example of the
図5に示すように、ユーザ端末300は、ユーザインタフェース部301、メディア再生処理部302、MPDファイル格納部303、メディアデータ取得部304を有する。また、メディアデータ取得部304には、メディアデータを一時的に格納するバッファ305が備えられる。
As illustrated in FIG. 5, the
ユーザインタフェース部301は、ユーザによるユーザ端末300に対する操作指示を受け付け、その指示内容を各機能部に通知するとともに、再生されたメディアを表示する機能を含む。ユーザインタフェース部301はディスプレイ(表示部)と一体化した機能部であってもよいし、ディスプレイ(ユーザインタフェース部301の一部)はユーザ端末300に接続される別の装置であってもよい。
The
メディア再生処理部302は、メディアデータ取得部304により取得されたメディアデータの復号を行うことでメディア再生を行い、ユーザインタフェース部301に出力する。MPDファイル格納部303にはMPDファイル(インデックスファイルを含む)が格納される。ユーザ端末300は、MPDファイルをメディアデータ配信装置200から取得してもよいし、他の装置(例:メディアデータ生成装置100)から取得してもよい。
The media
メディアデータ取得部304は、ユーザインタフェース部301からの指示及びMPDファイルのデータに基づいて、再生すべきメディアデータをメディアデータ配信装置200に要求し、当該メディアデータをメディアデータ配信装置200から取得する機能を有する。
Based on the instruction from the
本実施の形態に係るメディアデータ生成装置100、メディアデータ配信装置200、及びユーザ端末300はそれぞれ、例えば、1つ又は複数のコンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。すなわち、各装置が有する機能は、当該コンピュータに内蔵されるCPUやメモリ、ハードディスクなどのハードウェア資源を用いて、当該装置で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
Each of media
また、本実施の形態で説明するマルチセグメント構造のセグメントファイルは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、当該セグメントファイルとインデックスファイルを含むデータ(配信パッケージ等)についても、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。 The segment file having a multi-segment structure described in this embodiment can be recorded on a computer-readable recording medium (portable memory or the like), stored, or distributed. In addition, data including the segment file and the index file (distribution package, etc.) can be recorded on a computer-readable recording medium (portable memory, etc.) and stored or distributed. .
(セグメントファイルの構造例)
図6に、本実施の形態に係るセグメントファイルの構造例を示す。当該セグメントファイルは、メディアデータ生成装置100のセグメントファイル生成部104により生成されるものである。
(Example of segment file structure)
FIG. 6 shows an example of the structure of the segment file according to the present embodiment. The segment file is generated by the segment
図6に示すように、セグメントファイルの集合をパッケージ(後述する配信パッケージの一部)と呼んでおり、パッケージは初期化セグメントファイル(図中のAで示す)と、複数のセグメントファイル(1つをBで示す)を含む。この点は既存のMPEG DASHで規定されている構造と同様である。 As shown in FIG. 6, a set of segment files is called a package (part of a distribution package described later), and the package is an initialization segment file (indicated by A in the figure) and a plurality of segment files (one Is indicated by B). This is the same as the structure defined in the existing MPEG DASH.
本実施の形態では、図6のCに示すように、各セグメントファイルが、複数のシングルセグメントが連結されたマルチセグメント構造を有する。図6のDに示すように、各シングルセグメントは、1つのGOPに初期化データが付された構造である。GOPには、Iフレーム、及びPorBフレームを含む各フレームのデータと、対応する音声データ(Eで示される)が含まれる。当該初期化データは、シングルセグメントを1つのファイルにすると仮定する場合に付加されることが想定される初期化データである。なお、本実施の形態におけるシングルセグメントは実際のファイルではなく、セグメントファイルに格納されたデータである。ユーザ端末300は、当該初期化データを解釈することで、シングルセグメントにおける符号化データを正常にデコードし、表示することができる。
In the present embodiment, as shown in FIG. 6C, each segment file has a multi-segment structure in which a plurality of single segments are connected. As shown in FIG. 6D, each single segment has a structure in which initialization data is attached to one GOP. The GOP includes data of each frame including an I frame and a PorB frame, and corresponding audio data (indicated by E). The initialization data is initialization data assumed to be added when it is assumed that a single segment is one file. The single segment in this embodiment is not an actual file but data stored in a segment file. The
すなわち、マルチセグメント構造は、GOP単位で構成されたセグメント(シングルセグメント構造)を何段にも連結し構造化した構造化セグメントファイル(論理的なファイル)である。マルチセグメント構造では、ファイルの単位としてはあくまでも一般的なセグメントファイルと同様で、数秒〜10秒程度に分割されたファイルとなる。セグメントファイルの内部構造として、GOP単位で更に論理的にセグメントファイル化した構成をとることで、GOP単位でのデータアクセスが可能となる。また、各シングルセグメント中の初期化データ部分に、Iフレームを識別可能なBox情報を付加することで、Iフレームのみを抽出するランダムアクセス・トリックプレイも実現可能となる。 That is, the multi-segment structure is a structured segment file (logical file) in which segments (single segment structure) configured in units of GOPs are connected in a number of stages. In the multi-segment structure, the file unit is the same as that of a general segment file, and the file is divided into several seconds to 10 seconds. By adopting a configuration in which the segment file is further logically segmented in GOP units as the internal structure of the segment file, data access in GOP units becomes possible. Also, by adding Box information that can identify an I frame to the initialization data portion in each single segment, it is possible to realize random access trick play that extracts only the I frame.
当該BOX情報は例えばTrackRunBox(trun)であり、Iフレームの情報として、例えば、圧縮方式、シングルセグメント内のIフレームの位置(バイト位置)、Iフレームの再生時間等を含む。これらの情報により、ユーザ端末300が、適切にIフレームのみをデコード可能となる。
The BOX information is, for example, TrackRunBox (run), and includes, for example, the compression method, the position (byte position) of the I frame in a single segment, the playback time of the I frame, and the like as I frame information. With this information, the
なお、BOX構造は、ISO/IEC 14496−12でISO Base Media File Formatとして国際標準化されている構造である。このように国際標準化されている構造を採用することで、幅広いクライアントでの映像再生が保証される。 The BOX structure is a structure that is internationally standardized as ISO Base Media File Format in ISO / IEC 14496-12. By adopting the internationally standardized structure in this way, video reproduction by a wide range of clients is guaranteed.
なお、図6に示す例は、映像データと音声データを含む例であるが、映像データのみ、もしくは音声データのみを含むこととしてもよい。また、字幕テロップ(テキストデータ)を含んでもよい。 The example shown in FIG. 6 is an example including video data and audio data, but may include only video data or only audio data. Further, it may include a caption telop (text data).
図6に示すような映像と音声を同一ファイル内に含む構成の他、音声と映像(または字幕)を別ファイルとして構成することも可能である。この場合の構成例を図7に示す。図7に示すように、この構成では、映像と音声とで、各シングルセグメントのデュレーション(再生時間)と個数が一致するような構成としている。これにより、映像と音声で別々のインデックスファイルとなった場合でも、映像と音声の同期をとることが可能である。 In addition to a configuration in which video and audio are included in the same file as shown in FIG. 6, it is also possible to configure audio and video (or subtitles) as separate files. A configuration example in this case is shown in FIG. As shown in FIG. 7, in this configuration, the duration (reproduction time) and the number of each single segment are the same for video and audio. As a result, even when the index files are separate for video and audio, it is possible to synchronize the video and audio.
(セグメントファイルの生成手順)
次に、図6に示したような、マルチセグメント構造のセグメントファイルの生成手順を図8を参照して説明する。当該生成手順は図3に示したメディアデータ生成装置100により実行されるものであり、以下では、当該生成手順をメディアデータ生成装置100の動作として説明する。
(Segment file generation procedure)
Next, a procedure for generating a segment file having a multi-segment structure as shown in FIG. 6 will be described with reference to FIG. The generation procedure is executed by the media
メディアデータ生成装置100は、所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成し、当該シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成する。より具体的には以下のとおりである。
The media
元ファイル入力部101からセグメントファイルの集合を生成する対象となる元ファイルが入力される。当該元ファイルは、映像が符号化されたデータのファイルである。当該ファイルに格納されているデータをコンテンツデータと呼んでもよい。元ファイルが元ファイル格納部102に格納されるとともに、元ファイル解析部103に読み込まれる。
An original file that is a target for generating a set of segment files is input from the original
元ファイル解析部103は、入力された元ファイルを解析し、例えば、当該コンテンツデータのビットレートの情報、ファイル中のGOP単位の情報(バイト位置、時間位置、時間長等)、GOP毎の各フレーム(Iフレーム、Pフレーム、Bフレーム)の情報(バイト位置、時間位置、時間長等)等を得る(ステップ101)。
The original
ステップ101での解析結果は、セグメントファイル生成部104に渡されるとともに、セグメントファイル格納部105に格納される。
The analysis result in
次に、セグメントファイル生成部104は、GOP単位のデータ毎に、例えば図6に示した構造でシングルセグメント化を行う(ステップ102)。つまり、図6の例の場合、GOP毎に、初期化データ、各フレームのデータ、及び音声データからなるシングルセグメントを生成する。セグメントファイル生成部104は、既にシングルセグメントがある場合は、今回生成したシングルセグメントを、既に生成したシングルセグメントの最後尾に連結する。
Next, the segment
本例では、セグメント長を予め定めた時間長にするものとし、ステップ103において、連結されたシングルセグメントが、当該セグメント長に達したか否かを判定する。当該セグメント長に達していれば1つのセグメントファイルを出力し、セグメントファイル格納部105に格納する(ステップ103のYes、ステップ104)。セグメント長に達していなければ(ステップ103のNo)、ステップ102のシングルセグメント化・連結を繰り返す。つまり、セグメント長の長さになるまで、シングルセグメント化・連結を繰り返す。
In this example, the segment length is set to a predetermined time length, and in
ステップ104の後、入力ファイルに未処理データが残っていれば(ステップ105のNo)、次のセグメントファイルの生成処理として、ステップ102からの処理を繰り返す。入力ファイルの最後に達したら処理を終了する(ステップ105のYes)。
If unprocessed data remains in the input file after step 104 (No in step 105), the processing from
なお、上記の例では、1シングルセグメントに対応する、コンテンツとして再生可能な単位としてGOP単位を例に挙げているが、これは例に過ぎず、1シングルセグメントに対応する、コンテンツとして再生可能な単位は、複数GOP単位であってもよいし、フレーム単位であってもよい。 In the above example, the GOP unit is given as an example of a unit that can be played back as content corresponding to one single segment, but this is only an example, and playback is possible as content corresponding to one single segment. The unit may be a multiple GOP unit or a frame unit.
(配信パッケージについて)
MPEG DASHで映像配信を行う場合、配信する映像・音声等メディアのファイルそのもの(セグメントファイルの集合)と、インデックス情報が書かれたインデックスファイルと、配信に関するプレゼンテーション情報が書かれたMPD (Media Presentation Description)ファイルの3種類のファイルを用意する。なお、ABRを行う場合は、それぞれビットレートの異なるメディアのファイルを用意する。なお、インデックスファイルは必須ではなく、インデックスファイルがなくてもユーザ端末300においてメディア再生を行うことができる。
(About distribution package)
When performing video distribution using MPEG DASH, the media file itself (segment file set) to be distributed, an index file in which index information is written, and an MPD (Media Presentation Description) in which presentation information about distribution is written. ) Prepare three types of files. When performing ABR, media files having different bit rates are prepared. Note that the index file is not essential, and media playback can be performed on the
これらの3種類のファイルをまとめて配信パッケージと呼ぶこととする。図9に、配信パッケージの例を示す。図9に示す配信パッケージの構造自体は既存のものである。本実施の形態では、各セグメントファイルがマルチマルチセグメント構造になっている点が従来技術と異なるのである。 These three types of files are collectively referred to as a distribution package. FIG. 9 shows an example of a distribution package. The distribution package structure itself shown in FIG. 9 is an existing one. This embodiment is different from the prior art in that each segment file has a multi-multi-segment structure.
MPDファイルは、番組やコンテンツを構成する1つの単位の「Period」、映像・音声・字幕等の情報を記述する「AdaptationSet」、映像・音声のビットレートや解像度等の情報を記述する「Representation」、セグメントファイルをに関する情報を記述する「SegmentInfo」で構成される。 The MPD file is a unit of “Period” constituting a program or content, “AdaptationSet” describing information such as video / audio / subtitles, and “Representation” describing information such as bit rate and resolution of video / audio. And “SegmentInfo” that describes information related to the segment file.
図9に示すように、「period」配下の「AdaptationSet」には、音声と字幕、ビデオの符号化情報が記載されている。また、「Representation」には、音声のビットレートや、映像の解像度とビットレートが記述される。なお、音声のビットレートや、映像のビットレート/解像度等をNW状態等によって切換えるABRを行えるように、それぞれの情報を定義することができる。図9では、「100Mps」と「50Mbps」が示されている。 As shown in FIG. 9, “AdaptationSet” under “period” describes encoding information of audio, subtitles, and video. In “Representation”, the bit rate of audio, the resolution and bit rate of video are described. Each information can be defined so that ABR for switching the bit rate of audio, the bit rate / resolution of video, etc. depending on the NW state or the like can be performed. In FIG. 9, “100 Mbps” and “50 Mbps” are shown.
メディアデータ生成装置100のパッケージ生成部107は、コンテンツデータを解析して得た情報等から、図9に示すような構造を持つ配信パッケージを生成することができる。例えば、配信パッケージ生成は、セグメントファイル生成、インデックスファイル生成に続く処理として実行可能である。すなわち、シングルセグメントのデータを生成する際に、前記コンテンツデータを解析し、当該シングルセグメントの情報を取得し、当該シングルセグメントの情報に基づいてインデックス情報を生成し、当該インデックス情報及び前記セグメントファイルを含む、ストリーミングメディアの配信パッケージを生成する。また、解析結果でビットレート情報を取得することで、ビットレート毎のセグメントファイル、及びビットレート毎のインデックス情報を生成することができる。
The
(インデックスファイルについて)
次に、マルチセグメント構造を用いた場合のインデックスファイルについて説明する。図10にインデックスファイルの構成例を示す。当該インデックスファイルは、図3に示したメディアデータ生成装置100において、セグメントファイル格納部105に格納しておいて元ファイルの解析結果を用いて、インデックスファイル生成部106により生成されるものである。
(About index files)
Next, an index file when the multi-segment structure is used will be described. FIG. 10 shows a configuration example of the index file. The index file is generated by the index
図10に示すように、インデックスファイルは、ファイル先頭から順番に、インデックスファイル自体を表すSegmentType Boxである「styp」(1で示す)、複数のセグメントファイル全体のファイルサイズおよびデュレーション情報を格納するSegment Index Box「sidx」(2で示す)、各セグメントファイルごとに、セグメントファイル中のシングルセグメントのインデックス情報(GOP単位の情報)を格納したSegment Index Box「sidx」(3で示す)、GOP中のIフレームおよびその他のフレームのインデックス情報を格納したSub−Segment Index Box「ssix」(4で示す)で構成される。 As shown in FIG. 10, the index file is “Segment” (indicated by 1) that is a SegmentType Box representing the index file itself, in order from the beginning of the file, and a Segment that stores the file size and duration information of the entire plurality of segment files. Index Box “sidx” (indicated by 2), Segment Index Box “sidx” (indicated by 3) storing index information (information in GOP units) of a single segment in the segment file for each segment file, It is composed of a Sub-Segment Index Box “six” (indicated by 4) that stores index information of the I frame and other frames.
本実施の形態におけるマルチセグメント構造に基づくインデックスファイルを生成する場合、インデックスファイル生成部106は、各セグメントファイル(=マルチセグメント構造)のインデックス情報を2で示す「sidx」に格納し、マルチセグメント構造中の各シングルセグメントへのポインタ(インデックス情報)を3で示す「sidx」に格納する。また、GOP中のIフレームの情報として、シングルセグメントにおける初期化データ中のtrun boxに記載した当該Iフレーム情報へのポインタ(インデックス情報)を4で示す「ssix」に格納する。
When generating an index file based on the multi-segment structure in the present embodiment, the index
例えば、シングルセグメントのインデックス情報には、当該シングルセグメントのセグメントファイル内の時間位置とデータ位置を含む。「時間位置」とは、例えば、当該シングルセグメントの中のGOPのメディアが始まる時間(時刻)と、当該GOPの再生時間長とからなるものである。これは開始時間及び終了時間からなるものでもよい。また、「データ位置」は、例えば、当該シングルセグメント(及び/又はGOP)の先頭のバイト位置と、当該シングルセグメント(及び/又はGOP)のバイト長(サイズ)からなる。また、開始バイト位置及び終了バイト位置からなるものでもよい。各フレームのインデックス情報も同様である。 For example, single segment index information includes a time position and a data position in the segment file of the single segment. The “time position” includes, for example, a time (time) when a GOP medium in the single segment starts and a reproduction time length of the GOP. This may consist of a start time and an end time. The “data position” includes, for example, the first byte position of the single segment (and / or GOP) and the byte length (size) of the single segment (and / or GOP). It may also consist of a start byte position and an end byte position. The same applies to the index information of each frame.
特にIフレームに関しては、インデックス情報として、例えば、セグメントファイル中での当該Iフレームのバイト位置(1つ手前のIフレームからの相対位置)、当該Iフレームを表示する時刻情報(コンテナに記載のタイムスタンプ)、当該Iフレームを含むGOPのサイズ、GOPの表示時間等の情報を含む。 In particular, regarding I frames, as index information, for example, the byte position of the I frame in the segment file (relative position from the previous I frame), time information for displaying the I frame (time described in the container) Stamp), the size of the GOP including the I frame, and the GOP display time.
上記のようなバイト位置情報等をインデックス情報として有することで、ユーザ端末300は、セグメントファイルのURLとそのデータ範囲を指定することで、HTTP GETリクエストにより、セグメントファイル中の任意の位置のGOP(あるいは任意のIフレーム)のデータを取得して、再生することができる。
By having the byte position information as described above as index information, the
例えば、ユーザ端末300は、インデックス情報をメディアデータ再生装置200から取得し、所望のコンテンツに対応するセグメントファイルを逐一取得し、当該インデックス情報に含まれる、少なくともシングルセグメントの情報を参照して、前記取得したセグメントファイル中の任意の時間位置からメディアデータを再生することができる。
For example, the
また、配信パッケージに異なるビットレートのセグメントファイルが含まれる場合において、取得したセグメントファイル中の任意の時間位置からビットレートを切り替えることも可能である。 In addition, when segment files having different bit rates are included in the distribution package, the bit rate can be switched from an arbitrary time position in the acquired segment file.
(トリックプレイの例)
次に、上述したようなマルチセグメント構造を採用した場合におけるトリックプレイの手順の例を説明する。この動作は、図4、図5に示したメディアデータ配信装置200及びユーザ端末300により実行される。
(Trick play example)
Next, an example of a trick play procedure when the multi-segment structure as described above is employed will be described. This operation is executed by the media
以下の各処理手順例の前提として、ユーザ端末300は、MPDファイル、インデックスファイルを例えばメディアデータ配信装置200から取得し、MPDファイル格納部303に格納し、MPDファイル等の情報に従って順次セグメントファイルを取得することにより所望のメディアを再生しているものとする。
As a premise of each of the following processing procedure examples, the
まず、トリックプレイにおける処理手順例1を図11を参照して説明する。ステップ201において、ユーザ端末300のユーザインタフェース部301を介してユーザから早送りまたは巻き戻し操作が要求される。ここでは、N倍速再生(早送りまたは巻き戻し)とする。
First, processing procedure example 1 in trick play will be described with reference to FIG. In
メディア取得部304は、インデックスファイルを参照することにより、操作を行った時点の再生位置でのセグメントファイルを特定するとともに、セグメントファイル中のIフレームを特定し、対象となるセグメントファイルから、IフレームのみをN枚毎(N−1毎のIフレームを飛ばす)にメディアデータ配信装置200から取得する(ステップ202)。なお、Iフレームのみを取得する際に、当該Iフレームが属するシングルセグメントの初期化データも取得される。当該初期化データが存在することで、メディア再生処理部302は正常にIフレームをデコード(再生)することができる。
The
メディアデータ取得部304により取得されたIフレームは、メディア再生処理部302により再生され、メディア再生処理部302は当該Iフレームの画像をユーザインタフェース部301を介してGOP時間だけ表示する(ステップ203)。当該GOP時間は上記初期化データに含まれる。あるいは、インデックスファイルが当該GOP時間を含み、インデックスファイルを参照することでGOP時間だけ表示することとししてもよい。
The I frame acquired by the media
なお、ストリームによっては、シーンチェンジ対策などでGOP長(時間)が一定でない特異例もありうるが、この場合は、再生中の標準のGOP時間に表示時間を調整して表示することとする。 Depending on the stream, there may be a peculiar example in which the GOP length (time) is not constant due to scene change countermeasures, but in this case, the display time is adjusted to the standard GOP time during playback.
以降、メディアコンテンツの終端および先頭に達するか、ユーザ操作により通常再生状態に切り替わるまで(図11ではこれらを終了トリガと呼ぶ)、Iフレームのダウンロード、再生を繰り返す(ステップ204)。 Thereafter, I frame download and playback are repeated (step 204) until the end and top of the media content are reached or the normal playback state is switched by the user operation (in FIG. 11, these are called end triggers).
次に、トリックプレイ(ジャンプ)における処理手順例2を図12を参照して説明する。ステップ301のおいて、ユーザインタフェース部301に表示されるシークバー等を用いてユーザからジャンプの操作がなされる。
Next, a processing procedure example 2 in trick play (jump) will be described with reference to FIG. In
メディアデータ取得部304は、操作内容(ジャンプ先のシークバーの位置)に基づいて、ジャンプ先となる再生位置(時間情報)を割り出し、更に、インデックスファイルを参照し、該当する再生位置に相当するセグメントファイル及びセグメントファイル内のGOP位置(バイト位置)を特定する(ステップ302)。
The media
メディアデータ取得部304は、ステップ302で特定したバイト位置から、セグメントファイルのデータをメディアデータ再生装置200から取得し、再生する(ステップ303)。
The media
すなわち、ジャンプを行う際には、ジャンプ先となる再生位置に対応する、インデックス情報に含まれる映像データのGOPの開始位置を参照して、当該GOPが含まれるセグメントファイル中の当該GOPのデータから順に連続して再生する。 That is, when a jump is performed, the start position of the GOP of the video data included in the index information corresponding to the playback position that is the jump destination is referred to, and the GOP data in the segment file that includes the GOP is used. Play sequentially.
(実施の形態のまとめ)
以上、説明したように、本実施の形態によれば、コンピュータにおいて、インデックス情報に基づき特定の時間位置へのアクセスが可能であるストリーミングメディアのデータを生成するメディアデータ生成方法であって、所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成するステップと、前記シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成するステップと、を有することを特徴とするメディアデータ生成方法が提供される。
(Summary of embodiment)
As described above, according to the present embodiment, there is provided a media data generation method for generating streaming media data capable of accessing a specific time position based on index information in a computer. A unit of data that can be played back as content, and generating single segment data using the data, and linking the single segment data and distributing it as streaming media data Generating a segment file, which is a possible unit of data, is provided.
前記シングルセグメントのデータは、例えばGOPのデータを含む。また、前記シングルセグメントのデータは、映像データ、音声データ、テキストデータのうちのいずれか1つ又は複数を含む。前記セグメントファイルは、例えば、MPEG‐DASH(Dynamic Adaptive Streaming over HTTP)のセグメント長を有する。 The single segment data includes, for example, GOP data. The single segment data includes one or more of video data, audio data, and text data. The segment file has a segment length of, for example, MPEG-DASH (Dynamic Adaptive Streaming over HTTP).
前記メディアデータ生成方法は、前記シングルセグメントのデータを生成する際に、前記コンテンツデータを解析し、当該シングルセグメントの情報を取得し、当該シングルセグメントの情報に基づいてインデックス情報を生成するステップと、前記インデックス情報及び前記セグメントファイルを含む、ストリーミングメディアの配信パッケージを生成するステップと、を更に有することとしてもよい。 The media data generation method, when generating the data of the single segment, analyzing the content data, obtaining information of the single segment, and generating index information based on the information of the single segment; And generating a streaming media distribution package including the index information and the segment file.
また、前記シングルセグメントのデータを生成する際に取得された映像データのIフレームの情報に基づいて、前記インデックス情報を生成することとしてもよい。また、前記シングルセグメントのデータを生成する際に取得された映像データのビットレートの情報に基づいて、インデックス情報を生成することとしてもよい。 Further, the index information may be generated based on the information of the I frame of the video data acquired when the single segment data is generated. The index information may be generated based on the bit rate information of the video data acquired when the single segment data is generated.
また、本実施の形態により、コンピュータにおいて、前記メディアデータ生成方法により生成された前記セグメントファイルを含むストリーミングメディアのデータを再生する方法であって、前記インデックス情報を取得するステップと、前記セグメントファイルを逐一取得するステップと、当該インデックス情報に含まれる、少なくともシングルセグメントの情報を参照して、前記セグメントファイル中の任意の時間位置からメディアデータを取得し、再生するステップと、を有することを特徴とするメディアデータ再生方法が提供される。 Further, according to the present embodiment, in a computer, a method of reproducing streaming media data including the segment file generated by the media data generation method, the step of obtaining the index information, and the segment file Each of which includes acquiring the media data from an arbitrary time position in the segment file with reference to at least single segment information included in the index information, and reproducing the media data. A media data playback method is provided.
前記メディアデータ再生方法において、前記配信パッケージに異なるビットレートのセグメントファイルが含まれる場合において、前記取得したセグメントファイル中の任意の時間位置からビットレートを切り替えることとしてもよい。 In the media data reproduction method, when the distribution package includes segment files having different bit rates, the bit rate may be switched from an arbitrary time position in the acquired segment file.
また、早送り又は巻き戻しの指示を受信した場合に、前記インデックス情報に含まれるIフレームの情報を参照して、セグメントファイルの中からIフレームのみを取得して再生する処理を連続的に実行することとしてもよい。また、ジャンプの指示を受信した場合に、ジャンプ先となる再生位置に対応する、前記インデックス情報に含まれる映像データのGOPの開始位置を参照して、当該GOPが含まれるセグメントファイル中の当該GOPのデータから順に連続して再生することとしてもよい。 In addition, when a fast forward or rewind instruction is received, the process of acquiring and reproducing only the I frame from the segment file is continuously executed with reference to the I frame information included in the index information. It is good as well. Further, when a jump instruction is received, the GOP in the segment file including the GOP is referred to by referring to the start position of the GOP of the video data included in the index information corresponding to the playback position as the jump destination. It is good also as reproducing | regenerating continuously in order from this data.
また、本実施の形態により、インデックス情報に基づき特定の時間位置へのアクセスが可能であるストリーミングメディアのデータを生成するメディアデータ生成装置であって、所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成する手段と、前記シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成する手段と、を有することを特徴とするメディアデータ生成装置が提供される。 In addition, according to the present embodiment, a media data generation apparatus that generates streaming media data that can be accessed at a specific time position based on index information, and plays back as content from given content data A unit that obtains data in a possible unit and generates single segment data using the data, and a segment file that is a unit data that can be distributed as streaming media data by linking the single segment data. And a means for generating. A media data generating apparatus is provided.
前記メディアデータ生成装置は、前記シングルセグメントのデータを生成する際に、前記コンテンツデータを解析し、当該シングルセグメントの情報を取得し、当該シングルセグメントの情報に基づいてインデックス情報を生成する手段と、前記インデックス情報及び前記セグメントファイルを含む、ストリーミングメディアの配信パッケージを生成する手段と、を更に有することとしてもよい。 The media data generation device, when generating the data of the single segment, analyzing the content data, obtaining the information of the single segment, and generating index information based on the information of the single segment; It is good also as a means to produce | generate the delivery package of streaming media containing the said index information and the said segment file.
また、本実施の形態により、前記メディアデータ生成方法により生成された前記セグメントファイルを含むストリーミングメディアのデータを再生するメディアデータ再生装置であって、前記インデックス情報を取得する手段と、前記セグメントファイルを逐一取得する手段と、当該インデックス情報に含まれる、少なくともシングルセグメントの情報を参照して、前記セグメントファイル中の任意の時間位置からメディアデータを取得し、再生する手段と、を有することを特徴とするメディアデータ再生装置が提供される。 Further, according to the present embodiment, there is provided a media data playback apparatus for playing back streaming media data including the segment file generated by the media data generation method, the means for acquiring the index information, and the segment file Means for acquiring each one, and means for acquiring and reproducing media data from an arbitrary time position in the segment file with reference to at least single segment information included in the index information, A media data playback device is provided.
また、本発明の実施の形態により、インデックス情報に基づき特定の時間位置へのアクセスが可能であるストリーミングメディアのデータを格納するコンピュータ読み取り可能な記録媒体であって、所与のコンテンツデータの中から取得された、コンテンツとして再生可能な単位のデータを含むシングルセグメントのデータを連結したデータ構造を有する、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを格納したことを特徴とするコンピュータ読み取り可能な記録媒体が提供される。当該コンピュータ読み取り可能な記録媒体は、前記コンテンツデータを解析することにより取得された前記シングルセグメントの情報に基づいて生成されたインデックス情報を更に格納することとしてもよい。 According to an embodiment of the present invention, there is also provided a computer-readable recording medium for storing streaming media data that can be accessed at a specific time position based on index information. A computer storing a segment file, which is a unit of data that can be distributed as streaming media data, having a data structure in which data of a single segment including data of a unit that can be reproduced as content is connected. A readable recording medium is provided. The computer-readable recording medium may further store index information generated based on the single segment information acquired by analyzing the content data.
(実施の形態の効果)
本実施の形態で説明したように、配信映像データのファイルとしてマルチセグメント構造を採用することによって、クライアントプレイヤ(例:ユーザ端末300)は、サーバアクセスへの負荷とABRの切り替えメリットを勘案しながら、GOP単位でデータアクセスをしてもよいし、通常と同様にセグメントファイル単位、もしくはその中間のデータ単位でデータアクセスを行うことが可能となる。インデックスファイルを用いたGOP単位での高速ABRに対応しているプレイヤは、GOP単位でのABRを実現可能であるし、インデックスファイルを用いたGOP単位での高速ABRに対応していないプレイヤは、通常のセグメントファイル毎のデータ取得で映像再生をすれば良い。
(Effect of embodiment)
As described in the present embodiment, by adopting a multi-segment structure as a file of distribution video data, a client player (eg, user terminal 300) takes into account the load on server access and the merit of switching ABR. Data access may be performed in units of GOPs, and data access may be performed in units of segment files or data units in the middle as usual. A player that supports high-speed ABR in GOP units using an index file can realize ABR in GOP units, and a player that does not support high-speed ABR in GOP units using an index file What is necessary is just to reproduce | regenerate video by data acquisition for every normal segment file.
また、GOP単位の情報をインデックスファイル中に書き込んでおけば、映像データファイルは必ずしもセグメント化されている必要はなく、1つの映像データファイルと、1つのインデックスファイル、プレイリストのみでの映像データ配信の運用も可能である。 Also, if information in units of GOP is written in the index file, the video data file does not necessarily have to be segmented, and the video data is distributed only with one video data file, one index file, and a playlist. Is also possible.
また、GOP単位で映像データファイルが論理的に独立に構成されていることから、映像データファイル中のタイムスタンプ情報(MPEG−2 TS形式ではPTS、MP4形式ではCTS/DTS)を用いることで、映像データからのダイジェスト映像生成(カット編集)をGOP単位で行うことも可能となる。また、カット編集情報を、インデックスファイルに記載することで、元の映像データファイルには手を加えず、ダイジェスト映像プレイリストを作成することが容易に可能となる(かつ、MPEG−DASHでの配信が可能)。このダイジェスト映像プレイリストは、映像のカット点(in点−out点)の情報のみを記載したものであるため、多くのユーザがダイジェスト映像を生成するようなケースにおいても、映像データファイルが増えることにはならないため、サーバリソースの節約が可能となる。 In addition, since the video data file is configured logically independently in GOP units, by using the time stamp information (PTS in the MPEG-2 TS format, CTS / DTS in the MP4 format) in the video data file, Digest video generation (cut editing) from video data can also be performed in GOP units. In addition, by describing the cut editing information in the index file, it is possible to easily create a digest video playlist without changing the original video data file (and distribution by MPEG-DASH). Can). Since this digest video playlist describes only the information of video cut points (in point-out point), video data files increase even in the case where many users generate digest video. Therefore, server resources can be saved.
また、映像のGOP単位でのアクセスが可能であることから、例えばCMが配信されている最中は、プレイヤ側でCMをスキップするユーザ操作を禁止にするような制御も容易に可能となる。また、CMコンテンツの差し替え処理も容易に実現可能となる。 In addition, since video can be accessed in GOP units, for example, while a CM is being distributed, control that prohibits a user operation to skip the CM on the player side can be easily performed. Also, CM content replacement processing can be easily realized.
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.
100 メディアデータ生成装置
200 メディアデータ配信装置
300 ユーザ端末
400 ネットワーク
101 元ファイル入力部
102 元ファイル格納部
103 元ファイル解析部
104 セグメントファイル生成部
105 セグメントファイル格納部
106 インデックスファイル生成部
107 パッケージ生成部
201 データ配信制御部
202 セグメントファイル格納部
203 MPDファイル格納部
301 ユーザインタフェース部
302 メディア再生処理部
303 MPDファイル格納部
304 メディアデータ取得部
305 バッファ
100 Media
Claims (18)
所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成するステップと、
前記シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成するステップと、
を有することを特徴とするメディアデータ生成方法。 In a computer, a media data generation method for generating streaming media data capable of accessing a specific time position based on index information,
Acquiring unit data that can be reproduced as content from given content data, and generating single segment data using the data; and
Concatenating the single segment data to generate a segment file that is a unit of data that can be distributed as streaming media data;
A media data generation method characterized by comprising:
ことを特徴とする請求項1又は2に記載のメディアデータ生成方法。 The media data generation method according to claim 1 or 2, wherein the single segment data includes one or more of video data, audio data, and text data.
ことを特徴とする請求項1ないし3のうちいずれか1項に記載のメディアデータ生成方法。 The media data generation method according to any one of claims 1 to 3, wherein the segment file has a segment length of MPEG-DASH (Dynamic Adaptive Streaming over HTTP).
前記インデックス情報及び前記セグメントファイルを含む、ストリーミングメディアの配信パッケージを生成するステップと、
を更に有することを特徴とする請求項1ないし4のうちいずれか1項に記載のメディアデータ生成方法。 When generating the data of the single segment, analyzing the content data, obtaining information of the single segment, and generating index information based on the information of the single segment;
Generating a streaming media distribution package including the index information and the segment file;
5. The media data generation method according to claim 1, further comprising:
ことを特徴とする請求項5に記載のメディアデータ生成方法。 The media data generation method according to claim 5, wherein the index information is generated based on information of an I frame of video data acquired when generating the single segment data.
ことを特徴とする請求項5又は6に記載のメディアデータ生成方法。 The media data generation method according to claim 5 or 6, wherein the index information is generated based on bit rate information of the video data acquired when generating the single segment data.
前記インデックス情報を取得するステップと、
前記セグメントファイルを逐一取得するステップと、
当該インデックス情報に含まれる、少なくともシングルセグメントの情報を参照して、前記セグメントファイル中の任意の時間位置からメディアデータを取得し、再生するステップと、
を有することを特徴とするメディアデータ再生方法。 A method for reproducing streaming media data including the segment file generated by the media data generation method according to any one of claims 5 to 7 in a computer,
Obtaining the index information;
Obtaining the segment file step by step;
Obtaining media data from an arbitrary time position in the segment file with reference to at least single segment information included in the index information, and playing back the media data; and
A media data playback method comprising:
ことを特徴とする請求項8に記載のメディアデータ再生方法。 The media data playback method according to claim 8, wherein when the distribution package includes segment files having different bit rates, the bit rate is switched from an arbitrary time position in the acquired segment file.
ことを特徴とする請求項8又は9に記載のメディアデータ再生方法。 When a fast forward or rewind instruction is received, the process of acquiring and reproducing only the I frame from the segment file is continuously executed with reference to the information of the I frame included in the index information. 10. The media data reproduction method according to claim 8 or 9, characterized in that:
ことを特徴とする請求項8ないし10のうちいずれか1項に記載のメディアデータ再生方法。 When a jump instruction is received, the GOP data in the segment file including the GOP is referenced with reference to the start position of the GOP of the video data included in the index information corresponding to the playback position as the jump destination. The media data playback method according to any one of claims 8 to 10, wherein the media data is played back continuously in order.
所与のコンテンツデータの中から、コンテンツとして再生可能な単位のデータを取得し、当該データを用いて、シングルセグメントのデータを生成する手段と、
前記シングルセグメントのデータを連結し、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイルを生成する手段と、
を有することを特徴とするメディアデータ生成装置。 A media data generation device that generates data of streaming media that can access a specific time position based on index information,
Means for acquiring unit data that can be reproduced as content from given content data, and generating single segment data using the data;
Means for concatenating the single segment data and generating a segment file which is a unit of data that can be distributed as streaming media data;
A media data generation apparatus comprising:
前記インデックス情報及び前記セグメントファイルを含む、ストリーミングメディアの配信パッケージを生成する手段と、
を更に有することを特徴とする請求項12に記載のメディアデータ生成装置。 Means for analyzing the content data, obtaining the information of the single segment, and generating index information based on the information of the single segment, when generating the data of the single segment;
Means for generating a distribution package of streaming media including the index information and the segment file;
The media data generation device according to claim 12, further comprising:
前記インデックス情報を取得する手段と、
前記セグメントファイルを逐一取得する手段と、
当該インデックス情報に含まれる、少なくともシングルセグメントの情報を参照して、前記セグメントファイル中の任意の時間位置からメディアデータを取得し、再生する手段と、
を有することを特徴とするメディアデータ再生装置。 A media data playback device for playing back streaming media data including the segment file generated by the media data generation method according to any one of claims 5 to 7,
Means for obtaining the index information;
Means for acquiring the segment files one by one;
Means for acquiring and reproducing media data from an arbitrary time position in the segment file with reference to at least information of a single segment included in the index information;
A media data reproducing apparatus comprising:
所与のコンテンツデータの中から取得された、コンテンツとして再生可能な単位のデータを含むシングルセグメントのデータを連結したデータ構造を有する、ストリーミングメディアのデータとして配信可能な単位のデータであるセグメントファイル
を格納したことを特徴とするコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium for storing streaming media data capable of accessing a specific time position based on index information,
A segment file, which is a unit data that can be distributed as streaming media data, has a data structure obtained by concatenating single segment data including unit data that can be reproduced as content, obtained from given content data. A computer-readable recording medium characterized by being stored.
を更に格納することを特徴とする請求項17に記載のコンピュータ読み取り可能な記録媒体。 The computer-readable recording medium according to claim 17, further comprising: index information generated based on the information of the single segment acquired by analyzing the content data.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014201832A JP2016072858A (en) | 2014-09-30 | 2014-09-30 | Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014201832A JP2016072858A (en) | 2014-09-30 | 2014-09-30 | Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2016072858A true JP2016072858A (en) | 2016-05-09 |
Family
ID=55867447
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014201832A Pending JP2016072858A (en) | 2014-09-30 | 2014-09-30 | Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2016072858A (en) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017186493A (en) * | 2016-05-06 | 2017-10-12 | 株式会社Dnpファインケミカル | Ink composition for inkjet recording, ink set for inkjet recording, ink cartridge, and method for manufacturing printed matter |
| JP2019522919A (en) * | 2016-05-24 | 2019-08-15 | ディビックス, エルエルシー | System and method for providing variable speed in trick play mode |
| US20190295477A1 (en) * | 2018-03-23 | 2019-09-26 | Canon Kabushiki Kaisha | Display apparatus, control method of display apparatus, and non-transitory computer-readable medium |
| JP2020150321A (en) * | 2019-03-11 | 2020-09-17 | キヤノン株式会社 | Video distribution device, video distribution method and program |
| CN117278811A (en) * | 2022-06-14 | 2023-12-22 | 中兴通讯股份有限公司 | Video playback method, terminal device, server, storage medium and program product |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013505680A (en) * | 2009-09-22 | 2013-02-14 | クゥアルコム・インコーポレイテッド | Enhanced block-request streaming system using signaling or block generation |
| JP2013535865A (en) * | 2010-06-29 | 2013-09-12 | クゥアルコム・インコーポレイテッド | Signaling a random access point for streaming video data |
| WO2014022234A1 (en) * | 2012-07-29 | 2014-02-06 | Qualcomm Incorporated | Replacing lost media data for network streaming |
| WO2015008686A1 (en) * | 2013-07-19 | 2015-01-22 | ソニー株式会社 | File generation device and method, and content reproduction device and method |
-
2014
- 2014-09-30 JP JP2014201832A patent/JP2016072858A/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013505680A (en) * | 2009-09-22 | 2013-02-14 | クゥアルコム・インコーポレイテッド | Enhanced block-request streaming system using signaling or block generation |
| JP2013535865A (en) * | 2010-06-29 | 2013-09-12 | クゥアルコム・インコーポレイテッド | Signaling a random access point for streaming video data |
| WO2014022234A1 (en) * | 2012-07-29 | 2014-02-06 | Qualcomm Incorporated | Replacing lost media data for network streaming |
| WO2015008686A1 (en) * | 2013-07-19 | 2015-01-22 | ソニー株式会社 | File generation device and method, and content reproduction device and method |
Non-Patent Citations (3)
| Title |
|---|
| "Liaison response on MPEG-DASH[online], ISO/IEC DTR 23009-3 Information technology - Dynamic adaptive", 3GPP TSG-SA WG4#76 S4-131278, JPN6018014537, 8 November 2013 (2013-11-08), pages 4 - 29, ISSN: 0003894333 * |
| "Liaison response on MPEG-DASH[online], ISO/IEC FDIS 23009-1:2013(E) Information technology - Dynamic", 3GPP TSG-SA WG4#76 S4-131278, JPN6018014538, 8 November 2013 (2013-11-08), pages 80 - 91, ISSN: 0003894334 * |
| 平林 光浩 MITSUHIRO HIRABAYASHI: "次世代動画配信技術「MPEG−DASH」技術概要と標準化・関連技術動向", 映像情報メディア学会誌 第67巻 第2号 THE JOURNAL OF THE INSTITUTE OF IMAGE INFORMATION AND TELE, vol. 第67巻, JPN6018014535, 1 February 2013 (2013-02-01), JP, pages 109 - 115, ISSN: 0003783532 * |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017186493A (en) * | 2016-05-06 | 2017-10-12 | 株式会社Dnpファインケミカル | Ink composition for inkjet recording, ink set for inkjet recording, ink cartridge, and method for manufacturing printed matter |
| JP2019522919A (en) * | 2016-05-24 | 2019-08-15 | ディビックス, エルエルシー | System and method for providing variable speed in trick play mode |
| JP2020156115A (en) * | 2016-05-24 | 2020-09-24 | ディビックス, エルエルシー | System and method for providing variable speed in trick-play mode |
| US10904594B2 (en) | 2016-05-24 | 2021-01-26 | Divx, Llc | Systems and methods for providing variable speeds in a trick-play mode |
| JP7096292B2 (en) | 2016-05-24 | 2022-07-05 | ディビックス, エルエルシー | Systems and methods for providing variable speed in trick play mode |
| US11895348B2 (en) | 2016-05-24 | 2024-02-06 | Divx, Llc | Systems and methods for providing variable speeds in a trick-play mode |
| US12356029B2 (en) | 2016-05-24 | 2025-07-08 | Divx, Llc | Systems and methods for providing variable speeds in a trick-play mode |
| US20190295477A1 (en) * | 2018-03-23 | 2019-09-26 | Canon Kabushiki Kaisha | Display apparatus, control method of display apparatus, and non-transitory computer-readable medium |
| JP2020150321A (en) * | 2019-03-11 | 2020-09-17 | キヤノン株式会社 | Video distribution device, video distribution method and program |
| JP7327953B2 (en) | 2019-03-11 | 2023-08-16 | キヤノン株式会社 | Video distribution device, video distribution method and program |
| CN117278811A (en) * | 2022-06-14 | 2023-12-22 | 中兴通讯股份有限公司 | Video playback method, terminal device, server, storage medium and program product |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101868281B1 (en) | Information processing apparatus, information processing method, and computer-readable recording medium | |
| JP4270379B2 (en) | Efficient transmission and reproduction of digital information | |
| CN101960844B (en) | Systems and methods for encoding application enhancement tracks for inclusion in media files | |
| EP1239674B1 (en) | Recording broadcast data | |
| JP7439762B2 (en) | Information processing device, information processing method, and program | |
| CN103974147A (en) | MPEG (moving picture experts group)-DASH protocol based online video playing control system with code rate switch control and static abstract technology | |
| CN103024603B (en) | A kind of for solving playing network video time the device and method that pauses in short-term | |
| CN105409235B (en) | File creating apparatus and method and content reproduction apparatus and method | |
| JP4598627B2 (en) | Content editing apparatus and playback apparatus thereof | |
| JP2007012112A (en) | Data recording apparatus and method, program, and recording medium | |
| JP2016072858A (en) | Media data generation method, media data reproduction method, media data generation device, media data reproduction device, computer readable recording medium and program | |
| EP3441971A1 (en) | Multi-language buffering during media playback | |
| JP7287454B2 (en) | Information processing device, reproduction processing device, information processing method, and reproduction processing method | |
| KR20090017027A (en) | Method for generating media object based metadata, playback method and apparatus therefor | |
| WO2021065605A1 (en) | Information processing device and information processing method | |
| KR20140007893A (en) | A method for optimizing a video stream | |
| KR100744594B1 (en) | Content reproduce system, reproduce device, reproduce method, and distribution server | |
| CN119946327A (en) | Video playback method, device, computer equipment and storage medium | |
| CN105122821A (en) | Server device, content providing method, and computer program | |
| JP2015510727A (en) | Method and system for providing file data for media files | |
| KR102659489B1 (en) | Information processing devices, information processing devices and programs | |
| WO2018139283A1 (en) | Image processing device, method and program | |
| US20240086451A1 (en) | Information processing apparatus, reception apparatus, information processing method, and storage medium | |
| US20150088943A1 (en) | Media-Aware File System and Method | |
| CN119402708A (en) | Video file transmission method, device, equipment and readable storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170209 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180424 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180622 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20181009 |