[go: up one dir, main page]

JP2008160755A - Movie recording / playback device - Google Patents

Movie recording / playback device Download PDF

Info

Publication number
JP2008160755A
JP2008160755A JP2006350315A JP2006350315A JP2008160755A JP 2008160755 A JP2008160755 A JP 2008160755A JP 2006350315 A JP2006350315 A JP 2006350315A JP 2006350315 A JP2006350315 A JP 2006350315A JP 2008160755 A JP2008160755 A JP 2008160755A
Authority
JP
Japan
Prior art keywords
voice
character
recording
moving image
conversion device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006350315A
Other languages
Japanese (ja)
Inventor
Manabu Sakakibara
学 榊原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006350315A priority Critical patent/JP2008160755A/en
Publication of JP2008160755A publication Critical patent/JP2008160755A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】
アフレコの入力音声の文字を適切な表示位置に配置する。
【解決手段】
音声方向検出装置41は、マイク34〜40の出力から音声の到来方向を検出する。モニタ方向検出装置26はLCDモニタ24の向く方向を検出する。システム制御回路30は、音声文字のアフレコ時には、モニタ方向検出装置26の検出結果を参照して、音声方向検出装置41の検出結果を、モニタ方向を考慮した音声方向に修正する。文字変換装置46は、入力音声を文字認識して、文字コードに変換する。文字変換装置46による文字コードは、文字表示装置52と関連情報付加装置48に印加される。文字表示装置52は、文字変換装置52からの文字コードに従う文章を示す画像信号を生成し、システム制御回路30からの音声方向に応じた画面位置に重畳されることになるタイミングで、その画像信号を混合器22に出力する。
【選択図】 図1
【Task】
The characters of the post-recording input speech are placed at an appropriate display position.
[Solution]
The voice direction detection device 41 detects the voice arrival direction from the outputs of the microphones 34 to 40. The monitor direction detection device 26 detects the direction in which the LCD monitor 24 faces. The system control circuit 30 refers to the detection result of the monitor direction detection device 26 during the post-recording of the voice characters, and corrects the detection result of the voice direction detection device 41 to the voice direction considering the monitor direction. The character conversion device 46 recognizes the input speech and converts it into a character code. The character code by the character conversion device 46 is applied to the character display device 52 and the related information adding device 48. The character display device 52 generates an image signal indicating a sentence according to the character code from the character conversion device 52, and the image signal at a timing at which the image signal is superimposed on the screen position corresponding to the voice direction from the system control circuit 30. Is output to the mixer 22.
[Selection] Figure 1

Description

本発明は、動画記録再生装置に関する。   The present invention relates to a moving image recording / playback apparatus.

液晶表示モニタ(LCDモニタ)で撮影中の被写体画像を撮影者が確認しながら撮影可能なビデオカメラが、商品化されている。ビデオカメラにはマイクロフォンが内蔵され、映像と音声をリアルタイムに記録することが可能である。   Video cameras that can be photographed while a photographer confirms a subject image being photographed on a liquid crystal display monitor (LCD monitor) have been commercialized. A video camera has a built-in microphone and can record video and audio in real time.

LCDモニタは、2軸の回転機構を介して筐体に取り付けられており、種々の撮影方向に対して、LCDモニタを撮影者の方向に向けることができるようになっている。これにより、撮影中の画像をリアルタイムに確認可能できる。   The LCD monitor is attached to the housing via a biaxial rotation mechanism so that the LCD monitor can be directed toward the photographer with respect to various shooting directions. Thereby, it is possible to check an image being shot in real time.

また、LCDモニタは、撮影後の記録動画像を再生する再生モニタとしても使用される。鑑賞者の方向に表示画面を向けて動画像を再生することで、ユーザは記録動画像を鑑賞できる。   The LCD monitor is also used as a reproduction monitor for reproducing a recorded moving image after photographing. The user can appreciate the recorded moving image by reproducing the moving image with the display screen directed toward the viewer.

ところで、近年、音声認識技術の発達により、デジタルカメラ等の静止画記録装置として、入力音声を音声認識して文字変換し、液晶ディスプレイに画像と文字を重畳表示し、撮影時の印象や事実を画像と共に文字情報として記録及び出力可能な音声認識機能付きの撮像装置が提案されている(例えば、特許文献1参照)。また、音声の到来方向(音声方向)を検出し、音声方向に応じた表示位置に文字を重畳表示することが提案されている。
特開平11−055614号公報
By the way, in recent years, with the development of voice recognition technology, as a still image recording device such as a digital camera, the input voice is voice-recognized and converted into characters, and images and characters are superimposed on the liquid crystal display to give impressions and facts at the time of shooting An imaging apparatus with a voice recognition function that can be recorded and output as character information together with an image has been proposed (see, for example, Patent Document 1). In addition, it has been proposed to detect the voice arrival direction (voice direction) and to superimpose characters on a display position corresponding to the voice direction.
JP 11-055614 A

特許文献1に記載の技術は、あくまでもデジタルカメラ等の静止画記録装置において、撮影時の音声を文字化するものである。音声方向の検知については、常に、撮影方向(撮影レンズの向く方向)を正面とする相対的な角度で音声方向を検知している。   The technique described in Japanese Patent Laid-Open Publication No. 2003-259542 is a technique for characterizing sound at the time of shooting in a still image recording apparatus such as a digital camera. Regarding the detection of the voice direction, the voice direction is always detected at a relative angle with the shooting direction (the direction in which the shooting lens faces) as the front.

単に、撮影方向(撮影レンズの向く方向)を正面とする相対的な角度で音声方向を検知し、検知した音声方向に応じた画面位置に入力音声の文字情報を配置するだけでは、鑑賞者の直感と合わない場合がありうる。   Simply by detecting the voice direction at a relative angle with the shooting direction (direction facing the shooting lens) as the front, and placing the character information of the input voice at the screen position corresponding to the detected voice direction, It may not fit with intuition.

記録済み動画像を再生し、音声を文字としてアフレコする場合、アフレコの話者は、再生画像に対して適切な位置にいるとは限らない。従って、撮影方向に対する相対的な音声方向を検知し、音声方向に応じた画面位置に認識文字を嵌め込む音声処理装置を利用する場合、アフレコされる文字が不適切な画面位置に配置されてしまうことがある。   When a recorded moving image is reproduced and voice is recorded as characters, the post-recording speaker is not always at an appropriate position with respect to the reproduced image. Therefore, when using a voice processing device that detects a voice direction relative to the shooting direction and inserts a recognized character at a screen position corresponding to the voice direction, the post-recording character is placed at an inappropriate screen position. Sometimes.

本発明は、このような不具合を解消する動画記録再生装置を提示することを目的とする。   An object of this invention is to show the moving image recording / reproducing apparatus which eliminates such a malfunction.

上記の目的を達成するために、本発明に係る動画記録再生装置は、音声入力手段と、当該音声入力手段による入力音声の到来方向を検出する音声方向検出手段と、当該音声入力手段による入力音声を文字に変換する文字変換装置と、音声到来方向に応じた位置に音声文字を表示する音声文字表示手段と、画像表示手段と、当該画像表示手段の向きを検出するモニタ方向検出手段と、動画記録時には、当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定し、動画再生時には、当該モニタ方向検出手段及び当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定する制御手段とを具備することを特徴とする。   In order to achieve the above object, a moving picture recording / reproducing apparatus according to the present invention includes a voice input unit, a voice direction detection unit that detects a direction of arrival of input voice by the voice input unit, and an input voice by the voice input unit. A character conversion device for converting a character into a character, a voice character display means for displaying a voice character at a position corresponding to the voice arrival direction, an image display means, a monitor direction detection means for detecting the orientation of the image display means, and a moving image At the time of recording, the display position of the output character of the character conversion device on the screen is determined according to the detection result of the voice direction detection unit, and at the time of moving image reproduction, according to the detection result of the monitor direction detection unit and the voice direction detection unit. And a control means for determining the display position of the output character of the character conversion device on the screen.

本発明に係る動画記録再生装置は、記録媒体から動画を再生する動画再生手段と、音声入力手段と、当該音声入力手段による入力音声の到来方向を検出する音声方向検出手段と、当該音声入力手段による入力音声を文字に変換する文字変換装置と、音声到来方向に応じた位置に音声文字を表示する音声文字表示手段と、画像表示手段と、当該画像表示手段の向きを検出するモニタ方向検出手段と、当該モニタ方向検出手段及び当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定する制御手段と、当該制御手段により決定される表示位置に当該文字変換装置の出力文字が表示されるように、当該動画再生手段による再生画像に当該当該文字変換装置の出力文字の情報を重畳して当該画像表示手段に供給する混合器と、当該文字変換装置の出力文字の情報と、当該制御手段により決定される表示位置の情報を動画の関連情報として当該記録媒体に記録する記録手段とを具備することを特徴とする。   The moving image recording / reproducing apparatus according to the present invention includes a moving image reproducing unit that reproduces a moving image from a recording medium, an audio input unit, an audio direction detecting unit that detects an arrival direction of input audio by the audio input unit, and the audio input unit. A character conversion device that converts input speech by a character into a character, a voice character display unit that displays a voice character at a position corresponding to the direction of voice arrival, an image display unit, and a monitor direction detection unit that detects the orientation of the image display unit And, according to the detection results of the monitor direction detection means and the voice direction detection means, the control means for determining the display position of the output character of the character conversion device on the screen, and the display position determined by the control means In order to display the output character of the character conversion device, the image display unit superimposes the information of the output character of the character conversion device on the reproduction image by the moving image reproduction unit. Characterized in that it comprises: a mixer to be supplied; information on output characters of the character conversion device; and recording means for recording information on a display position determined by the control means on the recording medium as video related information. To do.

本発明に係る動画記録再生装置はさらに、当該動画再生手段で再生している動画像の時間情報を検出する手段を具備し、当該記録手段は、当該文字変換装置の出力文字の情報、当該表示位置の情報及び当該時間情報を、当該動画の関連情報として当該記録媒体に記録することを特徴とする。   The moving image recording / reproducing apparatus according to the present invention further comprises means for detecting time information of a moving image being reproduced by the moving image reproducing means, and the recording means comprises information on the output characters of the character conversion device, the display The position information and the time information are recorded on the recording medium as related information of the moving image.

本発明によれば、動画に音声を文字で重畳したい場合に、記録時と再生(アフレコ)時とで、話者の位置に対応した適切な表示位置に音声文字を配置できる。   According to the present invention, when it is desired to superimpose sound on a moving image with characters, the sound characters can be arranged at an appropriate display position corresponding to the position of the speaker during recording and during reproduction (after-recording).

以下、図面を参照して、本発明の実施例を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の一実施例である撮像装置10の概略構成ブロック図を示す。撮像装置10は、動画と静止画の両方を記録再生可能である。図2は、記録媒体12の記録フォーマットを示す。記録媒体12は例えば、記録可能な光ディスクからなる。本実施例では、1つの動画像に対して、1以上の静止画と1以上の音声文字情報を付加することができる。図2は、記録媒体12上で一体に管理される動画像、静止画及び音声文字情報の構成例を示す。記録媒体12には、MPEG動画像データを記録する動画音声記録領域70に対し、JPEG静止画データを記録する静止画記録領域72と、文字データを記録する文字データ記録領域74とが付加される。静止画記録領域72には1以上の静止画を格納できる。文字記録領域74は、音声文字アフレコで記録される文字化された音声を格納する領域であり、タイムコード領域76、表示位置領域78、文字コード領域80及びリンク情報領域82から構成される。文字記録領域74に格納されるデータの詳細は、後述する。   FIG. 1 shows a schematic block diagram of an image pickup apparatus 10 that is an embodiment of the present invention. The imaging device 10 can record and reproduce both moving images and still images. FIG. 2 shows a recording format of the recording medium 12. The recording medium 12 is composed of a recordable optical disc, for example. In the present embodiment, one or more still images and one or more voice character information can be added to one moving image. FIG. 2 shows a configuration example of a moving image, a still image, and voice character information managed together on the recording medium 12. On the recording medium 12, a still image recording area 72 for recording JPEG still image data and a character data recording area 74 for recording character data are added to a moving image / audio recording area 70 for recording MPEG moving image data. . One or more still images can be stored in the still image recording area 72. The character recording area 74 is an area for storing characterized voice recorded by the voice character after-recording, and is composed of a time code area 76, a display position area 78, a character code area 80, and a link information area 82. Details of the data stored in the character recording area 74 will be described later.

動画像を記録する場合、撮像部62は、撮影レンズ60による被写体の光学像を画像信号に変換して、一定レートで画像信号を出力する。マイク64は、周囲の音声を取り込み、音声信号を出力する。MPEGエンコーダ66は、撮像部62からの画像信号及びマイク64からの音声信号をMPEG規格に準拠して圧縮符号化する。ディスク記録装置50は、MPEGエンコーダ66からのMPEG圧縮データ(MPEG動画像データ)を記録媒体12に記録する。記録媒体12のMPEG圧縮データが記録された領域が、図2の動画音声記録領域70に相当する。   When recording a moving image, the imaging unit 62 converts the optical image of the subject by the photographing lens 60 into an image signal, and outputs the image signal at a constant rate. The microphone 64 takes in surrounding sounds and outputs a sound signal. The MPEG encoder 66 compresses and encodes the image signal from the imaging unit 62 and the audio signal from the microphone 64 in accordance with the MPEG standard. The disk recording device 50 records MPEG compressed data (MPEG moving image data) from the MPEG encoder 66 on the recording medium 12. The area where the MPEG compressed data is recorded on the recording medium 12 corresponds to the moving image / audio recording area 70 of FIG.

静止画像を記録する場合、撮像部62は、図示しないレリーズ操作に応じて、撮影レンズ60による被写体の光学像を1枚の静止画の画像信号に変換する。JPEGエンコーダ68は、撮像部62からの静止画像信号をJPEG方式で圧縮符号化する。ディスク記録装置50は、JPEGエンコーダ68からのJPEG圧縮データ(JPEG静止画データ)を記録媒体12に記録する。ここで記録される静止画が、動画音声記録領域70に記録される動画に関連付けられる場合、JPEG圧縮データが図2の静止画記録領域72に格納される。   When recording a still image, the imaging unit 62 converts the optical image of the subject by the photographing lens 60 into a single still image signal in response to a release operation (not shown). The JPEG encoder 68 compresses and encodes the still image signal from the imaging unit 62 using the JPEG method. The disk recording device 50 records the JPEG compressed data (JPEG still image data) from the JPEG encoder 68 on the recording medium 12. When the still image recorded here is associated with the moving image recorded in the moving image audio recording area 70, the JPEG compressed data is stored in the still image recording area 72 of FIG.

図3は、音声文字アフレコ処理中のイメージ図を示す。音声文字アフレコ時には、アフレコ対象の動画が記録媒体12から再生され、LCDモニタ24の画面上に表示されている。LCDモニタ24の画面内には、予め取り込んだ話者の静止画像92,94が動画に重畳して表示され、後述する方法で取り込まれ認識された文字情報96,98が、動画に重畳して表示される。図3に示す例では、アフレコの話者は人物Aと人物Bであり、人物AはLCDモニタ24に向かって左側にいて、人物BはLCDモニタ24に向かって右側にいるものとする。音声文字アフレコモードでは、人物AがLCDモニタ24に表示されている再生動画を鑑賞しながら発声した「よしよし」という音声を示す文字94が、LCDモニタ24の画面の右側に表示され、人物Bが発声した「やめてよ」という音声を示す文字96が、LCDモニタ24の画面左側に表示される。   FIG. 3 shows an image diagram during the voice character post-recording process. At the time of voice character post-recording, the moving image to be post-recorded is reproduced from the recording medium 12 and displayed on the screen of the LCD monitor 24. In the screen of the LCD monitor 24, the still images 92 and 94 of the speaker captured in advance are displayed superimposed on the moving image, and the character information 96 and 98 captured and recognized by the method described later is superimposed on the moving image. Is displayed. In the example shown in FIG. 3, it is assumed that the post-recording speakers are person A and person B, and person A is on the left side toward LCD monitor 24, and person B is on the right side toward LCD monitor 24. In the voice character post-recording mode, a character 94 indicating the sound “good” uttered while watching the playback video displayed on the LCD monitor 24 is displayed on the right side of the screen of the LCD monitor 24, and the person B A character 96 indicating the uttered voice “Stop it” is displayed on the left side of the screen of the LCD monitor 24.

図4は、音声文字アフレコ処理の操作手順のフローを示す。まず、人物Aの静止画を記録し(S1)、人物Bの静止画を記録する(S2)。これらの静止画を、アフレコ対象の動画像に対する静止画記録領域72に格納する。人物Aの静止画像92をLCDモニタ24の画面の左側に表示するように設定する(S3)。人物Bの静止画像94をLCDモニタ24の画面の右側に表示するように設定する(S4)。そして、音声文字アフレコを開始する(S5)。   FIG. 4 shows a flow of the operation procedure of the voice character post-recording process. First, the still image of the person A is recorded (S1), and the still image of the person B is recorded (S2). These still images are stored in the still image recording area 72 for the moving image to be dubbed. The still image 92 of the person A is set to be displayed on the left side of the screen of the LCD monitor 24 (S3). The still image 94 of the person B is set to be displayed on the right side of the screen of the LCD monitor 24 (S4). Then, the voice character after-recording is started (S5).

図5は、撮像装置10の、音声文字アフレコのための処理系の概略構成ブロック図を示す。なお、音声再生処理系は、省略してある。   FIG. 5 shows a schematic block diagram of a processing system for the voice character after-recording of the imaging apparatus 10. Note that the audio reproduction processing system is omitted.

操作装置28で特定の動画の再生が指示されると、システム制御回路30は、記録媒体12の動画音声記録領域70に記録されたMPEG動画像データの再生をディスク再生装置14に指示する。ディスク再生装置14は、指定された動画のMPEG動画像データを光ディスク12から読み出す。動画再生装置20は、ディスク再生装置14からのMPEG動画像データを伸長して動画像信号に変換する。このように再生された動画像信号は、混合器22を介してLCDモニタ24に供給され、LCDモニタ24の画面上に再生画像が表示される。   When playback of a specific moving image is instructed by the operation device 28, the system control circuit 30 instructs the disc playback device 14 to play back the MPEG moving image data recorded in the moving image / audio recording area 70 of the recording medium 12. The disc playback device 14 reads MPEG moving image data of the designated moving image from the optical disc 12. The moving image reproducing device 20 decompresses the MPEG moving image data from the disk reproducing device 14 and converts it into a moving image signal. The moving image signal reproduced in this way is supplied to the LCD monitor 24 via the mixer 22, and the reproduced image is displayed on the screen of the LCD monitor 24.

操作装置28で特定の静止画の再生が指示されると、システム制御回路30は、記録媒体12の静止画記録領域72に記録されたJPEG静止画データの再生をディスク再生装置14に指示する。ディスク再生装置14は、指定された静止画のJPEG静止画データを光ディスク12から読み出す。静止画再生装置16は、ディスク再生装置14からのJPEG静止画データを伸長して静止画像信号に変換する。サイズ変換装置18は、静止画再生装置16により再生されて静止画をLCDモニタ24の静止画用子画面の画面サイズに合致するサイズに変換し、変換後の静止画像を、動画像と同じレートで繰り返し出力する。サイズ変換装置18から出力される静止画の画像信号は、混合器22を介してLCDモニタ24に供給される。これにより、再生静止画像がLCDモニタ24の画面上に表示される。   When the operation device 28 instructs the playback of a specific still image, the system control circuit 30 instructs the disc playback device 14 to play back the JPEG still image data recorded in the still image recording area 72 of the recording medium 12. The disc playback device 14 reads JPEG still image data of the designated still image from the optical disc 12. The still image reproduction device 16 decompresses the JPEG still image data from the disk reproduction device 14 and converts it into a still image signal. The size conversion device 18 converts the still image reproduced by the still image reproduction device 16 into a size that matches the screen size of the still image sub-screen of the LCD monitor 24, and converts the converted still image to the same rate as the moving image. To output repeatedly. The still image signal output from the size converter 18 is supplied to the LCD monitor 24 via the mixer 22. As a result, the reproduced still image is displayed on the screen of the LCD monitor 24.

音声入力装置32は、4chのマイク34,36,38,40からなる。マイク34,36,38,40は、図3に示すように、前後左右に配置される。音声方向検出装置41が、マイク34,36の入力音声の位相差を検出することで、前後方向の音声到来方向を検出し、マイク38,40の入力音声の位相差を検出すること、左右方向の音声到来方向を検出する。音声方向検出装置41は、検出結果をシステム制御回路30に供給する。前後及び左右の方向を検出することで、360度のどの方向からの音声かを決定できる。   The voice input device 32 includes 4-channel microphones 34, 36, 38, and 40. The microphones 34, 36, 38, and 40 are arranged on the front, rear, left and right as shown in FIG. The voice direction detection device 41 detects the phase difference between the input voices of the microphones 34 and 36, thereby detecting the voice arrival direction in the front-rear direction and the phase difference between the input voices of the microphones 38 and 40. The direction of voice arrival is detected. The voice direction detection device 41 supplies the detection result to the system control circuit 30. By detecting the front-rear and left-right directions, it is possible to determine from which direction the sound is 360 degrees.

位相差検出による音声方向の決定方法を説明する。例えば、図6に示すように、マイク38,40の右斜め方向から音声が到来した場合、マイク38,40に到来する音声の時間差をΔT、マイク38,40間距離をd、到来方向をθとすると、ΔT=d×sinθが成立する。この関係式から音声到来方向θを決定できる。   A method for determining the voice direction by phase difference detection will be described. For example, as shown in FIG. 6, when sound comes from the diagonally right direction of the microphones 38, 40, the time difference between the sounds arriving at the microphones 38, 40 is ΔT, the distance between the microphones 38, 40 is d, and the arrival direction is θ Then, ΔT = d × sin θ is established. The voice arrival direction θ can be determined from this relational expression.

図7(A)は、マイク40の音声入力の様子を示し、図7(B)はマイク38の音声入力の様子を示す。横軸は時間を示し、縦軸は周波数を示す。マイク40では時刻t2に音声群Aと音声群Bが検知され、マイク36では時刻t1で音声群Bが検知され、時刻t2で音声群Aが検知されている。この場合、音声群Aの到来方向は、マイク38,40の正面方向(マイク38,40を結ぶ線に垂直な方向)であり、音声群Bの到来方向は、
(t2−t1)=d×sinθ
で表される右斜め方向θと検知できる。
FIG. 7A shows a state of voice input from the microphone 40, and FIG. 7B shows a state of voice input from the microphone 38. The horizontal axis indicates time, and the vertical axis indicates frequency. The microphone 40 detects the voice group A and the voice group B at the time t2, the microphone 36 detects the voice group B at the time t1, and the voice group A is detected at the time t2. In this case, the arrival direction of the voice group A is the front direction of the microphones 38 and 40 (the direction perpendicular to the line connecting the microphones 38 and 40), and the arrival direction of the voice group B is
(T2−t1) = d × sin θ
It can be detected as the diagonally right direction θ represented by

システム制御回路30は、音声方向検出装置41の検出結果に従い、音声到来方向別にマイク34,36,38,40の出力音声信号から音声を分離するように方向フィルタ42を制御する。音声抽出装置44は、方向フィルタ42の出力音声信号からノイズを除去し、人間の発音部分を抽出する。文字変換装置46は、音声抽出装置44で抽出された音声信号を文字認識して、文字コードに変換する。文字変換装置46による文字コードは、文字表示装置52と関連情報付加装置48に印加される。   The system control circuit 30 controls the direction filter 42 so as to separate the sound from the output sound signal of the microphones 34, 36, 38, 40 according to the sound arrival direction according to the detection result of the sound direction detecting device 41. The sound extraction device 44 removes noise from the output sound signal of the directional filter 42 and extracts a human sounding portion. The character conversion device 46 recognizes characters of the voice signal extracted by the voice extraction device 44 and converts it into a character code. The character code by the character conversion device 46 is applied to the character display device 52 and the related information adding device 48.

モニタ方向検出装置26は、LCDモニタ24の向いている方向を検出し、検出結果をシステム制御回路30に供給する。モニタ方向検出器26は、例えば、LCDモニタ24を回転可能に筐体に取り付ける回転機構の回転軸に装備される回転角検出装置等からなる。   The monitor direction detection device 26 detects the direction in which the LCD monitor 24 is facing and supplies the detection result to the system control circuit 30. The monitor direction detector 26 includes, for example, a rotation angle detection device or the like equipped on a rotation shaft of a rotation mechanism that rotatably attaches the LCD monitor 24 to the housing.

システム制御回路30は、モニタ方向検出装置26の検出結果を参照し、音声方向検出装置41の検出結果を、モニタ方向を考慮した音声方向に修正する。例えば、LCDモニタ24を撮像装置10の側面に外側に向けている場合、アフレコの話者A,Bは、モニタ24の画面を見て話すわけだから、そのままでは、例えば、話者Aは、撮像装置10の片側(例えば、右側)の後側に位置し、話者Bは、撮像装置10の同じ側の前側に位置することになる。そのままの音声方向では、話者Aの音声は、撮像装置10に対して右後方からの音声、話者Bの音声は、撮像装置10に対して右前方からの音声ということになり、音声方向に応じた画面位置に重畳すると、おかしなことになる。   The system control circuit 30 refers to the detection result of the monitor direction detection device 26 and corrects the detection result of the voice direction detection device 41 to a voice direction considering the monitor direction. For example, when the LCD monitor 24 is directed outward to the side of the imaging device 10, the post-recording speakers A and B speak while looking at the screen of the monitor 24. Positioned on the rear side of the device 10 (for example, the right side), the speaker B is positioned on the front side of the same side of the imaging device 10. In the same voice direction, the voice of the speaker A is the voice from the right rear with respect to the imaging device 10, and the voice of the speaker B is the voice from the right front with respect to the imaging device 10. When it is superimposed on the screen position according to the above, it becomes strange.

そこで、本実施例では、システム制御回路30は、モニタ方向検出装置26の検出結果を参照して修正した音声方向を、表示位置として関連情報付加装置48及び文字表示装置52に供給する。図8を参照して説明した例では、システム制御回路30は、話者Aの音声が撮像装置10の前左方向から到来し、話者Bの音声が撮像装置10の前右方向から到来するように音声方向を修正し、修正した音声方向に応じた表示位置を関連情報付加装置48及び文字表示装置52に通知する。   Therefore, in this embodiment, the system control circuit 30 supplies the sound direction corrected with reference to the detection result of the monitor direction detection device 26 to the related information adding device 48 and the character display device 52 as a display position. In the example described with reference to FIG. 8, the system control circuit 30 causes the voice of the speaker A to come from the front left direction of the imaging device 10 and the voice of the speaker B comes from the front right direction of the imaging device 10. Thus, the voice direction is corrected, and the display position corresponding to the corrected voice direction is notified to the related information adding device 48 and the character display device 52.

文字表示装置52は、文字変換装置52からの文字コードに従う文章を示す画像信号を生成し、システム制御回路30からの音声方向に応じた表示位置に重畳されることになるタイミングで、その画像信号を混合器22に出力する。混合器22は、動画再生装置20からの動画上に、サイズ変換回路18からの静止画、及び文字表示装置52からの文字画像を重畳して、LCDモニタ24に供給する。これにより、例えば、図8に示す説明例に対しては、図3に示すように、話者Aの音声が画面の左側に重畳され、話者Bの音声が画面右側に重畳される。   The character display device 52 generates an image signal indicating a sentence according to the character code from the character conversion device 52, and the image signal is displayed at a timing at which the image signal is superimposed on a display position corresponding to the voice direction from the system control circuit 30. Is output to the mixer 22. The mixer 22 superimposes the still image from the size conversion circuit 18 and the character image from the character display device 52 on the moving image from the moving image reproduction device 20 and supplies them to the LCD monitor 24. Thus, for example, for the example shown in FIG. 8, as shown in FIG. 3, the voice of speaker A is superimposed on the left side of the screen, and the voice of speaker B is superimposed on the right side of the screen.

関連情報付加装置48には、更に、動画再生装置20から再生される動画に付属するタイムコードが供給され、サイズ変換装置18から静止画のリンク情報が供給される。関連情報付加装置48は、動画再生装置20からのタイムコード、サイズ変換装置18からのリンク情報、システム制御回路30からの表示位置、及び文字変換装置46からの文字コードを、現に再生している動画の関連情報として、ディスク記録装置50に供給する。サイズ変換装置18からのリンク情報は、対応する静止画へのリンクを示す情報である。   The related information adding device 48 is further supplied with a time code attached to the moving image reproduced from the moving image reproducing device 20, and is supplied with link information of a still image from the size converting device 18. The related information adding device 48 actually reproduces the time code from the moving image reproducing device 20, the link information from the size converting device 18, the display position from the system control circuit 30, and the character code from the character converting device 46. The information is supplied to the disk recording device 50 as the related information of the moving image. The link information from the size conversion device 18 is information indicating a link to the corresponding still image.

ディスク記録装置50は、関連情報付加装置48からの関連情報を記録媒体12の文字記録領域74に図2に示すようなフォーマットで記録する。動画再生装置20からのタイムコードが、文字記録領域74の領域76に格納され、システム制御回路30からの表示位置の情報が領域78に格納され、文字変換装置46からの文字コードが領域80に格納され、サイズ変換装置18からのリンク情報が領域82に格納される。文字記録領域74のこれらの関連情報は、音声抽出装置44により抽出される音声の単位で生成され、追加記録される。   The disc recording device 50 records the related information from the related information adding device 48 in the character recording area 74 of the recording medium 12 in the format as shown in FIG. The time code from the moving image playback device 20 is stored in the region 76 of the character recording region 74, the display position information from the system control circuit 30 is stored in the region 78, and the character code from the character conversion device 46 is stored in the region 80. The link information from the size converter 18 is stored in the area 82. These pieces of related information in the character recording area 74 are generated in units of voice extracted by the voice extraction device 44 and additionally recorded.

このように、音声文字が追加記録された動画を再生すると、文字記録領域74に記録された文字コード領域80に記録された文字が、タイムコード領域76に記録されるタイムコードのタイミングで、表示位置領域78に記録される表示位置に相当する画面位置で表示される。必要により、リンク情報領域82に記録されるリンク情報により、話者の静止画も、再生表示される。   As described above, when a moving image in which voice characters are additionally recorded is reproduced, the characters recorded in the character code area 80 recorded in the character recording area 74 are displayed at the timing of the time code recorded in the time code area 76. The image is displayed at a screen position corresponding to the display position recorded in the position area 78. If necessary, the still image of the speaker is also reproduced and displayed by the link information recorded in the link information area 82.

記録済みの動画データを再生し、音声文字を追加記録する実施例を説明したが、動画撮影中の入力音声を文字化、動画の関連情報として記録してもよい。この場合、システム制御回路30は、動画記録時には、音声方向検出装置41の検出結果に従い、文字変換装置46の出力文字の画面上での表示位置を決定し、動画再生時(音声文字アフレコ時)には、モニタ方向検出装置26及び音声方向検出装置41の検出結果に従い、文字変換装置46の出力文字の画面上での表示位置を決定する。   Although the embodiment has been described in which recorded moving image data is reproduced and audio characters are additionally recorded, the input sound during moving image shooting may be converted into text and recorded as related information of the moving image. In this case, the system control circuit 30 determines the display position of the output character of the character conversion device 46 on the screen according to the detection result of the voice direction detection device 41 during moving image recording, and plays back the moving image (during voice character dubbing). In accordance with the detection results of the monitor direction detection device 26 and the voice direction detection device 41, the display position of the output character of the character conversion device 46 on the screen is determined.

図9は、記録モードか再生モードかに応じて、どの方向を正面に設定するかを示すフローチャートである。システム制御回路30は、図9に示すように、先ず、動作モードが動画再生(アフレコ)モードか動画記録モードかを判定する(S10)。動画再生(アフレコ)モードでは(S10)、LCDモニタ24の表示方向を正面として、音声方向と文字表示領域92,94を対応させる(S11)。動画記録モードでは(S10)、レンズ方向を正面として、音声方向と文字表示領域92,94を対応させる(S12)。   FIG. 9 is a flowchart showing which direction is set to the front depending on the recording mode or the reproduction mode. As shown in FIG. 9, the system control circuit 30 first determines whether the operation mode is a moving image playback (after-recording) mode or a moving image recording mode (S10). In the moving image reproduction (after-recording) mode (S10), the voice direction and the character display areas 92 and 94 are associated with each other with the display direction of the LCD monitor 24 as the front (S11). In the moving image recording mode (S10), the voice direction is made to correspond to the character display areas 92 and 94 with the lens direction as the front (S12).

文字表示領域92を青色、文字表示領域94を赤色というように異なる色で表現して、区別しやすくしてもよい。また、長時間無音が続いたら、無音を示唆する「...」のような文字列を表示するようにしてもよい。   The character display area 92 may be expressed in different colors such as blue and the character display area 94 may be expressed in red so that they can be easily distinguished. In addition, if silence continues for a long time, a character string such as “...” Indicating silence may be displayed.

入力された音声を文字に変換して、記録媒体12に記録する実施例を説明したが、本発明は、入力音声の文字をリアルタイムでモニタ画面上に重畳表示する場合にも、適用可能である。この場合、関連情報付加装置48及びディスク記録装置50は不要である。   Although the embodiment in which the input voice is converted into characters and recorded on the recording medium 12 has been described, the present invention is also applicable to the case where the characters of the input voice are superimposed and displayed on the monitor screen in real time. . In this case, the related information adding device 48 and the disk recording device 50 are unnecessary.

本実施例の記録系の概略構成ブロック図である。It is a schematic block diagram of the recording system of the present embodiment. 記録媒体の記録フォーマットを示す図である。It is a figure which shows the recording format of a recording medium. 本実施例の音声文字アフレコ処理のイメージ図である。It is an image figure of the voice character post-recording process of a present Example. 本実施例の基本フローである。It is a basic flow of a present Example. 撮像装置10の、音声文字アフレコのための処理系の概略構成ブロック図である。2 is a block diagram schematically illustrating the configuration of a processing system for voice character post-recording in the imaging apparatus 10. FIG. 位相差検出による音声方向の決定方法を説明する図である。It is a figure explaining the determination method of the audio | voice direction by a phase difference detection. 音声入力例を示す模式図である。It is a schematic diagram which shows the audio | voice input example. 音声入力時の話者A,Bの配置例を示す模式図である。It is a schematic diagram which shows the example of arrangement | positioning of the speakers A and B at the time of voice input. 本実施例のモード移行例を示すフロー図である。It is a flowchart which shows the example of mode transfer of a present Example.

符号の説明Explanation of symbols

10 撮像装置
12 記録媒体
14 ディスク再生装置
16 静止画再生装置
18 サイズ変換装置
20 動画再生装置
22 混合器
24 LCDモニタ
26 方向検出装置
28 操作装置
30 システム制御回路
32 音声入力装置
34,36,38,40 マイク
41:音声方向検出装置
42 方向フィルタ
44 音声抽出装置
46 文字変換装置
48 関連情報付加装置
50 ディスク記録装置
52 文字表示装置
60 光学レンズ
62 撮像ユニット
64 マイク
66 MPEGエンコーダ
68 JPEGエンコーダ
DESCRIPTION OF SYMBOLS 10 Image pick-up device 12 Recording medium 14 Disc reproducing device 16 Still image reproducing device 18 Size converting device 20 Movie reproducing device 22 Mixer 24 LCD monitor 26 Direction detecting device 28 Operating device 30 System control circuit 32 Voice input devices 34, 36, 38, 40 Microphone 41: Voice direction detection device 42 Direction filter 44 Voice extraction device 46 Character conversion device 48 Related information addition device 50 Disk recording device 52 Character display device 60 Optical lens 62 Imaging unit 64 Microphone 66 MPEG encoder 68 JPEG encoder

Claims (3)

音声入力手段(32)と、
当該音声入力手段による入力音声の到来方向を検出する音声方向検出手段(41)と、
当該音声入力手段による入力音声を文字に変換する文字変換装置(46)と、
音声到来方向に応じた位置に音声文字を表示する音声文字表示手段(52)と、
画像表示手段(24)と、
当該画像表示手段の向きを検出するモニタ方向検出手段(26)と、
動画記録時には、当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定し、動画再生時には、当該モニタ方向検出手段及び当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定する制御手段(30)
とを具備することを特徴とする動画記録再生装置。
Voice input means (32);
Voice direction detection means (41) for detecting the direction of arrival of the input voice by the voice input means;
A character conversion device (46) for converting a voice input by the voice input means into a character;
Voice character display means (52) for displaying a voice character at a position corresponding to the voice arrival direction;
Image display means (24);
Monitor direction detection means (26) for detecting the orientation of the image display means;
At the time of moving image recording, the display position of the output character of the character conversion device on the screen is determined according to the detection result of the voice direction detection unit, and at the time of moving image reproduction, the detection result of the monitor direction detection unit and the voice direction detection unit In accordance with the control means (30) for determining the display position on the screen of the output character of the character conversion device
A moving picture recording / reproducing apparatus comprising:
記録媒体(12)から動画を再生する動画再生手段(20)と、
音声入力手段(32)と、
当該音声入力手段による入力音声の到来方向を検出する音声方向検出手段(41)と、
当該音声入力手段による入力音声を文字に変換する文字変換装置(46)と、
音声到来方向に応じた位置に音声文字を表示する音声文字表示手段(52)と、
画像表示手段(24)と、
当該画像表示手段の向きを検出するモニタ方向検出手段(26)と、
当該モニタ方向検出手段及び当該音声方向検出手段の検出結果に従い、当該文字変換装置の出力文字の画面上での表示位置を決定する制御手段(30)と、
当該制御手段により決定される表示位置に当該文字変換装置の出力文字が表示されるように、当該動画再生手段による再生画像に当該当該文字変換装置の出力文字の情報を重畳して当該画像表示手段に供給する混合器(22)と、
当該文字変換装置の出力文字の情報と、当該制御手段により決定される表示位置の情報を動画の関連情報として当該記録媒体(12)に記録する記録手段(48,50)
とを具備することを特徴とする動画記録再生装置。
A moving image reproducing means (20) for reproducing a moving image from the recording medium (12);
Voice input means (32);
Voice direction detection means (41) for detecting the direction of arrival of the input voice by the voice input means;
A character conversion device (46) for converting a voice input by the voice input means into a character;
Voice character display means (52) for displaying a voice character at a position corresponding to the voice arrival direction;
Image display means (24);
Monitor direction detection means (26) for detecting the orientation of the image display means;
Control means (30) for determining the display position of the output character of the character conversion device on the screen according to the detection results of the monitor direction detection means and the voice direction detection means;
The image display means superimposes the output character information of the character conversion device on the reproduction image by the moving image reproduction means so that the output character of the character conversion device is displayed at the display position determined by the control means. A mixer (22) for feeding to
Recording means (48, 50) for recording the output character information of the character conversion device and the display position information determined by the control means on the recording medium (12) as related information of the moving image.
A moving picture recording / reproducing apparatus comprising:
さらに、当該動画再生手段で再生している動画像の時間情報を検出する手段を具備し、
当該記録手段は、当該文字変換装置の出力文字の情報、当該表示位置の情報及び当該時間情報を、当該動画の関連情報として当該記録媒体(12)に記録する
ことを特徴とする請求項2に記載の動画記録再生装置。
Furthermore, it comprises means for detecting time information of the moving image being played back by the moving picture playback means,
The recording means records the output character information, the display position information, and the time information of the character conversion device on the recording medium (12) as related information of the moving image. The moving picture recording / reproducing apparatus described.
JP2006350315A 2006-12-26 2006-12-26 Movie recording / playback device Withdrawn JP2008160755A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006350315A JP2008160755A (en) 2006-12-26 2006-12-26 Movie recording / playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006350315A JP2008160755A (en) 2006-12-26 2006-12-26 Movie recording / playback device

Publications (1)

Publication Number Publication Date
JP2008160755A true JP2008160755A (en) 2008-07-10

Family

ID=39661108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006350315A Withdrawn JP2008160755A (en) 2006-12-26 2006-12-26 Movie recording / playback device

Country Status (1)

Country Link
JP (1) JP2008160755A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8610812B2 (en) 2010-11-04 2013-12-17 Samsung Electronics Co., Ltd. Digital photographing apparatus and control method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8610812B2 (en) 2010-11-04 2013-12-17 Samsung Electronics Co., Ltd. Digital photographing apparatus and control method thereof

Similar Documents

Publication Publication Date Title
JP2010272999A5 (en) Imaging device and playback device
CN101715142B (en) Information recording/reproducing apparatus and video camera
JP4978324B2 (en) Image recording apparatus, image recording system, and image reproducing method
JP2000261752A (en) Device for recording and reproducing image having sound
CN102998880A (en) Projector with function of camera and shooting method
JP2002057930A (en) Digital still camera and its operation control method
JP2012120036A (en) Imaging apparatus
JP2011254400A (en) Image and voice recording device
JP4407549B2 (en) Shooting device, video playback device, video recording / playback program
JP2004297177A (en) Image processor
JP2008160755A (en) Movie recording / playback device
JP2008242714A (en) Photographing device, musical score photographing method, and musical score photographing program
KR19990049718A (en) Digital camera capable of voice recording / playback
JP5638897B2 (en) Imaging device
JP4499537B2 (en) Electronic camera
JPH10276395A (en) Image processing apparatus, image processing method, and recording medium
JP4515005B2 (en) Electronic camera
WO2007029832A1 (en) Captured image recording apparatus, captured image recording method, captured image reproducing apparatus, captured image reproducing method, and captured image recording/reproducing system
JP2002290901A (en) Viewer video recording and playback device
JP2000236508A (en) Image recording device
JP3027317B2 (en) Video recording / reproducing device with still camera
JP2007104405A (en) Video data processing apparatus with audio, video data processing method with audio, and video data processing program with audio
KR100627070B1 (en) Video and audio signal recording device and reproducing device
JP2012194347A (en) Sound reproduction device and imaging apparatus
KR20060057748A (en) Apparatus and method in which video and audio are linked

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100302