JP2005151584A - Transmission processing apparatus and method - Google Patents
Transmission processing apparatus and method Download PDFInfo
- Publication number
- JP2005151584A JP2005151584A JP2004337892A JP2004337892A JP2005151584A JP 2005151584 A JP2005151584 A JP 2005151584A JP 2004337892 A JP2004337892 A JP 2004337892A JP 2004337892 A JP2004337892 A JP 2004337892A JP 2005151584 A JP2005151584 A JP 2005151584A
- Authority
- JP
- Japan
- Prior art keywords
- video
- audio
- transmission processing
- transmission
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】各通信端末に映像/音声符号化手段を設けなくて済むようにする。
【解決手段】スイッチ12は、複数の映像・音声入力から1つを選択する。送信処理装置14のビデオ・キャプチャ16は、選択された映像信号をディジタル化する。ビデオ・エンコーダ18は、ビデオ・キャプチャ16の出力をモーションJPEG、MPEG及びH.261に従って圧縮符号化する。セレクタ20は、各符号化方式の圧縮映像データの内、送信すべき圧縮映像データを選択し、通信バッファ22に供給する。音声エンコーダ24は、選択された音声信号をディジタル化及び符号化して、通信バッファ22に供給する。通信バッファ22の符号化映像データ及び符号化音声データはネットワーク30に読み出される。制御回路26は、ネットワーク30を介して受信した制御コマンドに従いデバイス12〜24を制御する。
【選択図】図1An object of the present invention is to eliminate the need to provide video / audio encoding means in each communication terminal.
A switch 12 selects one from a plurality of video / audio inputs. The video capture 16 of the transmission processing device 14 digitizes the selected video signal. The video encoder 18 converts the output of the video capture 16 into motion JPEG, MPEG and H.264. Compress and encode according to H.261. The selector 20 selects the compressed video data to be transmitted from the compressed video data of each encoding method, and supplies it to the communication buffer 22. The voice encoder 24 digitizes and encodes the selected voice signal, and supplies it to the communication buffer 22. The encoded video data and encoded audio data in the communication buffer 22 are read out to the network 30. The control circuit 26 controls the devices 12 to 24 according to the control command received via the network 30.
[Selection] Figure 1
Description
本発明は、複数の映像/音声ソースからの映像/音声信号を選択的にネットワークに出力する送信処理装置及び方法に関し、より具体的には、コンピュータ・ネットワークに対応する送信処理装置及び方法に関する。 The present invention relates to a transmission processing apparatus and method for selectively outputting video / audio signals from a plurality of video / audio sources to a network, and more specifically to a transmission processing apparatus and method corresponding to a computer network.
コンピュータ(パーソナル・コンピュータ又はワークステーション)にカメラ、映像モニタ、マイク及びスピーカなどの映像音声入出力機器を接続して、端末間で映像及び音声を送受信できるようにした通信端末装置の構成は周知であり、例えば、テレビ会議又はビデオ会議のための通信端末装置として既に一般に使用されている。 The configuration of a communication terminal device in which video and audio input / output devices such as a camera, video monitor, microphone and speaker are connected to a computer (personal computer or workstation) so that video and audio can be transmitted and received between terminals is well known. For example, it is already generally used as a communication terminal device for a video conference or a video conference.
カメラから入力された映像信号及びマイクにより入力された音声信号はそれぞれ、ディジタル化され、所定方式で符号化されてローカル・エリア・ネットワーク又はワイド・エリア・ネットワーク等のネットワークに出力される。ネットワークからの符号化された映像信号及び音声信号は復号化され、それぞれ、映像モニタ及びスピーカから出力される。マイクとスピーカは、音声の回り込みによるエコーを回避するためのエコーキャンセラと組みあわされる。スピーカ・フォンとして構成されているものもある。 The video signal input from the camera and the audio signal input from the microphone are each digitized, encoded by a predetermined method, and output to a network such as a local area network or a wide area network. The encoded video signal and audio signal from the network are decoded and output from the video monitor and the speaker, respectively. The microphone and the speaker are combined with an echo canceller for avoiding an echo caused by a sound wraparound. Some are configured as speakerphones.
従来、このようなテレビ会議システムは専用通信端末により構成されていたが、コンピュータの処理能力の向上により、オフィスの各人のデスクトップにあるコンピュータを通信端末としてテレビ会議又はビデオ会議を行なえるようになってきている。 Conventionally, such a video conference system has been configured by a dedicated communication terminal. However, by improving the processing capability of the computer, a video conference or a video conference can be performed using a computer on the desktop of each person in the office as a communication terminal. It has become to.
映像及び/音声を遠隔地に伝送する用途では、テレビ会議だけでなく、色々な場所の様子を観察する遠隔監視システムなどがある。 In applications where video and / or audio are transmitted to remote locations, there are not only video conferences but also remote monitoring systems for observing various situations.
映像伝送では、カメラの出力映像信号をディジタル化して取り込むためのビデオ・キャプチャ装置と圧縮符号化のビデオ圧縮装置に大きなコストがかかる。各人のコンピュータに装備した場合、その稼働率からみて、コスト効果比が低い。 In video transmission, a video capture device for digitizing and capturing a video signal output from a camera and a video compression device for compression coding are expensive. When equipped on each person's computer, the cost-effectiveness ratio is low in view of its availability.
また、遠隔監視システムのような用途では、ビデオ圧縮装置の性能(例えば、秒間30フレームの符号化が可能)に対して、必ずしも1地点の画像をそんな高いフレーム・レートで更新する必要がなく、例えば秒間1フレームで良いといった利用形態がある。そのような利用形態では、秒間30フレームの能力を持つビデオ圧縮装置は過剰仕様となる。 In applications such as a remote monitoring system, it is not always necessary to update a single point image at such a high frame rate with respect to the performance of the video compression apparatus (for example, encoding of 30 frames per second). For example, there is a usage form in which one frame per second is sufficient. In such a mode of use, a video compression device capable of 30 frames per second is over-specified.
本発明は、このような問題点に鑑み、簡便な構成でコスト効果比の良い送信処理装置及び方法を提示することを目的とする。 The present invention has been made in view of such problems, and an object of the present invention is to provide a transmission processing apparatus and method having a simple configuration and a good cost-effectiveness ratio.
本発明に係る送信処理装置は、映像及び音声の少なくとも一方についての複数の入力から1つを選択して、ネットワークに送信する送信処理装置であって、複数のアナログ入力信号を与えられた指示に応じて切り換える切り換え手段と、当該切り換え手段から出力されるアナログ信号をディジタル化するA/D変換手段と、当該A/D変換手段のディジタル出力を圧縮符号化する符号化手段と、当該符号化手段により符号化されたデータをネットワークに出力する出力手段とからなることを特徴とする。 A transmission processing apparatus according to the present invention is a transmission processing apparatus that selects one of a plurality of inputs for at least one of video and audio, and transmits the selected one to a network. Switching means for switching in response, an A / D conversion means for digitizing an analog signal output from the switching means, an encoding means for compressing and encoding the digital output of the A / D conversion means, and the encoding means Output means for outputting the data encoded by the above to a network.
本発明に係る送信処理装置は、映像及び音声の少なくとも一方についての複数の入力から1つを選択してネットワークに送信する送信処理装置であって、ネットワークを介した複数の入力を切り換える切り換え手段と、当該切り換え手段からの信号を圧縮符号化する符号化手段と、当該手段による符号化出力をネットワークに出力する出力手段とを有することを特徴とする。 The transmission processing device according to the present invention is a transmission processing device that selects one of a plurality of inputs for video and audio and transmits the selected one to a network, and a switching means for switching the plurality of inputs via the network. And an encoding means for compressing and encoding the signal from the switching means, and an output means for outputting the output encoded by the means to the network.
本発明に係る送信処理装置は、複数のアナログ入力信号から任意の複数の信号を選択するスイッチと、当該スイッチにより選択される複数のアナログ信号を時間軸上で圧縮して合成する合成手段と、当該合成手段から出力されるアナログ信号をディジタル化するA/D変換手段と、当該A/D変換手段から出力されるディジタル信号を圧縮符号化する符号化手段と、通信及び当該スイッチを制御する制御手段とからなることを特徴とする。 A transmission processing apparatus according to the present invention includes a switch that selects an arbitrary plurality of signals from a plurality of analog input signals, and a combining unit that compresses and combines a plurality of analog signals selected by the switch on a time axis, A / D conversion means for digitizing the analog signal output from the synthesizing means, encoding means for compressing and encoding the digital signal output from the A / D conversion means, and control for controlling the communication and the switch Means.
本発明に係る送信処理装置は、複数のアナログ入力信号から任意の複数の信号を選択するスイッチと、当該スイッチにより選択された複数のアナログ信号の夫々をディジタル化する複数のA/D変換手段と、当該複数のA/D変換手段から出力されるディジタル信号のそれぞれを圧縮符号化する複数の符号化手段と、通信及び当該スイッチを制御する制御手段とからなることを特徴とする。 A transmission processing apparatus according to the present invention includes a switch for selecting an arbitrary plurality of signals from a plurality of analog input signals, and a plurality of A / D conversion means for digitizing each of the plurality of analog signals selected by the switch. The digital signal output from the plurality of A / D conversion means includes a plurality of encoding means for compressing and encoding, and a control means for controlling the communication and the switch.
本発明に係る送信処理方法は、映像及び音声の少なくとも一方についての複数の入力から1つを選択して、ネットワークに送信する送信処理方法であって、複数のアナログ入力信号を与えられた指示に応じて切り換え、A/D変換手段によりディジタル化し、そのディジタル出力を圧縮符号化し、符号化されたデータをネットワークに出力することを特徴とする。 A transmission processing method according to the present invention is a transmission processing method of selecting one of a plurality of inputs for at least one of video and audio, and transmitting the selected one to a network. Switching is made accordingly, digitizing by A / D conversion means, the digital output is compression encoded, and the encoded data is output to the network.
本発明に係る送信処理方法は、映像及び音声の少なくとも一方についての複数の入力から1つを選択してネットワークに送信する送信処理方法であって、ネットワークを介した複数の入力を切り換えて、圧縮符号化し、符号化出力をネットワークに出力することを特徴とする。 A transmission processing method according to the present invention is a transmission processing method for selecting one of a plurality of inputs for video and audio and transmitting the selected one to a network. The transmission processing method switches between a plurality of inputs via the network and performs compression. It encodes and outputs an encoding output to a network.
本発明に係る送信処理方法は、複数のアナログ入力信号から任意の複数の信号を選択し、選択された複数のアナログ信号を時間軸上で圧縮して合成し、合成されたアナログ信号をディジタル化し、ディジタル化された合成信号を圧縮符号化することを特徴とする。 The transmission processing method according to the present invention selects an arbitrary plurality of signals from a plurality of analog input signals, compresses and combines the selected analog signals on the time axis, and digitizes the combined analog signals. The digitally synthesized signal is compression-encoded.
本発明に係る送信処理方法は、複数のアナログ入力信号から任意の複数の信号を選択し、選択された複数のアナログ信号の夫々をディジタル化し、各ディジタル信号を圧縮符号化することを特徴とする。 The transmission processing method according to the present invention is characterized by selecting a plurality of arbitrary signals from a plurality of analog input signals, digitizing each of the selected plurality of analog signals, and compressing and encoding each digital signal. .
本発明によれば、映像音声情報送信処理の資源を複数の端末で共用でき、これら資源の稼働率を上げて、コスト効果比を改善できる。 According to the present invention, resources for video / audio information transmission processing can be shared by a plurality of terminals, the operating rate of these resources can be increased, and the cost-effectiveness ratio can be improved.
複数の圧縮符号化手段を設け、通信先との情報交換及び/又は通信経路の状況に基づき、圧縮符号化手段を選択することにより、送信先の性能や状況に応じた適切な通信品質で映像/音声情報を送信できる。 By providing a plurality of compression encoding means and selecting the compression encoding means based on the information exchange with the communication destination and / or the state of the communication path, the video can be transmitted with an appropriate communication quality according to the performance and situation of the transmission destination. / Voice information can be transmitted.
テレビ会議システムに組み込むことで、より低コストでテレビ会議システムを構築できる。映像/音声の符号化手段を集中化することで、テレビ会議システム用端末を安価なものとすることができる。 By incorporating it into a video conference system, a video conference system can be constructed at a lower cost. By concentrating the video / audio encoding means, the video conference system terminal can be made inexpensive.
また、本発明によれば、複数の入力信号から任意の複数の信号を選択するスイッチを使用することで、キャプチャ装置及びエンコーダなどを共用化でき、これらのモジュールの稼働率を上げてコスト効果比の向上を図ることができる。また、複数の入力信号を同時にディジタル化及び圧縮符号化することにより、スイッチの切り替えによる時間的損失を低減できる。 In addition, according to the present invention, by using a switch that selects a plurality of arbitrary signals from a plurality of input signals, the capture device and the encoder can be shared, and the operating rate of these modules is increased and the cost effectiveness ratio is increased. Can be improved. In addition, by simultaneously digitizing and compressing and encoding a plurality of input signals, time loss due to switch switching can be reduced.
また、本発明によれば、通信先との情報交換及び通信経路の状況に基づき圧縮符号化手段を選択するので、送信先の性能や状況に応じた適切な通信品質で情報を送信できる。 Further, according to the present invention, since the compression encoding means is selected based on the information exchange with the communication destination and the status of the communication path, information can be transmitted with appropriate communication quality according to the performance and status of the transmission destination.
以下、図面を参照して、本発明の実施の形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の第1実施例の概略構成ブロック図を示す。本実施例の映像/音声送信処理装置10は、複数の(本実施例では4つの)映像・音声入力から送信処理すべき映像音声信号を選択するスイッチ12と、スイッチ12により選択された映像音声信号を送信処理する送信処理装置14とからなる。
FIG. 1 shows a schematic block diagram of a first embodiment of the present invention. The video / audio
送信処理装置14内のビデオ・キャプチャ16は、スイッチ12により選択された映像信号をディジタル化する。ビデオ・エンコーダ18は、モーションJPEG、MPEG及びH.261の各符号化方式に対応する符号化モジュールを具備し、ビデオ・キャプチャ16の出力信号をモーションJPEG、MPEG及びH.261に従って圧縮符号化する。セレクタ20は、各符号化方式の圧縮映像データの内、送信すべき圧縮映像データを選択し、選択したデータを通信バッファ22に供給する。他方、音声エンコーダ24は、スイッチ12により選択された音声信号をディジタル化及び符号化して、通信バッファ22に供給する。通信バッファ22に書き込まれた符号化映像データ及び符号化音声データは、適宜のフォーマット及び速度でネットワーク30に読み出される。
The video capture 16 in the
制御回路26は、ネットワーク30を介して受信した制御コマンドに従い、スイッチ12、ビデオ・キャプチャ16、ビデオ・エンコーダ18、セレクタ20及び音声エンコーダ24を制御する。
The
図2は、図1に示す実施例の動作を示すフローチャートである。先ず、送信要求、送信終了要求及び送信起動などのイベントの待ち状態になる(S1)。映像/音声送信要求を受け付けると(S2)、新たな送信処理を開始する(S3)。映像/音声送信終了要求を受け付けると(S4)、指定された映像/音声の送信処理を終了する(S5)。送信スケジューラにより映像音声送信動作を起動するイベントが発生すると(S6)、カメラからの画像データの獲得と送信処理を開始する(S7)。 FIG. 2 is a flowchart showing the operation of the embodiment shown in FIG. First, it waits for events such as a transmission request, a transmission end request, and transmission activation (S1). When a video / audio transmission request is received (S2), a new transmission process is started (S3). When a video / audio transmission end request is received (S4), the designated video / audio transmission processing is ended (S5). When an event for starting the video / audio transmission operation is generated by the transmission scheduler (S6), acquisition of image data from the camera and transmission processing are started (S7).
本実施例には、2種類の送信要求がある。第1は、テレビ会議のように高いフレーム・レートの映像データ通信を要求する場合である。この場合、スイッチ12又は送信処理装置14の切り替え速度を上回るフレーム・レートが要求されたときには、その要求に応じるために全ての送信動作を占有する必要が発生する。このような要求を占有的処理要求と呼ぶことにする。第2は、カメラを切り替えながらの監視のように、高いフレーム・レートを要求されない場合である。このような要求を非占有的処理要求と呼ぶことにする。
In this embodiment, there are two types of transmission requests. The first is a case where high frame rate video data communication is requested as in a video conference. In this case, when a frame rate exceeding the switching speed of the
非占有的処理要求は複数、受け付け可能であり、送信スケジューラが、指定の映像/音声ソースからの信号を順に選択し、送信する。送信スケジューラは、実際にはタイマ・イベントにより実現される。 A plurality of non-occupying processing requests can be accepted, and the transmission scheduler sequentially selects and transmits signals from a designated video / audio source. The transmission scheduler is actually realized by a timer event.
制御回路26は、まず、イベント待ち状態(S1)になる。外部からの通信又は送信スケジューラのタイマ・イベントが発生すると、通信内容及びイベントの種類に応じて、S2、S4又はS6の何れかに進む。
First, the
通信されてきたメッセージが新たな送信要求である場合、映像/音声送信要求受け付け処理(S2)に進み、メッセージの内容を読み出す。次いで、メッセージ内容に従って送信開始処理(S3)を実行する。 When the transmitted message is a new transmission request, the process proceeds to a video / audio transmission request acceptance process (S2), and the content of the message is read. Next, a transmission start process (S3) is executed according to the message content.
通信されてきたメッセージが送信終了の要求である場合、音声/映像送信終了要求の受け付け処理(S4)に進み、メッセージの内容を読み出す。次いで、メッセージの内容に従って送信終了処理(S5)を実行する。 If the transmitted message is a transmission end request, the process proceeds to an audio / video transmission end request acceptance process (S4), and the content of the message is read. Next, a transmission end process (S5) is executed according to the content of the message.
タイマ・イベントが発生した場合には、送信処理プロセスを再起動し、イベント待ち状態(S1)に戻る。起動された送信処理プロセスが、カメラからの映像データの獲得と送信の処理を実行し、タイマを設定する(S7)。 If a timer event occurs, the transmission process is restarted and the process returns to the event waiting state (S1). The started transmission processing process acquires and transmits video data from the camera, and sets a timer (S7).
図3は、図2の送信開始処理(S3)の詳細なフローチャートを示す。制御回路26は、まず、占有的処理要求が既にあるか否かを判定する(S11)。占有的処理要求がある場合(S11)、他の要求を受けつけられないので、当該開始要求を拒否する(S15)。占有的処理要求が無い場合(S11)、開始しようとしている処理自体が占有的処理要求であるか否かを判定する(S12)。非占有的処理要求の場合(S12)、送信スケジューラに送信要求処理プロセスを追加し、起動のためのタイマを設定して終了する(S13)。占有的処理要求の場合(S12)、他の要求と共存できないので、既存の要求の処理プロセスを一時停止させた(S14)、その後、送信スケジューラに送信要求処理プロセスを追加し、起動のためのタイマを設定して終了する(S13)。
FIG. 3 shows a detailed flowchart of the transmission start process (S3) of FIG. First, the
図4は、図2の送信終了処理(S5)の詳細なフローチャートを示す。制御回路26は、まず、指定された終了すべき処理が実際に存在するかどうかを、送信スケジューラを参照して判定する(S21)。終了指定された処理が無い場合(S21)、エラー・メッセージを返す(S24)。終了指定された処理が存在する場合(S21)、対応する送信要求処理プロセスに終了信号を送り、送信スケジューラからそのプロセスを削除する(S22)。その後、終了したプロセスが占有的処理要求によるものかどうかを判定し(S23)、占有的処理要求によるものであれば(S23)、そのプロセスにより一時停止状態にされたプロセスを送信スケジューラを参照して再起動可能な状態に戻し、終了する(S25)。
FIG. 4 shows a detailed flowchart of the transmission end process (S5) of FIG. First, the
カメラからの映像データの獲得と送信処理(S7)の内容は、処理要求が占有的処理要求であるか否かによって異なる。図5は、図2のS7の詳細であって、非占有的処理要求に対する処理の流れを示す。先ず、制御回路26は、要求されたカメラの映像を入力するようにスイッチ12を設定し(S31)、要求された映像サイズになるようにビデオ・キャプチャ16を設定する(S32)、ビデオ・エンコーダ18の3つの出力の内、要求された圧縮方式に応じた符号化データを選択するようにセレクタ20を設定し(S33)、ビデオ・エンコーダ18の符号化パラメータを設定する(S34)。
Acquisition of video data from the camera and the content of the transmission process (S7) differ depending on whether or not the processing request is an exclusive processing request. FIG. 5 shows the details of S7 of FIG. 2 and shows the flow of processing for the non-occupied processing request. First, the
その後、カメラ映像が取り込まれ、データ送信される。即ち、ビデオ・キャプチャ16がスイッチ12からの映像信号をディジタル化し(S35)、ビデオ・エンコーダ18がディジタル化された映像信号を圧縮符号化する(S36)。指定の符号化方式の符号化映像データがセレクタ20により選択され、通信バッファ22に格納される(S37)。同時に、音声エンコーダ24が、選択された音声信号をディジタル化及び符号化し、通信バッファ22に格納する。通信バッファ22に格納された符号化映像データ及び符号化音声データは、適当なレート及びフォーマットでネットワーク30に読み出され、要求元(又は指定の相手)に送信される(S38)。送信後、タイマを次の送信時期に設定して、終了する。
Thereafter, the camera video is captured and data is transmitted. That is, the
なお、この実施例では、ビデオ・エンコーダ18内の3つのエンコード・モジュール全てにおいて符号化処理が行なわれているが、選択された符号化方式に対応するものだけが動作するようにしてもよい。
In this embodiment, encoding processing is performed in all three encoding modules in the
図6及び図7は、図2のS7の詳細であって、占有的処理要求に対する処理の流れを示す。図6は初期化処理であり、図7は、カメラからの映像データの獲得と送信処理の流れを示す。占有的処理要求の場合、非占有的処理要求のS31〜S34に相当する初期化設定操作が1回目(及び送信要求パラメータの変更時)にのみ行なわれ、その後はデータ獲得と送信動作のみが繰り返される。 6 and 7 show details of S7 in FIG. 2 and show the flow of processing for the exclusive processing request. FIG. 6 shows the initialization process, and FIG. 7 shows the flow of the video data acquisition and transmission process from the camera. In the case of the exclusive processing request, the initialization setting operation corresponding to S31 to S34 of the non-occlusive processing request is performed only for the first time (and when the transmission request parameter is changed), and thereafter, only the data acquisition and transmission operations are repeated. It is.
初期化処理として、図6に示すように、先ず、制御回路26は、要求されたカメラの映像を入力するようにスイッチ12を設定し(S41)、要求された映像サイズになるようにビデオ・キャプチャ16を設定する(S42)、ビデオ・エンコーダ18の3つの出力の内、要求された圧縮方式に応じた符号化データを選択するようにセレクタ20を設定し(S43)、ビデオ・エンコーダ18の符号化パラメータを設定する(S44)。これらの処理は、図5のS31〜S34と同じである。
As an initialization process, as shown in FIG. 6, first, the
これらの初期化処理の後、実際に、カメラ映像の獲得と送信処理を繰り返す。即ち、ビデオ・キャプチャ16が、スイッチ12からの映像信号をディジタル化し(S51)、ビデオ・エンコーダ18が、ディジタル化された映像信号を圧縮符号化する(S52)。指定の符号化方式の符号化映像データがセレクタ20により選択され、通信バッファ22に格納される(S53)。同時に、音声エンコーダ24が、選択された音声信号をディジタル化及び符号化し、通信バッファ22に格納する。通信バッファ22に格納された符号化映像データ及び符号化音声データは、適当なレート及びフォーマットでネットワーク30に読み出され、要求元(又は指定の相手)に送信される(S54)。送信後、タイマを次の送信時期に設定して、終了する。
After these initialization processes, the camera image acquisition and transmission processes are actually repeated. That is, the
以上の説明では、1つのカメラ又はマイクからの入力信号を1つの送信先に送る動作を示したが、1つのカメラ又はマイクからの入力信号に対する送信要求が複数の端末からあった場合、これらを一括して複数の送信先に送ることができることはネットワーク技術として明らかである。 In the above description, the operation of sending an input signal from one camera or microphone to one transmission destination has been shown. However, when there are transmission requests for input signals from one camera or microphone from a plurality of terminals, It is obvious as a network technology that data can be sent to a plurality of destinations at once.
送信データのサイズやレート等のパラメータ変更要求があった際には、図6の初期化処理が再実行された後に、図7の動作が続く。この際、パラメータの変更により占有的処理要求が非占有的処理要求となる場合には、停止された処理プロセスを再起動可能な状態に戻す。 When there is a request to change parameters such as the size and rate of transmission data, the initialization process of FIG. 6 is re-executed, and then the operation of FIG. 7 continues. At this time, if the exclusive processing request becomes a non-occupying processing request due to a parameter change, the stopped processing process is returned to a restartable state.
また、映像/音声データの符号化及び通信バッファ22への格納までのステップ(図5のS31〜S37、及び図7のS51〜S53)と通信バッファ22に格納されるデータの送信(図5のS38及び図7のS54)を別々のプロセス(符号化処理プロセスと送信プロセス)とすると共に2つのバッファを用意し、S38又はS54を実行する送信プロセスが一方のバッファのデータをネットワークに出力している間に、符号化処理プロセスが次に送るべきデータをもう一方のバッファに格納するようにすることで、データ送信を効率を向上させることができる。このような技術自体は、並列処理技術として公知である。
Also, the steps (S31 to S37 in FIG. 5 and S51 to S53 in FIG. 7) until the encoding of the video / audio data and the storage in the
図8は、図1に示す実施例を利用するテレビ会議システムのネットワーク構成の模式図を示す。図1に示す映像送信処理装置10のスイッチ12には、2台の端末40a,40bのカメラ出力及びマイク出力が入力されている。端末40aはワークステーション42aをベースとし、端末40bはパーソナル・コンピュータ42bをベースとしており、それぞれ、カメラ44a,44b、マイク46a,46b、映像モニタ48a,48b及びスピーカ50a,50bが接続されている。マイク46a,46bとスピーカ50a,50bは、例えばスピーカ・フォン構成になっている。
FIG. 8 shows a schematic diagram of the network configuration of the video conference system using the embodiment shown in FIG. The camera output and microphone output of the two
一例として、端末40aは、FDDIなどの高速ネットワークを介してネットワーク30に接続し、ワークステーション42aは例えば、映像/音声の符号化信号を復号化するハードウェアを具備する。また、端末40bは、イーサネット52及びルータ54を介してネットワーク30に接続し、コンピュータ42bは、映像/音声の符号化信号を復号化するソフトウエアを具備する。ここでは、映像送信処理装置10の出力が接続するネットワーク30は、基幹ネットワーク又はそれに近い高速ネットワークであるとする。
As an example, the
この環境下でテレビ会議の行なわれる様子を説明する。なお、端末40aと図示しない別の端末との間でテレビ会議が行なわれるとする。 A state where a video conference is held in this environment will be described. It is assumed that a video conference is performed between the terminal 40a and another terminal (not shown).
テレビ会議では、自分の画像と通信相手(複数人も可)の画像をモニタ上に表示し、相手の声を自分の端末のスピーカから出力する。端末40aを自端末とすると、これは、自端末映像の受信処理を起動すると共に、相手端末の映像及び音声の受信処理を起動することで、実現される。 In a video conference, the user's image and the image of a communication partner (or a plurality of persons) are displayed on a monitor, and the other's voice is output from the speaker of his / her terminal. When the terminal 40a is the own terminal, this is realized by starting the reception processing of the own terminal video and starting the reception processing of the video and audio of the partner terminal.
自端末映像の受信処理と相手端末の映像及び音声の受信処理は、ほぼ同様の動作となるので、以下、相手端末の映像及び音声の受信処理を例に説明する。 Since the reception processing of the own terminal video and the reception processing of the video and audio of the counterpart terminal are almost the same operation, the video and audio reception processing of the counterpart terminal will be described below as an example.
図9は、自端末上で動作する映像音声受信処理と、相手側のカメラ出力及びマイク出力が入力する映像音声送信処理装置(以下、相手側映像音声送信処理装置という。)のデータ送信処理との関係を示す。S61〜S67は自端末上で動作する映像音声の受信処理を示し、S68〜S70は、相手側映像音声送信処理装置のデータ送信処理を示す。 FIG. 9 shows a video / audio reception process that operates on its own terminal, and a data transmission process of a video / audio transmission processing apparatus (hereinafter referred to as a counterpart video / audio transmission processing apparatus) to which the camera output and microphone output of the other party are input. The relationship is shown. S61 to S67 indicate video / audio reception processing operating on the own terminal, and S68 to S70 indicate data transmission processing of the counterpart video / audio transmission processing device.
まず、自端末上で受信処理が起動する。映像表示及び音声出力に必要なウィンドウ・システム上のモジュールなどが初期設定され(S61)、データ受信のためのバッファが用意される(S62)。受信のためのポートが開かれ、受け付け可能状態になる(S63)。相手側映像音声送信処理装置に、相手端末のカメラ出力及びマイク出力の送信を要求する(S64)。相手側映像音声送信処理装置はこの要求を受けると、もし受け入れられるならば、送信の初期設定を実行し、相手端末(端末40a)側の受信ポートへの通信コネクションを要求する(S68)。これにより、自端末(端末40a)は、相手側映像音声送信処理装置との間に通信コネクションを確立する(S65)。 First, reception processing is started on the own terminal. Modules on the window system necessary for video display and audio output are initialized (S61), and a buffer for receiving data is prepared (S62). A port for reception is opened, and reception is enabled (S63). The other party's video / audio transmission processing device is requested to transmit the camera output and microphone output of the other terminal (S64). Upon receiving this request, the counterpart video / audio transmission processing device, if accepted, executes initial settings for transmission and requests a communication connection to the reception port on the counterpart terminal (terminal 40a) side (S68). As a result, the terminal itself (terminal 40a) establishes a communication connection with the counterpart video / audio transmission processing apparatus (S65).
相手側映像音声送信処理装置は、映像及び音声データを獲得及び符号化して通信バッファに格納し(S69)、通信バッファに格納されるデータを通信相手(端末40a)に送信する(S70)。 The partner video / audio transmission processing apparatus acquires and encodes the video and audio data, stores them in the communication buffer (S69), and transmits the data stored in the communication buffer to the communication partner (terminal 40a) (S70).
自端末(端末40a)は、符号化されたデータを受信し(S66)、これを復号化して、映像を映像モニタ48aのウィンドウに表示し、音声をスピーカ50aから出力する(S67)。
The own terminal (terminal 40a) receives the encoded data (S66), decodes it, displays the video on the window of the
その後、相手側映像音声送信処理装置は、S69とS70を繰り返し、端末40aも、S66とS67を繰り返す。これにより、映像及び音声が連続的に転送され、再生される。 Thereafter, the partner video / audio transmission processing apparatus repeats S69 and S70, and the terminal 40a also repeats S66 and S67. As a result, video and audio are continuously transferred and reproduced.
カメラの映像出力及びマイク出力はアナログ信号のレベルで分岐されコンピュータ42a,42bと映像音声送信処理装置10の両方に入力されるように構成しても良い。その場合、自分の映像を受信する必要はなくなるが、カメラ入力をディジタル化するビデオ・キャプチャ機能がコンピュータ42a,42bに必要になる。
The video output and the microphone output of the camera may be branched at an analog signal level and input to both the
尚、カメラ44a,44b及びマイク46a,46bの出力を無線により映像音声送信処理装置10に送信することで、配線の負担を無くすことができる。
Note that the burden of wiring can be eliminated by wirelessly transmitting the outputs of the
このようにして、多数のカメラ・マイクの映像音声情報を伝送する環境を低コストで実現できる。また、受信端末の性能や機能に応じて、異なる圧縮符号化方式や適切な送信パラメータを用いて映像音声データを送受信できる。 In this way, an environment for transmitting video / audio information of a large number of cameras and microphones can be realized at low cost. Also, video / audio data can be transmitted / received using different compression encoding methods and appropriate transmission parameters according to the performance and function of the receiving terminal.
音声信号の処理を省いて、映像信号のみを送信処理するようにしてもよい。図10は、音声信号の処理を省略した映像送信処理装置の概略構成ブロック図を示す。図1に示す実施例から、スイッチ12の音声入力を無くし、送信処理装置14の音声デコーダ24を除去した構成になっている。映像を用いた監視などの用途には、音声情報が不要な場合もあり、図10に示すように構成することで、よりコスト効果比の良いシステムとすることができる。図11は、図10に示す映像送信処理装置を用いた遠隔監視システムの構成例であり、図8に示す構成から、音声の入出力装置を取り除いたものになっている。
The audio signal processing may be omitted, and only the video signal may be transmitted. FIG. 10 shows a schematic block diagram of a video transmission processing apparatus in which audio signal processing is omitted. From the embodiment shown in FIG. 1, the voice input to the
このように構成することにより、より安価な構成で、監視のような目的に最適のシステムを安価に構成できる。 By configuring in this way, it is possible to configure a system that is optimal for a purpose such as monitoring at a low cost with a cheaper configuration.
図8に示す構成をワイド・エリア・ネットワーク(WAN)に拡張できることは明らかである。例えば、図12に示すように、一般にビデオ・ゲートウエイなどと呼ばれる映像音声WAN交換機60を組みあわせればよい。 It is clear that the configuration shown in FIG. 8 can be extended to a wide area network (WAN). For example, as shown in FIG. 12, a video / audio WAN switch 60 generally called a video gateway or the like may be combined.
このように構成することにより、ISDNなどの公衆通信回線網を介して外部のネットワークとの間でデータ交換できる。 With this configuration, data can be exchanged with an external network via a public communication line network such as ISDN.
上述の実施例では、映像信号を取り込むビデオ・キャプチャ及び映像と音声のエンコーダを共用することにより、そのためのコストを低減できるが、一般二、スイッチ12としてあまり高速のものを利用できない(高価になる、大型になる。)ので、高いフレーム・レートを要求される用途では、複数の信号を実質的にも同時に扱うことができない。
In the above-described embodiment, by sharing the video capture for capturing the video signal and the video and audio encoder, the cost for that can be reduced, but generally, the
以下に、この問題点を解決した実施例を説明する。図13は、本発明の第3実施例の概略構成ブロック図を示す。110は映像音声送信サーバ、112は8つの映像音声入力から任意の4つの映像音声信号を選択し、選択された4つの映像音声信号の4つの出力ポートから任意に出力できるマトリクス・スイッチ、114は、マトリクス・スイッチ112からの4つの映像音声信号の1つを選択するか、又は、4つの映像音声信号を時間軸圧縮し、映像信号については4画面のマルチ画構成に合成し、音声信号については時間軸で1/4に圧縮して合成する画面分割ユニットである。
An embodiment that solves this problem will be described below. FIG. 13 shows a schematic block diagram of a third embodiment of the present invention. 110 is a video / audio transmission server, 112 is a matrix switch that can arbitrarily select four video / audio signals from eight video / audio inputs, and can be arbitrarily output from four output ports of the selected four video / audio signals. , One of the four video / audio signals from the
映像音声送信サーバ110は、画面分割ユニット114から出力される映像信号を取り込み、ディジタル化する映像キャプチャ装置116と、映像キャプチャ装置116の出力映像データを圧縮符号化する映像エンコーダ118と、画面分割ユニット114から出力される音声信号を取り込み、ディジタル化する音声キャプチャ装置120と、音声キャプチャ装置120の出力音声データを圧縮符号化する音声エンコーダ122と、エンコーダ118,122の符号化データ及び送信すべき情報を一時格納する通信バッファ124と、映像音声送信サーバ110の全体、マトリクス・スイッチ112及び画面分割ユニット114を制御する制御回路126からなる。
The video /
画面分割ユニット114は、図14に示すように分割モードと選択モードの2つの動作モードを具備する。分割モードは4つの入力映像を水平及び垂直で1/2に縮小して1画面に合成するモードである。このとき、画面分割ユニット114は4つの入力音声を時間軸で圧縮及び合成して出力する。選択モードは、4つの入力映像音声信号の内の任意の1つを選択して出力するモードである。このような機能を有する装置として、例えば、ソニー株式会社製YS−Q430などがある。
As shown in FIG. 14, the
エンコーダ118は、例えば、図15に示すように、それぞれ異なる圧縮符号化方式(例えば、MotionJPEG、MPEG及びITU−T勧告H.261)に対応する複数のエンコーダ130,132,134を設け、制御回路126の制御下で、スイッチ136が、入力映像データを何れか指定のエンコーダ130,132,134に供給するようにした構成であってもよい。音声エンコーダ122についても、同様である。
For example, as shown in FIG. 15, the
制御回路126は外部からの送信要求の内容に応じて、マトリクス・スイッチ112及び画面分割ユニット114を設定すると共に、映像キャプチャ装置116、映像エンコーダ118、音声キャプチャ装置120及び音声エンコーダ122を制御して、適切な送信データを生成し、通信バッファ124を介して外部ネットワークに送信させる。
The
図16は、図13の実施例の動作を示す流れ図である。先ず、送信要求、送信終了要求及び送信起動などのイベントの待ち状態になる(S101)。映像/音声送信要求を受け付けると(S102)、新たな送信処理を開始する(S103)。映像/音声送信終了要求を受け付けると(S104)、指定された映像/音声の送信処理を終了する(S105)。送信スケジューラにより映像音声送信動作を起動するイベントが発生すると(S106)、カメラ/マイクからの映像/音声の獲得と送信処理を開始する(S107)。 FIG. 16 is a flowchart showing the operation of the embodiment of FIG. First, it waits for events such as a transmission request, a transmission end request, and transmission activation (S101). When a video / audio transmission request is received (S102), a new transmission process is started (S103). When the video / audio transmission end request is received (S104), the designated video / audio transmission processing is ended (S105). When an event for starting the video / audio transmission operation is generated by the transmission scheduler (S106), acquisition of video / audio from the camera / microphone and transmission processing are started (S107).
この実施例でも、送信要求には占有的処理要求と非占有的処理要求の2種類がある。占有的処理要求は、全ての送信動作を特定のデータで占有させることにより高いフレーム・レートでのデータ通信を可能にする送信要求である。映像音声送信サーバ110に要求するフレーム・レートがマトリクス・スイッチ112の切り替え速度を上回る場合、占有的処理要求にする必要がある。非占有的処理要求は、高いフレーム・レートを割り当てずに、複数の映像音声信号を送信する送信要求である。非占有的処理要求は、複数受け付けることができ、送信スケジューラにより順に起動される。送信スケジューラは、実際にはタイマ・イベントにより実現される。
Also in this embodiment, there are two types of transmission requests: exclusive processing requests and non-occupying processing requests. The exclusive processing request is a transmission request that enables data communication at a high frame rate by occupying all transmission operations with specific data. When the frame rate requested to the video /
各送信要求は、さらに2種類に分けられる。第1は、テレビ会議などを行うために、解像度よりも映像のフレーム・レートを優先したデータ送信要求である。このときには、画面分割ユニット114の動作モードを分割モードに設定し、複数画面をマトリクス・スイッチ112の切り替えなしに取り込み、符号化することで実現される。第2は、物体の細部の観察などを行なうためにフレーム・レートよりも解像度を優先したデータ送信要求である。このときは、画面分割ユニット114の動作モードを選択モードに設定し、マトリクス・スイッチ112により、送信したい映像音声信号を選択する。
Each transmission request is further divided into two types. The first is a data transmission request in which a video frame rate is given priority over resolution in order to perform a video conference or the like. At this time, the operation mode of the
制御回路126は、まず、イベント待ち状態(S101)になる。外部からの通信又は送信スケジューラのタイマ・イベントが発生すると、通信内容及びイベントの種類に応じて、S102、S104又はS106の何れかに進む。
First, the
受信したメッセージが新たな送信要求である場合、映像/音声送信要求受け付け処理(S102)に進み、メッセージの内容を読み出す。次いで、メッセージ内容に従って送信開始処理(S103)を実行する。 If the received message is a new transmission request, the process proceeds to a video / audio transmission request acceptance process (S102), and the content of the message is read. Next, a transmission start process (S103) is executed according to the message content.
受信したメッセージが送信終了の要求である場合、音声/映像送信終了要求の受け付け処理(S104)に進み、メッセージの内容を読み出す。次いで、メッセージの内容に従って送信終了処理(S105)を実行する。 If the received message is a transmission end request, the process proceeds to an audio / video transmission end request acceptance process (S104), and the content of the message is read. Next, transmission end processing (S105) is executed according to the content of the message.
タイマ・イベントが発生した場合には、送信処理プロセスを再起動し、イベント待ち状態(S101)に戻る。起動された送信処理プロセスが、カメラ/マイクからの映像/音声の獲得と送信の処理を実行し、再びタイマを設定する(S107)。 If a timer event has occurred, the transmission process is restarted and the process returns to the event waiting state (S101). The activated transmission process executes the process of acquiring and transmitting video / audio from the camera / microphone, and sets the timer again (S107).
図17は、図16の送信開始処理S103の詳細なフローチャートを示す。制御回路126は、まず、占有的処理要求が既にあるか否かを判定する(S111)。占有的処理要求がある場合(S111)、他の要求を受けつけられないので、当該開始要求を拒否する(S115)。占有的処理要求が無い場合(S111)、開始しようとしている処理自体が占有的処理要求であるか否かを判定する(S112)。非占有的処理要求の場合(S112)、送信スケジューラに、解像度優先かフレームレート優先かに応じた送信要求プロセスを追加し、起動のためのタイマを設定して終了する(S113)。占有的処理要求の場合(S112)、他の要求と共存できないので、既存の要求の処理プロセスを一時停止させた(S114)、その後、送信スケジューラに送信要求処理プロセスを追加し、起動のためのタイマを設定して終了する(S113)。
FIG. 17 shows a detailed flowchart of the transmission start process S103 of FIG. First, the
非占有的処理要求の処理プロセスを送信スケジューラに追加する手順を、図18に示す。まず、処理要求を受け取り(S121)、受け取った処理要求が要求するカメラと同じカメラに帯する送信処理要求が既に送信スケジューラに存在するかどうかを調べる(S122)。同じカメラに対する送信処理要求が存在すれば(S122)、その送信処理プロセスに、今受け取った送信要求の送信先を追加して終了する(S123)。同じカメラに対する送信処理要求が存在しない場合(S122)、S121で受け取った処理要求が解像度優先かフレーム・レート優先かを判断する(S124)。解像度優先の場合(S124)、新たに起動のためのタイマを設定して終了する(S125)。フレーム・レート優先であれば(S124)、フレームレート優先処理要求の待ち行列に空きが存在するかどうかを、送信スケジューラを参照して調べ(S126)、空きが存在しなければ(S126)、新たに起動のためのタイマを設定して終了し8S125)、空きがあれば(S126)、空いている場所に処理を追加して終了する8S127)。 FIG. 18 shows a procedure for adding a non-occupied processing request processing process to the transmission scheduler. First, a processing request is received (S121), and it is checked whether a transmission processing request associated with the same camera as that requested by the received processing request already exists in the transmission scheduler (S122). If there is a transmission processing request for the same camera (S122), the transmission destination of the transmission request just received is added to the transmission processing process, and the process ends (S123). If there is no transmission processing request for the same camera (S122), it is determined whether the processing request received in S121 is resolution priority or frame rate priority (S124). When the resolution is prioritized (S124), a new timer for activation is set and the process ends (S125). If the frame rate is prioritized (S124), it is checked with reference to the transmission scheduler whether or not there is a space in the frame rate priority processing request queue (S126). When the timer for starting is set and finished (S8), if there is a vacancy (S126), processing is added to the vacant place and the process is finished (S8127).
このような手順により、図19に例示するような送信要求列に対し、送信スケジューラの送信スケジュールは、図20に示すようになる。 With this procedure, the transmission schedule of the transmission scheduler is as shown in FIG. 20 for the transmission request sequence illustrated in FIG.
図21は、図16の送信終了処理S105の詳細なフローチャートである。制御回路126は、まず、指定された終了すべき処理が実際に存在するかどうかを、送信スケジューラを参照して判定する(S131)。終了指定された処理が無い場合(S131)、エラー・メッセージを返す(S134)。終了指定された処理が存在する場合(S131)、対応する送信要求処理プロセスに終了信号を送り、送信スケジューラからそのプロセスを削除する(S132)。その後、終了したプロセスが占有的処理要求によるものかどうかを判定し(S133)、占有的処理要求によるものであれば(S133)、そのプロセスにより一時停止状態にされたプロセスを送信スケジューラを参照して再起動可能な状態に戻し、終了する(S135)。
FIG. 21 is a detailed flowchart of the transmission end process S105 of FIG. First, the
図16のS107、即ち、カメラ/マイクからの映像/音声データの獲得と送信処理の内容は、処理要求が占有的処理要求であるか否かによって異なる。 The contents of the processing of S107 in FIG. 16, that is, acquisition of video / audio data from the camera / microphone and transmission processing differ depending on whether or not the processing request is an exclusive processing request.
図22は、図16のS107の詳細であって、非占有的処理要求の場合のフローチャートを示す。先ず、制御回路126は、画面分割ユニット114の動作モードを、要求が解像度優先であれば選択モードに、要求がフレーム・レート優先であれば分割モードにそれぞれ設定する(S141)。要求されたカメラ/マイクの映像/音声を取り込むように、マトリクス・スイッチ112を設定し(S142)、要求された映像サイズ及び音質になるように映像キャプチャ装置116及び音声キャプチャ装置120のパラメータを設定する(S143)。映像キャプチャ装置116及び音声キャプチャ装置120は映像/音声データを取り込んでディジタル化する(S144)。
FIG. 22 is a detailed flowchart of S107 in FIG. 16 and shows a flowchart in the case of a non-occupying process request. First, the
映像エンコーダ118及び音声エンコーダ122に圧縮符号化パラメータ(符号化方式と圧縮率等のパラメータ、更には符号化する範囲)を設定し(S145)、キャプチャ装置116,120の出力をその条件で圧縮符号化させる(S146)。圧縮符号化条件の符号化する範囲は、例えば、送信要求が解像度優先である場合には画面全体、フレーム・レート優先の場合には、画面分割ユニット114によって分割された画面の内、未だ符号化されていない領域の一つである。符号化された映像/音声データは通信バッファ124に一時格納され(S147)、通信バッファ124からネットワークを介して要求元(又は指定の相手)に送出される。この送信後、送信スケジューラに次の送信要求処理プロセスを追加する。キャプチャされた全ての領域が送信され終えるまで、S145〜S148を繰り返す(S149)。
Compression encoding parameters (parameters such as encoding method and compression rate, and encoding range) are set in the
各入力ごと及び分割された各領域ごとに符号化パラメータを設定するので(S145)、各領域を異なった符号化条件で符号化できる。また、エンコーダ118,122が複数の圧縮符号化方式に対応している場合には、各入力ごとに異なった圧縮符号化方式で符号化することも可能になる。
Since an encoding parameter is set for each input and for each divided area (S145), each area can be encoded under different encoding conditions. Further, when the
図23及び図24は、図16のS107の詳細であって、占有的処理要求の場合の流れを示す。図23は初期化処理であり、図24は、カメラ/マイクからの映像/音声データの獲得と送信処理の流れを示す。占有的処理要求の場合、図22のS141乃至S143、及びS145に相当する初期化設定操作が1回目(及び送信要求パラメータの変更時)にのみ行なわれ、その後はデータ獲得と送信動作のみが繰り返される。 FIG. 23 and FIG. 24 show the details of S107 in FIG. 16 and show the flow in the case of an exclusive processing request. FIG. 23 shows the initialization process, and FIG. 24 shows the flow of the acquisition / transmission process of video / audio data from the camera / microphone. In the case of an exclusive processing request, the initialization setting operation corresponding to S141 to S143 and S145 of FIG. 22 is performed only for the first time (and when the transmission request parameter is changed), and thereafter, only data acquisition and transmission operations are repeated. It is.
図23を説明する。まず、画面分割ユニット114を選択モードに設定する(S151)。このように設定することにより、ある特定のカメラからの信号を高速に送信できる。次いで、要求されたカメラ/マイクの映像/音声が入力されるようにマトリクス・スイッチ112を設定する(S152)。映像キャプチャ装置116及び音声キャプチャ装置120に送信要求の内容に応じたパラメータを設定し(S153)、映像エンコーダ118及び音声エンコーダ122にも送信要求の内容に応じたパラメータを設定する(S122)。なお、S151で画面分割ユニット114を分割モードに設定すれば、複数のカメラ(図14の例では、最大4箇所)からの映像を高速に送信できる。
FIG. 23 will be described. First, the
図24を説明する。映像キャプチャ装置116及び音声キャプチャ装置120は、画面分割ユニット114から出力される映像信号及び音声信号をそれぞれ取り込んでディジタル化する(S161)。映像エンコーダ118及び音声エンコーダ122はそれぞれ映像キャプチャ装置116及び音声キャプチャ装置120の出力データを圧縮符号化し(S162)、符号化データを通信バッファ124に格納する(S163)。通信バッファ124に格納されたデータは、所定のレート及びフォーマットでネットワークを介して送信要求元(又は指定の相手)に送信される(S164)。送信後、タイマを次の送信時期に設定して、終了する。
FIG. 24 will be described. The
図22及び図24に示す送信処理プロセスで映像/音声データの符号化及び通信バッファ124への格納のステップ(S145〜S147及びS161〜S163)と、通信バッファ124に格納されているデータの送信(S148及びS164)を別のプロセスとすると共に2つのバッファを用意し、S148及びS164を実行する送信プロセスが一方のバッファのデータを転送している間に、符号化プロセスが次に送信すべきデータを他方のバッファに格納するようにして、通信バッファの書き込みと読み出しを同時に実行し、データ送信の効率を向上させることができる。 The steps of encoding video / audio data and storing them in the communication buffer 124 (S145 to S147 and S161 to S163) in the transmission processing process shown in FIGS. 22 and 24, and transmission of data stored in the communication buffer 124 ( S148 and S164) are separate processes and two buffers are prepared. While the transmission process executing S148 and S164 is transferring the data of one buffer, the encoding process should transmit the next data Can be stored in the other buffer, and writing and reading of the communication buffer can be executed simultaneously to improve the efficiency of data transmission.
図25は、図13に示す実施例を利用するテレビ会議システムのネットワーク構成の模式図を示す。140は、図13に示す映像音声送信サーバ110、マトリクス・スイッチ112及び画面分割ユニット114からなる映像音声送信処理装置であり、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク、一般公衆電話回線、その他のネットワークなどからなる通信ネットワーク142に接続している。
FIG. 25 shows a schematic diagram of the network configuration of the video conference system using the embodiment shown in FIG.
映像音声送信処理装置140のマトリクス・スイッチ112の入力には、個人の机上又はサイドに配置される2台の端末144a,144bのカメラ出力及びマイク出力が接続されている。端末144aはワークステーション146aをベースとし、端末144bはパーソナル・コンピュータ146bをベースとしており、それぞれ、カメラ148a,148b、マイク150a,150b、映像モニタ152a,152b及びスピーカ154a,154bが接続されている。マイク150a,150bとスピーカ154a,154bは、例えばスピーカ・フォン構成になっている。
The input of the
一例として、端末144aは、FDDIなどの高速ネットワークを介してネットワーク142に接続し、ワークステーション146aは例えば、映像/音声の符号化信号を復号化するハードウェアを具備する。また、端末142bは、イーサネット(登録商標)156及びルータ158を介してネットワーク142に接続し、コンピュータ146bは、映像/音声の符号化信号を復号化するソフトウエアを具備する。ここでは、映像音声送信処理装置140の出力が接続するネットワーク142は、基幹ネットワーク又はそれに近い高速ネットワークであるとする。
As an example, the terminal 144a is connected to the
この環境下でテレビ会議の行なわれる様子を説明する。なお、端末144aと図示しない別の端末との間でテレビ会議が行なわれるとする。 A state where a video conference is held in this environment will be described. It is assumed that a video conference is performed between the terminal 144a and another terminal (not shown).
テレビ会議では、自分の画像と通信相手(複数人も可)の画像をモニタ上に表示し、相手の声を自分の端末のスピーカから出力する。端末144aを自端末とすると、これは、自端末映像の受信処理を起動すると共に、相手端末の映像及び音声の受信処理を起動することで、実現される。 In a video conference, the user's image and the image of a communication partner (or a plurality of persons) are displayed on a monitor, and the other's voice is output from the speaker of his / her terminal. When the terminal 144a is the own terminal, this is realized by starting the reception processing of the own terminal video and starting the reception processing of the video and audio of the partner terminal.
自端末映像の受信処理と相手端末の映像及び音声の受信処理は、ほぼ同様の動作となるので、以下、相手端末の映像及び音声の受信処理を例に説明する。 Since the reception processing of the own terminal video and the reception processing of the video and audio of the counterpart terminal are almost the same operation, the video and audio reception processing of the counterpart terminal will be described below as an example.
図26は、自端末上で動作する映像音声受信処理と、相手側のカメラ出力及びマイク出力が入力する映像音声送信処理装置(以下、相手側映像音声送信処理装置という。)のデータ送信処理との関係を示す。S171〜S177は自端末上で動作する映像音声の受信処理を示し、S178〜S180は、相手側映像音声送信処理装置のデータ送信処理を示す。 FIG. 26 shows a video / audio reception process operating on the own terminal, and a data transmission process of a video / audio transmission processing apparatus (hereinafter referred to as a counterpart video / audio transmission processing apparatus) to which the camera output and microphone output of the other party are input. The relationship is shown. S171 to S177 indicate video / audio reception processing operating on the terminal, and S178 to S180 indicate data transmission processing of the partner video / audio transmission processing device.
まず、自端末上で受信処理が起動する。映像表示及び音声出力に必要なウィンドウ・システム上のモジュールなどが初期設定され(S171)、データ受信のためのバッファが用意される(S172)。受信のためのポートが開かれ、受け付け可能状態になる(S173)。相手側映像音声送信処理装置に、相手端末のカメラ出力及びマイク出力の送信を要求する(S174)。相手側映像音声送信処理装置はこの要求を受けると、もし受け入れられるならば、送信の初期設定を実行し、相手端末(端末144a)側の受信ポートへの通信コネクションを要求する(S178)。これにより、自端末(端末144a)は、相手側映像音声送信処理装置との間に通信コネクションを確立する(S175)。 First, reception processing is started on the own terminal. Modules on the window system necessary for video display and audio output are initialized (S171), and a buffer for receiving data is prepared (S172). A port for reception is opened, and reception is enabled (S173). The other party video / audio transmission processing apparatus is requested to transmit the camera output and microphone output of the other party terminal (S174). Upon receiving this request, the counterpart video / audio transmission processing apparatus, if accepted, executes an initial setting for transmission and requests a communication connection to the reception port on the counterpart terminal (terminal 144a) side (S178). As a result, the terminal (terminal 144a) establishes a communication connection with the partner video / audio transmission processor (S175).
相手側映像音声送信処理装置は、映像及び音声データを獲得及び符号化して通信バッファに格納し(S179)、通信バッファに格納されるデータを通信相手(端末144a)に送信する(S180)。 The counterpart video / audio transmission processing apparatus acquires and encodes video and audio data, stores them in the communication buffer (S179), and transmits the data stored in the communication buffer to the communication partner (terminal 144a) (S180).
自端末(端末144a)は、符号化されたデータを受信し(S176)、これを復号化して、映像を映像モニタ152aのウィンドウに表示し、音声をスピーカ154aから出力する(S177)。
The own terminal (terminal 144a) receives the encoded data (S176), decodes it, displays the video on the window of the
その後、相手側映像音声送信処理装置は、S179とS180を繰り返し、端末144aも、S176とS177を繰り返す。これにより、映像及び音声が連続的に転送され、再生される。 Thereafter, the partner video / audio transmission processing apparatus repeats S179 and S180, and the terminal 144a also repeats S176 and S177. As a result, video and audio are continuously transferred and reproduced.
カメラの映像出力及びマイク出力はアナログ信号のレベルで分岐されコンピュータ146a,146bと映像音声送信処理装置140の両方に入力されるように構成しても良い。その場合、自分の映像を受信する必要はなくなるが、カメラ入力をディジタル化するビデオ・キャプチャ機能がコンピュータ146a,146bに必要になる。
The video output and microphone output of the camera may be branched at an analog signal level and input to both the
尚、カメラ148a,148b及びマイク150a,150bの出力を無線により映像音声送信処理装置140に送信することで、配線の負担を無くすことができる。
Note that the burden of wiring can be eliminated by wirelessly transmitting the outputs of the
以上説明したように構成することで、複数のカメラ及びマイクから4つ以内の複数のソースからの映像音声情報を自由に選択して送信できるようになる。 With the configuration described above, video / audio information from a plurality of sources within four from a plurality of cameras and microphones can be freely selected and transmitted.
図27は、図13に示す実施例の変更例の概略構成ブロック図を示す。160はマトリクス・スイッチ112と同様の8入力・4出力のマトリクス・スイッチ、162a,162b,162c,162dは、マトリクス・スイッチ160の4出力の各映像/音声出力信号を取り込み、符号化してネットワークに送出する映像音声送信サーバ、164は、外部からの制御信号に従い、映像音声送信サーバ162a〜d及びマトリクス・スイッチ160を制御する制御装置である。
FIG. 27 shows a schematic block diagram of a modified example of the embodiment shown in FIG. 160 is an 8-input, 4-output matrix switch similar to the
映像音声送信サーバ162a〜162dは、マトリクス・スイッチ160の映像音声出力信号を取り込むキャプチャ装置166a〜166d、キャプチャ装置166a〜166dの出力を圧縮符号化するエンコーダ168a〜168d及びエンコーダ168a〜168dの出力をネットワークに送出するために一時格納する通信バッファ170a〜170dからなる。
The audio /
各映像音声送信サーバ162a〜162dは、他の映像音声送信サーバ162a〜162dとは独立に、マトリクス・スイッチ160の出力を取り込み、符号化してネットワークに出力する。従って、各映像音声情報を高品質に送信できる。多地点間で高フレームレートかつ高解像度の信号が必要な用途では、本実施例のように複数のエンコーダを用いることにより、各端末にキャプチャ装置及びエンコーダを設置するよりもコスト効果比を高めつつ負荷を分散して、、同時に複数の信号を送信処理できる。
Each of the video /
図27に示す実施例では、ある送信処理要求を、複数の映像音声送信サーバ162a〜162dのどれに割り当てるかは、以下のように決定される。即ち、送信要求を出す側(受信側)は、送信要求を受け取る側(送信側)の映像音声送信処理装置の制御装置164を通じて映像音声送信サーバ162a〜162dの送信スケジューラを参照する。参照した結果に基づいて、どの映像音声送信サーバ162a〜162dに送信処理を要求するかを受信側が決定し、制御装置164を通じて映像音声送信サーバ162a〜162dを指定して送信処理を指令する。
In the embodiment shown in FIG. 27, to which of a plurality of video /
また、受信側が指定なしに送信側の制御装置164に送信処理を要求すると、送信側の制御装置164が、映像音声送信サーバ162a〜162dの送信スケジューラを参照し、負荷や能力などに応じて自動的に適切な映像音声送信サーバ162a〜162dに処理を割り振るようにしてもよい。この場合には、受信側は、送信スケジューラの参照や映像音声送信サーバの指定などの負担を負わずに済むという効果がある。
Further, when the receiving side requests transmission processing from the transmitting
いずれにしても、どの送信処理要求をどの映像音声送信サーバ162a〜162dに割り当てるかが決定されると、各映像音声送信サーバ162a〜162dの送信スケジューラに、割り振られた送信処理が追加される。制御装置164は、各映像音声送信サーバ162a〜162dの送信スケジューラを参照して、マトリクス・スイッチ160を適切に設定する。各映像音声送信サーバ162a〜162dは、設定されたマトリクス・スイッチ160の各出力を取り込み、圧縮符号化してネットワークに送出する。
In any case, when it is determined which transmission processing request is allocated to which video /
図28は、図27に示す映像音声送信処理装置を使用したテレビ会議システムの概略構成ブロック図を示す。180は図27に図示した映像音声送信処理装置である。図25と同じ構成要素には同じ符号を付してある。このように構成することにより、コスト効果比を低下させずに、負荷を分散し、複数の信号を同時にディジタル化及び圧縮符号化することができる。
FIG. 28 shows a schematic block diagram of a video conference system using the video / audio transmission processing apparatus shown in FIG.
本発明は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、リーダ又はプリンタ等)から構成されるシステムに適用しても、単一の機器(例えば、複写機又はファクシミリ装置など)からなる装置に適用してもよい。 The present invention can be applied to a system composed of a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.) or an apparatus composed of a single device (for example, a copier or a facsimile machine). You may apply.
また前述した実施形態の機能を実現する各種デバイスを動作させる様に当該各種デバイスと接続された装置又はシステム内のコンピュータに、前記実施形態の機能を実現するためのソフトウエアのプログラムコードを供給し、その装置又はシステムのコンピュータ(CPU又はMPU)が、格納されたプログラムに従って前記各種デバイスを動作させるようにしたものも、本願発明の技術的範囲に含まれる。この場合、前記ソフトウエアのプログラムコード自体が前述した実施形態の機能を実現することに相当し、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、例えばかかるプログラムコードを格納した記憶媒体は、本発明を構成する。 In addition, the program code of software for realizing the functions of the embodiment is supplied to an apparatus or a computer in the system connected to the various devices so as to operate the various devices that realize the functions of the embodiment. A device (CPU or MPU) of the apparatus or system that causes the various devices to operate according to a stored program is also included in the technical scope of the present invention. In this case, the program code of the software itself corresponds to realizing the functions of the above-described embodiments, and the program code itself and means for supplying the program code to the computer, for example, the program code is stored. The storage medium constitutes the present invention.
かかるプログラムコードを格納する記憶媒体としては、例えばフレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テープ、不揮発性のメモリカード及びROM等を用いることが出来る。 As a storage medium for storing the program code, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a magnetic tape, a nonvolatile memory card, a ROM, and the like can be used.
またコンピュータが供給されたプログラムコードを実行することにより、前述の実施形態の機能が実現されるだけではなく、そのプログラムコードがコンピュータにおいて稼働しているOS(オペレーティングシステム)又は他のアプリケーションソフトウエア等と共同して前述の実施形態の機能が実現される場合にも、かかるプログラムコードは本願発明の実施形態に含まれることは言うまでもない。 Further, by executing the program code supplied by the computer, not only the functions of the above-described embodiments are realized, but also the OS (operating system) or other application software in which the program code is running on the computer, etc. Needless to say, the program code is also included in the embodiment of the present invention even when the functions of the above-described embodiment are realized in cooperation with the embodiment.
更に、供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も、本願発明に含まれることは言うまでもない。 Further, after the supplied program code is stored in a memory provided in a function expansion board of the computer or a function expansion unit connected to the computer, the function code is provided in the function expansion board or function storage unit based on an instruction of the program code. Needless to say, the present invention also includes a case where the CPU or the like performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
10:映像/音声送信処理装置
12:スイッチ
14:送信処理装置
16:ビデオ・キャプチャ
18:ビデオ・エンコーダ
20:セレクタ
22:通信バッファ
24:音声エンコーダ
26:制御回路
30:ネットワーク
40a,40b:端末
42a:ワークステーション
42b:パーソナル・コンピュータ
44a,44b:カメラ
46a,46b:マイク
48a,48b:映像モニタ
50a,50b:スピーカ
52:イーサネット
54:ルータ
110:映像音声送信サーバ
112:マトリクス・スイッチ
114:画面分割ユニット
116:映像キャプチャ装置
118:映像エンコーダ
120:音声キャプチャ装置
122:音声エンコーダ
124:通信バッファ
126:制御回路
130,132,134:エンコーダ
136:スイッチ
140:映像音声送信処理装置
142:通信ネットワーク
144a,144b:端末
146a:ワークステーション
146b:パーソナル・コンピュータ
148a,148b:カメラ
150a,150b:マイク
152a,152b:映像モニタ
154a,154b:スピーカ
156:イーサネット(登録商標)
158:ルータ
160:マトリクス・スイッチ
162a,162b,162c,162d:映像音声送信サーバ
164:制御装置
166a〜166d:キャプチャ装置
168a〜168d:エンコーダ
170a〜170d:通信バッファ
10: Video / audio transmission processing device 12: Switch 14: Transmission processing device 16: Video capture 18: Video encoder 20: Selector 22: Communication buffer 24: Audio encoder 26: Control circuit 30:
158: Router 160:
Claims (18)
複数のアナログ入力信号を与えられた指示に応じて切り換える切り換え手段と、
当該切り換え手段から出力されるアナログ信号をディジタル化するA/D変換手段と、
当該A/D変換手段のディジタル出力を圧縮符号化する符号化手段と、
当該符号化手段により符号化されたデータをネットワークに出力する出力手段
とからなることを特徴とする送信処理装置。 A transmission processing device that selects one of a plurality of inputs for at least one of video and audio and transmits the selected video to a network.
Switching means for switching a plurality of analog input signals according to a given instruction;
A / D conversion means for digitizing an analog signal output from the switching means;
Encoding means for compressing and encoding the digital output of the A / D conversion means;
A transmission processing apparatus comprising: output means for outputting data encoded by the encoding means to a network.
ネットワークを介した複数の入力を切り換える切り換え手段と、
当該切り換え手段からの信号を圧縮符号化する符号化手段と、
当該手段による符号化出力をネットワークに出力する出力手段
とを有することを特徴とする送信処理装置。 A transmission processing apparatus that selects one of a plurality of inputs for at least one of video and audio and transmits it to a network,
Switching means for switching a plurality of inputs via a network;
Encoding means for compressing and encoding the signal from the switching means;
Output processing means for outputting the encoded output by said means to a network.
当該スイッチにより選択される複数のアナログ信号を時間軸上で圧縮して合成する合成手段と、
当該合成手段から出力されるアナログ信号をディジタル化するA/D変換手段と、
当該A/D変換手段から出力されるディジタル信号を圧縮符号化する符号化手段と、
通信及び当該スイッチを制御する制御手段
とからなることを特徴とする送信処理装置。 A switch for selecting an arbitrary plurality of signals from a plurality of analog input signals;
Combining means for compressing and combining a plurality of analog signals selected by the switch on the time axis;
A / D conversion means for digitizing an analog signal output from the synthesis means;
Encoding means for compressing and encoding a digital signal output from the A / D conversion means;
A transmission processing apparatus comprising communication and control means for controlling the switch.
当該スイッチにより選択された複数のアナログ信号の夫々をディジタル化する複数のA/D変換手段と、
当該複数のA/D変換手段から出力されるディジタル信号のそれぞれを圧縮符号化する複数の符号化手段と、
通信及び当該スイッチを制御する制御手段
とからなることを特徴とする送信処理装置。 A switch for selecting an arbitrary plurality of signals from a plurality of analog input signals;
A plurality of A / D conversion means for digitizing each of a plurality of analog signals selected by the switch;
A plurality of encoding means for compressing and encoding each of the digital signals output from the plurality of A / D conversion means;
A transmission processing apparatus comprising communication and control means for controlling the switch.
複数のアナログ入力信号を与えられた指示に応じて切り換え、
A/D変換手段によりディジタル化し、
そのディジタル出力を圧縮符号化し、
符号化されたデータをネットワークに出力する
ことを特徴とする送信処理方法。 A transmission processing method for selecting one of a plurality of inputs for at least one of video and audio and transmitting the selected one to a network,
Switch between multiple analog input signals according to given instructions,
Digitized by A / D conversion means,
Compress and encode the digital output,
A transmission processing method, comprising: outputting encoded data to a network.
ネットワークを介した複数の入力を切り換えて、圧縮符号化し、
符号化出力をネットワークに出力する
ことを特徴とする送信処理方法。 A transmission processing method for selecting one of a plurality of inputs for at least one of video and audio and transmitting it to a network,
Switching between multiple inputs over the network, compression encoding,
A transmission processing method characterized by outputting an encoded output to a network.
選択された複数のアナログ信号を時間軸上で圧縮して合成し、
合成されたアナログ信号をディジタル化し、
ディジタル化された合成信号を圧縮符号化する
ことを特徴とする送信処理方法。 Select any multiple signals from multiple analog input signals,
Compress and synthesize selected analog signals on the time axis,
Digitize the synthesized analog signal,
A transmission processing method characterized by compression-coding a digitized composite signal.
選択された複数のアナログ信号の夫々をディジタル化し、
各ディジタル信号を圧縮符号化する
ことを特徴とする送信処理方法。 Select any multiple signals from multiple analog input signals,
Digitize each of the selected analog signals,
A transmission processing method characterized by compression-coding each digital signal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004337892A JP2005151584A (en) | 1996-01-08 | 2004-11-22 | Transmission processing apparatus and method |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP68696 | 1996-01-08 | ||
| JP2004337892A JP2005151584A (en) | 1996-01-08 | 2004-11-22 | Transmission processing apparatus and method |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15940396A Division JP3659528B2 (en) | 1996-01-08 | 1996-06-20 | Video conference system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005151584A true JP2005151584A (en) | 2005-06-09 |
Family
ID=34702571
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004337892A Pending JP2005151584A (en) | 1996-01-08 | 2004-11-22 | Transmission processing apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005151584A (en) |
-
2004
- 2004-11-22 JP JP2004337892A patent/JP2005151584A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3659528B2 (en) | Video conference system | |
| US5821987A (en) | Videophone for simultaneous audio and video communication via a standard telephone line | |
| JP6172610B2 (en) | Video conferencing system | |
| US20020135677A1 (en) | Image sensing control method and apparatus, image transmission control method, apparatus, and system, and storage means storing program that implements the method | |
| JP2002007294A (en) | Image distribution system and method, and storage medium | |
| JP2005192227A (en) | Multimedia enabled network | |
| JP2003532347A (en) | Media Role Management in Video Conferencing Networks | |
| US5953505A (en) | Communication apparatus and method for reading out stored function information in response to identifying information | |
| JP2008288974A (en) | Video conferencing system and video conferencing apparatus | |
| JPH08228329A (en) | Communication conference method and communication conference terminal device | |
| JPH1169330A (en) | Image communication device with answering machine function | |
| JP2005151584A (en) | Transmission processing apparatus and method | |
| JP2001077924A (en) | Multipoint communication system and method | |
| JPS62200883A (en) | Graphic display device for electronic conference system | |
| JP2902220B2 (en) | Teleconference system | |
| JP2002290940A (en) | Video conference system | |
| US7499085B2 (en) | Information terminal with controller for stopping voice data | |
| JPH0888842A (en) | Picture transmission system | |
| JP6481937B2 (en) | Communication device for video conference | |
| JPH06209470A (en) | Video transmission processor | |
| JPH06268757A (en) | Terminal identification method | |
| JP2004282785A (en) | Display control device and display control method | |
| JP3030019B2 (en) | Teleconference system | |
| JPH08294102A (en) | Video communication conference system and communication method thereof | |
| JP3308906B2 (en) | Control information transmission method and video conference communication setting method in video conference communication |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061101 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070307 |