[go: up one dir, main page]

JP2000308034A - Video conference system, video conference system control method, and storage medium storing program for controlling video conference system - Google Patents

Video conference system, video conference system control method, and storage medium storing program for controlling video conference system

Info

Publication number
JP2000308034A
JP2000308034A JP11145386A JP14538699A JP2000308034A JP 2000308034 A JP2000308034 A JP 2000308034A JP 11145386 A JP11145386 A JP 11145386A JP 14538699 A JP14538699 A JP 14538699A JP 2000308034 A JP2000308034 A JP 2000308034A
Authority
JP
Japan
Prior art keywords
server
image data
client
image
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11145386A
Other languages
Japanese (ja)
Inventor
Hiromasa Hirata
寛将 平田
Yasuhito Hayashi
林  泰仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP11145386A priority Critical patent/JP2000308034A/en
Publication of JP2000308034A publication Critical patent/JP2000308034A/en
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 TV会議システムが接続されているネットワ
ーク及びクライアントにおいての膨大なデータ処理負荷
の問題があった。 【解決手段】 送信元クライアントのマイクに音声デー
タを入力する入力手段と、前記送信元クライアントが、
前記入力した音声データをユーザーの音声であるか環境
雑音であるかを判定する音声データ判定手段と、前記音
声データ判定手段でユーザの音声であったと判定された
場合、前記音声データを前記サーバに送信する送信手段
と、前記サーバに送信された前記音声データを受けて、
サーバがら画像データを要求する画像要求コマンドを送
信元クライアントに送信する前記送信手段と、前記サー
バから画像データを要求する画像要求コマンドを受け
て、送信元クライアントから入力された画像データをサ
ーバへ送信する送信手段と、前記サーバが前記送信元ク
ライアントから送信された音声データと画像データを送
信先クライアントへ送信する送信手段とを具備するTV
会議システム。
(57) [Problem] There is a problem of a huge data processing load on a network and a client to which a TV conference system is connected. SOLUTION: Input means for inputting audio data to a microphone of a transmission source client, the transmission source client comprising:
The voice data determining means for determining whether the input voice data is a user voice or environmental noise, and when the voice data determining means determines that the voice data is a user voice, the voice data is transmitted to the server. Transmitting means for transmitting, receiving the audio data transmitted to the server,
The transmitting means for transmitting an image request command for requesting image data from the server to the transmission source client; and receiving the image request command for requesting image data from the server, transmitting the image data input from the transmission source client to the server. And a transmission means for transmitting the audio data and the image data transmitted from the transmission source client to the transmission destination client by the server.
Conference system.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【発明の属する技術分野】この発明は、TV会議システ
ムに係わり、特にクライアント・サーバのシステム構成
をとるTV会議システム、及びTV会議システムの制御
方法、及びTV会議システムを制御するプログラムを格
納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a TV conference system, and more particularly to a TV conference system having a client / server system configuration, a method of controlling the TV conference system, and storage for storing a program for controlling the TV conference system. Media related.

【従来の技術】従来の技術について、以下に図21及び
図22を用いて説明する。従来の1対1のTV会議シス
テムにおいては、ネットワークに接続された各クライア
ント端末(以下クライアントとする)AまたはBは、マ
イク、カメラ及びスピーカ等を有し、マイク及びカメラ
前記から入力した音声データ及び画像データをそのま
ま、もしくは、圧縮符号化して、TV会議参加中の他の
クライアントへ送信し、前記クライアントA及びBのお
互いの音声と画像を相互にネットワークを介して交換し
て通信する。このとき当然に各クライアントには、TV
会議ソフトがインストールされており、この各TV会議
ソフトがTV会議システムを制御している。この際用い
られる画像の圧縮符号化、そして圧縮された画像データ
を復号化する処理は、ネットワーク及びクライアントに
対して処理負担が大きかった。TV会議ソフトをクライ
アントとして用いているPC(パーソナルコンピュー
タ)のアプリケーションソフトとして考えた場合、画像
処理の負担が高い為に、PCの処理能力をTV会議のた
めのアプリケーションが占有してしまい、PCの処理能
力が追いつかず、他のアプリケーションが適切に動作し
なくなる問題がある。また、処理能力の低いPCでは、
処理能力不足によりTV会議システムアプリケーショシ
自体を実行出来ない問題もあった。また、TV会議シス
テムで用いられている画像データは、圧縮符号化したと
しても、音声などよりも情報量が多く、常に画像データ
を送信しデータのでは、大量のデータがネットワークを
流れるため、ネットワークを占有してしまう問題点があ
る。また、TV会議においては表示される画面内容は相
手の上半身であり、ユーザがカメラの前から退席する等
の大きな変化が無い限りは、静止画に近い状態となって
いることが多いが、従来のTV会議システムでは、常に
一定の画像データを送信しているので、全く変化してい
ない無駄な画像データを送信しており、効率的に画像デ
ータの送信、そして、画像データの処理をしていない問
題もある。次に図22において、多地点間を接続した多
地点間のTV会議システムについて説明する。図22に
示すように、多地点間のTV会議システムにおいて、ク
ライアントAからDまでがネットワークに接続されてい
るものとし、例えば、クライアントAについて考える
と、TV会議システムにおける画像処理の処理負荷軽減
のため、会議参加中の全クライアントのユーザの画像を
表示せずに、発言者の画像のみを表示したり、表示する
ユーザの数を制限する場合が多く、全ユーザの画像が見
ることができない問題がある(ユーザの画像表示までク
ライアントPCの処理能力がついていかないため)。ま
た、多地点間のTV会議システムにおいては、1クライ
アントに表示するユーザの数を制限したとしても、画像
データが、(全会議参加クライアント数−1)*(1ク
ライアントで表示されるユーザ数)分の画像データがネ
ットワーク内を流れることになり、ネットワーク内に大
きな負荷をかけてしまう問題がある。
2. Description of the Related Art A conventional technique will be described below with reference to FIGS. In the conventional one-to-one TV conference system, each client terminal (hereinafter, referred to as a client) A or B connected to a network has a microphone, a camera, a speaker, and the like, and audio data input from the microphone and the camera. The image data and the image data are transmitted as they are or after compression-encoding and transmitted to other clients participating in the TV conference, and the voices and images of the clients A and B are mutually exchanged via a network for communication. At this time, of course, each client has a TV
Conference software is installed, and each of the video conference software controls the video conference system. The processing of compressing and encoding an image and decoding the compressed image data used at this time has a heavy processing load on the network and the client. When the application software for a PC (personal computer) using the TV conference software as a client is considered, since the load of image processing is high, the application for the TV conference occupies the processing capability of the PC. There is a problem that the processing ability cannot keep up and other applications do not operate properly. On a PC with low processing capacity,
There was also a problem that the TV conference system application itself could not be executed due to insufficient processing capacity. Further, even if the image data used in the TV conference system is compressed and coded, the amount of information is larger than that of voice and the like, and since image data is always transmitted and a large amount of data flows through the network, Is occupied. Also, in a TV conference, the displayed screen content is the upper body of the other party, and is often close to a still image unless there is a large change such as the user leaving the camera or the like. In this TV conference system, since fixed image data is always transmitted, wasteful image data that does not change at all is transmitted, and image data transmission and image data processing are performed efficiently. There are no problems. Next, with reference to FIG. 22, a description will be given of a multipoint TV conference system that connects the multipoints. As shown in FIG. 22, in a multipoint TV conference system, it is assumed that clients A to D are connected to a network. For example, considering client A, it is possible to reduce the processing load of image processing in the TV conference system. For this reason, it is often the case that only the images of the speakers are displayed without limiting the images of the users of all the clients participating in the conference, or the number of displayed users is limited, so that the images of all the users cannot be viewed. (Because the processing capability of the client PC cannot be maintained until the image of the user is displayed). Further, in the multipoint TV conference system, even if the number of users displayed on one client is limited, the image data is represented by (the number of clients participating in the conference-1) * (the number of users displayed by one client). There is a problem that minute image data flows through the network, which places a heavy load on the network.

【発明が解決しようとする課題】上述したように、従来
のTV会議システムにおいては、TV会議システムが接
続されているネットワークにおいてのデータ負荷が多大
になり、また前記ネットワークに接続されているクライ
アントにおいては、膨大なデータを処理しなければなら
ず、TV会議システムにおいける膨大なデータ量の問題
があった。この発明は、上記事情に鑑みて為されたもの
で、その目的は、無駄なデータ転送を省き、かつ、従来
のTVシステムよりもクライアントの処理負荷とネット
ワークにかかる負荷を軽減することのできるTV会議シ
ステム、及びTV会議システムの制御方法、及びTV会
議システムを制御するプログラムを格納した記憶媒体を
提供することにある。
As described above, in the conventional TV conference system, the data load on the network to which the TV conference system is connected increases, and the client connected to the network has a large data load. Has to process a huge amount of data, and there is a problem of a huge amount of data in the TV conference system. SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and has as its object to eliminate a useless data transfer and to reduce a processing load on a client and a load on a network as compared with a conventional TV system. It is an object of the present invention to provide a conference system, a control method of the TV conference system, and a storage medium storing a program for controlling the TV conference system.

【課題を解決するための手段】上記目的を達成するため
に、この発明では、送信元クライアント、送信先クライ
アント、前記送信元クライアントと前記送信先クライア
ントを接続するサーバを有する、クライアント・サーバ
システムの構成をとるTV会議システムにおいて、前記
送信元クライアントが音声入力装置から音声データを入
力する入力手段と、前記送信元クライアントが画像入力
装置から画像データを入力する入力手段と、前記送信元
クライアントが、前記入力した音声データをユーザーの
音声であるか環境雑音であるかを判定する前記クライア
ントに設けられた音声データ判定手段と、前記音声デー
タ判定手段でユーザの音声であったと判定された場合、
前記音声データを前記サーバに送信する送信手段と、前
記サーバに送信された前記音声データを受けて、前記サ
ーバが画像データを要求する画像要求コマンドを送信元
クライアントに送信する前記送信手段と、前記サーバか
らの画像データを要求する画像要求コマンドを受けて、
前記送信元クライアントが入力した前記画像データを前
記サーバへ送信する送信手段と、前記サーバが前記送信
元クライアントから送信された前記音声データと前記画
像データを前記送信先クライアントへ送信する送信手段
とを具備することを特徴とするTV会議システムであ
る。また、送信元クライアント、送信先クライアント、
前記送信元クライアントと前記送信先クライアントを接
続するサーバを有する、クライアント・サーバシステム
の構成をとるTV会議システムにおいて、前記送信元ク
ライアントが音声入力装置から音声データを入力する入
力手段と、前記送信元クライアントが画像入力装置から
画像データを入力する入力手段と、前記入力した音声デ
ータを前記サーバに送信する送信手段と、前記サーバに
送信された音声データをユーザーの音声であるか環境雑
音であるかを判定する、前記サーバに設けられた音声デ
ータ判定手段と、前記音声データ判定手段でユーザの音
声であったと判定された場合、前記送信元クライアント
へ画像データを要求する画像要求コマンドを送信する送
信手段と、前記サーバからの前記画像要求コマンドを前
記送信元クライアントが受信した場合、前記送信元クラ
イアントが前記入力した画像データを前記サーバへ送信
する送信手段と、前記サーバが、前記送信元クライアン
トから送信された前記音声データと前記画像データを前
記送信先クライアントに送信する送信手段とを具備する
ことを特徴とするTV会議システムである。また、送信
元クライアント、送信先クライアント、前記送信元クラ
イアントと前記送信先クライアントを接続するサーバを
有する、クライアント・サーバシステムの構成をとるT
V会議システムにおいて、前記送信元クライアントの画
像入力装置から、第1の時点に対応した第1の画像デー
タ、前記第1の画像データと異なる第2の時点に対応し
た第2の画像データを入力する画像入力手段と、前記送
信元クライアントに設けられた、前記第1の画像データ
と前記第2の画像データとを比較する比較判定手段と、
前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信す
る送信手段と、前記サーバに送信した前記画像変化通知
コマンドを受けて、前記サーバが画像データを要求する
画像要求コマンドを送信元クライアントに送信する前記
送信手段と、前記クライアントに送信した前記画像デー
タを要求する画像要求コマンドを受けて、前記送信元ク
ライアントが前記画像入力手段によって入力された画像
をサーバへ送信する送信手段と、前記サーバが、前記送
信元クライアントから前記画像データを送信先クライア
ントに送信する送信手段とを具備することを特徴とする
TV会議システムである。また、送信元クライアント、
送信先クライアント、前記送信元クライアントと前記送
信先クライアントを接続するサーバを有する、クライア
ント・サーバシステムの構成をとるTV会議システムに
おいて、前記送信元クライアントの画像入力装置から、
第1の時点に対応した第1の画像データ、前記第1の画
像データと異なる第2の時点に対応した第2の画像デー
タを入力する画像入力手段と、前記入力した第1の画像
データと前記第2の画像データをサーバに送信する送信
手段と、前記サーバが、前記送信された前記第1の画像
データと前記第2の画像データとを比較する比較判定手
段と、前記比較の結果、前記第1の画像データと前記第
2の画像データとの間に所定の変化があった場合、サー
バが画像変化通知コマンドを前記送信元クライアントへ
送信する送信手段と、前記送信元クライアントが前記画
像入力手段によって入力した前記画像データをサーバへ
送信する送信手段と、前記サーバが、前記送信元クライ
アントから前記画像データを送信先クライアントに送信
する送信手段とを具備することを特徴とするTV会議シ
ステムである。また、送信元クライアント、送信先クラ
イアント、前記送信元クライアントと前記送信先クライ
アントを接続するサーバを有する、クライアント・サー
バシステムの構成をとるTV会議システムにおいて、前
記送信元クライアントが音声入力装置から音声データを
入力する入力手段と、前記送信元クライアントが画像入
力装置から画像データを入力する入力手段と、前記送信
元クライアントが、前記入力した音声データをユーザー
の音声であるか環境雑音であるかを判定する前記クライ
アントに設けられた音声データ判定手段と、前記音声デ
ータ判定手段でユーザの音声であったと判定された場
合、前記音声データを前記サーバに送信する送信手段
と、前記サーバに送信された前記音声データを受けて、
前記サーバが画像データを要求する画像要求コマンドを
送信元クライアントに送信する前記送信手段と、前記サ
ーバからの画像データを要求する画像要求コマンドを受
けて、前記送信元クライアントが入力した前記画像デー
タを前記サーバへ送信する送信手段と、また、前記送信
元クライアントの画像入力装置から、第1の時点に対応
した第1の画像データ、前記第1の画像データと異なる
第2の時点に対応した第2の画像データを入力する画像
入力手段と、前記送信元クライアントに設けられた、前
記第1の画像データと前記第2の画像データとを比較す
る比較判定手段と、前記比較の結果、前記第1の画像デ
ータと前記第2の画像データとの間に所定の変化があっ
た場合、送信元クライアントが画像変化通知コマンドを
前記サーバへ送信する送信手段と、前記サーバに送信し
た前記画像変化通知コマンドを受けて、前記サーバが画
像データを要求する画像要求コマンドを送信元クライア
ントに送信する前記送信手段と、前記クライアントに送
信した前記画像データを要求する画像要求コマンドを受
けて、前記送信元クライアントが前記画像入力手段によ
って入力された画像をサーバへ送信する送信手段と、前
記サーバが前記送信元クライアントから送信された前記
音声データと前記画像データを前記送信先クライアント
へ送信する送信手段とを具備することを特徴とするTV
会議システムである。また、送信元クライアント、送信
先クライアント、前記送信元クライアントと前記送信先
クライアントを接続するサーバを有する、クライアント
・サーバシステムの構成をとるTV会議システムにおい
て、前記送信元クライアントが音声入力装置から音声デ
ータを入力する入力手段と、前記送信元クライアントが
画像入力装置から画像データを入力する入力手段と、前
記入力した音声データを前記サーバに送信する送信手段
と、前記サーバに送信された音声データをユーザーの音
声であるか環境雑音であるかを判定する、前記サーバに
設けられた音声データ判定手段と、前記音声データ判定
手段でユーザの音声であったと判定された場合、前記送
信元クライアントへ画像データを要求する画像要求コマ
ンドを送信する送信手段と、前記サーバからの前記画像
要求コマンドを前記送信元クライアントが受信した場
合、前記送信元クライアントが前記入力した画像データ
を前記サーバへ送信する送信手段と、また、前記送信元
クライアントの画像入力装置から、第1の時点に対応し
た第1の画像データ、前記第1の画像データと異なる第
2の時点に対応した第2の画像データを入力する画像入
力手段と、前記送信元クライアントに設けられた、前記
第1の画像データと前記第2の画像データとを比較する
比較判定手段と、前記比較の結果、前記第1の画像デー
タと前記第2の画像データとの間に所定の変化があった
場合、送信元クライアントが画像変化通知コマンドを前
記サーバへ送信する送信手段と、前記サーバに送信した
前記画像変化通知コマンドを受けて、前記サーバが画像
データを要求する画像要求コマンドを送信元クライアン
トに送信する前記送信手段と、前記クライアントに送信
した前記画像データを要求する画像要求コマンドを受け
て、前記送信元クライアントが前記画像入力手段によっ
て入力された画像をサーバへ送信する送信手段と、前記
サーバが、前記送信元クライアントから前記音声データ
と前記画像データを送信先クライアントに送信する送信
手段とを具備することを特徴とするTV会議システムで
ある。また、送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、前記送信
元クライアントが音声入力装置から音声データを入力す
る入力手段と、前記送信元クライアントが画像入力装置
から画像データを入力する入力手段と、前記送信元クラ
イアントが、前記入力した音声データをユーザーの音声
であるか環境雑音であるかを判定する前記クライアント
に設けられた音声データ判定手段と、前記音声データ判
定手段でユーザの音声であったと判定された場合、前記
音声データを前記サーバに送信する送信手段と、前記サ
ーバに送信された前記音声データを受けて、前記サーバ
が画像データを要求する画像要求コマンドを送信元クラ
イアントに送信する前記送信手段と、前記サーバからの
画像データを要求する画像要求コマンドを受けて、前記
送信元クライアントが入力した前記画像データを前記サ
ーバへ送信する送信手段と、また、前記送信元クライア
ントの画像入力装置から、第1の時点に対応した第1の
画像データ、前記第1の画像データと異なる第2の時点
に対応した第2の画像データを入力する画像入力手段
と、前記入力した第1の画像データと前記第2の画像デ
ータをサーバに送信する送信手段と、前記サーバが、前
記送信された前記第1の画像データと前記第2の画像デ
ータとを比較する比較判定手段と、前記比較の結果、前
記第1の画像データと前記第2の画像データとの間に所
定の変化があった場合、サーバが画像変化通知コマンド
を前記送信元クライアントへ送信する送信手段と、前記
送信元クライアントが前記画像入力手段によって入力し
た前記画像データをサーバへ送信する送信手段と、前記
サーバが、前記送信元クライアントから前記音声データ
と前記画像データを送信先クライアントに送信する送信
手段とを具備することを特徴とするTV会議システムで
ある。また、送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、前記送信
元クライアントが音声入力装置がら音声データを入力す
る入力手段と、前記送信元クライアントが画像入力装置
から画像データを入力する入力手段と、前記入力した音
声データを前記サーバに送信する送信手段と、前記サー
バに送信された音声データをユーザーの音声であるか環
境雑音であるかを判定する、前記サーバに設けられた音
声データ判定手段と、前記音声データ判定手段でユーザ
の音声であったと判定された場合、前記送信元クライア
ントへ画像データを要求する画像要求コマンドを送信す
る送信手段と、前記サーバからの前記画像要求コマンド
を前記送信元クライアントが受信した場合、前記送信元
クライアントが前記入力した画像データを前記サーバへ
送信する送信手段と、また、前記送信元クライアントの
画像入力装置から、第1の時点に対応した第1の画像デ
ータ、前記第1の画像データと異なる第2の時点に対応
した第2の画像データを入力する画像入力手段と、前記
入力した第1の画像データと前記第2の画像データをサ
ーバに送信する送信手段と、前記サーバが、前記送信さ
れた前記第1の画像データと前記第2の画像データとを
比較する比較判定手段と、前記比較の結果、前記第1の
画像データと前記第2の画像データとの間に所定の変化
があった場合、サーバが画像変化通知コマンドを前記送
信元クライアントへ送信する送信手段と、前記送信元ク
ライアントが前記画像入力手段によって入力した前記画
像データをサーバへ送信する送信手段と、前記サーバ
が、前記送信元クライアントから前記音声データと前記
画像データを送信先クライアントに送信する送信手段と
を具備することを特徴とするTV会議システムである。
また、送信元クライアント、送信先クライアント、前記
送信元クライアントと前記送信先クライアントを接続す
るサーバを有する、クライアント・サーバシステムの構
成をとるTV会議システムの制御方法において、前記送
信元クライアントの音声入力装置に音声データを入力
し、前記送信元クライアントの画像入力装置に画像デー
タを入力し、前記送信元クライアントが、前記入力した
音声データをユーザーの音声であるか環境雑音であるか
を判定し、前記ユーザの音声であったと判定された場
合、前記音声データをサーバに送信し、前記サーバに送
信された前記音声データを受けて、前記サーバが画像デ
ータを要求する画像要求コマンドを送信元クライアント
に送信し、前記サーバからの画像データを要求する画像
要求コマンドを受けて、前記送信元クライアントが入力
した前記画像データを前記サーバへ送信し、前記サーバ
が前記送信元クライアントから送信された前記音声デー
タと前記画像データを前記送信先クライアントへ送信す
ることを特徴とするTV会議システムの制御方法であ
る。また、送信元クライアント、送信先クライアント、
前記送信元クライアントと前記送信先クライアントを接
続するサーバを有する、クライアント・サーバシステム
の構成をとるTV会議システムの制御方法において、前
記送信元クライアントの音声入力装置に音声データを入
力し、前記送信元クライアントの画像入力装置に画像デ
ータを入力し、前記入力した音声データをサーバに送信
し、前記サーバに送信された音声データをユーザーの音
声であるか環境雑音であるかを判定し、前記音声データ
判定手段でユーザの音声であったと判定された場合、前
記送信元クライアントへ画像データを要求する画像要求
コマンドを送信し、前記サーバからの前記画像要求コマ
ンドを前記送信元クライアントが受信した場合、前記送
信元クライアントが前記入力した画像データを前記サー
バへ送信し、前記サーバが、前記送信元クライアントか
ら送信された前記音声データと前記画像データを前記送
信先クライアントに送信することを特徴とするTV会議
システムの制御方法である。また、送信元クライアン
ト、送信先クライアント、前記送信元クライアントと前
記送信先クライアントを接続するサーバを有する、クラ
イアント・サーバシステムの構成をとるTV会議システ
ムの制御方法において、前記送信元クライアントの画像
入力装置から、第1の時点に対応した第1の画像デー
タ、前記第1の画像データと異なる第2の時点に対応し
た第2の画像データを入力し、前記送信元クライアント
に設けられた、前記第1の画像データと前記第2の画像
データとを比較し、前記比較の結果、前記第1の画像デ
ータと前記第2の画像データとの間に所定の変化があっ
た場合、送信元クライアントが画像変化通知コマンドを
前記サーバへ送信し、前記サーバに送信した前記画像変
化通知コマンドを受けて、前記サーバが画像データを要
求する画像要求コマンドを送信元クライアントに送信
し、前記クライアントに送信した前記画像データを要求
する画像要求コマンドを受けて、前記送信元クライアン
トが前記画像入力手段によって入力された画像をサーバ
へ送信し、前記サーバが、前記送信元クライアントから
前記画像データを送信先クライアントに送信することを
特徴とするTV会議システムの制御方法。また、送信元
クライアント、送信先クライアント、前記送信元クライ
アントと前記送信先クライアントを接続するサーバを有
する、クライアント・サーバシステムの構成をとるTV
会議システムの制御方法において、前記送信元クライア
ントの画像入力装置から、第1の時点に対応した第1の
画像データ、前記第1の画像データと異なる第2の時点
に対応した第2の画像データを入力し、前記入力した第
1の画像データと前記第2の画像データをサーバに送信
し、前記サーバが、前記送信された前記第1の画像デー
タと前記第2の画像データとを比較し、前記比較の結
果、前記第1の画像データと前記第2の画像データとの
間に所定の変化があった場合、サーバが画像変化通知コ
マンドを前記送信元クライアントへ送信し、前記送信元
クライアントが前記画像入力手段によって入力した前記
画像データをサーバへ送信し、前記サーバが、前記送信
元クライアントから前記画像データを送信先クライアン
トに送信するTV会議システムの制御方法である。ま
た、送信元クライアント、送信先クライアント、前記送
信元クライアントと前記送信先クライアントを接続する
サーバを有する、クライアント・サーバシステムの構成
をとるTV会議システムの制御方法において、前記送信
元クライアントの音声入力装置に音声データを入力し、
前記送信元クライアントの画像入力装置に画像データを
入力し、前記送信元クライアントが、前記入力した音声
データをユーザーの音声であるか環境雑音であるかを判
定し、前記ユーザの音声であったと判定された場合、前
記音声データをサーバに送信し、前記サーバに送信され
た前記音声データを受けて、前記サーバが画像データを
要求する画像要求コマンドを送信元クライアントに送信
し、前記サーバからの画像データを要求する画像要求コ
マンドを受けて、前記送信元クライアントが入力した前
記画像データを前記サーバへ送信し、また、前記送信元
クライアントの画像入力装置から、第1の時点に対応し
た第1の画像データ、前記第1の画像データと異なる第
2の時点に対応した第2の画像データを入力し、前記送
信元クライアントに設けられた、前記第1の画像データ
と前記第2の画像データとを比較し、前記比較の結果、
前記第1の画像データと前記第2の画像データとの間に
所定の変化があった場合、送信元クライアントが画像変
化通知コマンドを前記サーバへ送信し、前記サーバに送
信した前記画像変化通知コマンドを受けて、前記サーバ
が画像データを要求する画像要求コマンドを送信元クラ
イアントに送信し、前記クライアントに送信した前記画
像データを要求する画像要求コマンドを受けて、前記送
信元クライアントが前記画像入力手段によって入力され
た画像をサーバへ送信し、前記サーバが前記送信元クラ
イアントから送信された前記音声データと前記画像デー
タを前記送信先クライアントへ送信ことを特徴とするT
V会議システムの制御方法である。また、送信元クライ
アント、送信先クライアント、前記送信元クライアント
と前記送信先クライアントを接続するサーバを有する、
クライアント・サーバシステムの構成をとるTV会議シ
ステムの制御方法において、前記送信元クライアントの
音声入力装置に音声データを入力し、前記送信元クライ
アントの画像入力装置に画像データを入力し、前記入力
した音声データをサーバに送信し、前記サーバに送信さ
れた音声データをユーザーの音声であるか環境雑音であ
るかを判定し、前記ユーザの音声であったと判定された
場合、前記送信元クライアントへ画像データを要求する
画像要求コマンドを送信し、前記サーバからの前記画像
要求コマンドを前記送信元クライアントが受信した場
合、前記送信元クライアントが前記入力した画像データ
を前記サーバへ送信し、また、前記送信元クライアント
の画像入力装置から、第1の時点に対応した第1の画像
データ、前記第1の画像データと異なる第2の時点に対
応した第2の画像データを入力し、前記送信元クライア
ントに設けられた、前記第1の画像データと前記第2の
画像データとを比較し、前記比較の結果、前記第1の画
像データと前記第2の画像データとの間に所定の変化が
あった場合、送信元クライアントが画像変化通知コマン
ドを前記サーバへ送信し、前記サーバに送信した前記画
像変化通知コマンドを受けて、前記サーバが画像データ
を要求する画像要求コマンドを送信元クライアントに送
信し、前記クライアントに送信した前記画像データを要
求する画像要求コマンドを受けて、前記送信元クライア
ントが前記画像入力手段によって入力された画像をサー
バへ送信し、前記サーバが、前記送信元クライアントか
ら前記音声データと前記画像データを送信先クライアン
トに送信することを特徴とするTV会議システムの制御
方法である。また、送信元クライアント、送信先クライ
アント、前記送信元クライアントと前記送信先クライア
ントを接続するサーバを有する、クライアント・サーバ
システムの構成をとるTV会議システムの制御方法にお
いて、前記送信元クライアントの音声入力装置に音声デ
ータを入力し、前記送信元クライアントの画像入力装置
に画像データを入力し、前記送信元クライアントが、前
記入力した音声データをユーザーの音声であるか環境雑
音であるかを判定し、前記音声データ判定手段でユーザ
の音声であったと判定された場合、前記音声データをサ
ーバに送信し、前記サーバに送信された前記音声データ
を受けて、前記サーバが画像データを要求する画像要求
コマンドを送信元クライアントに送信し、前記サーバか
らの画像データを要求する画像要求コマンドを受けて、
前記送信元クライアントが入力した前記画像データを前
記サーバへ送信し、また、前記送信元クライアントの画
像入力装置から、第1の時点に対応した第1の画像デー
タ、前記第1の画像データと異なる第2の時点に対応し
た第2の画像データを入力し、前記入力した第1の画像
データと前記第2の画像データをサーバに送信し、前記
サーバが、前記送信された前記第1の画像データと前記
第2の画像データとを比較し、前記比較の結果、前記第
1の画像データと前記第2の画像データとの間に所定の
変化があった場合、サーバが画像変化通知コマンドを前
記送信元クライアントへ送信し、前記送信元クライアン
トが前記画像入力手段によって入力した前記画像データ
をサーバへ送信し、前記サーバが、前記送信元クライア
ントから前記音声データと前記画像データを送信先クラ
イアントに送信することを特徴とするTV会議システム
の制御方法である。また、送信元クライアント、送信先
クライアント、前記送信元クライアントと前記送信先ク
ライアントを接続するサーバを有する、クライアント・
サーバシステムの構成をとるTV会議システムの制御方
法において、前記送信元クライアントの音声入力装置に
音声データを入力し、前記送信元クライアントの画像入
力装置に画像データを入力し、前記入力した音声データ
をサーバに送信し、前記サーバに送信された音声データ
をユーザーの音声であるか環境雑音であるかを判定し、
前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信し、前記サーバからの前
記画像要求コマンドを前記送信元クライアントが受信し
た場合、前記送信元クライアントが前記入力した画像デ
ータを前記サーバへ送信し、また、前記送信元クライア
ントの画像入力装置から、第1の時点に対応した第1の
画像データ、前記第1の画像データと異なる第2の時点
に対応した第2の画像データを入力し、前記入力した第
1の画像データと前記第2の画像データをサーバに送信
し、前記サーバが、前記送信された前記第1の画像デー
タと前記第2の画像データとを比較し、前記比較の結
果、前記第1の画像データと前記第2の画像データとの
間に所定の変化があった場合、サーバが画像変化通知コ
マンドを前記送信元クライアントへ送信し、前記送信元
クライアントが前記画像入力手段によって入力した前記
画像データをサーバへ送信し、前記サーバが、前記送信
元クライアントから前記音声データと前記画像データを
送信先クライアントに送信することを特徴とするTV会
議システムの制御方法である。また、前記送信元クライ
アントからサーバへ送信する画像データは、前記送信元
クライアントから入力された画像データで、入力された
時点が異なる画像データとの画像圧縮方式による差分デ
ータであることを特徴とする請求項9から請求項16の
いずれか1つに記載のTV会議システムの制御方法であ
る。また、クライアント・サーバシステムのTV会議シ
ステムに用いられ、前記TV会議システムのクライアン
トを制御するプログラムを格納した記憶媒体であって、
入力した音声データをユーザーの音声であるか環境雑音
であるかを判定する手順と、前記音声データを前記サー
バに送信する手順と、前記サーバからの画像データを要
求する画像要求コマンドを受けて、前記クライアントが
入力した前記画像データを前記サーバへ送信する手順
と、前記サーバから前記音声データと前記画像データを
受信する手順とを具備することを特徴とするTV会議シ
ステムのクライアントを制御するプログラムを格納した
記憶媒体である。また、クライアント・サーバシステム
のTV会議システムに用いられ、前記TV会議システム
のクライアントを制御するプログラムを格納した記憶媒
体であって、入力した音声データを前記サーバに送信す
る手順と、前記サーバから送信される画像データを要求
する画像要求コマンドを受信する手順と、前記サーバか
らの前記画像要求コマンドを受信した場合、前記クライ
アントが前記入力した画像データを前記サーバへ送信す
る手順と、前記サーバからの前記音声データと前記画像
データを受信する手順とを具備することを特徴とするT
V会議システムのクライアントを制御するプログラムを
格納した記憶媒体である。また、クライアント・サーバ
システムのTV会議システムに用いられ、前記TV会議
システムのクライアントを制御するプログラムを格納し
た記憶媒体であって、入力した第1の画像データと第2
の画像データとを比較する手順と、前記比較の結果、前
記第1の画像データと前記第2の画像データとの間に所
定の変化があった場合、画像変化通知コマンドを前記サ
ーバへ送信する手順と、前記サーバからの画像データを
要求する画像要求コマンドを受信する手順と、前記サー
バから受信した前記画像データを要求する画像要求コマ
ンドを受けて、前記画像入力手段によって入力された画
像をサーバへ送信する手順と、前記サーバからの前記画
像データ受信する手順とを具備することを特徴とするT
V会議システムのクライアントを制御するプログラムを
格納した記憶媒体である。また、クライアント・サーバ
システムのTV会議システムに用いられ、前記TV会議
システムのクライアントを制御するプログラムを格納し
た記憶媒体であって、入力した第1の画像データと前記
第2の画像データをサーバに送信する手順と、前記サー
バからの画像変化通知コマンドを受信する手順と、前記
画像入力手段によって入力した前記画像データをサーバ
へ送信する手順と、前記サーバからの前記画像データを
受信する手順とを具備することを特徴とするTV会議シ
ステムのクライアントを制御するプログラムを格納した
記憶媒体である。また、クライアント・サーバシステム
のTV会議システムに用いられ、前記TV会議システム
のサーバを制御するプログラムを格納した記憶媒体であ
って、前記クライアントからの音声データを受信する手
順と、画像データを要求する画像要求コマンドを送信元
クライアントに送信する手順と、前記送信元クライアン
トからの画像データを受信する手順と、前記送信元クラ
イアントからの前記音声データと前記画像データを送信
先クライアントへ送信する手順とを具備することを特徴
とするTV会議システムのサーバを制御するプログラム
を格納した記憶媒体である。また、クライアント・サー
バシステムのTV会議システムに用いられ、前記TV会
議システムのサーバを制御するプログラムを格納した記
憶媒体であって、前記クライアントからの音声データを
受信する手順と、前記音声データをユーザーの音声であ
るか環境雑音であるかを判定する手順と、前記手順によ
り、ユーザの音声であったと判定した場合、送信元クラ
イアントへ画像データを要求する画像要求コマンドを送
信する手順と、前記送信元クライアントからの画像デー
タを受信する手順と、前記送信元クライアントから受信
した前記音声データと前記画像データを送信先クライア
ントに送信する手順とを具備することを特徴とするTV
会議システムのサーバを制御するプログラムを格納した
記憶媒体である。また、クライアント・サーバシステム
のTV会議システムに用いられ、前記TV会議システム
のサーバを制御するプログラムを格納した記憶媒体であ
って、送信元クライアントに設けられた、入力した第1
の画像データと第2の画像データとを比較する手順と、
送信元クライアントからの画像変化通知コマンドを受信
する手順と、画像データを要求する画像要求コマンドを
送信元クライアントに送信する手順と、前記送信元クラ
イアントからの前記画像入力手順によって入力された画
像を受信する手順と、前記送信元クライアントから受信
した前記画像データを送信先クライアントに送信する手
順とを具備することを特徴とするTV会議システムのサ
ーバを制御するプログラムを格納した記憶媒体である。
また、クライアント・サーバシステムのTV会議システ
ムに用いられ、前記TV会議システムのサーバを制御す
るプログラムを格納した記憶媒体であって、送信元クラ
イアントから入力した第1の画像データと前記第2の画
像データを受信する手順と、前記受信された前記第1の
画像データと前記第2の画像データとを比較する手順
と、画像変化通知コマンドを前記送信元クライアントへ
送信する手順と、前記送信元クライアントからの画像デ
ータを受信する手順と、前記送信元クライアントから受
信した前記画像データを送信先クライアントに送信する
手順とを具備することを特徴とするTV会議システムの
サーバを制御するプログラムを格納した記憶媒体であ
る。上記構成を有するTV会議システム、及びTV会議
システムの制御方法、及びTV会議システムを制御する
プログラムを格納した記憶媒体によれば、ユーザが発言
している場合や、ユーザが大きく動いた場合等の入力画
像に変化が生じた場合にのみ、ネットワーク内で画像デ
ータを送受信し、前記の場合以外は画像データを送信し
ないことで、必要な画像データだけを通信し、従来のT
V会議の画像通信方式よりも、クライアントの処理負荷
とネットワークの負荷を軽減することが可能となる。
[MEANS FOR SOLVING THE PROBLEMS] To achieve the above object
In the present invention, the source client and the destination client
Client, the source client and the destination client
Client / server with a server to connect clients
In a TV conference system having a system configuration,
The source client inputs voice data from the voice input device.
Input means for inputting, and the source client inputs an image.
Input means for inputting image data from a device, and the transmission source
The client converts the input voice data to the user's
The client for determining whether it is voice or environmental noise;
Audio data determination means provided in the audio data,
If it is determined by the data determination means that the voice of the user,
Transmitting means for transmitting the audio data to the server;
Receiving the voice data transmitted to the server,
Server sends an image request command to request image data
The transmission means for transmitting to the client and the server
Receiving an image request command requesting these image data,
The image data input by the source client is
Transmitting means for transmitting to the server;
The audio data transmitted from the former client and the image
Transmission means for transmitting image data to the destination client
TV conference system characterized by comprising:
You. Also, the source client, destination client,
Connect the source client and the destination client
Client-server system having a server connected
In the TV conference system having the configuration of
The client inputs voice data from the voice input device.
Input means and the source client from the image input device
Input means for inputting image data, and the input audio data;
Transmitting means for transmitting data to the server;
If the transmitted voice data is the user's voice or
A sound data provided in the server to determine whether the sound is sound.
Data determination means and the sound data determination means
If it is determined to be a voice, the source client
To send an image request command requesting image data to
Communication means and the image request command from the server.
When the source client receives the message, the source client
Client sends the input image data to the server
Transmitting means for transmitting, and the server
The audio data and the image data transmitted from the
Transmission means for transmitting to the destination client
This is a TV conference system characterized in that: Also send
Source client, destination client, source client
Server connecting the client to the destination client
T having a client-server system configuration
In the V conference system, the image of the source client is displayed.
A first image data corresponding to a first time point from the image input device;
Corresponding to a second point in time different from the first image data.
Image input means for inputting the second image data,
The first image data provided in the client device
Comparing and comparing the second image data with the second image data;
As a result of the comparison, the first image data and the second image data
If there is a predetermined change with the image data, the source
Client sends an image change notification command to the server.
Transmitting means, and the image change notification transmitted to the server.
Upon receiving a command, the server requests image data
Sending an image request command to the source client
Transmitting means; and the image data transmitted to the client.
Receiving the image request command requesting the
Image input by the client by the image input means
Transmission means for transmitting the transmission to the server, and the server
The client transmits the image data from the source client
Transmission means for transmitting to the client
This is a TV conference system. Also, the sending client,
The destination client, the source client and the destination
A client with a server that connects the trusted clients
Video conferencing system that has the configuration of
In the above, from the image input device of the source client,
First image data corresponding to a first time point,
Second image data corresponding to a second time point different from the image data
Image input means for inputting data, and the input first image
Sending the data and the second image data to a server
Means and the server is adapted to transmit the first image
Comparison determining means for comparing data with the second image data
And the result of the comparison, the first image data and the second
When there is a predetermined change between the image data of
Sends an image change notification command to the source client
Transmitting means for transmitting, and the source client
The image data input by the image input means to the server
Transmitting means for transmitting, and the server comprising:
Client sends the image data to the destination client
TV conference system, comprising:
Stem. Also, the source client, destination client
Client, the source client and the destination client
Client server with server to connect clients
In a TV conference system that takes the configuration of
The source client sends voice data from the voice input device.
Input means for inputting, and the source client
Input means for inputting image data from an input device;
The former client sends the input audio data to the user
The client to determine whether the sound is ambient noise or environmental noise.
An audio data determination means provided in the client;
Data is determined to be the user's voice by the data determination means.
Transmitting means for transmitting the audio data to the server
And receiving the audio data transmitted to the server,
The server issues an image request command requesting image data.
The transmitting means for transmitting to the transmission source client;
Receives an image request command requesting image data from the
The image data input by the source client.
Transmitting means for transmitting data to the server;
From the client's image input device to the first point in time
First image data that differs from the first image data
Image for inputting second image data corresponding to a second time point
An input means, provided in the source client,
Comparing the first image data with the second image data;
Comparing and judging the first image data as a result of the comparison.
A predetermined change between the data and the second image data.
The source client sends an image change notification command.
Transmitting means for transmitting to the server; transmitting means for transmitting to the server;
Receiving the image change notification command, the server
Source client sends an image request command to request image data
Sending means for sending to the client, and sending means to the client.
Received an image request command requesting the received image data.
Then, the transmission source client is operated by the image input means.
Transmission means for transmitting the image input to the server
The server sent from the source client.
Sending the audio data and the image data to the destination client
And a transmitting means for transmitting to the TV
It is a conference system. Also, send client, send
Destination client, source client and destination
A client with a server that connects the client
・ In a TV conference system with a server system configuration
The source client sends a voice
Input means for inputting data, and
Input means for inputting image data from an image input device;
Transmitting means for transmitting the input voice data to the server
And the voice data transmitted to the server
The server determines whether it is voice or environmental noise.
Provided voice data determination means, and the voice data determination means
If it is determined by the means that the voice is the user's voice,
Image request frame that requests image data from the originating client
Transmitting means for transmitting a command, and the image from the server.
When the request command is received by the source client
If the source client inputs the image data
Transmitting means for transmitting to the server, and the transmission source
From the client's image input device,
First image data, and a first image data different from the first image data.
Image input for inputting the second image data corresponding to the time point 2
Force means, provided in the source client,
Comparing the first image data with the second image data
Comparing and judging the first image data as a result of the comparison;
There is a predetermined change between the data and the second image data.
If the sending client sends an image change notification command before
Transmitting means for transmitting to the server, and transmitting to the server
Upon receiving the image change notification command, the server
Source client sends image request command to request data
Transmitting means to the client and transmitting to the client
Received the image request command requesting the image data
The source client is operated by the image input means.
Transmitting means for transmitting the input image to the server,
A server transmits the voice data from the source client;
And transmitting the image data to a destination client
TV conference system characterized by comprising means
is there. Also, the source client and destination client
, The source client and the destination client
Client / server system having a server for connecting
In a TV conference system having a system configuration,
Former client inputs voice data from voice input device
Input means, and the source client is an image input device.
Input means for inputting image data from the
Client inputs the input voice data into the user's voice.
The client for determining whether the noise is environmental noise
Voice data determination means provided in the
If it is determined by the determination means that the voice of the user,
Transmitting means for transmitting voice data to the server;
Receiving the audio data transmitted to the server,
Sends an image request command requesting image data to the source
The transmitting means for transmitting to the client,
Upon receiving an image request command requesting image data,
The image data input by the transmission source client is
Transmitting means for transmitting to the client,
From the image input device of the
Image data, a second time point different from the first image data
Input means for inputting the second image data corresponding to the image
And the input first image data and the second image data.
Transmitting means for transmitting data to a server; and
The transmitted first image data and the second image data
Comparison determination means for comparing the data with the
The location between the first image data and the second image data.
If there is a certain change, the server sends an image change notification command
Transmitting means for transmitting to the transmission source client,
The source client inputs the image using the image input unit.
Transmitting means for transmitting the image data to a server,
A server transmits the voice data from the source client;
And transmitting the image data to a destination client
TV conference system characterized by comprising means
is there. Also, the source client and destination client
, The source client and the destination client
Client / server system having a server for connecting
In a TV conference system having a system configuration,
Former client inputs voice data from voice input device
Input means, and the source client is an image input device.
Input means for inputting image data from the
Transmitting means for transmitting voice data to the server;
The audio data sent to the server
Sound provided on the server to determine whether the noise is ambient noise
Voice data determination means; and
If it is determined that the voice is
Send an image request command to request
Transmitting means, and the image request command from the server
Is received by the source client, the source
Client sends the input image data to the server
Sending means for sending, and the sending client
A first image data corresponding to a first point in time is input from the image input device.
Data, corresponding to a second time point different from the first image data
Image input means for inputting the obtained second image data;
The input first image data and the second image data are supported.
Transmitting means for transmitting to the server, and the server
The obtained first image data and the second image data
Comparing means for comparing, the result of the comparison, the first
A predetermined change between image data and the second image data
The server sends the image change notification command
Transmitting means for transmitting to the source client;
The image input by the client through the image input means.
Transmitting means for transmitting image data to a server, and the server
However, the voice data and the
Transmitting means for transmitting image data to a destination client;
A TV conference system comprising:
In addition, the source client, the destination client,
Connect the source client and the destination client
Of a client / server system having a server
In the method for controlling a TV conference system,
Input voice data to the voice input device of the client
The image data is input to the image input device of the transmission source client.
Data, and the source client inputs the
Whether the audio data is user's voice or environmental noise
Is determined, and if it is determined that the voice is the voice of the user,
The audio data to the server and send it to the server.
The server receives the transmitted audio data and the server
Client that sends an image request command to request data
To send image data from the server
Upon receiving the request command, the source client inputs
Transmitting the image data to the server,
Is the audio data transmitted from the source client.
Data and the image data to the destination client.
A method for controlling a TV conference system, comprising:
You. Also, the source client, destination client,
Connect the source client and the destination client
Client-server system having a server connected
In the control method of the TV conference system having the configuration of
Enter voice data into the voice input device of the sending client.
To the image input device of the source client.
Data and send the input voice data to the server
The voice data transmitted to the server is
Determining whether the sound is voice or environmental noise;
If the determination unit determines that the voice is the user's voice, the
Image request to request image data from the sending client
A command, and transmits the image request frame from the server.
If the sending client receives the
The originating client transmits the input image data to the server.
Server, and the server is the source client
The audio data and the image data transmitted from the
TV conference characterized by sending to a trusted client
This is a system control method. Also, the source client
Client, the destination client, the source client and the
A client that has a server that connects the destination client
TV conference system with client / server system configuration
In the method for controlling the system, the image of the source client
The first image data corresponding to the first time point is input from the input device.
Corresponding to a second point in time different from the first image data.
The second client inputs the second image data
, The first image data and the second image
Data, and as a result of the comparison, the first image data
A predetermined change between the data and the second image data.
The source client sends an image change notification command.
Transmitting the image modification transmitted to the server;
Server receives image data, the server requests image data.
Send the image request command to the sending client
Requesting the image data transmitted to the client
Receiving the image request command to
The server inputs an image input by the image input means to a server.
To the server, the server from the source client
Transmitting the image data to a destination client;
A method for controlling a TV conference system. Also, the sender
Client, destination client, source client
Server that connects the client to the destination client.
TV with client / server system configuration
In the method for controlling a conference system, the source client
From the image input device of the
Image data, a second time point different from the first image data
And input the second image data corresponding to
Sending the first image data and the second image data to the server
The server transmits the first image data
Data is compared with the second image data.
As a result, the first image data and the second image data
If there is a predetermined change during the period, the server
Command to the source client, and the source
The client input by the image input means
Sending the image data to a server, wherein the server
The source client sends the image data to the destination client
This is a control method of the TV conference system for transmitting to the TV conference system. Ma
Source client, destination client,
Connect the source client and the destination client
Configuration of client-server system with server
The method of controlling a TV conference system, comprising:
Input voice data into the voice input device of the former client,
Image data to the image input device of the source client
Input, and the source client inputs the input voice
Determine whether data is user voice or environmental noise
If it is determined that the voice is the user's voice,
The voice data is transmitted to the server, and transmitted to the server.
Receiving the audio data, the server
Send the requested image request command to the sending client
And an image request code for requesting image data from the server.
Command before the source client has entered it
Transmitting the image data to the server;
From the client's image input device,
First image data, and a first image data different from the first image data.
2, the second image data corresponding to the time point
The first image data provided in the client device
And the second image data, and as a result of the comparison,
Between the first image data and the second image data
If there is a predetermined change, the source client
Sends the activation notification command to the server and sends it to the server.
Receiving the image change notification command
Sends an image request command requesting image data to the source
Sent to the client and sent to the client.
Upon receiving an image request command requesting image data,
The client is input by the image input means.
Transmits the image to the server, and the server
The audio data and the image data transmitted from the client.
T to the destination client.
This is a control method of the V conference system. Also, the source client
Client, destination client, source client
And a server connecting the destination client,
TV conference system with client / server system configuration
In the method for controlling the system, the transmission source client
Voice data is input to a voice input device, and
Input image data into the image input device of Ant
Transmitted to the server, and transmitted to the server.
The captured audio data as the user's voice or environmental noise.
And it was determined that the voice was the user's voice.
Requesting image data from the source client
Send an image request command and send the image from the server
When the request command is received by the source client
If the source client inputs the image data
To the server, and the source client
A first image corresponding to a first point in time
Data at a second point in time different from the first image data
Input the second image data corresponding to the
The first image data and the second image data
Comparing the image data with the first image.
A predetermined change between the image data and the second image data
If there is, the source client sends an image change notification command.
The image transmitted to the server.
Upon receiving the image change notification command, the server
Sends an image request command requesting
The image data transmitted to the client.
Receiving the image request command
The image input by the image input means.
Server, and the server is the source client
From the destination client to the audio data and the image data.
Control of a TV conference system characterized by transmitting to a TV conference system
Is the way. Also, the source client and destination client
Client, the source client and the destination client
Client / server with a server to connect clients
In the control method of the TV conference system taking the system configuration
And the voice input device of the source client
Data input to the image input device of the source client.
Enter the image data in the
If the input voice data is the user's voice or
The sound data determination means determines whether the sound is a sound.
If the audio data is determined to be
The voice data transmitted to the server and transmitted to the server.
Receiving the image request from the server
Sends a command to the sending client and sends it to the server
Receiving an image request command requesting these image data,
The image data input by the source client is
To the server, and
A first image data corresponding to a first time point from the image input device;
Corresponding to a second point in time different from the first image data.
Input second image data, and the input first image
Transmitting the data and the second image data to a server,
A server configured to transmit the first image data and
Comparing with the second image data, and as a result of the comparison,
A predetermined distance between the first image data and the second image data;
If there is a change, the server sends an image change notification command before
To the source client, the source client
The image data input by the image input means
To the server, and the server communicates with the source client.
Client sends the audio data and the image data to the destination
TV conference system for transmitting to a client
Is a control method. Also, the source client, destination
Client, the source client and the destination client
Client / server with server to connect clients
How to control a TV conference system with a server system configuration
In the method, the voice input device of the source client
Enter the audio data and enter the image of the source client.
Input image data to the input device, and the input audio data
To the server, the audio data transmitted to the server
Is determined to be the user's voice or environmental noise,
The voice data determination means determines that the voice is a user voice
Request, image data is required to the source client.
Send an image request command to request from the server
The source client receives the image request command.
The image data that the source client inputs.
Data to the server and the source client
From the image input device of the
Image data, a second time point different from the first image data
And input the second image data corresponding to
Sending the first image data and the second image data to the server
The server transmits the first image data
Data is compared with the second image data.
As a result, the first image data and the second image data
If there is a predetermined change during the period, the server
Command to the source client, and the source
The client input by the image input means
Sending the image data to a server, wherein the server
The audio data and the image data from the original client
TV meeting characterized by sending to the destination client
This is a control method of the conference system. In addition, the source client
The image data transmitted from the ant to the server is based on the source
The image data input from the client
Difference data between image data at different points in time using image compression
17. The method according to claim 9, wherein
The control method of the TV conference system according to any one of the above,
You. In addition, the TV conference system of the client / server system
System, the client of the TV conference system
A storage medium storing a program for controlling the
The input voice data is the user's voice or environmental noise
The audio data is stored in the server.
To send data to the server and image data from the server.
Receiving the image request command
Procedure for transmitting the input image data to the server
And the audio data and the image data from the server.
Receiving a TV conference system.
Stored a program that controls the system's client
It is a storage medium. Client / server system
The TV conference system,
Storage medium storing the program that controls the client
Transmitting the input voice data to the server.
Requesting image data sent from the server
Receiving an image request command to perform
Receiving the image request command from the
The ant sends the input image data to the server.
The audio data and the image from the server
Receiving the data.
A program that controls the client of the V conference system
This is the storage medium in which the data is stored. Also client / server
The TV conference used in the TV conference system of the system.
Stores programs that control system clients
The first image data and the second image data
Comparing the image data with the image data of
The location between the first image data and the second image data.
If there is a certain change, the image change notification command
Server and the image data from the server.
Receiving a requested image request command;
Image request frame for requesting the image data received from the
Receiving the command, the image input by the image input means.
Transmitting the image to the server; and transmitting the image from the server.
Receiving the image data.
A program that controls the client of the V conference system
This is the storage medium in which the data is stored. Also client / server
The TV conference used in the TV conference system of the system.
Stores programs that control system clients
A storage medium, wherein the input first image data and the
Transmitting the second image data to the server;
Receiving an image change notification command from the server;
The image data input by the image input means is stored in a server
And transmitting the image data from the server.
Receiving a TV conference system.
Stored a program that controls the system's client
It is a storage medium. Client / server system
The TV conference system,
Storage medium storing a program for controlling the server
Means for receiving voice data from the client
Order and source of image request command to request image data
Sending to the client, the source client
Receiving the image data from the
Transmit the audio data and the image data from the client
Sending to the destination client
To control the server of the TV conference system
Is a storage medium in which is stored. In addition, client services
Used in the TV conference system of the
Of the program that controls the server of the conference system
A storage medium for storing audio data from the client.
Receiving, and transmitting the voice data in a user's voice.
And whether the noise is environmental noise.
If the source voice is determined to be
Sends an image request command to the client to request image data.
And the image data from the source client.
And receiving from the source client.
Destination audio data and the image data
And transmitting to the client.
Stored a program to control the conference system server
It is a storage medium. Client / server system
The TV conference system,
Storage medium storing a program for controlling the server
Therefore, the input first number provided in the transmission source client
Comparing the first image data with the second image data;
Receives image change notification command from source client
And an image request command to request image data.
Sending to the source client;
Image input from the client by the image input procedure.
Receiving an image and receiving from the source client
Transmitting the image data to the destination client
And a video conference system.
A storage medium storing a program for controlling the server.
In addition, the TV conference system of the client / server system
To control the server of the TV conference system.
Storage medium that stores programs
The first image data input from the client and the second image data.
Receiving image data; and receiving the received first data.
Procedure for comparing image data with the second image data
And sends an image change notification command to the source client.
The transmitting procedure and the image data from the source client
Receiving the data from the source client.
Sending the received image data to a destination client
And a TV conference system.
A storage medium storing a program for controlling the server.
You. TV conference system having the above configuration, and TV conference
System control method and TV conference system control
According to the storage medium storing the program, the user
Input screen when the user is
Only when there is a change in the image, the image
Data is transmitted and received, and image data is transmitted
By transmitting only necessary image data, the conventional T
Processing load of client rather than video communication method of V conference
Thus, the load on the network can be reduced.

【発明の実施の形態】以下、本発明の実施形態を、図面
を参照して説明する。なお、全図面において、共通する
部分には、共通する参照符号を付す。 [第1の実施形態]図1は、本発明の第1の実施形態に
係る概略図である。図2は、本発明の第1の実施形態に
係る音声・画像通信のシーケンスを示す図である。ま
た、図17は本発明の第1の実施形態に係るクライアン
ト・サーバのシステムの構成図である送信元クライアン
ト(クライアントA1102、クライアントB1103
またはクライアントC1104)、送信先クライアント
(クライアントA1102が送信元クライアントのとき
には、クライアントB1103またはクライアントC1
104であり、クライアントB1103が送信元クライ
アントのときには、クライアントA1102またはクラ
イアントC1104であり、クライアントC1104が
送信元クライアントのときには、クライアントA110
2またはクライアントB1103)、前記送信元クライ
アントと前記送信先クライアントを接続するサーバを有
する、クライアント・サーバシステムの構成をとるTV
会議システムについて説明すると、前記送信元クライア
ントの音声入力装置(マイク)に音声データを入力する
入力し、前記送信元クライアントの画像入力装置に画像
データを入力する。次に前記送信元クライアントが、前
記入力した音声データをユーザーの音声であるか環境雑
音であるかを判定する前記クライアントに設けられた音
声データを判定し、前記音声データ判定手段でユーザの
音声であったと判定された場合、前記音声データをサー
バに送信する。さらに、前記サーバに送信された前記音
声データを受けて、前記サーバが画像データを要求する
画像要求コマンドを送信元クライアントに送信し、前記
サーバがらの画像データを要求する画像要求コマンドを
受けて、前記送信元クライアントが入力した前記画像デ
ータを前記サーバへ送信する。次に、前記サーバが前記
送信元クライアントから送信された前記音声データと前
記画像データを前記送信先クライアントへ送信する。さ
らに詳細に説明すると、図1に示すような、各クライア
ント(1101〜1104まで)が、ネットワークイン
タフェース、マイク、スピーカ、マイクやスピーカへア
ナログ音声信号の入出力を行うサウンドインターフェー
ス、カメラ、カメラからの画像入力を行うギャプチャド
ライバー及びモニタを持ち、マイクから音声データを入
力する入力手段と、カメラから画像データを入力する入
力手段と、送信される音声データを受信し、スピーカへ
出力する手段と、送信される画像データを受信し、モニ
タに出力する手段とを持つパソコン(PC)やワークス
テーション(WS)等のデータ通信クライアントをクラ
イアントとし、ネットワークインタフェースを持ち、ク
ライアントが送信する音声データ、画像データを受信
し、送信元以外の会議参加中のクライアントへ送信する
送信手段とを持つPCやWS等のデータ通信クライアン
トをサーバとして、1対1、もしくは、多地点間のTV
会議を行うシステムを、クライアント・サーバのシステ
ム構成をとるTV会議システムとする。図17には、ク
ライアント・サーバのシステム構成をとるTV会議シス
テムについて、さらに詳しく示した。図17に示すよう
に、前記クライアントには、ネットワークに接続される
ネットワークインターフェイス部を備え、前記ネットワ
ークインターフェイス部には、画像データコーデック
部、音声データコーデック部及び制御コマンド処理部が
接続されている。また、前記音声データコーデック部に
は、音声データ解析部が接続されており、前記画像デー
タコーデック部、音声データコーデック部、制御コマン
ド処理部及び音声データ解析部を制御するクライアント
機能制御部が設置されている。さらに、前記画像データ
コーデック部には、画像データ入出力部を介してカメラ
及びモニタが接続されており、前記音声データコーデッ
ク部には、音声データ入出力部を介して、マイク及びス
ピーカが接続されている。また、クライアントは、前記
のすべての部位を制御する装置制御部を備えている。ま
た、前記サーバには、ネットワークに接続されるネット
ワークインターフェイス部を備え、前記ネットワークイ
ンターフェイス部には、画像データ配信処理部、音声デ
ータ配信処理部及び制御コマンド処理部が接続されてお
り、前記画像データ配信処理部、音声データ配信処理部
及び制御コマンド処理部を制御するサーバ機能制御部が
設置されている。図1に示すように、送信元クライアン
ト(クライアントA1102またはクライアントB11
03)の前記TV会議システムの音声入力装置(マイ
ク)に音声データを入力し、前記送信元クライアント
が、前記入力した音声データをユーザーの音声であるか
環境雑音であるかを判定し、前記ユーザの音声であった
と判定された場合、前記音声データをサーバに送信す
る。前記サーバに送信された前記音声データを受けて、
サーバから画像データを要求する画像要求コマンドを送
信元クライアントに送信し、前記サーバから画像データ
を要求する画像要求コマンドを受けて、送信元クライア
ントから入力された画像データをサーバへ送信する。さ
らに前記サーバが前記送信元クライアントから送信され
た音声データと画像データを送信先クライアント(送信
元クライアントがクライアントA1102の場合には、
クライアントB1103であり、送信元クライアントが
クライアントB1103の場合には、クライアントA1
102)へ送信するものであり、前記送信元クライアン
トからサーバへ送信する画像データは、前記送信元クラ
イアントから入力された画像データである。さらに詳し
く説明すると、図1及び図2に示すように、本発明の第
1の実施の形態は、ネットワーク1104に、サーバ1
101及びクライアントA1102、クライアントB1
103がネットワークで繋がれた環境で、1対1のTV
会議を行っているものであり、前記送信元クライアント
がクライアントA1102の場合、クライアントA11
02は、マイクから入力した音声データをそのままサー
バへ送信するのではなく、入力された音声データがユー
ザの音声であるか、環境雑音であるかをクライアントA
1102が判定する。そして、入力した音声データがユ
ーザの音声であると判定した場合、入力した音声データ
をサーバ1101に送信する。この時の判定手段には、
例えば、従来からあるような無音圧縮の技術等を用いれ
ば、判定出来る。これにより、クライアントA1102
はユーザが発言した時にのみ、音声データをサーバ11
01へ送信する。サーバ1101は、受信した音声デー
タを、前記送信先クライアントをクライアントB110
3とする場合、クライアントB1103へ送信する。こ
の際、サーバ1101は、音声データ送信元クライアン
トA1102へ、画像を送信することを要求する画像要
求コマンドを送信する。そして、前記画像要求コマンド
を受信したクライアントA1102は、カメラから入力
された画像データをサーバ1101へ送信し、画像デー
タを受信したサーバ1101は、受信した画像データを
送信先クライアントB1103へ送信(配信)する。こ
の結果、ユーザが発言した場合以外の前記画像は静止画
となるが、TV会議においては表示される画面内容は、
相手の上半身であり、大きな変化が無い限りは、静止画
となっていいることが多く、画像が静止画となってもユ
ーザ側で気になることは少ない。また、発言時には、画
像データは接続先に転送されるので、ユーザの口の動き
は接続先に伝えられる。これにより、効率釣に画像デー
タを通信でき、クライアント側での処理負荷、ネットワ
ーク負荷を軽減することが可能となる。 [第2の実施形態]図3は、本発明の第2の実施形態に
係る概略図である。図4は、本発明の第2の実施形態に
係る音声・画像通信のシーケンスを示す図である。本発
明の第2の実施形態に係るクライアント・サーバのシス
テム構成をとるTV会議システムにおいては図18に示
したが、本発明の第1の実施形態との相違点は、クライ
アント側に設置されていた音声データ解析システムが、
本発明の第2の実施形態では、サーバ側に設置されてい
る点である。詳しく説明すると、図4及び図5に示すよ
うに、本発明の第2の実施の形態は、ネットワーク13
05に、サーバ1301、クライアントA1302、ク
ライアントB1303、クライアントC1304がネッ
トワークで繋がれた環境で、3地点間のTV会議を行う
場合の実施の形態である。クライアントA1302は、
マイクから入力した音声データをそのままサーバへ送信
する。サーバ1301は、受信した音声データをそのま
まのクライアントB1303、クライアントC1304
へ送信するのではなく、受信した音声データがユーザの
音声であるか、環境雑音であるかを判定する(第1の実
施の形態と同様、例えば、この音声データの判定には、
無音圧縮の技術を用いる)。そして、受信した音声デー
タがユーザの音声データであると判定した場合に、クラ
イアントB1303、クライアントC1304へ受信し
た音声データを送信する。これにより、ユーザが発言し
た時にのみ、音声データがクライアントB1303、ク
ライアントC1304へ配信される。そして、受信した
音声データがユーザの音声であると判定した場合は、音
声データを送信元クライアントA1302へ、画像を送
信することを要求する、画像要求コマンドを送信する。
画像要求コマンドを受信したクライアントA1302
は、カメラから入力された画像データをサーバ1301
へ送信し、画像データを受信したサーバ1301は、受
信した画像データを送信先クライアントB1303、ク
ライアントC1304へ送信する。この結果、ユーザが
発言した場合以外は、画像は静止画となるが、TV会議
においては表示される画像内容は、相手の上半身であ
り、大きな変化がない限りは、ほとんど静止画となって
いることが多く、画面が静止画となってもユーザ側で気
になることは少ない。また発言時には、画像データは接
続先に転送されるので、ユーザの口の動きは接続先に伝
えられる。これにより、効率的に画像データの送受信が
でき、クライアント側での処理負荷、ネットワーク負荷
を軽減することが可能となる。また、クライアントの処
理負荷が軽減されたことにより、1クライアント上で会
議参加中の全ユーザの画像を表示することも可能とな
る。 [第3の実施形態]図5は、本発明の第3の実施形態に
係る概略図である。図6は、本発明の第3の実施形態に
係る音声・画像通信のシーケンスを示す図である。本発
明の第3の実施形態に係るクライアント・サーバのシス
テム構成をとるTV会議システムにおいては、図19に
示したが、本発明の第1及び第2の実施形態との相違点
は、前記TV会議システムにおいて、送受信される画像
データの差分値を解析する画像データ差分値解析部がク
ライアント側に備えられている点である。送信元クライ
アント(クライアントA1502、クライアントB15
03またはクライアントC1504)、送信先クライア
ント(クライアントA1502が送信元クライアントの
ときには、クライアントB1503またはクライアント
C1504であり、クライアントB1503が送信元ク
ライアントのときには、クライアントA1502または
クライアントC1504であり、クライアントC150
4が送信元クライアントのときには、クライアントA1
502またはクライアントB1503)、前記送信元ク
ライアントと前記送信先クライアントを接続するサーバ
を有する、クライアント・サーバシステムの構成をとる
TV会議システムについて説明すると、まず、前記送信
元クライアントの画像入力装置から、第1の時点に対応
した第1の画像データ、前記第1の画像データと異なる
第2の時点に対応した第2の画像データを入力する。次
に、前記送信元クライアントに設けられた、前記第1の
画像データと前記第2の画像データとの比較判定を行
い、前記比較の結果、前記第1の画像データと前記第2
の画像データとの間に所定の変化があった場合、送信元
クライアントが画像変化通知コマンドを前記サーバへ送
信する。さらに、前記サーバに送信した前記画像変化通
知コマンドを受けて、前記サーバが画像データを要求す
る画像要求コマンドを送信元クライアントに送信し、前
記クライアントに送信した前記画像データを要求する画
像要求コマンドを受けて、前記送信元クライアントが前
記画像入力手段によって入力された画像をサーバへ送信
する。最後に、前記サーバが、前記送信元クライアント
から前記画像データを送信先クライアントに送信する。
さらに詳しく説明すると、図5及び図6に示すように、
本発明の第3の実施の形態は、ネットワーク1504
に、サーバ1501、クライアントA1502、クライ
アントB1503がネットワークで繋がれた環境で、1
対1のTV会議を行う場合の実施の形態である。クライ
アントA1502は、マイクから入力した音声データを
そのままサーバ1501へ送信する。サーバ1501
は、受信した音声データを、クライアントB1501へ
送信する。クライアントB1502でも、マイクから入
力した音声データをそのままサーバ1501へ送信し、
サーバ1501は、受信した音声データを、クライアン
トA1502へ配信して、クライアントA1502、ク
ライアントB1503間で音声通信を行う。クライアン
トA1502で、ユーザが大きく動いた場合、カメラか
ら入力される画像データが前回入力された画像データか
ら大きく変化することになる。クライアントA1502
が、その画像の変化が大きいと判定すると(画像データ
が大きく変化したことを判定するには、例えば、動きベ
クトルの解析を行うことで可能となる)、サーバ150
1へユーザが大きく動いたことを示す画像データを要求
する画像要求コマンドを送信する。画像データを要求す
る画像要求コマンドを受信したサーバ1501は、送信
元クライアントA1502へ画像要求コマンドを送信す
る。前記画像要求コマンドを受信したクライアントA1
502は、カメラから入力された画像データをサーバ1
501へ送信し、画像データを受信したサーバ1501
は、受信した画像データを、送信先クライアントB15
02へ送信する。これにより、ユーザがカメラの前から
退席した場合等、必要最小限の画像データを転送し、効
率的に画像データを通信でき、クライアント側での処理
負荷、ネットワーク負荷を軽減することが可能となる。 [第4の実施形態]図7は、本発明の第4の実施形態に
係る概略図である。図8は、本発明の第4の実施形態に
係る音声・画像通信のシーケンスを示す図である。本発
明の第4の実施形態に係るクライアント・サーバのシス
テム構成をとるTV会議システムにおいては、図20に
示したが、本発明の第3の実施形態との相違点は、クラ
イアント側に設置されていた画像データ差分値解析部
が、本発明の第4の実施形態では、サーバ側に設置され
ている点である。詳しく説明すると、図7及び図8に示
すように、本発明の第4の実施の形態は、ネットワーク
1704に、サーバ1701、クライアントA170
2、クライアントB1703がネットワークで繋がれた
環境で、1対1のTV会議を行う場合の実施の形態であ
る。クライアントA1702は、マイクから入力した音
声データをそのままサーバ1701へ送信する。サーバ
1701は、受信した音声データを、クライアントB1
703へ送信する。クライアントB1703でも、マイ
クから入力した音声データをそのままサーバ1701へ
送信し、サーバ1701は、受信した音声データを、ク
ライアントA1702へ配信して、クライアントA17
02とクライアントB1703間で音声通信を行う。ク
ライアントA1702は、カメラから入力される画像デ
ータと前回入力した画像データとの間の画像データの差
分値を計測し、計測した画像データの差分値をサーバ1
701へ送信する(この画像データの差分値は、従来の
圧縮技術により作られた差分データでもよいし、動きベ
クトルによる解析結果でもよい)。サーバ1701で
は、クライアントA1702から送信される画像データ
の差分値を受信し、受信した画像データの差分値から画
像の変化の度合いを計測する。次に、その変化の度合い
が、所定の変化量以上であった場合、その画像データの
差分値の送信元クライアントA1702へ画像要求コマ
ンドを送信する。これにより、クライアントA1702
のユーザが大きく動いた場合(差分値大の時)、クライ
アントA1702にはサーバ1701から画像要求コマ
ンドが送信され、それを受信したクライアントA170
2は、カメラから入力された画像データをサーバ170
1へ送信する。画像データを受信したサーバ1701
は、受信した画像データを送信先クライアントB170
3へ送信する。以上より、ユーザがカメラの前から退席
した場合等、必要最小限の画像データを転送し、効率的
に画像データを通信でき、クライアント側での処理負
荷、ネットワーク負荷を軽減することが可能となる。 [第5の実施形態]図9は、本発明の第5の実施形態に
係る概略図である。図10は、本発明の第5の実施形態
に係る音声・画像通信のシーケンスを示す図である。送
信元クライアント(クライアントA1902、クライア
ントB1903またはクライアントC1904)、送信
先クライアント(クライアントA1902が送信元クラ
イアントのときには、クライアントB1903またはク
ライアントC1904であり、クライアントB1903
が送信元クライアントのときには、クライアントA19
02またはクライアントC1904であり、クライアン
トC1904が送信元クライアントのときには、クライ
アントA1902またはクライアントB1903)、前
記送信元クライアントと前記送信先クライアントを接続
するサーバを有する、クライアント・サーバシステムの
構成をとるTV会議システムについて説明すると、前記
送信元クライアントの音声入力装置(マイク)に音声デ
ータを入力し、前記送信元クライアントの画像入力装置
に画像データを入力する。次に、前記送信元クライアン
トが、前記入力した音声データをユーザーの音声である
か環境雑音であるかを判定する前記クライアントに設け
られた音声データ判定を行い、前記音声データ判定手段
でユーザの音声であったと判定された場合、前記音声デ
ータをサーバに送信する。続いて、前記サーバに送信さ
れた前記音声データを受けて、前記サーバが画像データ
を要求する画像要求コマンドを送信元クライアントに送
信する。次に、前記サーバからの画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
入力した前記画像データを前記サーバへ送信する。ま
た、前記送信元クライアントの画像入力装置から、第1
の時点に対応した第1の画像データ、前記第1の画像デ
ータと異なる第2の時点に対応した第2の画像データを
入力し、前記送信元クライアントに設けられた、前記第
1の画像データと前記第2の画像データとを比較する。
次に、前記比較の結果、前記第1の画像データと前記第
2の画像データとの間に所定の変化があった場合、送信
元クライアントが画像変化通知コマンドを前記サーバへ
送信し、前記サーバに送信した前記画像変化通知コマン
ドを受けて、前記サーバが画像データを要求する画像要
求コマンドを送信元クライアントに送信する。さらに、
前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信し、前記サーバが前記送信元クライアントから送信さ
れた前記音声データと前記画像データを前記送信先クラ
イアントへ送信する。さらに詳しく説明すると、図9及
び図10に示すように、本発明の第5の実施の形態は、
ネットワーク1904に、サーバ1901、クライアン
トA1902、クライアントB1903がネットワーク
で繋がれた環境で、1対1のTV会議を行う場合の実施
の形態である。クライアントA1902は、マイクから
入力した音声データをそのままサーバへ送信するのでは
なく、入力した音声データがユーザの音声であるか、環
境雑音であるかを判定する(例えば、この音声データの
判定には、無音圧縮の技術を用いれば、判定出来る)。
次に、受信した音声データがユーザの音声であると判定
した場合、入力した音声データをサーバ1901へ送信
し、環境雑音と判定した場合は何も動作を行わない。こ
れにより、ユーザが発言した時にのみ、音声データがサ
ーバ1901へ送信され、それを受信したサーバ190
1は、受信した音声データをクライアントB1903へ
送信する。この際、サーバ1901は、音声データを送
信元クライアントA1902へ画像を送信することを要
求する画像要求コマンドを送信する。前記画像要求コマ
ンドを受信したクライアントA1902は、カメラから
入力された画像データをサーバ1901へ送信し、画像
データを受信したサーバ1901は、受信した画像デー
タを送信先クライアントB1903へ送信(配信)す
る。そして、クライアントA1902で、ユーザが大き
く動いた場合、カメラから入力される画像データが前回
入力した画像データから大きく変化する。クライアント
A1902は、その変化が大きいと判定すると、サーバ
1901へユーザが大きく動いたことを示す画像データ
を要求する画像要求コマンドを送信する。前記画像デー
タを要求する画像要求コマンドを受信したサーバ190
1は、送信元クライアントA1902へ画像要求コマン
声を送信する。さらに、画像要求コマンドを受信したク
ライアントA1902は、カメラから入力されたユーザ
の画像データをサーバ1901へ送信し、画像データを
受信したサーバ1901は、受信した画像データを送信
先クライアントB1903へ送信する。これにより、ユ
ーザが発言した場合や、ユーザがカメラの前から退席し
た場合等、必要最小限の画像データを転送し、効率的に
画像データを通信でき、クライアント側での処理負荷、
ネットワーク負荷を軽減することが可能となる。 [第6の実施形態]図11は、本発明の第6の実施形態
に係る概略図である。図12は、本発明の第6の実施形
態に係る音声・画像通信のシーケンスを示す図である。
本発明の第6の実施形態と前記第5の実施形態との相違
点は、入力された音声データの音声データ解析部が、本
発明の第6の実施形態では、サーバ側に設置されている
点である。さらに詳しく説明すると、図11及び図12
に示すように、本発明の第6の実施の形態は、ネットワ
ーク2104に、サーバ2101、クライアントA21
02、クライアントB2103がネットワークで繋がれ
た環境で、1対1のTV会議を行う場合の実施の形態で
ある。クライアントA2102は、マイクから入力した
音声データをそのままサーバへ送信する、サーバ210
1は、受信した音声データを、そのままのクライアント
B2103へ送信するのではなく、受信した音声データ
がユーザの音声であるか、環境雑音であるかを判定する
(第1の実施の形態と同様、例えば、この音声データの
判定には、無音圧縮の技術を用いる)。次に、受信した
音声データがユーザの音声であると判定した場合、クラ
イアントB2103へ受信した音声データを送信する。
これにより、ユーザが発言した時にのみ、音声データが
クライアントB2103へ配信される。さらに、受信し
た音声データがユーザの音声データであると判定した際
は、サーバ2101は、音声データ送信元クライアント
A2102へ画像を送信することを要求する画像要求コ
マンドを送信する。前記画像要求コマンドを受信したク
ライアントA2102は、カメラから入力された画像デ
ータをサーバ2101へ送信し、前記画像データを受信
したサーバ2101は、受信した画像データを送信先ク
ライアントB2103へ送信する。さらに、クライアン
トA2102で、ユーザが大きく動いた場合、カメラか
ら入力される画像データが前回入力した画像データから
大きく変化する。クライアントA2102は、その変化
が大きいと判定すると、サーバ2101へユーザが大き
く動いたことを示す画像データを要求する画像要求コマ
ンドを送信する。画像データを要求する画像要求コマン
ドを受信したサーバ2101は、送信元クライアントA
2102へ画像要求コマンドを送信する。次に、前記画
像要求コマンドを受信したクライアントA2102は、
カメラから入力されたユーザの画像データをサーバ21
01へ送信し、画像データを受信したサーバ2101
は、受信した画像データを送信先クライアントB210
3へ送信する。これにより、ユーザが発言した場合や、
ユーザがカメラの前から退席した場合等、必要量小限の
画像データを転送し、効率的に画像データを通信でき、
クライアント側での処理負荷、ネットワーク負荷を軽減
することが可能となる [第7の実施形態]図13は、本発明の第7の実施形態
に係る概略図である。図14は、本発明の第7の実施形
態に係る音声・画像通信のシーケンスを示す図である。
本発明の第7の実施形態と前記第5の実施形態との相違
点は、入力された画像データの画像データ解析部が、本
発明の第7の実施形態では、サーバ側に設置されている
点である。送信元クライアント(クライアントA230
2、クライアントB2303またはクライアントC23
04)、送信先クライアント(クライアントA2302
が送信元クライアントのときには、クライアントB23
03またはクライアントC2304であり、クライアン
トB2303が送信元クライアントのときには、クライ
アントA2302またはクライアントC2304であ
り、クライアントC2304が送信元クライアントのと
きには、クライアントA2302またはクライアントB
2303)、前記送信元クライアントと前記送信先クラ
イアントを接続するサーバを有する、クライアント・サ
ーバシステムの構成をとるTV会議システムについて説
明する。まず、前記送信元クライアントの音声入力装置
(マイク)に音声データを入力し、前記送信元クライア
ントの画像入力装置に画像データを入力する。次に、前
記送信元クライアントが、前記入力した音声データをユ
ーザーの音声であるか環境雑音であるかを判定する前記
クライアントに設けられた音声データ判定を行い、前記
音声データ判定手段でユーザの音声であったと判定され
た場合、前記音声データをサーバに送信する。さらに、
前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信し、前記サーバからの画像データ
を要求する画像要求コマンドを受けて、前記送信元クラ
イアントが入力した前記画像データを前記サーバへ送信
する。また、前記送信元クライアントの画像入力装置か
ら、第1の時点に対応した第1の画像データ、前記第1
の画像データと異なる第2の時点に対応した第2の画像
データを入力し、前記入力した第1の画像データと前記
第2の画像データをサーバに送信する。次に、前記サー
バが、前記送信された前記第1の画像データと前記第2
の画像データとの比較判定を行い、前記比較の結果、前
記第1の画像データと前記第2の画像データとの間に所
定の変化があった場合、サーバが画像変化通知コマンド
を前記送信元クライアントへ送信する。最後に、前記送
信元クライアントが前記画像入力手段によって入力した
前記画像データをサーバへ送信し、前記サーバが、前記
送信元クライアントから前記音声データと前記画像デー
タを送信先クライアントに送信する。さらに詳しく説明
すると、図13及び図14に示すように、本発明の第7
の実施の形態は、ネットワーク2304に、サーバ23
01、クライアントA2302、クライアントB230
3がネットワークで繋がれた環境で、1対1のTV会議
を行う場合の実施の形態である。クライアントA230
2は、マイクから入力した音声データをそのままサーバ
へ送信するのではなく、入力した音声データがユーザの
音声であるか、環境雑音であるかを判定する(例えば、
この音声データの判定には、無音圧縮の技術を用いれ
ば、判定出来る)。次に、受信した音声データがユーザ
の音声であると判定した場合、入力した音声データをサ
ーバ2301へ送信し、環境雑音と判定した場合は何も
動作を行わない。これにより、ユーザが発言した時にの
み、音声データがサーバ2301へ送信され、それを受
信したサーバ2301は、受信した音声データをクライ
アントB2303へ送信する。この際、サーバ2301
は、音声データを送信元クライアントA2302へ画像
を送信することを要求する画像要求コマンドを送信す
る。前記画像要求コマンドを受信したクライアントA2
302は、カメラから入力された画像データをサーバ2
301へ送信し、画像データを受信したサーバ2301
は、受信した画像データを送信先クライアントB230
3へ送信(配信)する。そして、クライアントA230
2は、カメラから入力される画像データと前回入力した
画像データとの間の画像データの差分値を計測し、計測
した画像データの差分値をサーバ2301へ送信する
(この画像データの差分値は、従来の圧縮技術により作
られた差分データでもよいし、動きベクトルによる解析
結果でもよい)。サーバ2301では、クライアントA
2302から送信される画像データの差分値を受信し、
受信した画像データの差分値から画像の変化の度合いを
計測する。次に、その変化の度合いが、所定の変化量以
上であった場合、その画像データの差分値の送信元クラ
イアントA2302へ画像要求コマンドを送信する。こ
れにより、クライアントA2302のユーザが大きく動
いた場合(差分値大の時)、クライアントA2302に
はサーバ2301から画像要求コマンドが送信され、そ
れを受信したクライアントA2302は、カメラから入
力された画像データをサーバ2301へ送信する。画像
データを受信したサーバ2301は、受信した画像デー
タを送信先クライアントB2302へ送信する。これに
より、ユーザが発言した場合や、ユーザがカメラの前か
ら退席した場合等、必要最小限の画像データを転送し、
効率的に画像データを通信でき、クライアント側での処
理負荷、ネットワーク負荷を軽減することが可能とな
る。 [第8の実施形態]図15は、本発明の第8の実施形態
に係る概略図である。図16は、本発明の第8の実施形
態に係る音声・画像通信のシーケンスを示す図である。
本発明の第8の実施形態と前記第7の実施形態との相違
点は、入力された音声データの音声データ解析システム
が、本発明の第8の実施形態では、サーバ側に設置され
ている点である。さらに詳しく説明すると、図15及び
図16に示すように、本発明の第8の実施の形態は、ネ
ットワーク2504に、サーバ2501、クライアント
A2502、クライアントB2503がネットワークで
繋がれた環境で、1対1のTV会議を行う場合の実施の
形態である。クライアントA2502は、マイクから入
力した音声データをそのままサーバへ送信する、サーバ
2501は、受信した音声データを、そのままのクライ
アントB2503へ送信するのではなく、受信した音声
データがユーザの音声であるか、環境雑音であるかを判
定する(第1の実施の形態と同様、例えば、この音声デ
ータの判定には、無音圧縮の技術を用いる)。次に、受
信した音声データがユーザの音声であると判定した場
合、クライアントB2503へ受信した音声データを送
信する。これにより、ユーザが発言した時にのみ、音声
データがクライアントB2503へ配信される。そし
て、クライアントA2502は、カメラから入力される
画像データと前回入力した画像データとの間の画像デー
タの差分値を計測し、計測した画像データの差分値をサ
ーバ2501へ送信する(この画像データの差分値は、
従来の圧縮技術により作られた差分データでもよいし、
動きベクトルによる解析結果でもよい)。サーバ250
1では、クライアントA2502から送信される画像デ
ータの差分値を受信し、受信した画像データの差分値か
ら画像の変化の度合いを計測する。次に、その変化の度
合いが、所定の変化量以上であった場合、その画像デー
タの差分値の送信元クライアントA2502へ画像要求
コマンドを送信する。これにより、クライアントA25
02のユーザが大きく動いた場合(差分値大の時)、ク
ライアントA2502にはサーバ2501から画像要求
コマンドが送信され、それを受信したクライアントA2
502は、カメラから入力された画像データをサーバ2
501へ送信する。画像データを受信したサーバ250
1は、受信した画像データを送信先クライアントB25
02へ送信する。これにより、ユーザが発言した場合
や、ユーザがカメラの前から退席した場合等、必要量小
限の画像データを転送し、効率的に画像データを通信で
き、クライアント側での処理負荷、ネットワーク負荷を
軽減することが可能となる。最後に、本発明の第1から
第8までの実施の形態について整理すると、本発明の第
1の実施の形態においては、クライアント側が音声の判
定処理を行っている。本発明の第2の実施の形態では、
音声の判定処理はサーバ側が行っている。本発明の第3
の実施の形態においては、クライアント側が差分値を利
用して、画像の判定を行っている。本発明の第4の実施
の形態においては、サーバ側が差分値を利用して、画像
の判定を行っている。本発明の第5の実施の形態におい
ては、クライアント側で音声とさらに画像の判定を行っ
ている。本発明の第6の実施の形態においては、クライ
アント側で画像の判定を行い、サーバ側で音声の判定を
行っている。本発明の第7の実施の形態においては、ク
ライアント側で音声の判定とサーバ側で画像の判定を行
っている。本発明の第8の実施の形態においては、サー
バ側で画像の判定を行っている。またサーバ側では音声
の判定を行っている。なお、本発明の実施の形態で用い
たネットワークは、LAN等のイントラネット、または
エクストラネット及びIPネットワークを用いたインタ
ーネット等を含むものであり、各クライアントとサーバ
がデータ交換できるようなネットワークであれば、形態
は問うものではない。以上、この発明を第1〜第8の実
施形態により説明したが、この発明は第1〜第8の実施
形態に限られるものではなく、その趣旨を逸脱しない範
囲で種々変形できる。例えば上記実施形態により説明し
た1対1のTV会議システムでは、多対多や1対多等の
TV会議システムにおいても、同様の形態で実施を行う
ことが可能である。
BRIEF DESCRIPTION OF THE DRAWINGS FIG.
This will be described with reference to FIG. In addition, common to all drawings
Parts are assigned the same reference numerals. [First Embodiment] FIG. 1 shows a first embodiment of the present invention.
It is such a schematic diagram. FIG. 2 shows a first embodiment of the present invention.
FIG. 3 is a diagram showing a sequence of such audio / video communication. Ma
FIG. 17 shows a client according to the first embodiment of the present invention.
Client, which is a configuration diagram of a remote server system
(Client A 1102, client B 1103
Or client C1104), destination client
(When client A 1102 is the source client
Has client B1103 or client C1
104, and the client B 1103
At the time of the client, the client A 1102 or the client
Client C1104, and client C1104
For the source client, client A 110
2 or client B 1103), the source client
Server that connects the client to the destination client.
TV with client / server system configuration
The conference system will be described.
Input voice data to the voice input device (microphone) of the client
Enter the image on the image input device of the source client
Enter the data. Next, the source client
If the input voice data is the user's voice or
Sound provided to the client to determine whether the sound is sound
Voice data, and the voice data determination means
If it is determined that the audio data is audio, the audio data is
Send to the bus. Further, the sound transmitted to the server
Upon receiving voice data, the server requests image data
Send an image request command to the source client, and
An image request command for requesting image data from the server
Receiving the image data input by the source client.
Data to the server. Next, the server
The voice data transmitted from the source client and
The image data is transmitted to the destination client. Sa
In more detail, each client as shown in FIG.
(1101 to 1104)
Interface, microphone, speaker, microphone and speaker.
Sound interface for inputting and outputting analog audio signals
Gaps that input images from cameras, cameras, and cameras
With audio and voice data from a microphone.
Input means to input image data from the camera.
Receiving the transmitted audio data and sending it to the speaker
Means for outputting, receiving the image data to be transmitted, and monitoring
(PC) or Works with means for outputting to
Clients such as WS (WS)
Client, have a network interface, and
Receives audio data and image data transmitted by the client
And send to participating clients other than the sender
Data communication client such as PC or WS with transmission means
One-to-one or multipoint TV with server as server
The meeting system is connected to the client / server system.
The TV conference system has a system configuration. FIG.
TV conference system with client server system configuration
The system is shown in more detail. As shown in FIG.
The client is connected to a network
A network interface unit;
Image data codec
Unit, audio data codec unit and control command processing unit
It is connected. Further, the audio data codec section
Is connected to the audio data analysis unit, and
Codec section, audio data codec section, control command
Client that controls the voice processing unit and voice data analysis unit
A function control unit is provided. Further, the image data
The codec section has a camera via the image data input / output section.
And a monitor are connected to the audio data codec.
Microphone and microphone via the audio data input / output unit.
A peaker is connected. In addition, the client
Is provided with a device control unit for controlling all the parts. Ma
The server has a network connected to the network.
A work interface unit;
The image data distribution processing unit and the audio data
Data distribution processing unit and control command processing unit are connected.
The image data distribution processing unit and the audio data distribution processing unit
And a server function control unit that controls the control command processing unit
is set up. As shown in FIG. 1, the source client
(Client A 1102 or client B 11
03), a voice input device (My
Input the voice data to the client
Whether the input voice data is the voice of the user
Determine whether the noise is environmental noise
Is transmitted, the voice data is transmitted to the server.
You. Receiving the audio data transmitted to the server,
Send image request command to request image data from server
The image data is transmitted from the server to the client
Receiving the image request command requesting
The image data input from the client is transmitted to the server. Sa
Further, the server is transmitted from the source client.
The audio data and image data
If the original client is client A 1102,
Client B 1103 and the source client is
In the case of client B 1103, client A1
102), and the sender client
The image data transmitted from the client to the server
This is image data input from the client. Further details
More specifically, as shown in FIG. 1 and FIG.
In one embodiment, a server 1
101, client A1102, client B1
One-to-one TV in an environment where 103 is connected via a network
The client that is having a meeting
Is client A1102, client A11
02 is the audio data input from the microphone
Input voice data instead of sending
Client A decides whether it is the voice of the
1102 determines. Then, the input audio data is
If the voice data is determined to be
Is transmitted to the server 1101. The determination means at this time includes:
For example, using the conventional silence compression technology, etc.
Can be determined. As a result, the client A 1102
Only sends voice data to the server 11 when the user speaks.
Send to 01. The server 1101 receives the received audio data.
The destination client to the client B110.
If the number is 3, the data is transmitted to the client B 1103. This
At this time, the server 1101
An image request to send an image to
Send request command. And the image request command
A1102, which has received the
The transmitted image data is transmitted to the server 1101,
The server 1101 that has received the data
The data is transmitted (distributed) to the transmission destination client B 1103. This
As a result, the image other than the case where the user
However, the screen content displayed in the TV conference is
Unless you are the upper body of the opponent and there are no significant changes, still images
In many cases, even if the image becomes a still image,
There is little concern on the user side. Also, when speaking,
Since the image data is transferred to the connection destination, the user's mouth movement
Is transmitted to the connection destination. This allows image data to be used for efficient fishing.
Data communication, processing load on the client side, network
Work load can be reduced. [Second Embodiment] FIG. 3 shows a second embodiment of the present invention.
It is such a schematic diagram. FIG. 4 shows a second embodiment of the present invention.
FIG. 3 is a diagram showing a sequence of such audio / video communication. Departure
Client-server system according to the second embodiment of the present invention
FIG. 18 shows a TV conference system having a system configuration.
However, the difference from the first embodiment of the present invention is that the client
The audio data analysis system installed on the ant side,
In the second embodiment of the present invention, the server is installed on the server side.
It is a point. More specifically, FIG. 4 and FIG.
As described above, the second embodiment of the present invention
05, the server 1301, the client A 1302,
Client B 1303 and client C 1304
Hold a TV conference between three locations in an environment connected by networks
It is an embodiment of the case. Client A 1302
The audio data input from the microphone is sent to the server as it is
I do. The server 1301 converts the received audio data as it is.
Client B1303, client C1304
Instead of sending to the user, the received audio data
It is determined whether the sound is voice or environmental noise (first actual
As in the embodiment, for example, in the determination of the audio data,
Using silence compression technology). Then, the received audio data
If the data is determined to be the user's voice data,
Client B 1303 and Client C 1304 receive
Transmit the audio data. This allows the user to speak
Only when the audio data is
It is distributed to client C1304. And received
If it is determined that the audio data is the user's voice,
Sends an image to client A1302 with voice data
Send an image request command requesting that the image be transmitted.
Client A 1302 that has received the image request command
Transmits image data input from the camera to the server 1301
Server 1301 that has transmitted the image data and received the image data,
The received image data is transmitted to the
Send to client C1304. As a result, the user
Except when you speak, the image will be a still image,
In, the displayed image content is
Unless there is a major change, it is almost a still image
In many cases, even if the screen becomes a still image,
It is rare. When speaking, the image data
Because the call is forwarded to the destination, the user's mouth movements are transmitted to the destination.
available. This allows efficient transmission and reception of image data
Yes, processing load on the client side, network load
Can be reduced. In addition, the client
Reduced on a single client
It is also possible to display images of all users participating in the conference.
You. [Third Embodiment] FIG. 5 shows a third embodiment of the present invention.
It is such a schematic diagram. FIG. 6 shows a third embodiment of the present invention.
FIG. 3 is a diagram showing a sequence of such audio / video communication. Departure
Client-server system according to the third embodiment of the present invention
In a TV conference system having a system configuration, FIG.
Although shown, the difference from the first and second embodiments of the present invention is shown.
Is an image transmitted and received in the TV conference system.
The image data difference value analysis unit that analyzes the data difference value
This is a point provided on the client side. Source Cry
Ant (Client A 1502, Client B15
03 or client C1504), destination client
Client (client A 1502 is the client
Sometimes client B1503 or client
C1504, and the client B1503
For clients, client A1502 or
The client C1504 and the client C150
4 is the source client, the client A1
502 or client B 1503), the source
Server connecting the client and the destination client
Take the configuration of a client-server system with
The TV conference system will be described first.
From the client's image input device to the first point in time
First image data that differs from the first image data
The second image data corresponding to the second time point is input. Next
The first client provided in the transmission source client;
A comparison between the image data and the second image data is performed.
As a result of the comparison, the first image data and the second
If there is a predetermined change with the image data of
Client sends an image change notification command to the server
I believe. Further, the image change notification transmitted to the server is transmitted.
Receiving the information command, the server requests image data.
Sends an image request command to the sending client
An image requesting the image data transmitted to the client.
Upon receiving the image request command, the source client
Send the image input by the image input means to the server
I do. Finally, the server is the source client
Transmits the image data to the destination client.
More specifically, as shown in FIGS. 5 and 6,
The third embodiment of the present invention relates to a network 1504
Server 1501, client A 1502, client
In an environment where Ant B1503 is connected via a network, 1
This is an embodiment in which a one-to-one TV conference is held. Cry
Ant A1502 converts the audio data input from the microphone
The data is transmitted to the server 1501 as it is. Server 1501
Sends the received audio data to client B 1501.
Send. Client B1502 also enters from the microphone.
The input voice data is transmitted to the server 1501 as it is,
The server 1501 converts the received audio data into client data.
To the client A 1502,
Voice communication is performed between the clients B1503. Client
In A1502, if the user moves greatly, the camera
Is the image data input last time
Will change greatly. Client A 1502
Determines that the change in the image is large (image data
For example, to determine that the
Server 150).
Requests image data indicating that the user has moved significantly to 1.
To send an image request command. Request image data
Server 1501 having received the image request command
Sends an image request command to former client A 1502
You. Client A1 that has received the image request command
Reference numeral 502 denotes a server 1 which stores image data input from a camera.
Server 1501 that has transmitted image data to server 501
Transmits the received image data to the destination client B15.
02. This allows the user to
Transfer the minimum required image data, such as when you leave
Image data can be communicated efficiently, processing on the client side
Load and network load can be reduced. [Fourth Embodiment] FIG. 7 shows a fourth embodiment of the present invention.
It is such a schematic diagram. FIG. 8 shows a fourth embodiment of the present invention.
FIG. 3 is a diagram showing a sequence of such audio / video communication. Departure
Client-server system according to the fourth embodiment of the present invention
In a TV conference system having a system configuration, FIG.
However, the difference from the third embodiment of the present invention is that
Image data difference value analysis unit installed on the client side
However, in the fourth embodiment of the present invention, it is installed on the server side.
That is the point. More specifically, FIG. 7 and FIG.
As described above, the fourth embodiment of the present invention
1704, a server 1701, a client A 170
2. Client B 1703 is connected via network
This is an embodiment in which a one-to-one TV conference is held in an environment.
You. Client A 1702 receives the sound input from the microphone
The voice data is transmitted to the server 1701 as it is. server
1701 transmits the received audio data to the client B1.
703. In client B1703, my
To the server 1701 as is
The server 1701 transmits the received audio data
It is distributed to client A 1702 and client A 17
02 and the client B 1703 perform voice communication. K
Client A 1702 stores the image data input from the camera.
Data difference between the image data and the previously input image data
The server 1 measures the minute value and calculates the difference value of the measured image data.
701 (the difference value of this image data is
Difference data created by compression technology may be used.
The analysis result by the vector may be used). On the server 1701
Is the image data transmitted from the client A 1702
Of the received image data,
The degree of change of the image is measured. Next, the degree of change
Is greater than or equal to a predetermined amount of change,
Image request frame to client A 1702 of difference value
Send a command. Thereby, the client A 1702
If a large number of users move (when the difference value is large),
An image request frame from the server 1701 is sent to the ant A 1702.
Command is transmitted and the client A 170 receives it.
2 stores the image data input from the camera in the server 170
Send to 1. Server 1701 that has received image data
Transmits the received image data to the destination client B 170
Send to 3. As described above, the user leaves from the camera
Transfer the minimum required image data,
Image data can be communicated to the
Load and network load can be reduced. [Fifth Embodiment] FIG. 9 shows a fifth embodiment of the present invention.
It is such a schematic diagram. FIG. 10 shows a fifth embodiment of the present invention.
It is a figure which shows the sequence of the audio / video communication concerning. Sending
Sender client (client A1902, client
Client B 1903 or client C 1904), transmission
Destination client (client A 1902 sends
Client B1903 or client
Client C 1904 and Client B 1903
Is the source client, the client A19
02 or client C1904 and the client
When C1904 is the source client, the client
Ant A1902 or Client B1903), before
Connect the source client and the destination client
Of a client / server system having a server
The following describes a TV conference system having a configuration.
The voice input device (microphone) of the source client
Data input to the image input device of the source client.
Input the image data into. Next, the source client
The input voice data is the voice of the user.
Provided to the client to determine whether the noise is environmental noise
The voice data determination means, and
If it is determined that the voice is the user's voice in
Data to the server. Then, sent to the server
Receiving the audio data, the server
Sends an image request command requesting
I believe. Next, request image data from the server
Upon receiving the image request command, the source client
The input image data is transmitted to the server. Ma
In addition, from the image input device of the transmission source client, the first
The first image data corresponding to the time point
Data corresponding to a second time point different from the
Input and provided in the source client.
The first image data is compared with the second image data.
Next, as a result of the comparison, the first image data and the second
When there is a predetermined change between the image data and the second image data,
Former client sends image change notification command to the server
Transmitting the image change notification command transmitted to the server
Receiving the password, the server requests image data.
Request command to the sending client. further,
Request the image data transmitted to the client
Upon receiving the image request command, the source client
Sending the image input by the image input means to the server;
The server sends the
The audio data and the image data obtained
Send to client. More specifically, FIG. 9 and FIG.
As shown in FIG. 10 and FIG.
Network 1904, server 1901, client
A 1902 and client B 1903 are on the network
Implementation of one-on-one TV conference in an environment connected by
It is a form of. Client A1902 is
To send the input audio data to the server as it is
The input voice data is the user's voice,
It is determined whether the noise is boundary noise (for example,
The determination can be made by using a silent compression technique.)
Next, it is determined that the received voice data is the voice of the user.
The input voice data to the server 1901
However, if it is determined to be environmental noise, no operation is performed. This
As a result, audio data is only supported when the user speaks.
Server 190 which has been transmitted to
1 sends the received audio data to the client B 1903
Send. At this time, the server 1901 transmits the audio data.
It is necessary to send an image to the originating client A1902.
Send the image request command to request. The image request frame
Client A 1902 receives the command from the camera.
The input image data is transmitted to the server 1901,
The server 1901 that has received the data transmits the received image data.
Data to the destination client B 1903 (distribution).
You. Then, in the client A1902, the user
Image data input from the camera
It changes greatly from the input image data. client
If A1902 determines that the change is large, the server
Image data indicating that the user has largely moved to 1901
Is transmitted. The image data
Server 190 that has received an image request command requesting data
1 is an image request command to the source client A 1902
Send voice. Further, when the image request command is received,
Client A 1902 is the user input from the camera
Is transmitted to the server 1901 and the image data is
The received server 1901 transmits the received image data.
This is transmitted to the destination client B 1903. This allows you to
When the user speaks or when the user exits from the camera
Transfer the minimum required image data,
Image data can be communicated, processing load on the client side,
Network load can be reduced. [Sixth Embodiment] FIG. 11 shows a sixth embodiment of the present invention.
FIG. FIG. 12 shows a sixth embodiment of the present invention.
FIG. 4 is a diagram showing a sequence of audio / video communication according to the embodiment.
Difference between the sixth embodiment of the present invention and the fifth embodiment
The point is that the audio data analysis unit of the input audio data
In the sixth embodiment of the present invention, it is installed on the server side.
Is a point. More specifically, FIG. 11 and FIG.
As shown in FIG.
Server 2101 and client A 21
02, Client B2103 is connected via network
In a case where a one-to-one TV conference is held in an environment
is there. Client A2102 input from microphone
The server 210 which transmits the audio data to the server as it is.
1 is a client that receives the audio data as it is
Received audio data instead of transmitting to B2103
Is the user's voice or environmental noise
(Similar to the first embodiment, for example, the audio data
The silence compression technology is used for the determination). Then, received
If it is determined that the voice data is the voice of the user,
The received audio data is transmitted to the client B2103.
Thus, only when the user speaks, the audio data is
It is distributed to the client B2103. In addition, receive
When it is determined that the voice data that has been input is the voice data of the user
Is a server 2101 that is a client of a voice data transmission source.
A2102 is an image request code requesting that an image be transmitted.
Send the command. When the image request command is received,
Client A 2102 is a client for the image data input from the camera.
Data to the server 2101 and receive the image data
The server 2101 that has received the received image data
Transmit to client B2103. In addition, the client
If the user moves greatly in A2102, the camera
Image data input from the
It changes greatly. Client A2102 changes
If the user is determined to be
Image request frame for requesting image data
Send a command. Image request command to request image data
Server 2101 that has received the
An image request command is transmitted to 2102. Next,
The client A 2102, which has received the image request command,
The image data of the user input from the camera is stored in the server 21
01 which has transmitted the image data to the server 2101
Transmits the received image data to the destination client B210.
Send to 3. As a result, when the user speaks,
When the user leaves the camera,
Transfer image data and communicate image data efficiently,
Reduce processing load and network load on client side
FIG. 13 shows a seventh embodiment of the present invention.
FIG. FIG. 14 shows a seventh embodiment of the present invention.
FIG. 4 is a diagram showing a sequence of audio / video communication according to the embodiment.
Difference between the seventh embodiment of the present invention and the fifth embodiment
The points are calculated by the image data analyzer of the input image data.
In the seventh embodiment of the present invention, it is installed on the server side.
Is a point. Source client (client A230
2. Client B 2303 or Client C23
04), destination client (client A 2302)
Is the source client, the client B23
03 or client C2304 and the client
When client B 2303 is the source client, the client
Client A 2302 or Client C 2304
Client C2304 is the sender client
Client A 2302 or Client B
2303), the source client and the destination client
Client server with a server to connect clients
Of a TV conference system that uses a server system
I will tell. First, the voice input device of the source client
(Microphone) and input the audio data
The image data is input to the image input device of the client. Next, before
The transmission source client uses the input audio data
The user's voice or environmental noise
Perform voice data determination provided in the client, the
The voice data determining means determines that the voice was the user's voice.
If so, the voice data is transmitted to the server. further,
Receiving the audio data transmitted to the server,
Server sends image request command to request image data
Image data sent from the server to the former client
Receiving the image request command requesting the
Sending the image data input by the client to the server
I do. In addition, if the image input device of the source client is
The first image data corresponding to the first time point;
Image corresponding to a second time point different from the image data of the second
Data, and input the first image data and the
The second image data is transmitted to the server. Next, the server
The first image data transmitted and the second image data
Is compared with the image data of
The location between the first image data and the second image data.
If there is a certain change, the server sends an image change notification command
To the source client. Finally, the transmission
Originating client input by the image input means
Sending the image data to a server, wherein the server
The audio data and the image data are transmitted from the transmission source client.
Data to the destination client. Further explanation
Then, as shown in FIG. 13 and FIG.
In the embodiment, the server 23 is connected to the network 2304.
01, client A 2302, client B 230
3 in a networked environment, one-on-one TV conference
This is an embodiment in the case of performing. Client A230
2 is the server that receives the voice data input from the microphone
Instead of sending it to
It is determined whether the sound is audio or environmental noise (for example,
This audio data is judged using silence compression technology.
Can be determined.) Next, the received audio data is
If the input voice data is determined to be
Is transmitted to the server 2301 and nothing is determined when the
No action is taken. As a result, when the user speaks,
Audio data is transmitted to the server 2301 and received.
The server 2301 that received the message
It transmits to Ant B 2303. At this time, the server 2301
Sends the audio data to the source client A 2302
Send an image request command requesting to send
You. Client A2 receiving the image request command
Reference numeral 302 denotes a server 2 which stores image data input from a camera.
Server 2301 that has transmitted to 301 and received the image data
Transmits the received image data to the destination client B230.
3 (distribution). And client A230
2 is the image data input from the camera and the last input
Measure the difference value of the image data with the image data and measure
The difference value of the obtained image data is transmitted to the server 2301.
(The difference value of this image data is created by the conventional compression technology.
Difference data or analysis using motion vectors
May be the result). In server 2301, client A
Receiving the difference value of the image data transmitted from 2302,
From the difference value of the received image data,
measure. Next, the degree of the change is equal to or less than a predetermined amount of change.
If it is above, the source class of the difference value of the image data
An image request command is transmitted to the client A 2302. This
As a result, the user of the client A 2302 greatly moves.
(When the difference value is large), the client A 2302
Sends an image request command from the server 2301,
The client A 2302 that has received the
The input image data is transmitted to the server 2301. image
The server 2301 that has received the data transmits the received image data.
Data to the destination client B 2302. to this
The user is speaking, or if the user is in front of the camera
Transfer the minimum required image data,
Image data can be communicated efficiently and processing on the client side
Management load and network load can be reduced.
You. [Eighth Embodiment] FIG. 15 shows an eighth embodiment of the present invention.
FIG. FIG. 16 shows an eighth embodiment of the present invention.
FIG. 4 is a diagram showing a sequence of audio / video communication according to the embodiment.
Difference between the eighth embodiment of the present invention and the seventh embodiment
The point is a voice data analysis system for input voice data.
However, in the eighth embodiment of the present invention,
That is the point. More specifically, FIG. 15 and FIG.
As shown in FIG. 16, the eighth embodiment of the present invention
Network 2504, server 2501, client
A2502, Client B2503 on the network
Implementation of one-on-one TV conference in a connected environment
It is a form. Client A 2502 enters from the microphone
Server that sends the input audio data to the server as it is
Reference numeral 2501 designates the received audio data as a client
Received audio instead of sending to Ant B2503
Determine whether the data is user voice or environmental noise
(For example, as in the first embodiment,
For the determination of data, use the silence compression technology). Next,
If the received voice data is determined to be the user's voice
The received voice data to the client B2503.
I believe. This allows the audio to be heard only when the user speaks.
The data is distributed to client B 2503. Soshi
Client A 2502 is input from the camera
Image data between the image data and the previously input image data
The difference value of the image data is measured, and the difference value of the measured image data is
(The difference value of the image data is
Difference data created by conventional compression technology may be used,
An analysis result using a motion vector may be used). Server 250
1, the image data transmitted from the client A 2502
Data difference value and the received image data difference value
Then, the degree of change of the image is measured. Next, the degree of the change
If the match is equal to or greater than the specified amount of change, the image data
An image request to the client A2502 of the transmission source of the difference value of data
Send a command. Thereby, the client A25
If the user 02 moves significantly (when the difference value is large),
Client A 2502 requests image from server 2501
Command A2 is sent and received by client A2
Reference numeral 502 denotes a server 2 which stores image data input from a camera.
501. Server 250 that has received the image data
1 indicates that the received image data is to be transmitted to the destination client B25.
02. As a result, when the user speaks
Necessary amount, such as when the user leaves from the front of the camera, etc.
Transfer of limited image data and efficient communication of image data
Processing load and network load on the client side
It becomes possible to reduce. Finally, from the first of the present invention
When the embodiments up to the eighth are arranged, the second embodiment of the present invention is described.
In one embodiment, the client side determines
The regular processing is being performed. In the second embodiment of the present invention,
The server judges the voice. Third of the present invention
In the embodiment, the client uses the difference value.
To determine the image. Fourth embodiment of the present invention
In the embodiment, the server uses the difference value to
Is determined. In the fifth embodiment of the present invention
The client side to determine the audio and further the image
ing. In the sixth embodiment of the present invention, the client
The client determines the image, and the server determines the sound.
Is going. In the seventh embodiment of the present invention,
The client determines the audio and the server determines the image.
ing. In an eighth embodiment of the present invention, a server
The image is determined on the side of the computer. On the server side, voice
Is determined. It should be noted that this is used in the embodiment of the present invention.
Network is an intranet such as a LAN, or
Internet using extranet and IP network
-Clients and servers
Is a network that can exchange data
Is not a question. As described above, the present invention relates to the first to eighth embodiments.
Although the embodiments have been described, the present invention relates to first to eighth embodiments.
The scope is not limited to the form and does not deviate from the gist.
It can be variously deformed by surroundings. For example, with the above embodiment,
In a one-to-one TV conference system, many-to-many, one-to-many, etc.
In a TV conference system, implementation is performed in a similar manner.
It is possible.

【発明の効果】以上説明したように、本発明を用いれ
ば、ユーザが発言している場合や、ユーザが大きく動い
た場合等に、画像データを転送し、それ以外は画像デー
タを送信しないことで、必要な画像データだけを通信
し、無駄なデータ転送を省き、かつ、従来のTVシステ
ムよりもクライアントの処理負荷とネットワークにかか
る負荷を軽減することのできるTV会議システム、及び
TV会議システムの制御方法、及びTV会議システムを
制御するプログラムを格納した記憶媒体を提供すること
にある。
As described above, according to the present invention, the image data is transferred when the user speaks or the user moves greatly, and the image data is not transmitted otherwise. Therefore, a TV conference system and a TV conference system which can communicate only necessary image data, omit useless data transfer, and reduce the processing load on the client and the load on the network as compared with the conventional TV system. An object of the present invention is to provide a control method and a storage medium storing a program for controlling a TV conference system.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態に係るTV会議シス
テムの概略を示す図。
FIG. 1 is an exemplary view schematically showing a TV conference system according to a first embodiment of the present invention.

【図2】本発明の第1の実施の形態に係る音声データと
画像データのシーケンスを示す図。
FIG. 2 is a diagram showing a sequence of audio data and image data according to the first embodiment of the present invention.

【図3】本発明の第2の実施の形態に係るTV会議シス
テムの概略を示す図。
FIG. 3 is a diagram schematically showing a TV conference system according to a second embodiment of the present invention.

【図4】本発明の第2の実施の形態に係る音声データと
画像データのシーケンスを示す図。
FIG. 4 is a diagram showing a sequence of audio data and image data according to a second embodiment of the present invention.

【図5】本発明の第3の実施の形態に係るTV会議シス
テムの概略を示す図。
FIG. 5 is a diagram schematically showing a TV conference system according to a third embodiment of the present invention.

【図6】本発明の第3の実施の形態に係る音声データと
画像データのシーケンスを示す図。
FIG. 6 is a diagram showing a sequence of audio data and image data according to a third embodiment of the present invention.

【図7】本発明の第4の実施の形態に係るTV会議シス
テムの概略を示す図。
FIG. 7 is a diagram schematically illustrating a TV conference system according to a fourth embodiment of the present invention.

【図8】本発明の第4の実施の形態に係る音声データと
画像データのシーケンスを示す図。
FIG. 8 is a diagram showing a sequence of audio data and image data according to a fourth embodiment of the present invention.

【図9】本発明の第5の実施の形態に係るTV会議シス
テムの概略を示す図。
FIG. 9 is a diagram schematically showing a TV conference system according to a fifth embodiment of the present invention.

【図10】本発明の第5の実施の形態に係る音声データ
と画像データのシーケンスを示す図。
FIG. 10 is a diagram showing a sequence of audio data and image data according to a fifth embodiment of the present invention.

【図11】本発明の第6の実施の形態に係るTV会議シ
ステムの概略を示す図。
FIG. 11 is a view schematically showing a TV conference system according to a sixth embodiment of the present invention.

【図12】本発明の第6の実施の形態に係る音声データ
と画像データのシーケンスを示す図。
FIG. 12 is a diagram showing a sequence of audio data and image data according to a sixth embodiment of the present invention.

【図13】本発明の第7の実施の形態に係るTV会議シ
ステムの概略を示す図。
FIG. 13 is a view schematically showing a TV conference system according to a seventh embodiment of the present invention.

【図14】本発明の第7の実施の形態に係る音声データ
と画像データのシーケンスを示す図。
FIG. 14 is a diagram showing a sequence of audio data and image data according to a seventh embodiment of the present invention.

【図15】本発明の第8の実施の形態に係るTV会議シ
ステムの概略を示す図。
FIG. 15 is a view schematically showing a TV conference system according to an eighth embodiment of the present invention.

【図16】本発明の第8の実施の形態に係る音声データ
と画像データのシーケンスを示す図。
FIG. 16 is a diagram showing a sequence of audio data and image data according to the eighth embodiment of the present invention.

【図17】本発明の第1の実施の形態に係るクライアン
ト・サーバのシステムをとるTV会議システムの概略を
示す図。
FIG. 17 is an exemplary view schematically showing a TV conference system which employs a client-server system according to the first embodiment of the present invention.

【図18】本発明の第2の実施の形態に係るクライアン
ト・サーバのシステムをとるTV会議システムの概略を
示す図。
FIG. 18 is a diagram showing an outline of a TV conference system using a client-server system according to a second embodiment of the present invention.

【図19】本発明の第3の実施の形態に係るクライアン
ト・サーバのシステムをとるTV会議システムの概略を
示す図。
FIG. 19 is a diagram showing an outline of a TV conference system using a client-server system according to a third embodiment of the present invention.

【図20】本発明の第3の実施の形態に係るクライアン
ト・サーバのシステムをとるTV会議システムの概略を
示す図。
FIG. 20 is an exemplary view schematically showing a TV conference system using a client-server system according to a third embodiment of the present invention.

【図21】従来の技術に係るTV会議システムを説明す
る概略図。
FIG. 21 is a schematic diagram illustrating a TV conference system according to a conventional technique.

【図22】従来の技術に係るTV会議システムを説明す
る概略図。
FIG. 22 is a schematic diagram illustrating a TV conference system according to a conventional technique.

【符号の説明】[Explanation of symbols]

1101、1301、1501、1701、1901、
2101、2301、2501…サーバ 1102、1302、1502、1702、1902、
2102、2302、2502…クライアントA 1103、1303、1503、1703、1903、
2103、2303、2503…クライアントB 1304、1904、2304…クライアントC 1104、1305、1504、1704、1905、
2104、2305、2504…イントラネット/IP
ネットワーク
1101, 1301, 1501, 1701, 1901,
2101, 2301, 2501 ... server 1102, 1302, 1502, 1702, 1902,
2102, 2302, 2502... Client A 1103, 1303, 1503, 1703, 1903,
2103, 2303, 2503 ... Client B 1304, 1904, 2304 ... Client C 1104, 1305, 1504, 1704, 1905,
2104, 2305, 2504 ... Intranet / IP
network

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B089 GA11 GA21 GB03 JA16 JB03 JB05 JB10 KA06 KA07 KH28 LB10 5C064 AA02 AC02 AC06 AC13 AC16 AC20 AD06  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B089 GA11 GA21 GB03 JA16 JB03 JB05 JB10 KA06 KA07 KH28 LB10 5C064 AA02 AC02 AC06 AC13 AC16 AC20 AD06

Claims (25)

【特許請求の範囲】[Claims] 【請求項1】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定する前
記クライアントに設けられた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記音声データを前記サーバに送信する送
信手段と、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信する前記送信手段と、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信する送信手段と、 前記サーバが前記送信元クライアントから送信された前
記音声データと前記画像データを前記送信先クライアン
トへ送信する送信手段とを具備することを特徴とするT
V会議システム。
1. A TV conference system having a configuration of a client-server system, comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting audio data from the input device; input means for inputting image data from the image input device by the transmission source client; and the transmission source client indicating whether the input audio data is a user's voice or environmental noise. Voice data determining means provided in the client for determining whether or not the voice data determining means determines that the voice is a user's voice; transmitting means for transmitting the voice data to the server; transmitting to the server The server receives the audio data and transmits the image data to the server. A transmission unit for transmitting an image request command to the transmission source client to request transmission of the image data input by the transmission source client to the server in response to an image request command for requesting image data from the server. T, the server comprising: a transmitting unit configured to transmit the audio data and the image data transmitted from the source client to the destination client.
V conference system.
【請求項2】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記入力した音声データを前記サーバに送信する送信手
段と、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定する、前記サーバに設け
られた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信する送信手段と、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信する送信手
段と、 前記サーバが、前記送信元クライアントから送信された
前記音声データと前記画像データを前記送信先クライア
ントに送信する送信手段とを具備することを特徴とする
TV会議システム。
2. A TV conference system having a configuration of a client-server system, comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting audio data from an input device; input means for inputting image data from the image input device by the transmission source client; transmission means for transmitting the input audio data to the server; and audio transmitted to the server Determining whether the data is a user's voice or environmental noise; a voice data determining unit provided in the server; and if the voice data determining unit determines that the data is a user's voice, the source client Transmitting means for transmitting an image request command requesting image data to Transmitting means for transmitting the input image data to the server when the source client receives the image request command from the server, wherein the server is transmitted from the source client; A TV conference system comprising: a transmission unit that transmits the audio data and the image data to the destination client.
【請求項3】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントの画像入力装置から、第1の時
点に対応した第1の画像データ、前記第1の画像データ
と異なる第2の時点に対応した第2の画像データを入力
する画像入力手段と、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較する比較判定手
段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信す
る送信手段と、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信する前記送信手段と、 前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信する送信手段と、 前記サーバが、前記送信元クライアントから前記画像デ
ータを送信先クライアントに送信する送信手段とを具備
することを特徴とするTV会議システム。
3. A video conference system having a client-server system configuration comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the image input device of the source client is provided. Image input means for inputting first image data corresponding to a first time point, second image data corresponding to a second time point different from the first image data, and Comparing means for comparing the first image data with the second image data; and, as a result of the comparison, a predetermined change between the first image data and the second image data. And transmitting means for transmitting an image change notification command from the client to the server, the image change notification transmitted to the server. Receiving means for receiving an information command, the server transmitting an image request command requesting image data to a transmission source client, and receiving the image request command requesting the image data transmitted to the client, A transmission unit that transmits an image input by the client to the server; and a transmission unit that transmits the image data from the transmission source client to a transmission destination client. TV conference system.
【請求項4】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントの画像入力装置から、第1の時
点に対応した第1の画像データ、前記第1の画像データ
と異なる第2の時点に対応した第2の画像データを入力
する画像入力手段と、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信する送信手段と、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較する比較判定手段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信す
る送信手段と、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信する送信手段と、 前記サーバが、前記送信元クライアントから前記画像デ
ータを送信先クライアントに送信する送信手段とを具備
することを特徴とするTV会議システム。
4. A video conference system having a client-server system configuration comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the image input device of the source client is provided. Image input means for inputting first image data corresponding to a first time point, second image data corresponding to a second time point different from the first image data, and the input first image A transmitting unit that transmits data and the second image data to a server; a comparison determining unit that compares the first image data and the second image data transmitted by the server; As a result, when there is a predetermined change between the first image data and the second image data, the server sends the image change notification command to the server. Transmitting means for transmitting the image data input by the image inputting means to the server, transmitting means for transmitting to the server, the server transmitting the image data from the source client to the destination client A TV conference system comprising: a transmitting unit that transmits a video signal to the TV conference system.
【請求項5】送信元クライアント、送信先クライアント
前記送信元クライアントと前記送信先クライアントを接
続するサーバを有する、クライアント・サーバシステム
の構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定する前
記クライアントに設けられた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記音声データを前記サーバに送信する送
信手段と、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信する前記送信手段と、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信する送信手段と、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力する画像入力手段と、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較する比較判定手
段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信す
る送信手段と、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信する前記送信手段と、 前記クライアントへに送信した前記画像データを要求す
る画像要求コマンドを受けて、前記送信元クライアント
が前記画像入力手段によって入力された画像をサーバへ
送信する送信手段と、 前記サーバが前記送信元クライアントから送信された前
記音声データと前記画像データを前記送信先クライアン
トへ送信する送信手段とを具備することを特徴とするT
V会議システム。
5. A TV conference system having a configuration of a client server system having a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting voice data; input means for the source client to input image data from an image input device; and whether the source client is the input voice data as a user's voice or environmental noise. A voice data determining unit provided in the client, a transmitting unit that transmits the voice data to the server when the voice data determining unit determines that the voice is a user's voice, Receiving the audio data, the server requests image data. Transmitting means for transmitting an image request command to be transmitted to a transmission source client, and transmitting means for receiving the image request command requesting image data from the server and transmitting the image data input by the transmission source client to the server. And inputting first image data corresponding to a first time point and second image data corresponding to a second time point different from the first image data from the image input device of the transmission source client. Image input means, comparison determination means provided in the transmission source client for comparing the first image data and the second image data, and the result of the comparison, the first image data and the second Transmitting means for transmitting an image change notification command to the server when a predetermined change has occurred between the server and the server; The transmitting means for receiving the image change notification command transmitted to the client, the server transmitting an image request command requesting image data to a transmission source client; and an image request command requesting the image data transmitted to the client. Receiving means for transmitting the image input by the image inputting means to the server by the transmission source client; and the server transmits the audio data and the image data transmitted from the transmission source client to the transmission destination client. Transmission means for transmitting to T
V conference system.
【請求項6】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記入力した音声データを前記サーバに送信する送信手
段と、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定する、前記サーバに設け
られた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信する送信手段と、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信する送信手
段と、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力する画像入力手段と、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較する比較判定手
段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信す
る送信手段と、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信する前記送信手段と、 前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信する送信手段と、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
送信手段とを具備することを特徴とするTV会議システ
ム。
6. A TV conference system having a configuration of a client-server system, comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting audio data from the input device; input means for inputting image data from the image input device by the source client; transmitting means for transmitting the input audio data to the server; and audio transmitted to the server Determining whether the data is user's voice or environmental noise; voice data determining means provided in the server; if the voice data determining means determines that the user's voice, the transmission source client Transmitting means for transmitting an image request command requesting image data to When the transmission source client receives the image request command from the server, the transmission unit transmits the input image data to the server, and from the image input device of the transmission client, Image input means for inputting first image data corresponding to a first time point, second image data corresponding to a second time point different from the first image data, and provided in the transmission source client; Comparing and judging means for comparing the first image data with the second image data; and as a result of the comparison, a predetermined change has occurred between the first image data and the second image data. A transmitting unit that transmits an image change notification command to the server by the transmission source client; and the server that receives the image change notification command transmitted to the server. Transmitting means for transmitting an image request command requesting image data to a transmission source client, receiving the image request command requesting the image data transmitted to the client, and inputting the image by the transmission source client by the image input means A video conference system, comprising: a transmission unit that transmits the selected image to a server; and a transmission unit that transmits the audio data and the image data from the transmission source client to the transmission destination client.
【請求項7】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定する前
記クライアントに設けられた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記音声データを前記サーバに送信する送
信手段と、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信する前記送信手段と、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信する送信手段と、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力する画像入力手段と、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信する送信手段と、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較する比較判定手段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信す
る送信手段と、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信する送信手段と、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
送信手段とを具備することを特徴とするTV会議システ
ム。
7. A TV conference system having a configuration of a client-server system, comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting audio data from the input device; input means for inputting image data from the image input device by the transmission source client; and the transmission source client converting the input audio data to a user's voice or environmental noise. Voice data determining means provided in the client for determining whether or not the voice data determining means determines that the voice is a user voice; transmitting means for transmitting the voice data to the server; transmitting to the server The server receives the audio data and transmits the image data to the server. A transmission unit for transmitting an image request command to the transmission source client to request transmission of the image data input by the transmission source client to the server in response to an image request command for requesting image data from the server. Means, inputting first image data corresponding to a first time point, and second image data corresponding to a second time point different from the first image data, from an image input device of the transmission source client; Image transmitting means for transmitting the input first image data and the second image data to a server, wherein the server transmits the first image data and the second image A comparison determining unit that compares data with the first image data and the second image data when a predetermined change occurs between the first image data and the second image data as a result of the comparison; A transmitting unit that transmits an image change notification command to the transmission source client; a transmission unit that transmits the image data input by the transmission source client by the image input unit to a server; A TV conference system comprising: a transmission unit that transmits audio data and the image data to a transmission destination client.
【請求項8】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムにおいて、 前記送信元クライアントが音声入力装置から音声データ
を入力する入力手段と、 前記送信元クライアントが画像入力装置から画像データ
を入力する入力手段と、 前記入力した音声データを前記サーバに送信する送信手
段と、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定する、前記サーバに設け
られた音声データ判定手段と、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信する送信手段と、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信する送信手
段と、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力する画像入力手段と、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信する送信手段と、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較する比較判定手段と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信す
る送信手段と、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信する送信手段と、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
送信手段とを具備することを特徴とするTV会議システ
ム。
8. A TV conference system having a client-server system configuration comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein the source client is a voice input device. Input means for inputting audio data from the input device; input means for inputting image data from the image input device by the source client; transmitting means for transmitting the input audio data to the server; and audio transmitted to the server Determining whether the data is user's voice or environmental noise; voice data determining means provided in the server; if the voice data determining means determines that the user's voice, the transmission source client Transmitting means for transmitting an image request command requesting image data to When the transmission source client receives the image request command from the server, the transmission unit transmits the input image data to the server, and from the image input device of the transmission client, Image input means for inputting first image data corresponding to a first time point, and second image data corresponding to a second time point different from the first image data; A transmitting unit that transmits the second image data to a server, a comparison determining unit that compares the transmitted first image data and the second image data, and a result of the comparison; When a predetermined change occurs between the first image data and the second image data, the server transmits an image change notification command to the transmission source client. Means, transmission means for transmitting the image data input by the transmission source client by the image input means to a server, and the server transmitting the audio data and the image data from the transmission source client to a transmission destination client A TV conference system comprising: a transmission unit.
【請求項9】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定し、 前記ユーザの音声であったと判定された場合、前記音声
データをサーバに送信し、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信し、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信し、 前記サーバが前記送信元クライアントから送信された前
記音声データと前記画像データを前記送信先クライアン
トへ送信することを特徴とするTV会議システムの制御
方法。
9. A control method for a TV conference system having a client-server system configuration, comprising: a source client, a destination client, and a server connecting the source client and the destination client. Voice data is input to a voice input device, image data is input to an image input device of the transmission source client, and the transmission source client determines whether the input voice data is a user's voice or environmental noise. When it is determined that the voice is the user's voice, the voice data is transmitted to a server. Upon receiving the voice data transmitted to the server, the server transmits an image request command requesting image data to the server. An image request command that transmits to a client and requests image data from the server Receiving the image data, the image data input by the transmission source client is transmitted to the server, and the server transmits the audio data and the image data transmitted from the transmission source client to the transmission destination client. Control method of the TV conference system.
【請求項10】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記入力した音声データをサーバに送信し、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定し、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信し、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信し前記サー
バが、前記送信元クライアントから送信された前記音声
データと前記画像データを前記送信先クライアントに送
信することを特徴とするTV会議システムの制御方法。
10. A method for controlling a TV conference system having a client-server system, comprising: a source client, a destination client, and a server connecting the source client and the destination client, wherein: Voice data is input to a voice input device, image data is input to an image input device of the transmission source client, the input voice data is transmitted to a server, and voice data transmitted to the server is a user voice. Or whether it is environmental noise, if the voice data determination means is determined to be a user's voice, transmits an image request command requesting image data to the source client, the image from the server If the requesting command is received by the source client, the source client And transmitting the input image data to the server and the server transmitting the audio data and the image data transmitted from the transmission source client to the transmission destination client. Method.
【請求項11】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの画像入力装置から、第1の時
点に対応した第1の画像データ、前記第1の画像データ
と異なる第2の時点に対応した第2の画像データを入力
し、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信
し、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信し、 前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信し、 前記サーバが、前記送信元クライアントから前記画像デ
ータを送信先クライアントに送信することを特徴とする
TV会議システムの制御方法。
11. A method for controlling a TV conference system having a client-server system configuration, comprising: a source client, a destination client, and a server connecting the source client and the destination client. First image data corresponding to a first point in time and second image data corresponding to a second point in time different from the first image data are input from an image input device, and provided in the source client. Comparing the first image data with the second image data, and, if the result of the comparison indicates that there is a predetermined change between the first image data and the second image data, transmitting The former client transmits an image change notification command to the server, and upon receiving the image change notification command transmitted to the server, the server An image request command for requesting image data is transmitted to a transmission source client, and an image request command for requesting the image data transmitted to the client is received, and the transmission source client transmits an image input by the image input unit to a server. And transmitting the image data from the transmission source client to the transmission destination client.
【請求項12】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの画像入力装置から、第1の時
点に対応した第1の画像データ、前記第1の画像データ
と異なる第2の時点に対応した第2の画像データを入力
し、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信し、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信
し、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信し、 前記サーバが、前記送信元クライアントから前記画像デ
ータを送信先クライアントに送信するTV会議システム
の制御方法。
12. A control method for a TV conference system having a client-server system, comprising: a source client; a destination client; and a server connecting the source client and the destination client. First image data corresponding to a first time point, second image data corresponding to a second time point different from the first image data are input from an image input device, and the input first image data is input. And the second image data are transmitted to the server. The server compares the transmitted first image data and the second image data. As a result of the comparison, the first image data And when there is a predetermined change between the second image data and the second image data, the server transmits an image change notification command to the source client, Xinyuan client sends the image data input by said image input unit to the server, the server, the control method of the TV conference system for transmitting from the source client of the image data to the destination client.
【請求項13】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定し、 前記ユーザの音声であったと判定された場合、前記音声
データをサーバに送信し、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信し、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信し、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力し、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信
し、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信し、 前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信し、 前記サーバが前記送信元クライアントから送信された前
記音声データと前記画像データを前記送信先クライアン
トへ送信ことを特徴とするTV会議システムの制御方
法。
13. A method for controlling a TV conference system having a client-server system, comprising: a source client, a destination client, and a server connecting the source client and the destination client. Voice data is input to a voice input device, and image data is input to an image input device of the transmission source client. The transmission source client determines whether the input voice data is a user voice or environmental noise. When it is determined that the voice is the user's voice, the voice data is transmitted to a server, and upon receiving the voice data transmitted to the server, the server transmits an image request command requesting image data to the transmission source. An image request frame for transmitting to the client and requesting image data from the server Receiving the image data, transmitting the image data input by the transmission source client to the server; and transmitting, from the image input device of the transmission source client, first image data corresponding to a first time, Inputting second image data corresponding to a second point in time different from the image data of the above, comparing the first image data and the second image data provided in the transmission source client, As a result, when there is a predetermined change between the first image data and the second image data, the transmission source client transmits an image change notification command to the server, and the image transmitted to the server Upon receiving the change notification command, the server transmits an image request command requesting image data to a transmission source client, and requests the image data transmitted to the client. Receiving the image request command, the transmission source client transmits an image input by the image input means to a server, and the server transmits the audio data and the image data transmitted from the transmission source client to the transmission destination client. A method for controlling a TV conference system, wherein the method is transmitted to a client.
【請求項14】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記入力した音声データをサーバに送信し、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定し、 前記ユーザの音声であったと判定された場合、前記送信
元クライアントへ画像データを要求する画像要求コマン
ドを送信し、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信しまた、前
記送信元クライアントの画像入力装置から、第1の時点
に対応した第1の画像データ、前記第1の画像データと
異なる第2の時点に対応した第2の画像データを入力
し、 前記送信元クライアントに設けられた、前記第1の画像
データと前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、送信元クラ
イアントが画像変化通知コマンドを前記サーバへ送信
し、 前記サーバに送信した前記画像変化通知コマンドを受け
て、前記サーバが画像データを要求する画像要求コマン
ドを送信元クライアントに送信し、 前記クライアントに送信した前記画像データを要求する
画像要求コマンドを受けて、前記送信元クライアントが
前記画像入力手段によって入力された画像をサーバへ送
信し、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
ことを特徴とするTV会議システムの制御方法。
14. A method for controlling a TV conference system having a client-server system, comprising: a source client, a destination client, and a server connecting the source client and the destination client. Voice data is input to a voice input device, image data is input to an image input device of the transmission source client, the input voice data is transmitted to a server, and voice data transmitted to the server is a user voice. Or an environmental noise, and if it is determined that the voice is the user's voice, an image request command for requesting image data is transmitted to the transmission source client, and the image request command from the server is transmitted. If the source client receives the message, the source client Transmitting image data to the server; and transmitting, from the image input device of the transmission source client, first image data corresponding to a first time point, and second image data corresponding to a second time point different from the first image data. And comparing the first image data and the second image data provided in the transmission source client. As a result of the comparison, the first image data and the second image data are compared. When there is a predetermined change between the image data and the image data, the transmission source client transmits an image change notification command to the server, and upon receiving the image change notification command transmitted to the server, the server requests the image data. An image request command requesting the image data transmitted to the client; Sends said image input by the image input unit to the server, the server, the control method of the TV conference system, characterized by transmitting from the source client of the image data and the voice data to the destination client.
【請求項15】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記送信元クライアントが、前記入力した音声データを
ユーザーの音声であるか環境雑音であるかを判定し、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記音声データをサーバに送信し、 前記サーバに送信された前記音声データを受けて、前記
サーバが画像データを要求する画像要求コマンドを送信
元クライアントに送信し、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記送信元クライアントが入力した前記画
像データを前記サーバへ送信し、 また、前記送信元クライアントの画像入力装置から、第
1の時点に対応した第1の画像データ、前記第1の画像
データと異なる第2の時点に対応した第2の画像データ
を入力し、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信し、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信
し、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信し、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
ことを特徴とするTV会議システムの制御方法
15. A control method for a TV conference system having a client-server system, comprising: a source client; a destination client; and a server connecting the source client and the destination client. Voice data is input to a voice input device, image data is input to an image input device of the transmission source client, and the transmission source client determines whether the input voice data is a user's voice or environmental noise. When the voice data determination unit determines that the voice is a user voice, the voice data is transmitted to a server, and the server receives the voice data transmitted to the server, and the server requests image data. Sends a request command to the sending client, and sends the image data from the server Receiving the requested image request command and transmitting the image data input by the transmission source client to the server; and transmitting, from the image input device of the transmission source client, first image data corresponding to a first time point Inputting second image data corresponding to a second point of time different from the first image data, transmitting the input first image data and the input second image data to a server, Comparing the transmitted first image data with the second image data, and as a result of the comparison, there is a predetermined change between the first image data and the second image data The server transmits an image change notification command to the transmission source client; the transmission source client transmits the image data input by the image input unit to the server; The control method of the TV conference system, characterized by transmitting from the source client of the image data and the voice data to the destination client
【請求項16】送信元クライアント、送信先クライアン
ト、前記送信元クライアントと前記送信先クライアント
を接続するサーバを有する、クライアント・サーバシス
テムの構成をとるTV会議システムの制御方法におい
て、 前記送信元クライアントの音声入力装置に音声データを
入力し、 前記送信元クライアントの画像入力装置に画像データを
入力し、 前記入力した音声データをサーバに送信し、 前記サーバに送信された音声データをユーザーの音声で
あるか環境雑音であるかを判定し、 前記音声データ判定手段でユーザの音声であったと判定
された場合、前記送信元クライアントへ画像データを要
求する画像要求コマンドを送信し、 前記サーバからの前記画像要求コマンドを前記送信元ク
ライアントが受信した場合、前記送信元クライアントが
前記入力した画像データを前記サーバへ送信しまた、前
記送信元クライアントの画像入力装置から、第1の時点
に対応した第1の画像データ、前記第1の画像データと
異なる第2の時点に対応した第2の画像データを入力
し、 前記入力した第1の画像データと前記第2の画像データ
をサーバに送信し、 前記サーバが、前記送信された前記第1の画像データと
前記第2の画像データとを比較し、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、サーバが画
像変化通知コマンドを前記送信元クライアントへ送信
し、 前記送信元クライアントが前記画像入力手段によって入
力した前記画像データをサーバへ送信し、 前記サーバが、前記送信元クライアントから前記音声デ
ータと前記画像データを送信先クライアントに送信する
ことを特徴とするTV会議システムの制御方法。
16. A method for controlling a TV conference system having a client-server system, comprising a source client, a destination client, and a server connecting the source client and the destination client, wherein: Voice data is input to a voice input device, image data is input to an image input device of the transmission source client, the input voice data is transmitted to a server, and voice data transmitted to the server is a user voice. Or whether it is environmental noise, if the voice data determination means is determined to be a user's voice, transmits an image request command requesting image data to the source client, the image from the server If the requesting command is received by the source client, the source client The client transmits the input image data to the server; and, from an image input device of the transmission source client, a first image data corresponding to a first time, a second time different from the first image data Inputting the second image data corresponding to the first image data and transmitting the input first image data and the second image data to a server, wherein the server transmits the first image data and the second image data And if the result of the comparison indicates that there is a predetermined change between the first image data and the second image data, the server sends an image change notification command to the source client. To the server, transmitting the image data input by the transmission source client by the image input unit to a server, the server, from the transmission source client, the audio data and the image A method for controlling a TV conference system, comprising transmitting image data to a destination client.
【請求項17】前記送信元クライアントからサーバへ送
信する画像データは、前記送信元クライアントから入力
された画像データで、入力された時点が異なる画像デー
タとの画像圧縮方式による差分データであることを特徴
とする請求項9から請求項16のいずれか1つに記載の
TV会議システムの制御方法。
17. The image data transmitted from the transmission source client to the server is image data input from the transmission source client and is difference data based on an image compression method from image data input at a different time. The control method for a TV conference system according to any one of claims 9 to 16, wherein:
【請求項18】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのクライ
アントを制御するプログラムを格納した記憶媒体であっ
て、 入力した音声データをユーザーの音声であるか環境雑音
であるかを判定する手順と、 前記音声データを前記サーバに送信する手順と、 前記サーバからの画像データを要求する画像要求コマン
ドを受けて、前記クライアントが入力した前記画像デー
タを前記サーバへ送信する手順と、 前記サーバから前記音声データと前記画像データを受信
する手順とを具備することを特徴とするTV会議システ
ムのクライアントを制御するプログラムを格納した記憶
媒体。
18. A storage medium for use in a TV conference system of a client / server system, in which a program for controlling a client of the TV conference system is stored, wherein input audio data is a user's voice or environmental noise. A step of determining whether or not the image data is present; a step of transmitting the audio data to the server; and receiving an image request command requesting image data from the server, transmitting the image data input by the client to the server. A storage medium storing a program for controlling a client of a TV conference system, comprising: a procedure; and a step of receiving the audio data and the image data from the server.
【請求項19】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのクライ
アントを制御するプログラムを格納した記憶媒体であっ
て、 入力した音声データを前記サーバに送信する手順と、 前記サーバから送信される画像データを要求する画像要
求コマンドを受信する手順と、 前記サーバからの前記画像要求コマンドを受信した場
合、前記クライアントが前記入力した画像データを前記
サーバへ送信する手順と、 前記サーバからの前記音声データと前記画像データを受
信する手順とを具備することを特徴とするTV会議シス
テムのクライアントを制御するプログラムを格納した記
憶媒体。
19. A storage medium used in a TV conference system of a client / server system and storing a program for controlling a client of the TV conference system, wherein a step of transmitting input audio data to the server; A step of receiving an image request command requesting image data transmitted from a server, and a step of transmitting the input image data to the server by the client when receiving the image request command from the server; A storage medium storing a program for controlling a client of a TV conference system, comprising: a step of receiving the audio data and the image data from a server.
【請求項20】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのクライ
アントを制御するプログラムを格納した記憶媒体であっ
て、入力した第1の画像データと第2の画像データとを
比較する手順と、 前記比較の結果、前記第1の画像データと前記第2の画
像データとの間に所定の変化があった場合、画像変化通
知コマンドを前記サーバへ送信する手順と、 前記サーバからの画像データを要求する画像要求コマン
ドを受信する手順と、 前記サーバから受信した前記画像データを要求する画像
要求コマンドを受けて、前記画像入力手段によって入力
された画像をサーバへ送信する手順と、 前記サーバからの前記画像データ受信する手順とを具備
することを特徴とするTV会議システムのクライアント
を制御するプログラムを格納した記憶媒体。
20. A storage medium for use in a TV conference system of a client / server system, in which a program for controlling a client of the TV conference system is stored, wherein the input first image data and second image data are And a step of transmitting an image change notification command to the server when a predetermined change has occurred between the first image data and the second image data as a result of the comparison. A step of receiving an image request command requesting image data from a server, a step of receiving an image request command requesting the image data received from the server, and transmitting an image input by the image input unit to the server And a step of receiving the image data from the server. A storage medium storing a program to be controlled.
【請求項21】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのクライ
アントを制御するプログラムを格納した記憶媒体であっ
て、 入力した第1の画像データと前記第2の画像データをサ
ーバに送信する手順と前記サーバからの画像変化通知コ
マンドを受信する手順と、 前記画像入力手段によって入力した前記画像データをサ
ーバへ送信する手順と前記サーバからの前記画像データ
を受信する手順とを具備することを特徴とするTV会議
システムのクライアントを制御するプログラムを格納し
た記憶媒体。
21. A storage medium used for a TV conference system of a client / server system and storing a program for controlling a client of the TV conference system, wherein the first image data and the second image data are inputted. Transmitting to the server, receiving the image change notification command from the server, transmitting the image data input by the image input unit to the server, and receiving the image data from the server. A storage medium storing a program for controlling a client of a TV conference system, comprising:
【請求項22】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのサーバ
を制御するプログラムを格納した記憶媒体であって、 前記クライアントからの音声データを受信する手順と、 画像データを要求する画像要求コマンドを送信元クライ
アントに送信する手順と、 前記送信元クライアントからの画像データを受信する手
順と、 前記送信元クライアントからの前記音声データと前記画
像データを送信先クライアントへ送信する手順とを具備
することを特徴とするTV会議システムのサーバを制御
するプログラムを格納した記憶媒体。
22. A storage medium used in a TV conference system of a client-server system and storing a program for controlling a server of the TV conference system, comprising: a step of receiving audio data from the client; Transmitting an image request command requesting image data to a transmission source client; receiving image data from the transmission source client; transmitting the audio data and the image data from the transmission source client to a transmission destination client. And a storage medium storing a program for controlling a server of the TV conference system.
【請求項23】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのサーバ
を制御するプログラムを格納した記憶媒体であって、 前記クライアントからの音声データを受信する手順と、 前記音声データをユーザーの音声であるか環境雑音であ
るかを判定する手順と前記手順により、ユーザの音声で
あったと判定した場合、送信元クライアントへ画像デー
タを要求する画像要求コマンドを送信する手順と、 前記送信元クライアントからの画像データを受信する手
順と、 前記送信元クライアントから受信した前記音声データと
前記画像データを送信先クライアントに送信する手順と
を具備することを特徴とするTV会議システムのサーバ
を制御するプログラムを格納した記憶媒体。
23. A storage medium for use in a TV conference system of a client-server system, in which a program for controlling a server of the TV conference system is stored, wherein a step of receiving voice data from the client; By the procedure for determining whether the data is the voice of the user or the environmental noise, the procedure for transmitting an image request command for requesting image data to the transmission source client when it is determined that the data is the voice of the user, A server for a TV conference system, comprising: a step of receiving image data from the source client; and a step of transmitting the audio data and the image data received from the source client to a destination client. Storage medium storing a program for controlling the computer.
【請求項24】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのサーバ
を制御するプログラムを格納した記憶媒体であって、 送信元クライアントに設けられた、入力した第1の画像
データと第2の画像データとを比較する手順と、 送信元クライアントからの画像変化通知コマンドを受信
する手順と、 画像データを要求する画像要求コマンドを送信元クライ
アントに送信する手順と、 前記送信元クライアントからの前記画像入力手順によっ
て入力された画像を受信する手順と、 前記送信元クライアントから受信した前記画像データを
送信先クライアントに送信する手順とを具備することを
特徴とするTV会議システムのサーバを制御するプログ
ラムを格納した記憶媒体。
24. A storage medium which is used in a TV conference system of a client / server system and stores a program for controlling a server of the TV conference system, wherein the input first image is provided in a transmission source client. Comparing the data with the second image data, receiving an image change notification command from the transmission source client, transmitting an image request command requesting image data to the transmission source client, A server for a TV conference system, comprising: a step of receiving an image input by the image input procedure from a client; and a step of transmitting the image data received from the source client to a destination client. Storage medium storing a program for controlling the computer.
【請求項25】クライアント・サーバシステムのTV会
議システムに用いられ、前記TV会議システムのサーバ
を制御するプログラムを格納した記憶媒体であって、 送信元クライアントから入力した第1の画像データと前
記第2の画像データを受信する手順と、 前記受信された前記第1の画像データと前記第2の画像
データとを比較する手順と、 画像変化通知コマンドを前記送信元クライアントへ送信
する手順と、 前記送信元クライアントからの画像データを受信する手
順と、 前記送信元クライアントから受信した前記画像データを
送信先クライアントに送信する手順とを具備することを
特徴とするTV会議システムのサーバを制御するプログ
ラムを格納した記憶媒体。
25. A storage medium for use in a TV conference system of a client / server system, in which a program for controlling a server of the TV conference system is stored, wherein the first image data input from a source client and the first image data are stored in the storage medium. Receiving the second image data, comparing the received first image data with the second image data, transmitting an image change notification command to the transmission source client, A program for controlling a server of a TV conference system, comprising: a step of receiving image data from a source client; and a step of transmitting the image data received from the source client to a destination client. The storage medium in which it was stored.
JP11145386A 1999-04-15 1999-04-15 Video conference system, video conference system control method, and storage medium storing program for controlling video conference system Pending JP2000308034A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11145386A JP2000308034A (en) 1999-04-15 1999-04-15 Video conference system, video conference system control method, and storage medium storing program for controlling video conference system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11145386A JP2000308034A (en) 1999-04-15 1999-04-15 Video conference system, video conference system control method, and storage medium storing program for controlling video conference system

Publications (1)

Publication Number Publication Date
JP2000308034A true JP2000308034A (en) 2000-11-02

Family

ID=15384058

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11145386A Pending JP2000308034A (en) 1999-04-15 1999-04-15 Video conference system, video conference system control method, and storage medium storing program for controlling video conference system

Country Status (1)

Country Link
JP (1) JP2000308034A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013242632A (en) * 2012-05-18 2013-12-05 Ricoh Co Ltd Information processing device, information processing system, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013242632A (en) * 2012-05-18 2013-12-05 Ricoh Co Ltd Information processing device, information processing system, and program

Similar Documents

Publication Publication Date Title
US10425782B2 (en) Voice messaging method and mobile terminal supporting voice messaging in mobile messenger service
US7227922B2 (en) Method and device for the transmission of data in a packet-oriented data network
EP2143234B1 (en) Media detection and packet distribution in a multipoint conference
US7996540B2 (en) Method and system for replacing media stream in a communication process of a terminal
JP2002007294A (en) Image distribution system and method, and storage medium
KR102501233B1 (en) Method for service video conference and apparatus for executing the method
US20090225153A1 (en) Apparatus For Synthesizing Information, Apparatus For Controlling Information, And Computer Program Product
JPH09252462A (en) Transmission processing device, video conference system, transmission processing method, and storage medium
CN111885252A (en) Mobile phone expansion use method
JP2004214934A (en) Presence information processing terminal, presence information processing program, and presence service providing server
JPWO2005094077A1 (en) Multipoint conference system and multipoint conference device
US20170034480A1 (en) Communication device, communication system, and computer-readable recording medium
EP2013768A2 (en) Methods and apparatuses for processing audio streams for use with multiple devices
US8667159B2 (en) Communication device, communication method, and computer product
JP2000308034A (en) Video conference system, video conference system control method, and storage medium storing program for controlling video conference system
US9335829B2 (en) Method for capturing and transmitting motion data
JP2020036225A (en) Information processing apparatus, information processing method, and information processing program
JP2002290940A (en) Video conference system
CN117255172A (en) A method for handling media streams in video conferencing
JP7665984B2 (en) Data processing device, data processing system, and audio processing method
JPH11261637A (en) Multipoint connection conference system configuration method, multipoint connection conference system, server device and client device, and storage medium storing multipoint connection conference system configuration program
CN112839197B (en) Image code stream processing method, device, system and storage medium
JP6183881B2 (en) Codec conversion gateway, codec conversion method, and codec conversion program
JP2010109654A (en) Framework, method and system of communication for providing audio and/or video signal on remotely-controlled real time basis
JP2007067535A (en) Participation control method in electronic conference