[go: up one dir, main page]

JP4745375B2 - 対話型立体的オーディオビジュアル・システム - Google Patents

対話型立体的オーディオビジュアル・システム Download PDF

Info

Publication number
JP4745375B2
JP4745375B2 JP2008244877A JP2008244877A JP4745375B2 JP 4745375 B2 JP4745375 B2 JP 4745375B2 JP 2008244877 A JP2008244877 A JP 2008244877A JP 2008244877 A JP2008244877 A JP 2008244877A JP 4745375 B2 JP4745375 B2 JP 4745375B2
Authority
JP
Japan
Prior art keywords
user
room
audio
specific
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008244877A
Other languages
English (en)
Other versions
JP2009043274A (ja
Inventor
スタンレー マクグラス,デイビッド
リチャード ヘッケンバーグ,ダニエル
ジェイムズ ベネット,スティーブン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2009043274A publication Critical patent/JP2009043274A/ja
Application granted granted Critical
Publication of JP4745375B2 publication Critical patent/JP4745375B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1822Conducting the conference, e.g. admission, detection, selection or grouping of participants, correlating users to one or more conference sessions, prioritising transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/563User guidance or feature selection
    • H04M3/564User guidance or feature selection whereby the feature is a sub-conference

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Stereophonic System (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、3次元オーディオ環境においてチャット・ルーム型の会話を行うための対話型立体的オーディオビジュアル・システムに関する。
近年、チャット・ルームは、インターネットを介した交際のための非常に人気のあるフォーラムになってきた。
チャット・ルームを用いることにより、更に高いレベルの個人的な交際やオンラインの討論が可能となる。通常、チャット・ルームは、討論主題ベースとすることができる。
従来のチャット・プログラムは、テキスト入力ベースのチャット環境を提供する。参加者は、個人とチャットするかグループの中でチャットするかのいずれかを選択することができる。限られた長さのショート・メッセージを2つのグループ間で送信することを可能とするメッセージング・サービスも提供されている。このオンライン・プログラムは、時間と共に非常に人気が出てきて、多くのユーザを獲得した。
残念ながら、チャット・ルームのシナリオには、多くの欠点がある。それには、チャット・ルームに入るためにはキーボード型装置上で情報をタイプすることが必要である点が含まれる。タイプは、話す過程と単純に比較すると面倒でありかつ無意識的でない過程であることが多い。更に、チャット・ルームの会話は、混乱して入り混じったものになることもままあり得るので、特定の討論の中で複数の参加者の経過を追うのは困難である。
本発明の第1の態様に従うと、複数の遠隔ユーザ端末を接続するための対話型立体的オーディオビジュアル・システムであって、
ネットワーク接続されたコンピュータと、
ユーザ状態情報を含む関連するユーザ・データベースと、
仮想ユーザ環境内で互いに対して相対的にユーザを仮想的に配置するための前記遠隔ユーザ端末から複数のオーディオ・ストリーム及び関連する配置データを前記コンピュータにおいて受信するための入力手段と、
前記ユーザ・データベース内の状態情報に基づいて第1の選択処理における前記オーディオ・ストリームの少なくとも第1のグループの選択を可能にするための選択手段と、
オーディオ・ストリームの選択されたグループ及び第1のユーザ端末における前記配置データによって規定されるオーディオ源の視覚表現と実質的に一貫している第1の聞き手ベースのオーディオ基準フレームに対して相対的に前記オーディオ・ストリームの選択されたグループを空間化するための関連する配置データを出力するための出力手段と、で構成されるシステムが提供される。
都合良く、前記システムは、前記オーディオ・ストリームの選択されたグループを立体化(空間化)するための第1の立体化(空間化)手段を含む。
望ましくは、前記システムは、前記ユーザ端末へ伝送するために前記オーディオ・ストリームの少なくともいくつかを結合オーディオ・ストリームへと結合するための結合手段と、前記ユーザ端末における前記オーディオ基準フレーム内に背景オーディオ効果を規定すべく前記結合ストリームを立体化するための第2の立体化手段と、を含む。
都合良く、前記選択手段は、相当するユーザ端末への伝送のために、前記ユーザ・データベース内の前記ユーザ状態情報に基づいて異なる選択処理に応じてオーディオ・ストリームの異なるグループを選択すべく準備される。
ユーザ状態情報は、典型的には、仮想環境内でユーザを配置するためのユーザ位置データ、他のユーザ及び前記仮想環境の両者に関して前記ユーザを方向付けるためのユーザ方向データ、ユーザ聞き方状態情報、及びユーザ話し方状態情報を含む。
前記ユーザ聞き方状態情報は、前記ユーザが前記環境内の他の選択されたユーザ又はグループの話を聞くことができるように準備される。
前記ユーザ聞き方状態は、
N個のオーディオ源からM個の最も近いオーディオ源を選択すること、
音源信号の振幅及び/又は聞き手からの音源の距離に基づいてM個の最も大きい音源を選択すること、
対象ユーザ又は他のユーザによって決定されるユーザ主導の選択処理、
前記環境内の「議長」が他のユーザの話し方及び聞き方の状態を制御することができる議長主導の選択処理、
壁や出入口のような障壁及び開口及び環境の他の機能が特定のユーザの聴力に作用するように現実的に準備された前記仮想環境の地形又はトポロジー、
ユーザグループの周りに一時的な「防音」壁を生成すること、の少なくとも一つに基づくことができる。
前記障壁は、特定のルーム内の前記オーディオ・ストリームの少なくともいくつかは前記特定のルームに特有の背景残響効果を得るために加算されすなわち結合されて立体化されている一つ以上のチャット・ルームを規定することができる。
隣接するルーム又は領域内の前記オーディオ・ストリームは、入口/出口点における「閾値」効果を生成すべく、結合し立体化することもできる。
「ドライ」及び「ウェット」ルーム信号は、それぞれ、加算された非残響オーディオ源及び加算され残響されたオーディオ源を用いて生成することができる。
一般論として、本発明は、仮想環境内における視覚的効果と聴覚的効果との間の密着の尺度が存在する仮想環境を提供しようと努めている。
典型的には、ユーザ・データベースは、選択されたオーディオ・ストリーム及び関連する配置情報が送信されている特定のユーザの状態に基づいて複数の異なった選択尺度を利用する。
都合良く、前記第1の立体化手段は、前記ネットワーク接続されたコンピュータからのオーディオ・ストリームの選択されたグループを処理するための前記ユーザ端末の各々において装備される。
これとは別に、前記第1の立体化手段は、少なくとも前記第1の選択されたユーザ端末に前方伝送するための立体的オーディオ・ストリームを得るために前記ネットワーク接続されたコンピュータにおいてオーディオ・ストリームの選択されたグループを処理するように準備される。
本発明の一形態において、前記第2の立体化手段は、少なくとも前記第1の選択されたユーザ端末に前方伝送するための立体的結合オーディオ・ストリームを得るために前記ネットワーク接続されたコンピュータにおいてオーディオ・ストリームの結合されたグループを処理するように準備される。
これとは別に、前記第2の立体化手段は、各ユーザ端末においてオーディオ・ストリームの結合されたグループを立体化するための前記ユーザ端末の各々において装備される。
典型的には、前記第2の立体化手段は、バイノーラル(binaural)残響プロセッサを含む。
複数のユーザ・ベースのオーディオ源から複数の相当するオーディオ・ストリーム及び仮想環境内で互いに対して相対的に前記オーディオ源を仮想的に配置することのできる関連する配置データを受信することと、
ユーザ状態データを決定することと、
前記ユーザ状態データに基づいて前記オーディオ・ストリームの少なくともいくつかを選択することと、
前記仮想環境内の前記オーディオ源の少なくともいくつかの仮想位置の視覚表現の表示を可能とするために前記配置データ及び選択されたオーディオ・ストリームを第1の聞き手の宛先に伝送することと、
前記オーディオ・ストリームが前記第1の聞き手の宛先に伝送される以前又は以後のいずれかにおいて前記オーディオ源の前記視覚表現と実質的に一貫している第1の聞き手ベースのオーディオ基準フレームに対して相対的に選択されたオーディオ・ストリームを空間化することと、で構成される対話型立体的オーディオビジュアル設備を提供する方法に、本発明は拡張される。
望ましくは、前記方法は、
前記ユーザ状態データを変更することを可能にすることと、
変更されたユーザ状態データを読むことと、
前記変更されたユーザ状態データに基づいて前記オーディオ・ストリームの少なくとも一つを選択することと、
を含み、
前記変更されたユーザ状態データを用いて選択された前記オーディオ・ストリームの少なくとも一つは以前の選択されたストリームとは異なる。
都合良く、前記方法は、
前記オーディオ・ストリームの少なくともいくつかを結合するステップと、
結合オーディオ・ストリームを前記第1の聞き手の宛先に伝送するステップと、
前記仮想環境内に背景オーディオ効果を与えるべく前記結合オーディオ・ストリームを前記第1の聞き手の宛先において立体化するステップと、を含む。
前記結合オーディオ・ストリームは、個々には選択されなかったオーディオ・ストリームを含むことができる。
複数のユーザ・ベースのオーディオ源から複数の相当するオーディオ・ストリーム及び仮想環境内で互いに対して相対的に前記オーディオ源を仮想的に配置することのできる関連する配置データを受信することと、
ユーザ状態データを決定することと、
第1の選択処理において前記ユーザ状態データに基づいて前記オーディオ・ストリームの少なくともいくつかを選択することと、
前記仮想環境内の選択されたオーディオ源の少なくともいくつかの仮想位置の視覚表現の表示を可能とするために選択されたオーディオ・ストリーム及び関連する配置データを第1の聞き手の宛先に伝送することと、
前記ストリームを伝送する以前又は以後のいずれかにおいて前記オーディオ源の前記視覚表現と実質的に一貫している第1の聞き手ベースのオーディオ基準フレームに対して相対的に前記選択されたオーディオ・ストリームを空間化することと、
第2の選択処理において前記オーディオ・ストリームの少なくともいくつかを選択することと、
少なくとも前記選択されたオーディオ源の位置の視覚表現の表示を可能とするために前記選択されたオーディオ・ストリーム及び関連する配置情報を第2の聞き手の宛先に伝送すると共に、前記ストリームを伝送する以前又は以後のいずれかにおいて前記オーディオ源の前記視覚表現と実質的に一貫しているオーディオ基準フレーム内で前記選択されたオーディオ・ストリームを前記第2の聞き手の宛先において空間化することと、で構成される対話型立体的オーディオビジュアル設備を提供する方法に、本発明は拡張される。
本発明の更なる態様に従うと、ネットワーク環境を介した立体的会話を規定するためのシステムであって、
複数のユーザ端末と、
各オーディオ・ストリームが関連する空間化情報を含む、前記ユーザ端末へのオーディオ・ストリームを流すことができるコンピュータ・ネットワークと、
前記関連する空間化情報を用いてユーザの周りの所定の仮想位置に前記オーディオ・ストリームをレンダリングするためのレンダリング・システムと、
前記オーディオ・ストリーム内においてユーザを仮想空間的に配置するためのユーザ・インターフェースと、で構成され、
前記レンダリング・システムは前記ユーザの周りに実質的に空間的に一貫したオーディオ基準フレームを保持すべく前記オーディオ・ストリームを空間化し、前記ユーザ・インターフェースは聞き手の周りの前記オーディオ・ストリームの各々の空間的位置の視覚インジケータを含み、前記レンダリング・システムは前記視覚インジケータに対して相対的に実質的に空間的に一貫したオーディオ基準フレームを保持する、システムが提供される。
各ストリームは、望ましくは、ユーザの所有権情報を含み、前記システムは、望ましくは、前記オーディオ・ストリームに対するアクセスを認めるためのオーディオ・ストリーム・アクセス・インターフェースを含む。
前記レンダリング・システムは、今のユーザから仮想的に離れて位置するオーディオ源を減衰させ、かつ、今のユーザから仮想的に離れて位置するオーディオ源を結合することができる。一実施形態において、前記レンダリング・システムは、ユーザ近傍に位置することができ、前記オーディオ源は、望ましくは、コンピュータ・ネットワークを介して流される。
本発明の一形態において、少なくとも一つの所定のアルゴリズムに応じてオーディオ・ストリームを選択するために複数の選択処理が用いられ、選択されたオーディオ・ストリーム及び関連する配置情報が複数の聞き手の宛先に送信され、少なくとも第2のオーディオ源の位置の視覚表現が複数の聞き手の宛先において表示され、選択されたオーディオ・ストリームの各々はオーディオ源の視覚表現と実質的に密着しているオーディオ基準フレーム内における複数の聞き手の宛先において立体化される。
対話型立体的オーディオビジュアル設備をコンピュータに提供せしめるための実行可能な命令を記憶したコンピュータ可読媒体であって、前記命令は、
複数のユーザ・ベースのオーディオ源から複数の相当するオーディオ・ストリーム及び仮想環境内で互いに対して相対的に前記オーディオ源を仮想的に配置することのできる関連する配置データを受信し、
ユーザ状態データを決定し、
前記ユーザ状態データに基づいて前記オーディオ・ストリームの少なくともいくつかを選択し、
前記仮想環境内の前記オーディオ源の少なくともいくつかの仮想位置の視覚表現の表示を可能とするために前記配置データ及び選択されたオーディオ・ストリームを第1の聞き手の宛先に伝送し、
前記オーディオ源の前記視覚表現と実質的に一貫している第1の聞き手ベースのオーディオ基準フレームに対して相対的に選択されたオーディオ・ストリームを空間化する、ように配置されているコンピュータ可読媒体を、本発明は更に提供する。
対話型立体的オーディオビジュアル設備をコンピュータに提供せしめるための実行可能な命令を記憶したコンピュータ可読媒体であって、前記命令は、
複数のユーザ・ベースのオーディオ源から複数の相当するオーディオ・ストリーム及び仮想環境内で互いに対して相対的に前記オーディオ源を仮想的に配置することのできる関連する配置データを受信し、
ユーザ状態データを決定し、
第1の選択処理において前記ユーザ状態データに基づいて前記オーディオ・ストリームの少なくともいくつかを選択し、
前記仮想環境内の選択されたオーディオ源の少なくともいくつかの仮想位置の視覚表現の表示を可能とするために選択されたオーディオ・ストリーム及び関連する配置データを第1の聞き手の宛先に伝送し、
前記オーディオ源の前記視覚表現と実質的に一貫している第1の聞き手ベースのオーディオ基準フレームに対して相対的に前記選択されたオーディオ・ストリームを空間化し、
第2の選択処理において前記オーディオ・ストリームの少なくともいくつかを選択し、
少なくとも前記選択されたオーディオ源の位置の視覚表現の表示を可能とするために前記選択されたオーディオ・ストリーム及び関連する配置情報を第2の聞き手の宛先に伝送すると共に、前記オーディオ源の前記視覚表現と実質的に一貫しているオーディオ基準フレーム内で前記選択されたオーディオ・ストリームを前記第2の聞き手の宛先において空間化する、ように配置されているコンピュータ可読媒体を、本発明はなお更に提供する。
本発明のなお更なる態様に従うと、ネットワーク接続されたコンピュータ及び前記ネットワーク接続されたコンピュータに接続された複数のユーザ端末を含む対話型立体的オーディオ設備を動作する方法であって、
相当するオーディオ・ストリーム、関連する配置データ、及び前記ネットワーク接続されたコンピュータにおけるユーザ状態データと選択的に組み合わせるために、ユーザによって生成されたオーディオ・ストリーム及び仮想環境内で前記ユーザによって生成された前記オーディオ・ストリームを仮想的に配置することのできる関連する配置データをユーザ端末から前記ネットワーク接続されたコンピュータに伝送することと、
前記ユーザ状態データ及び仮想ユーザ環境内で互いに対して相対的に前記ユーザを仮想的に配置するための関連する配置データに基づいて選択された複数のオーディオ・ストリームをユーザ端末において受信することと、
前記配置データの視覚表現を前記ユーザ端末において生成することと、
前記ユーザに対する再生のための前記配置データによって規定された前記ユーザのオーディオ源の前記視覚表現と実質的に一貫しているユーザ・ベースのオーディオ基準フレームに対して相対的にオーディオ・ストリームの選択されたグループを空間化することと、で構成される方法が提供される。
都合良く、前期方法は、前記ユーザに対する再生のための前記ユーザ端末において前記オーディオ基準フレーム内の立体的背景オーディオ効果を提供するための結合オーディオ・ストリームを受信する以前又は以後において立体化された結合オーディオ・ストリームを前記ユーザ端末において受信することを含む。
対話型立体的オーディオビジュアル設備をコンピュータに提供又は動作せしめるための実行可能な命令を記憶したコンピュータ可読媒体であって、前記命令は、上述の方法のいずれか一つを実施すべく配置されたプログラム・セグメントを含むコンピュータ可読媒体に、本発明は拡張される。
本発明の範囲に分類し得るあらゆる別の形態にも関らず、添付の図面を参照し、例示のみの目的で本発明の望ましい形態を記載する。
望ましい実施形態において、オーディオ・チャット・ルームの立体的形状を規定するためのオーディオの立体化(オーディオに空間的な広がりを持たせるための空間化:spatialization)及びレンダリング(rendering)技術を伴うチャット・ルーム機能を提供する。標準的なハイエンド・パソコン機材の適切なC++プログラミングによって、望ましい実施形態を実施することができる。
ここで図1を参照すると、本発明の第1の実施形態で利用するためのインターフェース・スクリーンを用いるユーザの例が図示されている。
ユーザ1は、このユーザのスクリーン上の2次元アレイ2で構成される仮想チャット・ルームに入る。この特定の場合のチャット・ルームは、「リナックス(登録商標)」オペレーティング・システムに対応するチャット・ルームである。このチャット・ルームは、様々な主題について討論するユーザ9の多くのグループ5、6、7、及び8で構成されている。ユーザ・インターフェースは、ユーザ1を掴みグループ5のような様々なグループの方へこのユーザを動かし更にグループにユーザを置くためにマウスと連動して利用し得るマウス・ポインタ4を含む。ユーザ1は、1組のヘッドホンを装備しており、このユーザがグループ5に近づくにつれて、そのグループの会話が最初は遠くに現れ、この会話はこの個人に近づいてくる。更に、グループ5の会話がユーザ1の左側に現れグループ6の会話がこのユーザの右側に現れるように会話を立体化することができる。このユーザは、マイクを装備しており、その結果、会話の一翼を担うことができる。更に、音楽トラックのような別のオーディオ入力をこの環境の中の他の聞き手に対して提供することができる。
この仮想環境の中の各聞き手は、明確に識別される現在地位置決め装置を有する同様なスクリーンを与えられている。聞き手は、チャット・ルームの「壁」10によって規定された空間内を動き回り、様々な会話を聞き、会話の一翼を担う。チャット・ルームの各メンバーは、他のメンバーとの局在する立体的会話に参加することができる。
ここで図2を参照すると、図1の機構の基本的な具体化が概略的に図示されている。このシステムは、マイク入力13に加えてヘッドホン12へのオーディオ出力を規定する機能を処理するサウンド・カードを有するパソコン11の周囲に基礎をおくことができる。レンダリング・コンピュータ11は、この場合はインターネット15であるストリーミング・ネットワークを介して各参加者のオーディオ・チャンネルを流すストリーミング・サーバ14と相互接続される。一連の他のユーザ16は同様に、会話位置情報に加えてオーディオの会話を流すストリーミング・サーバ14に相互接続される。ユーザ17のオーディオの会話もまた、各参加者に流すためにサーバ14に逆に転送される。
そのために、レンダリング・コンピュータは、図3に示したように動作する。ネットワーク・ストリーム20から、一連のチャット・ルーム占有者ストリーム21が提供される。各チャット・ルーム占有者ストリームは、音声チャンネル及びその音声チャンネルのユーザの位置及び方向を含む。同様に、レンダリング・コンピュータからの出力22は、局在するユーザの音声チャンネル及び関連する位置情報である。位置及び方向の情報は各個人の現在の位置及び方向の情報を更新すべく表示23を更新するために利用される。位置情報はまた、今の聞き手に対する各聞き手の現在位置を決定するために相対位置決定ユニット24に転送される。
相対位置決定の出力は、光学的音声チャンネル選択ユニット26に転送される。距離によって減衰した音声は、プリセットされた選択にしたがって選択することができる。更に、離れた音声のグループ又はクラスタは、音声チャンネルの重ね合わせにより単一の音声すなわち擬似音声へと結合することができる。選択及び結合の利用は、立体的オーディオ・レンダリング27を受けなければならない音声チャンネルの個数を減少させるべく機能する。
立体的オーディオ・レンダリングは、相対位置情報及び選択情報に加えて音声チャンネル入力を受け取り、所定の位置にいる聞き手の周りに音声を定位させる立体化技術を利用する。
適当な立体化技術には、1999年1月6日に出願され本出願人に付与された"Audio Signal Processing Method and Apparatus"と題するPCT公報第WO99/49574号に開示された技術が含まれ、その内容は、相互参照により明確に援用される。開示された立体化技術によって、ヘッドホンの聞き手に対して音声を定位することが可能となる。入力されたオーディオ・チャンネルの各々は、別々に立体化することができ、あるいは、最初にドルビー(登録商標)・サラウンド・サウンド5チャンネル基準フレームのような標準的な基準フレームにレンダリングされ次いで絶対基準フレームへ回転されてから聞き手の相対基準フレームへ最終的に回転することができる。信号は、結合され、次いで聞き手へ出力される。
立体化変換システムはまた、完全没入型動作(fully immersive behaviour)を規定するバイノーラル・レンダリング技術と組み合わせることもできる。例えば、豪州仮出願第PO0996号からの優先権を主張する米国出願第08/893848号、これらのいずれの内容も相互参照により明確に援用されるが、は、聞き手に対して特定の位置にある頭追跡環境(head tracked environment)におけるBフォーマットされた(B-formatted)音源をレンダリングするためのシステムを開示する。従って、オーディオ・トラックがBフォーマットで記録されるなら、そのようなシステムは、適切に適合して、オーディオ・トラックをレンダリングするのに利用することができる。そのようなシステムが適切な所の一例として、レンダリングのBフォーマット部が中心に実行され(ヘッドホン信号を生成するBフォーマット信号に適用される)頭追跡部(headtracking part)が局所的に実行される所がある。Bフィールドの計算は、高価になり得るので、中心で最良に実行される。中心の計算は、通信の遅延を負い、これにより、位置にレイテンシ(latency)を導入する効果が生じるが、これは過度に有害ではない。
PCT公報第WO99/51063は、特に頭の動きが存在するときにオーディオを頭追跡再生するための頭追跡処理に対する別のシステムを開示する。そのようなシステムは、聞き手に対して所定の位置を有するべくオーディオ・トラックを所定のフォーマット(例:ドルビー(登録商標)5.1チャンネル・サラウンド)にレンダリングし、次いで頭の動きが存在するときのオーディオ信号の局所化を規定すべくこのPCT出願に記載されたシステムを利用することによって、レンダリング・エンジンとして利用することができる。頭追跡は、レイテンシに対して非常に感度が高いので、局所的に実行される。
望ましい実施形態に対する様々なユーザ・インターフェースの変更も可能である。例えば、ユーザの入場及び退場をアナウンスする「神のような」声を与えるアナウンサー・オーディオ・チャンネルを提供することもできる。ユーザが環境を「歩き」回ることができるように、ジョイスティック又はマウスを提供することができる。他のユーザは、チャットの要求を承認するか又は拒否するかの選択を有することができる。
従って、上記実施形態において、ユーザは、従来の方法で−すなわち話すことによって−その会話/チャット会を行う。ユーザは、インターネット・オンライン接続を確立する電話線に接続された受信機と通信するトランスミッターの装着された一組のヘッドホンを身に付ける。新しいユーザがチャット・プログラムすなわち所謂「チャット・ルーム」にログオンすると、ルームに存在しているユーザ及びその詳細について音声アナウンスを受ける。ディスプレイはまた、チャット・ルーム内における全ての他の存在するユーザを基準にしてそのユーザが位置している場所を示す。ユーザは、(ディスプレイ上に位置する)ルームを「動き」回ることができ、個人的な会話を始めようとして、あらゆるユーザのところまで歩くことができる。実施形態の一形態において、全てのユーザは、チャットの要求を承認するか又は拒否するかの選択を有する。
ここで図4を参照すると、インターネットを介して多くのユーザ端末32.1〜32.Nに接続されているストリーミング・サーバ30が示されている。ストリーミング・サーバは、典型的にはSQLベースのユーザ状態データベース34を組み込んでいる。ユーザ状態データベースは、各ユーザ端末32.1〜32.Nからの入力36によるユーザの位置及び状態の情報で常に更新される。ユーザ位置データは、チャット・ルーム環境内の他のユーザ及びチャット・ルームの両者を基準にした各ユーザの位置及び方向を含む。状態情報は、特定の時刻におけるユーザの特定の状態を含む。例えば、ユーザは、チャット・ルーム内の他の選択されたユーザ又はグループの話を聞くことを可能とする聞き手状態の様々な範疇を有することができる。同様に、ユーザの話し方の状態は、最低の「無言」状態から、例えば、特定のユーザが、それぞれ、随意に話す、チャット・ルーム環境を通してメッセージ又はスピーチを一斉同報する、又はチャット・ルーム環境内における他のユーザの話し方及び聞き方の状態を制御する、立場になり得る最高の「神の声」、「演説」、又は「議長」状態まで変えることができる。ユーザ状態データベースからの複数の出力38は、ユーザの位置及び状態の入力41によって及びオーディオ・エンジン43を介したオーディオ入力42によって各ユーザ端末32.1〜32.Nに接続されたマルチプレクサ型M選択機能40.1〜40.Nに通じている。
図5を参照して、ストリーミング・サーバのオーディオ・コンポーネントの動作をここでより詳細に述べることにする。このサーバ内には、N人のユーザのオーディオ・チャンネルの全てを含むオーディオ・バス44が備わる。44.1及び44.2で示したチャンネルのようなチャンネルの各々は、相当するオーディオ又はマイク入力46.1及び46.2を有する。オーディオ・バス44.N内の各線からの出力48.1〜48.Nは、M選択機能40.1〜40.Nに入力される。M個の出力されたオーディオ・チャンネル50はM選択機能から図4のユーザ端末32.1〜32.Nの各々に入力される。特定のユーザに対してどのオーディオ・チャンネルを選択するかを正確に制御するために利用し得る様々な異なる方法あるいはアルゴリズムが存在する。主要な制御基準の内の二つとして、ユーザ又は聞き手がチャット・ルームに入場するための許可を得る方法、及び各チャット・ルーム内で誰が誰の話を聞くことになるのかを厳密化する方法がある。
典型的には、ルームへの新しい参加者は、参加を許可されるのに先立って承認過程を経ることになろう。その結果、新しい参加者は存在している参加者に事前に通知せずに「忍び込む」ことができないという認識の下で、特定のルーム内における参加者の間で個人的な会話は安全に保たれる。選択過程は、議長すなわち司会者により独裁的となることもあり、また、ユーザの投票により民主的となることもある。定例のチャット・グループの場合には、ユーザの参加をパスワードで制御することもできる。
再び図1を参照すると、新しい参加者52がユーザ・インターフェースのスクリーン上に現れている仮想チャット・ルーム3の入口54の所に位置しようとしており、例えば「参加要求」アイコンをクリックすることによってルームへの参加を要求しようとしている。次いで、上述した過程の一つが生じ得る。別の方法として、特定のグループ7は、互いの了解によって自分たちの会話の周囲に「防音」壁56を立てることができる。ユーザがルーム内にいて討論に参加しようと思っている場合であっても、同様の参加基準が当てはまることになろう。
ユーザ52がチャット・ルームに入ると、このユーザ又は聞き手が誰の話を聞くのかを厳密に決定するために様々な別の方法を用いることができる。あるバージョンにおいては、N個の音源からM個の最も近い音源を選択することができる。これとは別に、M個の最も音の大きい音源を選択することができる。ただし、音の大きさは音源信号の振幅並びに音源の聞き手からの距離に基づいている。
誰の話を聞くべきかをルーム内の全聞き手を代表して選択するために、議長、それにはユーザ1が成り得るが、を用いることができる。更なるバリエーションでは、議長は、グループを代表してM’個の音源を選択することができ、残りの(M−M’)個の音源に対しては聞き手個別の選択を用いることができる。
話し方の状態に関する限りは、聞き手は、自分の望みを議長1に知らせることによって会話の許可を要求することができる。次いで、議長は、聞き手の「列」を審査してグループが誰の話を聞くべきかを選択することができる。一つの選択方法として、予想される話し手の各々が自分の提案した寄稿の簡単なテキスト要約を与えることがあり得る。チャット・ルームに様々なグループが存在し、様々な異なる会話が同時に進行している所では、グループ5、6、7、及び8の各々は、特定のグループ内での討論の流れを制御するためにグループの議長すなわち司会者を有することができる。
再び図5を参照すると、オーディオ・バス44の全てのオーディオ・チャンネルは、加算器58で結合され、加算された信号60は、米国出願第08/893848号を参照して上述したBフォーマット・レンダリング処理のようなバイノーラル残響処理を受ける。左右のバイノーラル残響出力64及び66はそれぞれ、オーディオ・バス44の部分を形成し、左右の加算されたバイノーラル残響入力64.1〜64.N及び66.1〜66.Nは、各ユーザ端末32.1〜32.Nに与えられる。
図6を参照すると、HRTF処理68.1〜68.Mを用いたバイノーラル・レンダリングによって別々に立体化されるM個のオーディオ・チャンネル入力50.1〜50.Mを有するユーザ端末32.1が示されている。バイノーラル・レンダリングされた信号は、左右の加算器70及び72で加算され、ユーザが身につける一組のヘッドホン74のそれぞれ左右のイヤホンに入力される。左右のバイノーラル残響信号64.1及び66.1もまた、それぞれ左右の加算器70及び72に入力される。加算されたバイノーラル残響信号64.1及び66.1は、背景残響を生成し、それによって、ユーザは、例えばルーム内における3又は4個の最も近い音声のみならずチャット・ルーム環境における加算された音声の全てを代表する背景の喧騒をも体験することができる。このことは、法外な個数の入力オーディオ・チャンネルを要求することなく非常に臨場感のあるオーディオ体験をもたらす。
図5及び6の実施形態において、デジタル信号処理及びチャンネル選択の大部分は、図6に示したオーディオ信号処理機能をヘッドホン74の左右のイヤホンに内蔵できる程度までストリーミング・サーバにおいて行われ、ストリーミング・サーバは更にレンダリング・コンピュータに接続される。レンダリング・コンピュータの方は、画像ユーザ・インターフェースを内蔵し、ユーザ状態データベース34を更新するためのユーザの位置及び状態の情報を提供する。チャット・ルーム内にいる他のユーザの位置及び状態につれてユーザ・インターフェース・スクリーンを常に更新できるように、レンダリング・コンピュータはまた、デマルチプレクサ機能40.1〜40.Nから更新されたユーザの位置及び状態の情報を受け取る。
図7を参照すると、バイノーラル残響機能が取り除かれている点は別として、第1の実施形態と似ているストリーミング・サーバ76のオーディオ・コンポーネントの第2の実施形態が示されている。代わりに、加算器58からの加算された出力信号60は、処理されない加算された入力信号60.1〜60.Mとして各ユーザ端末に入力される。ユーザ端末の内の一つを図8の78.1に示す。加算された信号60.1のバイノーラル残響機能80は、ユーザ側でレンダリング・コンピュータ内又はヘッドホン74内のいずれかにおいてHRTF機能68.1〜68.Mと共に実行される。このように、ユーザ側の付加的な処理能力を犠牲にして、入力チャンネルの個数は、減少される。
図9及び10で、立体的会話システムのより洗練されたバージョンを説明する。ストリーミング・サーバ82のオーディオ・コンポーネントは、91〜98の番号が付いた8人のユーザからの音源信号チャンネルを有するオーディオ・バス84で構成される。図10に、相互通行する出入口102を有する壁100によって分割されたチャット・ルームA及びBで構成されるユーザ・インターフェース・スクリーンを示す。ユーザ91、92、94、及び96は、ルームAに位置し、ユーザ93、95、97、及び98は、ルームBに位置している。ユーザ92、93、及び95への及びからのオーディオ・チャンネルを示す。各ユーザは、自分のマイク信号を104で示すようなモノ信号としてサーバに与える。ユーザ92、93、及び95の各々は、他のユーザからの又は出入口102からの信号を含む3個の最も近い音源又は選択された音源を与えられる。ルームAに対する加算されたルーム喧騒は106で加算され、ルームBからの所謂「ウェット・ルーム」信号108と共にユーザ91、92、94、及び96からのオーディオ・チャンネルを含む。この信号108は、ルームAからの「ウェット・ルーム」信号112と共に110で加算されたユーザ93、95、97、及び98からの信号で構成される。加算器110から直接出力される加算された信号116は、ルームBからの「ドライ・ルーム」信号を構成する。ルームBからの「ドライ・ルーム」信号は、モノ残響器118に入力されて、ルームBに対する「ウェット・ルーム」信号120を提供する。これは、更にルームAに対する加算器106に入力される。加算器106から直接出力される加算された122は、ルームAに関する「ドライ・ルーム」信号であり、「ドライ・ルーム」信号は、モノ残響器124によって処理されてルームAに対するウェット・ルーム信号126となる。
このように、ユーザ95は、ルームB内の最も近い3人のユーザ93、97、及び98、並びにルームBに対するドライ・ルーム信号116によって構成される加算されたルーム喧騒を入力として有する。他方、ユーザ93は、ルームAからの「ウェット・ルーム」残響出力126によって構成される出入口信号128と共に最も近い2人のユーザ97及び95を入力として有する。更に、ルームB内のユーザ93は、ルームB内の背景の雑音すなわち喧騒を代表するドライ・ルーム入力130を入力として受け取る。
ルームA内のユーザ92は、ルームBの「ウェット・ルーム」出力120からの「ウェット・ルーム」信号132によって構成された出入口信号と共に、そのルームの背景雑音を代表するルームAからの「ドライ・ルーム」出力信号134と共に、最も近い2人のユーザ91及び96からの音声チャンネルを入力として受け取る。
出入口の近くにいる一方のルーム内のユーザは他方のルームからの「ウェット・ルーム」入力を専用の入力チャンネルとして受け取る点で、二つのチャット・ルーム環境と一致するオーディオ体験が得られる。出入口及び他方のルームから離れているユーザに対しては、各加算器106及び110で結合された「ウェット・ルーム」信号108及び112のフィードバックに基づいて、他方の部屋からの減少した入力がやはり得られる。この特徴は、複数のルーム及びドアを介して伝わる離れた喧騒を聞く能力及び最大レベルの可聴活動でルームを見つけるべく音によって移動する能力をユーザに与える。
フィードバックされるドア信号108及び112の利得は、ドアが部分的に開いているのか完全に開いているのか閉じているのかに依存して138で修正することができ、それにより、チャット・ルーム環境の臨場感を強調し、特に1人以上のユーザがドアを「閉じる」もしくは「開く」ことができる場所では盗聴を選択的に認めるもしくは妨げる。
図11を参照すると、バイノーラル処理がサーバにおいて実行される点は別として、図9の実施形態と実質的に一致するストリーミング・サーバ136の更なる実施形態が示されている。特に、バイノーラル・プロセッサ138は、様々なウェット及びドライ・ルーム信号及び音源信号を受け取って処理するために備わっている。従って、図8に示したユーザ端末ベースのバイノーラル残響及びHRTF処理は、サーバ・ベースのバイノーラル・プロセッサ138において実行されるように配置することができる。従って、サーバからのL及びRのバイノーラル信号は、各ユーザ92、93、及び95のヘッドホンに直接入力することができ、それにより、2個の入力オーディオ・チャンネルのみが要求される点で、各ユーザ・ステーションにおけるハードウェア、信号処理、及びネットワーク帯域の要求を減少させる。
HRTF処理の場合には、上述したように、ユーザのスクリーン2上のグラフィック表示におけるユーザの方向及び位置は、ジョイスティック又はマウス・ポインタ1によって制御できることが理解されるであろう。位置及び方向の信号は、特にバイノーラル・プロセッサにおける処理のためにストリーミング・サーバに伝送され、ユーザがグループの他の個人に注意を向けるべく自分の頭を回転するときに、より臨場感のある効果を得るために頭追跡信号によって補強することができる。頭追跡装置から得られる頭追跡信号は、相当する頭の回転及び並進によってユーザ表示の回転の動き及び並進の動きを両者とも生じされるために直感的に用いることができる。これは、マウス・ポインタ4又はジョイスティックによって補完することができる。合成された方向及び位置の信号は、処理するためにストリーミング・サーバに逆に伝送することができ、望ましい立体化効果を得るためにユーザ端末において局所的に処理することもできる。
本明細書において開示し規定した本発明は、記載した個々の特徴又は文章又は図面から明らかとなる個々の特徴の二つ以上の全ての代替となる組み合わせにまで及ぶことが理解されるであろう。これらの様々な組み合わせの全ては、本発明の様々な代替態様を構成する。
本発明の実施形態について前述したが、本発明の範囲から逸脱することなく、当業者には明らかな変形をそれになし得る。
望ましい実施形態のオーディオ・チャット・ルームに対するユーザ・インターフェースの第1の実施形態を概略的に説明する図である。 第1の実施形態のストリーミング環境を概略的に説明する図である。 第1の実施形態のレンダリング・コンピュータの動作を示す概略的なフローチャートである。 本発明の立体的オーディオ会話システムの第2の実施形態の非常に概略的な機能ブロック図である。 ストリーミング・サーバのオーディオ・コンポーネントのより詳細な機能ブロック図である。 図5のストリーミング・サーバに接続されるユーザ端末のより詳細な機能ブロック図である。 ストリーミング・サーバのオーディオ・コンポーネントの第2の実施形態のより詳細なブロック図である。 図7のストリーミング・サーバに接続されるユーザ端末の第2の実施形態の機能ブロック図である。 本発明のストリーミング・サーバの第3の実施形態のオーディオ・コンポーネントの機能ブロック図である。 図9で説明したサーバ構成に相当するユーザ・インターフェース・スクリーンの概略図である。 本発明のストリーミング・サーバの第4の実施形態のオーディオ・コンポーネントの機能ブロック図である。

Claims (29)

  1. 複数の遠隔ユーザ端末を接続するための対話型空間化オーディオビジュアル・システムであって、
    ネットワークに結合された処理システムと、
    前記処理システムに結合されているか前記処理システムの一部である、対応する各ユーザのユーザ状態情報を含むユーザデータを含む関連するユーザ・データベースとを有しており、
    前記処理システムは:
    前記遠隔ユーザ端末から複数のオーディオ・ストリーム及び関連する配置データを受信し、ここで、各オーディオ・ストリームはオーディオ源としてのユーザに対応し、前記配置データは仮想ユーザ環境内でユーザを互いに対して相対的に仮想的に配置するためのものであり、
    前記ユーザ・データベース内の状態情報に基づいて前記複数のオーディオ・ストリームのうちある特定ユーザを含む一または複数のユーザに送信する少なくとも一つのオーディオ・ストリームからなる少なくとも一つのグループを選択し、ここで、各グループはユーザのうちの一に対応し、前記少なくとも一つのグループは前記特定ユーザに対応する特定グループを含み、
    前記複数のオーディオ・ストリームのうちの少なくともいくつかを組み合わせて組み合わされたストリームを形成し、
    前記ネットワークを介して、前記特定ユーザに関連付けられた特定遠隔ユーザ端末を含む一つまたは複数の遠隔ユーザ端末に、該一つまたは複数の遠隔ユーザ端末に関連付けられた、前記特定ユーザを含むユーザにそれぞれ対応する、前記一つまたは複数の選択されたグループのオーディオ・ストリーム及び関連する配置データを送信し、
    前記遠隔ユーザ端末のうち前記特定遠隔ユーザ端末を含む前記少なくとも一つに、前記ネットワークを介して、前記組み合わされたストリームの関数を送信するよう構成されており、ここで、該関数はユーザ依存であってもよく、
    前記ネットワークに結合された、前記特定ユーザに対応する前記特定遠隔ユーザ端末は:
    前記の送信されたオーディオ・ストリームのグループおよび組み合わされたストリームの関数を受信し、
    前記ユーザのうちの少なくとも一部の表現を含む、前記仮想ユーザ環境の視覚的表現を表示し、
    前記特定ユーザに対応するオーディオ・ストリームを含む前記特定グループに含まれるオーディオ・ストリームおよび前記組み合わされたストリームの関数を変換して、前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含む一対のオーディオ・ヘッドホン信号にするよう構成されており、
    前記変換は、ヘッドホンを通じて前記ヘッドホン信号を聞いている前記特定ユーザが前記特定グループのオーディオ・ストリームが前記仮想ユーザ環境内において、その特定ユーザの位置に対して相対的なそれぞれのユーザ位置から発する感覚をもつよう前記特定グループに含まれるオーディオ・ストリームを空間化する変換であり
    前記空間化は、直接音及び初期エコーを考慮に入れることも含め前記仮想ユーザ環境中の前記特定ユーザの向きおよび位置ならびに前記特定グループ中のオーディオ信号の源の位置を考慮に入れるHRTF処理と前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含めることによる残響を含んでいる、
    システム。
  2. 前記処理システムがさらに、オーディオ・ストリームの各グループのオーディオ・ストリームの前記変換の少なくとも一部を実行するよう構成されている、請求項1に記載のシステム。
  3. 前記処理システムがさらに、前記組み合わされたストリームの残響処理されたバージョンを空間化して、ヘッドホンを通じて前記ヘッドホン信号を聞いている前記特定ユーザが前記組み合わされたストリームから形成されたバイノーラル残響信号から残響背景を知覚するようにするよう構成されている、請求項1に記載のシステム。
  4. 特定ユーザに送信するグループを選択する際に使われる前記ユーザ状態情報は、仮想環境内で前記特定ユーザを配置する働きをするユーザ位置データ、他のユーザ及び前記仮想環境の両者に関して前記特定ユーザを向き付けする働きをするユーザ向きデータ、前記特定ユーザについてのユーザ聞き方状態情報、及び/又は前記特定ユーザについてのユーザ話し方状態情報のうちの一つまたは複数を含む、請求項1に記載のシステム。
  5. 特定ユーザに送信するグループを選択する際に使われる前記ユーザ聞き方状態情報は、前記特定ユーザが前記環境内の他の選択されたユーザ又はユーザのグループの話を聞くことを許容するように構成される請求項4に記載のシステム。
  6. 特定ユーザに送信するオーディオ・ストリームのグループを選択することは、仮想環境内で最も近いある特定数の他のユーザに対応するオーディオ・ストリームを選択することを含む、請求項4に記載のシステム。
  7. 特定ユーザに送信するオーディオ・ストリームのグループを選択することは、オーディオ・ストリーム中のオーディオの振幅及び/又は仮想環境内での前記特定ユーザからのオーディオ・ストリームの音源の距離に基づいて、最も大きい音源を特定数だけ選択することを含む請求項4に記載のシステム。
  8. 特定ユーザに送信するオーディオ・ストリームのグループを選択することは、前記特定ユザ又は他のユーザの遠隔ユーザ端末からの入力に基づいて選択することを含む、請求項4に記載のシステム。
  9. 特定ユーザに送信するオーディオ・ストリームのグループを選択することは、ユーザの話し方及び聞き方の状態を制御できる議長からの入力に基づいて選択することを含む、請求項4に記載のシステム。
  10. 前記仮想環境が、該仮想環境中のユーザの聞く能力に影響するよう構成されている地形上又はトポロジー上の一つ又は複数の特徴を有しており、特定ユーザに送信するオーディオ・ストリームのグループを選択することは、前記地形上又はトポロジー上の特徴に基づいて選択することを含む、請求項4に記載のシステム。
  11. 前記一つまたは複数の特徴は、二つ以上のチャット・ルームを規定する一つまたは複数の壁を含み、特定のルーム内の前記オーディオ・ストリームの少なくともいくつかは加算され、空間化され、その特定のルームに特有の背景残響効果を実現するために残響処理が実行される、請求項10に記載のシステム。
  12. 前記処理システムがさらに、前記特定ユーザが位置する特定のルーム又は領域の仮想環境内に入口又は出口を有する隣接するルーム又は領域内のオーディオ・ストリームを組み合わせて、その特定のルーム又は領域と前記入口又は出口のところで隣接するルーム又は領域から発する組み合わされた雑音を表す、前記入口又は出口に位置する隣接ルーム信号を生成するよう構成されている、請求項10に記載のシステム。
  13. 前記処理システムがさらに、前記特定のルーム又は領域について、その特定のルーム又は領域内のユーザから発するオーディオ・ストリームに起因する背景を表し、任意的にその特定のルーム又は領域に隣接する任意のルーム内のユーザから発する任意の隣接ルーム信号の重み付けされた残響バージョンを含むルーム内信号を生成するよう構成されており、該生成することが、前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームおよび任意的にはその特定のルーム又は領域に隣接する単数又は複数のルーム又は領域内のユーザから発する組み合わされた信号の重み付けされた残響バージョンを組み合わせることを含む、請求項12に記載のシステム。
  14. 前記処理システムがさらに、前記特定のルーム又は領域について、前記特定のルーム又は領域に隣接するルーム内のユーザから発する信号の組み合わせとして形成される隣接ルーム信号の残響バージョンを表すルーム信号を生成するよう構成されている、請求項12に記載のシステム。
  15. 特定ユーザに送信するオーディオ・ストリームのグループを選択することは:
    総数N個のオーディオ・ストリームからM人の最も近いユーザに対応するM個のオーディオ・ストリームを選択する、
    オーディオ・ストリームの信号の振幅及び/又は前記特定ユーザからのオーディオ・ストリームに対応するユーザの距離に基づいてM個の最も大きいオーディオ・ストリームを選択する、
    前記特定ユーザ又は一もしくは複数の他のユーザによって決定されるユーザ主導の選択プロセスに従って選択する、
    前記環境内の「議長」が他のユーザの話し方及び聞き方の状態を制御できる議長主導の選択プロセスに従って選択する、及び/又は
    視覚的及び音響的に一貫したランドスケープを提供すべく前記環境内のユーザの聞く力にリアルに影響するように前記環境の特徴が準備されており、前記仮想環境の地理又はトポロジーに基づいて選択する、
    ことを含む一つまたは複数の基準に従って選択することを含む、請求項5に記載のシステム
  16. 複数の遠隔ユーザ端末と通信する処理システムの動作方法であって:
    複数のオーディオ・ストリーム及び関連する配置データを受信する段階と、ここで、各オーディオ・ストリームはオーディオ源としてのユーザに対応し、前記配置データは仮想ユーザ環境内でオーディオ源を互いに対して相対的に仮想的に配置できるものであり、
    前記ユーザのうちの一または複数についてユーザ状態データを判別する段階と、
    前記ユーザ状態データに基づいて前記複数のオーディオ・ストリームのうちある特定ユーザを含む一または複数のユーザに送信する少なくとも一つのオーディオ・ストリームからなる少なくとも一つのグループを選択する段階と、ここで、各グループはユーザのうちの一に対応し、前記少なくとも一つのグループは前記特定ユーザに対応する特定グループを含み、
    前記複数のオーディオ・ストリームのうちの少なくともいくつかを組み合わせて組み合わされたストリームを形成する段階と、
    前記特定ユーザに関連付けられた特定遠隔ユーザ端末を含む一つまたは複数の遠隔ユーザ端末に、該一つまたは複数の遠隔ユーザ端末に関連付けられた、前記特定ユーザを含むユーザにそれぞれ対応する、前記一つまたは複数の選択されたグループのオーディオ・ストリーム及び関連する配置データを送信する段階と、
    前記遠隔ユーザ端末のうち前記特定遠隔ユーザ端末を含む前記少なくとも一つに、前記組み合わされたストリームの関数を送信する段階とを含んでおり、ここで、該関数はユーザ依存であってもよく、
    前記特定ユーザに対応する前記特定遠隔ユーザ端末は:
    前記の送信されたオーディオ・ストリームのグループおよび組み合わされたストリームの関数を受信し、
    前記ユーザのうちの少なくとも一部の表現を含む、前記環境の視覚的表現を表示し、
    前記特定ユーザに対応するオーディオ・ストリームを含む前記特定グループに含まれるオーディオ・ストリームおよび前記組み合わされたストリームの関数を変換して、前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含む一対のオーディオ・ヘッドホン信号にするよう構成されており、
    前記変換は、ヘッドホンを通じて前記ヘッドホン信号を聞いている前記特定ユーザが前記特定グループのオーディオ・ストリームが前記仮想ユーザ環境内において、その特定ユーザの位置に対して相対的なそれぞれのユーザ位置から発する感覚をもつよう前記特定グループに含まれるオーディオ・ストリームを空間化する変換であり
    前記空間化は、直接音及び初期エコーを考慮に入れることも含め前記仮想ユーザ環境中の前記特定ユーザの向きおよび位置ならびに前記特定グループ中のオーディオ信号の源の位置を考慮に入れるHRTF処理と前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含めることによる残響を含んでおり、
    前記組み合わされたストリームは送信前又は送信後に空間化されて、前記仮想環境中の背景オーディオ効果を与える、
    方法。
  17. 前記ユーザ状態データが変更されている場合を許容するために前記判別する段階及び前記選択する段階を繰り返すことをさらに含む、請求項16に記載の方法。
  18. 請求項16に記載の方法であって、前記仮想環境は、二つ以上のルーム又は領域を規定する一つまたは複数の壁を有しており、当該方法がさらに、
    前記特定ユーザが位置する特定のルーム又は領域の仮想環境内に入口又は出口を有する隣接するルーム又は領域内のオーディオ・ストリームを組み合わせて、その特定のルーム又は領域と前記入口又は出口のところで隣接するルーム又は領域から発する組み合わされた雑音を表す、前記入口又は出口に位置する隣接ルーム信号を生成する段階を含む、
    方法。
  19. 請求項18に記載の方法であって、当該方法がさらに、
    前記仮想ユーザ環境内の前記特定のルーム又は領域について、その特定のルーム又は領域内のユーザから発するオーディオ・ストリームに起因する背景を表し、任意的にその特定のルーム又は領域に隣接する任意のルーム内のユーザから発する任意の隣接ルーム信号の重み付けされた残響バージョンを含むルーム内信号を生成するよう構成されており、該生成することが、前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームおよび任意的にはその特定のルーム又は領域に隣接する単数又は複数のルーム又は領域内のユーザから発する組み合わされた信号の重み付けされた残響バージョンを組み合わせることを含む、
    方法。
  20. 隣接するルーム又は領域内のオーディオ・ストリームを組み合わせる前記段階が、前記特定のルーム又は領域について、前記特定のルーム又は領域に隣接するルーム内のユーザから発する信号の組み合わせの残響バージョンを表すルーム信号を生成することを含む、請求項18に記載の方法。
  21. ネットワークにおける空間化された会話に参加するためのユーザ端末であって、オーディオ・ストリーム及び関連する空間化情報を当該ユーザ端末にストリーミングできるネットワークに結合されており、当該ユーザ端末は:
    レンダリング・システムとユーザ・インターフェースとを有しており、
    前記レンダリング・システムは:
    複数のオーディオ・ストリームから選択されたオーディオ・ストリームの選択されたグループを受け容れ、ここで、各ストリームは仮想ユーザ環境内でのユーザ位置に対応しており、
    仮想ユーザ環境内で前記グループのオーディオ・ストリームに関連付けられたユーザを互いに対して相対的に仮想的に配置するための関連する配置データを受け容れ、
    前記複数のオーディオ・ストリームの少なくともいくつかを組み合わせることによって形成された組み合わされたストリームの関数を受け容れ、
    前記グループのオーディオ・ストリームおよび前記組み合わされたストリームの関数を変換して、前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含む一対のオーディオ・ヘッドホン信号にするよう構成されており、
    前記変換は、ヘッドホンを通じて前記ヘッドホン信号を聞いている特定ユーザが前記グループのオーディオ・ストリームが前記仮想ユーザ環境内において、その特定ユーザの位置に対して相対的なそれぞれのユーザ位置から発する感覚をもつよう前記グループに含まれるオーディオ・ストリームを空間化する変換であり
    前記ユーザ・インターフェースは、前記ユーザのうちの少なくとも一部の表現を含む、前記仮想ユーザ環境の視覚的表現を呈示するよう構成されたディスプレイを有しており、
    前記レンダリング・システムによる空間化は、直接音及び初期エコーを考慮に入れることも含め前記仮想ユーザ環境中の前記特定ユーザの向きおよび位置ならびに前記グループ中のオーディオ信号の源の位置を考慮に入れるHRTF処理と前記組み合わされたストリームに応じて生成されたバイノーラル残響信号を含めることによる残響とを含んでいる、
    ユーザ端末。
  22. 請求項21に記載のユーザ端末であって、前記仮想環境は、二つ以上のルーム又は領域を規定する一つまたは複数の壁を有しており、前記特定ユーザは仮想環境中で特定のルーム又は領域に位置しており、該特定のルーム又は領域は前記特定のルーム又は領域への入口又は出口を有する隣接するルーム又は領域をもち、
    前記レンダリング・システムはさらに、その特定のルーム又は領域と前記入口又は出口のところで隣接するルーム又は領域から発する組み合わされた雑音を表す、前記入口又は出口に位置する隣接ルーム信号を受け容れるよう構成されている、
    ユーザ端末。
  23. 請求項22に記載の方法であって、前記レンダリング・システムがさらに、
    前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームに起因する背景を表し、任意的に前記特定のルーム又は領域に隣接する任意のルーム又は領域内のユーザから発する任意の隣接ルーム信号の重み付けされた残響バージョンを含むルーム内信号を受信するよう構成されており、ここで、前記ルーム内信号は、前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームおよび任意的にはその特定のルーム又は領域に隣接する単数又は複数のルーム又は領域内のユーザから発する組み合わされた信号の重み付けされた残響バージョンを組み合わせることを含むプロセスによって形成される、
    ユーザ端末。
  24. 前記隣接ルーム信号が隣接ルーム又は領域内のオーディオ・ストリームを組み合わせる段階を含むプロセスによって形成され、隣接するルーム又は領域内のオーディオ・ストリームを組み合わせる前記段階が、前記特定のルーム又は領域について、前記特定のルーム又は領域に隣接するルーム内のユーザから発する信号の組み合わせの残響バージョンを表すルーム信号を生成することを含む、請求項22に記載のユーザ端末。
  25. 複数の遠隔ユーザ端末と通信する処理システムの一つ又は複数のプロセッサによって実行されたときに請求項16ないし20のうちいずれか一項に記載の方法を実施させる実行可能命令を記憶しているコンピュータ可読媒体。
  26. ネットワーク接続されたコンピュータ及び前記ネットワーク接続されたコンピュータに接続された特定ユーザ端末を含む複数のユーザ端末を含む対話型の空間化オーディオ設備の一部である前記特定ユーザ端末の動作方法であって、
    特定ユーザによって生成されたオーディオ・ストリーム及び仮想環境内で前記ユーザによって生成された前記オーディオ・ストリームの音源を仮想的に配置することのできる関連する配置データを、前記特定ユーザ端末から前記ネットワーク接続されたコンピュータに送信し、それにより前記ネットワーク接続されたコンピュータが、各ユーザに対応するオーディオ・ストリームのグループを選択し、前記オーディオ・ストリームの少なくともいくつかを選択的に組み合わせ、各グループについて該グループ内のオーディオ・ストリームの音源について関連する配置データを選択できるようにし、ここで前記選択は前記ネットワーク接続されたコンピュータのところで利用可能なユーザ状態データに基づく、段階と、
    前記特定ユーザ端末において前記特定ユーザについての前記ユーザ状態データに基づいて選択された複数のオーディオ・ストリームの特定の選択されたグループを受信し、さらに、仮想ユーザ環境内で互いに対して相対的に前記グループのオーディオ・ストリームの音源を仮想的に配置するための関連する配置データを受信する段階と、
    前記特定ユーザ端末において、ユーザに対応する前記複数のオーディオ・ストリームの少なくともいくつかを組み合わせることによって形成された組み合わされたオーディオ・ストリームの関数を受信する段階と、
    前記特定ユーザ端末において、仮想ユーザ環境内の音源の仮想的な位置を示す、前記オーディオ・ストリームの音源の視覚的表現を生成する段階と、
    前記選択されたグループのオーディオ・ストリームおよび前記組み合わされたストリームの関数を変換して、前記組み合わされたストリームに従って生成されたバイノーラル残響信号を含む一対のオーディオ・ヘッドホン信号にするよう構成されており、
    前記変換は、ヘッドホンを通じて前記ヘッドホン信号を聞いている前記特定ユーザが前記選択されたグループのオーディオ・ストリームが前記仮想ユーザ環境内において、その特定ユーザの位置に対して相対的なそれぞれのユーザ位置から発する感覚をもつよう前記特定グループに含まれるオーディオ・ストリームを空間化する変換であり
    前記空間化は、直接音及び初期エコーを考慮に入れることも含め前記仮想ユーザ環境中の前記特定ユーザの向きおよび位置を考慮に入れるHRTF処理と前記組み合わされたストリームに応じて生成されたバイノーラル残響信号を含めることによる残響とを含んでいる、
    方法。
  27. 請求項26に記載の方法であって、前記仮想環境は、二つ以上のルーム又は領域を規定する一つまたは複数の壁を有しており、前記特定ユーザは仮想環境中で特定のルーム又は領域に位置しており、該特定のルーム又は領域は仮想ユーザ環境内に入口又は出口を有する隣接するルームを含んでおり、
    当該方法はさらに、その特定のルーム又は領域とその特定のルーム又は領域に隣接するルーム又は領域との間の前記入口又は出口のところでその特定のルーム又は領域と隣接するルーム又は領域から発する組み合わされた雑音を表す隣接ルーム信号を受信する段階を含む、方法。
  28. 請求項26に記載の方法であって:
    前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームに起因する背景を表し、任意的に前記特定のルーム又は領域に隣接する任意のルーム又は領域内のユーザから発する任意の隣接ルーム信号の重み付けされた残響バージョンを含むルーム内信号を受信するよう構成されており、ここで、前記ルーム内信号は、前記特定のルーム又は領域内のユーザから発するオーディオ・ストリームおよび任意的にはその特定のルーム又は領域に隣接する単数又は複数のルーム又は領域内のユーザから発する組み合わされた信号の重み付けされた残響バージョンを組み合わせることを含むプロセスによって形成される、
    方法。
  29. 特定のユーザ端末内のプロセッサによって実行されたときに、ネットワーク接続されたコンピュータ及び前記ネットワーク接続されたコンピュータに接続された特定ユーザ端末を含む複数のユーザ端末を含む対話型の空間化オーディオ設備の一部である、請求項26ないし28のうちいずれか一項に記載の特定ユーザ端末の動作方法を実行させる実行可能命令を記憶しているコンピュータ可読媒体。
JP2008244877A 2002-01-09 2008-09-24 対話型立体的オーディオビジュアル・システム Expired - Lifetime JP4745375B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AUPR9898A AUPR989802A0 (en) 2002-01-09 2002-01-09 Interactive spatialized audiovisual system
AUPR9898 2002-01-09

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2003558716A Division JP2005514702A (ja) 2002-01-09 2003-01-09 対話型立体的オーディオビジュアル・システム

Publications (2)

Publication Number Publication Date
JP2009043274A JP2009043274A (ja) 2009-02-26
JP4745375B2 true JP4745375B2 (ja) 2011-08-10

Family

ID=3833510

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2003558716A Pending JP2005514702A (ja) 2002-01-09 2003-01-09 対話型立体的オーディオビジュアル・システム
JP2008244877A Expired - Lifetime JP4745375B2 (ja) 2002-01-09 2008-09-24 対話型立体的オーディオビジュアル・システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2003558716A Pending JP2005514702A (ja) 2002-01-09 2003-01-09 対話型立体的オーディオビジュアル・システム

Country Status (4)

Country Link
US (1) US7533346B2 (ja)
JP (2) JP2005514702A (ja)
AU (1) AUPR989802A0 (ja)
WO (1) WO2003058473A1 (ja)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE352970T1 (de) * 2002-12-02 2007-02-15 Thomson Licensing Verfahren zur beschreibung der zusammensetzung eines audiosignals
US7827526B2 (en) * 2003-06-13 2010-11-02 Analog Devices, Inc. Stacking and repeating graphical controls
US20040264704A1 (en) * 2003-06-13 2004-12-30 Camille Huin Graphical user interface for determining speaker spatialization parameters
JP4529528B2 (ja) * 2004-04-26 2010-08-25 ヤマハ株式会社 音像定位端末
JP2005326987A (ja) * 2004-05-13 2005-11-24 Sony Corp オーディオ信号伝送システム、オーディオ信号伝送方法、サーバー、ネットワーク端末装置、プログラム及び記録媒体
JP2006025281A (ja) * 2004-07-09 2006-01-26 Hitachi Ltd 情報源選択システム、および方法
KR100673599B1 (ko) * 2004-07-20 2007-01-24 에스케이커뮤니케이션즈 주식회사 이동통신 단말기를 통한 모블로그 기반의 지역 커뮤니티 시스템에서 모임 제안 방법
US8627213B1 (en) * 2004-08-10 2014-01-07 Hewlett-Packard Development Company, L.P. Chat room system to provide binaural sound at a user location
JP4451794B2 (ja) * 2005-01-25 2010-04-14 パナソニック株式会社 音声対話装置
EP2006003A3 (en) * 2005-02-25 2010-03-17 Nokia Corporation Controlling communications between players of a multi-player game
US20060277034A1 (en) * 2005-06-01 2006-12-07 Ben Sferrazza Method and system for processing HRTF data for 3-D sound positioning
US7869386B2 (en) * 2005-08-29 2011-01-11 Cisco Technology, Inc. Method and system for conveying media source location information
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
US9180370B2 (en) * 2006-12-22 2015-11-10 Oracle America, Inc. Methods and apparatus for acoustic model based soundtracks
JP4561766B2 (ja) * 2007-04-06 2010-10-13 株式会社デンソー 音データ検索支援装置、音データ再生装置、プログラム
US7769806B2 (en) 2007-10-24 2010-08-03 Social Communications Company Automated real-time data stream switching in a shared virtual area communication environment
US8397168B2 (en) * 2008-04-05 2013-03-12 Social Communications Company Interfacing with a spatial virtual communication environment
US8407605B2 (en) 2009-04-03 2013-03-26 Social Communications Company Application sharing
US20090288007A1 (en) * 2008-04-05 2009-11-19 Social Communications Company Spatial interfaces for realtime networked communications
US9602295B1 (en) * 2007-11-09 2017-03-21 Avaya Inc. Audio conferencing server for the internet
US20090141905A1 (en) * 2007-12-03 2009-06-04 David Warhol Navigable audio-based virtual environment
KR20100097739A (ko) * 2007-12-17 2010-09-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 통신 시스템의 적어도 두 사용자들 사이의 통신들을 제어하는 방법
EP2232700B1 (en) 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
US8335331B2 (en) * 2008-01-18 2012-12-18 Microsoft Corporation Multichannel sound rendering via virtualization in a stereo loudspeaker system
KR20100131467A (ko) * 2008-03-03 2010-12-15 노키아 코포레이션 복수의 오디오 채널들을 캡쳐하고 렌더링하는 장치
US7774488B2 (en) 2008-03-12 2010-08-10 International Business Machines Corporation Method and system for switching media streams in a client system based on environmental changes
US9258337B2 (en) * 2008-03-18 2016-02-09 Avaya Inc. Inclusion of web content in a virtual environment
WO2009146130A2 (en) 2008-04-05 2009-12-03 Social Communications Company Shared virtual area communication environment based apparatus and methods
US9319357B2 (en) 2009-01-15 2016-04-19 Social Communications Company Context based virtual area creation
US9853922B2 (en) 2012-02-24 2017-12-26 Sococo, Inc. Virtual area communications
EP2216974A1 (en) * 2009-02-04 2010-08-11 Alcatel Lucent Method of providing a communication service
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
EP2606466A4 (en) 2010-08-16 2014-03-05 Social Communications Co PROMOTING COMMUNICATIVE INTERACTIONS IN A NETWORK COMMUNICATION ENVIRONMENT
US9736312B2 (en) * 2010-11-17 2017-08-15 Avaya Inc. Method and system for controlling audio signals in multiple concurrent conference calls
US8958567B2 (en) * 2011-07-07 2015-02-17 Dolby Laboratories Licensing Corporation Method and system for split client-server reverberation processing
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
WO2013181026A1 (en) 2012-06-02 2013-12-05 Social Communications Company Interfacing with a spatial virtual communications environment
US9959548B2 (en) 2012-08-31 2018-05-01 Sprinklr, Inc. Method and system for generating social signal vocabularies
US9755847B2 (en) * 2012-12-19 2017-09-05 Rabbit, Inc. Method and system for sharing and discovery
JP6146182B2 (ja) * 2013-07-23 2017-06-14 富士通株式会社 情報提供装置、情報提供システム、及び情報提供プログラム
US9185508B2 (en) 2013-08-30 2015-11-10 Gleim Conferencing, Llc Multidimensional virtual learning system and method
WO2015031080A2 (en) 2013-08-30 2015-03-05 Gleim Conferencing, Llc Multidimensional virtual learning audio programming system and method
US9407989B1 (en) * 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US10587978B2 (en) * 2016-06-03 2020-03-10 Nureva, Inc. Method, apparatus and computer-readable media for virtual positioning of a remote participant in a sound space
EP3465414B1 (en) 2016-06-06 2023-08-16 Nureva Inc. Method, apparatus and computer-readable media for touch and speech interface with audio location
WO2017210784A1 (en) 2016-06-06 2017-12-14 Nureva Inc. Time-correlated touch and speech command input
DE102016112609B4 (de) * 2016-07-08 2018-03-01 QLIPS GmbH Verfahren zur Erzeugung eines an einen realen Endpunkt zu übermittelnden Gesamtraumklangs, Verwendung des Verfahrens sowie Telekonferenzsystem
EP3343348A1 (en) * 2016-12-30 2018-07-04 Nokia Technologies Oy An apparatus and associated methods
US10424307B2 (en) 2017-01-03 2019-09-24 Nokia Technologies Oy Adapting a distributed audio recording for end user free viewpoint monitoring
CN106993249B (zh) * 2017-04-26 2020-04-14 深圳创维-Rgb电子有限公司 一种声场的音频数据的处理方法及装置
CN111466122B (zh) * 2017-10-12 2023-02-28 弗劳恩霍夫应用研究促进协会 用于虚拟现实应用的音频传递优化
CN113993062B (zh) 2018-04-09 2025-06-27 杜比国际公司 用于mpeg-h 3d音频的三自由度(3dof+)扩展的方法、设备和系统
US11375332B2 (en) 2018-04-09 2022-06-28 Dolby International Ab Methods, apparatus and systems for three degrees of freedom (3DoF+) extension of MPEG-H 3D audio
WO2020071622A1 (ko) * 2018-10-02 2020-04-09 엘지전자 주식회사 멀티 유저들에 관한 오디오 데이터를 송수신하는 방법 및 그 장치
US11481181B2 (en) * 2018-12-03 2022-10-25 At&T Intellectual Property I, L.P. Service for targeted crowd sourced audio for virtual interaction
CN116312572A (zh) * 2019-01-31 2023-06-23 华为技术有限公司 一种音频信号处理方法及装置
US10812928B1 (en) * 2019-08-12 2020-10-20 Facebook Technologies, Llc Audio service design for operating systems
US11340865B2 (en) 2020-08-11 2022-05-24 International Business Machines Corporation Communication device audio transmission modification
US11340864B2 (en) * 2020-08-11 2022-05-24 International Business Machines Corporation Communication device audio transmission modification
WO2022054603A1 (ja) * 2020-09-10 2022-03-17 ソニーグループ株式会社 情報処理装置、情報処理端末、情報処理方法、およびプログラム
CN113207058B (zh) * 2021-05-06 2023-04-28 恩平市奥达电子科技有限公司 一种音频信号的传输处理方法
CN118511547A (zh) * 2021-11-09 2024-08-16 弗劳恩霍夫应用研究促进协会 使用空间扩展声源的渲染器、解码器、编码器、方法及比特流
GB2616424A (en) * 2022-03-07 2023-09-13 Nokia Technologies Oy Spatial audio rendering of reverberation
CN115550831A (zh) * 2022-08-16 2022-12-30 Oppo广东移动通信有限公司 通话音频的处理方法、装置、设备、介质及程序产品

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH066471A (ja) 1992-06-22 1994-01-14 Fujitsu Ltd 音声会議装置の音声混合装置
JPH06149275A (ja) 1992-10-30 1994-05-27 Sega Enterp Ltd 三次元仮想空間情報を考慮した三次元仮想音像形成装置
US5659691A (en) * 1993-09-23 1997-08-19 Virtual Universe Corporation Virtual reality network with selective distribution and updating of data to reduce bandwidth requirements
US5347306A (en) * 1993-12-17 1994-09-13 Mitsubishi Electric Research Laboratories, Inc. Animated electronic meeting place
JP3070719B2 (ja) 1995-07-05 2000-07-31 日本電信電話株式会社 仮想空間共有方法およびこの方法を実施する装置
JP3019291B2 (ja) 1994-12-27 2000-03-13 日本電信電話株式会社 仮想空間共有装置
US5736982A (en) * 1994-08-03 1998-04-07 Nippon Telegraph And Telephone Corporation Virtual space apparatus with avatars and speech
JPH08125738A (ja) 1994-10-21 1996-05-17 Ricoh Co Ltd Isdnによる話者特定機能付音声会議システム
JPH0934868A (ja) 1995-07-14 1997-02-07 Nippon Telegr & Teleph Corp <Ntt> 分散協同学習支援方法及びシステム
GB2303516A (en) 1995-07-20 1997-02-19 Plessey Telecomm Teleconferencing
US5764639A (en) * 1995-11-15 1998-06-09 Staples; Leven E. System and method for providing a remote user with a virtual presence to an office
US7012630B2 (en) * 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
US5889843A (en) 1996-03-04 1999-03-30 Interval Research Corporation Methods and systems for creating a spatial auditory environment in an audio conference system
US6323857B1 (en) * 1996-04-19 2001-11-27 U.S. Philips Corporation Method and system enabling users to interact, via mutually coupled terminals, by reference to a virtual space
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
US7379961B2 (en) * 1997-04-30 2008-05-27 Computer Associates Think, Inc. Spatialized audio in a three-dimensional computer-based scene
US6011851A (en) * 1997-06-23 2000-01-04 Cisco Technology, Inc. Spatial audio processing method and apparatus for context switching between telephony applications
US6125115A (en) * 1998-02-12 2000-09-26 Qsound Labs, Inc. Teleconferencing method and apparatus with three-dimensional sound positioning
EP1070417B1 (en) 1998-04-08 2002-09-18 BRITISH TELECOMMUNICATIONS public limited company Echo cancellation
JP3456419B2 (ja) * 1998-07-23 2003-10-14 日本電信電話株式会社 仮想空間内における共有空間表示方法及びシステム及び仮想空間内における共有空間表示プログラムを格納した記憶媒体
JP3627521B2 (ja) * 1998-08-03 2005-03-09 日本電信電話株式会社 共有仮想画面による情報伝達方法及びユーザ端末装置及び計算機及び共有仮想画面による情報伝達プログラムを格納した記憶媒体
US6241612B1 (en) * 1998-11-09 2001-06-05 Cirrus Logic, Inc. Voice communication during a multi-player game
US6327567B1 (en) 1999-02-10 2001-12-04 Telefonaktiebolaget L M Ericsson (Publ) Method and system for providing spatialized audio in conference calls
GB2349055B (en) 1999-04-16 2004-03-24 Mitel Corp Virtual meeting rooms with spatial audio
JP2001308855A (ja) 2000-04-19 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> 多地点間音声通信方法、多地点間音声通信方法で用いられるクライアント・サーバシステム、およびクライアントとサーバのプログラムを記録した記録媒体
FI114129B (fi) * 2001-09-28 2004-08-13 Nokia Corp Konferenssipuhelujärjestely

Also Published As

Publication number Publication date
JP2009043274A (ja) 2009-02-26
US20060212147A1 (en) 2006-09-21
WO2003058473A8 (en) 2003-08-21
JP2005514702A (ja) 2005-05-19
AUPR989802A0 (en) 2002-01-31
US7533346B2 (en) 2009-05-12
WO2003058473A1 (en) 2003-07-17

Similar Documents

Publication Publication Date Title
JP4745375B2 (ja) 対話型立体的オーディオビジュアル・システム
EP3627860B1 (en) Audio conferencing using a distributed array of smartphones
CN1719852B (zh) 信息源选择系统和方法
US8406439B1 (en) Methods and systems for synthetic audio placement
US8073125B2 (en) Spatial audio conferencing
US9197755B2 (en) Multidimensional virtual learning audio programming system and method
US9525958B2 (en) Multidimensional virtual learning system and method
Harma et al. Techniques and applications of wearable augmented reality audio
US8085920B1 (en) Synthetic audio placement
US20240340605A1 (en) Information processing device and method, and program
Gospodarek et al. Sound design and reproduction techniques for co-located narrative VR experiences
JP5602688B2 (ja) 音像定位制御システム、コミュニケーション用サーバ、多地点接続装置、及び音像定位制御方法
JP2001274912A (ja) 遠隔地会話制御方法および遠隔地会話システムならびに遠隔地会話制御プログラムを記録した記録媒体
JP2006094315A (ja) 立体音響再生システム
CN117409804A (zh) 音频信息的处理方法、介质、服务器、客户端及系统
JP6972858B2 (ja) 音響処理装置、プログラム及び方法
JP2023043698A (ja) オンライン通話管理装置及びオンライン通話管理プログラム
JP2006279492A (ja) 電話会議システム
WO2022054900A1 (ja) 情報処理装置、情報処理端末、情報処理方法、およびプログラム
US20260040022A1 (en) System and method for immersive musical performance between at least two remote locations over a network
JP7687339B2 (ja) 情報処理装置、情報処理端末、情報処理方法、およびプログラム
Kilgore et al. The Vocal Village: enhancing collaboration with spatialized audio
KR20250165851A (ko) 실시간 합주시스템 및 이를 이용한 합주서비스 제공방법
GB2627540A (en) A system and method for immersive musical performance between at least two remote locations over a network
Hansson Can an Optimized MidSide Technique Improve Perceived Envelopment in Game Audio

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20081017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100811

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110419

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140520

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4745375

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term