HK1214711B - 用於个性化音频虚拟化的方法和装置 - Google Patents
用於个性化音频虚拟化的方法和装置 Download PDFInfo
- Publication number
- HK1214711B HK1214711B HK16102596.6A HK16102596A HK1214711B HK 1214711 B HK1214711 B HK 1214711B HK 16102596 A HK16102596 A HK 16102596A HK 1214711 B HK1214711 B HK 1214711B
- Authority
- HK
- Hong Kong
- Prior art keywords
- audio
- metadata
- room
- digital
- profile
- Prior art date
Links
Description
相关申请的交叉引用
本申请要求在2012年11月30日提交的美国临时申请第61/731,958号、在2013年1月7日提交的美国临时申请第61/749,746号以及在2013年11月26日提交的美国临时申请第14/091,112号的优先权,这些美国临时申请通过引用而被结合,就好像被完全陈述一样。
技术领域
本申请一般地涉及用于个性化音频虚拟化的方法和装置。
背景技术
在传统的音频再现中,消费者无法再现原始内容制作者或者设备生产者的空间属性。因此,原始内容制作者的意图被丢失,并且给消费者留下不希望的音频体验。将用于交付传达内容制作者的原始意图的高质量音频制作的方法和装置交付给消费者因而将是希望的。
发明内容
各种示例性实施例的简要总结被给出。在以下总结中可以做出某些简化和省略,其旨在突出和介绍各种示例性实施例的某些方面,但是并非限制本发明的范围。足够允许本领域普通技术人员制作和使用这些发明概念的对优选示例性实施例的详细描述在后续部分中将跟随。
各种示例性实施例与用于执行个性化音频虚拟化的方法和装置有关。该装置可以包括扬声器、耳机(包耳式、贴耳式或者入耳式)、麦克风、计算机、移动设备、家庭影院接收器、电视、蓝光(BD)播放器、紧凑盘(CD)播放器、数字媒体播放器等。该装置可被配置为接收音频信号、缩放音频信号并且对缩放后的音频信号执行卷积和混响以产生卷积的音频信号。该装置可被配置为对卷积的音频信号进行滤波并且处理滤波后的音频信号以供输出。
各种示例性实施例还涉及一种供在音频设备中使用的方法,该方法包括:接收包含至少一个音频声道信号的数字音频内容;接收影响数字音频内容的再现的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件(profile)和基于用户听觉能力的频谱响应曲线的收听者听觉配置文件;基于接收的元数据来配置至少一个数字滤波器;利用相对应的至少一个数字滤波器对所述至少一个音频声道进行滤波以产生滤波后的音频信号;以及将滤波后的音频信号输出到附件设备。
在一些实施例中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。在一些实施例中,与数字音频内容复用的元数据被接收。在一些实施例中,独立于数字音频内容在容器文件中接收元数据。在一些实施例中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。在一些实施例中,早期室内响应参数和后期混响参数将数字滤波器配置为产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。在一些实施例中,后期混响参数配置预定房间的后期混响的参数模型。
各种示例性实施例还涉及一种音频设备,其包括:接收器,其被配置为接收包含至少一个音频声道信号的数字音频内容;以及接收影响数字音频内容的再现的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件和基于用户听觉能力的频谱响应曲线的收听者听觉配置文件;处理器,其被配置为基于接收的元数据来配置至少一个数字滤波器,其中该处理器被配置为利用相对应的至少一个数字滤波器对所述至少一个音频声道信号进行滤波以产生滤波后的音频信号;并且其中,处理器被配置为将滤波后的音频信号输出到附件设备。
在一些实施例中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。在一些实施例中,与数字音频内容复用的元数据被接收。在一些实施例中,独立于数字音频内容在容器文件中接收元数据。在一些实施例中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。在一些实施例中,处理器利用早期室内响应参数和后期混响参数来配置数字滤波器以产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。在一些实施例中,处理器利用后期混响参数来配置预定房间的后期混响的参数模型。
各种示例性实施例还涉及一种虚拟化数据格式,其包括:多个字段,所述多个字段包括多个参数,其中所述多个参数是基于以下配置文件的:基于对预定房间的声学测量的室内测量配置文件、基于用户听觉能力的频谱响应曲线的收听者听觉配置文件、基于回放设备的频率响应参数的回放设备配置文件和基于附件设备的频率响应参数的附件设备配置文件。
在一些实施例中,所述多个参数中的至少一个被与数字音频内容复用。
各种示例性实施例还涉及一种供在音频设备中使用的方法,该方法包括:接收包含至少一个音频声道信号的数字音频内容;接收影响数字音频内容的再现的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件;基于接收的元数据来配置至少一个数字滤波器;利用相对应的至少一个数字滤波器对所述至少一个音频声道进行滤波以产生滤波后的音频信号;以及将滤波后的音频信号输出到附件设备。
在一些实施例中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。在一些实施例中,与数字音频内容复用的元数据被接收。在一些实施例中,独立于数字音频内容在容器文件中接收元数据。在一些实施例中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。在一些实施例中,早期室内响应参数和后期混响参数将数字滤波器配置为产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。在一些实施例中,后期混响参数配置预定房间的后期混响的参数模型。
各种示例性实施例还涉及一种音频设备,其包括:接收器,其被配置为接收包含至少一个音频声道信号的数字音频内容;以及接收影响数字音频内容的再现的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件;处理器,其被配置为基于接收的元数据来配置至少一个数字滤波器,其中该处理器被配置为利用相对应的至少一个数字滤波器对所述至少一个音频声道信号进行滤波以产生滤波后的音频信号;并且其中,处理器被配置为将滤波后的音频信号输出到附件设备。
在一些实施例中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。在一些实施例中,与数字音频内容复用的元数据被接收。在一些实施例中,独立于数字音频内容在容器文件中接收元数据。在一些实施例中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。在一些实施例中,处理器利用早期室内响应参数和后期混响参数来配置数字滤波器以产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。在一些实施例中,处理器利用后期混响参数来配置预定房间的后期混响的参数模型。
在一些实施例中,数字音频内容包括表明音频声道信号包含预处理后的内容的标志。如果音频声道信号经过预处理,则元数据可包括关于音频信号被如何预处理的信息。
在一些实施例中,元数据包括表明数字音频内容包含至少一个预处理后的音频声道信号的标志。如果音频声道信号经过预处理,则元数据可包括关于音频信号被如何预处理的信息。
附图说明
在这里公开的各种实施例的这些以及其他特征和优点关于以下描述和附图将得到更好的理解,其中相似的编号自始至终指代相似的部件,并且其中:
图1是传统的5.1环绕格式的示例扬声器布置的示图;
图2是示例室内声学测量过程的示图;
图3A是供在应用虚拟化数据的虚拟化系统中使用的用来处理包括嵌入的虚拟化数据的音频内容的示例方法的示图;
图3B是供在应用虚拟化数据的虚拟化系统中使用的用来处理不包括嵌入的虚拟化数据的音频内容的示例方法的示图;
图4是示例虚拟化系统的示图;
图5是示出虚拟化系统的概览的框图;
图6A和图6B是示出图5中的虚拟化系统的实施例的操作的一般概览的框图;并且
图7是示出描述为在虚拟化系统中使用的示例方法的详细流程图。
具体实施方式
下面联系附图阐述的详细描述旨在作为对本发明的当前优选实施例的描述,并非旨在表示本发明可被构建或使用的仅有形式。该描述阐述了用于开发和操作与所示出的实施例相关的本发明的功能及步骤顺序。然而也应当理解,相同或者等同的功能和顺序可以通过同样旨在包含在本发明的精神和范围内的不同的实施例来完成。还理解的是,诸如第一和第二等的关系术语的使用仅用于区分一个实体与另一个实体,而不一定要求或者暗示这些实体之间任何实际的这种关系或次序。
声波是由通过诸如空气之类的可压缩介质传播的物体的振动引起的一类压力波。声波周期性地使介质(例如,空气)中的物质发生位移,从而使物质振荡。声波的频率描述了一个时间段内的完整周期的数目并且以赫兹(Hz)表示。12Hz到20,000Hz频率范围内的声波是人类能听到的。
本申请涉及用于处理音频信号的方法和装置,音频信号即表示物理声音的信号。这些信号可以由数字电子信号表示。在随后的讨论中,可示出或讨论模拟波形来例示概念;然而应当理解的是本发明的典型实施例可以在数字字节或者字的时间序列的上下文中操作,所述字节或字构成对模拟信号或(最终)物理声音的离散逼近。该离散的数字信号可以对应于周期性采样的音频波形的数字表示。如本领域中已知的,为了均匀采样,对于感兴趣的频率可以以至少足以满足Nyquist采样定理的速率对波形进行采样。例如,在典型实施例中,可以使用约44.1kHz的均匀采样率。可以替选地使用诸如96kHz的更高采样率。根据本领域公知的原理,可以选择量化方案和比特分辨率来满足特定应用的要求。本发明的技术和装置通常将相互依赖地应用于多条声道内。例如,其可以用于“环绕”音频系统(具有多于两条声道)的环境中。
如这里所使用的,“数字音频信号”或“音频信号”不仅仅描述数学抽象,而是表示能够通过机器或装置进行检测的物理介质所包含或承载的信息。该术语包括记录的或者传输的信号,并且应当被理解为包括以任何形式的编码(包括脉冲编码调制(PCM),但不仅限于PCM)来传送。输出或输入,或者甚至中间音频信号可以通过各种已知方法中的任何一种来编码或压缩,各种已知方法包括MPEG、ATRAC、AC3,或DTS公司的专有方法,如美国专利5,974,380;5,978,762;以及6,487,535中所描述的方法。如对本领域技术人员将是清楚的,可能需要对计算进行某种修改,以适应该特定压缩或编码方法。
本发明可以实现在消费者电子设备中,诸如数字视频盘(DVD)或者蓝光盘(BD)播放器、电视(TV)调谐器、紧凑盘(CD)播放器、手持播放器、因特网音频/视频设备、游戏机、移动电话等。消费者电子设备包括中央处理单元(CPU)或者数字信号处理器(DSP),其可表示一个或多个传统类型的这种处理器,诸如IBM PowerPC、Intel Pentium(x86)处理器等等。随机存取存储器(RAM)临时存储由CPU或DSP执行的数据处理操作的结果,并且通常经由专用存储声道互联。消费者电子设备还可以包括通过I/O总线与CPU或DSP通信的诸如硬盘驱动器的永久性存储设备。也可连接其他类型的存储设备,诸如磁带驱动器、光盘驱动器。图形卡也经由视频总线与CPU连接,并且向显示监视器传输代表显示数据的信号。诸如键盘或鼠标的外围数据输入设备可以通过USB端口与音频再现系统连接。USB控制器为连接到USB端口的外围设备翻译去往和来自CPU的数据和指令。诸如打印机、麦克风、扬声器等的附加设备可与消费者电子设备连接。
消费者电子设备可利用具有图形用户界面(GUI)的操作系统,诸如来自Redmond,Washington的微软公司的WINDOWS、来自Cupertino,CA的苹果公司的MAC OS、为诸如Android的移动操作系统设计的各种移动GUI版本等。消费者电子设备可以执行一个或多个计算机程序。通常,操作系统和计算机程序以有形的方式包含在计算机可读介质中,例如包括硬盘驱动器在内的固定和/或可拆卸的数据存储设备中的一个或多个。操作系统和计算机程序均可从上述的数据存储设备被加载到RAM中以供CPU执行。计算机程序可包括指令,这些指令当被CPU读取和执行时导致其执行步骤以执行本发明的步骤或特征。
本发明可具有许多不同的配置和架构。可以在不背离本发明的范围的情况下很容易地替代任何这种配置或架构。本领域技术人员将认识到,上述的序列是最常用于计算机可读介质中的,但是,在不背离本发明范围的情况下,存在能够被替代的其它现有序列。
可通过硬件、固件、软件或它们的任意组合实现本发明的一个实施例的要素。当实现为硬件时,音频编解码器可在一个音频信号处理器上使用,或者分布于各种处理组件之中。当实现为软件时,本发明的实施例的要素基本上是用于执行各种任务的代码段。软件可包括用于实施在本发明的一个实施例中描述的操作的实际代码,或者仿真或模拟这些操作的代码。程序或代码段可被存储于处理器或机器可存取介质中,或者通过传送介质,通过在载波中包含的计算机数据信号或通过载波调制的信号被传输。“处理器可读或可存取介质”或“机器可读或可存取介质”可包含被配置为存储、传输或传送信息的任何介质。
处理器可读介质的示例包括电子电路、半导体存储设备、只读存储器(ROM)、闪速存储器、可擦ROM(EROM)、软盘、紧凑盘(CD)ROM、光盘、硬盘、光纤介质、射频(RF)链路等。计算机数据信号包括可以通过诸如电子网络信道、光纤、空气、电磁波、RF链路等的传输介质传播的任何信号。代码段可通过诸如因特网、内联网等的计算机网络被下载。可在制品中包含机器可存取介质。机器可存取介质可包括当被机器访问时可使机器执行下面描述的操作的数据。术语“数据”在这里指的是可出于机器可读目的而被编码的任何类型的信息。因此,它可包括程序、代码、数据、文件等。
可通过软件实现本发明的实施例的全部或一部分。软件可具有相互耦合的几个模块。软件模块可与另一模块耦合以接收变量、参数、自变量、指针等,并且/或者生成或传递结果、更新的变量、指针等。软件模块也可以是与在平台上运行的操作系统相互作用的软件驱动程序或接口。软件模块也可以是配置、建立、初始化、发送和接收去往和来自硬件设备的数据的硬件驱动器。
本发明的一个实施例可被描述为通常示为流程表、流程图、结构图或框图的处理。虽然框图可将操作描述为依次的处理,但是可以并行或同时地执行多个操作。另外,操作的次序可被重新安排。处理可在其操作完成时终止。处理可与方法、程序、过程等对应。
本发明的特定实施例可以利用声学室内测量。测量可以在包含高保真音频设备的房间(诸如,例如混音室或听音室)中进行。该房间可包括多个扬声器,并且这些扬声器可以以传统的扬声器布局(诸如,例如立体声、5.1、7.1、11.1或者22.2)来布置。也可使用其他扬声器布局或阵列,诸如波场合成(WFS)阵列或者其他基于对象的呈现布局。
图1是传统的5.1环绕格式的示例扬声器布置100的示图。扬声器布置100可包括左前扬声器110、右前扬声器120、中前扬声器130、左环绕扬声器140、右环绕扬声器150和重低音喇叭160。虽然具有环绕扬声器的混音室被提供作为示例,但是测量可以在包含一个或多个扬声器的任意地点进行。
室内声学
图2是示例室内声学测量过程200的示图。在该示例中,可通过将测量装置放置在最佳收听位置(诸如制作者的椅子)来获得声学室内测量。测量装置可以是独立的麦克风、放置在仿真头内的双耳麦克风或者放置在测试对象的耳朵内的双耳麦克风。测量装置可以接收来自一个或多个扬声器的一个或多个测试信号210。测试信号可以包括扫频信号或者线性调频(chirp)信号。作为替代,或者除此之外,测试信号可以是诸如Golay码或最大长度序列之类的噪声序列。当每一个扬声器播放测试信号时,测量装置可以记录在收听位置处接收的音频信号220。根据记录的音频信号,可对于每一个扬声器位置和测量装置的每一个麦克风生成230室内测量配置文件。
根据特定实施例,测量装置可以是可旋转的。可在各种位置下旋转测量装置的情况下播放附加的测试音调。各种旋转处的测量信息可以允许系统支持对收听者的头部跟踪,如在下面描述的。
可例如为了“最佳听音位置(sweetspot)外”监视而在房间中的其他位置处进行附加的室内测量。“最佳听音位置外”测量可以辅助为不在最佳收听位置的收听者确定受测房间的声学效果。
另外,根据特定实施例,可利用测量装置获得特定回放耳机的频率响应。
根据特定新颖实施例,每一个受测室内测量配置文件可被分离为头部相关传递函数(HRTF)、早期室内响应和后期混响。HRTF可以特征化在没有房间的声学影响的情况下测量装置如何接收来自每一个扬声器的声音。早期室内响应可以特征化在来自每一个扬声器的声音已经被房间的表面反射之后的早期反射。后期混响可以特征化在早期反射之后的房间内的声音。
HRTF可由滤波器系数表示。早期室内响应和后期混响例如可由重现房间的声学的声学模型表示。声学模型可部分地由早期室内响应参数和后期混响参数决定。声学模型可作为室内测量配置文件而被传输和/或存储。
根据特定新颖实施例,HRTF滤波器系数、早期室内响应参数和/或后期混响参数可被用于处理音频信号以供通过耳机回放。作为替代,在另一个实施例中,完全室内测量配置文件可被用于处理音频信号。音频信号可被处理以使得当信号通过耳机被回放时受测房间的声学和扬声器位置被重现。
早期室内响应和后期混响声学模型可能不精确地重现室内声学。因此,根据特定新颖实施例,声学模型和/或参数可被修改以向房间应用虚拟声学处理或者向扬声器应用均衡(EQ)。虚拟声学测量可包括虚拟吸收处理或者虚拟低音陷阱。虚拟吸收处理可使房间混响响应“减弱”或者修改被某些表面反射的声音。虚拟低音陷阱可以移除房间的“箱谐振”中的一些。EQ可被应用以修改房间中的每一个扬声器的感知频率响应。
室内测量配置文件可包括对于一个或多个房间和每一个房间内的一个或多个收听位置的完全室内测量配置文件数据和/或HRTF滤波器系数、早期室内响应参数和后期混响参数。室内测量配置文件还可以包括其他标识信息,诸如耳机频率响应信息、耳机标识信息、受测扬声器布局信息、回放模式信息、测量位置信息、测量设备信息和/或授权/所有者信息。
根据特定新颖实施例,虚拟化数据可作为可包括在音频内容比特流中的元数据而被存储。音频内容可以是基于声道的或是基于对象的。虚拟化数据可包括室内测量配置文件、回放设备配置文件、附件设备配置文件和收听者听觉配置文件中的至少一个。室内测量配置文件可包括室内响应参数和HRTF。在一些实施例中,室内测量配置文件可不包括HRTF。回放设备配置文件可包括回放设备的频率响应参数和其他回放设备信息。回放设备可以是包括耳机在内的将音频数据转换为可由扬声器呈现的信号的任何设备。附件设备配置文件可包括附件设备(例如,耳机)的频率响应参数,以及其他附件设备信息。附件设备可以是将来自回放设备的音频信号转换为可听见的声音的任何设备。回放设备和附件设备在其中耳机/扬声器包括必需的DAC、放大器和虚拟处理器的实施例中可以是相同的设备。收听者听觉配置文件可包括收听者听觉损失参数、收听者均衡偏好和HRTF。
虚拟化数据可被嵌入或复用在音频内容的文件头部中,或者可被嵌入或复用在音频文件或帧的任何其他部分中。虚拟化数据也可在音频比特流的多个帧中被重复。作为替代或者除此之外,虚拟化数据可在若干帧上随时间而被改变,或者可被存储在独立于音频内容的虚拟化数据文件中。虚拟化数据可与音频内容一起被传送到虚拟化系统或者虚拟化数据可独立于音频内容而被传送。
图3A是供在应用虚拟化数据的虚拟化系统中使用的用来处理包括嵌入或复用的虚拟化数据的音频内容的示例方法300的示图。一旦虚拟化系统接收音频内容310,虚拟化系统就可以确定320虚拟化数据被与音频内容复用。虚拟化系统可以使虚拟化数据与音频内容分离330并且解析340虚拟化数据。虚拟化数据和/或音频内容可经由有线和/或无线连接而被传送到虚拟化系统。
图3B是供在应用虚拟化数据的虚拟化系统中使用的用来处理不包括嵌入或复用的虚拟化数据的音频内容的示例方法350的示图。在该示例中,虚拟化系统可以接收音频内容360,并且单独地接收虚拟化数据370。虚拟化系统然后可解析380虚拟化数据。在该示例中,可以在接收音频内容之前、在接收音频内容之后或者在音频内容的接收期间接收虚拟化数据。
根据特定新颖实施例,虚拟化数据可具有唯一的标识符,诸如,例如MD5校验和或者其他散列函数。虚拟化系统可以独立于虚拟化数据而接收唯一的标识符。虚拟化系统可以轮询包含唯一标识符和虚拟化数据的远程服务器,或者唯一标识符可被直接传送到虚拟化系统。唯一标识符可被间歇地(例如,在指定为随机存取点的帧中)传送到虚拟化系统。虚拟化系统可以将该唯一标识符与先前接收的虚拟化数据的唯一标识符相比较。如果该唯一标识符与先前接收的虚拟化数据相匹配,则虚拟化系统可使用先前接收的虚拟化数据。
如果虚拟化数据包括完全室内测量配置文件,则虚拟化系统可以通过执行音频内容与室内测量配置文件的直接卷积来处理音频内容。如果虚拟化数据包括HRTF滤波器系数、早期室内响应参数和后期混响参数,那么虚拟化系统可以创建房间的声学模型并且使用该声学模型和HRTF来处理音频内容。在该示例中,早期室内响应参数和后期混响参数可与音频内容卷积。
可替代地,虚拟化系统可使用直接卷积和声学建模的组合来补偿由于使用虚拟系统包含的混响算法而可能丢失的感知相关的室内测量配置文件。例如,早期室内响应参数可与音频内容卷积,而后期混响参数可被建模。在此示例中,后期混响参数可在没有卷积滤波的情况下被建模。该示例可以在实现资源不允许完全室内测量参数被卷积的情形下被采用。在该示例中,原始测量的混响尾部可被用作为室内测量配置文件一部分的人造混响尾部代替。混响的参数可被选择以使得原始混响尾部的感知属性被尽可能接近地再现。这些参数可被指定为室内测量配置文件的一部分。
此外,根据特定实施例,虚拟化系统可跟踪收听者的头部的位置。基于收听者的头部位置,虚拟化系统可以更改HRTF和/或室内测量配置文件以更好地与受测房间中的类似收听位置相对应。
虚拟化系统可在回放时和/或在回放时之前处理音频内容。音频内容的处理可以是分布式的。例如,音频内容可利用某些虚拟化数据而被预处理,并且虚拟化系统可以进一步处理音频内容以校正收听者的听觉损失。该处理可以在用户的回放设备中执行,用户的回放设备诸如是例如MP3播放器、移动电话、计算机、耳机、AV接收器或者能够处理音频内容的任何其他设备。可替代地,在一些实施例中,处理可以在被存储在用户的本地设备中之前或在被传输到用户的本地设备之前执行。例如,音频内容可在内容所有者的服务器处被预处理,然后作为空间化的耳机混音而被传输到用户设备。
例如,虚拟化系统可以将音频内容呈现为具有环绕虚拟化的双声道信号,并且可以是虚拟化系统的一部分。虚拟化系统可以以允许内容制作者对音频进行预处理的方式来构造。该处理可以生成优化的音轨,该音轨被设计为以内容制作者指定的方式增强设备回放。虚拟化系统可包括一个或多个处理器,这一个或多个处理器被配置为保持原始混合环绕声轨的期望属性并且向收听者提供工作室原本提供的声音体验。
任何旨在用于对内容进行预处理的房间和扬声器配置都可以被测量并且被以虚拟化文件格式存储。因为该模型可假定预处理将不会被实时执行,因此预先编码的内容模型可以提供利用完全室内测量配置文件来仿真任何空间的能力。虚拟化文件格式在信号被预处理的情况下可包括关于信号被如何预处理的信息。例如,虚拟化文件格式可包括与室内测量配置文件、附件设备配置文件、回放设备配置文件和/或收听者听觉配置文件有关的完全或者部分的信息。
虚拟化系统的预处理的结果可以是可使用任何解码器来解码的比特流。该比特流可包括指示音频已被利用虚拟化数据预处理与否的标志。如果使用不认识该标志的旧有解码器来回放该比特流,内容仍然可以利用虚拟化系统播放,然而,耳机EQ无法被包括在该处理中。耳机EQ可包括近似地使特定耳机的频率响应规格化的均衡滤波器。
回放设备或者附件设备可包含虚拟化系统,该虚拟化系统被配置为呈现已经利用虚拟化数据预处理过的音频信号。当回放设备或者附件设备接收音频信号时,其可寻找比特流中的消费者设备标志。在该示例中,消费者设备标志可以是耳机设备标志。如果耳机标志被设置,则双耳房间和混响处理块可被绕过并且只有耳机EQ处理可被应用。空间处理可被应用于那些未设置耳机标志的信号。
音频内容可被在混音室中处理,从而允许音频制作者监视最终用户听到的空间化耳机混音。当处理后或者预处理后的音频内容通过耳机被回放时,例如,该音频内容听起来类似于在受测收听环境中通过扬声器回放的音频。
在运行时对内容进行处理
当虚拟化数据旨在用于实时用途时,运行时数据格式可被使用。运行时数据格式可包括可被快速地并且/或者以更少处理器负荷执行的简化室内测量配置文件。这与将与预处理后的音频一起使用的室内测量配置文件(其中执行速度和处理器负荷较不重要)形成对比。运行时数据格式可以是具有一个或多个缩短的卷积滤波器的室内测量配置文件的表示,这一个或多个缩短的卷积滤波器更适合回放设备和/或附件设备的处理局限。虚拟化系统可以补偿由于使用虚拟化系统包括的混响算法而可能丢失的感知相关的室内测量配置文件。
如果音频源流未利用虚拟数据而被预处理,则运行时数据格式可被从可被本地存储的“预设”文件中获得。运行时数据格式可包括由消费者测量的室内测量配置文件和/或来自不同源(例如,远程服务器)的室内测量配置文件。
运行时数据格式还可以作为元数据被嵌入或复用在流中。在该示例中,运行时元数据被解析并被发送到在设备上运行的实时算法。该特征在游戏应用中可以是有用的,因为以这种方式提供室内测量配置文件可允许内容提供者定义在为特定游戏实时处理音频时应当被使用的虚拟室内声学。在该示例中,通过将游戏的多声道声轨转码为具有可在外部设备上使用的嵌入式室内测量配置文件的多声道流,可将相关的室内测量配置文件传递到一个或多个外部设备,例如游戏外围设备。
根据特定新颖实施例,虚拟化系统可使用利用上面描述的类似的虚拟化数据和后期处理技术在当前房间内测量的数据以通过耳机呈现本地收听环境的声学效果。
如果虚拟化数据包括多个房间的测量结果,则虚拟化系统可选择哪一个房间的声学效果应当被用于处理音频内容。用户可能更喜欢利用与当前房间的声学效果最类似的室内测量配置文件处理的音频内容。虚拟化系统可以利用一个或多个测试来确定当前房间的声学效果的一些量度。例如,用户可在当前房间内拍它们的手。拍手可被虚拟化系统记录,然后被处理以确定房间的声学参数。作为替代或者除此之外,虚拟化系统可分析诸如讲话之类的其他环境声音。
一旦虚拟化系统已经确定当前房间的声学参数,虚拟化系统就可选择和/或改变受测房间的声学效果。根据特定实施例,虚拟化系统可选择具有与当前房间最类似的声学效果的受测房间。虚拟化系统可以通过使当前房间的声学参数与受测房间的声学参数相关联来确定最类似的受测房间。例如,当前房间中的拍手的声学参数可被与受测房间中的真实或仿真拍手的声学参数相关联。
作为替代或者除此之外,根据特定实施例,虚拟化系统可改变受测房间的声学模型以更加类似于当前房间。例如,虚拟化系统可对受测房间的早期响应进行滤波或者时间缩放以更加类似于当前房间的早期响应。虚拟化系统还可使用当前房间的早期响应。虚拟化系统还可以在受测房间的后期混响模型中使用当前房间的混响参数。
当处理后的音频内容通过耳机被播放时,处理后的音频内容可以近似受测扬声器的音色以及受测房间的声学特性。然而,收听者可能习惯于耳机的音色,并且未经处理或者“下混频(downmixed)”的耳机信号与扬声器和受测房间的声学特性之间的音色差异对于收听者可以是显著的。因此,根据特定新颖实施例,虚拟化系统针对特定输入声道和/或输入声道对来中和音色差异,同时保留受测房间中的扬声器的空间属性。虚拟化系统可通过应用均衡来中和音色差异,该均衡产生更加接近地近似收听者习惯听到的原始耳机信号的音色的总体音色签名。均衡可基于特定回放耳机的频率响应和/或受测房间的声学模型和HRTF。
根据特定实施例,收听者可在不同的均衡配置文件之间进行选择。例如,收听者可选择近似如在受测房间内播放的原始作品的准确音色和空间属性的室内测量配置文件。或者收听者可选择在保持原始作品的空间属性的同时中和音色差异的附件设备配置文件。或者收听者可从这些或其他均衡配置文件的组合中进行选择。
根据另一特定实施例,收听者和/或虚拟化系统在收听者的特定HRTF不是已知的情况下可以另外在不同的HRTF配置文件之间进行选择。收听者可通过收听测试来选择HRTF配置文件或者虚拟化系统可通过其他手段来选择HRTF配置文件。收听测试可包括不同组的HRTF,并且允许收听者选择具有测试声音的优选定位的一组HRTF。在原始室内测量配置文件中使用的HRTF可被代替并且选中的一组HRTF可被合并以使得原始测量空间的声学特性被保留。
收听者听觉配置文件
图4是示例虚拟化系统400的示图。虚拟化系统400可包括用户的一个或多个本地回放设备410、一个或多个附件设备420和服务器430。服务器430可以是本地服务器或者远程服务器。服务器430可以包括一个或多个室内测量配置文件435。一个或多个室内测量配置文件435可被包括在唯一收听者账户440中。用户可被与虚拟化系统400的唯一收听者账户440相关联。回放设备410可经由有线或无线接口415与服务器430通信,并且可经由有线或无线接口425与附件设备420通信。收听者账户440可包括关于用户的信息,诸如一个或多个收听者听觉配置文件450、一个或多个回放设备配置文件460和一个或多个附件设备配置文件470。一个或多个室内测量配置文件435和来自收听者账户440的一个或多个配置文件可被传输到回放设备410和/或附件设备420以供使用和存储。一个或多个室内测量配置文件435和来自收听者账户440的一个或多个配置文件可作为音频信号中的嵌入式元数据而被发送,或者它们可独立于音频信号而被发送。
可根据收听者听觉测试的结果生成收听者听觉配置文件450。可利用用户的回放设备(诸如智能电话、计算机、个人音频播放器、MP3播放器、A/V接收器、电视机或者能够播放音频和接收用户输入的任何其他设备)来执行收听者听觉测试。可替代地,可在独立系统上执行收听者听觉测试,该独立系统可将听觉测试结果上传到服务器430以供稍后与用户的回放设备410一起使用。根据特定实施例,收听者听觉测试可在用户与唯一收听者账户440相关联之后发生。可替代地,收听者听觉测试可在用户与唯一收听者账户440相关联之前发生,然后可在完成测试之后的某一时间与收听者账户440相关联。
根据特定实施例,虚拟化系统400可获得将与收听者听觉测试一起使用的关于回放设备410、附件设备420和室内测量配置文件435的信息。可在收听者听觉测试之前、与收听者听觉测试同时或者在收听者听觉测试之后获得该信息。回放设备410可向服务器430发送回放设备标识号。基于回放设备标识号,服务器430可查找回放设备410的制造/型号、回放设备410的音频特性(诸如频率响应)、最大音量级别和最小音量级别,和/或室内测量配置文件435。可替代地,回放设备410可将回放设备的制造/型号和/或回放设备410的音频特性直接发送到服务器430。基于回放设备410的制造/型号、回放设备410的音频特性和/或室内测量配置文件435,服务器430可生成该特定回放设备410的回放设备配置文件460。
此外,回放设备410可发送关于与回放设备410相连的附件设备420的信息。附件设备420可以是耳机、头戴式受话器、集成扬声器、独立扬声器或者能够再现音频的任何其他设备。回放设备410可通过用户输入来识别附件设备420,或者通过检测附件设备420的制造/型号来自动识别附件设备420。附件设备420的用户输入可包括对附件设备420的特定制造/型号的用户选择,或者对附件设备的一般类别(诸如入耳式耳机、包耳式耳机、耳塞、贴耳式耳机、内建扬声器或者外部扬声器)的用户选择。回放设备410然后可向服务器430发送附件设备标识号。基于附件设备标识号,服务器430可查找附件设备420的制造/型号、附件设备420的音频特性,诸如频率响应、谐波失真、最大音量级别和最小音量级别,和/或室内测量配置文件435。可替代地,回放设备410可将附件设备420的制造/型号和/或附件设备420的音频特性直接发送到服务器430。基于附件设备420的制造/型号、附件设备420的音频特性和/或室内测量配置文件435,服务器430可生成该特定附件设备420的附件设备配置文件470。
可利用用户的回放设备410和与回放设备410相连的附件设备420来执行收听者听觉测试。收听者听觉测试可确定用户的听觉特性,诸如最小响度阈值、最大响度阈值、相等响度曲线和HRTF,并且虚拟化系统可在呈现耳机输出时使用用户的听觉特性。此外,收听者听觉测试可确定用户的均衡偏好,诸如低音、中音和高音频率的优选音量。可由回放设备410通过附件设备420播放一系列音调来执行收听者听觉测试。可以以各种频率和响度级别来播放这一系列音调。用户然后可向回放设备410输入其是否能够听到这些音调,以及用户听到的音调的最小响度级别。基于用户的输入,可针对用于测试的特定回放设备410和附件设备420确定用户的听觉特性。回放设备410可将收听者听觉测试的结果传输到服务器430。收听者听觉测试结果可包括用户的特定听觉特性,或者在收听者听觉测试其间生成的原始用户输入数据。此外,收听者听觉测试结果可包括对特定回放设备410的均衡偏好和在测试期间使用的输出扬声器。可基于收听者听觉测试结果来更新室内测量配置文件435、附件设备配置文件470和/或回放设备配置文件460。
在服务器430获得听觉测试结果、回放设备配置文件460和附件设备配置文件470之后,服务器430可生成收听者听觉配置文件450。可通过根据听觉测试结果移除回放设备410和附件设备420的音频特性来生成收听者听觉配置文件450。以这种方式,可生成独立于回放设备410和附件设备420的收听者听觉配置文件450。
在一些实施例中,虚拟化系统400的组件可驻留在云计算环境中的服务器430上。云计算环境可通过服务器430与任意注册回放设备之间的网络作为服务来递送计算资源。
一旦已经为用户生成收听者听觉配置文件450,服务器430可将收听者听觉配置文件450发送到在系统注册的回放设备410中的每一个。以这种方式,回放设备410中的每一个都可以存储与服务器430上的当前收听者听觉配置文件450同步的收听者配置文件780。这可以允许用户在用户的任意注册回放设备上体验丰富的个性化回放体验。不管用户的注册设备中的哪一个被用作回放设备410,回放设备410上包含的收听者配置文件480都可以为该设备上的收听者优化回放体验。
一旦用户请求来自系统的音频内容并且尝试内容的回放,正被用来回放内容的回放设备410可检查以确定用户是否具有有效的回放会话。有效的回放会话可以意味着用户登入系统并且系统知道用户的身份和正被使用的回放设备的类型。另外,这还可以意味着收听者配置文件480的副本可被包含在回放设备410上。如果不存在有效的会话,则回放设备410可与服务器430通信并且使用用户标识、回放设备标识和任何可用的附件设备信息向系统验证会话。
虚拟化系统400可基于收听者听觉配置文件450来改变回放设备配置文件460和附件设备配置文件470(如果有的话)。换言之,使用收听者听觉配置文件450作为用户希望如何听到音频内容的基准,系统可将任何相连附件设备的回放设备配置文件460和附件设备配置文件470配置为尽可能地接近以达到该基准。该信息可在音频内容的回放之前被从服务器430传输到回放设备410,并被存储在回放设备410处。
音频内容的回放然后可基于收听者听觉配置文件450、回放设备配置文件460和附件设备配置文件470在回放设备410上开始。以各种间隔,服务器430可针对任何状态变化(诸如当新耳机被连接时的附件设备变化)来查询回放设备410。可替代地,回放设备410可向虚拟化系统400通知状态变化已经发生。或者其可以是用户已经更新其偏好或者已经重新进行收听者听觉测试。每当这些变化之一发生时,系统的更新模块可向回放设备提供以下各项中的全部或者一些:1)更新的收听者配置文件;2)当前正被使用的回放设备的回放设备配置文件;以及3)正被与回放结合使用的任何附件的附件设备配置文件。
应当注意到,在未来需要配置文件的情况下可由虚拟化系统存储配置文件。即使回放设备不再被使用或者附件设备被与回放设备断开,配置文件也可被虚拟化系统的任何组件存储。在一些实施例中,虚拟化系统还可跟踪用户使用回放设备或附件设备的次数。这可以允许虚拟化系统基于先前的回放设备和附件设备使用来向用户提供定制推荐。
在一些实施例中,虚拟化系统可被通知哪些回放设备和附件设备正被使用。在一些示例中,虚拟化系统在没有用户输入的情况下可被通知哪些回放设备和附件设备正被使用。可能存在例如使用射频识别(RFID)和即插即用技术来实现通知的若干选项。因此,即使用户关于哪一个回放设备或者附件设备正被使用犯了错误,虚拟化系统也可以确定要使用的正确的回放设备配置文件和附件设备配置文件。
在一些实施例中,在不使用收听者听觉测试的情况下,收听者配置文件可被与用户相关联。这可以通过挖掘先前已经进行的收听者听觉测试的数据库并且使其与完成测试的用户的标识相关联来完成。基于系统对用户的所知,系统可从数据库中指派与用户的特性(诸如年龄、性别、身高、体重等)最紧密匹配的收听者配置文件。
虚拟化系统的实施例可允许诸如原始设备制造商(OEM)之类的实体改变回放设备的工厂设定。具体而言,OEM可以在工厂处执行对回放设备的音频特性的调谐。调节这些工厂设定的能力通常是有限的或是不存在的。使用虚拟化系统,OEM可以对回放设备配置文件做出改变以反映工厂设定的期望变化。该更新后的回放设备配置文件可被从服务器传输到回放设备并被永久地存储在其上。
如果多个注册用户正在使用单个回放设备和附件设备(诸如一起在房间中收听扬声器),虚拟化系统可确定多个用户的最佳回放设定。例如,系统可对多个用户的收听者配置文件进行平均化。
图5是示出示例虚拟化系统500的概览的框图。应当注意到图5是虚拟化系统500的实施例可被实现的许多方式中的一种。参考图5,示例虚拟化系统500可包括可被包含在云计算环境510内的远程服务器505。云计算环境510可以是将硬件和软件资源分布在各种设备当中的分布式环境。虚拟化系统500的若干组件可被分布在云计算环境510中并且与远程服务器505通信。在替代实施例中,以下组件中的至少一个或多个可被包含在远程服务器505上。
具体而言,虚拟化系统500可包括通过第一网络链路517与远程服务器505通信的注册模块515。注册模块515可辅助向虚拟化系统500注册用户、设备和其他信息(诸如回放环境)。更新模块520可通过第二通信链路522与远程服务器505通信。更新模块520可接收用户和设备状态的更新并且发送查询以确定用户和设备状态。如果更新模块520变得意识到状态或者状态变化,那么任何必需的配置文件都可以被更新。虚拟化系统500可包括通过第三通信链路527与远程服务器505通信的音频内容525。该音频内容525可被用户选择并被远程服务器505发送。
用户要在设备上进行的收听者听觉测试530可被存储在云计算环境510中并且可通过第四通信链路532与远程服务器505通信。在一些实施例中,收听者听觉测试530可以是多个不同测试。如在上面提到,用户可在设备上进行收听者听觉测试530,并且结果可被上传到远程服务器505,其中虚拟化系统500可生成收听者配置文件535。收听者配置文件535可以是设备无关的,意味着在不同回放设备上播放的相同音频内容可以听起来几乎相同。每一个注册用户的收听者配置文件535可被存储在云计算环境510中并且可通过第五通信链路537与远程服务器505通信。
基于特定注册用户的收听者配置文件535,虚拟化系统500可生成回放设备配置文件540,回放设备配置文件540可以基于用户正用来回放任何音频内容525的设备的类型。在一些实施例中,回放设备配置文件540可以是为多个不同回放设备存储的多个配置文件。回放设备配置文件540可通过第六通信链路542与远程服务器505通信。另外,虚拟化系统500可为用户正在使用的任何类型的附件设备生成附件设备配置文件545。在一些实施例中,附件设备配置文件545可以是为各种不同附件设备存储的多个配置文件。附件设备配置文件545可通过第七通信链路547与远程服务器505通信。
虚拟化系统500可包括可通过第八通信链路549与远程服务器505通信的室内测量配置文件548。应当注意到上面讨论的通信链路517、522、527、532、537、542、547和/或549中的一个或多个可以是共享的。
虚拟化系统500的实施例还可包括用于在回放环境555中回放音频内容525的回放设备550。回放环境555几乎可以是可以欣赏音频内容525的任何地方,诸如房间、汽车或建筑物。用户可在设备上进行收听者听觉测试530并且结果可被发送到远程服务器505以供虚拟化系统500处理。在虚拟化系统500的一些实施例中,用户可使用应用560来进行收听者听觉测试530。在图5中,应用560被示出在回放设备550上以易于描述虚拟化系统500,但是应当注意到上面进行收听者听觉测试530的设备可能不一定是与回放设备550相同的设备。虚拟化系统500可根据收听者听觉测试530的结果生成收听者配置文件535并且将收听者配置文件535传输到与用户相关联的所有注册设备。
向收听者565的音频内容525的回放可在回放环境555中发生。在图5中示出的示例性实施例中,在回放环境555中示出5.1扬声器配置。将会认识到可在回放环境中使用多种音频配置中的任何一种,包括耳机。如在图5中示出,5.1扬声器配置可包括中央扬声器570、右前扬声器575、左前扬声器580、右后扬声器585、左后扬声器590和重低音喇叭595。回放设备550可通过第八通信链路597与远程服务器505通信。
图6A和图6B是示出虚拟化系统500的实施例的操作的一般概览的框图。例如,第一回放设备600可被用来进行收听者听觉测试530。在一些实施例中,第一回放设备600可包含用于辅助进行收听者听觉测试530的应用560。一旦用户完成收听者听觉测试530,收听者听觉测试结果605就可被发送到远程服务器505。此外,第一回放设备600可向远程服务器505发送第一回放设备信息610、附件设备信息615(诸如与第一回放设备600相连的扬声器或耳机的类型)和用户标识。
第二回放设备625可被用来为收听者565回放音频内容525。再一次,尽管第一回放设备600和第二回放设备625被示出为分离的设备,但是在一些实施例中它们可以是同一设备。在回放之前,第二回放设备625可向远程服务器505发送诸如用户标识620、第二回放设备信息630、附件设备信息635和回放环境信息640之类的信息。远程服务器505上的虚拟化系统500可处理来自第二回放设备625的该信息并且将信息传输回第二回放设备625。传输回第二回放设备625的信息可以是配置文件信息,诸如收听者配置文件535、第二回放设备配置文件645、附件设备配置文件650和回放环境配置文件655。使用这些配置文件535、645、650或655中的一个或多个,第二回放设备625可向收听者565回放音频内容525。
第二回放设备625可以是具有网络连接性的多种不同类型的回放设备中的任何一个。通过示例而非限制,第二回放设备625可以是MP3设备660、电视机665、计算设备670、A/V接收器675,或者诸如智能电话680之类的嵌入式设备。使用虚拟化系统500的实施例,收听者565可以使用不同类型的回放设备、附件设备并且在各种回放环境中收听相同的音频内容并且具有基本上类似的音频体验。
图7是供在虚拟化系统中使用的示例方法的流程图。该方法可以通过使用户与唯一的收听者账户700相关联而开始。该信息可被存储在云计算环境510中。另外,用户的回放设备中的每一个可被向虚拟化系统500注册并被存储710在云计算环境510中。
如上所述,用户可在第一回放设备600上执行720收听者听觉测试530。另外,关于第一回放设备600和与第一回放设备600一起使用的任何附件设备的信息可被传输740到远程服务器505。使用该信息,虚拟化系统500的实施例可在远程服务器505上生成750用户的收听者配置文件535。
用户可选择760要在回放环境555中的第二回放设备625上回放的音频内容525。第二回放设备625可向远程服务器505传输770关于第二回放设备625的信息(诸如型号编号)、关于任何附件设备的信息(诸如品牌和/或类型)和关于回放环境555的信息(诸如室内特性和扬声器布置)。在一些实施例中,设备可以仅需要向虚拟化系统500注册一次并且在注册后可被给予设备标识。与虚拟化系统500的进一步交互可要求设备提供其设备标识。
远程服务器505然后可向第二回放设备625传输780收听者配置文件535、第二回放设备配置文件645、附件设备配置文件650和回放环境配置文件655。在一些实施例中,这些配置文件中的任何一个或者任何组合都可被传输。在一些实施例中,某些配置文件可能不适用,并且在其他实施例中,配置文件可被本地存储在第二回放设备625上。使用这些配置文件,用户可在第二回放设备625上播放790音频内容525。基于收听者配置文件535以及诸如第二回放设备配置文件645、附件设备配置文件650和回放环境配置文件655之类的其他配置文件,可针对用户收听偏好使音频内容525的回放个性化。
在这里示出的细节是通过示例方式并且仅是为了本发明的实施例的例示性讨论的目的,并且是在提供据信是本发明的原理和概念方面的最有用和容易理解的描述的情况下给出的。就这一点而言,不试图以比本发明的基本理解所必需者更多的细节示出本发明的细节,利用附图理解的描述使如何可在实践中实现本发明的若干形式对本领域技术人员是清楚的。
Claims (30)
1.一种供在音频设备中使用的方法,该方法包括:
由音频设备接收包含至少一个音频声道信号的数字音频内容;
将标识出音频设备的信息发送到服务器;
从服务器接收影响数字音频内容的再现的与音频设备相关联的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件和基于用户听觉能力的频谱响应曲线的收听者听觉配置文件;
基于接收的元数据来配置至少一个数字滤波器;
利用相对应的至少一个数字滤波器对所述至少一个音频声道进行滤波以产生滤波后的音频信号;以及
将滤波后的音频信号输出到耦接到音频设备的附件设备以再现数字音频内容。
2.如权利要求1所述的方法,其中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。
3.如权利要求1所述的方法,其中,与数字音频内容复用的元数据被接收。
4.如权利要求1所述的方法,其中,独立于数字音频内容在容器文件中接收元数据。
5.如权利要求1所述的方法,其中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。
6.如权利要求5所述的方法,其中,早期室内响应参数和后期混响参数将数字滤波器配置为产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。
7.如权利要求6所述的方法,其中,后期混响参数配置预定房间的后期混响的参数模型。
8.一种音频设备,包括:
接收器,被配置为
接收包含至少一个音频声道信号的数字音频内容;
将标识出音频设备的信息发送到服务器;
从服务器接收接收影响数字音频内容的再现的与音频设备相关联的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件和基于用户听觉能力的频谱响应曲线的收听者听觉配置文件;
处理器,被配置为基于接收的元数据来配置至少一个数字滤波器,其中该处理器被配置为利用相对应的至少一个数字滤波器对所述至少一个音频声道信号进行滤波以产生滤波后的音频信号;并且
其中,该处理器被配置为将滤波后的音频信号输出到耦接到音频设备的附件设备以再现数字音频内容。
9.如权利要求8所述的音频设备,其中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。
10.如权利要求8所述的音频设备,其中,与数字音频内容复用的元数据被接收。
11.如权利要求8所述的音频设备,其中,独立于数字音频内容在容器文件中接收元数据。
12.如权利要求8所述的音频设备,其中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。
13.如权利要求12所述的音频设备,其中,处理器利用早期室内响应参数和后期混响参数来配置数字滤波器以产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。
14.如权利要求13所述的音频设备,其中,处理器利用后期混响参数来配置预定房间的后期混响的参数模型。
15.一种用于音频虚拟化的方法,包括:
在服务器处接收用户收听测试的结果;
接收关于与用户相关联的至少一个回放设备及耦接到回放设备的至少一个附件设备的信息;
将所接收的测试结果和信息存储在与用户相关联的虚拟化配置文件中,该虚拟化配置文件包括用于基于对预定房间的声学测量的室内测量配置文件、基于用户听觉能力的频谱响应曲线的收听者听觉配置文件、基于回放设备的频率响应参数的回放设备配置文件和基于附件设备的频率响应参数的附件设备配置文件的多个参数;
接收来自与用户相关联的回放设备的对虚拟化配置文件的请求;以及
将所请求的虚拟化配置文件发送到回放设备。
16.如权利要求15所述的方法,其中,所述多个参数中的至少一个被与数字音频内容复用。
17.一种供在音频设备中使用的方法,该方法包括:
由音频设备接收包含至少一个音频声道信号的数字音频内容;
将标识出音频设备的信息发送到服务器;
从服务器接收影响数字音频内容的再现的与音频设备相关联的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件;
基于接收的元数据来配置至少一个数字滤波器;
利用相对应的至少一个数字滤波器对所述至少一个音频声道进行滤波以产生滤波后的音频信号;以及
将滤波后的音频信号输出到耦接到音频设备的附件设备以再现数字音频内容。
18.如权利要求17所述的方法,其中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。
19.如权利要求17所述的方法,其中,与数字音频内容复用的元数据被接收。
20.如权利要求17所述的方法,其中,独立于数字音频内容在容器文件中接收元数据。
21.如权利要求17所述的方法,其中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。
22.如权利要求21所述的方法,其中,早期室内响应参数和后期混响参数将数字滤波器配置为产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。
23.如权利要求22所述的方法,其中,后期混响参数配置预定房间的后期混响的参数模型。
24.一种音频设备,包括:
接收器,被配置为
接收包含至少一个音频声道信号的数字音频内容;以及
将标识出音频设备的信息发送到服务器;
从服务器接收影响数字音频内容的再现的与音频设备相关联的元数据,其中该元数据包括基于对预定房间的声学测量的室内测量配置文件;
处理器,被配置为基于接收的元数据来配置至少一个数字滤波器,其中该处理器被配置为利用相对应的至少一个数字滤波器对所述至少一个音频声道信号进行滤波以产生滤波后的音频信号;并且
其中,该处理器被配置为将滤波后的音频信号输出到耦接到音频设备的附件设备以再现数字音频内容。
25.如权利要求24的音频设备,其中,元数据还包括基于回放设备的频率响应参数的回放设备配置文件,以及基于附件设备的频率响应参数的附件设备配置文件。
26.如权利要求24所述的音频设备,其中,与数字音频内容复用的元数据被接收。
27.如权利要求24所述的音频设备,其中,独立于数字音频内容在容器文件中接收元数据。
28.如权利要求24所述的音频设备,其中,室内测量配置文件包括至少一组头部相关传递函数(HRTF)滤波器系数、早期室内响应参数和后期混响参数。
29.如权利要求28所述的音频设备,其中,处理器利用早期室内响应参数和后期混响参数来配置数字滤波器以产生具有与预定房间的声学属性基本上类似的声学属性的滤波后的音频信号。
30.如权利要求29所述的音频设备,其中,处理器利用后期混响参数来配置预定房间的后期混响的参数模型。
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201261731958P | 2012-11-30 | 2012-11-30 | |
| US61/731,958 | 2012-11-30 | ||
| US201361749746P | 2013-01-07 | 2013-01-07 | |
| US61/749,746 | 2013-01-07 | ||
| PCT/US2013/072108 WO2014085510A1 (en) | 2012-11-30 | 2013-11-26 | Method and apparatus for personalized audio virtualization |
| US14/091,112 | 2013-11-26 | ||
| US14/091,112 US9426599B2 (en) | 2012-11-30 | 2013-11-26 | Method and apparatus for personalized audio virtualization |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1214711A1 HK1214711A1 (zh) | 2016-07-29 |
| HK1214711B true HK1214711B (zh) | 2018-06-22 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10070245B2 (en) | Method and apparatus for personalized audio virtualization | |
| CN107251009B (zh) | 用于可变采样速率的数字音频滤波器 | |
| US11075609B2 (en) | Transforming audio content for subjective fidelity | |
| US9055382B2 (en) | Calibration of headphones to improve accuracy of recorded audio content | |
| JP7481116B2 (ja) | ユーザ固有音声情報及びハードウェア固有音声情報に基づくカスタマイズされた音声処理 | |
| US10560792B2 (en) | Reproducing audio signals with a haptic apparatus on acoustic headphones and their calibration and measurement | |
| JP2017194703A (ja) | 可搬型メディア再生装置に関するオーディオ・システム等化処理 | |
| CN106664497A (zh) | 音频再现系统和方法 | |
| US20150156588A1 (en) | Audio Output Device Specific Audio Processing | |
| JP2022516429A (ja) | 音響再生/シミュレーションシステムおよび音響再生をシミュレーションするための方法 | |
| US12395804B1 (en) | System and method for an audio reproduction device | |
| HK1214711B (zh) | 用於个性化音频虚拟化的方法和装置 | |
| CN115474130A (zh) | 音频处理方法及相关设备 | |
| HK1240666A1 (zh) | 用於可变采样速率的数字音频滤波器 | |
| HK1240666B (zh) | 用於可变采样速率的数字音频滤波器 |