CN106104686A

CN106104686A - 麦克风及相应的数字接口

Info

Publication number: CN106104686A
Application number: CN201480072463.7A
Authority: CN
Inventors: 戴伟文; R·A·鲍勃; D·南迪; 李杨; S·乌图布; C·E·弗斯特; H·汤姆森; T·卡西尔
Original assignee: Knowles Electronics LLC
Current assignee: Knowles Electronics LLC
Priority date: 2013-11-08
Filing date: 2014-11-06
Publication date: 2016-11-09
Anticipated expiration: 2034-11-06
Also published as: WO2015069878A1; CN106104686B; DE112014005087B4; KR20160083904A; DE112014005087T5

Abstract

从声音换能器接收模拟信号。所述模拟信号被转换成数字化数据。关于是否在所述数字化信号内存在话音活动的确定被做出。在检测到话音活动时，向处理装置发送话音活动的指示。所述指示跨越标准接口被发送，并且所述标准接口被配置为兼容与来自潜在不同的制造商的多个装置连接。

Description

麦克风及相应的数字接口

相关申请的交叉引用

本专利根据35U.S.C.§119(e)要求2013年11月8日提交的标题为“Microphone andCorresponding Digital Interface”的美国临时申请No.61/901,832的权益，通过引用将其内容整体地并入本文。本专利是2014年5月20日提交的标题为“VAD DetectionMicrophone and Method of Operating the Same”的美国申请No.14/282,101的继续部分，该申请要求2013年5月23日提交的标题为“VAD Detection Microphone and Method ofOperating the Same”的美国临时申请No.61/826,587的优先权，通过引用将两者的内容整体地并入。

技术领域

本申请涉及声学活动检测(AAD)方法和话音活动检测(VAD)方法及其与其它类型的电子装置的接口对接。

背景技术

话音活动检测(VAD)方法是语音识别软件和硬件的重要组件。例如，识别软件通常利用MIPS密集算法不断地扫描麦克风的音频信号，从而搜寻话音活动。因为算法在不断地运行，所以此话音检测方法中使用的功率是显著的。

麦克风也被布置在诸如蜂窝电话的移动装置产品中。这些消费者装置具有标准化接口。如果麦克风不与这个接口兼容，则不能够与移动装置产品一起使用它。

许多移动装置产品具有与移动装置包括在一起的语音识别。然而，算法的功率使用对电池而言太费力，以致该特征常常仅在用户按下按钮或者唤醒装置之后被启用。为了始终使得能实现此特征，总体解决方案的功耗必须足够小以对装置的总电池寿命具有最小影响。如所提及的，现有装置尚未发生这个。

因为以上提及的问题，已经发生一些用户对先前方法的不满。

附图说明

为了更完全地理解本公开，应该参照以下详细描述和附图，其中：

图1A包括根据本发明的各种实施方式的具有声学活动检测(AAD)的声学系统的框图；

图1B包括根据本发明的各种实施方式的具有声学活动检测(AAD)的另一声学系统的框图；

图2包括示出了根据本发明的各种实施方式的图1的系统的操作的一个方面的定时图；

图3包括示出了根据本发明的各种实施方式的图1的系统的操作的另一方面的定时图；

图4包括示出了根据本发明的各种实施方式的图1的系统的操作的状态的状态转换图；

图5包括示出了根据本发明的各种实施方式的图4的状态图所示的状态之间的转换的条件的表；

图6包括根据本发明的各种实施方式的多麦克风布置的框图；

图7包括根据本发明的各种实施方式的时钟检测器的一个示例的框图。

技术人员应当了解，图中的元件是为了简单和清楚而例示的。还应当了解，可以按照发生的特定顺序描述或者描绘特定动作和/或步骤，同时本领域技术人员应当理解，实际上不需要针对顺序的这种规定。还应当理解，除了在已经另外在本文中阐述了特定含义的情况下，本文所使用的术语和表达具有如相对于它们对应的相应询问和研究领域符合这些术语和表达的普通含义。

具体实施方式

在本文中描述了将话音活动检测(VAD)或声学活动检测(AAD)方法集成到麦克风中的方法。麦克风组件中的至少一些(例如，VAD或AAD模块)被布置在专用电路(ASIC)或其它集成装置处或上。诸如VAD或AAD模块的组件的集成显著地减小系统的功率要求，从而增加用户对系统的满意度。接口也被设置在麦克风与其中布置有麦克风的电子装置(例如，蜂窝电话或个人计算机)中的电路之间。该接口被标准化，使得其配置允许将麦克风放置在大多数(如果不是所有)电子装置(例如，蜂窝电话)中。麦克风在包括仍然检测诸如话音信号的声学事件的低功率模式的多种操作模式下操作。

在许多这些实施方式中，在麦克风处从声音换能器接收模拟信号。模拟信号被转换成数字化数据。关于是否在该数字化信号内存在话音活动的确定被做出。在检测到话音活动时，向处理装置发送话音活动的指示。该指示跨越标准接口被发送，并且该标准接口被配置为兼容与来自潜在不同的制造商的多个装置连接。

在其它方面中，麦克风在多种操作模式下操作，使得麦克风基于是否正从处理装置接收外部时钟或者电力是否正被提供给麦克风中的一个或更多个选择性地在第一麦克风感测模式和第二麦克风感测模式下操作并且在第一麦克风感测模式与第二麦克风感测模式之间移动。在第一麦克风感测模式内，麦克风利用内部时钟，从声音换能器接收第一模拟信号，将第一模拟信号转换成第一数字化数据，确定是否在该第一数字化信号内存在话音活动，并且在检测到话音活动时，向处理装置发送话音活动的指示并且随后从使用内部时钟切换并接收外部时钟。在第二麦克风感测模式内，麦克风从声音换能器接收第二模拟信号，将第二模拟信号转换成第二数字化数据，确定是否在该第二数字化信号内存在话音活动，并且在检测到话音活动时，向处理装置发送话音活动的指示，并且使用由处理装置供应的外部时钟。

在一些示例中，指示包括数字化信号或指示已经检测到话音活动的信号。在其它示例中，换能器包括微机电系统(MEMS)装置、压电装置或扬声器中的一个。

在一些方面中，在集成电路处执行接收、转换、确定和发送。在其它方面中，集成电路被布置在蜂窝电话、智能电话、个人计算机、可穿戴电子装置或平板电脑中的一个处。在一些示例中，当在单个操作模式下操作时执行接收、转换、确定和发送。

在一些示例中，单一模式是省电模式。在其它示例中，数字化数据包括PDM数据或PCM数据。在一些其它示例中，指示包括时钟信号。在其它的示例中，指示包括一个或更多个DC电压电平。

在一些示例中，继发送指示之后，在麦克风处接收时钟信号。在一些方面中，时钟信号被利用来使麦克风与外部处理器之间的数据移动同步。在其它示例中，所接收到的时钟的第一频率与布置在麦克风处的内部时钟的第二频率相同。在其它的示例中，所接收到的时钟的第一频率与布置在麦克风处的内部时钟的第二频率不同。

在一些示例中，在接收到时钟之前，麦克风处于第一操作模式下，并且接收时钟能有效使麦克风进入第二操作模式。在其它示例中，标准接口与PDM协议、I²S协议或I²C协议的任何组合兼容。

在其它这些实施方式中，设备包括模拟至数字转换电路，该模拟至数字转换电路被配置为从声音换能器接收模拟信号并且将这些模拟信号转换成数字化数据。该设备还包括标准接口和处理装置。处理装置连接至模拟至数字转换电路和标准接口。处理装置被配置为确定是否在数字化信号内存在话音活动并且在检测到话音活动时，向外部处理装置发送话音活动的指示。该指示跨越标准接口被发送，并且该标准接口被配置为兼容与来自潜在不同的制造商的多个装置连接。

在许多这些实施方式中，第一模拟信号是从第一麦克风接收的，第一模拟信号被转换成第一数字数据并且使用第一外部时钟将该第一数字数据存储在第一缓冲器中。第二模拟信号是根据第二内部时钟从第二麦克风接收的，第二模拟信号被转换成第二数字数据并且该第二数字数据被存储在第二缓冲器中。第一缓冲器中的第一数字数据未必与第二缓冲器中的第二数字数据实时地同步。关于是否已经在第一声学活动检测(AAD)模块处发生话音活动的确定是基于第一数字数据做出的。当话音活动被确定时，话音活动检测信号被发送到外部处理器，并且该外部处理器在接收到该话音活动检测信号时响应地提供外部时钟信号。来自第一缓冲器的第一数字数据以及来自第二缓冲器的第二数字数据使用外部时钟来抽取以提供抽取的输出数据，并且经抽取的输出数据具有实时地对准的第一数字数据和第二数字数据。

在其它方面中，在第一麦克风和第二麦克风处接收外部时钟，并且第一麦克风和第二麦克风的操作与外部时钟同步。在一些其它方面中，继对第一数字数据和第二数字数据进行抽取之后，利用来自第一麦克风和第二麦克风的经抽取的输出数据来执行双通道话音信号增强。

在一些示例中，将第一模拟信号转换成第一数字信号的步骤包括将第一模拟信号转换成PDM数据，然后再转换为PCM数据。在其它示例中，第二麦克风而非第一麦克风被保持在低功率或睡眠模式下，直到由外部处理器施加了外部时钟为止。

在一些方面中，外部处理器包括抽取器(decimator)并且该抽取器被配置为使用同一时钟以及同一样本同步信号或字探测(WS)来对两个或更多个通道进行抽取。在一些其它示例中，第一麦克风、第二麦克风以及多个另外的麦克风经由公共时钟线和多条串行PDM数据线连接至外部处理器。

在一些方面中，第一麦克风包括第一缓冲器并且第一麦克风在第一AAD模块和第一缓冲器作用的情况下被保持在感测模式下。在其它方面中，第二麦克风以及任何另外的麦克风而非第一麦克风被保持在低功率或睡眠模式下，直到由外部处理器施加了外部时钟为止。在其它示例中，继对来自第一麦克风、第二麦克风以及多个另外的麦克风的数字数据进行抽取之后，利用来自第一麦克风、第二麦克风和第三麦克风的经抽取的输出数据来执行多通道话音信号增强。

在其它这些实施方式中，设备包括：外部处理器；第一缓冲器，该第一缓冲器连接至外部处理器；第二缓冲器，该第二缓冲器连接至外部处理器；以及第一模拟至数字转换器，该第一模拟至数字转换器连接至第一缓冲器。第一模拟至数字转换器被配置为从第一麦克风接收第一模拟信号，将第一模拟信号转换成第一数字数据并且将该第一数字数据存储在第一缓冲器中。该设备还包括连接至第一模拟至数字转换器的第一声学活动检测(AAD)模块。该第一声学活动检测模块被配置为基于第一数字数据来确定是否已经发生话音活动，并且在话音活动被确定时，向外部处理器发送话音活动检测信号。外部处理器在接收到话音活动检测信号时响应地提供外部时钟信号。该设备还包括连接至第二缓冲器的第二模拟至数字转换器。该第二模拟至数字转换器被配置为根据外部时钟从第二麦克风接收第二模拟信号，将第二模拟信号转换成第二数字数据并且将该第二数字数据存储在第二缓冲器中。第一缓冲器中的第一数字数据未必与第二缓冲器中的第二数字数据实时地同步。第一缓冲器、第一模拟至数字转换器以及第一声学活动检测模块被布置在第一麦克风处，并且其中，第二缓冲器和第二模拟至数字转换器被布置在第二麦克风处。外部处理器被配置为使用外部时钟来对来自第一缓冲器的第一数字数据以及来自第二缓冲器的第二数字数据进行抽取以提供抽取的输出数据。经抽取的输出数据具有实时地对准的第一数字数据和第二数字数据。

在一些示例中，在第一麦克风和第二麦克风处接收外部时钟，并且第一麦克风和第二麦克风的操作与外部时钟同步。在其它示例中，继对第一数字数据和第二数字数据进行抽取之后，利用来自第一麦克风和第二麦克风的经抽取的输出数据来执行双通道话音信号增强。

在一些示例中，第一模拟信号被转换成PDM数据，然后再转换为PCM数据。在其它示例中，第二麦克风而非第一麦克风被保持在低功率睡眠模式下，直到由外部处理器施加了外部时钟为止。

在其它示例中，外部处理器包括抽取器并且该抽取器被配置为使用同一时钟以及同一样本同步信号或字探测(WS)来对两个或更多个通道进行抽取。

在其它方面中，第一麦克风、第二麦克风以及多个另外的麦克风经由公共时钟线和多条串行PDM数据线连接至外部处理器。在其它示例中，第一麦克风在第一AAD模块和第一缓冲器作用的情况下被保持在感测模式下。在其它的示例中，第二麦克风以及任何另外的麦克风而非第一麦克风被保持在低功率睡眠模式下，直到由外部处理器施加了外部时钟为止。在其它方面中，继对来自第一麦克风、第二麦克风以及多个另外的麦克风的数字数据进行抽取之后，利用来自第一麦克风、第二麦克风和第三麦克风的经抽取的输出数据来执行多通道话音信号增强。

在许多这些实施方式中，接收具有第一频率的外部时钟信号。针对分频比的自动确定是至少部分地基于内部时钟的第二频率而做出的，该第二频率大于第一频率。抽取因子是至少部分地基于外部时钟信号的第一频率、内部时钟信号的第二频率以及预定期望的采样频率而自动地确定的。分频比被应用于内部时钟信号以将第一频率减小至减小的第三频率。抽取因子被应用于经减小的第三频率以提供预定期望的采样频率。数据使用预定期望的采样频率被记录到缓冲器。

在其它方面中，随后移除外部时钟信号。在其它示例中，预定期望的采样频率包括大约16kHz的频率。

在其它这些实施方式中，设备包括具有输入端和输出端的接口电路，并且所述输入端被配置为接收具有第一频率的外部时钟信号。该设备还包括处理电路，并且该处理电路连接至接口电路并且被配置为至少部分地基于内部时钟的第二频率自动地确定分频比，该第二频率大于第一频率。处理电路还被配置为至少部分地基于外部时钟信号的第一频率、内部时钟信号的第二频率以及预定期望的采样频率自动地确定抽取因子。处理电路还被配置为对内部时钟信号应用分频比以将第一频率减小至减小的第三频率并且对经减小的第三频率应用抽取因子以提供预定期望的采样频率。处理电路还被配置为使用预定期望的采样频率来经由所述输出端将数据记录到缓冲器。

现在参照图1A，麦克风设备100包括电荷泵101、电容性微机电系统(MEMS)传感器102、时钟检测器104、Σ-Δ调制器106、声学活动检测(AAD)模块108、缓冲器110和控制模块112。应当了解，这些元件可以作为硬件和编程软件的各种组合被实现并且这些组件中的至少一些能够被布置在ASIC上。

电荷泵101提供用于对电容性MEMS传感器102的膜片进行充电和偏置的电压。针对一些应用(例如，当将压电装置用作传感器时)，电荷泵可以用可以在麦克风外部的电源代替。话音或其它声学信号移动膜片，电容性MEMS传感器102的电容改变，并且产生成为电信号的电压。在一个方面中，电荷泵101和MEMS传感器102未被布置在ASIC上(但是在其它方面中，它们可以被布置在ASIC上)。应当了解，MEMS传感器102可以另选地为压电传感器、扬声器或任何其它类型的感测装置或布置。

时钟检测器104控制哪一个时钟转向Σ-Δ调制器106并且使ASIC的数字段同步。如果存在外部时钟，则时钟检测器104使用该时钟；如果不存在外部时钟，则时钟检测器104将内部振荡器103用于数据定时/计时目的。

Σ-Δ调制器106将模拟信号转换成数字信号。在一个方面中，Σ-Δ调制器106的输出是一比特串行流。另选地，Σ-Δ调制器106可以是任何类型的模拟至数字转换器。

缓冲器110存储数据并构成过去的数据的运行存储部。到检测到声学活动时，这个过去的附加数据被存储在缓冲器110中。换句话说，缓冲器110存储过去的音频活动的历史。当音频事件发生(例如，检测到触发字)时，控制模块112指示缓冲器110从缓冲器110中假脱机输出数据。在一个示例中，缓冲器110存储在活动检测之前生成的先前大约180ms的数据。一旦已经检测到活动，麦克风100就将经缓冲的数据发送到主机(例如，诸如蜂窝电话的消费者装置中的电子电路)。

声学活动检测(AAD)模块108检测声学活动。各种方法能够被用来检测如触发字、触发短语、特定噪声或声音等的发生这样的事件。在一个方面中，模块108监视传入声学信号从而寻找类似话音的标记(或者监视其它适当的特性或阈值)。在检测到满足触发要求的声学活动时，麦克风100发送脉冲密度调制(PDM)流以唤醒系统链的其余部分来完成全话音识别过程。还能够使用其它类型的数据。

控制模块112控制何时从缓冲器发送数据。如在本文中别处所讨论的，当活动已经由AAD模块108检测到时，然后数据通过包括VDD引脚120、时钟引脚122、选择(SELECT)引脚124、数据(DATA)引脚126和接地(GND)引脚128的接口119时钟输出。引脚120-128形成可在操作中利用各种类型的电子电路(例如，在蜂窝电话中使用的那些类型的电路)识别并兼容的接口119。在一个方面中，麦克风100使用接口119来与蜂窝电话内部的电路进行通信。因为接口119被标准化为在蜂窝电话之间，所以能够将麦克风100放置或者布置在利用标准接口的任何电话中。接口119无缝地连接至蜂窝电话中的兼容电路。其它接口在其它引脚输出的情况下是可能的。不同的引脚也能够被用于中断。

在操作中，麦克风100在各种不同的模式以及涵盖这些模式的数个状态下操作。例如，当时钟信号(具有落入预定范围内的频率)被供应给麦克风100时，麦克风100在标准操作模式下操作。如果频率不在该范围内，则麦克风100在感测模式内操作。在感测模式下，麦克风100的内部振荡器103正被使用，并且在检测到声学事件时，数据传输与上升时钟边缘对准，其中时钟是内部时钟。

现在参照图1B，对麦克风100的另一示例进行描述。这个示例包括与图1A所示的那些元件相同的元件，并且这些元件使用与图1A所示的那些标记相同的标记进行编号。

另外，图1B的麦克风100包括低通滤波器140、基准142、抽取/压缩模块144、解压缩PDM模块146和前置放大器148。

低通滤波器140的功能从电荷泵移除较高频率。基准142的功能是由系统内的组件用作方便基准值的电压或其它基准。抽取/压缩模块144的功能是使缓冲器大小最小化、取数据或者对它进行压缩并然后存储它。解压缩PDM模块146的功能是为控制模块拉开数据。前置放大器148的功能是将传感器输出信号带到可用电压电平。

图1A和图1B中由标记100标识的组件可以被布置在单个专用集成电路(ASIC)或其它集成装置上。然而，电荷泵101在图1A中未被布置在ASIC 160上，但是在图1B的系统中位于ASIC上。在特定实施方式中，可以或者可能不将这些元件布置在ASIC上。应当了解，ASIC可以具有诸如信号处理功能的其它功能。

现在参照图2、图3、图4和图5，麦克风(例如，图1的麦克风100)在标准执行模式和感测模式下操作，并且这些由时钟频率确定。在标准执行模式下，麦克风作为它时钟输出如接收到的数据的标准麦克风。使麦克风在标准模式下操作所需要的频率范围可以在用于所讨论部分的数据手册中定义或指定或者由麦克风的制造商以其它方式供应。

在感测模式下，麦克风的输出端为三态并且内部时钟被应用于感测电路。一旦AAD模块触发(例如，发送指示已经发生声学事件的触发信号)，麦克风就在与内部时钟(例如，512kHz时钟)同步的麦克风数据引脚(例如，数据引脚126)上发送缓冲的PDM数据。这个内部时钟将在这种模式期间被作为输出供应给选择引脚(例如，选择引脚124)。在这种模式下，数据将在内部生成的时钟的上升边缘上有效(在选择引脚上输出)。这个操作确保与现有I2S兼容硬件块的兼容性。时钟引脚(例如，时钟引脚122)和数据引脚(例如，数据引脚126)将在不再检测到活动之后的设定时间停止输出数据。用于这种模式的频率在用于所讨论部分的数据手册中定义。在其它示例中，接口与PDM协议或I²C协议兼容。其它示例是可能的。

在图2中示出了以上所描述的麦克风的操作。选择引脚(例如，选择引脚124)是顶部线，数据引脚(例如，数据引脚126)是从顶部起的第二条线，并且时钟引脚(例如，时钟引脚122)是图上的底部线。可以看到一旦检测到声学活动，就在内部时钟的上升边缘上发送数据。如所提及的，这个操作确保与现有I²S兼容硬件块的兼容性。

对于在感测模式下与DMIC兼容接口的兼容性，能够驱动时钟引脚(例如，时钟引脚122)以时钟输出麦克风数据。时钟必须满足针对频率(例如，512kHz)的感测模式要求。在一个示例中，当在时钟引脚(例如，时钟引脚122)上检测到外部时钟信号时，在数据引脚(例如，数据引脚126)上驱动的数据在两个周期内与外部时钟同步。其它示例是可能的。在这种模式下，外部时钟在对于麦克风来说不再检测到活动时被移除以返回到最低功率模式。在这种模式下的活动检测可以使用选择引脚(例如，选择引脚124)来确定是否不再感测到活动。还可以使用其它引脚。

在图3中示出了这个操作。选择引脚(例如，选择引脚124)是顶部线，数据引脚(例如，数据引脚126)是从顶部起的第二条线，并且时钟引脚(例如，时钟引脚122)是图上的底部线。在一个示例中，可以看到一旦检测到声学活动，在数据引脚(例如，数据引脚126)上驱动的数据就在两个周期内与外部时钟同步。其它示例是可能的。数据在外部时钟的下降边缘上同步。也能够使用其它时钟边缘来使数据同步。此外，外部时钟在对于麦克风来说不再检测到活动时被移除以返回到最低功率模式。

现在参照图4和图5，对状态转换图400(图4)和转换条件表500(图5)进行描述。图4中列举的各种转换在图5的表中列举的条件下发生。例如，当Vdd被施加并且没有时钟存在于时钟输入引脚上时发生转换A1。应当理解，图5的表给出频率值(其是近似值)并且其它频率值是可能的。术语“OTP”意指一次性编程。

图4的状态转换图包括麦克风关(OFF)状态402、正常模式状态404、麦克风感测模式外部时钟状态406、麦克风感测模式内部时钟状态408以及带输出的感测模式状态410。

麦克风关状态402是麦克风400被去激活的情况。正常模式状态404是当正在施加外部时钟时(在外部时钟在预定范围内的情况下)的正常操作模式期间的状态。麦克风感测模式外部时钟状态406是当模式正切换至如图3所示的外部时钟时。麦克风感测模式内部时钟状态408是如图2所示的那样当不使用外部时钟时。带输出的感测模式状态410是当不在使用外部时钟时并且也如图2所示的那样在正在输出数据的情况下。

如所提及的，这些状态之间的转换基于事件并且由事件触发。举一个例子，如果麦克风正在正常操作状态404下(例如，以高于512kHz的时钟速率)操作并且控制模块检测到时钟引脚大约是512kHz，则控制转向麦克风感测模式外部时钟状态406。在外部时钟状态406下，当控制模块然后在时钟引脚上未检测到时钟时，控制转向麦克风感测模式内部时钟状态408。当在麦克风感测模式内部时钟状态408下并且检测到声学事件时，控制转向带输出的感测模式状态410。当在带输出的感测模式状态410下时，大于大约1MHz的时钟可以使控制返回到状态404。时钟可以小于1MHz(例如，与内部振荡器相同的频率)并且被用来使正从麦克风向外部处理器输出的数据同步。在OTP编程时间段内无声学活动另一方面使控制返回到状态406。

应当了解，图5所指定的其它事件将导致如图4的状态转换图所示的状态之间的转换。

现在参照图6，声学回路或系统600包括第一麦克风615、第二麦克风625和外部系统芯片(或装置)640。

第一麦克风615包括第一换能器元件601、第一电荷泵603、第一下转换器602、第一缓冲器(或随机存取存储器(RAM))604、第一上转换器606(具有输出端SD01)、第一ΣΔ转换器608、第一声学活动检测器610、第一控制器612、第一内部时钟613以及第一时钟检测模块614。这些元件包括第一麦克风615。第一麦克风615可以通过将作为输出端的SELECT引脚650连接至能够在此引脚上检测指示信号的系统芯片(或其它外部装置)640并且通过禁用针对低功率模式设计的内部时钟或外部时钟而被配置为感测麦克风。

第二麦克风625包括第二换能器元件621、第二电荷泵623、第二下转换器622、第二缓冲器(或随机存取存储器(RAM))624、第二上转换器626(具有输出端SD02)、第二ΣΔ转换器628、第二声学活动检测器630、第二控制器632、第二内部时钟633以及第二时钟检测模块634。这些元件包括第二麦克风625。第二麦克风625的SELECT线653可以连接至V_dd或连接至地。这条线被用来使用音频缓冲器和内部时钟633来按照低功率麦克风配置麦克风625，只要外部时钟被禁用即可。AAD电路630通过SELECT引脚653的配置来禁用。

两个内部时钟模块614和634被布置为或者在两个独立装置中并且在一个方面中不具有要同步的装置。第一换能器元件601和第二换能器元件621可以是MEMS传感器、压电传感器、扬声器或任何其它类型的感测装置。第一电荷泵603和第二电荷泵623提供用于对换能器元件601和621的膜片进行充电和偏置的电压。

第一ΣΔ调制器608被用来将第一换能器元件601的模拟输出转换为第一数字脉冲密度调制(PDM)信号。第二ΣΔ调制器628被用来将换能器元件621的模拟输出转换为第二数字脉冲密度调制(PDM)信号。

第一下转换器602被用来将第一PDM信号转换为第一脉冲编码调制(PCM)信号并且第二下转换器622被用来将第二PDM信号转换为第二PCM信号。转换基于各个麦克风615和625内的异步时钟。作为第一近似法，可以假定两个内部时钟以同一速率操作。另外地，在一些方面中，在内部时钟速率下的PDM信号的已知数量的比特每隔固定数量的时钟被转换为PCM样本。在其它方面中，转换使用不限制被转换的PDM比特的数量的装置来实现，但是每隔固定数量的时钟生成PCM样本。对于多通道音频数据，这通常通过字探测(WS)信号来同步。然而，不能够使PCM样本转换的起始时钟比特和结束时钟比特同步，因为这两个转换器不共享装置来定义公共起始时钟比特或WS。如本文所使用的，与两个PCM样本对应的两组数据比特在各个数据组的第一比特在时间上与同一时钟周期的同一时钟边缘对准时“同步”。

第一缓冲器604和第二缓冲器624分别存储从下转换器602和下转换器622接收到的数据。这些PCM音频样本是异步的并且具有由抽取速率D和内部时钟频率f_clk定义的时间差不确定性。

–D/(2×f_clk)<Δt<D/(2×f_clk)

来自第一下转换器602的PCM信号被提供给AAD电路610以用于检测声学活动。各种方法能够被用来检测诸如触发字、触发短语、特定噪声或特定声音的发生的活动。在检测到时，AAD模块610指示控制模块612经由SELECT线650向系统芯片640发送存在话音活动(例如，中断被发送)的通信。

如所提及的并且在一个示例中，SELECT线650可以被用来指示话音活动的检测。第一上转换器606然后可以被用来将音频缓冲器中的PCM信号转换为被以内部时钟速率f_clk时钟输出的PDM信号。

外部系统芯片(或其它装置)640可以包括立体声抽取器642、系统控制模块641和处理单元643。系统芯片640可以使用来自SELECT线650的指示信号来初始化到麦克风615和625的外部时钟651。在从系统芯片640接收到外部时钟651时，第一麦克风615中的控制块612以及第二麦克风625中的控制块632与由系统控制模块641提供的同一外部时钟f_{ext_clk}同步。

第一控制器612和第二控制器632指示缓冲器604和624使用第一上转换器606和第二上转换器626在适当的时间假脱机输出数据。第一上转换器606和第二上转换器626分别将来自缓冲器604和缓冲器624的PCM信号分别转换为PDM信号SD01和SD02。在一个方面中，存储在604和624中的PCM音频不同步。然而，上转换过程移除各个PCM信号样本上的信号样本时钟边界，并因此移除存储在两个缓冲器604和624中的PCM信号的隐式时间不确定性。

在电路600的操作的另一方面中，第一麦克风615被激活以接收声能。在由ΣΔ转换器608以及由下转换器602将信号从模拟信号转换为数字信号之后，数据被存储在缓冲器604中。在话音活动由第一AAD 610检测到之后，SELECT线650被用来指示此话音活动的检测。系统芯片640接收指示并且可以使用来自SELECT线650的这个指示信号来初始化到麦克风615和625的外部时钟651。时钟651被馈送给被激活来接收声能的第二麦克风625。时钟激活时钟检测模块634。时钟检测模块634的激活将控制器632、第二电荷泵623、ΣΔ调制器628和下转换器622激活，并且为第二缓冲器624计时。这使得第二麦克风625能够被激活并且向第二缓冲器624发送数据以被以PCM格式存储。而且，在这方面中，存储在604和624中的PCM音频不同步。

在这两个示例中，在同一物理串行数据线上对信号SD01和SD02进行复用，其中麦克风615使用上升边缘或下降边缘并且麦克风625使用下降边缘或上升边缘来为数据计时。在其它方面中，时钟信号651以及信号SD01和SD02可以在单独的线上。

来自第一缓冲器604和第二缓冲器624的合成输出通过606被再次上转换为PDM信号SD01并且通过626上转换为PDM信号SD02。上转换过程移除各个PCM信号样本上的信号样本时钟边界，并且因此移除存储在两个缓冲器604和624中的PCM信号的隐式时间不确定性。

系统芯片640接收PDM数据流并且能够将此数据记录到立体声抽取器642中。此抽取器642通过由系统控制模块641生成的时钟来操作并且将PDM数据解复用成两个流。此外，立体声抽取器642通过各个流的公共字探测信号来被操作并且生成在同一比特时钟边缘处开始和结束并因此被同步的两个PCM信号样本的流。

该两个同步流现在适合于双麦克风信号增强算法处理以减少背景噪声并且改进语音识别。针对双麦克风信号增强的进一步处理可以由处理单元643执行，后面是关键短语识别。

应当了解，可以在类似模式下操作具有类似结构和能力的超过两个麦克风，其中内部PCM数据可能由于不能具有公共字探测而被以隐式异步方式存储在各个麦克风的内部缓冲器中。通过提供外部时钟，PCM数据被上转换并且可以在多条PDM串行数据线上被提供给系统芯片640。在系统芯片640处的在同一时钟和字探测上操作的一组抽取器可以被用来对来自这些麦克风中的每一个麦克风的PDM数据进行抽取，并且获得多个通道的同步PDM数据以用于在处理单元中针对数字信号处理的语音和音频增强。

应当了解，可以在处理链中的任何识别阶段之前做出用于改进用于语音识别的语音质量的这种信号增强。可以在处理单元643中实现或者执行这些算法或方法两者。

在一个方面中，为了避免过度的功耗，还能够使用鲁棒识别算法在处理单元643中仅利用来自第一麦克风615的数据来检测关键触发短语。在这种方法中，第二麦克风625被保持未激活直到如关键触发短语被识别这样的时间为止。在识别出触发短语时，第二麦克风625像以上所描述的那样通过共享外部时钟651来激活。随后可以通过在处理单元643中激活这些算法来增强从两个或更多个麦克风接收到的音频。这将减小功耗，因为对多个麦克风数据的信号增强是仅在关键短语被识别之后实行的，并且在潜在有噪声的环境中需要通用自然语言理解。

应当了解，可以使用硬件和软件的各种组合来实现图6的各种元件。例如，可以使用在诸如微处理器这样的处理装置上执行的计算机指令来实现这些元件中的一些。

现在参照图7，计时模块700包括时钟检测块702、内部时钟704、可编程分频器706和抽取器708。外部时钟710连接至时钟检测块702。电荷泵714连接至麦克风713，该麦克风713连接至ΣΔ转换器712，该ΣΔ转换器712连接至抽取器708。抽取器708连接至缓冲器716。

应当了解，在一个示例中计时模块700可以是图1A或图1B的时钟检测器模块104。还应当理解，可以使用硬件和/或软件元件的任何组合来实现计时模块的元件。在一个示例中，可以使用在任何类型的处理装置(例如，微处理器)上实现的计算机指令来实现这些元件。

时钟检测块702接收外部时钟并且像在下面所描述的那样计算分频比720和抽取因子722。内部时钟704提供高频率信号，而外部时钟710提供较低频率信号。可编程分频器706减小内部时钟704的频率。抽取器708将1比特PDM数据转换为具有通过抽取因子确定的频率的PCM数据。抽取器708可以包括一个或更多个滤波器。

电荷泵714为麦克风713提供电压。麦克风713可以是MEMS传感器、压电传感器或任何其它类型的感测装置。ΣΔ转换器712将来自麦克风714的模拟信号转换成数字信号以用于由抽取器708使用。

在计时模块700的操作的一个示例中，内部时钟704提供12.288MHz内部时钟信号。时钟检测块702在一个方面中包含对内部时钟脉冲进行计数的计数器。当来自外部时钟710的信号被施加到时钟检测块702时，计数器将对在外部时钟脉冲内有多少内部时钟脉冲进行计数。内部时钟704必须是比外部时钟710更高的频率。在这个示例中，外部时钟710是512kHz时钟并且被施加到计时模块700的外部时钟引脚。

时钟检测块702现在对在一个外部时钟周期内有多少内部时钟脉冲进行计数。在这种情况下，12,288,000/512,000＝24个时钟。一旦确认了下分频比实际上为24，可编程分频器706被利用数24来编程。这时，内部时钟信号现在是512,000Hz。如通过可编程分频器706修改的这个内部时钟信号将为抽取器708计时。

基于所期望的输出数据速率(预定期望的采样频率)，并且举一个例子，需要16个比特的16kHz数据(然而，应当了解，这可能是任何其它频率和比特长度)来在缓冲器716处供给系统的下一级。

时钟检测块702取内部时钟信号和预定期望的采样频率来确定抽取器708的抽取因子(比)722。在一个示例中，需要16,000Hz样本速率，并且时钟检测块702将进行除法512,000/16,000以得到抽取因子32。

时钟检测块702利用32倍的抽取因子(比)722对抽取器708进行编程并且调整抽取器708内的滤波器来提供16kHz速率的数据。

在本文中描述了本发明的优选实施方式，包括用于执行本发明的为发明人所知的最佳模式。应当理解，所例示的实施方式仅是示例性的，而不应该被视为限制本发明的范围。

Claims

1.一种方法，该方法包括以下步骤：

在麦克风处：

从声音换能器接收模拟信号；

将所述模拟信号转换成数字化数据；

确定在所述数字化信号内是否存在话音活动；

在检测到话音活动时，向处理装置发送话音活动的指示，其中，所述指示跨越标准接口被发送，所述标准接口被配置为兼容与来自潜在不同的制造商的多个装置连接。

2.根据权利要求1所述的方法，其中，所述麦克风在多种操作模式下操作，使得所述麦克风基于是否正从处理装置接收外部时钟或者电力是否正被提供给所述麦克风中的一个或更多个而选择性地在第一麦克风感测模式和第二麦克风感测模式下操作并且在所述第一麦克风感测模式与所述第二麦克风感测模式之间移动；

其中，在所述第一麦克风感测模式内，所述麦克风利用内部时钟，从声音换能器接收第一模拟信号，将所述第一模拟信号转换成第一数字化数据，确定在所述第一数字化信号内是否存在话音活动，并且在检测到话音活动时，向所述处理装置发送话音活动的指示并且随后从使用所述内部时钟切换并接收外部时钟；

其中，在所述第二麦克风感测模式内，所述麦克风从声音换能器接收第二模拟信号，将所述第二模拟信号转换成第二数字化数据，确定在所述第二数字化信号内是否存在话音活动，并且在检测到话音活动时，向所述处理装置发送话音活动的指示，并且使用由所述处理装置提供的所述外部时钟。

3.根据权利要求1所述的方法，其中，所述指示包括数字化信号或指示已经检测到话音活动的信号。

4.根据权利要求1所述的方法，其中，所述换能器包括微机电系统MEMS装置、压电装置或扬声器中的一个。

5.根据权利要求1所述的方法，其中，在集成电路处执行所述接收、转换、确定和发送。

6.根据权利要求1所述的方法，其中，所述集成电路被布置在蜂窝电话、智能电话、个人计算机、可穿戴电子装置或平板电脑中的一个处。

7.根据权利要求1所述的方法，其中，所述接收、转换、确定和发送是当在操作的单个模式下操作时被执行的。

8.根据权利要求1所述的方法，其中，所述单个模式是省电模式。

9.根据权利要求1所述的方法，其中，所述数字化数据包括PDM数据或PCM数据。

10.根据权利要求1所述的方法，其中，所述指示包括时钟信号。

11.根据权利要求1所述的方法，其中，所述指示包括一个或更多个DC电压电平。

12.根据权利要求1所述的方法，其中，继发送所述指示之后，在所述麦克风处接收时钟信号。

13.根据权利要求12所述的方法，其中，所述时钟信号被利用来使所述麦克风与外部处理器之间的数据移动同步。

14.根据权利要求12所述的方法，其中，所接收到的时钟的第一频率与布置在所述麦克风处的内部时钟的第二频率相同。

15.根据权利要求12所述的方法，其中，所接收到的时钟的第一频率与布置在所述麦克风处的内部时钟的第二频率不同。

16.根据权利要求12所述的方法，其中，在接收时钟之前，所述麦克风处于第一操作模式下，并且接收所述时钟能够使得所述麦克风进入第二操作模式。

17.根据权利要求1所述的方法，其中，所述标准接口与PDM协议、I²S协议或I²C协议的任何组合兼容。

18.一种设备，该设备包括：

模拟至数字转换电路，该模拟至数字转换电路被配置为从声音换能器接收模拟信号并且将所述模拟信号转换成数字化数据；

标准接口；

处理装置，该处理装置连接至所述模拟至数字转换电路和所述标准接口，所述处理装置被配置为确定在所述数字化信号内是否存在话音活动并且在检测到话音活动时，向外部处理装置发送话音活动的指示，其中，所述指示跨越所述标准接口被发送，所述标准接口被配置为兼容与来自潜在不同的制造商的多个装置。

19.根据权利要求18所述的设备，其中，所述指示是数字化信号或指示已经检测到话音活动的信号。

20.根据权利要求18所述的设备，其中，所述换能器包括微机电系统MEMS装置、压电装置或扬声器。

21.根据权利要求18所述的设备，其中，所述设备包括集成电路。

22.根据权利要求18所述的设备，其中，所述集成电路被布置在蜂窝电话、智能电话、个人计算机、可穿戴电子装置或平板电脑处。

23.根据权利要求18所述的设备，其中，所述数字化数据包括PDM数据或PCM数据。

24.根据权利要求18所述的设备，其中，所述指示包括时钟信号。

25.根据权利要求18所述的设备，其中，所述指示包括一个或更多个DC电压电平。

26.根据权利要求18所述的设备，其中，继发送所述指示之后，在所述标准接口处接收时钟信号。

27.根据权利要求26所述的设备，其中，所述处理装置利用所述时钟信号来使所述麦克风与所述外部处理装置之间的数据移动同步。

28.根据权利要求26所述的设备，其中在接收时钟之前，所述设备处于第一操作模式下，并且接收所述时钟能够使得所述设备进入第二操作模式。

29.根据权利要求18所述的设备，其中，所述标准接口与PDM协议、I²S协议或I²C协议的任何组合兼容。

30.一种方法，该方法包括以下步骤：

使用第一内部时钟从第一麦克风接收第一模拟信号，将所述第一模拟信号转换成第一数字数据并且将所述第一数字数据存储在第一缓冲器中；

根据第二内部时钟从第二麦克风接收第二模拟信号，将所述第二模拟信号转换成第二数字数据并且将所述第二数字数据存储在第二缓冲器中；

其中，所述第一缓冲器中的所述第一数字数据未必与所述第二缓冲器中的所述第二数字数据实时地同步；

基于所述第一数字数据来确定是否已经在第一声学活动检测AAD模块处发生话音活动，并且在话音活动被确定时，向外部处理器发送话音活动检测信号，所述外部处理器在接收到所述话音活动检测信号时响应地提供外部时钟信号；

使用所述外部时钟来对来自所述第一缓冲器的所述第一数字数据以及来自所述第二缓冲器的所述第二数字数据进行抽取以提供抽取的输出数据，所述抽取的输出数据具有实时地对准的所述第一数字数据和所述第二数字数据。

31.根据权利要求30所述的方法，所述方法还包括：在所述第一麦克风和所述第二麦克风处接收所述外部时钟，并且使所述第一麦克风和所述第二麦克风的操作与所述外部时钟同步。

32.根据权利要求30所述的方法，所述方法还包括：继对所述第一数字数据和所述第二数字数据进行抽取之后，利用来自所述第一麦克风和所述第二麦克风的经抽取的输出数据来执行双通道话音信号增强。

33.根据权利要求30所述的方法，其中，将所述第一模拟信号转换成第一数字信号的步骤包括将所述第一模拟信号转换成PDM数据，然后再转换为PCM数据。

34.根据权利要求30所述的方法，其中，所述第二麦克风而非所述第一麦克风被保持在低功率或睡眠模式下，直到由所述外部处理器施加了外部时钟为止。

35.根据权利要求30所述的方法，其中，所述外部处理器包括抽取器并且所述抽取器被配置为使用同一时钟以及同一样本同步信号或字探测WS来对两个或更多个通道进行抽取。

36.根据权利要求30所述的方法，其中，所述第一麦克风、所述第二麦克风以及多个另外的麦克风经由公共时钟线和多条串行PDM数据线连接至所述外部处理器。

37.根据权利要求30所述的方法，其中，所述第一麦克风包括第一缓冲器并且所述第一麦克风在所述第一AAD模块和所述第一缓冲器作用的情况下被保持在感测模式下。

38.根据权利要求30所述的方法，其中，所述第二麦克风以及任何另外的麦克风而非所述第一麦克风被保持在低功率或睡眠模式下，直到由所述外部处理器施加了外部时钟为止。

39.根据权利要求30所述的方法，所述方法还包括：继对来自所述第一麦克风、所述第二麦克风以及多个另外的麦克风的所述数字数据进行抽取之后，利用来自所述第一麦克风、所述第二麦克风和第三麦克风的经抽取的输出数据来执行多通道话音信号增强。

40.一种设备，该设备包括：

外部处理器；

第一缓冲器，该第一缓冲器连接至所述外部处理器；

第二缓冲器，该第二缓冲器连接至所述外部处理器；

连接至所述第一缓冲器的第一模拟至数字转换器，该第一模拟至数字转换器被配置为从第一麦克风接收第一模拟信号，将所述第一模拟信号转换成第一数字数据并且将所述第一数字数据存储在第一缓冲器中；

连接至所述第一模拟至数字转换器的第一声学活动检测AAD模块，该第一声学活动检测模块被配置为基于所述第一数字数据来确定是否已经发生话音活动，并且在话音活动被确定时，向所述外部处理器发送话音活动检测信号，所述外部处理器在接收到所述话音活动检测信号时响应地提供外部时钟信号；

连接至所述第二缓冲器的第二模拟至数字转换器，该第二模拟至数字转换器被配置为根据所述外部时钟从第二麦克风接收第二模拟信号，将所述第二模拟信号转换成第二数字数据并且将所述第二数字数据存储在第二缓冲器中；

其中，所述第一缓冲器、所述第一模拟至数字转换器以及所述第一声学活动检测模块被布置在第一麦克风处，并且其中，所述第二缓冲器和所述第二模拟至数字转换器被布置在第二麦克风处；

其中，所述外部处理器被配置为使用所述外部时钟来对来自所述第一缓冲器的所述第一数字数据以及来自所述第二缓冲器的所述第二数字数据进行抽取以提供抽取的输出数据，所述抽取的输出数据具有实时地对准的所述第一数字数据和所述第二数字数据。

41.根据权利要求40所述的设备，其中，在所述第一麦克风和所述第二麦克风处接收所述外部时钟，并且所述第一麦克风和所述第二麦克风的操作与所述外部时钟同步。

42.根据权利要求40所述的设备，所述设备还包括：继对所述第一数字数据和所述第二数字数据进行抽取之后，利用来自所述第一麦克风和所述第二麦克风的经抽取的输出数据来执行双通道话音信号增强。

43.根据权利要求40所述的设备，其中，所述第一模拟信号被转换成PDM数据，然后再转换为PCM数据。

44.根据权利要求40所述的设备，其中，所述第二麦克风而非所述第一麦克风被保持在低功率睡眠模式下，直到由所述外部处理器施加了外部时钟为止。

45.根据权利要求40所述的设备，其中，所述外部处理器包括抽取器并且所述抽取器被配置为使用同一时钟以及同一样本同步信号或字探测WS来对两个或更多个通道进行抽取。

46.根据权利要求40所述的设备，其中，所述第一麦克风、所述第二麦克风以及多个另外的麦克风经由公共时钟线和多条串行PDM数据线连接至所述外部处理器。

47.根据权利要求40所述的设备，其中，所述第一麦克风在所述第一AAD模块和所述第一缓冲器作用的情况下被保持在感测模式下。

48.根据权利要求40所述的设备，其中，所述第二麦克风以及任何另外的麦克风而非所述第一麦克风被保持在低功率睡眠模式下，直到由所述外部处理器施加了外部时钟为止。

49.根据权利要求40所述的设备，所述设备还包括：继对来自所述第一麦克风、所述第二麦克风以及多个另外的麦克风的所述数字数据进行抽取之后，利用来自所述第一麦克风、所述第二麦克风和第三麦克风的经抽取的输出数据来执行多通道话音信号增强。

50.一种方法，该方法包括以下步骤：

接收具有第一频率的外部时钟信号；

至少部分地基于内部时钟的第二频率自动地确定分频比，所述第二频率大于所述第一频率；

至少部分地基于所述外部时钟信号的所述第一频率、所述内部时钟信号的所述第二频率以及预定期望的采样频率自动地确定抽取因子；

将所述分频比应用于所述内部时钟信号以将所述第一频率减小至减小的第三频率；

将所述抽取因子应用于所述减小的第三频率以提供所述预定期望的采样频率；

使用所述预定期望的采样频率来将数据记录到缓冲器。

51.根据权利要求50所述的方法，所述方法还包括随后移除所述外部时钟信号。

52.根据权利要求50所述的方法，其中，所述预定期望的采样频率包括大约16kHz的频率。

53.一种设备，该设备包括：

具有输入端和输出端的接口电路，所述输入端被配置为接收具有第一频率的外部时钟信号；

处理电路，该处理电路连接至所述接口电路并且被配置为至少部分地基于内部时钟的第二频率自动地确定分频比，所述第二频率大于所述第一频率，所述处理电路还被配置为至少部分地基于所述外部时钟信号的所述第一频率、所述内部时钟信号的所述第二频率以及预定期望的采样频率自动地确定抽取因子，所述处理电路还被配置为将所述分频比应用于所述内部时钟信号以将所述第一频率减小至减小的第三频率并且将所述抽取因子应用于所述减小的第三频率以提供所述预定期望的采样频率，所述处理电路还被配置为使用所述预定期望的采样频率经由所述输出端来将数据记录到缓冲器。

54.根据权利要求53所述的设备，其中，所述外部时钟信号被随后移除。

55.根据权利要求53所述的设备，其中，所述预定期望的采样频率包括大约16kHz的频率。