CN108810838A

CN108810838A - 基于智能手机室内背景声感知的房间级定位方法

Info

Publication number: CN108810838A
Application number: CN201810560130.9A
Authority: CN
Inventors: 王玫; 昂晨; 仇洪冰; 宋浠瑜; 罗丽燕
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2018-06-03
Filing date: 2018-06-03
Publication date: 2018-11-13

Abstract

本发明公开了一种基于智能手机室内背景声感知的房间级定位方法，包括室内房间背景声线下采集和训练，以及待定位地点背景声线上定位二个阶段。利用智能手机录取室内环境声，通过提取声音功率的第五百分位功率作为声学特征，导入RNN‑LSTM学习算法，训练得出特定室内背景声定位模型，通过与真实环境的房间信息比对可计算出房间的识别率，识别出房间即可实现房间级定位。相对传统同类声特征室内定位系统而言，本发明方法不仅达到房间级定位的要求，而且提高了房间识别率，更适用于室内背景声定位场景中。

Description

基于智能手机室内背景声感知的房间级定位方法

技术领域

本发明涉及室内房间级的定位方法，具体是一种基于智能手机室内背景声感知的房间级定位方法。

背景技术

GPS为代表的定位技术自从出现以来，以其高效、迅速、精确的特性使人们的生活方式发生剧变，同时带动了其服务与应用的蓬勃发展，给人们的生活带来了极大的便利。但是传统的室外定位技术(例如GPS)由于原理的局限性，在室内条件下的表现不尽理想，因此急需一种高效、便捷、准确的室内定位技术来填补空白。

当前较成熟的有基于Wifi、蓝牙、红外线、超声波等室内定位技术。基于WiFi的定位技术基础设备易于安装，但易受其它信号干扰、功耗较高；基于蓝牙的定位技术功耗低、易集成，但定位距离短，稳定性较差、易受噪声干扰；基于红外的定位技术精度高，但不能穿越障碍，同时造价高，功耗较大；基于超声波的室内定位技术整体精度高，结构简单，但存在多径效应、衰减明显、易受温度影响、成本高。

基于背景声定位的技术优点在于无需预布置其它基础设施且背景声极易被获取。事实上，背景声作为一种时间与空间分布特殊的声波传播形式，作用于人类听觉系统，会形成一定规律的听觉感知效应。同时，背景声也是一种信息载体，反映发声体的物理属性、外部激励力等众多环境因素的重要特性。此外，建筑声学领域提出:房间的持续声音和房间的冲击响应相结合形成了每一间房间的独特背景声。即使是人耳听觉相近的两个房间，由于房间结构所产生的持久化声音仍然能够较精确的区分两个不同的房间。因此利用背景声进行定位是可行的。

己有部分室内指纹定位系统，利用智能手机多传感优势，采集WiFi、声音、视觉图像、加速度计数据作为指纹，进行多信息的融合定位；少数文献则专门研究室内环境背景声定位的方法，如：通过背景声指纹提取和KNN算法进行背景声室内定位等。然而，受不同声学特征及不同声识别分类算法的影响，定位精度普遍较低。

发明内容

针对传统室内定位需要预部署基础设施的缺点，本发明提供一种基于智能手机室内背景声感知的房间级定位方法，仅需利用智能手机采集室内房间背景声，提取背景声音指纹并建立背景声模型；通过RNN-LSTM学习算法训练出一个适用于室内背景声场景下的定位模型，应用于室内房间级的定位。

本发明基于智能手机室内背景声感知的房间级定位方法，包括(1)室内房间背景声线下采集和训练，以及(2)待定位地点背景声线上定位二个阶段。

阶段(1)所述室内房间背景声线下采集与训练，具体方法包括如下步骤:

(1.1)采集室内房间背景声与特征提取：

利用智能手机线下采集足量的房间背景声数据，进行背景声特征提取，通过第五百分位功率提取出背景声指纹；

(1.2)构建背景声指纹库：

将背景声指纹与人工标注的房间标记信息共同构成房间背景声指纹库；

(1.3)训练过程：

构建了背景声指纹库之后，以此为训练集数据，通过RNN-LSTM深度学习算法训练出适用于背景声室内定位场景下的定位模型，此模型需有较高的泛化能力，能较好的反映整个样本空间的特征。

阶段(2)所述待定位地点背景声线上定位，具体方法包括如下步骤:

(2.1)获取待定位地点背景声测试集指纹数据：

录制室内待定位地点背景声，进行第五百分功率提取，得出的背景声指纹作为测试集数据；

(2.2)将测试集数据输入线下训练的背景声定位模型，输入后，输出为房间标记信息，通过与真实环境的房间信息比对可计算出房间的识别率，识别出房间即可实现房间级定位。

本发明通过第五百分位功率提取背景声指纹，利用RNN-LSTM算法建立室内背景声定位模型，使得房间识别率有较大幅度的提升。

步骤(1.1)所述第五百分位功率提取出背景声指纹，包括如下步骤：

(1.1.1)对采集的原始音频序列进行分帧加窗操作，得到短时平稳的背景声信号，窗函数为：

(1.1.2)将分帧加窗之后的每一帧音频信号做FFT变换，保留FFT变换的前二分之一数据，并乘上它的共轭，可求出功率谱；

FFT变换公式为：

(1.1.3)舍弃频率大于7kHz的音频信号；

(1.1.4)对剩余的数据按功率大小进行排序；

(1.1.5)提取功率的第五百分列并取对数，得到背景声指纹。

步骤(2.1)所述的进行第五百分功率提取，其方法与步骤(1.1)相同。前两步是标准的功率谱计算方法。求出功率谱之后，需要提取功率谱中鲁棒性高的特征向量以表征房间背景声。由于想要提取的是房间中的背景声，此特征应该具有时间平稳性，因此需要抑制瞬态噪声。在窗口采样过程中通过选择每个频率下观测的背景声功率的最小值来提取背景声谱。然而，最小值容易受到外界噪声以及预处理过程的干扰，因此选择临近功率最小值的一组特征向量代替最小值，即功率第五百分位特征向量。

步骤(1.3)所述RNN-LSTM学习算法训练定位模型，包括如下步骤：

(1.3.1)确定参数：初始化输入层、隐藏层、输出层的权值矩阵；

(1.3.2)前向传播：前向计算每个神经元的输出值；

(1.3.3)反向传播：反向计算每个神经元的误差项，RNN-LSTM误差项的方向传播包括两个方向：一个是沿时间的方向传播，即从当前t时刻开始，计算每个时刻的误差项；一个是将误差项向上一层传播；

(1.3.4)根据相应的误差项进行参数权重的迭代更新计算。

RNN-LSTM利用LSTM细胞代替常规网络单元的RNN的高级版本。LSTM细胞的基础原理是运用不同类型的门来操控网络中的信息流。通过门结构，LSTM细胞可以决定什么时候应该记住输入信息，什么时候应该忘记该信息以及什么时候应该输出该信息。因此其是一种能够长时间保存信息的复杂且精巧的网络单元RNN-LSTM。可以解决由于梯度消失或爆炸引起的短周期依赖问题，以实现长期记忆的效果。

步骤(2.2)所述房间识别率的计算：是根据模型输出的结果与真实环境的房间标记进行比对，可计算出房间的识别率p；

其中,y_i表示利用模型计算出的房间标记，表示真实环境下的房间标记,表示当其值为1；否则其值为0。

本发明基于智能手机室内背景声感知的房间级定位方法，该方法无需预部署其它基础设施，仅需利用智能手机采集房间背景声，提取第五百分位功率作为背景声指纹特征。该特征提取方法相对于MFCC等特征提取方法,计算简单，通过RNN-LSTM深度学习算法训练得出的模型识别率高，相较传统模型性能有较大程度的提升，更适用于室内背景声定位场景中。

附图说明

图1为本发明定位方法中室内房间背景声线下采集与训练过程框图；

图2为本发明定位方法中待定位地点背景声线上定位过程框图。

具体实施方式

下面结合附图对本发明内容作进一步的说明，但不是对本发明的限定。

参照图1-2，本发明基于智能手机室内背景声感知的房间级定位方法，包括如下步骤：

(1)室内房间背景声线下采集与训练

(1.1)采集室内房间背景声与特征提取：

(1.2)构建背景声指纹库：

(1.3)训练过程：

构建了背景声指纹库之后，以此为训练集数据，通过RNN-LSTM深度学习算法训练出适用于背景声室内定位场景下的定位模型，此模型需有较高的泛化能力，能较好的反映整个样本空间的特征；

(2)待定位地点背景声线上定位

(2.1)获取待定位地点背景声测试集指纹数据：

FFT变换公式为：

(1.1.3)舍弃频率大于7kHz的音频信号；

(1.1.4)对剩余的数据按功率大小进行排序；

(1.1.5)提取功率的第五百分列并取对数，得到背景声指纹。

步骤(2.1)所述的进行第五百分功率提取，其方法与步骤(1.1)相同。

步骤(1.3)所述RNN-LSTM学习算法训练定位模型，包括如下步骤：

(1.3.2)前向传播：前向计算每个神经元的输出值；

(1.3.4)根据相应的误差项进行参数权重的迭代更新计算。

本发明利用智能手机录取室内环境声，通过提取声音功率的第五百分位功率作为声学特征，导入RNN-LSTM学习算法，训练特定室内背景声定位模型，相对传统同类声特征室内定位系统而言，采用本发明方法在15个房间中的识别率达到90％以上，不仅达到房间级定位的要求，而且提高了房间识别率。

Claims

1.基于智能手机室内背景声感知的房间级定位方法，包括(1)室内房间背景声线下采集和训练，以及(2)待定位地点背景声线上定位二个阶段，其特征在于：

(1.1)采集室内房间背景声与特征提取：

(1.2)构建背景声指纹库：

(1.3)训练过程：

构建了背景声指纹库之后，以此为训练集数据，通过RNN-LSTM深度学习算法训练出适用于背景声室内定位场景下的定位模型；

(2.1)获取待定位地点背景声测试集指纹数据：

2.根据权利要求1所述的基于智能手机室内背景声感知的房间级定位方法，其特征在于：步骤(1.1)所述第五百分位功率提取出背景声指纹，包括如下步骤：(1.1.1)对采集的原始音频序列进行分帧加窗操作，得到短时平稳的背景声信号，窗函数为：

FFT变换公式为：

(1.1.3)舍弃频率大于7kHz的音频信号；

(1.1.4)对剩余的数据按功率大小进行排序；

(1.1.5)提取功率的第五百分列并取对数，得到背景声指纹。

3.根据权利要求1所述的基于智能手机室内背景声感知的房间级定位方法，其特征在于：步骤(1.3)所述RNN-LSTM学习算法训练定位模型，包括如下步骤：

(1.3.2)前向传播：前向计算每个神经元的输出值；

(1.3.4)根据相应的误差项进行参数权重的迭代更新计算。

4.根据权利要求1所述的基于智能手机室内背景声感知的房间级定位方法，其特征在于：步骤(2.2)所述房间识别率的计算：是根据定位模型输出的结果与真实环境的房间标记进行比对，可计算出房间的识别率p；