CN105096937A - 语音数据处理方法及终端 - Google Patents
语音数据处理方法及终端 Download PDFInfo
- Publication number
- CN105096937A CN105096937A CN201510274283.3A CN201510274283A CN105096937A CN 105096937 A CN105096937 A CN 105096937A CN 201510274283 A CN201510274283 A CN 201510274283A CN 105096937 A CN105096937 A CN 105096937A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- terminal
- information
- user
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 8
- 238000000034 method Methods 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 4
- 238000011022 operating instruction Methods 0.000 claims 2
- 238000004891 communication Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000010267 cellular communication Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明实施例公开了一种语音数据处理方法及终端,方法包括:第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
Description
技术领域
本发明涉及通信领域的语音处理技术,尤其涉及一种语音数据处理方法及终端。
背景技术
目前终端在进行语音通信时,参与通信的两个终端往往是基于对端的终端标识如终端的电话号码来完成对另一方终端的识别,这种识别仅仅限于两个终端参与语音通信的场景,对于多个终端参与的语音通信场景中,如何对语音数据中的语音的来源终端也即来源终端的用户进行识别,进而基于识别出的用户来对多终端语音场景中的业务功能进行扩展,相关技术尚无有效解决方案。
发明内容
本发明实施例提供一种语音数据处理方法及终端,能够对语音数据中的语音的来源终端也即来源终端的用户进行识别,进而对多终端语音场景中的业务功能进行扩展,提升用户体验。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种语音数据处理方法,所述方法包括:
第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
优选地,所述方法还包括:
所述第一终端从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令,包括:
所述语音数据中承载有至少两个所述用户的语音;
当确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
优选地,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述基于与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
本发明实施例提供一种终端,所述终端包括:
语音获取模块,用于获取语音数据;
声纹提取模块,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
优选地,所述语音获取模块,还用于从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
优选地,所述响应模块,还用于当所述声纹识别模块确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;
其中,所述语音数据中承载有至少两个所述用户的语音。
优选地,所述响应模块包括:
采集单元,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元,用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
优选地,所述响应模块包括:触发单元、滤除单元、编辑单元;
所述触发单元,用于基于所述操作指令触发所述滤除单元和/或所述编辑单元;其中,
所述滤除单元,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
本发明实施例中,第一终端处于多终端的语音通信场景中时,可以基于从多终端语音通信场景中获取的语音数据中提取出声纹特征,与第一终端中预设声纹特征匹配,进而得到提取出的声纹特征对应的目标用户的信息,这就克服了多终端语音通信场景中无法识别语音的来源用户(也即目标用户)的问题;同时,第一终端可以基于提取出的目标用户的声纹特征、和/或来源目标用户的信息,对多终端的语音通信场景进行功能扩展,例如提示当前语音的来源用户、与来源用户基于声纹特征进行加密通信,或基于声纹特征对语音数据进行编辑,满足了用户在多终端的语音通信场景中的需求,提升了用户体验。
附图说明
图1是本发明实施例中语音数据处理的实现流程示意图一;
图2a至图2c是本发明实施例中终端的结构示意图;
图3是本发明实施例中语音数据处理的实现流程示意图二。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例记载一种语音数据处理方法,可以应用于第一终端(如智能手机),如图1所示,包括以下步骤:
步骤S101,第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征。
步骤S102,基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息。
作为一个示例,预设声纹特征与用户的信息的一一对应关系可以在第一终端用户的历史通话过程中,基于所接收语音数据提取声纹特征得到,例如,第一终端在与第二终端进行点对点的语音通信时,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;基于所提取出的第二终端的用户的声纹特征,建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
作为又一个示例,预设声纹特征与用户的信息的一一对应关系可以由第一终端用户直接对第二终端的用户进行语音采集(例如由第一终端用户持有第一终端对第二终端的用户进行面对面的语音采集,或者第一终端接收第二终端发送的承载有第二终端用户语音的语音数据)得到语音数据,从所述第二终端的用户的声纹特征;基于所提取出的第二终端的用户的声纹特征,建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
步骤S103,基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
作为步骤S103的一个示例,在多终端的语音通信场景中,所述语音数据中承载有至少两个所述用户的语音;当第一终端确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;例如,第一终端与用户A持有的第二终端A、以及用户B持有的第二终端B进行电话会议时,第一终端对接收的语音数据进行声纹特征提取,当提出的声纹特征与用户A的预设声纹特征匹配时,表明用户A当前是电话会议的发言者,第一终端可以在自身的图形界面中呈现诸如“当前发言者是用户A”的提示信息,直至在接收的语音数据中不能提取出用户A的声纹特征,表明用户A在电话会议中的发言结束;对于用户B发言以及用户A、B同时发言的情况,第一终端基于上述处理同样能够对发言的用户在图形界面上提示,从而便于第一终端用户了解会议的发言者的情况。
作为步骤S103的又一个示例,第一终端提取出的声纹可以用于第一终端与目标用户持有的第三终端进行加密通信;在前述的电话会议场景中,当第一终端的用户期望将第一终端采集的信息(例如语音、短消息、图片等)向目标用户加密发送时,可以将所述提取出的目标用户的声纹特征对信息进行加密;并基于与所述提取出的声纹特征对应的目标用户的信息(承载有与目标用户的第二终端可用的通信方式),向所述目标用户对应的第三终端发送加密后的信息;当目标用户的第三终端接收到所述加密后的信息,利用第三用户的预设声纹特征信息对接收的信息解密,得到第一终端采集的信息,确保了用于使所述第三终端基于所述目标用户的声纹特征进行解密操作;一个典型的应用场景是微信群聊和QQ群聊,第一终端可以向目标用户发送基于目标用于的声纹特征加密的信息,这样,即使该信息被其他终端接收也无法解密,提升了多设备通信的隐私安全。
作为步骤S103的又一个示例,在前述的电话会议场景中,第一终端接收到语音数据后,基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据,例如,当用户A电话会议中的发言涉密不便播放时,第一终端可以基于用户A的声纹特征将语音数据中用户A的语音滤除;
又例如,第一终端用户需要在用户A的语音数据与用户B的语音数据中插入已经提前采集的用户C的语音数据时,基于所述提取出的声纹特征与预设用户A、B的声纹特征匹配,确定所述语音数据中承载有用户A、B的语音的数据段,在用户A的数据段、用户B的语音的数据段中插入用户C的语音数据;这样对语音数据中的声纹特征进行提取,并基于预设的声纹特征语音数据中的语音对应的目标用户进行识别,可以以目标用户为单位对语音数据进行编辑处理。
本发明实施例还记载一种终端100,如图2a所示,所述终端100包括:
语音获取模块110,用于获取语音数据;
声纹提取模块120,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块130,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块140,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块150,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块140存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块160,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
作为一个示例,所述语音获取模块110,还用于从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块120,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块140,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
作为一个示例,所述响应模块160,还用于当所述声纹识别模块150确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户的对应的语音;其中,所述语音数据中承载有至少两个所述用户的语音。
作为一个示例,如图2b所示,所述响应模块160包括:
采集单元1601,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元1602(与采集单元1601连接),用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行解密操作。
作为一个示例,如图2c所示,所述响应模块160包括:触发单元1603、滤除单元1604、编辑单元1605;
所述触发单元,用于基于所述操作指令触发所述滤除单元1604和/或所述编辑单元1605;其中,
所述滤除单元1604,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述编辑单元1605,用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
实际应用中,语音获取模块110可由终端中的支持通信的专用集成电路模块,以直接接收语音数据,通信的类型包括:蜂窝通信、WiFi通信,语音获取模块110可由终端中的支持音频采集的专用集成电路实现;声纹提取模块120、声纹匹配模块130、声纹识别模块150可由终端设备中的处理器,数字信号处理器(DSP)实现;声纹关联模块140可以存储介质(如闪存、硬盘、卡型存储器)、结合处理器或数字信号处理器(DSP)实现。
下面再结合电话会议场景中对语音数据进行特征提取,并对电话会议中的当前发言者进行提示的处理进行说明。
具体的实现过程如图3所示,包括以下步骤:
步骤S201,终端的图形界面呈现声纹提取开关,提示用户根据自身需要自行选择是否打开。
步骤S202,当用户打开上述开关,并通讯录中的联系人进行语音通话时,终端开始自动提取通话用户声纹数据。
语音获取模块110实时采集来自参与电话会议的其他终端语音数据,发送到声纹提取模块120进行声纹特征提取;
提取声纹特征的实现方式包括:基音频谱及其轮廓、基音帧的能量、基音共振峰的出现频率及其轨迹;线性预测倒谱、线谱对、自相关和对数面积比、MFCC、感知线性预测以及小波变换技术等。
步骤S203,建立提取的声纹特征与当前进行语音通话的联系人的对应关系,把声纹特征与联系人的对应关系数据通过文件的形式进行存储。
通过多次执行步骤S202至步骤S203,声纹关联模块140可以建立通讯录中所有联系人与联系人的声纹特征的对应关系。
步骤S204,进入会议电话模式,对当前通话中对方发言者的声纹特征进行实时提取,与已保存的联系人的声纹特征匹配,得到通讯录中当前发言者的信息。
匹配中适配的语音模型包括:矢量化模型、随机模型、神经网络模型。
步骤S205,显示当前发言者的信息。
本发明实施例还记载一种计算机存储介质,所述计算机存储介质中存储有可执行指令,所述可执行指令用于执行图1或图3所示的语音数据处理流程。
本发明实施例中,第一终端处于多终端的语音通信场景中时,可以基于从多终端语音通信场景中获取的语音数据中提取出声纹特征,与第一终端中预设声纹特征匹配,进而得到提取出的声纹特征对应的目标用户的信息,这就克服了多终端语音通信场景中无法识别语音的来源用户(也即目标用户)的问题;同时,第一终端可以基于提取出的目标用户的声纹特征、和/或来源目标用户的信息,对多终端的语音通信场景进行功能扩展,例如提示当前语音的来源用户、与来源用户基于声纹特征进行加密通信,或基于声纹特征对语音数据进行编辑,满足了用户在多终端的语音通信场景中的需求,提升了用户体验。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、随机存取存储器(RAM,RandomAccessMemory)、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种语音数据处理方法,其特征在于,所述方法包括:
第一终端从获取的语音数据中提取出声纹特征,将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一终端从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
3.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令,包括:
所述语音数据中承载有至少两个所述用户的语音;
当确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音。
4.如权利要求1所述的方法,其特征在于,所述基于与提取出的声纹特征、和/或与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
5.如权利要求1至4任一项所述的方法,其特征在于,所述基于与提取出的声纹特征响应操作指令,包括:
基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述基于与所述提取出的声纹特征对应的用户的信息响应操作指令,包括:
基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
6.一种终端,其特征在于,所述终端包括:
语音获取模块,用于获取语音数据;
声纹提取模块,用于从所述获取的语音数据中提取出声纹特征,
声纹匹配模块,用于将所述声纹特征与至少一个预设声纹特征进行匹配,得到与所述提取出的声纹特征匹配的预设声纹特征;
声纹关联模块,用于存储所述预设声纹特征与用户的信息的一一对应关系;
声纹识别模块,用于基于与所述提取出的声纹特征匹配的预设声纹特征、以及所述声纹关联模块存储的所述预设声纹特征与用户的信息的一一对应关系,确定与所述提取出的声纹特征对应的目标用户的信息;
响应模块,用于基于所述提取出的声纹特征、和/或与所述提取出的声纹特征对应的目标用户的信息响应操作指令。
7.如权利要求6所述的终端,其特征在于,
所述语音获取模块,还用于在所述声纹提取模块从获取的语音数据中提取出声纹特征之前,获取来自第二终端的语音数据,所述来自第二终端的语音数据中承载有所述第二终端的用户的语音;
所述声纹提取模块,还用于从来自所述第二终端的语音数据中提取出所述第二终端的用户的声纹特征;
所述声纹关联模块,还用于建立所述第二终端的用户的声纹特征与所述第二终端的用户的信息之间的对应关系。
8.如权利要求6所述的终端,其特征在于,
所述响应模块,还用于当所述声纹识别模块确定与所述提取出的声纹特征对应的用户的信息时,基于图形界面呈现与所述提取出的声纹特征对应的用户的信息,直至所接收的所述语音数据中不再承载有与所述用户对应的语音;
其中,所述语音数据中承载有至少两个所述用户的语音。
9.如权利要求6所述的终端,其特征在于,所述响应模块包括:
采集单元,用于采集信息,利用所述提取出的声纹特征对所采集到的信息进行加密;
加密单元,用于基于与所述提取出的声纹特征对应的目标用户的信息,向所述目标用户对应的第三终端发送加密后的信息;其中,
所述加密后的信息用于使所述第三终端基于所述目标用户的声纹特征进行声纹匹配,以对所述加密后的信息进行解密。
10.如权利要求6至9任一项所述的终端,其特征在于,所述响应模块包括:触发单元、滤除单元和编辑单元;
所述触发单元,用于基于所述操作指令触发所述滤除单元和/或所述编辑单元;其中,
所述滤除单元,用于基于所述提取出的声纹特征,在所述语音数据中滤除与所述声纹特征对应的语音数据;
所述编辑单元,用于基于所述提取出的声纹特征、以及与所述提取出的声纹特征对应的目标用户的信息,确定所述语音数据中承载有不同所述目标用户的语音的数据段,对所确定的数据段进行语音编辑操作。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510274283.3A CN105096937A (zh) | 2015-05-26 | 2015-05-26 | 语音数据处理方法及终端 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510274283.3A CN105096937A (zh) | 2015-05-26 | 2015-05-26 | 语音数据处理方法及终端 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN105096937A true CN105096937A (zh) | 2015-11-25 |
Family
ID=54577223
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201510274283.3A Pending CN105096937A (zh) | 2015-05-26 | 2015-05-26 | 语音数据处理方法及终端 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN105096937A (zh) |
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105719659A (zh) * | 2016-02-03 | 2016-06-29 | 努比亚技术有限公司 | 基于声纹识别的录音文件分离方法及装置 |
| CN106128465A (zh) * | 2016-06-23 | 2016-11-16 | 成都启英泰伦科技有限公司 | 一种声纹识别系统及方法 |
| CN106782498A (zh) * | 2016-11-30 | 2017-05-31 | 广东欧珀移动通信有限公司 | 语音信息播放方法、装置及终端 |
| CN107104994A (zh) * | 2016-02-22 | 2017-08-29 | 华硕电脑股份有限公司 | 语音识别方法、电子装置及语音识别系统 |
| CN107171816A (zh) * | 2017-06-21 | 2017-09-15 | 歌尔科技有限公司 | 电话会议中的数据处理方法及装置 |
| WO2017181752A1 (zh) * | 2016-04-22 | 2017-10-26 | 中兴通讯股份有限公司 | 一种建立无线局域网的方法、装置及终端 |
| CN108159702A (zh) * | 2017-12-06 | 2018-06-15 | 广东欧珀移动通信有限公司 | 基于多人语音游戏处理方法和装置 |
| CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
| CN109410955A (zh) * | 2018-12-07 | 2019-03-01 | 广州势必可赢网络科技有限公司 | 一种语音数据的保密方法、系统、装置及存储介质 |
| CN109427017A (zh) * | 2017-08-24 | 2019-03-05 | 中兴通讯股份有限公司 | 一种提示方法及装置 |
| CN109524013A (zh) * | 2018-12-18 | 2019-03-26 | 北京猎户星空科技有限公司 | 一种语音处理方法、装置、介质和智能设备 |
| CN109727601A (zh) * | 2018-12-24 | 2019-05-07 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
| WO2019127057A1 (zh) * | 2017-12-26 | 2019-07-04 | 海能达通信股份有限公司 | 组呼的语音信号处理方法、通讯终端以及计算机存储介质 |
| CN110362204A (zh) * | 2019-07-11 | 2019-10-22 | Oppo广东移动通信有限公司 | 信息提示方法、装置、存储介质及增强现实设备 |
| CN110574103A (zh) * | 2018-06-29 | 2019-12-13 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
| CN110688640A (zh) * | 2019-09-03 | 2020-01-14 | 深圳市声扬科技有限公司 | 一种基于声纹识别的数据处理方法、装置、系统及服务器 |
| CN108364654B (zh) * | 2018-01-30 | 2020-10-13 | 网易乐得科技有限公司 | 语音处理方法、介质、装置和计算设备 |
| CN111862947A (zh) * | 2020-06-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 用于控制智能设备的方法、装置、电子设备和计算机存储介质 |
| WO2021017982A1 (zh) * | 2019-07-29 | 2021-02-04 | 华为技术有限公司 | 一种声纹识别的方法及设备 |
| CN112929501A (zh) * | 2021-01-25 | 2021-06-08 | 深圳前海微众银行股份有限公司 | 语音通话服务方法、装置、设备、介质及计算机程序产品 |
| CN112970061A (zh) * | 2018-11-14 | 2021-06-15 | 惠普发展公司,有限责任合伙企业 | 基于策略许可的内容 |
| CN113051426A (zh) * | 2021-03-18 | 2021-06-29 | 深圳市声扬科技有限公司 | 音频信息分类方法、装置、电子设备及存储介质 |
| CN120260580A (zh) * | 2025-05-29 | 2025-07-04 | 广州九四智能科技有限公司 | 一种用户语音数据安全加密方法及系统 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101030846A (zh) * | 2006-03-02 | 2007-09-05 | 积体数位股份有限公司 | 可携式声纹密码锁远程传输系统及其方法 |
| US20110069140A1 (en) * | 2002-11-08 | 2011-03-24 | Verizon Services Corp. | Facilitation of a conference call |
| CN102064937A (zh) * | 2011-01-10 | 2011-05-18 | 杭州电子科技大学 | 基于声纹的通话双方语音加解密方法 |
| CN102985965A (zh) * | 2010-05-24 | 2013-03-20 | 微软公司 | 声纹标识 |
| CN103780866A (zh) * | 2012-10-22 | 2014-05-07 | 联想移动通信科技有限公司 | 一种视频控制装置、方法与视频终端 |
-
2015
- 2015-05-26 CN CN201510274283.3A patent/CN105096937A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20110069140A1 (en) * | 2002-11-08 | 2011-03-24 | Verizon Services Corp. | Facilitation of a conference call |
| CN101030846A (zh) * | 2006-03-02 | 2007-09-05 | 积体数位股份有限公司 | 可携式声纹密码锁远程传输系统及其方法 |
| CN102985965A (zh) * | 2010-05-24 | 2013-03-20 | 微软公司 | 声纹标识 |
| CN102064937A (zh) * | 2011-01-10 | 2011-05-18 | 杭州电子科技大学 | 基于声纹的通话双方语音加解密方法 |
| CN103780866A (zh) * | 2012-10-22 | 2014-05-07 | 联想移动通信科技有限公司 | 一种视频控制装置、方法与视频终端 |
Cited By (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105719659A (zh) * | 2016-02-03 | 2016-06-29 | 努比亚技术有限公司 | 基于声纹识别的录音文件分离方法及装置 |
| CN107104994A (zh) * | 2016-02-22 | 2017-08-29 | 华硕电脑股份有限公司 | 语音识别方法、电子装置及语音识别系统 |
| WO2017181752A1 (zh) * | 2016-04-22 | 2017-10-26 | 中兴通讯股份有限公司 | 一种建立无线局域网的方法、装置及终端 |
| CN106128465A (zh) * | 2016-06-23 | 2016-11-16 | 成都启英泰伦科技有限公司 | 一种声纹识别系统及方法 |
| CN106782498A (zh) * | 2016-11-30 | 2017-05-31 | 广东欧珀移动通信有限公司 | 语音信息播放方法、装置及终端 |
| CN106782498B (zh) * | 2016-11-30 | 2019-12-10 | Oppo广东移动通信有限公司 | 语音信息播放方法、装置及终端 |
| CN107171816A (zh) * | 2017-06-21 | 2017-09-15 | 歌尔科技有限公司 | 电话会议中的数据处理方法及装置 |
| CN109427017A (zh) * | 2017-08-24 | 2019-03-05 | 中兴通讯股份有限公司 | 一种提示方法及装置 |
| CN108159702B (zh) * | 2017-12-06 | 2021-08-20 | Oppo广东移动通信有限公司 | 基于多人语音游戏处理方法和装置 |
| CN108159702A (zh) * | 2017-12-06 | 2018-06-15 | 广东欧珀移动通信有限公司 | 基于多人语音游戏处理方法和装置 |
| WO2019127057A1 (zh) * | 2017-12-26 | 2019-07-04 | 海能达通信股份有限公司 | 组呼的语音信号处理方法、通讯终端以及计算机存储介质 |
| CN108364654B (zh) * | 2018-01-30 | 2020-10-13 | 网易乐得科技有限公司 | 语音处理方法、介质、装置和计算设备 |
| CN110574103B (zh) * | 2018-06-29 | 2020-10-23 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
| CN110574103A (zh) * | 2018-06-29 | 2019-12-13 | 华为技术有限公司 | 一种语音控制方法、可穿戴设备及终端 |
| CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
| CN112970061A (zh) * | 2018-11-14 | 2021-06-15 | 惠普发展公司,有限责任合伙企业 | 基于策略许可的内容 |
| US12512103B2 (en) | 2018-11-14 | 2025-12-30 | Hewlett-Packard Development Company, L.P. | Contents based on policy permissions |
| CN109410955A (zh) * | 2018-12-07 | 2019-03-01 | 广州势必可赢网络科技有限公司 | 一种语音数据的保密方法、系统、装置及存储介质 |
| CN109524013A (zh) * | 2018-12-18 | 2019-03-26 | 北京猎户星空科技有限公司 | 一种语音处理方法、装置、介质和智能设备 |
| CN109524013B (zh) * | 2018-12-18 | 2022-07-22 | 北京猎户星空科技有限公司 | 一种语音处理方法、装置、介质和智能设备 |
| CN109727601A (zh) * | 2018-12-24 | 2019-05-07 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
| CN110362204A (zh) * | 2019-07-11 | 2019-10-22 | Oppo广东移动通信有限公司 | 信息提示方法、装置、存储介质及增强现实设备 |
| WO2021017982A1 (zh) * | 2019-07-29 | 2021-02-04 | 华为技术有限公司 | 一种声纹识别的方法及设备 |
| US12130899B2 (en) | 2019-07-29 | 2024-10-29 | Huawei Technologies Co., Ltd. | Voiceprint recognition method and device |
| CN110688640A (zh) * | 2019-09-03 | 2020-01-14 | 深圳市声扬科技有限公司 | 一种基于声纹识别的数据处理方法、装置、系统及服务器 |
| CN111862947A (zh) * | 2020-06-30 | 2020-10-30 | 百度在线网络技术(北京)有限公司 | 用于控制智能设备的方法、装置、电子设备和计算机存储介质 |
| CN112929501A (zh) * | 2021-01-25 | 2021-06-08 | 深圳前海微众银行股份有限公司 | 语音通话服务方法、装置、设备、介质及计算机程序产品 |
| CN113051426A (zh) * | 2021-03-18 | 2021-06-29 | 深圳市声扬科技有限公司 | 音频信息分类方法、装置、电子设备及存储介质 |
| CN120260580A (zh) * | 2025-05-29 | 2025-07-04 | 广州九四智能科技有限公司 | 一种用户语音数据安全加密方法及系统 |
| CN120260580B (zh) * | 2025-05-29 | 2025-08-05 | 广州九四智能科技有限公司 | 一种用户语音数据安全加密方法及系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105096937A (zh) | 语音数据处理方法及终端 | |
| CN107623614B (zh) | 用于推送信息的方法和装置 | |
| CN103281683B (zh) | 一种发送语音消息的方法及装置 | |
| EP3288238B1 (en) | Terminal alarm method and apparatus | |
| US20170154519A1 (en) | Alarming Method, Terminal, and Storage Medium | |
| CN105979197B (zh) | 基于啸叫音自动识别的远程会议控制方法及装置 | |
| CN108197572B (zh) | 一种唇语识别方法和移动终端 | |
| US10270736B2 (en) | Account adding method, terminal, server, and computer storage medium | |
| CN108198569B (zh) | 一种音频处理方法、装置、设备及可读存储介质 | |
| CN109951743A (zh) | 弹幕信息处理方法、系统及计算机设备 | |
| CN103856624B (zh) | 识别身份的方法和移动终端 | |
| CN103841272B (zh) | 一种发送语音消息的方法及装置 | |
| CN107995360A (zh) | 通话处理方法及相关产品 | |
| CN103391359A (zh) | 移动终端声音识别处理方法及移动终端 | |
| CN112509586A (zh) | 电话信道声纹识别方法及装置 | |
| CN103491257A (zh) | 一种在通话过程中发送联系人信息的方法及系统 | |
| CN107945806B (zh) | 基于声音特征的用户识别方法及装置 | |
| CN113808592A (zh) | 通话录音的转写方法及装置、电子设备和存储介质 | |
| CN111681650A (zh) | 一种智能会议控制方法和装置 | |
| CN101141722B (zh) | 基于用户语音特征的安全手机及实现方法 | |
| CN104851423B (zh) | 一种声音信息处理方法及装置 | |
| CN107371144B (zh) | 一种智能发送信息的方法及装置 | |
| WO2016033988A1 (zh) | 业务处理方法及装置 | |
| CN105529025B (zh) | 一种语音操作输入方法及电子设备 | |
| CN103414560A (zh) | 应用的启动方法、装置和系统及应用服务器 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151125 |