JP6429945B2 - 音声データを処理するための方法及び装置 - Google Patents
音声データを処理するための方法及び装置 Download PDFInfo
- Publication number
- JP6429945B2 JP6429945B2 JP2017109505A JP2017109505A JP6429945B2 JP 6429945 B2 JP6429945 B2 JP 6429945B2 JP 2017109505 A JP2017109505 A JP 2017109505A JP 2017109505 A JP2017109505 A JP 2017109505A JP 6429945 B2 JP6429945 B2 JP 6429945B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- registered
- voiceprint
- user
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/08—Use of distortion metrics or a particular distance between probe pattern and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Collating Specific Patterns (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Description
Claims (20)
- ユーザ端末から送信された音声データを受信するステップと、
前記音声データにおける声紋特徴ベクトルを抽出するステップと、
前記声紋特徴ベクトルと予め記憶したユーザの登録声紋ベクトルとをマッチングし、前記声紋特徴ベクトルと前記登録声紋ベクトルとのマッチング度を生成するステップと、
前記マッチング度が予め設定した更新閾値以上であるかどうかを決定するステップと、
前記マッチング度が予め設定した更新閾値以上であると決定したことに応答して、前記声紋特徴ベクトルと前記音声データとによって前記登録声紋ベクトルを更新するステップと、を含み、
前記声紋特徴ベクトルと前記音声データとによって前記登録声紋ベクトルを更新するステップは、
ユーザが入力した登録音声データの数と、前記ユーザが記憶した各声紋特徴ベクトルとを取得するステップと、
前記ユーザが記憶した各声紋特徴ベクトル、前記ユーザが記憶した音声データの数、前記登録音声データの数及び前記登録声紋ベクトルに基づいて、登録声紋ベクトルを更新するステップと、を含む
ことを特徴とする音声データを処理するための方法。 - 前記音声データにおける声紋特徴ベクトルを抽出するステップにおいては、
前記音声データを予めトレーニングしたユニバーサルバックグラウンドモデルに導入しマッピングを行って中間ベクトルを取得するステップと、
前記中間ベクトルに対して特徴変換を行って声紋特徴ベクトルを取得するステップと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記声紋特徴ベクトルと予め記憶した前記ユーザの登録声紋ベクトルとをマッチングするステップの前に、
登録声紋ベクトルを生成するステップをさらに含んでおり、
前記の登録声紋ベクトルを生成するステップにおいては、
前記ユーザが入力した所定数の登録音声データを取得するステップと、
前記所定数の登録音声データを予めトレーニングしたユニバーサルバックグラウンドモデルに導入しマッピングを行って所定数の長さが同じ中間ベクトルを取得するステップと、
前記所定数の長さが同じ中間ベクトルに対して特徴変換を行って所定数の登録声紋特徴ベクトルを取得するステップと、
前記所定数の登録声紋特徴ベクトルを融合し、前記ユーザの登録声紋ベクトルを生成するステップと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記ユーザが記憶した各声紋特徴ベクトル、前記ユーザが記憶した音声データの数、前記登録音声データの数及び前記登録声紋ベクトルに基づいて、登録声紋ベクトルを更新するステップにおいては、
前記ユーザが記憶した各声紋特徴ベクトルに対してデータ正規化演算を行い、データ正規化演算後のベクトルを加算し、前記ユーザが記憶した声紋特徴ベクトルの和を求めるステップと、
前記登録音声データの数に前記登録声紋ベクトルを乗じて、登録声紋ベクトルの積を取得するステップと、
前記声紋特徴ベクトルの和と前記登録声紋ベクトルの積とのベクトル和を計算するとともに、前記ユーザが記憶した音声データの数と前記登録音声データの数との数の和を計算し、前記数の和で前記ベクトル和を割って更新した登録声紋ベクトルを取得するステップと、を含む
ことを特徴とする請求項1に記載の方法。 - 前記の登録声紋ベクトルを更新するステップの後に、
前記ユーザが記憶した音声データを削除するステップを含む
ことを特徴とする請求項1に記載の方法。 - 前記ユーザが入力した所定数の登録音声データを取得するステップにおいては、
前記ユーザが記憶した音声データと、音声データの入力時点を含む前記音声データの関連情報とを取得するステップと、
前記入力時点が予め設定した時間分割点より早い音声データを削除し、残った音声データを登録音声データとするステップと、を含む
ことを特徴とする請求項3に記載の方法。 - 前記ユーザが入力した所定数の登録音声データを取得するステップにおいては、
クラスタリングアルゴリズムによって前記ユーザが記憶した音声データをクラスタリングし、少なくとも1つの記憶した音声データのクラスタを生成するステップと、
各クラスタの中心点を取得するステップと、
距離アルゴリズムによって各記憶した音声データと各記憶した音声データが所在するクラスタの中心点との距離を計算するステップと、
前記距離が予め設定した距離閾値より大きい音声データを削除し、残った音声データを登録音声データとするステップと、をさらに含む
ことを特徴とする請求項3に記載の方法。 - 前記関連情報は、音声データの収集装置タイプ、音声データの入力場所のうちの少なくとも1つをさらに含み、
前記の少なくとも1つの記憶した音声データのクラスタを生成するステップの後に、
各クラスタにおける音声データと、前記各クラスタにおける音声データの関連情報とを取得するステップと、
各クラスタの音声データによって前記ユーザの各登録声紋ベクトルを再生成し、前記各クラスタの音声データの関連情報に基づいて各登録声紋ベクトルの関連情報を生成するステップと、をさらに含む
ことを特徴とする請求項6に記載の方法。 - 前記のユーザ端末から送信された音声データを受信するステップの後に、
前記音声データの関連情報を取得するステップをさらに含んでおり、
前記声紋特徴ベクトルと予め記憶した前記ユーザの登録声紋ベクトルをマッチングするステップにおいては、
前記音声データの関連情報と各登録声紋ベクトルの関連情報とのマッチング度に基づいて、登録声紋ベクトルを選択するステップと、
前記声紋特徴ベクトルと選択した登録声紋ベクトルとをマッチングするステップと、を含む
ことを特徴とする請求項8に記載の方法。 - 前記声紋特徴ベクトルと前記登録声紋ベクトルとのマッチング度を生成するステップの後に、
前記マッチング度が予め設定した成功閾値以上であるかどうかを決定するステップと、
前記マッチング度が予め設定した成功閾値以上であると決定したことに応答して、ユーザ身元認証が成功したと決定して認証成功に対応する操作を実行するステップと、をさらに含む
ことを特徴とする請求項1に記載の方法。 - ユーザ端末から送信された音声データを受信するように配置される受信ユニットと、
前記音声データにおける声紋特徴ベクトルを抽出するように配置される抽出ユニットと、
前記声紋特徴ベクトルと予め記憶したユーザの登録声紋ベクトルとをマッチングし、前記声紋特徴ベクトルと前記登録声紋ベクトルとのマッチング度を生成するように配置されるマッチングユニットと、
前記マッチング度が予め設定した更新閾値以上であるかどうかを決定するように配置される第1決定ユニットと、
前記マッチング度が予め設定した更新閾値以上であると決定したことに応答して、前記声紋特徴ベクトルと前記音声データとによって前記登録声紋ベクトルを更新するように配置される更新ユニットと、を備え、
前記更新ユニットは、
ユーザが入力した登録音声データの数と、前記ユーザが記憶した各声紋特徴ベクトルとを取得するように配置される取得モジュールと、
前記ユーザが記憶した各声紋特徴ベクトル、前記ユーザが記憶した音声データの数、前記登録音声データの数及び前記登録声紋ベクトルに基づいて、登録声紋ベクトルを更新するように配置される更新モジュールと、を備える
ことを特徴とする音声データを処理するための装置。 - 前記抽出ユニットは、
前記音声データを予めトレーニングしたユニバーサルバックグラウンドモデルに導入しマッピングを行って中間ベクトルを取得するように配置されるマッピングモジュールと、
前記中間ベクトルに対して特徴変換を行って声紋特徴ベクトルを取得するように配置される変換モジュールと、を備える
ことを特徴とする請求項11に記載の装置。 - 生成ユニットをさらに備えており、
前記生成ユニットは、
前記ユーザが入力した所定数の登録音声データを取得するように配置される取得モジュールと、
前記所定数の登録音声データを予めトレーニングしたユニバーサルバックグラウンドモデルに導入しマッピングを行って所定数の長さが同じ中間ベクトルを取得するように配置されるマッピングモジュールと、
前記所定数の長さが同じ中間ベクトルに対して特徴変換を行って所定数の登録声紋特徴ベクトルを取得するように配置される変換モジュールと、
前記所定数の登録声紋特徴ベクトルを融合し、前記ユーザの登録声紋ベクトルを生成するように配置される融合モジュールと、を備える
ことを特徴とする請求項11に記載の装置。 - 前記更新モジュールは、
前記ユーザが記憶した各声紋特徴ベクトルに対してデータ正規化演算を行い、データ正規化演算後のベクトルを加算し、前記ユーザが記憶した声紋特徴ベクトルの和を求めるように配置される第1計算サブモジュールと、
前記登録音声データの数に前記登録声紋ベクトルを乗じて、登録声紋ベクトルの積を取得するように配置される第2計算サブモジュールと、
前記声紋特徴ベクトルの和と前記登録声紋ベクトルの積とのベクトル和を計算し、前記ユーザが記憶した音声データの数と前記登録音声データの数との数の和を計算し、前記数の和で前記ベクトル和を割って更新した登録声紋ベクトルを取得するように配置される更新サブモジュールと、を備える
ことを特徴とする請求項11に記載の装置。 - 前記更新ユニットは、さらに、
前記ユーザが記憶した音声データを削除するように配置される
ことを特徴とする請求項11に記載の装置。 - 前記取得モジュールは、
前記ユーザが記憶した音声データと、音声データの入力時点を含む前記音声データの関連情報とを取得するように配置される第1取得サブモジュールと、
前記入力時点が予め設定した時間分割点より早い音声データを削除し、残った音声データを登録音声データとするように配置される第1削除サブモジュールと、を備える
ことを特徴とする請求項13に記載の装置。 - 前記取得モジュールは、
クラスタリングアルゴリズムによって前記ユーザが記憶した音声データをクラスタリングし、少なくとも1つの記憶した音声データのクラスタを生成するように配置される生成サブモジュールと、
各クラスタの中心点を取得するように配置される第2取得サブモジュールと、
距離アルゴリズムによって各記憶した音声データと各記憶した音声データが所在するクラスタの中心点との距離を計算するように配置される計算サブモジュールと、
前記距離が予め設定した距離閾値より大きい音声データを削除し、残った音声データを登録音声データとするように配置される第2削除サブモジュールと、を備える
ことを特徴とする請求項13に記載の装置。 - 前記関連情報は、音声データの収集装置タイプ、音声データの入力場所のうちの少なくとも1つをさらに含み、
前記装置は、
各クラスタにおける音声データと、前記各クラスタにおける音声データの関連情報とを取得するように配置される第1取得ユニットと、
各クラスタの音声データによって前記ユーザの各登録声紋ベクトルを再生成し、前記各クラスタの音声データの関連情報に基づいて各登録声紋ベクトルの関連情報を生成するように配置される再生成ユニットと、をさらに備える
ことを特徴とする請求項16に記載の装置。 - 前記音声データの関連情報を取得するように配置される第2取得ユニットをさらに備えており、
前記マッチングユニットは、
前記音声データの関連情報と各登録声紋ベクトルの関連情報とのマッチング度に基づいて、登録声紋ベクトルを選択するように配置される選択モジュールと、
前記声紋特徴ベクトルと選択した登録声紋ベクトルとをマッチングするように配置されるマッチングモジュールと、を備える
ことを特徴とする請求項18に記載の装置。 - 前記マッチング度が予め設定した成功閾値以上であるかどうかを決定するように配置される第2決定ユニットと、
前記マッチング度が予め設定した成功閾値以上であると決定したことに応答して、ユーザ身元認証が成功と決定して認証成功に対応する操作を実行するように配置される実行ユニットと、を備える
ことを特徴とする請求項11に記載の装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201611031726.7A CN106782564B (zh) | 2016-11-18 | 2016-11-18 | 用于处理语音数据的方法和装置 |
| CN201611031726.7 | 2016-11-18 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018081297A JP2018081297A (ja) | 2018-05-24 |
| JP6429945B2 true JP6429945B2 (ja) | 2018-11-28 |
Family
ID=58970925
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017109505A Expired - Fee Related JP6429945B2 (ja) | 2016-11-18 | 2017-06-01 | 音声データを処理するための方法及び装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (2) | US10140984B2 (ja) |
| JP (1) | JP6429945B2 (ja) |
| CN (1) | CN106782564B (ja) |
Families Citing this family (66)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105656887A (zh) * | 2015-12-30 | 2016-06-08 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹认证方法以及装置 |
| CN105869645B (zh) * | 2016-03-25 | 2019-04-12 | 腾讯科技(深圳)有限公司 | 语音数据处理方法和装置 |
| CN109145145A (zh) * | 2017-06-16 | 2019-01-04 | 阿里巴巴集团控股有限公司 | 一种数据更新方法、客户端及电子设备 |
| CN109147770B (zh) | 2017-06-16 | 2023-07-28 | 阿里巴巴集团控股有限公司 | 声音识别特征的优化、动态注册方法、客户端和服务器 |
| CN108335695B (zh) * | 2017-06-27 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 语音控制方法、装置、计算机设备和存储介质 |
| CN109215643B (zh) * | 2017-07-05 | 2023-10-24 | 阿里巴巴集团控股有限公司 | 一种交互方法、电子设备及服务器 |
| CN107623614B (zh) * | 2017-09-19 | 2020-12-08 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
| EP3698358B1 (en) | 2017-10-18 | 2025-03-05 | Soapbox Labs Ltd. | Methods and systems for processing audio signals containing speech data |
| CN107895578B (zh) * | 2017-11-15 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 语音交互方法和装置 |
| CN107863108B (zh) * | 2017-11-16 | 2021-03-23 | 百度在线网络技术(北京)有限公司 | 信息输出方法和装置 |
| CN107978311B (zh) * | 2017-11-24 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置以及语音交互设备 |
| CN108257604B (zh) * | 2017-12-08 | 2021-01-08 | 平安普惠企业管理有限公司 | 语音识别方法、终端设备及计算机可读存储介质 |
| EP4246508A3 (en) * | 2017-12-27 | 2023-11-15 | Rovi Guides, Inc. | Systems and methods for identifying users based on voice data and media consumption data |
| CN108231082A (zh) * | 2017-12-29 | 2018-06-29 | 广州势必可赢网络科技有限公司 | 一种自学习声纹识别的更新方法和装置 |
| CN108172230A (zh) * | 2018-01-03 | 2018-06-15 | 平安科技(深圳)有限公司 | 基于声纹识别模型的声纹注册方法、终端装置及存储介质 |
| CN108417226A (zh) * | 2018-01-09 | 2018-08-17 | 平安科技(深圳)有限公司 | 语音对比方法、终端及计算机可读存储介质 |
| CN108460081B (zh) * | 2018-01-12 | 2019-07-12 | 平安科技(深圳)有限公司 | 语音数据库创建方法、声纹注册方法、装置、设备及介质 |
| CN108154371A (zh) * | 2018-01-12 | 2018-06-12 | 平安科技(深圳)有限公司 | 电子装置、身份验证的方法及存储介质 |
| CN108269575B (zh) * | 2018-01-12 | 2021-11-02 | 平安科技(深圳)有限公司 | 更新声纹数据的语音识别方法、终端装置及存储介质 |
| CN108564955B (zh) * | 2018-03-19 | 2019-09-03 | 平安科技(深圳)有限公司 | 电子装置、身份验证方法和计算机可读存储介质 |
| CN108737872A (zh) * | 2018-06-08 | 2018-11-02 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
| CN110853674A (zh) * | 2018-07-24 | 2020-02-28 | 中兴通讯股份有限公司 | 文本核对方法、设备以及计算机可读存储介质 |
| KR102483833B1 (ko) * | 2018-08-07 | 2023-01-04 | 삼성전자주식회사 | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 |
| US11004454B1 (en) * | 2018-11-06 | 2021-05-11 | Amazon Technologies, Inc. | Voice profile updating |
| CN111179940A (zh) * | 2018-11-12 | 2020-05-19 | 阿里巴巴集团控股有限公司 | 一种语音识别方法、装置及计算设备 |
| CN111292733A (zh) * | 2018-12-06 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 一种语音交互方法和装置 |
| US12021864B2 (en) | 2019-01-08 | 2024-06-25 | Fidelity Information Services, Llc. | Systems and methods for contactless authentication using voice recognition |
| US12014740B2 (en) * | 2019-01-08 | 2024-06-18 | Fidelity Information Services, Llc | Systems and methods for contactless authentication using voice recognition |
| CN109801634B (zh) * | 2019-01-31 | 2021-05-18 | 北京声智科技有限公司 | 一种声纹特征的融合方法及装置 |
| US11200886B2 (en) * | 2019-04-02 | 2021-12-14 | Accenture Global Solutions Limited | System and method for training a virtual agent to identify a user's intent from a conversation |
| CN110085209B (zh) * | 2019-04-11 | 2021-07-23 | 广州多益网络股份有限公司 | 一种音色筛选方法及装置 |
| CN110400567B (zh) * | 2019-07-30 | 2021-10-19 | 深圳秋田微电子股份有限公司 | 注册声纹动态更新方法及计算机存储介质 |
| CN110689894B (zh) * | 2019-08-15 | 2022-03-29 | 深圳市声扬科技有限公司 | 自动注册方法及装置、智能设备 |
| CN110648671A (zh) * | 2019-08-21 | 2020-01-03 | 广州国音智能科技有限公司 | 声纹模型重建方法、终端、装置及可读存储介质 |
| CN110473552A (zh) * | 2019-09-04 | 2019-11-19 | 平安科技(深圳)有限公司 | 语音识别认证方法及系统 |
| CN110534117B (zh) * | 2019-09-10 | 2022-11-25 | 阿波罗智联(北京)科技有限公司 | 用于优化语音生成模型的方法、装置、设备和计算机介质 |
| CN110600040B (zh) * | 2019-09-19 | 2021-05-25 | 北京三快在线科技有限公司 | 声纹特征注册方法、装置、计算机设备及存储介质 |
| CN110660398B (zh) * | 2019-09-19 | 2020-11-20 | 北京三快在线科技有限公司 | 声纹特征更新方法、装置、计算机设备及存储介质 |
| CN110956966B (zh) * | 2019-11-01 | 2023-09-19 | 平安科技(深圳)有限公司 | 声纹认证方法、装置、介质及电子设备 |
| US11488581B1 (en) * | 2019-12-06 | 2022-11-01 | Amazon Technologies, Inc. | System and method of providing recovery for automatic speech recognition errors for named entities |
| CN111091837A (zh) * | 2019-12-27 | 2020-05-01 | 中国人民解放军陆军工程大学 | 一种基于在线学习的时变声纹认证方法及系统 |
| CN111341325A (zh) * | 2020-02-13 | 2020-06-26 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、存储介质、电子装置 |
| CN117476038A (zh) * | 2020-05-21 | 2024-01-30 | 北京百度网讯科技有限公司 | 模型评测方法、装置及电子设备 |
| CN111681681A (zh) * | 2020-05-22 | 2020-09-18 | 深圳壹账通智能科技有限公司 | 语音情绪识别方法、装置、电子设备及存储介质 |
| US11664033B2 (en) * | 2020-06-15 | 2023-05-30 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
| TWI807203B (zh) * | 2020-07-28 | 2023-07-01 | 華碩電腦股份有限公司 | 聲音辨識方法及使用其之電子裝置 |
| CN111968645B (zh) * | 2020-09-09 | 2022-11-11 | 重庆电子工程职业学院 | 一种个性化的语音控制系统 |
| CN112289322B (zh) * | 2020-11-10 | 2022-11-15 | 思必驰科技股份有限公司 | 声纹识别方法和装置 |
| CN112489678B (zh) * | 2020-11-13 | 2023-12-05 | 深圳市云网万店科技有限公司 | 一种基于信道特征的场景识别方法及装置 |
| CN112528068B (zh) * | 2020-11-13 | 2024-06-28 | 中信银行股份有限公司 | 声纹特征存储方法、声纹特征匹配方法、装置及电子设备 |
| CN112328994A (zh) * | 2020-11-17 | 2021-02-05 | 携程计算机技术(上海)有限公司 | 声纹数据处理方法、装置、电子设备和存储介质 |
| CN112750440B (zh) * | 2020-12-30 | 2023-12-29 | 北京捷通华声科技股份有限公司 | 一种信息处理方法及装置 |
| CN112992181A (zh) * | 2021-02-08 | 2021-06-18 | 上海哔哩哔哩科技有限公司 | 音频分类方法及装置 |
| CN112802482B (zh) * | 2021-04-15 | 2021-07-23 | 北京远鉴信息技术有限公司 | 一种声纹串并的识别方法、单兵系统及存储介质 |
| CN112966252B (zh) * | 2021-04-26 | 2023-11-24 | 平安国际智慧城市科技股份有限公司 | 一种基于密码技术的客户端验证方法、装置、电子设备及介质 |
| CN115310066A (zh) * | 2021-05-07 | 2022-11-08 | 华为技术有限公司 | 一种升级方法、装置及电子设备 |
| CN113448975B (zh) * | 2021-05-26 | 2023-01-17 | 科大讯飞股份有限公司 | 一种人物画像库的更新方法、装置、系统和存储介质 |
| CN113987432A (zh) * | 2021-10-13 | 2022-01-28 | 中国工商银行股份有限公司 | 角色授权方法、装置、计算机设备和存储介质 |
| CN116168708A (zh) * | 2021-11-25 | 2023-05-26 | 华为技术有限公司 | 声纹模板更新方法及相关设备 |
| CN114187916B (zh) * | 2021-12-14 | 2025-11-25 | 四川启睿克科技有限公司 | 一种免注册声纹识别方法及系统 |
| CN114387976B (zh) * | 2021-12-24 | 2024-05-14 | 西北工业大学 | 一种基于声纹特征及语义压缩的水声语音数字通信方法 |
| CN115019806B (zh) * | 2021-12-28 | 2025-02-25 | 北京荣耀终端有限公司 | 声纹识别方法和装置 |
| CN115019808B (zh) * | 2022-06-01 | 2025-07-11 | 科大讯飞股份有限公司 | 声纹提取方法、装置、设备及可读存储介质 |
| CN116129901B (zh) * | 2022-08-30 | 2025-07-18 | 马上消费金融股份有限公司 | 语音识别方法、装置、电子设备及可读存储介质 |
| WO2024049311A1 (en) * | 2022-08-30 | 2024-03-07 | Biometriq Sp. Z O.O. | Method of selecting the optimal voiceprint |
| CN117457006B (zh) * | 2023-12-25 | 2024-03-12 | 北京语艺星光文化传媒有限公司 | 用于3d打印手办的配音决策方法及配音决策系统 |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002229955A (ja) * | 2001-02-02 | 2002-08-16 | Matsushita Electric Ind Co Ltd | 情報端末装置及び認証システム |
| US7240007B2 (en) * | 2001-12-13 | 2007-07-03 | Matsushita Electric Industrial Co., Ltd. | Speaker authentication by fusion of voiceprint match attempt results with additional information |
| FR2842643B1 (fr) * | 2002-07-22 | 2004-09-03 | France Telecom | Normalisation de score de verification dans un dispositif de reconnaissance vocale de locuteur |
| GB2391373A (en) * | 2002-07-31 | 2004-02-04 | David Toms | A system for the automatic detection of a fraudulent transaction |
| US8116436B2 (en) * | 2005-02-24 | 2012-02-14 | Grape Technology Group, Inc. | Technique for verifying identities of users of a communications service by voiceprints |
| CN1941080A (zh) * | 2005-09-26 | 2007-04-04 | 吴田平 | 一种楼宇对讲门口机声纹识别开锁模块及识别开锁方法 |
| US7539616B2 (en) * | 2006-02-20 | 2009-05-26 | Microsoft Corporation | Speaker authentication using adapted background models |
| US20070219801A1 (en) * | 2006-03-14 | 2007-09-20 | Prabha Sundaram | System, method and computer program product for updating a biometric model based on changes in a biometric feature of a user |
| US7995713B2 (en) * | 2006-04-03 | 2011-08-09 | Agere Systems Inc. | Voice-identification-based signal processing for multiple-talker applications |
| JP4743053B2 (ja) * | 2006-09-06 | 2011-08-10 | ヤマハ株式会社 | 生体認証装置、生体認証方法およびプログラム |
| US8537978B2 (en) * | 2008-10-06 | 2013-09-17 | International Business Machines Corporation | Method and system for using conversational biometrics and speaker identification/verification to filter voice streams |
| JP5042194B2 (ja) * | 2008-10-27 | 2012-10-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 話者テンプレートを更新する装置及び方法 |
| CN102543084A (zh) * | 2010-12-29 | 2012-07-04 | 盛乐信息技术(上海)有限公司 | 在线声纹认证系统及其实现方法 |
| CN102238189B (zh) * | 2011-08-01 | 2013-12-11 | 安徽科大讯飞信息科技股份有限公司 | 声纹密码认证方法及系统 |
| US9237232B1 (en) * | 2013-03-14 | 2016-01-12 | Verint Americas Inc. | Recording infrastructure having biometrics engine and analytics service |
| GB2517952B (en) * | 2013-09-05 | 2017-05-31 | Barclays Bank Plc | Biometric verification using predicted signatures |
| CN103632667B (zh) * | 2013-11-25 | 2017-08-04 | 华为技术有限公司 | 声学模型优化方法、装置及语音唤醒方法、装置和终端 |
| WO2016015687A1 (zh) | 2014-07-31 | 2016-02-04 | 腾讯科技(深圳)有限公司 | 声纹验证方法及装置 |
| CN104219050B (zh) * | 2014-08-08 | 2015-11-11 | 腾讯科技(深圳)有限公司 | 声纹验证方法、服务器、客户端及系统 |
| CN105575391B (zh) * | 2014-10-10 | 2020-04-03 | 阿里巴巴集团控股有限公司 | 声纹信息管理方法、装置以及身份认证方法、系统 |
| CN104616655B (zh) * | 2015-02-05 | 2018-01-16 | 北京得意音通技术有限责任公司 | 声纹模型自动重建的方法和装置 |
| CN105869645B (zh) * | 2016-03-25 | 2019-04-12 | 腾讯科技(深圳)有限公司 | 语音数据处理方法和装置 |
-
2016
- 2016-11-18 CN CN201611031726.7A patent/CN106782564B/zh active Active
-
2017
- 2017-06-01 JP JP2017109505A patent/JP6429945B2/ja not_active Expired - Fee Related
- 2017-06-06 US US15/615,512 patent/US10140984B2/en active Active
-
2018
- 2018-10-25 US US16/170,939 patent/US10825452B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN106782564B (zh) | 2018-09-11 |
| US10140984B2 (en) | 2018-11-27 |
| US10825452B2 (en) | 2020-11-03 |
| US20180144742A1 (en) | 2018-05-24 |
| US20190066665A1 (en) | 2019-02-28 |
| JP2018081297A (ja) | 2018-05-24 |
| CN106782564A (zh) | 2017-05-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6429945B2 (ja) | 音声データを処理するための方法及び装置 | |
| CN106683680B (zh) | 说话人识别方法及装置、计算机设备及计算机可读介质 | |
| JP6502512B2 (ja) | 動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法 | |
| CN107610709B (zh) | 一种训练声纹识别模型的方法及系统 | |
| CN107492379B (zh) | 一种声纹创建与注册方法及装置 | |
| JP6621536B2 (ja) | 電子装置、身元認証方法、システム及びコンピュータ読み取り可能な記憶媒体 | |
| CN107517207A (zh) | 服务器、身份验证方法及计算机可读存储介质 | |
| CN112466314A (zh) | 情感语音数据转换方法、装置、计算机设备及存储介质 | |
| WO2021082420A1 (zh) | 声纹认证方法、装置、介质及电子设备 | |
| CN107221320A (zh) | 训练声学特征提取模型的方法、装置、设备和计算机存储介质 | |
| CN107481720A (zh) | 一种显式声纹识别方法及装置 | |
| WO2019179029A1 (zh) | 电子装置、身份验证方法和计算机可读存储介质 | |
| Tiwari et al. | Virtual home assistant for voice based controlling and scheduling with short speech speaker identification | |
| CN110648671A (zh) | 声纹模型重建方法、终端、装置及可读存储介质 | |
| US20100045787A1 (en) | Authenticating apparatus, authenticating system, and authenticating method | |
| CN111613230A (zh) | 声纹验证方法、装置、设备及存储介质 | |
| CN109688271A (zh) | 联系人信息输入的方法、装置及终端设备 | |
| CN113808577A (zh) | 语音摘要的智能提取方法、装置、电子设备及存储介质 | |
| CN109614780B (zh) | 生物信息认证方法及装置、存储介质、电子设备 | |
| US10446138B2 (en) | System and method for assessing audio files for transcription services | |
| CN116486789A (zh) | 语音识别模型的生成方法、语音识别方法、装置及设备 | |
| CN110580905A (zh) | 识别装置及方法 | |
| CN114882890A (zh) | 深度学习模型的训练方法、声纹识别方法、装置和设备 | |
| CN113035230A (zh) | 认证模型的训练方法、装置及电子设备 | |
| TW201944320A (zh) | 支付認證方法、裝置、設備及存儲介質 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180703 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180921 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181009 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181030 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6429945 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |