JP4970371B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP4970371B2 JP4970371B2 JP2008184897A JP2008184897A JP4970371B2 JP 4970371 B2 JP4970371 B2 JP 4970371B2 JP 2008184897 A JP2008184897 A JP 2008184897A JP 2008184897 A JP2008184897 A JP 2008184897A JP 4970371 B2 JP4970371 B2 JP 4970371B2
- Authority
- JP
- Japan
- Prior art keywords
- differential wave
- vocal cord
- source differential
- voice
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
Alku, P., Backstrom, T., & Vilkman, E. (2002). Normalized amplitude quotient for parameterization of the glottal flow. Journal of the Acoustic Society of America: 112(2), 701-710.
このような積分処理を行うと、αが1.0に近い場合、−6dB/octの特性が付加される。残差波形はフラットな周波数特性を有するため、積分処理を行うことで、−6dB/octの特性を付加することができる。なお、残差波形から声帯音源微分波を得る処理は積分処理に限定することはなく、例えば−6dB/octの特性を有するFIRフィルタによって処理しても良い。
Claims (6)
- 音声を入力する入力手段と、
前記入力手段によって入力された音声をフレームに区分する区分手段と、
前記区分手段から出力されたフレーム音声に対して線形予測分析を行って、線形予測の残差波形を算出し、この残差波形に基づいて声帯音源波に放射特性を加えた声帯音源微分波を推定する声帯音源微分波演算手段と、
前記区分手段によって区分されるフレーム音声から基本周期を算出する基本周期演算手段と、
前記声帯音源微分波演算手段によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がりの最小位置と最大位置とを特定して、急峻な立ち上がりの最大位置と次の急峻な立ち上がりの最小位置とを結ぶ線分を取得し、取得した前記線分を一辺とする領域と前記声帯音源微分波の領域との差分から声の強弱を表す特徴量を算出する特徴量算出手段と
を有することを特徴とする情報処理装置。 - 前記特徴量算出手段は、前記差分の合計値を特徴量として算出することを特徴とする請求項1に記載の情報処理装置。
- 前記特徴量算出手段は、前記差分の荷重和を特徴量として算出することを特徴とする請求項1に記載の情報処理装置。
- 前記基本周期演算手段によってフレーム音声の基本周期が算出されなかった場合、当該フレームに対して前記特徴量算出手段による特徴量の算出を行わないことを特徴とする請求項1に記載の情報処理装置。
- 前記特徴量算出手段は、
前記声帯音源微分波の前記基本周期ごとの急峻な波形の立ち上がりの最小位置と最大位置を、前記基本周期ごとに声帯音源微分波を微分して得られる値が最大値のサンプルから前後に前記微分して得られる値が前記最大値の所定の割合以上のサンプルが連続する区間から探索することを特徴とする請求項1に記載の情報処理装置。 - 入力された音声をフレームに区分する区分機能と、
前記区分機能によって得られるフレーム音声に対して線形予測分析を行って、線形予測の残差波形を算出し、この残差波形に基づいて声帯音源波に放射特性を加えた声帯音源微分波を推定する声帯音源微分波演算機能と、
前記区分機能によって区分されるフレーム音声から基本周期を算出する基本周期演算機能と、
前記声帯音源微分波演算機能によって推定された声帯音源微分波に対して、前記基本周期ごとに急峻な立ち上がりの最小位置と最大位置とを特定して、急峻な立ち上がりの最大位置と次の急峻な立ち上がりの最小位置とを結ぶ線分を取得し、取得した前記線分を一辺とする領域と前記声帯音源微分波の領域との差分から声の強弱を表す特徴量を算出する特徴量算出機能と
を有することを特徴とする音声特徴量算出プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008184897A JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008184897A JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010026068A JP2010026068A (ja) | 2010-02-04 |
| JP4970371B2 true JP4970371B2 (ja) | 2012-07-04 |
Family
ID=41731986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008184897A Expired - Fee Related JP4970371B2 (ja) | 2008-07-16 | 2008-07-16 | 情報処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4970371B2 (ja) |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3035939B2 (ja) * | 1989-11-30 | 2000-04-24 | 日本電気株式会社 | 音声分析合成装置 |
| JPH1185197A (ja) * | 1997-09-02 | 1999-03-30 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 音声信号分析装置 |
| JP3166673B2 (ja) * | 1997-09-08 | 2001-05-14 | 日本電気株式会社 | ボコーダ符号化復号装置 |
| JP3673507B2 (ja) * | 2002-05-16 | 2005-07-20 | 独立行政法人科学技術振興機構 | 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム |
| JP4177751B2 (ja) * | 2003-12-25 | 2008-11-05 | 株式会社国際電気通信基礎技術研究所 | 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ |
-
2008
- 2008-07-16 JP JP2008184897A patent/JP4970371B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010026068A (ja) | 2010-02-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20200160839A1 (en) | Method and system for generating advanced feature discrimination vectors for use in speech recognition | |
| CN107657964A (zh) | 基于声学特征和稀疏数学的抑郁症辅助检测方法及分类器 | |
| Martinez et al. | Prosodic features and formant modeling for an ivector-based language recognition system | |
| JPH10133693A (ja) | 音声認識装置 | |
| CN102222499B (zh) | 声音判别系统、声音判别方法以及声音判别用程序 | |
| Subhashree et al. | Speech emotion recognition: performance analysis based on fused algorithms and GMM modelling | |
| Chandrashekar et al. | Breathiness indices for classification of dysarthria based on type and speech intelligibility | |
| Přibil et al. | GMM-based speaker gender and age classification after voice conversion | |
| Dissen et al. | Formant Estimation and Tracking Using Deep Learning. | |
| Jena et al. | Gender recognition of speech signal using knn and svm | |
| Hosain et al. | Deep-learning-based speech emotion recognition using synthetic bone-conducted speech | |
| Submitter et al. | Gender recognition and classification of speech signal | |
| JP7159655B2 (ja) | 感情推定システムおよびプログラム | |
| WO2003098597A1 (en) | Syllabic kernel extraction apparatus and program product thereof | |
| Badr et al. | Estimating age in short utterances based on multi-class classification approach | |
| JP2017520016A5 (ja) | パラメトリック音声合成システムに基づく声門パルスモデルの励起信号形成方法 | |
| Ahmed et al. | Enhancing English accent identification in automatic speech recognition using spectral features and hybrid CNN-BiLSTM model | |
| JP2007219286A (ja) | 音声のスタイル検出装置、その方法およびそのプログラム | |
| Gowda et al. | Formant tracking using quasi-closed phase forward-backward linear prediction analysis and deep neural networks | |
| Mohanta et al. | Classifying emotional states using pitch and formants in vowel regions | |
| Srinivasan et al. | Classification of Normal and Pathological Voice using GA and SVM | |
| JP4970371B2 (ja) | 情報処理装置 | |
| Mannem et al. | Acoustic and Articulatory Feature Based Speech Rate Estimation Using a Convolutional Dense Neural Network. | |
| Deshpande et al. | A Speech Emotion Recognition System for Improved Communication and Enhancing Human-Machine Interaction | |
| Hora et al. | Linear frequency residual cepstral coefficients for speech emotion recognition |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101119 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101119 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111212 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120215 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120404 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |