JP2010078990A - 基本周波数変化量抽出装置、方法及びプログラム - Google Patents
基本周波数変化量抽出装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2010078990A JP2010078990A JP2008248000A JP2008248000A JP2010078990A JP 2010078990 A JP2010078990 A JP 2010078990A JP 2008248000 A JP2008248000 A JP 2008248000A JP 2008248000 A JP2008248000 A JP 2008248000A JP 2010078990 A JP2010078990 A JP 2010078990A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- logarithmic
- straight line
- unit
- fundamental frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
【解決手段】対数周波数スペクトログラム計算部101は、フレーム毎に入力された音声信号について、対数周波数スペクトログラムを計算する。ハフ変換部102は、対数周波数スペクトログラム計算部101が計算した対数周波数スペクトログラムについて、周波数成分の強さを用いて投票を行うことにより、直線を検出するためのハフ変換を行う。直線群抽出部103は、ハフ変換部102が出力した投票値を用いて、基本周波数変化量の計算に用いる対象となる直線群と対象投票値とを抽出する。基本周波数変化量計算部104は、直線群抽出部103が抽出した直線群に含まれる個々の直線の傾きと対象投票値とを用いて、基本周波数変化量を計算する。
【選択図】 図2
Description
102 ハフ変換部
103 直線群抽出部
Claims (9)
- 入力された音声信号に基づいて、対数周波数軸上で等間隔に求められた周波数成分からなる対数周波数スペクトルであって時刻毎に当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結した対数周波数スペクトログラムを計算する対数周波数スペクトログラム計算部と、
前記対数周波数スペクトログラムの時系列の各時刻において、当該対数周波数スペクトログラムについて周波数成分の強さを用いて投票を行うことにより、直線を検出するためのハフ変換を行うハフ変換部と、
前記投票の結果である投票値を用いて、直線の集まりである直線群と、周波数成分の強さが第1閾値より大きい投票値又は周波数成分の強さの大きい順に所定の順位以内の投票値とを抽出する直線群抽出部と、
前記直線群に含まれる個々の直線の傾きと抽出された前記投票値とを用いて、基本周波数の時間変化量を計算する基本周波数変化量計算部と、
を備えることを特徴とする基本周波数変化量抽出装置。 - 前記基本周波数変化量計算部は、
任意の傾き毎に、当該傾きを共通に持つ前記直線について抽出された前記投票値を加算する対象投票値加算部と、
任意の傾きから、加算された前記投票値の総和の最大値を与える傾きを抽出する傾き抽出部と、
抽出された傾きを用いて、基本周波数の時間変化量を計算する基本周波数変化量算出部と、
を有することを特徴とする請求項1に記載の基本周波数変化量抽出装置。 - 前記基本周波数変化量算出部は、抽出された傾きと、線形周波数軸上における周波数の最大値と、線形周波数軸上における周波数の最小値とを用いて、基本周波数の時間変化量を計算することを特徴とする請求項2に記載の基本周波数変化量抽出装置。
- 前記対数周波数スペクトログラムから、周波数成分の強さが第2閾値より大きい特徴点又は周波数成分の強さの大きい順に所定の順位以内の特徴点を抽出する特徴点抽出部を更に備え、
前記ハフ変換部は、抽出された前記特徴点の周波数成分の強さのみを用いて投票を行うことにより、前記ハフ変換を行うことを特徴とする請求項1乃至請求項3のいずれか1項に記載の基本周波数変化量抽出装置。 - 前記特徴点抽出部は、前記対数周波数スペクトログラムの各点に対して、周波数成分の強さと前記第2閾値との比較を行い、周波数成分の強さが前記第2閾値より大きい点を前記特徴点として抽出することを特徴とする請求項4に記載の基本周波数変化量抽出装置。
- 前記特徴点抽出部は、前記対数周波数スペクトログラムの各点に対して、周波数成分の強さの大きい順に所定の順位以内の点を前記特徴点として抽出することを特徴とする請求項4に記載の基本周波数変化量抽出装置。
- 前記対数周波数スペクトログラム計算部は、
所定の間隔の時刻毎に所定の時間範囲に分解された前記音声信号であるフレーム毎に周波数分析を行い、前記対数周波数スペクトルを計算する周波数分析部と、
時刻毎に、当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結する対数周波数スペクトログラム連結部と、
を有することを特徴とする請求項1乃至請求項6のいずれか1項に記載の基本周波数変化量抽出装置。 - 対数周波数スペクトログラム計算部と、ハフ変換部と、直線群抽出部と、基本周波数変化量計算部とを備える基本周波数変化量抽出装置で実行される基本周波数変化量抽出方法であって、
前記対数周波数スペクトログラム計算部が、入力された音声信号に基づいて、対数周波数軸上で等間隔に求められた周波数成分からなる対数周波数スペクトルであって時刻毎に当該時刻を含む所定の時間範囲の対数周波数スペクトルを連結した対数周波数スペクトログラムを計算する対数周波数スペクトログラム計算ステップと、
前記ハフ変換部が、前記対数周波数スペクトログラムの時系列の各時刻において、当該対数周波数スペクトログラムについて周波数成分の強さを用いて投票を行うことにより、直線を検出するためのハフ変換を行うハフ変換ステップと、
前記直線群抽出部が、前記投票の結果である投票値を用いて、直線の集まりである直線群と、周波数成分の強さが第1閾値より大きい投票値又は周波数成分の強さの大きい順に所定の順位以内の投票値とを抽出する直線群抽出ステップと、
前記基本周波数変化量計算部が、前記直線群に含まれる個々の直線の傾きと抽出された前記投票値とを用いて、基本周波数の時間変化量を計算する基本周波数変化量計算ステップと、
を含むことを特徴とする基本周波数変化量抽出方法。 - 請求項8に記載の基本周波数変化量抽出方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008248000A JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
| US12/556,382 US8554546B2 (en) | 2008-09-26 | 2009-09-09 | Apparatus and method for calculating a fundamental frequency change |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008248000A JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010078990A true JP2010078990A (ja) | 2010-04-08 |
| JP4585590B2 JP4585590B2 (ja) | 2010-11-24 |
Family
ID=42058385
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008248000A Active JP4585590B2 (ja) | 2008-09-26 | 2008-09-26 | 基本周波数変化量抽出装置、方法及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US8554546B2 (ja) |
| JP (1) | JP4585590B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013046629A1 (ja) * | 2011-09-30 | 2013-04-04 | 旭化成株式会社 | 基本周波数抽出装置および基本周波数抽出方法 |
| WO2021137419A1 (ko) * | 2019-12-31 | 2021-07-08 | 브레인소프트 주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
| US12300265B2 (en) | 2019-12-31 | 2025-05-13 | Brainsoft Inc. | Sound processing method using DJ transform |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101996628A (zh) * | 2009-08-21 | 2011-03-30 | 索尼株式会社 | 提取语音信号的韵律特征的方法和装置 |
| US9965685B2 (en) * | 2015-06-12 | 2018-05-08 | Google Llc | Method and system for detecting an audio event for smart home devices |
| CN114038474B (zh) * | 2021-12-20 | 2025-05-27 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频合成方法、终端设备及计算机可读存储介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009047831A (ja) * | 2007-08-17 | 2009-03-05 | Toshiba Corp | 特徴量抽出装置、プログラムおよび特徴量抽出方法 |
| JP4599420B2 (ja) * | 2008-02-29 | 2010-12-15 | 株式会社東芝 | 特徴量抽出装置 |
-
2008
- 2008-09-26 JP JP2008248000A patent/JP4585590B2/ja active Active
-
2009
- 2009-09-09 US US12/556,382 patent/US8554546B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2940835B2 (ja) * | 1991-03-18 | 1999-08-25 | 日本電信電話株式会社 | ピッチ周波数差分特徴量抽出法 |
Non-Patent Citations (2)
| Title |
|---|
| CSNG200301457004, 岩野公司 関 高浩 古井貞熙, "雑音に頑健な基本周波数抽出法とその音声認識ヘの適用", 電子情報通信学会技術研究報告, 20020419, Vol.102 No.35 * |
| CSNG200400033002, 関 高浩 岩野 公司 古井 貞熙, "ハフ変換による雑音に頑健な基本周波数抽出法", 情報処理学会研究報告, 20011019, Vol.2001 No.100, pp.9−14 * |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2013046629A1 (ja) * | 2011-09-30 | 2013-04-04 | 旭化成株式会社 | 基本周波数抽出装置および基本周波数抽出方法 |
| WO2021137419A1 (ko) * | 2019-12-31 | 2021-07-08 | 브레인소프트 주식회사 | 디제이변환에 기초한 기본주파수 추출 방법 |
| US11574646B2 (en) | 2019-12-31 | 2023-02-07 | Brainsoft Inc. | Fundamental frequency extraction method using DJ transform |
| US12300265B2 (en) | 2019-12-31 | 2025-05-13 | Brainsoft Inc. | Sound processing method using DJ transform |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4585590B2 (ja) | 2010-11-24 |
| US8554546B2 (en) | 2013-10-08 |
| US20100082336A1 (en) | 2010-04-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8073686B2 (en) | Apparatus, method and computer program product for feature extraction | |
| US8831942B1 (en) | System and method for pitch based gender identification with suspicious speaker detection | |
| JP2009047831A (ja) | 特徴量抽出装置、プログラムおよび特徴量抽出方法 | |
| JP4264841B2 (ja) | 音声認識装置および音声認識方法、並びに、プログラム | |
| JP5949550B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
| JP4585590B2 (ja) | 基本周波数変化量抽出装置、方法及びプログラム | |
| JP2000298475A (ja) | 和音判定装置、方法及び記録媒体 | |
| KR20080065910A (ko) | 정보처리장치 및 방법과 프로그램 | |
| CN106157974A (zh) | 文本背诵质量评估装置和方法 | |
| RU2559689C2 (ru) | Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа | |
| Mitev et al. | Fundamental frequency estimation of voice of patients with laryngeal disorders | |
| JP4182444B2 (ja) | 信号処理装置、信号処理方法、及びプログラム | |
| JP2010060846A (ja) | 合成音声評価システム及び合成音声評価方法 | |
| JP5924968B2 (ja) | 楽譜位置推定装置、及び楽譜位置推定方法 | |
| Yarra et al. | A mode-shape classification technique for robust speech rate estimation and syllable nuclei detection | |
| JP2006195449A (ja) | 声質判定装置、声質判定方法、および声質判定プログラム | |
| Ni et al. | Quantitative and structural modeling of voice fundamental frequency contours of speech in Mandarin | |
| KR100744288B1 (ko) | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 | |
| JP4630183B2 (ja) | 音声信号分析装置、音声信号分析方法及び音声信号分析プログラム | |
| Płonkowski | Using bands of frequencies for vowel recognition for Polish language | |
| JP4839970B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
| JP4760179B2 (ja) | 音声特徴量算出装置およびプログラム | |
| JP4362072B2 (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
| KR101250051B1 (ko) | 발음 교정을 위한 음성 신호 분석 방법 및 장치 | |
| JP2009086476A (ja) | 音声処理装置、音声処理方法、およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100721 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100810 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100903 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 4585590 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 3 |