TWI718716B - 樂器音階觸發的偵測方法 - Google Patents
樂器音階觸發的偵測方法 Download PDFInfo
- Publication number
- TWI718716B TWI718716B TW108138320A TW108138320A TWI718716B TW I718716 B TWI718716 B TW I718716B TW 108138320 A TW108138320 A TW 108138320A TW 108138320 A TW108138320 A TW 108138320A TW I718716 B TWI718716 B TW I718716B
- Authority
- TW
- Taiwan
- Prior art keywords
- scale
- sound signal
- frequency
- trigger
- musical instrument
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000001960 triggered effect Effects 0.000 title claims abstract description 11
- 230000005236 sound signal Effects 0.000 claims abstract description 84
- 230000000694 effects Effects 0.000 claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 238000001514 detection method Methods 0.000 claims description 25
- 238000009527 percussion Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000005457 optimization Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
Abstract
本揭露提供一種樂器音階觸發的偵測方法,包含:輸入一目標樂器的各音階的聲音訊號;將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號;對該無膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表;將該初階特徵值表進行特徵值優化以獲得一最終特徵值表;連續輸入一待測聲音訊號;將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號;對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號;將該待測頻域訊號與該最終特徵值表,以決定該目標樂器的某音階是否被觸發的偵測結果。
Description
本發明係有關一種樂器音階觸發的偵測方法。
打擊樂器(或稱敲擊樂器)除了在音樂與音樂教育市場佔有相當比例外、打擊樂器的迷你版或簡化版更是個歷久不衰的經典玩具,例如,最簡單的組合就是一組可分別發出Do、Re、Mi、Fa、So、La、Si、Do音階、共八個鈴鐺的玩具樂器;構造簡單、對幼兒娛樂、聲音辨識、或音樂啟發來說去有許多功能。另一方面,由於智慧電子產品的日益普及,越來越多的電子產品也加入基於聲音的相關技術以增加使用方便性與市場競爭力。因此,針對前述之打擊樂器類型的玩具,設計一套演算法,在只依靠麥克風收音的情況下偵測那些音階是否有被觸發,並藉由可偵測該樂器是否被觸發的功能,增加該打擊樂器類型的玩具的新玩法,其應用層面將更加廣泛。
本發明之實施例揭露一種樂器音階觸發的偵測方法,包含:一樂器音階特徵值表生成階段、以及一樂器音階觸發偵測階段;其中,該樂器音階特徵值表生成階段更包含:輸入一目標樂器的各音階的聲音訊號;將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號;對該膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表;將該初階特徵值表進行特徵值優化以獲得一最終特徵值表;該樂器音階觸發偵測階段更包含:連續輸入一待測聲音訊號;將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號;對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號;將該待測頻域訊號與該最終特徵值表進行比對,以決定該目標樂器的某音階是否被觸發的偵測結果。
在一較佳實施例中,該膺頻效應處理步驟更包含:將該目標樂器的各音階的聲音訊號進行有限脈衝響應(finite impulse response,FIR) 低通濾波,得到一濾波後訊號;以及,將該將濾波後訊號進行重新取樣,以得到一無膺頻聲音訊號。
在一較佳實施例中,該特徵萃取步驟更包含:將該無膺頻聲音訊號進行音框化,以產生一音框化聲音訊號;將該音框化聲音訊號進行時頻轉換,以得到一頻域訊號;將該頻域訊號進行敲擊聲能量統計平均後得到一敲擊能量特徵;統計被敲擊之音階中最強以及次強的頻率能量特徵,將所有音階的音頻能量統計與敲擊聲能量統計特徵合併獲得初階特徵值表。
在一較佳實施例中,該特徵值優化步驟更包含:將該初階特徵值表進行特徵值交叉對比,係將該初階特徵值表中所有特徵值與其他特徵值兩兩單一對比,檢查是否有音階的頻率特徵彼此太過相近;進行觸發與誤觸發測試,係將該無膺頻聲音訊號輸入,檢查各音階是否有正常觸發以及是否會造成誤觸發之情形;將該初階特徵值表中,由該特徵值交叉對比結果對比出頻率特徵太過相近之音階進行特徵相近之音階門檻值優化;以及,將初階特徵值表中,由將該觸發與誤觸發測試步驟中測試出有誤觸發情形之音階的頻率特徵進行誤觸音階的特徵替換,再次萃取該音階特徵並排除會誤觸發的特徵,全部完成後便獲得一最終特徵值表。
在一較佳實施例中,該將該待測頻域訊號與該最終特徵值表進行比對步驟係將該頻域訊號與該最終特徵值表中所統計的敲擊聲能量特徵進行比對,可判斷該樂器之某音階是否被敲擊,以及樂器敲擊之相對距離。
以下藉由特定的具體實施例說明本發明之實施方式,熟悉此技術之人士可由本說明書所揭示之內容輕易地瞭解本發明之其他優點及功效。本發明亦可藉由其他不同的具體實例加以施行或應用,本發明說明書中的各項細節亦可基於不同觀點與應用在不悖離本發明之精神下進行各種修飾與變更。
其中,本說明書所附圖式繪示之結構、比例、大小等,均僅用以配合說明書所揭示之內容,以供熟悉此技術之人士瞭解與閱讀,並非用以限定本發明可實施之限定條件,故不具技術上之實質意義,任何結構之修飾、比例關之改變或大小之調整,在不影響本發明所能產生之功效及所能達成之目的下,均應落在本發明所揭示之技術內容得能涵蓋之範圍內。
如圖1所示,本發明之實施例揭露一種樂器音階觸發的偵測方法,適用於一具有複數個音階的目標樂器,該偵測方法包含:一樂器音階特徵值表生成階段110、以及一樂器音階觸發偵測階段120;其中,該樂器音階特徵值表生成階段110更包含:步驟111、輸入一目標樂器的各音階的聲音訊號;步驟112、將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號;步驟113、對該膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表;步驟114、將該初階特徵值表進行特徵值優化以獲得一最終特徵值表;該樂器音階觸發偵測階段120更包含:步驟121、連續輸入一待測聲音訊號;步驟122、將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號;步驟123、對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號;步驟124、將該待測頻域訊號與該最終特徵值表進行比對,以決定該目標樂器的某音階是否被觸發的偵測結果。
換言之,本發明之一種樂器音階觸發的偵測方法先在前一階段中將一具有複數個音階的目標樂器的各音階的聲音訊號進行處理,以獲得一包含有該目標樂器的各音階的聲音特徵值的最終特徵值表;然後在後一階段中,持續接收輸入的待測聲音訊號,且藉由比對方式決定該待測聲音訊號是否與該目標樂器的各音階的聲音特徵值相符,以判斷該目標樂器的各音階是否被觸發。
圖2為本發明之樂器音階觸發的偵測方法中對於聲音訊號的膺頻效應處理的流程示意圖;如圖2所示,該膺頻效應處理步驟112更包含:步驟112a、將該目標樂器的各音階的聲音訊號進行有限脈衝響應(finite impulse response,FIR) 低通濾波,得到一濾波後訊號;以及,112b、將該將濾波後訊號進行重新取樣,以得到一無膺頻聲音訊號。
具體而言,該膺頻效應處理步驟主要目的係將原來的聲音訊號中的雜訊濾除,然後再重新取樣,以取得所謂的乾淨無雜訊的聲音訊號。
圖3為本發明之樂器音階觸發的偵測方法中膺頻聲音訊號進行特徵萃取的流程示意圖;如圖3所示,該特徵萃取步驟113更包含:步驟113a、將該無膺頻聲音訊號進行音框化,以產生一音框化聲音訊號;步驟113b、將該音框化聲音訊號進行時頻轉換,以得到一頻域訊號;步驟113c、將該頻域訊號進行敲擊聲能量統計平均後得到一敲擊能量特徵;以及,步驟113d、統計被敲擊之音階中最強以及次強的頻率能量特徵,將所有音階的音頻能量統計與敲擊聲能量統計特徵合併獲得初階特徵值表。
值得說明的是,所謂音框(frame)係先將 N 個取樣點集合成一個觀測單位,稱為音框,通常 N 的值是 256 或 512,涵蓋的時間約為 20~30 ms 左右。為了避免相鄰兩音框的變化過大,通常會讓兩相鄰音框之間有一段重疊區域。值得說明的是,上述之N值、涵蓋的時間長度、以及音框之間是否重疊皆只是習知用來說明本發明之實施例,但在實際應用時並不限於此。再者,在一較佳實施例中,在進行時頻轉換時所使用的轉換方法為快速傅立葉轉換,但也不限於此。同樣地,在一較佳實施例中,在進行敲擊聲能量統計平均中的頻譜能量計算時所使用的計算函式為絕對值函式,但也不限於此。
圖4為本發明之一種樂器音階觸發的偵測方法中特徵值優化的流程示意圖;如圖4所示,該特徵值優化步驟114更包含:步驟114a、將該初階特徵值表進行特徵值交叉對比,係將該初階特徵值表中所有特徵值與其他特徵值兩兩單一對比,檢查是否有音階的頻率特徵彼此太過相近;步驟114b、進行觸發與誤觸發測試,係將該無膺頻聲音訊號輸入,檢查各音階是否有正常觸發以及是否會造成誤觸發之情形;步驟114c、特徵相近之音階門檻值優化,係將該初階特徵值表中,由該特徵值交叉對比結果對比出頻率特徵太過相近之音階進行特徵相近之音階門檻值優化;以及,步驟114d、誤觸音階的特徵替換,係將初階特徵值表中,由將該觸發與誤觸發測試步驟中測試出有誤觸發情形之音階的頻率特徵進行誤觸音階的特徵替換,再次萃取該音階特徵並排除會誤觸發的特徵,全部完成後便獲得一最終特徵值表。
其中,步驟114a中的檢查是否有音階的頻率特徵彼此太過相近的條件,可以依照其頻率特徵的差異是否低於一預定門檻值來判定。再者,在步驟114b中,因為無膺頻聲音訊號代表的是經過濾波後重新取樣的訊號,因此不含其他雜訊;另一方面,所謂誤觸發的情形,指的是該音階的頻率特徵中有超過某一預定門檻值的雜訊,可判定為誤觸發。
值得說明的是,在該樂器音階觸發偵測階段120中的步驟122、將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號,係與在該樂器音階特徵值表生成階段110中的步驟112相同,因此,其細節不在此重複說明;同樣地,在該樂器音階觸發偵測階段120中的步驟123、對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號,與在前述該特徵萃取步驟113中的步驟113a、步驟113b相同,因此其細節也不在此重複。
具體而言,該將該待測頻域訊號與該最終特徵值表進行比對步驟係將該頻域訊號的與該最終特徵值表中所統計的敲擊聲能量特徵進行比對,可判斷該樂器之某音階是否被敲擊,以及樂器敲擊之相對距離。
儘管已參考本申請的許多說明性實施例描述了實施方式,但應瞭解的是,本領域技術人員能夠想到多種其他改變及實施例,這些改變及實施例將落入本公開原理的精神與範圍內。尤其是,在本公開、圖式以及所附申請專利的範圍之內,對主題結合設置的組成部分及/或設置可作出各種變化與修飾。除對組成部分及/或設置做出的變化與修飾之外,可替代的用途對本領域技術人員而言將是顯而易見的。
110:樂器音階特徵值表生成階段
111:輸入目標樂器的各音階的聲音訊號
112:將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號
112a:將該目標樂器的各音階的聲音訊號進行有限脈衝響應低通濾波,得到一濾波後訊號
112b:將該將濾波後訊號進行重新取樣,以得到一無膺頻聲音訊號
113:對該膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表
113a:將該無膺頻聲音訊號進行音框化,以產生一音框化聲音訊號
113b:將該音框化聲音訊號進行時頻轉換,以得到一頻域訊號
113c:將該頻域訊號進行敲擊聲能量統計平均後得到一敲擊能量特徵
113d:統計被敲擊之音階中最強以及次強的頻率能量特徵,將所有音階的音頻能量統計與敲擊聲能量統計特徵合併獲得初階特徵值表
114:將該初階特徵值表進行特徵值優化以獲得一最終特徵值表
114a:將該初階特徵值表進行特徵值交叉對比
114b:進行觸發與誤觸發測試
114c:特徵相近之音階門檻值優化
114d:誤觸音階的特徵替換
120:樂器音階觸發偵測階段
121:連續輸入一待測聲音訊號
122:將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號
123:對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號
124:將該待測頻域訊號與該最終特徵值表進行比對,以決定該目標樂器的某音階是否被觸發的偵測結果
圖1為本發明之一種樂器音階觸發的偵測方法的流程示意圖;
圖2為本發明之一種樂器音階觸發的偵測方法中對於聲音訊號的膺頻效應處理的流程示意圖;
圖3為本發明之一種樂器音階觸發的偵測方法中膺頻聲音訊號進行特徵萃取的流程示意圖;
圖4為本發明之一種樂器音階觸發的偵測方法中特徵值優化的流程示意圖。
100:樂器音階特徵值表生成階段
111:輸入目標樂器的各音階的聲音訊號
112:將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號
113:對該膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表
114:將該初階特徵值表進行特徵值優化以獲得一最終特徵值表
120:樂器音階觸發偵測階段
121:連續輸入一待測聲音訊號
122:將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號
123:對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號
124:將該待測頻域訊號與該最終特徵值表進行比對,以決定該目標樂器的某音階是否被觸發的偵測結果
Claims (3)
- 一種樂器音階觸發的偵測方法,適用於一具有複數個音階的目標樂器,包含:一樂器音階特徵值表生成階段;以及一樂器音階觸發偵測階段;其中,該樂器音階特徵值表生成階段更包含:輸入一目標樂器的各音階的聲音訊號;將該各音階的聲音訊號進行膺頻效應處理以獲得一無膺頻聲音訊號;對該膺頻聲音訊號進行特徵萃取以獲得一初階特徵值表;將該初階特徵值表進行特徵值優化以獲得一最終特徵值表;該樂器音階觸發偵測階段更包含:連續輸入一待測聲音訊號;將該待測聲音訊號進行膺頻效應處理以獲得一無膺頻待測聲音訊號;對該無膺頻待測聲音訊號進行音框化及時頻轉換處理以獲得一待測頻域訊號;將該待測頻域訊號與該最終特徵值表進行比對,以決定該目標樂器的某音階是否被觸發的偵測結果;其中,該特徵萃取步驟更包含:將該無膺頻聲音訊號進行音框化,以產生一音框化聲音訊號;將該音框化聲音訊號進行時頻轉換,以得到一頻域訊號;將該頻域訊號進行敲擊聲能量統計平均後得到一敲擊能量特徵;統計被敲擊之音階中最強以及次強的頻率能量特徵,將所有音階的音頻能量統計與敲擊聲能量統計特徵合併獲得初階特徵值表; 其中,該特徵值優化步驟更包含:將該初階特徵值表中所有特徵值與其他特徵值兩兩單一對比,檢查是否有音階的頻率特徵彼此太過相近;將該無膺頻聲音訊號輸入,檢查各音階是否有正常觸發以及是否會造成誤觸發之情形;將該初階特徵值表中,由該特徵值交叉對比結果對比出頻率特徵太過相近之音階進行特徵相近之音階門檻值優化;以及將初階特徵值表中,由將該觸發與誤觸發測試步驟中測試出有誤觸發情形之音階的頻率特徵進行誤觸音階的特徵替換,再次萃取該音階特徵並排除會誤觸發的特徵,全部完成後便獲得一最終特徵值表。
- 如請求項1之樂器音階觸發的偵測方法,其中,該膺頻效應處理步驟更包含:將該目標樂器的各音階的聲音訊號進行有限脈衝響應(FIR)低通濾波,得到一濾波後訊號;以及,將該將濾波後訊號進行重新取樣,以得到一無膺頻聲音訊號。
- 如請求項1之樂器音階觸發的偵測方法,其中,該將該待測頻域訊號與該最終特徵值表進行比對步驟係將該頻域訊號的與該最終特徵值表中所統計的敲擊聲能量特徵進行比對,可判斷該樂器之某音階是否被敲擊,以及樂器敲擊之相對距離。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW108138320A TWI718716B (zh) | 2019-10-23 | 2019-10-23 | 樂器音階觸發的偵測方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW108138320A TWI718716B (zh) | 2019-10-23 | 2019-10-23 | 樂器音階觸發的偵測方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TWI718716B true TWI718716B (zh) | 2021-02-11 |
| TW202117701A TW202117701A (zh) | 2021-05-01 |
Family
ID=75745842
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW108138320A TWI718716B (zh) | 2019-10-23 | 2019-10-23 | 樂器音階觸發的偵測方法 |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TWI718716B (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI905581B (zh) * | 2023-11-30 | 2025-11-21 | 圓展科技股份有限公司 | 醫學電子設備的提示音偵測系統及方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW446932B (en) * | 1998-10-29 | 2001-07-21 | Smith Paul Reed Guitars Ltd | Fast find fundamental |
| US20080037803A1 (en) * | 1994-05-09 | 2008-02-14 | Automotive Technologies International, Inc. | Sound Management Techniques for Vehicles |
| CN103828232A (zh) * | 2011-09-22 | 2014-05-28 | 伊尔索芙特有限公司 | 动态范围控制 |
| CN103890837A (zh) * | 2011-11-30 | 2014-06-25 | 泛音实验室股份有限公司 | 鼓和架子鼓调谐装置 |
| CN107851444A (zh) * | 2015-07-24 | 2018-03-27 | 声音对象技术股份有限公司 | 用于将声学信号分解为声音对象的方法和系统、声音对象及其使用 |
-
2019
- 2019-10-23 TW TW108138320A patent/TWI718716B/zh active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080037803A1 (en) * | 1994-05-09 | 2008-02-14 | Automotive Technologies International, Inc. | Sound Management Techniques for Vehicles |
| TW446932B (en) * | 1998-10-29 | 2001-07-21 | Smith Paul Reed Guitars Ltd | Fast find fundamental |
| CN103828232A (zh) * | 2011-09-22 | 2014-05-28 | 伊尔索芙特有限公司 | 动态范围控制 |
| CN103890837A (zh) * | 2011-11-30 | 2014-06-25 | 泛音实验室股份有限公司 | 鼓和架子鼓调谐装置 |
| CN107851444A (zh) * | 2015-07-24 | 2018-03-27 | 声音对象技术股份有限公司 | 用于将声学信号分解为声音对象的方法和系统、声音对象及其使用 |
Also Published As
| Publication number | Publication date |
|---|---|
| TW202117701A (zh) | 2021-05-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103575523B (zh) | 基于FastICA-谱峭度-包络谱分析的旋转机械故障诊断方法 | |
| RU2704073C2 (ru) | Способ и система для стадии обучения акустического или вибрационного анализа машины | |
| US20140074481A1 (en) | Wave Analysis for Command Identification | |
| JPWO2021048974A5 (zh) | ||
| JP2008525808A (ja) | 衝撃位置を特定するための方法 | |
| CN106297772A (zh) | 基于扬声器引入的语音信号失真特性的回放攻检测方法 | |
| CN112863550B (zh) | 基于注意力残差学习的哭声检测方法及系统 | |
| TWI718716B (zh) | 樂器音階觸發的偵測方法 | |
| CN110996210B (zh) | 一种用于声场均衡的方法和一种耳机 | |
| US12387733B2 (en) | Methods and apparatus to fingerprint an audio signal via normalization | |
| US20210287674A1 (en) | Voice recognition for imposter rejection in wearable devices | |
| JP7061126B6 (ja) | 睡眠呼吸障害を特徴付ける方法 | |
| CN106771598B (zh) | 一种自适应谱峭度信号处理方法 | |
| CN107210029A (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
| CN202041281U (zh) | 一种钢琴音准测量系统 | |
| CN112672265A (zh) | 检测麦克风阵一致性的方法及系统、计算机可读存储介质 | |
| CN108924725B (zh) | 一种车载音响系统的音效测试方法 | |
| CN111803080B (zh) | 婴儿畸变耳声检测仪及其检测方法 | |
| Yun et al. | Verification of estimated output signal-to-noise ratios from a phase inversion technique using a simulated hearing aid | |
| Amiri et al. | Suppressing noise disparity in training data for automatic pathological speech detection | |
| CN116383631A (zh) | 参数自适应最大循环平稳性盲解卷积的轴承故障特征提取 | |
| Montazeri et al. | Evaluation of a new approach for speech enhancement algorithms in hearing aids | |
| CN114464200A (zh) | 基于耳机的肺功能检测方法、系统、设备及可读存储介质 | |
| TW202343243A (zh) | 訊號異常檢測系統及其方法 | |
| CN114220411A (zh) | 一种可剔除稳态干扰声音的声级计 |