TWI841271B - 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 - Google Patents
一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 Download PDFInfo
- Publication number
- TWI841271B TWI841271B TW112107905A TW112107905A TWI841271B TW I841271 B TWI841271 B TW I841271B TW 112107905 A TW112107905 A TW 112107905A TW 112107905 A TW112107905 A TW 112107905A TW I841271 B TWI841271 B TW I841271B
- Authority
- TW
- Taiwan
- Prior art keywords
- mode function
- energy spectrum
- signal
- function
- spectrum entropy
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 93
- 241000283084 Balaenoptera musculus Species 0.000 title claims abstract description 76
- 238000000034 method Methods 0.000 title claims description 20
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 230000005236 sound signal Effects 0.000 claims abstract description 62
- 238000005315 distribution function Methods 0.000 claims abstract description 54
- 238000005070 sampling Methods 0.000 claims description 22
- 230000008859 change Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 2
- 208000003476 primary myelofibrosis Diseases 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 25
- 238000000354 decomposition reaction Methods 0.000 abstract description 19
- 238000005516 engineering process Methods 0.000 abstract description 13
- 241000283153 Cetacea Species 0.000 abstract description 12
- 238000000605 extraction Methods 0.000 abstract description 12
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 230000007123 defense Effects 0.000 abstract description 4
- 238000011160 research Methods 0.000 abstract description 4
- 238000011161 development Methods 0.000 abstract description 3
- 241001481833 Coryphaena hippurus Species 0.000 description 5
- 239000013535 sea water Substances 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 1
- 208000027697 autoimmune lymphoproliferative syndrome due to CTLA4 haploinsuffiency Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,基於經驗模態拆解、能量特徵分析和訊息理論熵,新創一種訊號偵測及特徵擷取分析演算法,稱為本質模態函數集中能量頻譜熵分析法,觀察此演算法所產生於訊號主要頻域中本質模態函數之時間-集中能量頻譜熵分佈函數的集中能量頻譜熵值之變化,並選擇適當地臨界參數設定閾值,進行藍鯨聲音的訊號偵測,包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),此應用可發展於海洋哺乳動物聲音訊號偵測理論的領域,作為發展海洋生物聲音監測系統、海洋生物研究和國防科技重要的關鍵技術之一。
Description
本發明係有關一種適於偵測海洋哺乳動物之藍鯨聲音訊號領域,而基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號的偵測方法。
無線電波和光波在海水中傳播會產生嚴重的衰減,因此無法有效地傳遞資訊,而聲波目前已知是遠距離海水介質中最有效的傳輸載體,其水下移動速度比在空中快四倍。因此,在深海的黑暗環境中,海洋哺乳動物通常依靠聲音交流,這就是為什麼海洋充滿了聲音、咔噠聲、脈衝聲、口哨聲和呻吟聲。
水下技術的研究與開發包括海水介質的聲學特性、聲波在海水介質中的傳播特性和水下目標聲音的特性等,其中水下訊號處理是研究這些聲音特性過程中非常重要的一環,包括水下錄音和原始音檔預處理、訊號特徵擷取、偵測和分類等。海洋哺乳動物的聲音可以透過使用水下麥克風和錄音設備進行錄音記錄,目前的聲納系統有主動和被動兩種類型,通過拖曳陣列、聲納浮標、底部安裝感測器等技術在海中操作,如利用被動聲學監測系統記錄大量原始水下聲音訊號,其中可能包含海洋哺乳動物的聲音、船舶引擎聲音、拍打水聲音和未知的噪音等,而這些水下聲音訊號大多是非穩態訊號。
因此,近年來,針對水下音訊監測已經發展出數件先前技
術,依序列舉4件先前技術如下:
1、中華民國專利公開公告號I567732,“一種基於經驗模態拆解之水下音訊訊號時間頻率能量分佈特徵分析方法”,其整合經驗模態拆解而創設的一種水下音訊訊號時間頻率能量分佈特徵分析方法,理論基礎包含有經驗模態拆解、能量特徵分析等,並應用於水下人類語音音訊號的訊號特徵擷取。
2、本件發明人溫在昇、林進豐、張順雄,“基於經驗模態拆解於藍鯨聲音訊號能量特徵擷取”,國際學術期刊Sensors,2022,22,2737,(Chai-Sheng Wen,Chin-Feng Lin,Shun-Hsyung Chang,“Extraction of Energy Characteristic of Blue Whale Vocalization Base on Empirical Mode Decomposition”,Sensors,2022,22,2737)。其運用經驗模態拆解及訊號能量密度參數的一種藍鯨B call聲音訊號特徵分析方法,理論基礎包含有經驗模態拆解、能量特徵分析等,並應用於海洋哺乳動物藍鯨B call聲音訊號特徵擷取。
3、中國人民共和國專利公開公告號CN115424639A,“一种基于时频特征的环境噪声下海豚声音端点检测方法”。其涉及一種基於時頻特徵的環境雜訊下海豚聲音端點檢測方法,理論基礎主要以能量特徵分析、閾值訊號偵測方法等,並應用於海洋哺乳動物海豚聲音訊號的檢測。
4、中國人民共和國專利公開公告號CN103578466B,“基於分數階傅立葉轉換的語音非語音檢測方法”。其公開了語音信號處理領域的一種基於分數階傅立葉轉換的語音非語音檢測方法,理論基礎主要以傅立葉轉換能量特徵分析、訊息理論熵等,並應用於人類語音及非語音訊
號的檢測。
然而,所述之4件先前技術在對於藍鯨聲音訊號的偵測結果並非為較佳的偵測準確度,而為本發明欲求加以突破及解決技術課題之所在。
本發明之目的在於:提供一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,基於經驗模態拆解、能量特徵分析和訊息理論熵,新創一種訊號偵測及特徵擷取分析演算法,稱為本質模態函數集中能量頻譜熵分析法,觀察此演算法所產生於訊號主要頻域中本質模態函數之時間-集中能量頻譜熵分佈函數的集中能量頻譜熵值之變化,並選擇適當地臨界參數設定閾值,進行藍鯨聲音的訊號偵測,包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),此應用可發展於海洋哺乳動物聲音訊號偵測理論的領域,作為發展海洋生物聲音監測系統、海洋生物研究和國防科技重要的關鍵技術之一。
第一圖:一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法的主要架構圖。
第二圖:兩組待分析的藍鯨聲音訊號,每組藍鯨聲音訊號各包含一組藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),其中一組有效取樣訊號(取樣時間100秒)。
第三圖:500個取樣訊號中的兩個取樣訊號,分別擁有4個本質模態函數(IMF)
及1個殘餘函數(rf)(a)藍鯨聲音甲訊號(20~20.2sec)(b)藍鯨聲音乙訊號(73~73.2sec)。
第四圖:500個取樣訊號的本質模態函數(IMFi)平均能量分佈比。
第五圖:500個取樣訊號中(a)本質模態函數1(b)本質模態函數2的平均邊際頻率頻譜分佈函數。
第六圖:500個取樣訊號中本質模態函數1及本質模態函數2的平均邊際頻率頻譜分佈函數的主要頻帶、能量最高的頻率、主要頻域。
第七圖:500個取樣訊號中(a)本質模態函數1(b)本質模態函數2的希爾伯特能量頻譜分佈函數。
第八圖:500個取樣訊號於主要頻域的(a)本質模態函數1(b)本質模態函數2之時間-集中能量頻譜熵分佈函數。
第九圖:500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2時間-集中能量頻譜熵分佈函數的真陽性及偽陽性之相關參數值,其中閾值值為本質模態函數之時間-集中能量頻譜熵分佈函數的中位值。
第十圖:500個取樣訊號於主要頻域的(a)本質模態函數1及(b)本質模態函數2之時間-集中能量頻譜熵分佈函數的接收者操作特徵曲線(ROC)。
第十一圖:500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2時間-集中能量頻譜熵分佈函數的真陽性及偽陽性之相關參數值,其中設定閾值為最佳訊號偵測結果之最佳設定閾值。
第十二圖:500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2之時間-集中能量頻譜熵分佈函數的接收者操作特徵曲線下的面積(AUC)以及偵測準確度,其中設定閾值為最佳訊號偵測結果之最佳設定閾值。
請配合參閱第一圖至第十二圖,本發明為一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,基於經驗模態拆解、能量特徵分析和訊息理論熵,新創一種訊號偵測及特徵擷取分析演算法,稱為本質模態函數集中能量頻譜熵分析法,觀察此演算法所產生於訊號主要頻域中本質模態函數之時間-集中能量頻譜熵分佈函數的集中能量頻譜熵值之變化,並選擇適當地臨界參數設定閾值,進行藍鯨聲音的訊號偵測,包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),此應用可發展於海洋哺乳動物聲音訊號偵測理論的領域,作為發展海洋生物聲音監測系統、海洋生物研究和國防科技重要的關鍵技術之一;請參閱第一圖,本發明實施方法包含下列16個步驟:
步驟一、請配合參見第二圖,以一組待偵測分析之藍鯨聲音訊號,其中包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),取樣時間為T秒(sec),取樣頻率為F赫茲(Hz)。將此聲音訊號平均分割M個取樣訊號X(t),每個取樣訊號持續時間為t秒(sec)。如第二圖為兩組待分析的藍鯨聲音訊號,取樣時間為235.72秒,取樣頻率為4800赫茲(Hz),每組藍鯨聲音訊號各包含一組藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),擷取其中一組藍鯨聲音訊號作為取樣訊號分析,取樣時間為100秒。並對此取樣訊號平均分割500個取樣訊號,每個取樣訊號持續時間為200毫秒。
步驟二、請配合參見第三圖,將取樣訊號X(t)經過經驗模態拆解後,取樣訊號可被拆解成N個本質模態函數(IMFi)及1個殘餘函數(rf)。
如第三圖為500個取樣訊號中的兩個取樣訊號,經過經驗模態拆解後各產生4個本質模態函數(IMF)及1個殘餘函數(rf)(a)藍鯨聲音甲訊號(20~20.2秒)(b)藍鯨聲音乙訊號(73~73.2秒)。
步驟三、請配合參見第四圖,計算所有本質模態函數能量的總和為訊號總能量E total ,同時計算出每個本質模態函數的平均能量分佈E IMFi 。
步驟四、請配合參見第四圖,於所有本質模態函數中,定義平均能量分佈比較高的本質模態函數,稱為勝任的本質模態函數(Competent IMF,CIMF)。如第四圖為500個取樣訊號的本質模態函數(IMFi)平均能量分佈比,平均能量強度密度主要集中於本質模態函數1、2、3、4(IMF1、2、3、4),本質模態函數1(IMF1)及本質模態函數2(IMF2)為勝任的本質模態函數(CIMF),做為演算法主要訊號分析的本質模態函數,而最高的平均能量分佈比之勝任的本質模態函數為本質模態函數1(IMF1)。
步驟五、請配合參見第五圖,將每個本質模態函數實行希爾伯特轉換(Hilbert Transform,HT)後,可計算出第i個本質模態函數的瞬時頻率
F i (t)。
步驟六、請配合參見第五圖,當取樣頻率頻寬為f=0~150赫茲時,則定義第1個本質模態函數的邊際頻率頻譜分佈函數(MF1),當取樣頻率頻寬為f=0~100赫茲時,則定義第2個本質模態函數的邊際頻率頻譜分佈函數(MF2)。
如第五圖為500個取樣訊號中(a)本質模態函數1(b)本質函數2的平均邊際頻率頻譜分佈函數。
步驟七、請配合參見第五圖及第六圖,當邊際頻率頻譜圖的趨勢呈現峰值變化時,表示信號在某一特定頻率上具有較高的能量或振幅,可以於峰值底部設定一個固定值,此固定值視為適當的最佳臨界參數閾值。根據所有取樣訊號之本質模態函數的平均邊際頻率頻譜分佈函數取適當的臨界參數閾值,則可擷取每個本質模態函數的訊號特徵參數,主要頻帶、能量最高的頻率、主要頻域等,其中訊號能量幾乎都會落於主要頻域內,而訊號大部分能量集中於主要頻帶中。設定適當的最佳臨界參數閾值於0.3~0.4時,本質模態函數1(IMF1)的主要頻帶為27~49赫茲,能量最高的頻率為39赫茲,主要頻域為0~150赫茲。設定適當的臨界參數閾值為0.4~0.47時,本質模態函數2(IMF2)的主要頻帶從9~43赫茲,能量最高的頻率為13赫茲,主要頻域為0~100赫茲。
步驟八、請配合參見第七圖,將本質模態函數之瞬時頻率振幅大小平方後可以得到取樣訊號的第i個本質模態函數的時間-頻率-能量分
佈函數,稱為希爾伯特能量頻譜分佈函數(Hilbert energy spectrum,E i ),如第七圖為500個取樣訊號中(a)本質模態函數1(b)本質模態函數2的希爾伯特能量頻譜分佈函數。
步驟九、請配合參見第七圖,定義取樣訊號的第i個本質模態函數的希爾伯特能量頻譜分佈函數Eij {Eia,…,Eib},j為主要頻域中的頻率從a到b,於主要頻域的能量頻譜分佈函數Eia~Eib中取最大的能量頻譜分佈函數為max(Ei),取最小的能量頻譜分佈函數為min(Ei)。於此,再次定義第i個本質模態函數的能量頻譜分佈函數Sij {Sia,…,Sib},j為主要頻域中的頻率從a到b。
步驟十、請配合參見第七圖,將本質模態函數的能量頻譜分佈函數於主要頻域內進行正規化,因此定義第i個本質模態函數的能量頻譜密度Pi(Sj),j為主要頻域的頻率從a到b。
步驟十一、請配合參見第八圖,定義第i個本質模態函數於主要頻域的集中能量頻譜熵(concentrated energy spectrum distribution entropy,CHi),j為主要頻域的頻率從a到b。
步驟十二、請配合參見第八圖,計算第i個本質模態函數於主要頻帶的集中能量頻譜熵,稱為CHicd,j為主要頻帶的頻率從c到d。
步驟十三、請配合參見第八圖,取得所有取樣訊號於主要頻域的本質模態函數之時間-集中能量頻譜熵分佈函數。如第八圖為500個取樣訊號於主要頻域的(a)本質模態函數1(b)本質模態函數2之時間-集中能量頻譜熵分佈函數,其中藍鯨聲音甲訊號(A call)取樣訊號的本質模態函數1的集中能量頻譜熵值範圍為3.9675~6.2030,藍鯨聲音甲訊號(A call)取樣訊號的本質模態函數2的集中能量頻譜熵值範圍為1.7571~5.7485;藍鯨聲音乙訊號(B call)取樣訊號的本質模態函數1的集中能量頻譜熵值範圍為3.3344~6.1398,藍鯨聲音乙訊號(B call)取樣訊號的本質模態函數2的集中能量頻譜熵值範圍為2.1081~5.7627。
步驟十四、請配合參見第九圖,設定本質模態函數之時間-集中能量頻譜熵分佈函數的中位值為設定閾值,當本質模態函數之時間-集中能量頻譜熵分佈函數中的集中能量頻譜熵值大於設定閾值時視為偵測到的訊號,當集中能量頻譜熵值小於設定閾值時視為非偵測到的訊號或雜訊,如此,可以達成訊號偵測的結果,而偵測到的訊號與真實訊號之間會產生四種可能參數結果;真陽性(true positives,TP),即偵測為有,實際上也有;偽陽性(false positives,FP),即偵測為有,實際卻沒有;真陰性(true negatives,TN),即偵測為沒有,實際上也沒有;偽陰性(false negative,FN),即偵測為沒有,實際上卻有;並且定義,真陽性率TPR=TP/(TP+FN),即在所有實際為陽性的樣本中,被正確地判斷為陽性之比率;偽陽性率FPR=FP/(FP+TN),在所有實際為陰性的樣本中,被錯誤地判斷為陽性之比率。如
第九圖為500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2之時間-集中能量頻譜熵分佈函數的真陽性及偽陽性之相關參數值,其中設定閾值為本質模態函數之時間-集中能量頻譜熵分佈函數的中位值於本質模態函數1為5.45及本質模態函數2為4.38;於此,在本質模態函數1中真陽性(TP)參數的藍鯨聲音甲訊號(A call)偵測數目為47,藍鯨聲音乙訊號(B call)偵測數目為85,真陽性(TP)的總訊號偵測數目為132,真陽性率(TPR)為75.43%;偽陽性(FP)參數的藍鯨聲音甲訊號(A call)偵測數目為40,藍鯨聲音乙訊號(B call)偵測數目為60,偽陽性(FP)的總訊號偵測數目為100,偽陽性率(FPR)為30.37%。在本質模態函數2中真陽性(TP)參數的藍鯨聲音甲訊號(A call)偵測數目為72,藍鯨聲音乙訊號(B call)偵測數目為85,真陽性(TP)的總訊號偵測數目為157,真陽性率(TPR)為89.71%;偽陽性(FP)參數的藍鯨聲音甲訊號(A call)偵測數目為64,藍鯨聲音乙訊號(B call)偵測數目為34,偽陽性(FP)的總訊號偵測數目為98,偽陽性率(FPR)為30.06%。
步驟十五、請配合參見第十圖,設定閾值從本質模態函數之時間-集中能量頻譜熵分佈函數中的集中能量頻譜熵值之最高值至最低值,可劃出本質模態函數的接收者操作特徵曲線(Receiver Operating Characteristics,ROC)以及計算出接收者操作特徵曲線下的面積(Area Under Curve,AUC),作為分析訊號偵測效能優劣的工具。詳如第十圖為500個取樣訊號於主要頻域的(a)本質模態函數1及(b)本質模態函數2之時間-集中能量頻譜熵分佈函數的接收者操作特徵曲線(Receiver Operating Characteristics,ROC)。
步驟十六、請配合參見第十圖、及第十一圖及第十二圖,本
質模態函數的接收者操作特徵曲線圖(Receiver Operating Characteristic,ROC)可以評估訊號偵測在不同閾值下的性能,並畫出訊號偵測在各種閾值下的性能表現。ROC曲線X軸是偽陽性率FPR,Y軸是真陽性率TPR。ROC曲線中(0,1)點表示訊號偵測能夠實現完美的分類,即最低的偽陽性率FPR=0和最高的真陽性率TPR=1。因此,曲線越靠近左上角(0,1),訊號偵測的性能越好,因為在這個點上,FPR很低,而TPR很高。換句話說,此曲線點代表在偵測真實訊號方面效果很好,同時又能夠保持較低的誤報率,可視為最佳的訊號偵測結果。所以,最接近(0,1)的曲線點被認為是最佳的閾值選擇點,因為它代表了一個很好的平衡,高真陽性率TPR和低偽陽性率FPR,於此可取得最佳訊號偵測結果之最佳設定閾值。計算每個曲線上的點(x,y)與(0,1)的距離d,此時最小d值之(x,y)中的設定閾值即為最佳訊號偵測結果之最佳設定閾值。如第十一圖為500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2之時間-集中能量頻譜熵分佈函數的真陽性及偽陽性之相關參數值,其中設定閾值為最佳訊號偵測結果之最佳設定閾值,最佳設定閾值於本質模態函數1為5.4及本質模態函數2為4.25;於此,在本質模態函數1中真陽性(TP)參數的藍鯨聲音甲訊號(A call)偵測數目為47,藍鯨聲音乙訊號(B call)偵測數目為85,真陽性(TP)的總訊號偵測數目為132,真陽性率(TPR)為75.43%;偽陽性(FP)參數的藍鯨聲音甲訊號(A call)偵測數目為40,藍鯨聲音乙訊號(B call)偵測數目為60,偽陽性(FP)的總訊號偵測數目為100,偽陽性率(FPR)為30.37%。在本質模態函數2中真陽性(TP)參數的藍鯨聲音甲訊號(A call)偵測數目為66,藍鯨聲音乙訊號(B call)偵測數目為82,真陽性(TP)的總訊號偵測數目為148,真陽性率(TPR)為84.57%;偽陽性(FP)參數的藍鯨聲音
甲訊號(A call)偵測數目為46,藍鯨聲音乙訊號(B call)偵測數目為23,偽陽性(FP)的總訊號偵測數目為69,偽陽性率(FPR)為21.17%。再配合參見第十二圖為500個取樣訊號於主要頻域的本質模態函數1及本質模態函數2之時間-集中能量頻譜熵分佈函數的接收者操作特徵曲線下的面積(Area Under Curve,AUC)以及偵測準確度,其中設定閾值為最佳訊號偵測結果之最佳設定閾值。接收者操作特徵曲線下的面積(AUC)越大代表偵測方法的偵測效益越高,而偵測準確率為(真陽性TP+真陰性TN)/(真陽性TP+真陰性TN+偽陽性FP+偽陰性FN),偵測準確率越高偵測效益越好。如此,在本質模態函數1的接收者操作特徵曲線下的面積(AUC)為0.8134,並且以最佳訊號偵測結果之最佳設定閾值計算出偵測準確度為73.65%。在本質模態函數2的接收者操作特徵曲線下的面積(AUC)為0.8779,並且以最佳訊號偵測結果之最佳設定閾值計算出偵測準確度為82.44%。
本發明特徵與先前技術新穎性、進步性比較說明:本發明採取基於經驗模態拆解、能量特徵分析和訊息理論熵,新創一種訊號偵測及特徵擷取分析演算法,稱為本質模態函數集中能量頻譜熵分析法,觀察此演算法所產生於訊號主要頻域中本質模態函數之時間-集中能量頻譜熵分佈函數的集中能量頻譜熵值之變化,並選擇適當地臨界參數設定閾值,進行藍鯨聲音的訊號偵測,包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),此應用可發展於海洋哺乳動物聲音訊號偵測理論的領域,作為發展海洋生物聲音監測系統、海洋生物研究和國防科技重要的關鍵技術之一。
反觀所述先前技術1.其整合經驗模態拆解而創設的一種水
下音訊訊號時間頻率能量分佈特徵分析方法,理論基礎包含有經驗模態拆解、能量特徵分析等,並應用於水下人類語音音訊號的訊號特徵擷取。先前技術2.其運用經驗模態拆解及訊號能量密度參數的一種藍鯨B call聲音訊號特徵分析方法,理論基礎包含有經驗模態拆解、能量特徵分析等,並應用於海洋哺乳動物藍鯨B call聲音訊號特徵擷取。先前技術3.其涉及一種基於時頻特徵的環境雜訊下海豚聲音端點檢測方法,理論基礎主要以能量特徵分析、閾值訊號偵測方法等,並應用於海洋哺乳動物海豚聲音訊號的檢測。先前技術4.其公開了語音信號處理領域的一種基於分數階傅立葉轉換的語音非語音檢測方法,理論基礎主要以傅立葉轉換能量特徵分析、訊息理論熵等,並應用於人類語音及非語音訊號的檢測。故先前技術1到4並未揭露本發明技術手段特徵,本發明符合新穎性。
另外,本發明之理論基礎包含有經驗模態拆解、能量特徵分析、訊號特徵擷取、訊息理論熵、集中能量頻譜熵、訊號偵測方法、最佳設定閾值訊號偵測法等,並應用於海洋哺乳動物藍鯨聲音的訊號偵測,包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),其中經驗模態拆解、能量特徵分析、訊息理論熵,本發明可確定非發明所屬技術領域中具有通常知識者之技術水準。
再者,本申請案與所術先前技術1到4之間的區別在於本發明新創的部分包含本質模態函數集中能量頻譜熵分析法,以及演算法於訊號能量集中的主頻域中所產生的時間-集中能量頻譜熵分佈函數中取得最佳訊號偵測結果之最佳設定閾值,並針對應用於海洋哺乳動物藍鯨聲音訊號的偵測。本發明新創的偵測步驟部分,其中本質模態函數集中能量頻譜熵分
布函數需要經過實施方法中從步驟1至步驟13的運算,過程為非顯而易見,同時實施方法中步驟14至步驟16於時間-集中能量頻譜熵分佈函數中取得最佳訊號偵測結果之最佳設定閾值後,才可以達成訊號最佳偵測的結果,以上的訊號偵測方法非輕易完成。
本發明方法以最佳訊號偵測結果之最佳設定閾值計算出偵測準確度為73.65%。在本質模態函數2的接收者操作特徵曲線下的面積(AUC)為0.8779,並且以最佳訊號偵測結果之最佳設定閾值計算出偵測準確度為82.44%。因此本發明具備進步性。
綜上所述,當知本案所發明之基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法已具有產業利用性、新穎性與進步性,符合發明專利專利要件。為以上所述者,僅為本發明之一較佳實施例而已,並非用來限定本發明實施之範圍。及凡依本發明申請專利範圍所做的均等變化與修飾,皆為本發明專利範圍所涵蓋。
Claims (3)
- 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,包含下列步驟:步驟一:一組待偵測分析之藍鯨聲音訊號,其中包含藍鯨聲音甲訊號(A call)以及藍鯨聲音乙訊號(B call),取樣時間為T秒(sec),取樣頻率為F赫茲(Hz),將此聲音訊號平均分割M個取樣訊號X(t),每個取樣訊號持續時間為t秒(sec);步驟二:將取樣訊號X(t)經過經驗模態拆解後,取樣訊號可被拆解成N個本質模態函數及1個殘餘函數;步驟三:計算所有本質模態函數能量的總和為訊號總能量E total ,同時計算出每個本質模態函數的平均能量分佈比E IMFi ;步驟四:於所有本質模態函數中,定義平均能量分佈比較高的本質模態函數,稱為勝任的本質模態函數(Competent IMF,CIMF);步驟五:將每個本質模態函數實行希爾伯特轉換後,可計算出第i個本質模態函數的瞬時頻率F i (t);步驟六:當取樣頻率頻寬為f=0~150赫茲時,則定義第1個本質模態函數的邊際頻率頻譜分佈函數(MF1),當取樣頻率頻寬為f=0~100赫茲時,則定義第2個本質模態函數的邊際頻率頻譜分佈函數(MF2);步驟七:當邊際頻率頻譜圖的趨勢呈現峰值變化時,表示信號在某一特定頻率上具有較高的能量或振幅,可以於峰值底部設定一個固定值,此固定值視為適當的最佳臨界參數閾值,根據所有取樣訊號之本質模態函數的平均邊際頻率頻譜分佈函數取適當的最佳臨界參數閾值,則可擷取每個本質 模態函數的訊號特徵參數,主要頻帶、能量最高的頻率、主要頻域等,其中訊號能量幾乎都會落於主要頻域內,而訊號大部分能量集中於主要頻帶中,設定適當的最佳臨界參數閾值於0.3~0.4時,本質模態函數1(IMF1)的主要頻帶為27~49赫茲,能量最高的頻率為39赫茲,主要頻域為0~150赫茲,設定適當的臨界參數閾值為0.4~0.47時,本質模態函數2(IMF2)的主要頻帶從9~43赫茲,能量最高的頻率為13赫茲,主要頻域為0~100赫茲;步驟八:將本質模態函數之瞬時頻率振幅大小平方後可以得到取樣訊號的第i個本質模態函數的時間-頻率-能量分佈函數,稱為希爾伯特能量頻譜分佈函數(E i );步驟九:定義取樣訊號的第i個本質模態函數的希爾伯特能量頻譜分佈函數Eij {Eia,...,Eib},j為主要頻域中的頻率從a到b,於主要頻域的能量頻譜分佈函數Eia~Eib中取最大的能量頻譜分佈函數為max(Ei),取最小的能量頻譜分佈函數為min(Ei);於此,再次定義第i個本質模態函數的能量頻譜分佈函數Sij {Sia,...,Sib},j為主要頻域的頻率從a到b;步驟十:將本質模態函數的能量頻譜分佈函數於主要頻域內進行正規化,因此定義第i個本質模態函數的能量頻譜密度Pi(Sj),j為主要頻域的頻率從a到b;步驟十一:定義第i個本質模態函數於主要頻域的集中能量頻譜熵(concentrated energy spectrum distribution entropy,CHi),j為主要頻域的頻率從a到b;步驟十二:計算第i個本質模態函數於主要頻帶的集中能量頻譜熵,稱為CHicd,j為主要頻帶的頻率從c到d; 步驟十三:取得所有取樣訊號於主要頻域的本質模態函數之時間-集中能量頻譜熵分佈函數;步驟十四:設定本質模態函數之時間-集中能量頻譜熵分佈函數的中位值為設定閾值,當本質模態函數之時間-集中能量頻譜熵分佈函數中的集中能量頻譜熵值大於設定閾值時視為偵測到的訊號,當集中能量頻譜熵值小於設閾值時視為非偵測到的訊號或雜訊,如此,可以達成訊號偵測的結果;步驟十五:設定閾值從本質模態函數之時間-集中能量頻譜熵分佈函數中的集中能量頻譜熵值之最高值至最低值,可劃出本質模態函數的接收者操作特徵曲線(Receiver Operating Characteristics,ROC)以及計算出接收者操作特徵曲線下的面積(Area Under Curve,AUC),作為分析訊號偵測效能優劣的工具;步驟十六:本質模態函數的接收者操作特徵曲線圖中(0,1)點表示訊號偵測能夠實現完美的分類,即最低的偽陽性率FPR=0和最高的真陽性率TPR=1;曲線越靠近左上角(0,1),訊號偵測的性能越好,因為在這個點上,FPR很低,而TPR很高;此曲線點代表在偵測真實訊號方面效果很好,同時又能夠保持較低的誤報率,可視為最佳的訊號偵測結果;最接近(0,1)的曲線點被認為是最佳的閾值選擇點,因為它代表了一個很好的平衡,高真陽性率TPR和低偽陽性率FPR,於此可取得最佳訊號偵測結果之最佳設定閾值;計算每個曲線上的點(x,y)與(0,1)的距離d,此時最小d值之(x,y)中的設定閾值即為最佳訊號偵測結果之最佳設定閾值。
- 如請求項1所述之一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,其中所述藍鯨聲音甲訊號(A call)取樣訊號的本質模 態函數1的集中能量頻譜熵值範圍為3.9675~6.2030,藍鯨聲音甲訊號(A call)取樣訊號的本質模態函數2的集中能量頻譜熵值範圍為1.7571~5.7485。
- 如請求項1所述之一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法,其中所述藍鯨聲音乙訊號(B call)取樣訊號的本質模態函數1的集中能量頻譜熵值範圍為3.3344~6.1398,藍鯨聲音乙訊號(B call)取樣訊號的本質模態函數2的集中能量頻譜熵值範圍為2.1081~5.7627。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW112107905A TWI841271B (zh) | 2023-03-03 | 2023-03-03 | 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW112107905A TWI841271B (zh) | 2023-03-03 | 2023-03-03 | 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TWI841271B true TWI841271B (zh) | 2024-05-01 |
| TW202437237A TW202437237A (zh) | 2024-09-16 |
Family
ID=92076873
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW112107905A TWI841271B (zh) | 2023-03-03 | 2023-03-03 | 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TWI841271B (zh) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104217722A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
| TW201835784A (zh) * | 2016-12-30 | 2018-10-01 | 美商英特爾公司 | 物聯網 |
| WO2020125839A1 (de) * | 2018-12-18 | 2020-06-25 | GRID INVENT gGmbH | Elektronisches element und elektrisch angesteuertes anzeigeelement |
| CN112329819A (zh) * | 2020-10-20 | 2021-02-05 | 中国海洋大学 | 基于多网络融合的水下目标识别方法 |
-
2023
- 2023-03-03 TW TW112107905A patent/TWI841271B/zh active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104217722A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种海豚哨声信号时频谱轮廓提取方法 |
| TW201835784A (zh) * | 2016-12-30 | 2018-10-01 | 美商英特爾公司 | 物聯網 |
| WO2020125839A1 (de) * | 2018-12-18 | 2020-06-25 | GRID INVENT gGmbH | Elektronisches element und elektrisch angesteuertes anzeigeelement |
| CN112329819A (zh) * | 2020-10-20 | 2021-02-05 | 中国海洋大学 | 基于多网络融合的水下目标识别方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| TW202437237A (zh) | 2024-09-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2633519B1 (en) | Method and apparatus for voice activity detection | |
| US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
| US8600073B2 (en) | Wind noise suppression | |
| US9538301B2 (en) | Device comprising a plurality of audio sensors and a method of operating the same | |
| Kim et al. | Robust signal-to-noise ratio estimation based on waveform amplitude distribution analysis. | |
| Suhadi et al. | A data-driven approach to a priori SNR estimation | |
| Wang et al. | ia-PNCC: Noise Processing Method for Underwater Target Recognition Convolutional Neural Network. | |
| CN120636432B (zh) | 一种基于语音传感器的会见窗口通话系统 | |
| Caldeira et al. | EEMD-IF based method for underwater noisy acoustic signals enhancement in time-domain | |
| CN111243600A (zh) | 一种基于声场和场纹的语音欺骗攻击检测方法 | |
| Gupta et al. | Morse wavelet transform-based features for voice liveness detection | |
| Qiao et al. | Spectral entropy based dolphin whistle detection algorithm and its possible application for biologically inspired communication | |
| Chen et al. | A DNN based normalized time-frequency weighted criterion for robust wideband DoA estimation | |
| TWI841271B (zh) | 一種基於本質模態函數集中能量頻譜熵之藍鯨聲音訊號偵測方法 | |
| Liang et al. | Entropy-based automatic detection of marine mammal tonal calls | |
| Colonna et al. | A framework for chainsaw detection using one-class kernel and wireless acoustic sensor networks into the amazon rainforest | |
| May et al. | Generalization of supervised learning for binary mask estimation | |
| Lopatka et al. | An attractive alternative for sperm whale click detection using the wavelet transform in comparison to the Fourier spectrogram | |
| CN115932808B (zh) | 一种基于多特征融合的被动声纳智能探测方法 | |
| Bougher et al. | Generalized marine mammal detection based on improved band-limited processing | |
| CN115424639A (zh) | 一种基于时频特征的环境噪声下海豚声音端点检测方法 | |
| Meng et al. | Fully Automatic Balance between Directivity Factor and White Noise Gain for Large-scale Microphone Arrays in Diffuse Noise Fields. | |
| Salvati et al. | Improvement of acoustic localization using a short time spectral attenuation with a novel suppression rule | |
| CN119128502B (zh) | 一种基于神经网络的主动声纳抗混响方法及系统 | |
| Zhao et al. | Detecting and suppressing dolphin clicks in whistle signals using adaptive matched filtering and interpolation algorithm |