TWI740374B - 消除特定對象語音之方法及應用其之耳戴式音訊裝置 - Google Patents
消除特定對象語音之方法及應用其之耳戴式音訊裝置 Download PDFInfo
- Publication number
- TWI740374B TWI740374B TW109104420A TW109104420A TWI740374B TW I740374 B TWI740374 B TW I740374B TW 109104420 A TW109104420 A TW 109104420A TW 109104420 A TW109104420 A TW 109104420A TW I740374 B TWI740374 B TW I740374B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- sound
- ear
- unit
- specific
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
- H04R5/0335—Earpiece support, e.g. headbands or neckrests
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
- G10K11/17885—General system configurations additionally using a desired external signal, e.g. pass-through audio such as music or speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
- G10K11/17873—General system configurations using a reference signal without an error signal, e.g. pure feedforward
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
- G10K11/341—Circuits therefor
- G10K11/346—Circuits therefor using phase variation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/10—Applications
- G10K2210/108—Communication systems, e.g. where useful sound is kept and noise is cancelled
- G10K2210/1081—Earphones, e.g. for telephones, ear protectors or headsets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3046—Multiple acoustic inputs, multiple acoustic outputs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/321—Physical
- G10K2210/3215—Arrays, e.g. for beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一種消除特定對象語音之方法及應用其之耳戴式音訊裝置。耳戴式音訊裝置包括數個收音單元、一語音方向追蹤單元、一方向加強單元、一視窗切割單元、一聲紋辨識單元、一語音消除單元及二揚聲器。此些收音單元陣列式排列,以取得一聲音訊號。語音方向追蹤單元用以追蹤數個聲源,以獲得數個聲源方向。聲紋辨識單元確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則語音消除單元以一波束成型技術調整一場型,以消除特定對象語音。
Description
本發明是有關於一種語音處理方法及應用其之音訊裝置,且特別是有關於一種消除特定對象語音之方法及應用其之耳戴式音訊裝置。
在生活中,有些對象在自己周圍說話時,會讓人覺得是一種干擾,有時想要耳根清靜,卻又不想錯失其他重要聲音資訊。因此需要一種針對特定對象語音消除機制,讓我們達到心理平靜的目的。
然而,一般的降噪技術只能使環境的雜訊降低,放大語音訊號,而無法消除特定對象語音,來達到心理平靜的目的。
本發明係有關於一種消除特定對象語音之方法及應用其之耳戴式音訊裝置,其利用語音方向追蹤技術(voice
tracking)與波束成型技術(beamforming),消除特定對象語音,來達到心理平靜的目的。
根據本發明之第一方面,提出一種具特定對象語音消除機制之耳戴式音訊裝置。耳戴式音訊裝置包括數個收音單元、一語音方向追蹤單元、一方向加強單元、一視窗切割單元、一聲紋辨識單元、一語音消除單元及二揚聲器。此些收音單元陣列式排列,以取得一聲音訊號。語音方向追蹤單元用以追蹤數個聲源,以獲得數個聲源方向。方向加強單元用以調整此些收音單元,以對此些聲源方向進行加強。視窗切割單元用以對聲音訊號切割出數個視窗。聲紋辨識單元用以於各個視窗進行聲紋辨識,以確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則語音消除單元以一波束成型技術(beamforming)調整一場型,以消除特定對象語音。揚聲器用以對一左耳及一右耳輸出已消除特定對象語音之聲音訊號。
根據本發明之第二方面,提出一種消除特定對象語音之方法。消除特定對象語音之方法包括以下步驟。以數個收音單元取得一聲音訊號。此些收音單元陣列式排列。追蹤數個聲源,以獲得數個聲源方向。調整此些收音單元,以對此些聲源方向進行加強。對聲音訊號切割出數個視窗。於各個視窗進行聲紋辨識,以確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則以一波
束成型技術(beamforming)調整一場型,以消除特定對象語音。對一左耳及一右耳輸出已消除特定對象語音之聲音訊號。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式詳細說明如下:
100:耳戴式音訊裝置
110:收音單元
120:語音方向追蹤單元
130:方向加強單元
140:視窗切割單元
150:聲紋辨識單元
160:語音消除單元
170:揚聲器
A,B,C:特定對象語音
D1,D2:聲源方向
F0,F1:場型
FA,FB:加強場型
MD:辨識模型
S1,S1’:聲音訊號
S110,S120,S130,S140,S150,S151,S152,S153,S154,S160,S161,S170:步驟
T1,T2:時間點
WD:視窗
第1圖繪示二特定對象語音之示意圖。
第2圖繪示根據一實施例之具特定對象語音消除機制之耳戴式音訊裝置的示意圖。
第3圖繪示根據一實施例具特定對象語音消除機制之耳戴式音訊裝置的方塊圖。
第4圖繪示根據一實施例之消除特定對象語音之方法的流程圖。
第5圖繪示根據一實施例之聲源方向之示意圖。
第6A圖繪示特定對象語音之加強場型。
第6B圖繪示另一特定對象語音之加強場型。
第7圖繪示根據一實施例之多個視窗的示意圖。
第8A圖繪示原有之場型。
第8B圖繪示調整後場型。
第9圖繪示根據一實施例之調整係數之示意圖。
第10圖繪示三個特定對象語音之示意圖。
第11圖繪示根據另一實施例之消除特定對象語音之方法的流程圖。
請參照第1圖,其繪示特定對象語音A與特定對象語音B之示意圖。在生活中,使用者可能會覺得特定對象語音B是一種干擾。使用者可能不想聽見特定對象語音B,但直接去關閉耳戴式音訊裝置100,卻又會錯失重要的特定對象語音A。
請參照第2圖及第3圖,第2圖繪示根據一實施例之具特定對象語音消除機制之耳戴式音訊裝置100的示意圖,第3圖繪示根據一實施例具特定對象語音消除機制之耳戴式音訊裝置100的方塊圖。耳戴式音訊裝置100例如是一耳機或一助聽器。耳戴式音訊裝置100包括數個收音單元110、一語音方向追蹤單元120、一方向加強單元130、一視窗切割單元140、一聲紋辨識單元150、一語音消除單元160、及二揚聲器170。收音單元110例如是一麥克風。揚聲器170例如是一喇叭。語音方向追蹤單元120、方向加強單元130、視窗切割單元140、聲紋辨識單元150、及語音消除單元160例如是一電路、一晶片、一電路板、數組程式碼、或儲存程式碼之記錄裝置。耳戴式音訊裝置100可以在接收到外界之聲音訊號S1後,將特定對象語音B消除,再輸出調整後之聲音訊號S1’,來達到心理平靜的目的。以下更搭配一流程圖詳細說明上述各項元件之運作。
請參照第4圖,其繪示根據一實施例之消除特定對象語音之方法的流程圖。在步驟S110中,以此些收音單元110取得聲音訊號S1。如第2圖所示,此些收音單元110係以陣列式排列,且朝向不同方向。如此一來,某一收音單元110主要是接收到特定對象語音A;某一收音單元110主要是接收到特定對象語音B。
接著,在步驟S120中,語音方向追蹤單元120追蹤數個聲源,以獲得數個聲源方向D1、D2。請參照第5圖,其繪示根據一實施例之聲源方向D1、D2之示意圖。語音方向追蹤單元120追蹤特定對象語音A及特定對象語音B,分別獲得聲源方向D1及聲源方向D2。在此步驟中,語音方向追蹤單元120以一雙耳時間差資訊(interaural time difference,ITD)與一互相關函數(Cross Correlation Function,CCF)追蹤此些聲源,以獲得聲源方向D1、D2。
然後,在步驟S130中,方向加強單元130調整此些收音單元110,以對聲源方向D1、D2進行加強。請參照第6A~6B圖,第6A圖繪示特定對象語音A之加強場型FA,第6B圖繪示特定對象語音B之加強場型FB。在此步驟中,方向加強單元130透過一波束成型技術(beamforming)調整收音單元110,以對聲源方向D1、D2進行加強。如第6A圖之加強場型FA所示,朝向特定對象語音A之波束能量較高,可以獲得加強特定對象語音A。如第6B圖之加強場型FB所示,朝向特定對象語音B之波束能量較高,可以獲得加強特定對象語音B。
接著,在步驟S140中,視窗切割單元140對聲音訊號S1切割出數個視窗WD。請參照第7圖,其繪示根據一實施例之多個視窗WD的示意圖。在此步驟中,視窗WD大於或等於32毫秒(ms),有助於聲紋辨識的確認。並且,此些視窗WD之間隔小於或等於5毫秒,以避免使用者感到延遲。
然後,在步驟S150中,聲紋辨識單元150於各個視窗WD進行聲紋辨識,以確認聲音訊號S1在各個聲源方向D1、D2是否含有特定對象語音B。在此步驟中,聲紋辨識單元150取得針對特定對象語音B之辨識模型MD。辨識模型MD係預先訓練且儲存於聲紋辨識單元150中。
接著,在步驟S151中,聲紋辨識單元150判斷聲音訊號S1在聲源方向D1、D2是否含有特定對象語音B。聲音訊號S1在聲源方向D1不含有特定對象語音B,故進入步驟S161;聲音訊號S1在聲源方向D2含有特定對象語音B,故進入步驟S160。
在步驟S161中,語音消除單元160維持原有之場型,以保持特定對象語音A。請參照第8A圖,其繪示原有之場型F0。在原有之場型F0之下,特定對象語音A得以保持。
在步驟S160中,語音消除單元160以一波束成型技術(beamforming)調整場型,以消除欲消除之特定對象語音B。請參照第8B圖,其繪示調整後場型F1。在調整後場型F1之下,特定對象語音B被減弱。在此步驟中,語音消除單元160隨時間漸進式調整場型F1。舉例來說,請參照第9圖,其繪示根據一實施例之調整係數之示意圖。在時間點T1,辨識出特定對象語
音B,語音消除單元160隨時間漸進式降低調整係數,以隨時間漸進式調整調整場型F1。在時間點T2,特定對象語音B消失了,語音消除單元160隨時間漸進式增加調整係數,以隨時間漸進式復原為原有之場型F0。
接著,在步驟S170中,揚聲器170對一左耳及一右耳輸出已消除特定對象語音B之聲音訊號S1’。
在一種情況中,同一方向可能存在兩種特定對象語音,而需要額外的處理步驟。請參照第10圖,其繪示特定對象語音A、B、C之示意圖。特定對象語音A位於聲源方向D1,特定對象語音B、C位於聲源方向D2。請參照第11圖,其繪示根據另一實施例之消除特定對象語音之方法的流程圖。在步驟S150中,聲紋辨識單元150於各個視窗WD進行聲紋辨識,以確認聲音訊號S1在各個聲源方向D1、D2是否含有特定對象語音B。在此步驟中,聲紋辨識單元150取得針對特定對象語音B之辨識模型MD。
接著,在步驟S151中,聲紋辨識單元150判斷聲音訊號S1在聲源方向D1、D2是否含有特定對象語音B。聲音訊號S1在聲源方向D1不含有特定對象語音B,故進入步驟S161;聲音訊號S1在聲源方向D2含有特定對象語音B,故進入步驟S152。
在步驟S152中,聲紋辨識單元150判斷是否含有兩個以上特定對象語音。如第10圖所示,在聲源方向D2含有特定對象語音B及特定對象語音C,故流程進入步驟S153。
在步驟S153中,語音消除單元160對各個視窗WD消除欲消除之特定對象語音B。在此步驟中,語音消除單元160例如是採用可可適性訊號處理技術消除特定對象語音B。
在步驟S154中,語音消除單元160進行視窗WD合成。合成後,聲源方向D2僅留下特定對象語音C,而不含有特定對象語音B。
接著,在步驟S170中,揚聲器170對一左耳及一右耳輸出已消除特定對象語音B之聲音訊號S1’。
透過上述實施例,特定對象語音B可以順利消除,並保留下重要的特定對象語音A。在處理過程中,使用者感知不到的延遲時間(真實聲音與播放聲音的時間差小於或等於5毫秒)。上述實施例不採用視窗合成之方式,而是採用波束成型技術,使得調整後之聲音訊號S1’能夠保持真實性,而不會有失真的情況。
此外,即使在吵雜環境下,視窗WD的辨識結果可能不穩定時,漸進式的調整場型能夠讓聲音的變化較為平滑,使用者感受較為舒適。
綜上所述,雖然本發明已以實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:耳戴式音訊裝置
110:收音單元
120:語音方向追蹤單元
130:方向加強單元
140:視窗切割單元
150:聲紋辨識單元
160:語音消除單元
170:揚聲器
D1,D2:聲源方向
FO,F1:場型
FA,FB:加強場型
MD:辨識模型
S1,S1’:聲音訊號
WD:視窗
Claims (7)
- 一種具特定對象語音消除機制之耳戴式音訊裝置,包括:複數個收音單元,該些收音單元陣列式排列,以取得一聲音訊號;一語音方向追蹤單元,用以追蹤複數個聲源,以獲得複數個聲源方向;一方向加強單元,用以透過一波束成型技術(beamforming)調整該些收音單元,使得朝向該些聲源之波束能量較高,以對該些聲源方向進行加強;一視窗切割單元,用以對該聲音訊號切割出複數個視窗,其中該些視窗大於或等於32毫秒(ms),該些視窗之間隔小於或等於5毫秒,該些視窗部分重疊;一聲紋辨識單元,用以於各該視窗進行聲紋辨識,以確認該聲音訊號在各該聲源方向是否含有一特定對象語音;一語音消除單元,若該聲音訊號在該些聲源方向之其中之一含有該特定對象語音,則該語音消除單元以該波束成型技術(beamforming)調整一場型,以消除該特定對象語音;以及二揚聲器,用以對一左耳及一右耳輸出已消除該特定對象語音之該聲音訊號。
- 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該些收音單元朝向不同方向。
- 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音方向追蹤單元以一雙耳時間差資訊(interaural time difference,ITD)與一互相關函數(Cross Correlation Function,CCF)追蹤該些聲源,以獲得該些聲源方向。
- 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音消除單元隨時間漸進式調整該場型。
- 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音消除單元隨時間漸進式調整該場型,並且該語音消除單元隨時間漸進式復原該場型。
- 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中若該聲音訊號在該些聲源方向之其中之一不含有該特定對象語音,則該語音消除單元維持該場型。
- 一種消除特定對象語音之方法,包括:以複數個收音單元取得一聲音訊號,該些收音單元陣列式排列;追蹤複數個聲源,以獲得複數個聲源方向;透過一波束成型技術(beamforming)調整該些收音單元,使得朝向該些聲源之波束能量較高,以對該些聲源方向進行加強;對該聲音訊號切割出複數個視窗,其中該些視窗大於或等於32毫秒(ms),該些視窗之間隔小於或等於5毫秒,該些視窗部分重疊; 於各該視窗進行聲紋辨識,以確認該聲音訊號在各該聲源方向是否含有一特定對象語音;若該聲音訊號在該些聲源方向之其中之一含有該特定對象語音,則以該波束成型技術(beamforming)調整一場型,以消除該特定對象語音;以及對一左耳及一右耳輸出已消除該特定對象語音之該聲音訊號。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW109104420A TWI740374B (zh) | 2020-02-12 | 2020-02-12 | 消除特定對象語音之方法及應用其之耳戴式音訊裝置 |
| US17/100,646 US11158301B2 (en) | 2020-02-12 | 2020-11-20 | Method for eliminating specific object voice and ear-wearing audio device using same |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW109104420A TWI740374B (zh) | 2020-02-12 | 2020-02-12 | 消除特定對象語音之方法及應用其之耳戴式音訊裝置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW202131307A TW202131307A (zh) | 2021-08-16 |
| TWI740374B true TWI740374B (zh) | 2021-09-21 |
Family
ID=77178799
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW109104420A TWI740374B (zh) | 2020-02-12 | 2020-02-12 | 消除特定對象語音之方法及應用其之耳戴式音訊裝置 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US11158301B2 (zh) |
| TW (1) | TWI740374B (zh) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115294999B (zh) * | 2022-08-02 | 2025-10-28 | 联想(北京)有限公司 | 音频处理方法和降噪设备 |
| CN116741180B (zh) * | 2023-08-14 | 2023-10-31 | 北京分音塔科技有限公司 | 基于声纹增强和对抗的语音识别模型训练方法及装置 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW201225066A (en) * | 2010-12-14 | 2012-06-16 | Univ Nat Chiao Tung | A microphone array structure and method for noise reduction and enhancing speech |
| CN103733602A (zh) * | 2011-08-16 | 2014-04-16 | 思科技术公司 | 用于静音与源相关联的音频的系统和方法 |
| CN105679329A (zh) * | 2016-02-04 | 2016-06-15 | 厦门大学 | 可适应强烈背景噪声的麦克风阵列语音增强装置 |
| TW201820315A (zh) * | 2016-11-21 | 2018-06-01 | 法國國立高等礦業電信學校聯盟 | 改良型音訊耳機裝置及其聲音播放方法、電腦程式 |
| US20180295240A1 (en) * | 2015-06-16 | 2018-10-11 | Dolby Laboratories Licensing Corporation | Post-Teleconference Playback Using Non-Destructive Audio Transport |
-
2020
- 2020-02-12 TW TW109104420A patent/TWI740374B/zh active
- 2020-11-20 US US17/100,646 patent/US11158301B2/en not_active Expired - Fee Related
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW201225066A (en) * | 2010-12-14 | 2012-06-16 | Univ Nat Chiao Tung | A microphone array structure and method for noise reduction and enhancing speech |
| CN103733602A (zh) * | 2011-08-16 | 2014-04-16 | 思科技术公司 | 用于静音与源相关联的音频的系统和方法 |
| US20180295240A1 (en) * | 2015-06-16 | 2018-10-11 | Dolby Laboratories Licensing Corporation | Post-Teleconference Playback Using Non-Destructive Audio Transport |
| CN105679329A (zh) * | 2016-02-04 | 2016-06-15 | 厦门大学 | 可适应强烈背景噪声的麦克风阵列语音增强装置 |
| TW201820315A (zh) * | 2016-11-21 | 2018-06-01 | 法國國立高等礦業電信學校聯盟 | 改良型音訊耳機裝置及其聲音播放方法、電腦程式 |
Also Published As
| Publication number | Publication date |
|---|---|
| US11158301B2 (en) | 2021-10-26 |
| US20210248992A1 (en) | 2021-08-12 |
| TW202131307A (zh) | 2021-08-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112019962B (zh) | 基于情景的周围声音增强和声学噪声消除 | |
| US10395634B2 (en) | Speech reproduction device configured for masking reproduced speech in a masked speech zone | |
| US11849274B2 (en) | Systems, apparatus, and methods for acoustic transparency | |
| US8655003B2 (en) | Earphone arrangement and method of operation therefor | |
| EP2360943B1 (en) | Beamforming in hearing aids | |
| Launer et al. | Hearing aid signal processing | |
| US20080004872A1 (en) | Apparatus and Method for Sound Enhancement | |
| US20140010373A1 (en) | Binaural hearing aid with frequency unmasking | |
| US9191755B2 (en) | Spatial enhancement mode for hearing aids | |
| Belyi et al. | Integrated psychoacoustic active noise control and masking | |
| CN112616105A (zh) | 用于发射掩蔽信号的可穿戴电子装置 | |
| TWI740374B (zh) | 消除特定對象語音之方法及應用其之耳戴式音訊裝置 | |
| JP5130298B2 (ja) | 補聴器の動作方法、および補聴器 | |
| CN113347519B (zh) | 消除特定对象语音的方法及应用其的耳戴式声音信号装置 | |
| WO2024238643A1 (en) | Audio processing using hearing loss data | |
| JP7740337B2 (ja) | 音声処理装置及び音声処理方法 | |
| US12542124B2 (en) | Headphone speech listening | |
| EP2683179B1 (en) | Hearing aid with frequency unmasking | |
| TWI818413B (zh) | 耳機工作模式自動切換方法 | |
| Ngo | Digital signal processing algorithms for noise reduction, dynamic range compression, and feedback cancellation in hearing aids | |
| CN118870277A (zh) | 具有主动降噪的助听方法、头戴式设备和计算机程序产品 | |
| CN119400147A (zh) | 基于侧音的降噪方法、主动降噪耳机和存储介质 | |
| CN121056802A (zh) | 用于运行听力设备的方法 | |
| HK40000314A (zh) | 媒体补偿通过和模式切换 | |
| HK40000314B (zh) | 媒体补偿通过和模式切换 |