[go: up one dir, main page]

TWI740374B - 消除特定對象語音之方法及應用其之耳戴式音訊裝置 - Google Patents

消除特定對象語音之方法及應用其之耳戴式音訊裝置 Download PDF

Info

Publication number
TWI740374B
TWI740374B TW109104420A TW109104420A TWI740374B TW I740374 B TWI740374 B TW I740374B TW 109104420 A TW109104420 A TW 109104420A TW 109104420 A TW109104420 A TW 109104420A TW I740374 B TWI740374 B TW I740374B
Authority
TW
Taiwan
Prior art keywords
voice
sound
ear
unit
specific
Prior art date
Application number
TW109104420A
Other languages
English (en)
Other versions
TW202131307A (zh
Inventor
杜博仁
張嘉仁
曾凱盟
戴魁廷
林致達
Original Assignee
宏碁股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宏碁股份有限公司 filed Critical 宏碁股份有限公司
Priority to TW109104420A priority Critical patent/TWI740374B/zh
Priority to US17/100,646 priority patent/US11158301B2/en
Publication of TW202131307A publication Critical patent/TW202131307A/zh
Application granted granted Critical
Publication of TWI740374B publication Critical patent/TWI740374B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • H04R5/0335Earpiece support, e.g. headbands or neckrests
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17885General system configurations additionally using a desired external signal, e.g. pass-through audio such as music or speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17873General system configurations using a reference signal without an error signal, e.g. pure feedforward
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • G10K11/346Circuits therefor using phase variation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/108Communication systems, e.g. where useful sound is kept and noise is cancelled
    • G10K2210/1081Earphones, e.g. for telephones, ear protectors or headsets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3046Multiple acoustic inputs, multiple acoustic outputs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/321Physical
    • G10K2210/3215Arrays, e.g. for beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一種消除特定對象語音之方法及應用其之耳戴式音訊裝置。耳戴式音訊裝置包括數個收音單元、一語音方向追蹤單元、一方向加強單元、一視窗切割單元、一聲紋辨識單元、一語音消除單元及二揚聲器。此些收音單元陣列式排列,以取得一聲音訊號。語音方向追蹤單元用以追蹤數個聲源,以獲得數個聲源方向。聲紋辨識單元確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則語音消除單元以一波束成型技術調整一場型,以消除特定對象語音。

Description

消除特定對象語音之方法及應用其之耳戴式音訊 裝置
本發明是有關於一種語音處理方法及應用其之音訊裝置,且特別是有關於一種消除特定對象語音之方法及應用其之耳戴式音訊裝置。
在生活中,有些對象在自己周圍說話時,會讓人覺得是一種干擾,有時想要耳根清靜,卻又不想錯失其他重要聲音資訊。因此需要一種針對特定對象語音消除機制,讓我們達到心理平靜的目的。
然而,一般的降噪技術只能使環境的雜訊降低,放大語音訊號,而無法消除特定對象語音,來達到心理平靜的目的。
本發明係有關於一種消除特定對象語音之方法及應用其之耳戴式音訊裝置,其利用語音方向追蹤技術(voice tracking)與波束成型技術(beamforming),消除特定對象語音,來達到心理平靜的目的。
根據本發明之第一方面,提出一種具特定對象語音消除機制之耳戴式音訊裝置。耳戴式音訊裝置包括數個收音單元、一語音方向追蹤單元、一方向加強單元、一視窗切割單元、一聲紋辨識單元、一語音消除單元及二揚聲器。此些收音單元陣列式排列,以取得一聲音訊號。語音方向追蹤單元用以追蹤數個聲源,以獲得數個聲源方向。方向加強單元用以調整此些收音單元,以對此些聲源方向進行加強。視窗切割單元用以對聲音訊號切割出數個視窗。聲紋辨識單元用以於各個視窗進行聲紋辨識,以確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則語音消除單元以一波束成型技術(beamforming)調整一場型,以消除特定對象語音。揚聲器用以對一左耳及一右耳輸出已消除特定對象語音之聲音訊號。
根據本發明之第二方面,提出一種消除特定對象語音之方法。消除特定對象語音之方法包括以下步驟。以數個收音單元取得一聲音訊號。此些收音單元陣列式排列。追蹤數個聲源,以獲得數個聲源方向。調整此些收音單元,以對此些聲源方向進行加強。對聲音訊號切割出數個視窗。於各個視窗進行聲紋辨識,以確認聲音訊號在各個聲源方向是否含有一特定對象語音。若聲音訊號在此些聲源方向之其中之一含有特定對象語音,則以一波 束成型技術(beamforming)調整一場型,以消除特定對象語音。對一左耳及一右耳輸出已消除特定對象語音之聲音訊號。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式詳細說明如下:
100:耳戴式音訊裝置
110:收音單元
120:語音方向追蹤單元
130:方向加強單元
140:視窗切割單元
150:聲紋辨識單元
160:語音消除單元
170:揚聲器
A,B,C:特定對象語音
D1,D2:聲源方向
F0,F1:場型
FA,FB:加強場型
MD:辨識模型
S1,S1’:聲音訊號
S110,S120,S130,S140,S150,S151,S152,S153,S154,S160,S161,S170:步驟
T1,T2:時間點
WD:視窗
第1圖繪示二特定對象語音之示意圖。
第2圖繪示根據一實施例之具特定對象語音消除機制之耳戴式音訊裝置的示意圖。
第3圖繪示根據一實施例具特定對象語音消除機制之耳戴式音訊裝置的方塊圖。
第4圖繪示根據一實施例之消除特定對象語音之方法的流程圖。
第5圖繪示根據一實施例之聲源方向之示意圖。
第6A圖繪示特定對象語音之加強場型。
第6B圖繪示另一特定對象語音之加強場型。
第7圖繪示根據一實施例之多個視窗的示意圖。
第8A圖繪示原有之場型。
第8B圖繪示調整後場型。
第9圖繪示根據一實施例之調整係數之示意圖。
第10圖繪示三個特定對象語音之示意圖。
第11圖繪示根據另一實施例之消除特定對象語音之方法的流程圖。
請參照第1圖,其繪示特定對象語音A與特定對象語音B之示意圖。在生活中,使用者可能會覺得特定對象語音B是一種干擾。使用者可能不想聽見特定對象語音B,但直接去關閉耳戴式音訊裝置100,卻又會錯失重要的特定對象語音A。
請參照第2圖及第3圖,第2圖繪示根據一實施例之具特定對象語音消除機制之耳戴式音訊裝置100的示意圖,第3圖繪示根據一實施例具特定對象語音消除機制之耳戴式音訊裝置100的方塊圖。耳戴式音訊裝置100例如是一耳機或一助聽器。耳戴式音訊裝置100包括數個收音單元110、一語音方向追蹤單元120、一方向加強單元130、一視窗切割單元140、一聲紋辨識單元150、一語音消除單元160、及二揚聲器170。收音單元110例如是一麥克風。揚聲器170例如是一喇叭。語音方向追蹤單元120、方向加強單元130、視窗切割單元140、聲紋辨識單元150、及語音消除單元160例如是一電路、一晶片、一電路板、數組程式碼、或儲存程式碼之記錄裝置。耳戴式音訊裝置100可以在接收到外界之聲音訊號S1後,將特定對象語音B消除,再輸出調整後之聲音訊號S1’,來達到心理平靜的目的。以下更搭配一流程圖詳細說明上述各項元件之運作。
請參照第4圖,其繪示根據一實施例之消除特定對象語音之方法的流程圖。在步驟S110中,以此些收音單元110取得聲音訊號S1。如第2圖所示,此些收音單元110係以陣列式排列,且朝向不同方向。如此一來,某一收音單元110主要是接收到特定對象語音A;某一收音單元110主要是接收到特定對象語音B。
接著,在步驟S120中,語音方向追蹤單元120追蹤數個聲源,以獲得數個聲源方向D1、D2。請參照第5圖,其繪示根據一實施例之聲源方向D1、D2之示意圖。語音方向追蹤單元120追蹤特定對象語音A及特定對象語音B,分別獲得聲源方向D1及聲源方向D2。在此步驟中,語音方向追蹤單元120以一雙耳時間差資訊(interaural time difference,ITD)與一互相關函數(Cross Correlation Function,CCF)追蹤此些聲源,以獲得聲源方向D1、D2。
然後,在步驟S130中,方向加強單元130調整此些收音單元110,以對聲源方向D1、D2進行加強。請參照第6A~6B圖,第6A圖繪示特定對象語音A之加強場型FA,第6B圖繪示特定對象語音B之加強場型FB。在此步驟中,方向加強單元130透過一波束成型技術(beamforming)調整收音單元110,以對聲源方向D1、D2進行加強。如第6A圖之加強場型FA所示,朝向特定對象語音A之波束能量較高,可以獲得加強特定對象語音A。如第6B圖之加強場型FB所示,朝向特定對象語音B之波束能量較高,可以獲得加強特定對象語音B。
接著,在步驟S140中,視窗切割單元140對聲音訊號S1切割出數個視窗WD。請參照第7圖,其繪示根據一實施例之多個視窗WD的示意圖。在此步驟中,視窗WD大於或等於32毫秒(ms),有助於聲紋辨識的確認。並且,此些視窗WD之間隔小於或等於5毫秒,以避免使用者感到延遲。
然後,在步驟S150中,聲紋辨識單元150於各個視窗WD進行聲紋辨識,以確認聲音訊號S1在各個聲源方向D1、D2是否含有特定對象語音B。在此步驟中,聲紋辨識單元150取得針對特定對象語音B之辨識模型MD。辨識模型MD係預先訓練且儲存於聲紋辨識單元150中。
接著,在步驟S151中,聲紋辨識單元150判斷聲音訊號S1在聲源方向D1、D2是否含有特定對象語音B。聲音訊號S1在聲源方向D1不含有特定對象語音B,故進入步驟S161;聲音訊號S1在聲源方向D2含有特定對象語音B,故進入步驟S160。
在步驟S161中,語音消除單元160維持原有之場型,以保持特定對象語音A。請參照第8A圖,其繪示原有之場型F0。在原有之場型F0之下,特定對象語音A得以保持。
在步驟S160中,語音消除單元160以一波束成型技術(beamforming)調整場型,以消除欲消除之特定對象語音B。請參照第8B圖,其繪示調整後場型F1。在調整後場型F1之下,特定對象語音B被減弱。在此步驟中,語音消除單元160隨時間漸進式調整場型F1。舉例來說,請參照第9圖,其繪示根據一實施例之調整係數之示意圖。在時間點T1,辨識出特定對象語 音B,語音消除單元160隨時間漸進式降低調整係數,以隨時間漸進式調整調整場型F1。在時間點T2,特定對象語音B消失了,語音消除單元160隨時間漸進式增加調整係數,以隨時間漸進式復原為原有之場型F0。
接著,在步驟S170中,揚聲器170對一左耳及一右耳輸出已消除特定對象語音B之聲音訊號S1’。
在一種情況中,同一方向可能存在兩種特定對象語音,而需要額外的處理步驟。請參照第10圖,其繪示特定對象語音A、B、C之示意圖。特定對象語音A位於聲源方向D1,特定對象語音B、C位於聲源方向D2。請參照第11圖,其繪示根據另一實施例之消除特定對象語音之方法的流程圖。在步驟S150中,聲紋辨識單元150於各個視窗WD進行聲紋辨識,以確認聲音訊號S1在各個聲源方向D1、D2是否含有特定對象語音B。在此步驟中,聲紋辨識單元150取得針對特定對象語音B之辨識模型MD。
接著,在步驟S151中,聲紋辨識單元150判斷聲音訊號S1在聲源方向D1、D2是否含有特定對象語音B。聲音訊號S1在聲源方向D1不含有特定對象語音B,故進入步驟S161;聲音訊號S1在聲源方向D2含有特定對象語音B,故進入步驟S152。
在步驟S152中,聲紋辨識單元150判斷是否含有兩個以上特定對象語音。如第10圖所示,在聲源方向D2含有特定對象語音B及特定對象語音C,故流程進入步驟S153。
在步驟S153中,語音消除單元160對各個視窗WD消除欲消除之特定對象語音B。在此步驟中,語音消除單元160例如是採用可可適性訊號處理技術消除特定對象語音B。
在步驟S154中,語音消除單元160進行視窗WD合成。合成後,聲源方向D2僅留下特定對象語音C,而不含有特定對象語音B。
接著,在步驟S170中,揚聲器170對一左耳及一右耳輸出已消除特定對象語音B之聲音訊號S1’。
透過上述實施例,特定對象語音B可以順利消除,並保留下重要的特定對象語音A。在處理過程中,使用者感知不到的延遲時間(真實聲音與播放聲音的時間差小於或等於5毫秒)。上述實施例不採用視窗合成之方式,而是採用波束成型技術,使得調整後之聲音訊號S1’能夠保持真實性,而不會有失真的情況。
此外,即使在吵雜環境下,視窗WD的辨識結果可能不穩定時,漸進式的調整場型能夠讓聲音的變化較為平滑,使用者感受較為舒適。
綜上所述,雖然本發明已以實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100:耳戴式音訊裝置
110:收音單元
120:語音方向追蹤單元
130:方向加強單元
140:視窗切割單元
150:聲紋辨識單元
160:語音消除單元
170:揚聲器
D1,D2:聲源方向
FO,F1:場型
FA,FB:加強場型
MD:辨識模型
S1,S1’:聲音訊號
WD:視窗

Claims (7)

  1. 一種具特定對象語音消除機制之耳戴式音訊裝置,包括:複數個收音單元,該些收音單元陣列式排列,以取得一聲音訊號;一語音方向追蹤單元,用以追蹤複數個聲源,以獲得複數個聲源方向;一方向加強單元,用以透過一波束成型技術(beamforming)調整該些收音單元,使得朝向該些聲源之波束能量較高,以對該些聲源方向進行加強;一視窗切割單元,用以對該聲音訊號切割出複數個視窗,其中該些視窗大於或等於32毫秒(ms),該些視窗之間隔小於或等於5毫秒,該些視窗部分重疊;一聲紋辨識單元,用以於各該視窗進行聲紋辨識,以確認該聲音訊號在各該聲源方向是否含有一特定對象語音;一語音消除單元,若該聲音訊號在該些聲源方向之其中之一含有該特定對象語音,則該語音消除單元以該波束成型技術(beamforming)調整一場型,以消除該特定對象語音;以及二揚聲器,用以對一左耳及一右耳輸出已消除該特定對象語音之該聲音訊號。
  2. 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該些收音單元朝向不同方向。
  3. 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音方向追蹤單元以一雙耳時間差資訊(interaural time difference,ITD)與一互相關函數(Cross Correlation Function,CCF)追蹤該些聲源,以獲得該些聲源方向。
  4. 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音消除單元隨時間漸進式調整該場型。
  5. 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中該語音消除單元隨時間漸進式調整該場型,並且該語音消除單元隨時間漸進式復原該場型。
  6. 如請求項1所述之具特定對象語音消除機制之耳戴式音訊裝置,其中若該聲音訊號在該些聲源方向之其中之一不含有該特定對象語音,則該語音消除單元維持該場型。
  7. 一種消除特定對象語音之方法,包括:以複數個收音單元取得一聲音訊號,該些收音單元陣列式排列;追蹤複數個聲源,以獲得複數個聲源方向;透過一波束成型技術(beamforming)調整該些收音單元,使得朝向該些聲源之波束能量較高,以對該些聲源方向進行加強;對該聲音訊號切割出複數個視窗,其中該些視窗大於或等於32毫秒(ms),該些視窗之間隔小於或等於5毫秒,該些視窗部分重疊; 於各該視窗進行聲紋辨識,以確認該聲音訊號在各該聲源方向是否含有一特定對象語音;若該聲音訊號在該些聲源方向之其中之一含有該特定對象語音,則以該波束成型技術(beamforming)調整一場型,以消除該特定對象語音;以及對一左耳及一右耳輸出已消除該特定對象語音之該聲音訊號。
TW109104420A 2020-02-12 2020-02-12 消除特定對象語音之方法及應用其之耳戴式音訊裝置 TWI740374B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW109104420A TWI740374B (zh) 2020-02-12 2020-02-12 消除特定對象語音之方法及應用其之耳戴式音訊裝置
US17/100,646 US11158301B2 (en) 2020-02-12 2020-11-20 Method for eliminating specific object voice and ear-wearing audio device using same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109104420A TWI740374B (zh) 2020-02-12 2020-02-12 消除特定對象語音之方法及應用其之耳戴式音訊裝置

Publications (2)

Publication Number Publication Date
TW202131307A TW202131307A (zh) 2021-08-16
TWI740374B true TWI740374B (zh) 2021-09-21

Family

ID=77178799

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109104420A TWI740374B (zh) 2020-02-12 2020-02-12 消除特定對象語音之方法及應用其之耳戴式音訊裝置

Country Status (2)

Country Link
US (1) US11158301B2 (zh)
TW (1) TWI740374B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294999B (zh) * 2022-08-02 2025-10-28 联想(北京)有限公司 音频处理方法和降噪设备
CN116741180B (zh) * 2023-08-14 2023-10-31 北京分音塔科技有限公司 基于声纹增强和对抗的语音识别模型训练方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201225066A (en) * 2010-12-14 2012-06-16 Univ Nat Chiao Tung A microphone array structure and method for noise reduction and enhancing speech
CN103733602A (zh) * 2011-08-16 2014-04-16 思科技术公司 用于静音与源相关联的音频的系统和方法
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
TW201820315A (zh) * 2016-11-21 2018-06-01 法國國立高等礦業電信學校聯盟 改良型音訊耳機裝置及其聲音播放方法、電腦程式
US20180295240A1 (en) * 2015-06-16 2018-10-11 Dolby Laboratories Licensing Corporation Post-Teleconference Playback Using Non-Destructive Audio Transport

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201225066A (en) * 2010-12-14 2012-06-16 Univ Nat Chiao Tung A microphone array structure and method for noise reduction and enhancing speech
CN103733602A (zh) * 2011-08-16 2014-04-16 思科技术公司 用于静音与源相关联的音频的系统和方法
US20180295240A1 (en) * 2015-06-16 2018-10-11 Dolby Laboratories Licensing Corporation Post-Teleconference Playback Using Non-Destructive Audio Transport
CN105679329A (zh) * 2016-02-04 2016-06-15 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
TW201820315A (zh) * 2016-11-21 2018-06-01 法國國立高等礦業電信學校聯盟 改良型音訊耳機裝置及其聲音播放方法、電腦程式

Also Published As

Publication number Publication date
US11158301B2 (en) 2021-10-26
US20210248992A1 (en) 2021-08-12
TW202131307A (zh) 2021-08-16

Similar Documents

Publication Publication Date Title
CN112019962B (zh) 基于情景的周围声音增强和声学噪声消除
US10395634B2 (en) Speech reproduction device configured for masking reproduced speech in a masked speech zone
US11849274B2 (en) Systems, apparatus, and methods for acoustic transparency
US8655003B2 (en) Earphone arrangement and method of operation therefor
EP2360943B1 (en) Beamforming in hearing aids
Launer et al. Hearing aid signal processing
US20080004872A1 (en) Apparatus and Method for Sound Enhancement
US20140010373A1 (en) Binaural hearing aid with frequency unmasking
US9191755B2 (en) Spatial enhancement mode for hearing aids
Belyi et al. Integrated psychoacoustic active noise control and masking
CN112616105A (zh) 用于发射掩蔽信号的可穿戴电子装置
TWI740374B (zh) 消除特定對象語音之方法及應用其之耳戴式音訊裝置
JP5130298B2 (ja) 補聴器の動作方法、および補聴器
CN113347519B (zh) 消除特定对象语音的方法及应用其的耳戴式声音信号装置
WO2024238643A1 (en) Audio processing using hearing loss data
JP7740337B2 (ja) 音声処理装置及び音声処理方法
US12542124B2 (en) Headphone speech listening
EP2683179B1 (en) Hearing aid with frequency unmasking
TWI818413B (zh) 耳機工作模式自動切換方法
Ngo Digital signal processing algorithms for noise reduction, dynamic range compression, and feedback cancellation in hearing aids
CN118870277A (zh) 具有主动降噪的助听方法、头戴式设备和计算机程序产品
CN119400147A (zh) 基于侧音的降噪方法、主动降噪耳机和存储介质
CN121056802A (zh) 用于运行听力设备的方法
HK40000314A (zh) 媒体补偿通过和模式切换
HK40000314B (zh) 媒体补偿通过和模式切换