TWI779571B - 聲音處理選擇裝置及聲音處理選擇方法 - Google Patents
聲音處理選擇裝置及聲音處理選擇方法 Download PDFInfo
- Publication number
- TWI779571B TWI779571B TW110114321A TW110114321A TWI779571B TW I779571 B TWI779571 B TW I779571B TW 110114321 A TW110114321 A TW 110114321A TW 110114321 A TW110114321 A TW 110114321A TW I779571 B TWI779571 B TW I779571B
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- signal
- processing
- audio
- signals
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 180
- 238000012545 processing Methods 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000011156 evaluation Methods 0.000 claims description 30
- 230000008569 process Effects 0.000 claims description 16
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000010187 selection method Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001629 suppression Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241001330002 Bambuseae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
- G10K11/17827—Desired external signals, e.g. pass-through audio such as music or speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/02—Synthesis of acoustic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/03—Connection circuits to selectively connect loudspeakers or headphones to amplifiers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Circuits Of Receivers In General (AREA)
Abstract
本發明提供一種聲音處理選擇裝置及方法。對合成聲音訊號分別進行數個聲音訊號處理以產生數個經處理聲音訊號,依據經處理聲音訊號及主要訊號之間的比較結果評估聲音訊號處理,並依據對應於那些聲音訊號處理的評估結果選擇指定應用程式及指定聲音輸出模式對應的聲音訊號處理。合成聲音訊號是對主要訊號加入次要訊號所產生,且聲音訊號處理相關於對合成聲音訊號濾除次要訊號。經處理聲音訊號皆是在相同的指定聲音輸出模式下藉由相同的指定應用程式使用,且比較結果相關於訊號相似性。而評估結果相關於那些比較結果中的訊號相似性最高者。
Description
本發明是有關於一種訊號分析技術,且特別是有關於一種聲音處理選擇裝置及聲音處理選擇方法。
現今已知的聲音訊號處理包括許多的抑制雜訊技術。值得注意的是,在不同的條件下,應用程式(例如,Skype或Teams)使用不同的聲音傳輸模式(例如,內建喇叭、耳機或外接喇叭)將造成很大效果差異。圖1是習知聲音傳輸的架構圖。請參照圖1,分為兩個路徑,其中聲音接收端連接揚聲器,且聲音發送端連接收音器。應用程式和輸出模式在頂層10,雜訊抑制的訊號處理技術在中間層30,靠近硬體的編/解碼器在底層150。在實際使用上,雖然使用者可能會改變應用程式或聲音輸出模式,但現有技術並沒有針對應用程式及/或聲音輸出模式提供對應合適的雜訊抑制處理技術。
有鑑於此,本發明實施例提供一種聲音處理選擇裝置及聲音處理選擇方法,可對特定應用程式及聲音輸出模式提供合適的聲音訊號處理。
本發明實施例的聲音處理選擇方法包括(但不僅限於)下列步驟:對合成聲音訊號分別進行數個聲音訊號處理以產生數個經處理聲音訊號,依據那些經處理聲音訊號及主要訊號之間的數個比較結果評估那些聲音訊號處理,並依據對應於那些聲音訊號處理的評估結果選擇指定應用程式及指定聲音輸出模式對應的聲音訊號處理。合成聲音訊號是對主要訊號加入次要訊號所產生,且那些聲音訊號處理相關於對合成聲音訊號濾除次要訊號。那些經處理聲音訊號皆是在相同的指定聲音輸出模式下藉由相同的指定應用程式使用,且那些比較結果相關於訊號相似性。而評估結果相關於那些比較結果中的訊號相似性最高者。
本發明實施例的聲音訊號處理選擇裝置包括(但不僅限於)儲存器及處理器。儲存器用以儲存數個軟體模組。處理器耦接儲存器,並用以載入且執行那些軟體模組。那些軟體模組包括聲音訊號處理模組、應用控制模組及評估模組。聲音訊號處理模組對合成聲音訊號分別進行數個聲音訊號處理以產生數個經處理聲音訊號。合成聲音訊號是對主要訊號加入次要訊號所產生,且那些聲音訊號處理相關於對合成聲音訊號濾除次要訊號。應用控制模組將那些經處理聲音訊號皆在相同的指定聲音輸出模式下藉由相同的指定應用程式使用。評估模組依據那些經處理聲音訊號及主要訊號之間的數個比較結果分別評估那些聲音訊號處理,並依據對應於那些聲音訊號處理的評估結果選擇指定應用程式及指定聲音輸出模式對應的聲音訊號處理。那些比較結果相關於訊號相似性,且評估結果相關於那些比較結果中訊號相似性最高者。
基於上述,依據本發明實施例的聲音處理選擇裝置及聲音處理選擇方法,針對特定應用程式及特定聲音輸出模式找尋能輸出與主要訊號最相似的聲音訊號的聲音訊號處理。藉此,當應用程式和聲音輸出模式轉變時,可自行切換到適合的聲音訊號處理技術。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
圖2A是依據本發明一實施例的聲音處理選擇裝置100的元件方塊圖,且圖2B是依據本發明一實施例的聲音處理選擇裝置100的元件方塊圖。請參照圖2A及圖2B,聲音處理選擇裝置100包括(但不僅限於)儲存器110及處理器150。聲音處理選擇裝置100可以是桌上型電腦、筆記型電腦、AIO電腦、智慧型手機、平板電腦、或伺服器等裝置。
儲存器110可以是任何型態的固定或可移動隨機存取記憶體(Radom Access Memory,RAM)、唯讀記憶體(Read Only Memory,ROM)、快閃記憶體(flash memory)、傳統硬碟(Hard Disk Drive,HDD)、固態硬碟(Solid-State Drive,SSD)或類似元件。在一實施例中,儲存器110用以記錄程式碼、軟體模組(例如,合成模組111、應用控制模組113、聲音訊號處理模組115、評估模組117及選擇模組119)、組態配置、資料或檔案(例如,聲音訊號、比較結果及評估結果),並待後續實施例詳述。
處理器150耦接儲存器110,處理器150並可以是中央處理單元(Central Processing Unit,CPU)、圖形處理單元(Graphic Processing unit,GPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、現場可程式化邏輯閘陣列(Field Programmable Gate Array,FPGA)、特殊應用積體電路(Application-Specific Integrated Circuit,ASIC)、神經網路加速器或其他類似元件或上述元件的組合。在一實施例中,處理器150用以執行聲音處理選擇裝置100的所有或部份作業,且可載入並執行儲存器110所儲存的各軟體模組、檔案及資料。
下文中,將搭配聲音處理選擇裝置100中的各項元件、模組及訊號說明本發明實施例所述之方法。本方法的各個流程可依照實施情形而隨之調整,且並不僅限於此。
圖3是依據本發明一實施例的聲音處理選擇方法的流程圖。請參照圖3,聲音訊號處理模組115對合成聲音訊號S
S分別進行數個聲音訊號處理以產生數筆經處理聲音訊號S
1 ns~S
N ns(N為正整數,並代表聲音訊號處理的數量)(步驟S310)。具體而言,合成聲音訊號S
S是合成模組111對主要訊號S
M加入次要訊號S
N所產生的。即,對主要訊號S
M及次要訊號S
N合成可產生合成聲音訊號S
S。主要訊號S
M可以是單純語音訊號(例如,沒雜訊的人聲訊號)、透過收音器錄製的語音訊號或空白的靜音訊號(即,無聲訊號)。而次要訊號S
N可以是生物(例如,狗、鳥、或嬰兒)所發出聲音、機器(例如,壓縮機或馬達)運作聲、合成聲、環境聲(例如,風聲、竹林敲打聲等)、物件互動作用的聲音(例如,手指點擊滑鼠的聲音、球碰撞牆等)或其組合。只要是主要訊號S
M以外的其他聲音都可視為次要訊號S
N。
在一實施例中,合成模組111例如可對兩訊號S
M, S
N在頻譜上疊加或採用其他合成技術。在另一實施例中,聲音處理選擇裝置100可透過內建、外置或外部喇叭同時播放主要訊號S
M及次要訊號S
N,並進一步錄製,以取得合成聲音訊號S
S。
另一方面,在一實施例中,聲音訊號處理模型115對合成聲音訊號S
S所進行的聲音訊號處理是相關於對合成聲音訊號S
S濾除次要訊號S
N。例如,聲音訊號處理的目的之一在於還原主要訊號S
M、或雜訊消除。雜訊/降噪抑制(或聲源分離)技術例如是產生與雜訊音波相位相反的訊號、或利用獨立成分分析(Independent Components Analysis,ICA)等方式自合成聲音訊號S
S中消除雜訊(即,次要訊號S
N),且本發明實施例不加以限制技術類型。
值得注意的是,基於不同技術的聲音訊號處理對相同輸入訊號所輸出的訊號在頻率、波形或振幅上可能有差異。若欲評估多種聲音訊號處理技術,聲音訊號處理模組115可整合這些聲音訊號處理技術,並分別採用不同聲音訊號處理技術來處理合成聲音訊號S
S。此外,若欲了解特定聲音訊號處理對不同次要訊號S
N的濾除能力,合成模組111也可分別加入不同類型的次要訊號S
N,以用於後續的評估訓練。
另一方面,應用控制模組113可將那些經處理聲音訊號S
1 ns~S
N ns皆在相同的指定聲音輸出模式下藉由相同的指定應用程式使用。指定聲音輸出模式是數種聲音輸出模式中的一者。聲音輸出模式例如是內建喇叭、耳機、或外接喇叭。須說明的是,不同類型或廠牌的喇叭或耳機也可視為不同聲音輸出模式。此外,指定應用程式是數種應用程式中的一者。這些應用程式會使用聲音訊號。應用程式例如是視訊軟體、通話軟體、音樂軟體、影片播放軟體。本發明實施例對這些經處理聲音訊號S
1 ns~S
N ns評估選擇相同的應用條件(即,相同的指定聲音輸出模式及相同的指定應用程式)。在實際操作下,應用控制模組113可啟動指定應用程式並設定在指定輸出模式下,且將輸入的聲音訊號作為錄製或欲播放的聲音訊號並輸入到指定應用程式。
在一實施例中,請參照圖2A,針對聲音接收端,應用控制模組113可對合成聲音訊號S
S經指定應用程式處理並透過指定聲音輸出模式輸出以產生模擬輸出聲音訊號S
C。這模擬輸出聲音訊號S
C不需要透過喇叭實際發出聲音。在一實施例中,聲音訊號處理模組115可透過虛擬音訊纜線(Virtual Audio Cable,VAC)技術(即,程序或程式之間轉送音訊串流)取得指定應用程式所輸出的那模擬輸出聲音訊號S
C。此外,聲音訊號處理模組115可對模擬輸出聲音訊號S
C(作為欲播放的聲音訊號)分別進行那些接收端的聲音訊號處理以產生那些經處理聲音訊號S
1 ns~S
N ns。也就是說,若欲評估接收端的聲音訊號處理,則需要先模擬使用指定應用程式及指定聲音輸出模式所輸出的聲音訊號,再對這些聲音訊號分別經過不同聲音訊號處理。
在另一實施例中,請參照圖2B,針對聲音傳送端,聲音訊號處理模組115可對模擬輸出聲音訊號分別進行那些傳送端的聲音訊號處理以產生那些經處理聲音訊號S
1 ns~S
N ns。接著,應用控制模組113可將那些經處理聲音訊號S
1 ns~S
N ns(作為錄製的聲音訊號)經指定應用程式處理並透過指定聲音輸出模式輸出以產生數個模擬輸出聲音訊號S
1 C~S
N C。也就是說,若欲評估傳送端的聲音訊號處理,則需要先模擬對這些聲音訊號分別經過不同聲音訊號處理,再使用指定應用程式及指定聲音輸出模式輸出聲音訊號。
評估模組117可依據那些經處理聲音訊號S
1 ns~S
N ns(也可能是模擬輸出聲音訊號S
1 C~S
N C)及主要訊號S
M之間的數個比較結果分別評估那些聲音訊號處理(步驟S330)。具體而言,評估模組117將使用不同聲音訊號處理所輸出的經處理聲音訊號S
1 ns~S
N ns與主要訊號S
M比較,以產生數個比較結果。而這些比較結果相關於訊號相似性。訊號相似性例如聲紋特性的相似性、語意辨識度(例如,經語音轉文字後的文字內容的正確程度)、或次要訊號S
N的殘量(例如,在特定頻帶上的訊號強度)。須說明的是,比較訊號相似性的方法有很多。例如,若主要訊號S
M是乾淨沒雜訊的人聲訊號,則評估模組117可採用結合聲紋特性及語意辨識度的比較。又例如,若主要訊號S
M是空白的靜音訊號,則相似度越高代表訊號越小。換句而言,若欲比較聲音訊號處理的抑制雜訊能力,則經處理聲音訊號S
1 ns~S
N ns越小越好。
評估模組117可依據對應於那些聲音訊號處理的評估結果選擇指定應用程式及指定聲音輸出模式對應的一個或更多個聲音訊號處理(步驟S350)。具體而言,評估結果相關於那些比較結果中訊號相似性最高者。換句而言,訊號相似性越高,代表對應聲音訊號處理較適合此指定應用程式及指定聲音輸出模式。另一方面,訊號相似性越低,代表對應聲音訊號處理較不適合此指定應用程式及指定聲音輸出模式。評估模組117可自那些聲音訊號處理選擇一個或更多個相似性最高者、次高者或其他順位者,並將此指定應用程式及指定聲音輸出模式與選擇的聲音訊號處理相關聯。
須說明的是,若欲評估數個應用程式及聲音輸出模式,則應用控制模組113可選擇其他應用程式及聲音輸出模式作為指定應用程式及指定聲音輸出模式,並經由評估模組117來判斷其他應用程式及聲音輸出模式所合適的聲音訊號處理。
在一實施例中,合適的聲音訊號處理已決定。若選擇指定聲音輸出模式及指定應用程式(即,應用控制模組115判斷當前選擇的聲音輸出模式為指定聲音輸出模式,並判斷當前選擇的應用程式為指定應用程式),則選擇模組119可使用基於評估結果所選擇的聲音訊號處理來處理指定應用程式的聲音訊號。即,針對指定應用程式及指定聲音輸出模式,基於評估結果選擇最合適的聲音訊號處理。例如,使用者開啟視訊軟體並設定喇叭輸出,則選擇模組119可選擇對應於視訊軟體及喇叭輸出的聲音訊號處理。
另一方面,若未選擇指定聲音輸出模式及指定應用程式(即,應用控制模組115判斷當前選擇的聲音輸出模式不為指定聲音輸出模式,並判斷當前選擇的聲音輸出模式不為指定聲音輸出模式),則選擇模組119可切換至其他聲音訊號處理。換句而言,若當前選擇的聲音輸出模式轉變為第二指定聲音輸出模式,且當前選擇的應用程式轉變為第二指定應用程式,則選擇模組119可切換至針對第二指定應用程式及第二指定聲音輸出模式對應聲音訊號處理。例如,使用者視訊結束後開啟語音通話軟體並設定耳機輸出,則選擇模組119可切換至對應於語音通話軟體及耳機輸出的聲音訊號處理。
綜上所述,在本發明實施例的聲音處理選擇裝置及聲音處理選擇方法中,訓練出特定應用程式及聲音輸出模式所合適的聲音訊號處理。當應用程式及聲音輸出模式轉變時,本發明實施例可自行切換到合適的聲音訊號處理。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
10:頂層
30:中間層
50:底層
100:聲音處理選擇裝置
110:儲存器
111:合成模組
113:應用控制模組
115:聲音訊號處理模組
117:評估模組
119:選擇模組
150:處理器
S
M:主要訊號
S
N:次要訊號
S
S:合成聲音訊號
S
C、S
1 C~S
N C:模擬輸出聲音訊號
S
1 ns~S
N ns:經處理聲音訊號
S310~S350:步驟
圖1是習知聲音傳輸的架構圖。
圖2A是依據本發明一實施例的聲音處理選擇裝置的元件方塊圖。
圖2B是依據本發明一實施例的聲音處理選擇裝置的元件方塊圖。
圖3是依據本發明一實施例的聲音處理選擇方法的流程圖。
S310~S350:步驟
Claims (10)
- 一種聲音處理選擇方法,包括:對一主要訊號加入一次要訊號以產生一合成聲音訊號;反應於該合成聲音訊號之產生,對該合成聲音訊號分別進行多個聲音訊號處理以產生多個經處理聲音訊號,其中該些聲音訊號處理皆是用於對該合成聲音訊號濾除該次要訊號;分別比較該些經處理聲音訊號及該主要訊號,以產生多個比較結果,其中每一該比較結果是該些經處理聲音訊號中的一者與該主要聲音訊號之間的一訊號相似性;依據該些經處理聲音訊號及該主要訊號之間的該些比較結果決定該些聲音訊號處理的一評估結果,其中該些經處理聲音訊號皆是在相同的一指定聲音輸出模式下藉由相同的一指定應用程式使用;以及依據對應於該些聲音訊號處理的該評估結果選擇該指定應用程式及該指定聲音輸出模式對應的一該聲音訊號處理,其中該評估結果相關於該些比較結果中該訊號相似性最高者。
- 如請求項1所述的聲音處理選擇方法,更包括:判斷當前選擇的一聲音輸出模式為該指定聲音輸出模式;判斷當前選擇的一應用程式為該指定應用程式;反應於選擇該指定聲音輸出模式及該指定應用程式,使用基於該評估結果所選擇的該聲音訊號處理來處理該指定應用程式的聲音訊號;以及 反應於未選擇該指定聲音輸出模式及該指定應用程式,切換至其他聲音訊號處理。
- 如請求項1所述的聲音處理選擇方法,其中產生該些經處理聲音訊號的步驟包括:對該合成聲音訊號經該指定應用程式處理並透過該指定聲音輸出模式輸出,以產生一模擬輸出聲音訊號;以及對該模擬輸出聲音訊號分別進行該些聲音訊號處理以產生該些經處理聲音訊號。
- 如請求項1所述的聲音處理選擇方法,其中產生該些經處理聲音訊號的步驟包括:將該些經處理聲音訊號經該指定應用程式處理並透過該指定聲音輸出模式輸出,以產生多個模擬輸出聲音訊號,其中該些模擬輸出聲音訊號用於評估該些聲音訊號處理。
- 如請求項3或請求項4所述的聲音處理選擇方法,其中產生該些經處理聲音訊號的步驟包括:透過一虛擬音訊纜線(Virtual Audio Cable,VAC)技術取得該指定應用程式所輸出的聲音訊號。
- 一種聲音處理選擇裝置,包括:一儲存器,儲存多個軟體模組;以及一處理器,耦接該儲存器,載入且執行該些軟體模組,其中該些軟體模組包括:一聲音訊號處理模組,對一主要訊號加入一次要訊號以 產生一合成聲音訊號,對該合成聲音訊號分別進行多個聲音訊號處理以產生多個經處理聲音訊號,其中該些聲音訊號處理皆是用於對該合成聲音訊號濾除該次要訊號;一應用控制模組,將該些經處理聲音訊號皆在相同的一指定聲音輸出模式下藉由相同的一指定應用程式使用;以及一評估模組,分別比較該些經處理聲音訊號及該主要訊號,以產生多個比較結果,依據該些經處理聲音訊號及該主要訊號之間的該些比較結果決定該些聲音訊號處理的一評估結果,並依據對應於該些聲音訊號處理的該評估結果選擇該指定應用程式及該指定聲音輸出模式對應的一該聲音訊號處理,其中每一該比較結果是該些經處理聲音訊號中的一者與該主要聲音訊號之間的一訊號相似性,且該評估結果相關於該些比較結果中該訊號相似性最高者。
- 如請求項6所述的聲音處理選擇裝置,其中該應用選擇模組判斷當前選擇的一聲音輸出模式為該指定聲音輸出模式,並判斷當前選擇的一應用程式為該指定應用程式,且該些軟體模組更包括:一選擇模組,其中反應於選擇該指定聲音輸出模式及該指定應用程式,該選擇模組使用基於該評估結果所選擇的該聲音訊號處理來處理該指定應用程式的聲音訊號;以及反應於未選擇該指定聲音輸出模式及該指定應用程式, 該選擇模組切換至其他聲音訊號處理。
- 如請求項6所述的聲音處理選擇裝置,其中該應用控制模組對該合成聲音訊號經該指定應用程式處理並透過該指定聲音輸出模式輸出以產生一模擬輸出聲音訊號,且該聲音訊號處理模組對該模擬輸出聲音訊號分別進行該些聲音訊號處理以產生該些經處理聲音訊號。
- 如請求項6所述的聲音處理選擇裝置,其中該應用控制模組將該些經處理聲音訊號經該指定應用程式處理並透過該指定聲音輸出模式輸出以產生多個模擬輸出聲音訊號,其中該些模擬輸出聲音訊號用於評估該些聲音訊號處理。
- 如請求項8或請求項9所述的聲音處理選擇裝置,其中該聲音訊號處理模組透過一虛擬音訊纜線技術取得該指定應用程式所輸出的聲音訊號。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW110114321A TWI779571B (zh) | 2021-04-21 | 2021-04-21 | 聲音處理選擇裝置及聲音處理選擇方法 |
| CN202110538154.6A CN115223586A (zh) | 2021-04-21 | 2021-05-18 | 声音处理选择装置及声音处理选择方法 |
| US17/492,685 US11810543B2 (en) | 2021-04-21 | 2021-10-04 | Method and apparatus for audio signal processing selection |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW110114321A TWI779571B (zh) | 2021-04-21 | 2021-04-21 | 聲音處理選擇裝置及聲音處理選擇方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TWI779571B true TWI779571B (zh) | 2022-10-01 |
| TW202242858A TW202242858A (zh) | 2022-11-01 |
Family
ID=83606198
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW110114321A TWI779571B (zh) | 2021-04-21 | 2021-04-21 | 聲音處理選擇裝置及聲音處理選擇方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11810543B2 (zh) |
| CN (1) | CN115223586A (zh) |
| TW (1) | TWI779571B (zh) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070010978A1 (en) * | 2002-05-16 | 2007-01-11 | Crutchfield Corporation | Virtual Speaker Demonstration System and Virtual Noise Simulation |
| CN104160714A (zh) * | 2012-03-02 | 2014-11-19 | 雅马哈株式会社 | 内容提供系统、内容提供方法、内容编辑装置、内容解析系统、以及播送站id放音装置 |
| US20150373474A1 (en) * | 2014-04-08 | 2015-12-24 | Doppler Labs, Inc. | Augmented reality sound system |
| TW201835784A (zh) * | 2016-12-30 | 2018-10-01 | 美商英特爾公司 | 物聯網 |
| US20210041953A1 (en) * | 2019-08-06 | 2021-02-11 | Neuroenhancement Lab, LLC | System and method for communicating brain activity to an imaging device |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8208654B2 (en) | 2001-10-30 | 2012-06-26 | Unwired Technology Llc | Noise cancellation for wireless audio distribution system |
| US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
| US20110096942A1 (en) * | 2009-10-23 | 2011-04-28 | Broadcom Corporation | Noise suppression system and method |
| US8972984B2 (en) * | 2011-05-20 | 2015-03-03 | Citrix Systems, Inc. | Methods and systems for virtualizing audio hardware for one or more virtual machines |
| CN107666637B (zh) * | 2016-07-28 | 2020-04-03 | 骅讯电子企业股份有限公司 | 自调式主动噪声消除方法、系统及耳机装置 |
| CN109410921B (zh) * | 2018-09-30 | 2021-09-07 | 秒针信息技术有限公司 | 一种通过声音进行质量评估的方法及装置 |
| CN110517708B (zh) * | 2019-09-02 | 2024-06-07 | 平安科技(深圳)有限公司 | 一种音频处理方法、装置及计算机存储介质 |
| CN111158632B (zh) * | 2020-01-07 | 2022-02-25 | 山东超越数控电子股份有限公司 | 一种arm处理器下通用音频接口网络化的方法 |
| CN111462737B (zh) * | 2020-03-26 | 2023-08-08 | 中国科学院计算技术研究所 | 一种训练用于语音分组的分组模型的方法和语音降噪方法 |
-
2021
- 2021-04-21 TW TW110114321A patent/TWI779571B/zh active
- 2021-05-18 CN CN202110538154.6A patent/CN115223586A/zh active Pending
- 2021-10-04 US US17/492,685 patent/US11810543B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070010978A1 (en) * | 2002-05-16 | 2007-01-11 | Crutchfield Corporation | Virtual Speaker Demonstration System and Virtual Noise Simulation |
| CN104160714A (zh) * | 2012-03-02 | 2014-11-19 | 雅马哈株式会社 | 内容提供系统、内容提供方法、内容编辑装置、内容解析系统、以及播送站id放音装置 |
| US20150373474A1 (en) * | 2014-04-08 | 2015-12-24 | Doppler Labs, Inc. | Augmented reality sound system |
| TW201835784A (zh) * | 2016-12-30 | 2018-10-01 | 美商英特爾公司 | 物聯網 |
| US20210041953A1 (en) * | 2019-08-06 | 2021-02-11 | Neuroenhancement Lab, LLC | System and method for communicating brain activity to an imaging device |
Also Published As
| Publication number | Publication date |
|---|---|
| CN115223586A (zh) | 2022-10-21 |
| US20220343889A1 (en) | 2022-10-27 |
| TW202242858A (zh) | 2022-11-01 |
| US11810543B2 (en) | 2023-11-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11620983B2 (en) | Speech recognition method, device, and computer-readable storage medium | |
| CN105493179B (zh) | 具有多个同时语音识别器的系统 | |
| TWI719385B (zh) | 電子裝置及其語音指令辨識方法 | |
| Smus | Web audio API: advanced sound for games and interactive apps | |
| US20130144626A1 (en) | Rap music generation | |
| JP7739583B2 (ja) | 発話向上 | |
| CN112966090B (zh) | 对话音频数据处理方法、电子设备和计算机可读存储介质 | |
| CN114678038B (zh) | 音频噪声检测方法、计算机设备和计算机程序产品 | |
| CN110503991A (zh) | 语音播报方法、装置、电子设备及存储介质 | |
| TWI740315B (zh) | 聲音分離方法、電子設備和電腦可讀儲存媒體 | |
| CN116185167B (zh) | 音乐分轨匹配振动的触觉反馈方法、系统及相关设备 | |
| TWI779571B (zh) | 聲音處理選擇裝置及聲音處理選擇方法 | |
| CN117643075A (zh) | 用于言语增强的数据扩充 | |
| US11636844B2 (en) | Method and apparatus for audio signal processing evaluation | |
| TWI662545B (zh) | 調整語音頻率之方法及其聲音播放裝置 | |
| JP2021072465A (ja) | 回路装置、音再生装置及び電子機器 | |
| JP2017106989A5 (ja) | 音声対話方法、音声対話装置およびプログラム | |
| US20100087954A1 (en) | Robot and robot control system | |
| CN109522425B (zh) | 一种调整多媒体环境的方法、装置及存储设备 | |
| HK40082743B (zh) | 音频数据处理方法、装置、设备以及介质 | |
| CN120600047A (zh) | 基于本地化处理的实时音频变音控制方法、系统及终端 | |
| WO2025066426A1 (zh) | 音频信号处理方法、电子设备及存储介质 | |
| CN119724210A (zh) | 用于高端吸顶麦的语音信号处理模型的训练方法、电子设备和存储介质 | |
| CN120416713A (zh) | 基于本地化处理的实时音频变音控制方法、系统及终端 | |
| CN116506760A (zh) | 一种耳机记忆控制方法、装置、电子设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| GD4A | Issue of patent certificate for granted invention patent |