TW200916813A - Voice direction recognizer using rectangular microphone-array - Google Patents
Voice direction recognizer using rectangular microphone-array Download PDFInfo
- Publication number
- TW200916813A TW200916813A TW96137690A TW96137690A TW200916813A TW 200916813 A TW200916813 A TW 200916813A TW 96137690 A TW96137690 A TW 96137690A TW 96137690 A TW96137690 A TW 96137690A TW 200916813 A TW200916813 A TW 200916813A
- Authority
- TW
- Taiwan
- Prior art keywords
- microphone
- array
- microphone array
- rectangular
- pass filter
- Prior art date
Links
- 230000003321 amplification Effects 0.000 claims abstract description 8
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 8
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000013461 design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000003287 bathing Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 241001122315 Polites Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
200916813 九、發明說明: 【發明所屬之技術領域】 本發明係提供-種使祕轉克風_之音财位辨識器, 尤雜-種使用_雑麥克風_所構成的矩形_,用:降 低環境雜訊影響,提高聲音接收品s與聽覺纽辨識率。 【先前技術】 按,移動體(例如機器人)的聽覺功能多利用取音褒置(如 麥克風)接受聲波後,轉換成電塵來進行語音及語意之辨識,這 如同人類的耳雜㈣聲音,轉換成峨繼大腦一般。 聲波主要透過空氣進行傳遞,而在—個密閉的環境下(例如: 展覽館、辦公室等),,空氣中同時有其他的雜訊(例如:灰塵的折 射、空間的反射等)’在游離,這些干擾會嚴重降低語音辨識的效 能。習知麟f提㈣賴絲克絲取倾絲立絲克風, 來解決因麥克風與語者距離較遠所產生雜訊接收關題。然而使 用頭戴式麥克風會造成語者的不便,且長細&戴也會有不舒適的 感覺’因此改用免持式麥克風陣列來取代有線式麥克風的語音辨 識系統,可克服環境噪音和回音對語音訊號的影響,還原出較乾 淨的語音。同時此-技術並非針對特定澡音環境,可適用於任何 澡音環境下’得到令人滿意的效果。因此_有許多研究機構投 入此一領域進行相關的研究。 人的眼睛位於頭部的前方,因此視覺系統是針對前方的物體 去做判斷,搭配上頸部的轉動可以看到一定範圍的物體。然而機 200916813 器人不可能不停的旋轉頸部,這樣在與人類的互動上,是不太禮 貌的表現。然而有部分研究提出使用全方位鏡頭搭配CCD攝影機 作為視覺纽的元件,賴可以克服可視範_問題,但是這樣 的設計跟人類眼睛的器官構造與功能是有所不同的本發明希望 能達到人類與機器人互動,有如兩個人在互動_樣自然。所以必 須配合聽聽統能夠全方位接收訊⑽特性,触到有語者與機 器人在互動溝通,藉由這些訊號進行分析與判斷,得到語者方位 與距離,再驅動機器人轉向到語者方向,面對面的溝通:是符合 人機互動的良好關係。 近幾年麥克風陣列的發展,可以分成立體式和平面式。立體 式的優點在柯以多村慮說財的方位,销_度可以更加 精確,是在計算部份,必須用到三維的快速傅力業轉換,增加 了運算上的複雜性與花費時間。 另外’習知相關之專利前案,諸如胡竹生等人所創作之「個 人電腦之麥克風陣列系統」創作第Ι2βδ477號及許天明所創作之 「結合定位技術之麥克風陣列收音方法及其系統」創作第㈣卿 號。該些專利前案揭示有相關之麥克風陣列相職術,在此併入 本文,以供參考。 【發明内容】 …本伽之目的储供-種使用矩形麥克風_之音訊方位辨 識益係使用線性(平面式)麥克風陣列,用以迅速的讓機器人做 出反應’減少域式麥克風_計算上的繁雜。 200916813 為達致上述目的,本發明之語音方位辨識器,包括:複數個 平面,每一平面設置有複數顆各相距一定距離的麥克風,以形成 方形陣列;一個二階放大電路,用以接收前述麥克風之聲音訊號 後,將訊號進行放大;一帶通濾波器,把前述經二階放大電路放 大後之訊號,而將不必要的頻率雜訊給濾除掉。藉此,有效降低 系統複雜性,用以迅速的讓機器人做出反應,減少立體式麥克風 陣列計算上的繁雜。 為了讓本發明之上述目的、特徵、優點能更明顯,下文特舉 本發明較佳實施例,並配合所附圖示,作詳細說明如下。 【實施方式】 請參閱第-圖,其係根據本發明實施例所綠製之麥克風電路 圖。包括有:-麥克風部份2;—㈣路4,與該麥克風部份2 電性^接;及-電源部份6,用以提供前述配置動作所需之能源。 立明參閱第―®,其係根據本發明實施例崎製之麥克風陣列 丁忍圖包括有複數個平面,每一平面8設置有複數顆(例如四 顆)各她-定距離(例如5cm)的麥克風1〇,以形成方形陣列 (最好疋正方料列)的擺放方式,肋魏不同四個面的 作判定。 本發明實施靖_之料麥姐1G,細電容式麥克風來 現,由於電容式麥克風具有諸多優點(例如 成電能訊號、魏『肛* a h。日直接轉換 原曰重現』的特性及具有極為寬廣的頻率響 …,轉容式麥克朗對於聲音的反應極為靈敏,以致,也同 200916813 時把細微雜訊也接收進來,並且輸出電壓也很小,不容易去觀察 聲音的變化與判斷此音段為有聲段(speech segment)還是無聲段 (silence segment)或雜訊(noise)。因此在電路設計方面,前述 之麥克風10在接收到聲音訊號之後,係經過一個二階放大電路12 (如第三圖所示),用以先將訊號進行放大。由於訊號經放大後, 雜訊也一同放大,因此,本發明實施例以一高通濾波器(Hight Pass Filter ’ HPF)與一低通遽波器(Low Pass Filter,LPF)戶斤構成 的帶通濾波器14(如第四圖所示),以把不必要的頻率雜訊給濾除 掉。本發明實施例經試驗後,認為麥克風前置二級放大迴路增益 (Gain)之範圍應介於1〇~1〇〇〇〇之間為宜,如公式(一)及(二)式所計 算,本發明實施例經過實驗測試與調整後,將增益值設定為1〇〇。
Gain{min)
Gain(max) R2 R7(mix) 100K 10K 10K χϊοκ ' 〜min) 100^ 1½ x 丁
10 100000 (二) 在真實的系統上,做出理想的低通濾波器是不易實現的,一 個真實的低通濾波器,其頻率響應在截止頻率處通常會有衰減。 另外,帶通濾波器的設計上也相當複雜,因此,本發明實施例之 200916813 ;慮波器為_低通;慮波器與南通滤波器結合而成,取樣頻率會比 信號最大的頻寬的兩倍再多一點,一般是再多出約1〇%,本發明 實施例所設定的取樣頻率為16kHz,如公式(三)及(四)計算。 高通濾波器之截止頻率為 hp 2nR3Cx 2s-x80xl〇〇//F= 2〇Hz (二) 低通濾波器之截止頻率為 fl广 (四) 另外,為了整合音訊接㈣制電源部份,本發明實施例以 -電源整合電路16,來分配給四㈣路雜(即配置前述之方形 麥克風陣列)所需的電力(如第五圖所示),這樣的設計可以減少 線材的耗費财雜’可叫低過多配、_起的電磁波干擾與線 阻的損失,也讓本纽在整理收納的時候比較方便。 常用來接收音賴元件為麥克風,市面上搭配麥克風來搁取 音訊的農置’通常都是使用音效卡,但是傳統的音效卡只有一個 輸入頻道,_高_音效卡也不過賴四個舰的接收,而且 價格非常的昂貴。本系統之麥克風陣列是由十六個電容式麥克風 所組成’為了分別接收這十六個類比訊號進入_做運算,資料 200916813 的P刀在實施上係選用由Advantech研華公司所生產的 11負料榻取|置。由於考量到要達成即時處理並且運算分 析出使用者的方向,因此選用擷取速度更快可達纟】_ kS/s的 =SB2.0界φ裝置。除了提供十六個類比輸人頻道,另外此系統也 提供了一侧比輸出親,可用來軸馬達哺速控制機器人 朝向使用者所在的方向。另外各有八個數位輸入與輸出的頻道, 方便於日後在此系統上更多功能的與開發。 本發明實施細提出的使舰形麥克風陣狀音訊方位辨識 器,其結合了線性麥克風_、二階訊號放大難帶通渡波器, 在肩配放大贿濾、波$之間的最佳化之後,讓資料擷取系統得到 的訊號可以代表最多語者方向的條件。因為使用環境的因素本 發明選㈣積小同時也絲顧各方位聲音訊號的線性麥克風陣 列,捨棄體積大成本高的環狀麥克風陣列系統,與需要經過複雜 運算來達到三維空間聲音定位的3D麥克風陣列系統。在資料掏取 系統部分,免去傳統音效卡只能支援少數通道的訊號接收,使用 多通道轉換迅速的資料擷取器,不僅可以配合本發明十六通道的 訊號接收’也能提高系統的反應速度。 本發明所使用之線性(平面式)麥克風陣列,可以迅速的讓機器 人做出反應,減少立體式麥克風陣列計算上的繁雜。亦設計麥克 風陣列應使用的最佳麥克風數,以及麥克風間的擺放適當距離的 最佳方式係在單一平面由四顆電容式麥克風各相距5cm的麥克風 陣列,以四面也就是正方形擺放方式,來接收四個面的聲音作判 200916813 定為最佳方式。麥克風陣列接收訊號後經過一個二階放大電路, 先將訊號進行放大之後,再、㈣-辦通舰肋^必要的頻率 雜訊給遽除掉。本創作在實耻更以―低通濾波器搭配一高通遽 波器,截止頻率在20Ηζ〜16ΚΗζ之間,有效降録統複雜性。 使用麥克風陣列於聽覺系統是近年來主要的研發議題,雖然 環型麥克風_可以將聲音減晝分最詳細,每顆麥克風所得到' 的訊號資訊也㈣更確實,但是環性麥克風陣列必須考量圓形系 統與聲波(假設為平行波)的切面問題,使得王袁型系統相當複雜,陣 列也相當龐大。雖立_麥姐_突破了聲音源高度的問題, 使得聲音接收為三維空間更加全面’但是三維富立雜換的運算 相當複雜’若要使用關狀或監控纟鱗即時性工作,將降低 便利性與反應速度。 本發明之線性麥克風_,使用四職容式麥克風增加接收 訊號資訊的範圍,在組合成矩形_四方接收訊號更全面。工作 電路部份整合-麥克風接收電路、二階放大電路與帶通遽波器, 每個頻道(Channel)尺寸已縮小(約只有⑽啦),突破了過去 其他系統體積龐大_題。且在選紅作IC部分也多方#試得到 效能最理想敝合,崎紐A電路誠波器可能造成的訊號衰 減。 如前所述,本發明之線性(平面式)麥克贿列有下列之優點: (i)適用於任何環境。 (11)測試者事先不需要經過訓練即可使用 200916813 (iii) 體積小方便運用於機器人等設備上。 (iv) 系統元件成本低。 古W方便搭配聲音定位系統或是語者辨識系統,系統相容性 同。適用於各類聲音,不受限於任意發聲元件。 故本發明之提出,確實已可改善前逑習知之諸多缺失,應符 合專利產業上雖然前述 的描述及圖式已揭示本發明之較佳實細,惟此乃健實施例之 呈現,舉凡各種增添、修改和取代可能使用於本創作較佳實施例, 仍應屬落入本發明之申請專利範圍所界定之範圍内。因此,本文 於此所揭不的實施例所有觀點,應被視為用以說明本發明,而非 用以限制本發明。本發明之範圍應由後附之申請專利範圍所界 疋,並涵蓋其合法均等物,並不限於先前之描述。 11 200916813 【圖式簡單說明】 第一圖係本發明實施例之麥克風電路圖。 第二圖為本發明實施例之麥克風陣列示意圖。 第三圖係本發明實施例之麥克風陣列二階放大電路圖。 第四圖係本發明實施例HPF與LPF構成的帶通濾波器。 第五圖係本發明實施例之電源整合電路圖。 【主要元件符號說明】 2 麥克風部份 4 RC電路 6 電源部份 8 平面 10 麥克風 12 二階放大電路 14 帶通濾、波器 16 電源整合電路 12
Claims (1)
- 200916813 十、申請專利範圍: 1. 一種使用矩形麥克風陣列之音訊方位辨識器,包括: 複數個平面,每一平面設置有複數顆各相距一定距離的麥克 風,以形成方形陣列; 一個二階放大電路,用以接收前述麥克風之聲音訊號後,將 訊號進行放大; 一帶通濾波器’把前述經二階放大電路放大後之訊號,而將 不必要的頻率雜訊給濾除掉。 ^ 2.如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方 位辨識器,其中,每一平面設置有四顆麥克風。 3.如申請專利範圍第1或第2項所述之使用矩形麥克風陣列之音 訊方位辨識器,其中,該麥克風為電容式麥克風。 4·如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方 位辨識器,其中,每一麥克風間之距離約5cm。 “ 5.如申請專利範園第1項所述之使用矩形麥克風陣列之音訊方 位辨識器,其中,該帶通濾波器包含有一個低通濾波器與—個高通 濾波器。 6.如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方 位辨識器,其中,該麥克風陣列之擺設方式係以正方形擺玫方式。 13
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW96137690A TW200916813A (en) | 2007-10-08 | 2007-10-08 | Voice direction recognizer using rectangular microphone-array |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW96137690A TW200916813A (en) | 2007-10-08 | 2007-10-08 | Voice direction recognizer using rectangular microphone-array |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW200916813A true TW200916813A (en) | 2009-04-16 |
Family
ID=44726166
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW96137690A TW200916813A (en) | 2007-10-08 | 2007-10-08 | Voice direction recognizer using rectangular microphone-array |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TW200916813A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI406266B (zh) * | 2011-06-03 | 2013-08-21 | Univ Nat Chiao Tung | 語音辨識裝置及其辨識方法 |
-
2007
- 2007-10-08 TW TW96137690A patent/TW200916813A/zh unknown
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI406266B (zh) * | 2011-06-03 | 2013-08-21 | Univ Nat Chiao Tung | 語音辨識裝置及其辨識方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12266378B2 (en) | Sound modification based on frequency composition | |
| CN108538320B (zh) | 录音控制方法和装置、可读存储介质、终端 | |
| JP2014502439A (ja) | 方向性高感度記録制御のためのシステム、方法、装置、及びコンピュータ可読媒体 | |
| CN106416292A (zh) | 用于获取声信号的方法、电路、设备、系统和相关计算机可执行代码 | |
| JP2015213328A (ja) | マルチマイクロフォンを用いた3次元サウンド獲得及び再生 | |
| CN103873977A (zh) | 基于多麦克风阵列波束成形的录音系统及其实现方法 | |
| US10154345B2 (en) | Surround sound recording for mobile devices | |
| KR20230156967A (ko) | 오디오 줌 | |
| CN116456247A (zh) | 立体声重放方法、装置、话筒设备、音箱设备和介质 | |
| US20240223986A1 (en) | Directional sound emission method, device and apparatus | |
| CN117119355A (zh) | 一种利用机器听觉检测扬声器状态的方法和系统 | |
| CN110010117A (zh) | 一种语音主动降噪的方法及装置 | |
| TW200916813A (en) | Voice direction recognizer using rectangular microphone-array | |
| CN116913328B (zh) | 音频处理方法、电子设备及存储介质 | |
| CN206149485U (zh) | 集成远场语音识别和声场录制的系统 | |
| CN113132845A (zh) | 信号处理方法及装置、计算机可读存储介质及耳机 | |
| Lin et al. | Development of novel hearing aids by using image recognition technology | |
| US20170094412A1 (en) | Wearable recording and playback system | |
| JP2018120007A (ja) | 音声信号変換装置、その方法、及びプログラム | |
| Shabtai et al. | Spherical array beamforming for binaural sound reproduction | |
| CN109920442A (zh) | 一种麦克风阵列语音增强的方法和系统 | |
| CN118338196A (zh) | 一种应用于喇叭单体的发声和拾音两用电路 | |
| CN207039828U (zh) | 一种具有音源识别及定位的耳机 | |
| TWM330707U (en) | Audio extractor using rectangle microphone array | |
| JP2023026927A (ja) | 接話用マイクロホンアレイ及び接話用マイクロホンアレイの設定方法 |