TW200916813A

TW200916813A - Voice direction recognizer using rectangular microphone-array

Info

Publication number: TW200916813A
Application number: TW96137690A
Authority: TW
Inventors: Ming-Yuan Shieh; Chi-Jen Huang
Original assignee: Univ Southern Taiwan
Priority date: 2007-10-08
Filing date: 2007-10-08
Publication date: 2009-04-16

Description

200916813 九、發明說明：【發明所屬之技術領域】本發明係提供-種使祕轉克風_之音财位辨識器，尤雜-種使用_雑麥克風_所構成的矩形_，用:降低環境雜訊影響，提高聲音接收品s與聽覺纽辨識率。【先前技術】按，移動體（例如機器人）的聽覺功能多利用取音褒置（如麥克風）接受聲波後，轉換成電塵來進行語音及語意之辨識，這如同人類的耳雜㈣聲音，轉換成峨繼大腦一般。聲波主要透過空氣進行傳遞，而在—個密閉的環境下(例如：展覽館、辦公室等),，空氣中同時有其他的雜訊(例如：灰塵的折射、空間的反射等)’在游離，這些干擾會嚴重降低語音辨識的效能。習知麟f提㈣賴絲克絲取倾絲立絲克風，來解決因麥克風與語者距離較遠所產生雜訊接收關題。然而使用頭戴式麥克風會造成語者的不便，且長細&戴也會有不舒適的感覺’因此改用免持式麥克風陣列來取代有線式麥克風的語音辨識系統，可克服環境噪音和回音對語音訊號的影響，還原出較乾淨的語音。同時此-技術並非針對特定澡音環境，可適用於任何澡音環境下’得到令人滿意的效果。因此_有許多研究機構投入此一領域進行相關的研究。人的眼睛位於頭部的前方，因此視覺系統是針對前方的物體去做判斷，搭配上頸部的轉動可以看到一定範圍的物體。然而機 200916813 器人不可能不停的旋轉頸部，這樣在與人類的互動上，是不太禮貌的表現。然而有部分研究提出使用全方位鏡頭搭配CCD攝影機作為視覺纽的元件，賴可以克服可視範_問題，但是這樣的設計跟人類眼睛的器官構造與功能是有所不同的本發明希望能達到人類與機器人互動，有如兩個人在互動_樣自然。所以必須配合聽聽統能夠全方位接收訊⑽特性，触到有語者與機器人在互動溝通，藉由這些訊號進行分析與判斷，得到語者方位與距離，再驅動機器人轉向到語者方向，面對面的溝通:是符合人機互動的良好關係。近幾年麥克風陣列的發展，可以分成立體式和平面式。立體式的優點在柯以多村慮說財的方位，销_度可以更加精確，是在計算部份，必須用到三維的快速傅力業轉換，增加了運算上的複雜性與花費時間。另外’習知相關之專利前案，諸如胡竹生等人所創作之「個人電腦之麥克風陣列系統」創作第Ι2βδ477號及許天明所創作之「結合定位技術之麥克風陣列收音方法及其系統」創作第㈣卿號。該些專利前案揭示有相關之麥克風陣列相職術，在此併入本文，以供參考。【發明内容】 …本伽之目的储供-種使用矩形麥克風_之音訊方位辨識益係使用線性（平面式)麥克風陣列，用以迅速的讓機器人做出反應’減少域式麥克風_計算上的繁雜。 200916813 為達致上述目的，本發明之語音方位辨識器，包括：複數個平面，每一平面設置有複數顆各相距一定距離的麥克風，以形成方形陣列；一個二階放大電路，用以接收前述麥克風之聲音訊號後，將訊號進行放大；一帶通濾波器，把前述經二階放大電路放大後之訊號，而將不必要的頻率雜訊給濾除掉。藉此，有效降低系統複雜性，用以迅速的讓機器人做出反應，減少立體式麥克風陣列計算上的繁雜。為了讓本發明之上述目的、特徵、優點能更明顯，下文特舉本發明較佳實施例，並配合所附圖示，作詳細說明如下。【實施方式】請參閱第-圖，其係根據本發明實施例所綠製之麥克風電路圖。包括有：-麥克風部份2;—㈣路4，與該麥克風部份2 電性^接；及-電源部份6，用以提供前述配置動作所需之能源。立明參閱第―®，其係根據本發明實施例崎製之麥克風陣列丁忍圖包括有複數個平面，每一平面8設置有複數顆（例如四顆）各她-定距離（例如5cm)的麥克風1〇，以形成方形陣列 (最好疋正方料列）的擺放方式，肋魏不同四個面的作判定。本發明實施靖_之料麥姐1G，細電容式麥克風來現，由於電容式麥克風具有諸多優點（例如成電能訊號、魏『肛* a h。日直接轉換原曰重現』的特性及具有極為寬廣的頻率響 …，轉容式麥克朗對於聲音的反應極為靈敏，以致，也同 200916813 時把細微雜訊也接收進來，並且輸出電壓也很小，不容易去觀察聲音的變化與判斷此音段為有聲段(speech segment)還是無聲段 (silence segment)或雜訊(noise)。因此在電路設計方面，前述之麥克風10在接收到聲音訊號之後，係經過一個二階放大電路12 (如第三圖所示），用以先將訊號進行放大。由於訊號經放大後，雜訊也一同放大，因此，本發明實施例以一高通濾波器（Hight Pass Filter ’ HPF)與一低通遽波器（Low Pass Filter，LPF)戶斤構成的帶通濾波器14(如第四圖所示），以把不必要的頻率雜訊給濾除掉。本發明實施例經試驗後，認為麥克風前置二級放大迴路增益 (Gain)之範圍應介於1〇~1〇〇〇〇之間為宜，如公式(一)及(二)式所計算，本發明實施例經過實驗測試與調整後，將增益值設定為1〇〇。

Gain{min)

Gain(max) R2 R7(mix) 100K 10K 10K χϊοκ ' 〜min) 100^ 1½ x 丁

10 100000 (二) 在真實的系統上，做出理想的低通濾波器是不易實現的，一個真實的低通濾波器，其頻率響應在截止頻率處通常會有衰減。另外，帶通濾波器的設計上也相當複雜，因此，本發明實施例之 200916813 ;慮波器為_低通;慮波器與南通滤波器結合而成，取樣頻率會比信號最大的頻寬的兩倍再多一點，一般是再多出約1〇%，本發明實施例所設定的取樣頻率為16kHz，如公式(三)及(四)計算。高通濾波器之截止頻率為 hp 2nR3Cx 2s-x80xl〇〇//F= 2〇Hz (二) 低通濾波器之截止頻率為 fl广 (四) 另外，為了整合音訊接㈣制電源部份，本發明實施例以 -電源整合電路16，來分配給四㈣路雜（即配置前述之方形麥克風陣列）所需的電力（如第五圖所示），這樣的設計可以減少線材的耗費财雜’可叫低過多配、_起的電磁波干擾與線阻的損失，也讓本纽在整理收納的時候比較方便。常用來接收音賴元件為麥克風，市面上搭配麥克風來搁取音訊的農置’通常都是使用音效卡，但是傳統的音效卡只有一個輸入頻道，_高_音效卡也不過賴四個舰的接收，而且價格非常的昂貴。本系統之麥克風陣列是由十六個電容式麥克風所組成’為了分別接收這十六個類比訊號進入_做運算，資料 200916813 的P刀在實施上係選用由Advantech研華公司所生產的 11負料榻取|置。由於考量到要達成即時處理並且運算分析出使用者的方向，因此選用擷取速度更快可達纟】_ kS/s的 =SB2.0界φ裝置。除了提供十六個類比輸人頻道，另外此系統也提供了一侧比輸出親，可用來軸馬達哺速控制機器人朝向使用者所在的方向。另外各有八個數位輸入與輸出的頻道，方便於日後在此系統上更多功能的與開發。本發明實施細提出的使舰形麥克風陣狀音訊方位辨識器，其結合了線性麥克風_、二階訊號放大難帶通渡波器，在肩配放大贿濾、波$之間的最佳化之後，讓資料擷取系統得到的訊號可以代表最多語者方向的條件。因為使用環境的因素本發明選㈣積小同時也絲顧各方位聲音訊號的線性麥克風陣列，捨棄體積大成本高的環狀麥克風陣列系統，與需要經過複雜運算來達到三維空間聲音定位的3D麥克風陣列系統。在資料掏取系統部分，免去傳統音效卡只能支援少數通道的訊號接收，使用多通道轉換迅速的資料擷取器，不僅可以配合本發明十六通道的訊號接收’也能提高系統的反應速度。本發明所使用之線性(平面式)麥克風陣列，可以迅速的讓機器人做出反應，減少立體式麥克風陣列計算上的繁雜。亦設計麥克風陣列應使用的最佳麥克風數，以及麥克風間的擺放適當距離的最佳方式係在單一平面由四顆電容式麥克風各相距5cm的麥克風陣列，以四面也就是正方形擺放方式，來接收四個面的聲音作判 200916813 定為最佳方式。麥克風陣列接收訊號後經過一個二階放大電路，先將訊號進行放大之後，再、㈣-辦通舰肋^必要的頻率雜訊給遽除掉。本創作在實耻更以―低通濾波器搭配一高通遽波器，截止頻率在20Ηζ〜16ΚΗζ之間，有效降録統複雜性。使用麥克風陣列於聽覺系統是近年來主要的研發議題，雖然環型麥克風_可以將聲音減晝分最詳細，每顆麥克風所得到' 的訊號資訊也㈣更確實，但是環性麥克風陣列必須考量圓形系統與聲波(假設為平行波)的切面問題，使得王袁型系統相當複雜，陣列也相當龐大。雖立_麥姐_突破了聲音源高度的問題，使得聲音接收為三維空間更加全面’但是三維富立雜換的運算相當複雜’若要使用關狀或監控纟鱗即時性工作，將降低便利性與反應速度。本發明之線性麥克風_，使用四職容式麥克風增加接收訊號資訊的範圍，在組合成矩形_四方接收訊號更全面。工作電路部份整合-麥克風接收電路、二階放大電路與帶通遽波器，每個頻道（Channel)尺寸已縮小（約只有⑽啦），突破了過去其他系統體積龐大_題。且在選紅作IC部分也多方#試得到效能最理想敝合，崎紐A電路誠波器可能造成的訊號衰減。如前所述，本發明之線性(平面式)麥克贿列有下列之優點： (i)適用於任何環境。 (11)測試者事先不需要經過訓練即可使用 200916813 (iii) 體積小方便運用於機器人等設備上。 (iv) 系統元件成本低。古W方便搭配聲音定位系統或是語者辨識系統，系統相容性同。適用於各類聲音，不受限於任意發聲元件。故本發明之提出，確實已可改善前逑習知之諸多缺失，應符合專利產業上雖然前述的描述及圖式已揭示本發明之較佳實細，惟此乃健實施例之呈現，舉凡各種增添、修改和取代可能使用於本創作較佳實施例，仍應屬落入本發明之申請專利範圍所界定之範圍内。因此，本文於此所揭不的實施例所有觀點，應被視為用以說明本發明，而非用以限制本發明。本發明之範圍應由後附之申請專利範圍所界疋，並涵蓋其合法均等物，並不限於先前之描述。 11 200916813 【圖式簡單說明】第一圖係本發明實施例之麥克風電路圖。第二圖為本發明實施例之麥克風陣列示意圖。第三圖係本發明實施例之麥克風陣列二階放大電路圖。第四圖係本發明實施例HPF與LPF構成的帶通濾波器。第五圖係本發明實施例之電源整合電路圖。【主要元件符號說明】 2 麥克風部份 4 RC電路 6 電源部份 8 平面 10 麥克風 12 二階放大電路 14 帶通濾、波器 16 電源整合電路 12

Claims

200916813 十、申請專利範圍： 1. 一種使用矩形麥克風陣列之音訊方位辨識器，包括：複數個平面，每一平面設置有複數顆各相距一定距離的麥克風，以形成方形陣列；一個二階放大電路，用以接收前述麥克風之聲音訊號後，將訊號進行放大；一帶通濾波器’把前述經二階放大電路放大後之訊號，而將不必要的頻率雜訊給濾除掉。 ^ 2.如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方位辨識器，其中，每一平面設置有四顆麥克風。 3.如申請專利範圍第1或第2項所述之使用矩形麥克風陣列之音訊方位辨識器，其中，該麥克風為電容式麥克風。 4·如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方位辨識器，其中，每一麥克風間之距離約5cm。 “ 5.如申請專利範園第1項所述之使用矩形麥克風陣列之音訊方位辨識器，其中，該帶通濾波器包含有一個低通濾波器與—個高通濾波器。 6.如申請專利範圍第1項所述之使用矩形麥克風陣列之音訊方位辨識器，其中，該麥克風陣列之擺設方式係以正方形擺玫方式。 13