TWM648143U

TWM648143U - 語音辨識裝置

Info

Publication number: TWM648143U
Application number: TW112204855U
Authority: TW
Inventors: 張允融
Original assignee: 智管家科技股份有限公司
Priority date: 2023-05-16
Filing date: 2023-05-16
Publication date: 2023-11-11

Abstract

本新型提出一種語音辨識裝置，其包含一處理器、一語音接收單元、一語音辨識單元、一學習分析單元以及一通訊單元，該語音接收單元用以接收使用者之語音，該語音辨識單元用以將該處理器所傳送而來之使用者之語音辨識出關鍵字，該學習分析單元藉由人工智慧技術手段學習使用者之口音，並對關鍵字進行分析，該通訊單元連通、控制相對應之外部平台或外部裝置。俾具有優化之語音辨識作用，來處理使用者所發出的語言，尤其對於方言、口音，讓使用者可以完成用口令、語音就能達成執行目標行動之全部步驟，例如購買欠缺的食材，警急救援，購買配好之餐點，處理快過期或多餘食材等，或者把周邊的智慧家電和電子產品做串聯，以提供單一應用軟體及簡易的控制；使用者無需使用不同的軟體、硬體來執行繁瑣步驟就能完成一項目標行動。

Description

語音辨識裝置

本新型係有關於語音辨識裝置之相關技術領域，特別是指其具有優化之語音辨識作用，來處理使用者所發出的語言，尤其對於方言、口音，讓使用者可以完成用口令、語音就能達成執行目標行動之全部步驟。

現代人們的日常生活中，常常會遇到下列問題：在廚房裡常常要因應不同的需求，例如學做菜、買菜、叫外賣、聯絡物業，以及控制家裏的開銷、看劇、購物，計算開銷及面臨緊急狀況等，往往面對複雜的電子產品，不知如何操作，而且若在家中沒有智能家電狀況下，必須要有很多不同的載具及應用軟體來達成目的。

再者於管理購物方面的問題，現代人們經常會忘記例如冰箱裏與家裡的食物是什麼時候買的，還能放多久這些都是問題，要的時候沒有，要不然食物就會超過保存期限，而造成浪費，臨時要補貨又求助無門。

再者在語音辨識上常常會遇到一些辨識度的問題，例如老年人在說話的方言、口音、甚至口齒不清晰，或是聲音太小，或是環境雜音等等。對於電商操作以及手機、平板手寫輸入不擅長的高齡族群，語音輸入更是他們日常生活不可或缺的幫手，那麼如何讓高齡族群在語音辨識上能有更精準判斷的裝置更是一個待解決的課題。

有鑑於此，為了改善上述之缺點，本新型之創作人係極力加以研究創作，而終於研發完成本新型之一種語音辨識裝置。

本新型之目的在於提出一種語音辨識裝置，其包含一處理器、一語音接收單元、一語音辨識單元、一學習分析單元以及一通訊單元，其中，該語音接收單元用以接收使用者之語音；該語音辨識單元用以將該處理器所傳送而來之使用者之語音辨識出關鍵字；該學習分析單元藉由人工智慧(AI，Artificial Intelligence)技術手段學習使用者之口音，並對使用者所使用的關鍵字進行分析，以及排列出關鍵字順序；該通訊單元連通、控制相對應之外部平台或外部裝置。

本新型具有優化之語音辨識作用，來處理使用者所發出的語言，尤其對於方言、口音，讓使用者可以完成用口令、語音就能達成執行目標行動之全部步驟，例如購買欠缺的食材，警急救援，購買配好之餐點，處理快過期或多餘食材等，或者把周邊的智慧家電和電子產品做串聯，以提供單一應用軟體及簡易的控制。

使用者無需使用不同的軟體、硬體來執行繁瑣步驟就能完成一項目標行動。

因此，為了達成上述本新型之目的，本案之創作人係提供所述語音辨識裝置的一實施例，包含：一處理器；一語音接收單元，資訊連接該處理器，用以接收使用者之語音，並將該使用者之語音傳送至該處理器；一語音辨識單元，資訊連接該處理器，用以將該處理器所傳送而來之使用者之語音辨識出關鍵字，並擷取出來儲存至一資料庫中；一學習分析單元，資訊連接該處理器，該學習分析單元藉由人工智慧(AI，Artificial Intelligence)技術手段進行人工智慧學習，學習使用者之口音，並將學習後之關鍵字存入該資料庫中，且該學習分析單元對使用者所使用的關鍵字進行分析，並建立一關鍵字資料庫，以及排列出關鍵字順序，進而提供給該語音辨識單元與該學習分析單元；以及一通訊單元，資訊連接該處理器，用以基於使用者所使用的關鍵字轉換成相對應之口令、指令，以連通、控制相對應之外部平台或外部裝置。

於一實施例中，該語音接收單元係包含複數個麥克風及降噪模組，該降噪模組可為濾波器，包括電路中的篩檢軟體和韌體過濾演算法，以過濾掉外部不需要的語音/聲音並判斷出實際使用者所說出的指令。

於一實施例中，該學習分析單元其人工智慧技術手段係選自一機械學習(Machine-Learning)運算模組，用以當語音辨識單元在接收到由該處理器傳來之使用者語音，且辨識失敗後，該處理器會啟動機械學習運算模組進行人工智慧學習，利用該機械學習運算模組，透過相對應地調整權重，進行自適應學習的神經網絡框架，來學習每個使用者的口音，並將學習後之關鍵字存入該資料庫中，其中每個獨立的設備都有自我機器學習的能力，使用人工智慧技術，和模糊邏輯和一些專家系統來挑選口音與每個不同使用者常用的關鍵字。

於一實施例中，該學習分析單元係包含一數據分析模組，用以對使用者所使用的關鍵字進行分析，以及排列出關鍵字順序，進而提供給該語音辨識單元與該學習分析單元。該裝置還對使用者在整個生態系網路中產生的關鍵字的頻率進行加權，看是否也會被其他不同的使用者選中，以及使用的頻率。然後，根據原始的關鍵字進行加權，重新生成新的關鍵字集合，更包括所有使用者的關鍵字(以生態網路系中的所有使用者為基礎加權)，也包括每個使用者的關鍵字，使用模式和頻率/加權方法的語音辨識相關的最佳實施例的方法。

於一實施例中，該通訊單元包含一連網模組，用以連接網際網路。

於一實施例中，該通訊單元包含一自動撥接電話模組，用以自動撥打電話或發送訊息至該外部平台或該外部裝置。

於一實施例中，該通訊單元包含一無線傳輸模組，用以無線連通、控制該外部平台或該外部裝置。

於一實施例中，該外部平台可為救援單位、緊急醫療單位、超市、保健購物平台、送貨代購平台、配菜餐服務平台、門房服務平台、雲端資料庫...等。

於一實施例中，該外部裝置可為智慧開關如房門監控之開關，智慧裝置如手機、智慧家電、電子產品...等。

以下僅藉由具體實施例，且佐以圖式作詳細之說明。

1:語音辨識裝置

2:外部平台

3:外部裝置

10:處理器

20:語音接收單元

30:語音辨識單元

31:資料庫

40:學習分析單元

41:關鍵字資料庫

42:機械學習運算模組

43:數據分析模組

50:通訊單元

51:連網模組

52:自動撥接電話模組

53:無線傳輸模組

圖1係顯示本新型之一種語音辨識裝置之立體圖；圖2係顯示本新型之一種語音辨識裝置之主要構件方塊圖；圖3係顯示本新型之一種語音辨識裝置於進行語音辨識時之流程圖；圖4係顯示本新型之一種語音辨識裝置於進行人工智慧學習時之流程圖；以及圖5係顯示本新型之一種語音辨識裝置於進行數據分析時之使用流程圖。

為了能夠更清楚地描述本新型所提出的一種語音辨識裝置，以下將配合圖式，詳盡說明本新型之較佳實施例。

圖1係顯示本新型之一種語音辨識裝置之立體圖，圖2係顯示本新型之一種語音辨識裝置之主要構件方塊圖。

如圖1、圖2所示，本新型之語音辨識裝置1係包含一處理器10、一語音接收單元20、一語音辨識單元30、一學習分析單元40以及一通訊單元50。

該語音接收單元20資訊連接該處理器10，用以接收使用者之語音，並將該使用者之語音傳送至該處理器10。

該語音辨識單元30資訊連接該處理器10，用以將該處理器10所傳送而來之使用者之語音辨識出關鍵字，並擷取出來儲存至一資料庫中31。

該學習分析單元40資訊連接該處理器10，該學習分析單元40藉由人工智慧(AI，Artificial Intelligence)技術手段進行人工智慧學習，學習使用者之口音，並將學習後之關鍵字存入該資料庫31中，且該學習分析單元40對使用者所使用的關鍵字進行分析，並建立一關鍵字資料庫41，以及排列出關鍵字順序，進而提供給該語音辨識單元30與該學習分析單元40。

該通訊單元50資訊連接該處理器10，用以基於使用者所使用的關鍵字轉換成相對應之口令、指令，以連通、控制相對應之外部平台2或外部裝置3。

於一實施例中，該語音接收單元20係包含複數個麥克風及降噪模組，該降噪模組可為濾波器。

據此，藉由降噪模組可使該等麥克風過濾掉外部不需要的語音、聲音，可接收到較真實的語音，增加語音辨識成功率與準確率。

於一實施例中，該學習分析單元40其人工智慧技術手段係選自一機械學習(Machine-Learning)運算模組42，用以當語音辨識單元30在接收到由該處理器10傳來之使用者語音，且辨識失敗後，該處理器10會啟動機械學習運算模組42進行人工智慧學習，利用該機械學習運算模組42，透過相對應地調整權重，進行自適應學習的神經網絡框架，來學習每個使用者的口音，並將學習後之關鍵字同樣存入該資料庫31中。

於一實施例中，該學習分析單元40係包含一數據分析模組43，用以對使用者所使用的關鍵字進行分析，以及排列出關鍵字順序，進而提供給該語音辨識單元30與該學習分析單元40。

據此，本新型之語音辨識裝置1經過每一次的口語音辨識以及人工智慧學習，該處理器10驅動數據分析模組43針對使用者所使用的關鍵字進行分析，使用者總共使用的關鍵字次數、喜好、場合等，並調整權重，藉以分析並建立關鍵字資料庫41，以及排列出關鍵字順序，提供給語音辨識單元30與學習分析單元40，增加語音辨識成功率與準確率。

於一實施例中，該通訊單元50包含一連網模組51，用以連接網際網路。

於一實施例中，該通訊單元50包含一自動撥接電話模組52，用以自動撥打電話或發送訊息至該外部平台2或該外部裝置3。

於一實施例中，該通訊單元50包含一無線傳輸模組53，用以無線連通、控制該外部平台2或該外部裝置3。

於一實施例中，該外部平台2可為救援單位、緊急醫療單位、超市、保健購物平台、送貨代購平台、配菜餐服務平台、門房服務平台、雲端資料庫...等。

於一實施例中，該外部裝置3可為智慧開關如房門監控之開關，智慧裝置如手機、智慧家電、電子產品...等。

上述為本新型之各部構件及其組成方式介紹，接著再將本新型之使用特點、功效介紹如下：語音辨識使用例：圖3係顯示本新型之一種語音辨識裝置於進行語音辨識時之流程圖。

如圖1至圖3所示，當語音接收單元20接收使用者之語音後，經由處理器10傳送至語音辨識單元30，當語音辨識單元30成功辨識後，便會將辨識出之關鍵字提取出來儲存至資料庫31中，作為下次辨識的比對基礎，因此語音辨識單元30會隨著使用多次後越來越精準。

人工智慧學習使用例：圖4係顯示本新型之一種語音辨識裝置於進行人工智慧學習時之流程圖。

如圖1、圖2及圖4所示，當語音辨識單元30在接收到由處理器10傳來之使用者語音，且辨識失敗後，處理器10便會啟動學習分析單元40進行人工智慧學習，利用人工智慧技術，透過相對應地調整權重，進行自適應用學習的神經網絡框架，來學習每個使用者的口音，並將學習後之關鍵字同樣存入資料庫31中。

數據分析使用例：圖5係顯示本新型之一種語音辨識裝置於進行數據分析時之使用流程圖。

如圖1、圖2及圖5所示，本新型語音辨識裝置1經過每一次的語音辨識以及學習，藉處理器10驅使學習分析單元40針對使用者所使用的關鍵字進行分析，使用者總共使用的關鍵字次數、喜好、場合等，並調整權重，藉以分析並建立關鍵字資料庫41，以及排列出關鍵字順序，提供給語音辨識單元30與學習分析單元40，增加語音辨識成功率與準確率。

如圖1、圖2所示，於一使用例中，利用本新型語音辨識裝置1之語音辨識作用及通訊單元50之傳輸作用，而可以連線雲端資料庫達到查詢食譜，此時本新型語音辨識裝置1也可另外連上網際網路，並連接搜尋引擎，例如google、icook愛料理等。

於一使用例中，利用本新型語音辨識裝置1之語音辨識作用及通訊單元50之傳輸作用，可達到一個口令即驅動緊急救援，此時本新型語音辨識裝置1還可另外連上網際網路或電話，當語音接收單元20接收到特定口令，且經語音辨識單元30辨識為需要驅動緊急救援的關鍵字時，處理器10即透過通訊單元50連上網際網路，進而連通救援單位、緊急醫療單位等或是自動撥打救援電話並發送救援訊息，該救援訊息可以包含地址、GPS定位、緊急聯絡人資料等。

本新型具有之有利效益：本新型的最大優化及優勢在於把原本需要應用不同應用程式(APP)才能完成不同或是相同功能，而是將該些不同或是相同功能整合在本新型語音辨識裝置，並建構語音地方語言輸入以方便叫喚使用並對話，另一方面本新型語音辨識裝置也具有抗油污、抗高熱等功效。進而讓婆婆媽媽們對於家事管理不再是一件無聊且費神的事，及對於一般對3C產品不熟的使用者、在使用環境而雙手相當忙碌之使用者，讓消費者達到更多的需求更多的需求。

本新型語音辨識裝置可使用一鍵或口頭命令啟動危機處理支援(醫療、火災等所需)利用後台系統的串連完成。因為本新型語音辨識裝置可為固定裝置，當位置確定時可減少誤判及搜尋所耽誤之時間，使用者因為個人資料(保健食品、藥物使用紀錄、基本資料等)，醫院醫師紀錄等都有儲存所以可以完整無誤的轉送出。

綜合以上所述，本新型語音辨識裝置具有優化之語音辨識作用，來處理使用者所發出的語言，尤其對於方言、口音，讓使用者可以完成用口令、語音就能達成執行目標行動之全部步驟，例如購買欠缺的食材，警急救援，購買配好之餐點，處理快過期或多餘食材等，或者把周邊的智慧家電和電子產品做串聯，以提供單一應用軟體及簡易的控制。

必須加以強調的是，上述之詳細說明係針對本新型可行實施例之具體說明，惟該實施例並非用以限制本新型之專利範圍，凡未脫離本新型技藝精神所為之等效實施或變更，均應包含於本案之專利範圍中。