[go: up one dir, main page]

TW201908920A - 數位語音助理之操作系統 - Google Patents

數位語音助理之操作系統 Download PDF

Info

Publication number
TW201908920A
TW201908920A TW106124633A TW106124633A TW201908920A TW 201908920 A TW201908920 A TW 201908920A TW 106124633 A TW106124633 A TW 106124633A TW 106124633 A TW106124633 A TW 106124633A TW 201908920 A TW201908920 A TW 201908920A
Authority
TW
Taiwan
Prior art keywords
voice
command
network
transmission module
digital
Prior art date
Application number
TW106124633A
Other languages
English (en)
Inventor
許家翔
顏霈綸
李文詩
李宗杰
Original Assignee
致伸科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 致伸科技股份有限公司 filed Critical 致伸科技股份有限公司
Priority to TW106124633A priority Critical patent/TW201908920A/zh
Priority to US15/812,870 priority patent/US20190027139A1/en
Publication of TW201908920A publication Critical patent/TW201908920A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本發明係關於一種數位語音助理之操作系統,包括網路存入裝置、電子裝置、音訊裝置以及數位語音助理。網路存入裝置網路連接於語音辨識模組,而電子裝置網路連接於網路存入裝置。使用者可提供語音指令予音訊裝置,語音指令可透過音訊裝置、數位語音助理以及網路存入裝置而傳輸至語音辨識模組。語音辨識模組辨識語音指令且產生相對應之操作訊號,使得電子裝置可根據操作訊號而運作。

Description

數位語音助理之操作系統
本發明係關於一種操作系統,尤其係關於應用於數位語音助理之操作系統。
近年來,電子裝置提供數位語音助理(Digital Voice Assistant,DVA),以供使用者以語音方式傳遞語音指令予電子裝置,使電子裝置辨識語音指令之內容,且執行對應於語音指令的工作。以智慧型手機為例說明,當使用者啟動智慧型手機中之數位語音助理,且對智慧型手機說:「打電話給爸爸」時,數位語音助理接收到內容為「打電話給爸爸」的語音指令,且辨識其語音指令之內容。於數位語音助理辨識語音指令完成之後,數位語音助理理解其內容並控制智慧型手機進行「打電話給爸爸」的工作。藉此,使用者可不需以手操作智慧型手機來進行「打電話給爸爸」的工作,換言之,當使用者不方便以手操作智慧型手機時,則可利用數位 語音助理來協助操作智慧型手機。
因應數位語音助理的發展,數位語音助理被製造為一台獨立的機器,且可應用於數位家庭的領域,而形成數位語音助理之操作系統。請參閱圖1,其為習知數位語音助理之操作系統之方塊示意圖。習知數位語音助理之操作系統1網路連接於語音辨識模組10,語音辨識模組10係設置於網際網路上之伺服器內,而習知數位語音助理之操作系統1包括第一數位語音助理11、第二數位語音助理12、電子裝置13以及網路存入裝置(Access Point,AP)14。其中,第一數位語音助理11以及網路存入裝置14設置於客廳,第二數位語音助理12設置於臥室,而電子裝置13設置於廚房。第一數位語音助理11以有線或無線方式連接於網路存入裝置14,而第二數位語音助理12以及電子裝置13則以無線方式分別連接於網路存入裝置14。另外,網路存入裝置14網路連接於語音辨識模組10。其中,語音辨識模組10係為人工智慧或具有語音辨識功能之程式,而電子裝置13係為智慧型冷氣機,網路存入裝置14係為網路路由器或網路基地台。
圖1中,第一數位語音助理11包括第一網路傳輸模組111、第一控制單元112、第一麥克風113以及第一語音辨識單元114。第一網路傳輸模組111以有線或無線方式連接於網路存入裝置14,而第一控制單元112分別連接於第一網路傳輸模組111、第一麥克風113以及第一語音辨識單元114。第一麥克風113之功能為接收使用者所產生的語音指令以及喚醒指令,而第一語音辨識單元114連接於第一麥克風113,其可辨識使用者所產生的喚醒指令。其中,第一語音辨識單元114預設有喚醒指令C1:「Wake Up」。另一方面,第二數位語音助理12包括第二網路傳輸模組121、第二控制單元122、第二麥克風123以及第二語音辨識單元124,而第二數位語音助理12中之各元件的功能與第一數位語音助理11相同,故不再贅述。
接下來說明習知數位語音助理之操作系統1的運作情形。當位於客廳的使用者W對第一數位語音助理11喊出喚醒指令C1:「Wake Up」時,第一麥克風113接收到喚醒指令C1,且傳輸喚醒指令C1予第一語音辨識單元114,使第一語音辨識單元114辨識喚醒指令C1與預設的「WakeUp」一致。辨識完成之後,第一語音辨識單元114可判斷使用者所喊的「Wake Up」為喚醒指令,且解除第一數位語音助理11的休眠模式以啟動第一數位語音助理11。接下來,使用者W可對被啟動的第一數位語音助理11喊出語音指令C2:「開啟冷氣機」,第一麥克風113接收到語音指令C2,而第一語音辨識單元114辨識語音指令C2:「開啟冷氣機」,但由於第一語音辨識單元114無法搜尋到相對應的預設指令,而無法辨識之。因此,第一控制單元112被設定為將第一語音辨識單元114所接收到之無法辨識的語音指令C2輸出,且透過網路存入裝置14傳輸語音指令C2至語音辨識模組10。
接下來,語音辨識模組10可辨識語音指令C2之內容為「開啟冷氣機」,且語音辨識模組10搜尋其內部是否預設有與「開啟冷氣機」一致的操作訊號。當語音辨識模組10搜尋到相對應的操作訊號時,語音辨識模組10透過網路存入裝置14傳輸操作訊號S至位於廚房的電子裝置13,使電子裝置13進行對應於操作訊號S之運作,亦即開啟冷氣機。藉此,位於客廳的使用者W可利用第一數位語音助理11來操作位於臥室的電子裝置13。同理,進入臥室的使用者W亦可對位於臥室的第二數位語音助理12進行與上述相同的運作,使第二數位語音助理12以及語音辨識模組10亦進行相對應的運作,以啟動位於廚房的電子裝置13。其運作之詳細情形係與第一數位語音助理11之運作相同,故不再贅述。
雖然習知數位語音助理之操作系統1可提供使用者以語音方式操作電子裝置的功能,但位於不同的場所即必須設置一台數位語音助 理,也就是說,越方便的數位語音助理之操作系統需要越多數量的數位語音助理,而數位語音助理的成本不低,故習知數位語音助理之操作系統難以普及化。
因此,需要一種可符合經濟效應的數位語音助理之操作系統。
本發明之目的在於提供一種可符合經濟效應的數位語音助理之操作系統。
於一較佳實施例中,本發明提供一種數位語音助理之操作系統,網路連接於一語音辨識模組,該數位語音助理之操作系統包括一網路存入裝置、一電子裝置、一音訊裝置以及一數位語音助理。該網路存入裝置網路連接於該語音辨識模組,而該電子裝置網路連接於該網路存入裝置。該音訊裝置用以接收一第一語音指令,且輸出該第一語音指令。該數位語音助理無線連接於該音訊裝置,且網路連接於該網路存入裝置,該數位語音助理包括一第一無線傳輸模組、一網路傳輸模組以及一控制單元。該第一無線傳輸模組無線連接於該音訊裝置,用以接收該第一語音指令,而該網路傳輸模組網路連接於該網路存入裝置,用以傳輸該第一語音指令。該控制單元連接於該網路傳輸模組,用以於接收到該第一語音指令之後,控制該網路傳輸模組傳輸該第一語音指令,且藉由該網路存入裝置而傳輸該第一語音指令予該語音辨識模組。其中,當該語音辨識模組辨識該第一語音指令之後,藉由該網路存入裝置輸出對應於該第一語音指令之一第一操作訊號予該電子裝置,使該電子裝置進行對應於該第一操作訊號之 運作。
於一較佳實施例中,當該第三麥克風接收到一第三語音指令時,該控制單元藉由該網路傳輸模組傳輸該第三語音指令予該語音辨識模組,該語音辨識模組辨識該第三語音指令,且輸出對應於該第三語音指令之一第三操作訊號予該數位語音助理;其中,該控制單元可根據該第三操作訊號而輸出一通話請求予該音訊裝置;於該第一無線傳輸模組接收到來自該音訊裝置之一回應訊號之後,該控制單元根據該回應訊號而建立該數位語音助理以及該音訊裝置之間之語音通話。
於一較佳實施例中,當該第二麥克風接收到一第三語音指令時,該第二無線傳輸模組無線傳輸該第三語音指令予該第一無線傳輸模組,使該控制單元藉由該網路傳輸模組傳輸該第三語音指令予該語音辨識模組,該語音辨識模組辨識該第三語音指令,且輸出對應於該第三語音指令之一第三操作訊號予該數位語音助理。
於一較佳實施例中,該控制單元可根據該第三操作訊號而控制該數位語音助理之一第二揚聲器產生一通知聲響;而當該第三麥克風接收到回應指令時,該語音辨識單元辨識該回應指令而產生對應於該回應指令之一回應訊號,該控制單元根據該回應訊號而建立該數位語音助理以及該音訊裝置之間之語音通話。
於一較佳實施例中,本發明亦提供一種數位語音助理之操作系統,網路連接於一語音辨識模組,該數位語音助理之操作系統包括一網路存入裝置、一第一音訊裝置、一數位語音助理以及一第二音訊裝置。該網路存入裝置網路連接於該語音辨識模組,而該第一音訊裝置用以接收一語音指令,且輸出該語音指令。該數位語音助理無線連接於該第一音訊裝置,且網路連接於該網路存入裝置,該數位語音助理包括一第一無線傳輸 模組、一網路傳輸模組以及一控制單元。該第一無線傳輸模組無線連接於該第一音訊裝置,用以接收該語音指令。該網路傳輸模組網路連接於該網路存入裝置,用以傳輸該語音指令。其中,該第一語音指令藉由該網路存入裝置而被傳輸予該語音辨識模組,當該語音辨識模組辨識該語音指令之後,輸出對應於該語音指令之一操作訊號。該控制單元連接於該網路傳輸模組,用以根據該操作訊號而輸出一通話請求。該第二音訊裝置無線連接於該第一無線傳輸模組,用以接收該通話請求,且輸出對應於該通話請求之一回應訊號;其中,該控制單元根據該回應訊號而建立該第一音訊裝置以及該第二音訊裝置之間之語音通話。
於一較佳實施例中,該第一音訊裝置包括一第一麥克風、一第一語音辨識單元、一第二麥克風以及一第二無線傳輸模組,該第一麥克風用以接收一喚醒指令。該第一語音辨識單元連接於該第一麥克風,用以辨識該喚醒指令,且於辨識該喚醒指令後解除該第一音訊裝置之休眠模式。該第二麥克風用以接收該語音指令該第二無線傳輸模組連接於該第二麥克風且無線連接於該第一無線模組以及該第二音訊裝置,用以無線傳輸該語音指令。
於一較佳實施例中,該第二音訊裝置包括一第三麥克風、一揚聲器、一第二語音辨識單元以及一第三無線傳輸模組,該第三麥克風用以接收對應於該通話請求之一回應指令。該揚聲器用以於該第三麥克風接收到該通話請求之後,播放對應於該通話請求之一通知聲響。該第二語音辨識單元連接於該第三麥克風,用以辨識該回應指令,且於辨識該回應指令之後產生對應於該回應指令之該回應訊號。該第三無線傳輸模組無線連接於該第一無線模組以及該第二音訊裝置,用以無線傳輸該通話請求以及該回應訊號。
簡言之,本發明數位語音助理之操作系統可應用於數位家庭領域,其可於不同的房間內分別設置音訊裝置,使得複數音訊裝置無線連接於一台數位語音助理。使用者可透過語音方式對音訊裝置下達語音指令,音訊裝置則與數位語音助理無線通訊且進行相對應的運作,以控制位於不同房間的電子裝置,或者可控制位於不同房間的複數音訊裝置進行語音通話。
1、2、3‧‧‧數位語音助理之操作系統
10、20、30‧‧‧語音辨識模組
11‧‧‧第一數位語音助理
12‧‧‧第二數位語音助理
13、22、32‧‧‧電子裝置
14、21、31‧‧‧網路存入裝置
23‧‧‧音訊裝置
24、34‧‧‧數位語音助理
33‧‧‧第一音訊裝置
35‧‧‧第二音訊裝置
111‧‧‧第一網路傳輸模組
112‧‧‧第一控制單元
113、244、344‧‧‧第一麥克風
114、245、345‧‧‧第一語音辨識單元
121‧‧‧第二網路傳輸模組
122‧‧‧第二控制單元
123、231、331‧‧‧第二麥克風
124、232、332‧‧‧第二語音辨識單元
233、333‧‧‧第三麥克風
234、334‧‧‧第二無線傳輸模組
235、335‧‧‧第二揚聲器
241、341‧‧‧第一無線傳輸模組
242、342‧‧‧網路傳輸模組
243、343‧‧‧控制單元
246、346‧‧‧第一揚聲器
351‧‧‧第四麥克風
352‧‧‧第三語音辨識單元
353‧‧‧第五麥克風
354‧‧‧第三無線傳輸模組
355‧‧‧第三揚聲器
C1‧‧‧喚醒指令
C2‧‧‧語音指令
C3‧‧‧第一喚醒指令
C4‧‧‧第一語音指令
C5‧‧‧第二喚醒指令
C6‧‧‧第二語音指令
C7‧‧‧第三喚醒指令
C8‧‧‧第三語音指令
C9‧‧‧第一回應指令
C10‧‧‧第二回應指令
R‧‧‧通話請求
S‧‧‧操作訊號
S1‧‧‧第一操作訊號
S2‧‧‧第二操作訊號
S3‧‧‧第三操作訊號
S4‧‧‧第一回應訊號
S5‧‧‧第二回應訊號
W‧‧‧使用者
X‧‧‧第一使用者
Y‧‧‧第二使用者
Z‧‧‧第三使用者
圖1係習知數位語音助理之操作系統之方塊示意圖。
圖2係本發明數位語音助理之操作系統於第一較佳實施例中之方塊示意圖。
圖3係本發明數位語音助理之操作系統於第二較佳實施例中之方塊示意圖。
鑑於習知技術之問題,本發明提供一種可解決習知技術問題之數位語音助理之操作系統。請參閱圖2,其為本發明數位語音助理之操作系統於第一較佳實施例中之方塊示意圖。數位語音助理之操作系統2包括網路存入裝置21、電子裝置22、音訊裝置23以及數位語音助理24,網路 存入裝置21係網路連接於語音辨識模組20,而語音辨識模組20係設置於網際網路上之伺服器內。電子裝置22網路連接於網路存入裝置21,音訊裝置23無線連接於數位語音助理24,其功能為接收使用者所產生的語音指令,且輸出語音指令至數位語音助理24。數位語音助理24無線連接於音訊裝置23,且網路連接於網路存入裝置21。於本較佳實施例中,網路存入裝置21以及數位語音助理24設置於客廳,且網路存入裝置21係為網路路由器或網路基地台,音訊裝置23設置於臥室,而電子裝置22則設置於廚房,且電子裝置22係為智慧型冷氣機。
數位語音助理24包括第一無線傳輸模組241、網路傳輸模組242、控制單元243、第一麥克風244、第一語音辨識單元245以及第一揚聲器246。第一無線傳輸模組241連接於控制單元243且無線連接於音訊裝置23,其功能為接收來自於音訊裝置23的第一喚醒指令C3以及第一語音指令C4。網路傳輸模組242連接於控制單元243且網路連接於網路存入裝置21,其功能為以網路傳輸方式傳輸第一語音指令C4。控制單元243更連接於第一語音辨識單元245,其可於接收到第一語音指令C4之後,控制網路傳輸模組241傳輸第一語音指令C4,且藉由網路存入裝置21以網路傳輸方式傳輸第一語音指令C4予語音辨識模組20。第一麥克風244連接於第一語音辨識單元245,且其功能為接收使用者所產生的第二喚醒指令C5以及第二語音指令C6。第一語音辨識單元245之功能為辨識第二喚醒指令C5,且於辨識第二喚醒指令C5之後,解除數位語音助理24之休眠模式,亦即啟動數位語音助理24。其中,第一語音辨識單元245預設有第一喚醒指令C3:「Wake Up」,而上述第一喚醒指令僅為例示之用。第一揚聲器246連接於控制單元243,其可播放音樂或回饋提示聲,至於回饋提示聲之內容則於稍後說明。
於本較佳實施例中,控制單元243係為微處理器,第一語音辨識單元245係為語音辨識晶片,而網路存入裝置21提供無線網路連接功能予網路傳輸模組241,例如藉由Wi-Fi等無線方式連接於網路傳輸模組241。其僅為例示之用,而非以此為限。於另一較佳實施例中,網路傳輸模組亦可藉由網路線等有線方式連接於網路存入裝置。
另一方面,音訊裝置23包括第二麥克風231、第二語音辨識單元232、第三麥克風233、第二無線傳輸模組234以及第二揚聲器235,第二麥克風231連接於第二無線傳輸模組234,且其功能為接收使用者所產生的第一喚醒指令C3。第二語音辨識單元232連接於第二麥克風231以及第二無線傳輸模組234,其可辨識所接收到的第一喚醒指令C3,且於辨識第一喚醒指令C3之後,解除音訊裝置23之休眠模式,亦即啟動音訊裝置23。其中,第二語音辨識單元232預設有第二喚醒指令C5:「Wake Up」,而上述第二喚醒指令僅為例示之用。第三麥克風233連接於第二無線傳輸模組234,其功能為接收使用者所產生的第一語音指令C4。第二無線傳輸模組234無線連接於第一無線模組242,其功能為以無線傳輸方式傳輸第一語音指令C4予第一無線傳輸模組242。第二揚聲器235連接於第二無線傳輸模組234,其可播放回饋提示聲。
於本較佳實施例中,第二語音辨識單元232係為語音辨識晶片,第二無線傳輸模組234係以系統晶片(System on Chip,SOC)形式設置,而數位語音助理24之第一無線傳輸模組242以及音訊裝置23之第二無線傳輸模組234之間係藉由數位增強無線通訊(Digital Enhanced Cordless Telecommunications,DECT)技術而無線連接。
接下來說明本發明數位語音助理之操作系統2之運作情形。若位於臥室之第一使用者X欲開啟位於廚房的電子裝置22,可利用數 位語音助理之操作系統2達成,其運作如下。首先,數位語音助理24處於休眠模式,而其第一麥克風244以及第一語音辨識單元245以低耗電量方式運作。類似地,音訊裝置23亦處於休眠模式,而其第二麥克風231、第二語音辨識單元232以及第三麥克風233同樣以低耗電量方式運作。當第一使用者X對音訊裝置23喊出第一喚醒指令C3:「Wake Up」時,第二麥克風231接收到第一喚醒指令C3,且傳輸第一喚醒指令C3予第二語音辨識單元232,使第二語音辨識單元232辨識第一喚醒指令C3與預設的「Wake Up」一致。辨識完成之後,第二語音辨識單元232可判斷第一使用者X所喊的「Wake Up」為第一喚醒指令C3,且解除音訊裝置23的休眠模式以啟動音訊裝置23。
需特別說明的是,於第一使用者X對音訊裝置23喊出第一喚醒指令C3:「Wake Up」時,第三麥克風233亦會接收到第一喚醒指令C3,但由於第三麥克風233所連接到的第二無線傳輸模組234仍處於休眠模式,故第二無線傳輸模組234不會傳輸第一喚醒指令C3。其中,由於第三麥克風233所接收到的第一喚醒指令C3並無作用,故圖中未繪製出第三麥克風233接收到的第一喚醒指令C3之情況。
於音訊裝置23啟動之後,第一使用者X可對被啟動的音訊裝置23喊出第一語音指令C4:「開啟冷氣機」,第二麥克風231以及第三麥克風233皆接收到第一語音指令C4,其中,第二語音辨識單元232可藉由第二麥克風231接收到第一語音指令C4,但由於第二語音辨識單元232僅可辨識第一喚醒指令C3,故無法辨識出第一語音指令C4的內容。由於第二麥克風231所接收到的第一語音指令C4並無作用,故圖中未繪製出第二麥克風231接收到第一語音指令C4之情況。另一方面,第一語音指令C4可透過第三麥克風233而被傳輸至被喚醒的第二無線傳輸模組234。
當第二無線傳輸模組234接收到第一語音指令C4之後,第二無線傳輸模組234會與數位語音助理24之第一無線傳輸模組242進行無線溝通運作,以確保後續的無線傳輸運作,此時,第一無線傳輸模組242喚醒數位語音助理24。接下來,第二無線傳輸模組234以無線方式傳輸第一語音指令C4至第一無線傳輸模組242,控制單元243會將第一無線傳輸模組242所接收到的第一語音指令C4透過網路存入裝置21以網路傳輸方式傳輸至網際網路上的語音辨識模組20。
當語音辨識模組20接收到第一語音指令C4之後,語音辨識模組20搜尋其內部是否預設有與第一語音指令C4:「開啟冷氣機」一致的操作訊號。當語音辨識模組20搜尋到相對應的操作訊號時,語音辨識模組20傳輸對應於第一語音指令C4之第一操作訊號S1至網路存入裝置21,且網路存入裝置21傳輸第一操作訊號S1至位於廚房的電子裝置22,使電子裝置22進行對應於第一操作訊號S1之運作,亦即開啟冷氣機。藉此,位於臥室的第一使用者X可利用音訊裝置23以及數位語音助理24來操作位於廚房的電子裝置22。
另外,位於客廳的第二使用者Y亦可對利用位於客廳的二數位語音助理24而操作位於廚房的電子裝置22,其運作如下。當第二使用者Y對數位語音助理24喊出第二喚醒指令C5:「Wake Up」時,第一麥克風244接收到第二喚醒指令C5,且傳輸第二喚醒指令C5予第一語音辨識單元245,使第一語音辨識單元245辨識第二喚醒指令C5與預設的「Wake Up」一致。使第一語音辨識單元245辨識第二喚醒指令C5與預設的「Wake Up」一致。辨識完成之後,第一語音辨識單元245可判斷第二使用者Y所喊的「Wake Up」為第二喚醒指令C5,且解除數位語音助理24的休眠模式,以啟動之。
於數位語音助理24啟動之後,第二使用者Y可對被啟動的數位語音助理24喊出第二語音指令C6:「開啟冷氣機」,第一麥克風244接收到第二語音指令C6,且第二語音指令C6被傳輸至第一語音辨識單元245。由於第一語音辨識單元245無法於其內部搜尋到對應於第二語音指令C6的語音指令,故控制單元243將第二語音指令C6傳輸至第一無線傳輸模組241,使第一無線傳輸模組241透過網路傳輸方式傳輸第二語音指令C6至語音辨識模組20。
另一方面,語音辨識模組20進行與前述相同的運作而傳輸對應於第二語音指令C6之第二操作訊號S2至網路存入裝置21,且網路存入裝置21傳輸第二操作訊號S2至位於廚房的電子裝置22,使電子裝置22進行對應於第二操作訊號S2之運作,亦即開啟冷氣機。藉此,位於客廳的第二使用者Y可直接利用數位語音助理24來操作位於廚房的電子裝置22。
需特別說明的有二,第一,本較佳實施例中,數位語音助理24內的第一語音辨識單元245之運作能力強於音訊裝置23內的第二語音辨識單元232,亦即,第二語音辨識單元232係採用較低階的語音辨識晶片,以達降低音訊裝置23之成本的功效。另外,由於數位語音助理24亦可透過第一揚聲器246播放音樂,故第一語音辨識單元245必須具有較強的運作能力,才得以於音樂聲中辨識出第二喚醒指令C5。當然,本發明並非限制數位語音助理必須採用高運作能力的語音辨識晶片,於可運作的情況下,數位語音助理亦可採用低階的語音辨識晶片。
第二,於一較佳作法中,本發明數位語音助理之操作系統亦可藉由網路存入裝置而網路連接於一監控模組(未顯示於圖中),且監控模組亦透過網路存入裝置而網路連接於電子裝置,使得電子裝置可隨時回報其運作狀態予監控模組。因此,於電子裝置被啟動,且其運作狀態改變時, 電子裝置會通知監控模組。而監控模組亦可透過網路存入裝置而通知數位語音助理,使數位語音助理之第一揚聲器可輸出回饋提示聲,以供第二使用者得知電子裝置已被啟動。同理,監控模組亦可透過網路存入裝置以及數位語音助理而通知音訊裝置,使音訊裝置之第二揚聲器亦可輸出回饋提示聲,以供第一使用者得知電子裝置已被啟動。
此外,本發明更提供與上述不同作法之第二較佳實施例。請參考圖3,其為本發明數位語音助理之操作系統於第二較佳實施例中之方塊示意圖。數位語音助理之操作系統3包括網路存入裝置31、電子裝置32、第一音訊裝置33、數位語音助理34以及第二音訊裝置35。網路存入裝置31係網路連接於語音辨識模組30,而語音辨識模組30係設置於網際網路上之伺服器內。電子裝置32網路連接於網路存入裝置31,第一音訊裝置33無線連接於數位語音助理34,其功能為接收使用者所產生的語音指令,且輸出語音指令至數位語音助理34。同理,第二音訊裝置35亦無線連接於數位語音助理34,其功能為接收使用者所產生的語音指令,且輸出語音指令至數位語音助理34。數位語音助理34分別無線連接於第一音訊裝置33以及第二音訊裝置35,且網路連接於網路存入裝置31。於本較佳實施例中,網路存入裝置31以及數位語音助理34設置於客廳,且網路存入裝置31係為網路路由器或網路基地台,第一音訊裝置33設置於臥室,而電子裝置32以及第二音訊裝置35則設置於廚房,且電子裝置32係為智慧型冷氣機。
數位語音助理34包括第一無線傳輸模組341、網路傳輸模組342、控制單元343、第一麥克風344、第一語音辨識單元345以及第一揚聲器346,而數位語音助理34中之各元件之結構以及功能大致上與前述較佳實施例之數位語音助理24相同,而不再贅述。其中,第一語音辨識單元345中預設有第二喚醒指令C5:「Wake Up」、第一回應指令C9:「接聽」 以及第二回應指令C10:「掛斷」。另一方面,第一音訊裝置33包括第二麥克風331、第二語音辨識單元352、第三麥克風333、第二無線傳輸模組334以及第二揚聲器335,而第一音訊裝置33中之各元件之結構以及功能大致上與前述較佳實施例之音訊裝置23大致上相同,故不再贅述。其中,第二語音辨識單元352中預設有第一喚醒指令C3:「Wake Up」、第一回應指令C9:「接聽」以及第二回應指令C10:「掛斷」。
類似地,第二音訊裝置35包括第四麥克風351、第三語音辨識單元352、第五麥克風353、第三無線傳輸模組354以及第三揚聲器355,而第二音訊裝置35中之各元件之結構以及功能與第一音訊裝置33大致上相同,故不再贅述。其中,第三語音辨識單元352中預設有第三喚醒指令C7:「Wake Up」、第一回應指令C9:「接聽」以及第二回應指令C10:「掛斷」。關於第一回應指令C9以及第二回應指令C10之運作,將於後段詳細說明。於本較佳實施例中,第一無線傳輸模組342以及第二無線傳輸模組334之間係藉由數位增強無線通訊技術而無線連接,而第一無線傳輸模組342以及第三無線傳輸模組354之間亦藉由數位增強無線通訊技術而無線連接。
若位於臥室之第一使用者X欲與位於廚房的第三使用者Z通話,可利用數位語音助理之操作系統3達成,其運作如下。首先,數位語音助理34、第一音訊裝置33以及第二音訊裝置35皆處於休眠模式。當第一使用者X對第一音訊裝置33喊出第一喚醒指令C3:「Wake Up」時,第二麥克風331接收到第一喚醒指令C3,且傳輸第一喚醒指令C3予第二語音辨識單元332,使第二語音辨識單元332辨識第一喚醒指令C3與預設的「Wake Up」一致。辨識完成之後,第二語音辨識單元332可判斷第一使用者X所喊的「Wake Up」為第一喚醒指令C3,且解除第一音訊裝置33 的休眠模式以啟動第一音訊裝置33。
於第一音訊裝置33啟動之後,第一使用者X可對被啟動的第一音訊裝置33喊出第三語音指令C8:「與第二音訊裝置通話」,第二麥克風331接收到第三語音指令C8,且傳輸第三語音指令C8至第二語音辨識單元332,但第二語音辨識單元332無法辨識之而不運作。另一方面,第三語音指令C8可透過第三麥克風233而被傳輸至被喚醒的第二無線傳輸模組334。當第二無線傳輸模組334接收到第三語音指令C8之後,第二無線傳輸模組334會與數位語音助理34之第一無線傳輸模組342進行無線溝通運作,以確保後續的無線傳輸運作,此時,第一無線傳輸模組342喚醒數位語音助理34。
接下來,第二無線傳輸模組334以無線方式傳輸第三語音指令C8至第一無線傳輸模組342,控制單元343會將第一無線傳輸模組342所接收到的第三語音指令C8透過網路存入裝置31以網路傳輸方式傳輸至網際網路上的語音辨識模組30。語音辨識模組30進行與前述相同的運作而辨識第三語音指令C8,且傳輸對應於第三語音指令C8之第三操作訊號S3至網路存入裝置31。網路存入裝置31傳輸第三操作訊號S3至數位語音助理34,此時,控制單元343因應第三操作訊號S3而輸出通話請求R,且通話請求R透過第一無線傳輸模組342以及第三無線傳輸模組354而被無線傳輸至位於廚房的第二音訊裝置35。
第二音訊裝置35中,當第三無線傳輸模組354接收到通話請求R之後,第三無線傳輸模組354控制第三揚聲器355產生對應於通話請求R1之通知聲響,該通知聲響例如為電話鈴響等聲音,以讓位於廚房的第三使用者Z聽到通知聲響。接下來,第三使用者Z可於聽到通知聲響後,喊出第一回應指令C9:「接聽」或第二回應指令C10:「掛斷」。當第三使用 者Z喊出第二回應指令C10:「掛斷」時,第二回應指令C10可透過第二麥克風331而傳輸至第二語音辨識單元332,使第二語音辨識單元332辨識之且產生對應於第二回應指令C10之第二回應訊號S5,以控制第二音訊裝置35不接受來自數位語音助理34之通話請求R。
反之,第三使用者Z可於聽到通知聲響後,喊出第一回應指令C9:「接聽」時,第一回應指令C9可透過第二麥克風331而傳輸至第二語音辨識單元332,使第二語音辨識單元332辨識之且產生對應於第一回應指令C9之第一回應訊號S4,且第三無線傳輸模組354以無線傳輸方式傳輸第一回應訊號S4至第一無線傳輸模組342。當控制單元343接收到第一回應訊號S4之後,透過第一無線傳輸模組342建立第二無線傳輸模組334以及第三無線傳輸模組354之間的語音通話。藉此,第一使用者X可與第三使用者Z透過第一音訊裝置33以及第二音訊裝置35進行通話。當第三使用者Z欲結束通話時,僅需喊出第二回應指令C10:「掛斷」,第二音訊裝置35即可進行相對應的運作,而結束語音通話。至於第一使用者X利用第一音訊裝置33與第二音訊裝置35進行通話之運作亦為同理,而不再贅述。
需特別說明的有二,第一,於一較佳作法中,第二音訊裝置更可設置一掛斷按鍵,以供第三使用者以觸壓方式來結束語音通話。此作法之優點有二,優點一,第三語音辨識單元中可不需預設第二回應指令:「掛斷」,而可採用成本較低廉的語音辨識晶片,以符合經濟效應。優點二,以第二回應指令來結束語音通話之作法中,第三使用者可能於通話內容中提到「掛斷」,而並非想結束語音通話,但第三語音辨識單元會運作而結束語音通話,以造成困擾。以觸壓方式的掛斷按鍵可避免上述困擾發生。
第二,本較佳實施例中,並非限定僅可利用第一音訊裝置 33與第二音訊裝置35進行通話。由於圖3中之數位語音助理34之第一語音辨識單元342中亦預設有第一回應指令C9:「接聽」以及第二回應指令C10:「掛斷」,故第一使用者X亦可利用第一音訊裝置33與數位語音助理34進行通話。同理,第三使用者Z亦可利用第二音訊裝置35與數位語音助理34進行通話。其中,第一音訊裝置33與數位語音助理34進行通話之運作以及第二音訊裝置35與數位語音助理34進行通話之運作皆與上述同理,故不再贅述。反之,第二使用者Y亦可利用數位語音助理34而分別與第一音訊裝置33或第二音訊裝置35進行通話,且其運作與上述同理,而不再贅述。
根據上述可知,本發明數位語音助理之操作系統可應用於數位家庭領域,其可於不同的房間內分別設置音訊裝置,使得複數音訊裝置無線連接於一台數位語音助理。使用者可透過語音方式對音訊裝置下達語音指令,音訊裝置則與數位語音助理無線通訊且進行相對應的運作,以控制位於不同房間的電子裝置,或者可控制位於不同房間的複數音訊裝置進行語音通話。與習知技術相比,本發明數位語音助理之操作系統以成本低廉的複數音訊裝置取代習知技術的複數數位語音助理,而僅需使用一台數位語音助理即可完成控制電子裝置的操作。因此,本發明數位語音助理之操作系統確實可解決習知技術的問題。
以上所述僅為本發明之較佳實施例,並非用以限定本發明之申請專利範圍,因此凡其它未脫離本發明所揭示之精神下所完成之等效改變或修飾,均應包含於本案之申請專利範圍內。

Claims (13)

  1. 一種數位語音助理之操作系統,網路連接於一語音辨識模組,該數位語音助理之操作系統包括:一網路存入裝置,網路連接於該語音辨識模組;一電子裝置,網路連接於該網路存入裝置;一音訊裝置,用以接收一第一語音指令,且輸出該第一語音指令;以及一數位語音助理,無線連接於該音訊裝置,且網路連接於該網路存入裝置,包括:一第一無線傳輸模組,無線連接於該音訊裝置,用以接收該第一語音指令;一網路傳輸模組,網路連接於該網路存入裝置,用以傳輸該第一語音指令;以及一控制單元,連接於該網路傳輸模組,用以於接收到該第一語音指令之後,控制該網路傳輸模組傳輸該第一語音指令,且藉由該網路存入裝置而傳輸該第一語音指令予該語音辨識模組;其中,當該語音辨識模組辨識該第一語音指令之後,藉由該網路存入裝置輸出對應於該第一語音指令之一第一操作訊號予該電子裝置,使該電子裝置進行對應於該第一操作訊號之運作。
  2. 如申請專利範圍第1項所述之數位語音助理之操作系統,其中,該音訊裝置包括:一第一麥克風,用以接收一第一喚醒指令; 一低階語音辨識單元,連接於該第一麥克風,用以辨識該第一喚醒指令,且於辨識該第一喚醒指令後解除該音訊裝置之休眠模式;一第二麥克風,用以接收該第一語音指令;以及一第二無線傳輸模組,連接於該第二麥克風且無線連接於該第一無線模組,用以無線傳輸該第一語音指令予該第一無線傳輸模組。
  3. 如申請專利範圍第2項所述之數位語音助理之操作系統,其中,該數位語音助理更包括:一第三麥克風,用以接收一第二語音指令以及一第二喚醒指令;以及一語音辨識單元,連接於該第三麥克風,用以辨識該第二喚醒指令,且於辨識該第二喚醒指令後解除該數位語音助理之休眠模式;其中,該數位語音助理藉由該網路傳輸模組傳輸該第二語音指令予該語音辨識模組,該語音辨識模組辨識該第二語音指令,且藉由該網路存入裝置輸出對應於該第二語音指令之一第二操作訊號予該電子裝置,使該電子裝置進行對應於該第二操作訊號之運作。
  4. 如申請專利範圍第3項所述之數位語音助理之操作系統,其中,當該第三麥克風接收到一第三語音指令時,該控制單元藉由該網路傳輸模組傳輸該第三語音指令予該語音辨識模組,該語音辨識模組辨識該第三語音指令,且輸出對應於該第三語音指令之一第三操作訊號予該數位語音助理;其中,該控制單元可根據該第三操作訊號而輸出一通話請求予該音訊裝置;於該第一無線傳輸模組接收到來自該音訊裝置之一回應訊號之後,該控制單元根據該回應訊號而建立該數位語音助理以及該音訊裝置之間之語音通話。
  5. 如申請專利範圍第3項所述之數位語音助理之操作系統,其中,當該第二麥克風接收到一第三語音指令時,該第二無線傳輸模組無線傳輸該第三語音指令予該第一無線傳輸模組,使該控制單元藉由該網路傳輸模組傳輸該第三語音指令予該語音辨識模組,該語音辨識模組辨識該第三語音指令,且輸出對應於該第三語音指令之一第三操作訊號予該數位語音助理。
  6. 如申請專利範圍第5項所述之數位語音助理之操作系統,其中,該控制單元可根據該第三操作訊號而控制該數位語音助理之一第二揚聲器產生一通知聲響;而當該第三麥克風接收到回應指令時,該語音辨識單元辨識該回應指令而產生對應於該回應指令之一回應訊號,該控制單元根據該回應訊號而建立該數位語音助理以及該音訊裝置之間之語音通話。
  7. 如申請專利範圍第2項所述之數位語音助理之操作系統,其中,該音訊裝置更包括一第一揚聲器,連接於該第二無線傳輸模組,用以於該電子裝置運作之後播放一回饋聲響。
  8. 如申請專利範圍第2項所述之數位語音助理之操作系統,其中,該數位語音助理更包括一第二揚聲器,連接於該控制單元,用以於該電子裝置運作之後播放一回饋聲響。
  9. 一種數位語音助理之操作系統,網路連接於一語音辨識模組,該數位語音助理之操作系統包括:一網路存入裝置,網路連接於該語音辨識模組;一第一音訊裝置,用以接收一第一語音指令,且輸出該語音指令;一數位語音助理,無線連接於該第一音訊裝置,且網路連接於該網路存入裝置,包括: 一第一無線傳輸模組,無線連接於該第一音訊裝置,用以接收該語音指令;一網路傳輸模組,網路連接於該網路存入裝置,用以傳輸該語音指令;其中,該語音指令藉由該網路存入裝置而被傳輸予該語音辨識模組,當該語音辨識模組辨識該語音指令之後,輸出對應於該語音指令之一操作訊號;以及一控制單元,連接於該網路傳輸模組,用以根據該操作訊號而輸出一通話請求;以及一第二音訊裝置,無線連接於該第一無線傳輸模組,用以接收該通話請求,且輸出對應於該通話請求之一回應訊號;其中,該控制單元根據該回應訊號而建立該第一音訊裝置以及該第二音訊裝置之間之語音通話。
  10. 如申請專利範圍第9項所述之數位語音助理之操作系統,其中,該第一音訊裝置包括:一第一麥克風,用以接收一喚醒指令;一第一語音辨識單元,連接於該第一麥克風,用以辨識該喚醒指令,且於辨識該喚醒指令後解除該第一音訊裝置之休眠模式;一第二麥克風,用以接收該語音指令;以及一第二無線傳輸模組,連接於該第二麥克風且無線連接於該第一無線模組以及該第二音訊裝置,用以無線傳輸該語音指令。
  11. 如申請專利範圍第10項所述之數位語音助理之操作系統,其中,該第二音訊裝置包括:一第三麥克風,用以接收對應於該通話請求之一回應指令; 一揚聲器,用以於該第三麥克風接收到該通話請求之後,播放對應於該通話請求之一通知聲響;一第二語音辨識單元,連接於該第三麥克風,用以辨識該回應指令,且於辨識該回應指令之後產生對應於該回應指令之該回應訊號;以及一第三無線傳輸模組,連接於該揚聲器且無線連接於該第一無線模組以及該第二音訊裝置,用以無線傳輸該通話請求以及該回應訊號。
  12. 如申請專利範圍第11項所述之數位語音助理之操作系統,其中,當該第三麥克風接收到該回應指令之後,該第二語音辨識單元辨識該回應指令,且該第三無線傳輸模組傳輸對應於該回應指令之該回應訊號予該第一無線傳輸模組。
  13. 如申請專利範圍第11項所述之數位語音助理之操作系統,其中,該第一無線傳輸模組、該第二無線傳輸模組以及該第三無線傳輸模組之間藉由數位增強無線通訊技術而無線連接。
TW106124633A 2017-07-21 2017-07-21 數位語音助理之操作系統 TW201908920A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW106124633A TW201908920A (zh) 2017-07-21 2017-07-21 數位語音助理之操作系統
US15/812,870 US20190027139A1 (en) 2017-07-21 2017-11-14 Digital voice assistant operation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106124633A TW201908920A (zh) 2017-07-21 2017-07-21 數位語音助理之操作系統

Publications (1)

Publication Number Publication Date
TW201908920A true TW201908920A (zh) 2019-03-01

Family

ID=65023170

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106124633A TW201908920A (zh) 2017-07-21 2017-07-21 數位語音助理之操作系統

Country Status (2)

Country Link
US (1) US20190027139A1 (zh)
TW (1) TW201908920A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109889660B (zh) * 2019-01-28 2021-09-07 努比亚技术有限公司 临时信息记录方法、存储介质和移动终端
US20210373596A1 (en) * 2019-04-02 2021-12-02 Talkgo, Inc. Voice-enabled external smart processing system with display
KR20210066647A (ko) 2019-11-28 2021-06-07 삼성전자주식회사 전자 장치 및 이의 제어 방법
TWI765485B (zh) * 2020-12-21 2022-05-21 矽統科技股份有限公司 外接式語音喚醒裝置及其控制方法
CN113516981A (zh) * 2021-03-31 2021-10-19 深圳鱼亮科技有限公司 一种基于无线分布式麦克风阵列的语音唤醒决策系统

Also Published As

Publication number Publication date
US20190027139A1 (en) 2019-01-24

Similar Documents

Publication Publication Date Title
CN105451369B (zh) 低功耗蓝牙设备的连接参数更新方法及装置
EP2314077B1 (en) Wearable headset with self-contained vocal feedback and vocal command
TW201908920A (zh) 數位語音助理之操作系統
KR101433166B1 (ko) 블루투스 헤드셋 및 그의 멀티포인트 페어링 방법
CN108922537B (zh) 音频识别方法、装置、终端、耳机及可读存储介质
CN105792050A (zh) 一种蓝牙耳机及基于该蓝牙耳机的通信方法
CN103391118A (zh) 一种蓝牙耳机及利用该蓝牙耳机共享音频的方法
CN108495212A (zh) 一种与智能音响交互的系统
CN106896362A (zh) 一种具有超声波距离检测功能的终端
CN104168263B (zh) 一种服务器及其闹钟实现方法
CN206819732U (zh) 智能音乐播放器
CN205726256U (zh) 一种蓝牙耳机
WO2019075787A1 (zh) 翻译盒子和翻译系统
WO2024235182A1 (zh) 基于生成式人工智能大语言模型的智能眼镜、系统及控制方法
CN111835923A (zh) 一种基于人工智能的移动式语音交互对话系统
CN107633849A (zh) 蓝牙设备音量调整方法、设备及计算机可读存储介质
CN109743657A (zh) 一种基于蓝牙传输进行中转音频的智能音响系统
CN113709906B (zh) 无线音频系统、无线通讯方法及设备
CN108540660A (zh) 语音信号处理方法和装置、可读存储介质、终端
CN114520002A (zh) 一种处理语音的方法及电子设备
WO2020133564A1 (zh) 移动终端外壳、移动终端及智能家居网络系统
WO2023159717A1 (zh) 耳机的运行控制方法、指环耳机及存储介质
WO2020042491A9 (zh) 一种耳机远场交互方法、耳机远场交互配件及无线耳机
CN109981443A (zh) 语音交互方法、装置及终端设备
CN108900706B (zh) 一种通话语音调整方法及移动终端