TWI395105B

TWI395105B - 筆型電腦以及產生語音索引表的方法

Info

Publication number: TWI395105B
Application number: TW095146435A
Authority: TW
Inventors: Paul Huang Yen-Son
Original assignee: Fortemedia Inc
Priority date: 2006-09-05
Filing date: 2006-12-12
Publication date: 2013-05-01
Also published as: US20080059196A1; CN101529499B; US8447611B2; TW200813748A; CN101529499A; WO2008030254A1

Description

筆型電腦以及產生語音索引表的方法

本發明係有關於一種筆型語音電腦(pen－type voice computer)，特別是有關於一種筆型語音電腦的資料索引。

[0002]在傳統技術中，學生使用筆來抄筆記並且使用語音記錄器(voice recoder)將上課內容錄音。同樣的，記錄員或新聞工作者在訪談中會手寫筆記並且錄音。

[0003]然而，儲存語音資料需要相當多的記憶體容量，且透過傳統技術來搜尋特定語音資料也是相當不容易的。使用者通常都會盲目的搜尋全部的語音資料來找出想要的資料，因而耗費了許多不必要的時間與精力。

[0004]有鑑於此，期望設計一種可輕易地搜尋錄音檔中特定資料的裝置。因此，本發明係揭露一種用來產生搜尋索引並且執行索引搜尋的方法與裝置。

筆型語音電腦的特性包括：兩個輸入端－－筆輸入以及麥克風，一個輸出端－－喇叭/耳機。

三個可同時操作的輸入/輸出。

適用於筆輸入的內建式手寫辨識，適用於語音以及文字至語音的內建式語音辨識，使得伺服器至筆型語音電腦之間的傳輸以資料取代語音。

建造為兩個元件－－筆以及語音介面(麥克風＋喇叭/耳機)。

語音介面部分為一頭戴受話器(headset)。

藉由無線的方式可以存取網路、伺服器、喇叭、鍵盤以及螢幕。

筆輸入以及語音記錄可以同時執行，筆輸入的最後一個片段可與語音串流有關聯。

在經過藉由手寫辨識執行辨識後，最後一個片段變為索引(文字)。

語音串流的相關片段可藉由語音辨識而變為索引(文字)。

藉由索引可用以搜尋以及播放語音記錄。

藉由比語音更多的文字即可使語音串流與伺服器進行通訊。

藉由按鈕來表示可輸入的連接字串(concatenated text string)。

筆輸入、語音記錄以及喇叭/耳機可以同時操作。

藉由手寫辨識可使手寫輸入轉變為文字。

藉由語音辨識可使語音輸入轉變為文字。

喇叭/耳機可藉由文字至語音程式持續地播放來自手寫輸入與記錄中的文字。

為讓本發明之上述和其他目的、特徵、和優點能更明顯易懂，下文特舉出較佳實施例，並配合所附圖式，作詳細說明如下：

實施例：

以下將介紹適用於根據本發明所述之較佳實施例。必須說明的是，本發明提供了許多可應用之發明概念，所揭露之特定實施例僅是說明達成以及使用本發明之特定方式，不可用以限制本發明之範圍。

[0013]第1圖係顯示根據本發明實施例所述之筆型語音電腦1的方塊圖，包括天線10、收發器11、麥克風模組12、手寫輸入單元13、處理器14、記憶體15、電池16、喇叭/耳機17以及控制按鈕18。收發器11、麥克風模組12、手寫輸入單元13、記憶體15以及喇叭/耳機17全部都耦接至處理器14，其中收發器11係耦接至天線10。

[0014]電池16係耦接至筆型語音電腦1中的所有元件以提供所有元件的電力需求。

[0015]藉由天線10與收發器11可以將數位信號傳送至遠端電腦以及接收來自遠端電腦的數位信號，以執行資料儲存或後資料處理。天線10可以透過藍芽(Bluetooth)、無線區域網路或是其他射頻技術以及紅外線數據協會(infrared data association,IrDA)技術與遠端電腦進行通訊。

[0016]麥克風模組12可包括麥克風單元122與124的麥克風陣列以及類比至數位轉換器(analog to digital converter,ADC)120。麥克風單元122與124僅接收特定角度覆蓋範圍內的方向語音信號(directional voice signal)，如此一來便可以消除特定角度覆蓋範圍外的信號源。ADC 120係接收來自麥克風單元122與124之類比語音信號並將其轉換為數位資料。手寫輸入單元13係接收來自寫入端(writing tip)的寫入信號，寫入端可以為筆或描畫針(stylus)、觸控板、滑鼠或是光學掃描器。即時(realtime)應用系統係藉由手寫辨識軟體應用程式來偵測或辨識描畫針、觸控板或是滑鼠所接收的使用者手寫輸入而產生二進位格式、文字格式或是任何適用於資料儲存與轉換的格式。對於離線應用系統來說，透過光學掃描器所掃瞄的文件或手寫輸入可於處理器14中進行辨識。手寫信號可以為文數字元(alphanumeric character)、圖形或圖案。

[0017]喇叭/耳機17係接收來自處理器14的類比音頻信號並且將音頻信號傳送至四周給使用者聽。

[0018]記憶體16係提供暫時的資料儲存空間給處理器14使用，使得程式碼可以被處理器14執行。記憶體16可以為隨機存取記憶體(Random access Memory,RAM)、唯讀記憶體(Read－Only Memory,ROM)、快取記憶體或是上述之組合。

[0019]處理器14可以為數位信號處理器(digital signal processor,DSP)。處理器14係接收來自麥克風模組12與手寫輸入單元13的數位資料並且執行資料處理。資料處理包括資料錄音、語音辨識、手寫辨識、產生索引、資料壓縮、索引搜尋、產生音頻信號以及輸入/輸出操作。資料錄音係暫時記錄數位化音頻資料或是數位化手寫資料以執行資料辨識。語音辨識係辨認語音字元，並將已辨識的字元轉換為可用於資料傳輸與儲存的形式，包括文字、二進位或其他電腦可讀取的形式。手寫辨識係辨識手寫文字或是圖形等，並將已辨識的文字轉換為可於本地記憶體或遠端電腦執行資料傳輸與儲存的形式。產生索引係於數位化資料處標記索引，使得使用者在之後可以搜尋具有已知索引的標記資料。索引可以為從麥克風模組12或手寫輸入單元13所輸入的文數字元或是藉由手寫輸入單元13所輸入的圖形。資料壓縮係將數位資料執行壓縮以減少其資料量，使得資料儲存更具經濟效益，並且可以降低與遠端電腦執行傳輸的資料傳輸量。索引搜尋係尋找在產生索引的操作中標記為預定索引的資料。產生音頻信號係接收來自遠端電腦的壓縮資料，將資料解壓縮並且轉換為可以被使用者辨識的類比音頻波形。輸入/輸出操作係提供筆型語音電腦1與外部裝置之間的輸入與輸出資料的存取。

[0020]控制按鈕18可以接收使用者輸入並且辨認對應的資料處理，包括資料錄音、語音辨識、手寫辨識、產生索引、資料壓縮、索引搜尋、產生音頻信號、語音重播、資料確認與校正。控制按鈕18可以為機械開關、電子開關、觸控式開關(on－screen switch)或是上述之組合。

[0021]第2圖係顯示使用第1圖之筆型語音電腦的流程圖，包括判斷指令S20、資料錄音S200、語音辨識S201、產生索引S2010、資料壓縮S2011、手寫辨識S202、產生索引S2020、資料壓縮S2021、語音輸出S203、索引搜尋S204、輸入/輸出操作S205、語音重播S206、資料確認與校正S2060。

[0022]當控制按鈕18接收輸入資料來啟動資料處理時，處理器14係編譯並執行對應於輸入資料的指令(S20)。

[0023]在資料錄音辨識指令(S200)中，處理器14係接收來自ADC 120的數位化語音資料或是來自手寫輸入單元13的手寫信號，並將其儲存於記憶體15中。

[0024]在語音辨識指令S201步驟中，處理器14係辨識語音資料並將語音資料轉換為二進位文字或是可以執行資料儲存或資料壓縮的其他格式。資料壓縮S2011步驟係將轉換後的資料執行壓縮以降低儲存的需求，並將壓縮後的資料儲存於記憶體15中或是透過收發器11與天線10進行無線傳輸而儲存於遠端電腦中。在索引產生(S2010)步驟中，控制按鈕18會被啟動以於語音辨識(S201)期間開始搜尋索引。根據本發明實施例，當語音辨識(S201)將語音資料轉換為文字資料時，手寫工具13係取得手寫信號並將手寫信號轉換為與文字資料連接的搜尋索引，使得搜尋索引可以映射至文字資料。文字資料與搜尋索引可儲存於第3圖之查找表(lookup table)中的資料以及搜尋索引欄中。文字資料的位置可以映射至搜尋索引之文字資料的起始位址來表示。

[0025]在手寫辨識S202步驟中，處理器14係將手寫信號轉換為二進位、文字或是可用以執行資料儲存或資料壓縮的其他格式，並且加以識別。同樣的，資料壓縮S2021係將已轉換格式的手寫資料執行壓縮，以降低儲存需求，並且將壓縮資料儲存於記憶體15或是藉由收發器11以及天線10以無線傳輸的方式儲存於遠端電腦中。在索引產生(S2020)步驟中，控制按鈕18於手寫辨識(S202)期間會被啟動以開始進行搜尋索引。根據本發明一實施例，當手寫辨識(S202)步驟將手寫信號轉會為文字資料時，麥克風模組12取得語音資料並將其轉會為連接至文字資料的搜尋索引，使得搜尋索引映射至文字資料。文字資料與搜尋索引可儲存於第3圖的查找表之資料以及搜尋索引欄中。文字資料的位置可以映射至搜尋索引的文字資料的起始位址來表示。

[0026]輸入/輸出操作205係執行輸入與輸出操作，以達成筆型語音電腦與遠端電腦之間的溝通。

[0027]在索引搜尋S204步驟中，控制按鈕18會被啟動已開始執行索引搜尋。搜尋索引可以為來自麥克風模組12的語音資料或是來自手寫工具13的手寫資料。根據本發明實施例，搜尋索引係為語音資料，處理器14係從記憶體15中載入包括文字資料與搜尋索引的查找表，尋找搜尋索引欄中的搜尋索引，映射對應的文字資料並將其輸出為搜尋結果。根據本發明其他實施例，麥克風模組12係接收語音索引資料，處理器14係將語音索引資料轉換為作為搜尋索引的文字格式，載入記憶體15中部分或所有即將被搜尋的文字資料並且尋找搜尋索引以作為搜尋結果。根據本發明另一實施例，手寫工具13係接收手寫索引資料，處理器14係將手寫索引資料轉換為作為搜尋索引的文字資料，載入記憶體15中部分或全部即將被搜尋的文字資料並且尋找搜尋索引以作為搜尋結果。處理器14隨後於語音輸出操作S203步驟中將搜尋結果轉換為類比語音信號，使得耳機/喇叭17可播放語音信號，使用者因而可確認與校正搜尋結果。使用者可透過控制按鈕18略過搜尋結果，並且藉由使用搜尋索引對記憶體15剩下的資料進行下一次搜尋，直到找到期望的搜尋結果為止。

[0028]在語音重播S206步驟中，控制按鈕18指出使用者期望播放儲存於遠端電腦或記憶體15中的特定資料。根據本發明一實施例，處理器14係將遠端電腦或記憶體15中的壓縮資料解壓縮並且轉換為即將為耳機/喇叭17播放的語音信號，使用者因而可以確認與校正資料。

[0029]在資料確認與校正S2060步驟中，使用者係藉由控制按鈕18指出來自語音重播S206步驟中的播放結果或是來自索引搜尋204步驟中的搜尋結果是否正確。當播放結果或搜尋結果不正確時，使用者可藉由操作控制按鈕18來校正結果。

[0030]第3圖係顯示與第1圖之筆型語音電腦以及第2圖之流程圖結合的查找表3，包括搜尋索引欄300、語音資料欄301、文字資料欄302以及時序連結欄304。搜尋索引欄300包括在索引產生S2010或索引產生S2020步驟中所產生的搜尋索引。搜尋索引可以為語音資料、手寫資料或是文字資料。語音資料欄301包括對應於搜尋索引之語音資料的初始位址。文字資料欄302包括對應於搜尋索引之文字資料的初始位址。時序連結欄304包括對應於資料記錄時間的時間計數(time count)。在索引搜尋204或重播S206步驟期間處理器14係使用期望搜尋索引來尋找搜尋索引欄300，並且找出索引搜尋欄中的期望搜尋索引，查找對應的語音資料欄301、文字資料欄302或是時間連結欄304，並且將與初始位置或時間計數有關的資料轉換為語音資料，並且在語音輸出S203步驟中透過耳機/喇叭17來播放語音信號，使得使用者可以確認資料的準確性。根據本發明一實施例，單一搜尋索引可對應至複數語音資料、文字資料或時間計數，且使用者可以忽略目前的索引搜尋S204步驟，並藉由控制控制按鈕18以相同的搜尋所引來進行下一次的搜尋。處理器14接著尋找搜尋索引欄300中的其他搜尋索引，轉換並播放與語音資料、文字資料或是與時間計數有關資料。

[0031]第4a圖與第4b圖係顯示根據本發明實施例所述之使用第1圖之筆型語音電腦、第2圖之流程圖以及第3圖的查找表來產生索引的方法，第4a突為在語音錄音S200步驟中所錄製的聲音串流，第4b圖為在手寫辨識S202與索引產生S2020步驟中所產生的手寫輸入。

[0032]處理器14係於語音錄音S200期間透過麥克風模組12接收第4a圖中的語音，使用者藉由控制控制按鈕18來啟動索引產生S2020步驟並且在第4b圖的紙上畫出一些字或圖案。參照第4b圖，使用者將底線畫在字”Newton”下並且在底線末端加上原點來表示”Newton”為搜尋索引，處理器14係於記憶體15中向後搜尋符合搜尋索引”Newton”的資料，並且將”Newton”記錄於搜尋索引欄300中，將符合的資料之起始位址記錄於文字資料欄302中。同樣的，末端具有原點的底線亦畫在字”gravitation”、”Laplace”、”Hooke”、”mechanic”以及”satellites”下而產生分別記錄於搜尋索引欄300與文字資料欄302中的搜尋索引以及資料。根據本發明另一實施例，使用者將紙張上的文字串流”handwriting in paper notebook”圈出，處理器14將圓圈視為時序連結，在時序連結欄304中記錄畫圓圈時的時間計數並且將文字串流”handwriting in paper notebook”記錄於索引搜尋欄300中。

[0033]使用者在索引搜尋操作S204期間係以”Newton”、”gravitation”、”Laplace”、”Hooke”、”mechanic”以及”satellites”來搜尋索引表，處理器14係尋找搜尋索引欄300並且回報文字資料欄302中對應的資料。使用者亦可以關鍵字”handwriting in paper notebook”來搜尋索引表，處理器14係尋找搜尋索引欄300，回報時序連結欄304中的時間計數，並且透過耳機/喇叭17來播放該時間計數時記憶體15中的資料，使得使用者可以驗證資料的準確性。

[0034]參照第4a圖，根據本發明另一實施例，使用者期望進行多次索引搜尋204或重播S206步驟。手寫工具13係接收作為搜尋索引的輸入”Newton”，處理器14係尋找搜尋索引欄300，找出符合期望索引的第一搜尋索引(對應至”Newton conceived that...”)，轉換並播放資料讓使用者來驗證準確性，如果使用者認為資料不正確，使用者可忽略目前的索引搜尋並且藉由控制控制按鈕18來進行下一次搜尋，處理器14接著尋找搜尋索引欄300，找出第二搜尋索引(對應至”Newton,through he...”)，轉換並播放資料讓使用者來驗證準確性，忽略與進行搜尋的程序可以重複許多次直到找到符合要求的資料為止。

[0035]第5圖係顯示根據本發明另一實施例所述與第1圖之筆型語音電腦1以及第2圖之流程圖結合的查找表5，包括手寫索引欄500、文字索引欄502、語音索引欄506以及應用索引欄508。手寫索引欄500係將來自手寫工具13的手寫信號儲存為搜尋索引。文字索引欄502也包括作為搜尋索引的手寫文字資料。語音索引欄506包括作為搜尋索引的語音資料。應用索引欄508包括對應於手寫索引欄500、文字索引欄502或是語音索引欄506中搜尋索引的時間、程式指令或是電話號碼。

[0036]當使用手寫工具13在書寫平面上做筆記時，使用者透過麥克風模組12記錄語音檔案，藉由控制控制按鈕18可以於手寫索引欄500中產生索引5001。處理器14係於產生手寫索引5001時接收並記錄手寫信號，將手寫信號轉換為文字格式的手寫資料，記錄手寫資料的文字索引5021，並且產生手寫索引5001。根據本發明一實施例，應用索引欄508係保持對應於手寫索引5001之時間索引5081，使得使用者可以藉由搜尋手寫索引欄5001或是文字索引欄5021找出時序間索引5081。使用者亦可以產生對應於手寫索引5001或文字索引5021的語音索引5061作為另外的搜尋索引，使得使用者可以藉由對麥克風模組12說出語音索引5061而找出時間索引5081。語音索引可藉由手寫工具13輸入手寫索引或是文字索引而產生，播放語音檔案中對應於時間索引的內容，控制控制按鈕18來表示產生語音索引，記錄來自麥克風模組12的語音串流，並且確認完成產生語音索引的步驟。語音索引5061可以為與手寫索引5001或文字索引5021之發音有關或無關。在應用索引欄508中的應用索引係對應至手寫索引、文字索引或是語音索引。應用索引5081可以為控制筆型語音電腦1之內部或外部裝置的程式指令，處理器14係接收並尋找手寫索引欄500、文字索引欄502、語音索引欄506中的搜尋索引，且找出並執行對應的應用索引。應用索引5081亦可以為電話號碼，處理器14係接收並尋找手寫索引欄500、文字索引欄502、語音索引欄506中的搜尋索引，並且找出對應於應用索引欄508的電話號碼。

[0037]在一種應用系統中，使用者分別輸入對應於人名之輸入手寫索引5001以及語音索引5061，該人的電話號碼係作為應用索引508，如此一來便建立了電話簿。由於手寫與語音發音皆是同一個人建立的，因此手寫索引5001或語音索引5061可以作為獨特的辨識器，如此一來便可以禁止其他人使用此電話簿以達到高安全性以及便利性。在其他應用系統中，使用者在手寫索引欄500中輸入手寫指令，在語音索引欄506中輸入語音指令，並且在對應的應用索引欄508中輸入程式指令，因此建立了高安全性且便利性之客製化指令表。

本發明雖以較佳實施例揭露如上，然其並非用以限定本發明的範圍，任何熟習此項技藝者，在不脫離本發明之精神和範圍內，當可做些許的更動與潤飾，因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。

1．．．筆型語音電腦

10．．．天線

11．．．收發器

12．．．麥克風模組

13．．．手寫輸入單元

14．．．處理器

15．．．記憶體

16．．．電池

17．．．喇叭/耳機

18．．．控制按鈕

120．．．類比至數位轉換器

122、124．．．麥克風單元

3、5．．．查找表

第1圖係顯示根據本發明實施例所述之筆型語音電腦的方塊圖。

第2圖係顯示根據本發明實施例所述之使用第1圖之筆型語音電腦的流程圖。

第3圖係顯示根據本發明一實施例所述之使用第1圖之筆型語音電腦與第2圖之流程圖所搭配的查找表。

第4a圖以及第4b圖係顯示使用第1圖之筆型語音電腦、第2圖之流程圖以及第3圖之查找表來產生索引的方法。

第5圖係顯示根據本發明另一實施例所述之使用第1圖之筆型語音電腦與第2圖之流程圖所搭配的查找表。