[go: up one dir, main page]

TWI395105B - 筆型電腦以及產生語音索引表的方法 - Google Patents

筆型電腦以及產生語音索引表的方法 Download PDF

Info

Publication number
TWI395105B
TWI395105B TW095146435A TW95146435A TWI395105B TW I395105 B TWI395105 B TW I395105B TW 095146435 A TW095146435 A TW 095146435A TW 95146435 A TW95146435 A TW 95146435A TW I395105 B TWI395105 B TW I395105B
Authority
TW
Taiwan
Prior art keywords
index
voice
data
handwritten
text
Prior art date
Application number
TW095146435A
Other languages
English (en)
Other versions
TW200813748A (en
Inventor
Paul Huang Yen-Son
Original Assignee
Fortemedia Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fortemedia Inc filed Critical Fortemedia Inc
Publication of TW200813748A publication Critical patent/TW200813748A/zh
Application granted granted Critical
Publication of TWI395105B publication Critical patent/TWI395105B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Description

筆型電腦以及產生語音索引表的方法
本發明係有關於一種筆型語音電腦(pen-type voice computer),特別是有關於一種筆型語音電腦的資料索引。
[0002]在傳統技術中,學生使用筆來抄筆記並且使用語音記錄器(voice recoder)將上課內容錄音。同樣的,記錄員或新聞工作者在訪談中會手寫筆記並且錄音。
[0003]然而,儲存語音資料需要相當多的記憶體容量,且透過傳統技術來搜尋特定語音資料也是相當不容易的。使用者通常都會盲目的搜尋全部的語音資料來找出想要的資料,因而耗費了許多不必要的時間與精力。
[0004]有鑑於此,期望設計一種可輕易地搜尋錄音檔中特定資料的裝置。因此,本發明係揭露一種用來產生搜尋索引並且執行索引搜尋的方法與裝置。
筆型語音電腦的特性包括:兩個輸入端--筆輸入以及麥克風,一個輸出端--喇叭/耳機。
三個可同時操作的輸入/輸出。
適用於筆輸入的內建式手寫辨識,適用於語音以及文字至語音的內建式語音辨識,使得伺服器至筆型語音電腦之間的傳輸以資料取代語音。
建造為兩個元件--筆以及語音介面(麥克風+喇叭/耳機)。
語音介面部分為一頭戴受話器(headset)。
藉由無線的方式可以存取網路、伺服器、喇叭、鍵盤以及螢幕。
筆輸入以及語音記錄可以同時執行,筆輸入的最後一個片段可與語音串流有關聯。
在經過藉由手寫辨識執行辨識後,最後一個片段變為索引(文字)。
語音串流的相關片段可藉由語音辨識而變為索引(文字)。
藉由索引可用以搜尋以及播放語音記錄。
藉由比語音更多的文字即可使語音串流與伺服器進行通訊。
藉由按鈕來表示可輸入的連接字串(concatenated text string)。
筆輸入、語音記錄以及喇叭/耳機可以同時操作。
藉由手寫辨識可使手寫輸入轉變為文字。
藉由語音辨識可使語音輸入轉變為文字。
喇叭/耳機可藉由文字至語音程式持續地播放來自手寫輸入與記錄中的文字。
為讓本發明之上述和其他目的、特徵、和優點能更明顯易懂,下文特舉出較佳實施例,並配合所附圖式,作詳細說明如下:
實施例:
以下將介紹適用於根據本發明所述之較佳實施例。必須說明的是,本發明提供了許多可應用之發明概念,所揭露之特定實施例僅是說明達成以及使用本發明之特定方式,不可用以限制本發明之範圍。
[0013]第1圖係顯示根據本發明實施例所述之筆型語音電腦1的方塊圖,包括天線10、收發器11、麥克風模組12、手寫輸入單元13、處理器14、記憶體15、電池16、喇叭/耳機17以及控制按鈕18。收發器11、麥克風模組12、手寫輸入單元13、記憶體15以及喇叭/耳機17全部都耦接至處理器14,其中收發器11係耦接至天線10。
[0014]電池16係耦接至筆型語音電腦1中的所有元件以提供所有元件的電力需求。
[0015]藉由天線10與收發器11可以將數位信號傳送至遠端電腦以及接收來自遠端電腦的數位信號,以執行資料儲存或後資料處理。天線10可以透過藍芽(Bluetooth)、無線區域網路或是其他射頻技術以及紅外線數據協會(infrared data association,IrDA)技術與遠端電腦進行通訊。
[0016]麥克風模組12可包括麥克風單元122與124的麥克風陣列以及類比至數位轉換器(analog to digital converter,ADC)120。麥克風單元122與124僅接收特定角度覆蓋範圍內的方向語音信號(directional voice signal),如此一來便可以消除特定角度覆蓋範圍外的信號源。ADC 120係接收來自麥克風單元122與124之類比語音信號並將其轉換為數位資料。手寫輸入單元13係接收來自寫入端(writing tip)的寫入信號,寫入端可以為筆或描畫針(stylus)、觸控板、滑鼠或是光學掃描器。即時(realtime)應用系統係藉由手寫辨識軟體應用程式來偵測或辨識描畫針、觸控板或是滑鼠所接收的使用者手寫輸入而產生二進位格式、文字格式或是任何適用於資料儲存與轉換的格式。對於離線應用系統來說,透過光學掃描器所掃瞄的文件或手寫輸入可於處理器14中進行辨識。手寫信號可以為文數字元(alphanumeric character)、圖形或圖案。
[0017]喇叭/耳機17係接收來自處理器14的類比音頻信號並且將音頻信號傳送至四周給使用者聽。
[0018]記憶體16係提供暫時的資料儲存空間給處理器14使用,使得程式碼可以被處理器14執行。記憶體16可以為隨機存取記憶體(Random access Memory,RAM)、唯讀記憶體(Read-Only Memory,ROM)、快取記憶體或是上述之組合。
[0019]處理器14可以為數位信號處理器(digital signal processor,DSP)。處理器14係接收來自麥克風模組12與手寫輸入單元13的數位資料並且執行資料處理。資料處理包括資料錄音、語音辨識、手寫辨識、產生索引、資料壓縮、索引搜尋、產生音頻信號以及輸入/輸出操作。資料錄音係暫時記錄數位化音頻資料或是數位化手寫資料以執行資料辨識。語音辨識係辨認語音字元,並將已辨識的字元轉換為可用於資料傳輸與儲存的形式,包括文字、二進位或其他電腦可讀取的形式。手寫辨識係辨識手寫文字或是圖形等,並將已辨識的文字轉換為可於本地記憶體或遠端電腦執行資料傳輸與儲存的形式。產生索引係於數位化資料處標記索引,使得使用者在之後可以搜尋具有已知索引的標記資料。索引可以為從麥克風模組12或手寫輸入單元13所輸入的文數字元或是藉由手寫輸入單元13所輸入的圖形。資料壓縮係將數位資料執行壓縮以減少其資料量,使得資料儲存更具經濟效益,並且可以降低與遠端電腦執行傳輸的資料傳輸量。索引搜尋係尋找在產生索引的操作中標記為預定索引的資料。產生音頻信號係接收來自遠端電腦的壓縮資料,將資料解壓縮並且轉換為可以被使用者辨識的類比音頻波形。輸入/輸出操作係提供筆型語音電腦1與外部裝置之間的輸入與輸出資料的存取。
[0020]控制按鈕18可以接收使用者輸入並且辨認對應的資料處理,包括資料錄音、語音辨識、手寫辨識、產生索引、資料壓縮、索引搜尋、產生音頻信號、語音重播、資料確認與校正。控制按鈕18可以為機械開關、電子開關、觸控式開關(on-screen switch)或是上述之組合。
[0021]第2圖係顯示使用第1圖之筆型語音電腦的流程圖,包括判斷指令S20、資料錄音S200、語音辨識S201、產生索引S2010、資料壓縮S2011、手寫辨識S202、產生索引S2020、資料壓縮S2021、語音輸出S203、索引搜尋S204、輸入/輸出操作S205、語音重播S206、資料確認與校正S2060。
[0022]當控制按鈕18接收輸入資料來啟動資料處理時,處理器14係編譯並執行對應於輸入資料的指令(S20)。
[0023]在資料錄音辨識指令(S200)中,處理器14係接收來自ADC 120的數位化語音資料或是來自手寫輸入單元13的手寫信號,並將其儲存於記憶體15中。
[0024]在語音辨識指令S201步驟中,處理器14係辨識語音資料並將語音資料轉換為二進位文字或是可以執行資料儲存或資料壓縮的其他格式。資料壓縮S2011步驟係將轉換後的資料執行壓縮以降低儲存的需求,並將壓縮後的資料儲存於記憶體15中或是透過收發器11與天線10進行無線傳輸而儲存於遠端電腦中。在索引產生(S2010)步驟中,控制按鈕18會被啟動以於語音辨識(S201)期間開始搜尋索引。根據本發明實施例,當語音辨識(S201)將語音資料轉換為文字資料時,手寫工具13係取得手寫信號並將手寫信號轉換為與文字資料連接的搜尋索引,使得搜尋索引可以映射至文字資料。文字資料與搜尋索引可儲存於第3圖之查找表(lookup table)中的資料以及搜尋索引欄中。文字資料的位置可以映射至搜尋索引之文字資料的起始位址來表示。
[0025]在手寫辨識S202步驟中,處理器14係將手寫信號轉換為二進位、文字或是可用以執行資料儲存或資料壓縮的其他格式,並且加以識別。同樣的,資料壓縮S2021係將已轉換格式的手寫資料執行壓縮,以降低儲存需求,並且將壓縮資料儲存於記憶體15或是藉由收發器11以及天線10以無線傳輸的方式儲存於遠端電腦中。在索引產生(S2020)步驟中,控制按鈕18於手寫辨識(S202)期間會被啟動以開始進行搜尋索引。根據本發明一實施例,當手寫辨識(S202)步驟將手寫信號轉會為文字資料時,麥克風模組12取得語音資料並將其轉會為連接至文字資料的搜尋索引,使得搜尋索引映射至文字資料。文字資料與搜尋索引可儲存於第3圖的查找表之資料以及搜尋索引欄中。文字資料的位置可以映射至搜尋索引的文字資料的起始位址來表示。
[0026]輸入/輸出操作205係執行輸入與輸出操作,以達成筆型語音電腦與遠端電腦之間的溝通。
[0027]在索引搜尋S204步驟中,控制按鈕18會被啟動已開始執行索引搜尋。搜尋索引可以為來自麥克風模組12的語音資料或是來自手寫工具13的手寫資料。根據本發明實施例,搜尋索引係為語音資料,處理器14係從記憶體15中載入包括文字資料與搜尋索引的查找表,尋找搜尋索引欄中的搜尋索引,映射對應的文字資料並將其輸出為搜尋結果。根據本發明其他實施例,麥克風模組12係接收語音索引資料,處理器14係將語音索引資料轉換為作為搜尋索引的文字格式,載入記憶體15中部分或所有即將被搜尋的文字資料並且尋找搜尋索引以作為搜尋結果。根據本發明另一實施例,手寫工具13係接收手寫索引資料,處理器14係將手寫索引資料轉換為作為搜尋索引的文字資料,載入記憶體15中部分或全部即將被搜尋的文字資料並且尋找搜尋索引以作為搜尋結果。處理器14隨後於語音輸出操作S203步驟中將搜尋結果轉換為類比語音信號,使得耳機/喇叭17可播放語音信號,使用者因而可確認與校正搜尋結果。使用者可透過控制按鈕18略過搜尋結果,並且藉由使用搜尋索引對記憶體15剩下的資料進行下一次搜尋,直到找到期望的搜尋結果為止。
[0028]在語音重播S206步驟中,控制按鈕18指出使用者期望播放儲存於遠端電腦或記憶體15中的特定資料。根據本發明一實施例,處理器14係將遠端電腦或記憶體15中的壓縮資料解壓縮並且轉換為即將為耳機/喇叭17播放的語音信號,使用者因而可以確認與校正資料。
[0029]在資料確認與校正S2060步驟中,使用者係藉由控制按鈕18指出來自語音重播S206步驟中的播放結果或是來自索引搜尋204步驟中的搜尋結果是否正確。當播放結果或搜尋結果不正確時,使用者可藉由操作控制按鈕18來校正結果。
[0030]第3圖係顯示與第1圖之筆型語音電腦以及第2圖之流程圖結合的查找表3,包括搜尋索引欄300、語音資料欄301、文字資料欄302以及時序連結欄304。搜尋索引欄300包括在索引產生S2010或索引產生S2020步驟中所產生的搜尋索引。搜尋索引可以為語音資料、手寫資料或是文字資料。語音資料欄301包括對應於搜尋索引之語音資料的初始位址。文字資料欄302包括對應於搜尋索引之文字資料的初始位址。時序連結欄304包括對應於資料記錄時間的時間計數(time count)。在索引搜尋204或重播S206步驟期間處理器14係使用期望搜尋索引來尋找搜尋索引欄300,並且找出索引搜尋欄中的期望搜尋索引,查找對應的語音資料欄301、文字資料欄302或是時間連結欄304,並且將與初始位置或時間計數有關的資料轉換為語音資料,並且在語音輸出S203步驟中透過耳機/喇叭17來播放語音信號,使得使用者可以確認資料的準確性。根據本發明一實施例,單一搜尋索引可對應至複數語音資料、文字資料或時間計數,且使用者可以忽略目前的索引搜尋S204步驟,並藉由控制控制按鈕18以相同的搜尋所引來進行下一次的搜尋。處理器14接著尋找搜尋索引欄300中的其他搜尋索引,轉換並播放與語音資料、文字資料或是與時間計數有關資料。
[0031]第4a圖與第4b圖係顯示根據本發明實施例所述之使用第1圖之筆型語音電腦、第2圖之流程圖以及第3圖的查找表來產生索引的方法,第4a突為在語音錄音S200步驟中所錄製的聲音串流,第4b圖為在手寫辨識S202與索引產生S2020步驟中所產生的手寫輸入。
[0032]處理器14係於語音錄音S200期間透過麥克風模組12接收第4a圖中的語音,使用者藉由控制控制按鈕18來啟動索引產生S2020步驟並且在第4b圖的紙上畫出一些字或圖案。參照第4b圖,使用者將底線畫在字”Newton”下並且在底線末端加上原點來表示”Newton”為搜尋索引,處理器14係於記憶體15中向後搜尋符合搜尋索引”Newton”的資料,並且將”Newton”記錄於搜尋索引欄300中,將符合的資料之起始位址記錄於文字資料欄302中。同樣的,末端具有原點的底線亦畫在字”gravitation”、”Laplace”、”Hooke”、”mechanic”以及”satellites”下而產生分別記錄於搜尋索引欄300與文字資料欄302中的搜尋索引以及資料。根據本發明另一實施例,使用者將紙張上的文字串流”handwriting in paper notebook”圈出,處理器14將圓圈視為時序連結,在時序連結欄304中記錄畫圓圈時的時間計數並且將文字串流”handwriting in paper notebook”記錄於索引搜尋欄300中。
[0033]使用者在索引搜尋操作S204期間係以”Newton”、”gravitation”、”Laplace”、”Hooke”、”mechanic”以及”satellites”來搜尋索引表,處理器14係尋找搜尋索引欄300並且回報文字資料欄302中對應的資料。使用者亦可以關鍵字”handwriting in paper notebook”來搜尋索引表,處理器14係尋找搜尋索引欄300,回報時序連結欄304中的時間計數,並且透過耳機/喇叭17來播放該時間計數時記憶體15中的資料,使得使用者可以驗證資料的準確性。
[0034]參照第4a圖,根據本發明另一實施例,使用者期望進行多次索引搜尋204或重播S206步驟。手寫工具13係接收作為搜尋索引的輸入”Newton”,處理器14係尋找搜尋索引欄300,找出符合期望索引的第一搜尋索引(對應至”Newton conceived that...”),轉換並播放資料讓使用者來驗證準確性,如果使用者認為資料不正確,使用者可忽略目前的索引搜尋並且藉由控制控制按鈕18來進行下一次搜尋,處理器14接著尋找搜尋索引欄300,找出第二搜尋索引(對應至”Newton,through he...”),轉換並播放資料讓使用者來驗證準確性,忽略與進行搜尋的程序可以重複許多次直到找到符合要求的資料為止。
[0035]第5圖係顯示根據本發明另一實施例所述與第1圖之筆型語音電腦1以及第2圖之流程圖結合的查找表5,包括手寫索引欄500、文字索引欄502、語音索引欄506以及應用索引欄508。手寫索引欄500係將來自手寫工具13的手寫信號儲存為搜尋索引。文字索引欄502也包括作為搜尋索引的手寫文字資料。語音索引欄506包括作為搜尋索引的語音資料。應用索引欄508包括對應於手寫索引欄500、文字索引欄502或是語音索引欄506中搜尋索引的時間、程式指令或是電話號碼。
[0036]當使用手寫工具13在書寫平面上做筆記時,使用者透過麥克風模組12記錄語音檔案,藉由控制控制按鈕18可以於手寫索引欄500中產生索引5001。處理器14係於產生手寫索引5001時接收並記錄手寫信號,將手寫信號轉換為文字格式的手寫資料,記錄手寫資料的文字索引5021,並且產生手寫索引5001。根據本發明一實施例,應用索引欄508係保持對應於手寫索引5001之時間索引5081,使得使用者可以藉由搜尋手寫索引欄5001或是文字索引欄5021找出時序間索引5081。使用者亦可以產生對應於手寫索引5001或文字索引5021的語音索引5061作為另外的搜尋索引,使得使用者可以藉由對麥克風模組12說出語音索引5061而找出時間索引5081。語音索引可藉由手寫工具13輸入手寫索引或是文字索引而產生,播放語音檔案中對應於時間索引的內容,控制控制按鈕18來表示產生語音索引,記錄來自麥克風模組12的語音串流,並且確認完成產生語音索引的步驟。語音索引5061可以為與手寫索引5001或文字索引5021之發音有關或無關。在應用索引欄508中的應用索引係對應至手寫索引、文字索引或是語音索引。應用索引5081可以為控制筆型語音電腦1之內部或外部裝置的程式指令,處理器14係接收並尋找手寫索引欄500、文字索引欄502、語音索引欄506中的搜尋索引,且找出並執行對應的應用索引。應用索引5081亦可以為電話號碼,處理器14係接收並尋找手寫索引欄500、文字索引欄502、語音索引欄506中的搜尋索引,並且找出對應於應用索引欄508的電話號碼。
[0037]在一種應用系統中,使用者分別輸入對應於人名之輸入手寫索引5001以及語音索引5061,該人的電話號碼係作為應用索引508,如此一來便建立了電話簿。由於手寫與語音發音皆是同一個人建立的,因此手寫索引5001或語音索引5061可以作為獨特的辨識器,如此一來便可以禁止其他人使用此電話簿以達到高安全性以及便利性。在其他應用系統中,使用者在手寫索引欄500中輸入手寫指令,在語音索引欄506中輸入語音指令,並且在對應的應用索引欄508中輸入程式指令,因此建立了高安全性且便利性之客製化指令表。
本發明雖以較佳實施例揭露如上,然其並非用以限定本發明的範圍,任何熟習此項技藝者,在不脫離本發明之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
1...筆型語音電腦
10...天線
11...收發器
12...麥克風模組
13...手寫輸入單元
14...處理器
15...記憶體
16...電池
17...喇叭/耳機
18...控制按鈕
120...類比至數位轉換器
122、124...麥克風單元
3、5...查找表
第1圖係顯示根據本發明實施例所述之筆型語音電腦的方塊圖。
第2圖係顯示根據本發明實施例所述之使用第1圖之筆型語音電腦的流程圖。
第3圖係顯示根據本發明一實施例所述之使用第1圖之筆型語音電腦與第2圖之流程圖所搭配的查找表。
第4a圖以及第4b圖係顯示使用第1圖之筆型語音電腦、第2圖之流程圖以及第3圖之查找表來產生索引的方法。
第5圖係顯示根據本發明另一實施例所述之使用第1圖之筆型語音電腦與第2圖之流程圖所搭配的查找表。
1...筆型語音電腦
10...天線
11...收發器
12...麥克風模組
13...手寫輸入單元
14...處理器
15...記憶體
16...電池
17...喇叭/耳機
18...控制按鈕
120...類比至數位轉換器
122、124...麥克風單元

Claims (10)

  1. 一種產生語音索引表的方法,包括:透過一麥克風記錄一語音資料;藉由一手寫輸入裝置輸入一圖形資料而產生上述語音資料之一手寫索引;以及使該手寫索引關聯該對應的上述語音資料以產生該語音索引表;其中上述語音資料包括複數語音片段,每一語音片段具有對應的時序索引,上述產生步驟包括使用文字辨識將上述圖形資料轉換為上述手寫索引;且上述關聯步驟包括當上述語音片段的語音文字資料符合上述手寫索引時使上述時序索引關聯上述手寫索引。
  2. 如申請專利範圍第1項所述之產生語音索引表的方法,更包括:接收來自一聲敏元件之一語音索引;以及使上述語音索引關聯上述手寫索引以及對應的上述語音資料。
  3. 如申請專利範圍第1項所述之產生語音索引表的方法,更包括:根據上述手寫索引播放一語音資料。
  4. 如申請專利範圍第2項所述之產生語音索引表的方法,更包括:接收一第二語音索引來取代上述語音索引表中的上述語音索引。
  5. 一種筆型電腦,包括:一麥克風,用以記錄一語音資料;一產生裝置,用以藉由一手寫輸入裝置輸入一圖形資料而產生上述語音資料之一手寫索引;以及一第一關聯裝置,用以使上述手寫索引關聯對應的上述語音資料而產生上述語音索引表;其中上述語音資料包括複數語音片段,每一語音片段具有對應的時序索引,上述產生裝置包括一轉換裝置,藉由使用文字辨識將上述圖形資料轉換為上述手寫索引,且上述關聯裝置包括於上述語音片段的語音文字資料符合上述手寫索引時使上述時序索引關聯上述手寫索引的裝置。
  6. 如申請專利範圍第5項所述之筆型電腦,更包括:一接收裝置,用以接收來自一聲敏元件之一語音索引;以及一第二關聯裝置,用以使上述語音索引關聯上述手寫索引以及對應的上述語音資料。
  7. 如申請專利範圍第6項所述之筆型電腦,更包括:一播放裝置,用以根據上述手寫索引播放一語音資料。
  8. 如申請專利範圍第7項所述之筆型電腦,更包括:一接收裝置,用以接收一第二語音索引來取代上述語音索引表中的上述語音索引。
  9. 如申請專利範圍第1項所述之產生語音索引表的方法,其中該語音索引表包括一手寫索引欄、文字索引欄、語音索引欄以及應用索引欄。
  10. 如申請專利範圍第5項所述之筆型電腦,其中該語音索引表包括一手寫索引欄、文字索引欄、語音索引欄以及應用索引欄。
TW095146435A 2006-09-05 2006-12-12 筆型電腦以及產生語音索引表的方法 TWI395105B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/516,140 US8447611B2 (en) 2006-09-05 2006-09-05 Pen-type voice computer and method thereof

Publications (2)

Publication Number Publication Date
TW200813748A TW200813748A (en) 2008-03-16
TWI395105B true TWI395105B (zh) 2013-05-01

Family

ID=39153044

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095146435A TWI395105B (zh) 2006-09-05 2006-12-12 筆型電腦以及產生語音索引表的方法

Country Status (4)

Country Link
US (1) US8447611B2 (zh)
CN (1) CN101529499B (zh)
TW (1) TWI395105B (zh)
WO (1) WO2008030254A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9304608B2 (en) * 2011-12-20 2016-04-05 Htc Corporation Stylus device
US9858039B2 (en) * 2014-01-28 2018-01-02 Oracle International Corporation Voice recognition of commands extracted from user interface screen devices
JP6776639B2 (ja) * 2016-06-10 2020-10-28 コニカミノルタ株式会社 情報処理システム、電子機器、情報処理装置、情報処理方法、電子機器処理方法、及びプログラム
EP4028930B1 (en) * 2019-09-11 2025-07-16 Oracle International Corporation Using a generative adversarial network to train a semantic parser of a dialog system
EP4234264A1 (en) * 2022-02-25 2023-08-30 BIC Violex Single Member S.A. Methods and systems for transforming speech into visual text

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
US20040215458A1 (en) * 2003-04-28 2004-10-28 Hajime Kobayashi Voice recognition apparatus, voice recognition method and program for voice recognition

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1112252A (zh) * 1994-05-16 1995-11-22 北京超凡电子科技有限公司 集成语音手写汉字输入工具
US6438523B1 (en) * 1998-05-20 2002-08-20 John A. Oberteuffer Processing handwritten and hand-drawn input and speech input
US7458013B2 (en) * 1999-05-12 2008-11-25 The Board Of Trustees Of The Leland Stanford Junior University Concurrent voice to text and sketch processing with synchronized replay
US9009060B2 (en) * 1999-09-21 2015-04-14 Ameranth, Inc. Information management and synchronous communications system
US6505153B1 (en) * 2000-05-22 2003-01-07 Compaq Information Technologies Group, L.P. Efficient method for producing off-line closed captions
US6788815B2 (en) * 2000-11-10 2004-09-07 Microsoft Corporation System and method for accepting disparate types of user input
US7533014B2 (en) * 2000-12-27 2009-05-12 Intel Corporation Method and system for concurrent use of two or more closely coupled communication recognition modalities
US20020152075A1 (en) * 2001-04-16 2002-10-17 Shao-Tsu Kung Composite input method
US7467089B2 (en) * 2001-09-05 2008-12-16 Roth Daniel L Combined speech and handwriting recognition
US7225131B1 (en) * 2002-06-14 2007-05-29 At&T Corp. System and method for accessing and annotating electronic medical records using multi-modal interface
CN1224889C (zh) * 2002-07-22 2005-10-26 北京大学 一种汉字输入方法和使用该方法的系统
US7506271B2 (en) * 2003-12-15 2009-03-17 Microsoft Corporation Multi-modal handwriting recognition correction
US20050137867A1 (en) * 2003-12-17 2005-06-23 Miller Mark R. Method for electronically generating a synchronized textual transcript of an audio recording

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6249765B1 (en) * 1998-12-22 2001-06-19 Xerox Corporation System and method for extracting data from audio messages
US20040215458A1 (en) * 2003-04-28 2004-10-28 Hajime Kobayashi Voice recognition apparatus, voice recognition method and program for voice recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
2004年9月22日公開論文:Schimke,etal,"IntegrationandFusionAspectsofSpeechandHandwritingMedia,"9thConferenceSpeechandComputer,September20-22,2004. *

Also Published As

Publication number Publication date
US20080059196A1 (en) 2008-03-06
CN101529499B (zh) 2013-04-24
US8447611B2 (en) 2013-05-21
TW200813748A (en) 2008-03-16
CN101529499A (zh) 2009-09-09
WO2008030254A1 (en) 2008-03-13

Similar Documents

Publication Publication Date Title
US9058067B2 (en) Digital bookclip
US20040010409A1 (en) Voice recognition system, device, voice recognition method and voice recognition program
JP2014219614A (ja) オーディオ装置、ビデオ装置及びコンピュータプログラム
WO2007141204A1 (en) System and method for recalling media
CN109119079B (zh) 语音输入处理方法和装置
CN103533155B (zh) 在移动终端中记录和播放用户语音的方法和装置
US7979278B2 (en) Speech recognition system and speech file recording system
TWI395105B (zh) 筆型電腦以及產生語音索引表的方法
KR20150088564A (ko) 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법
KR20110053397A (ko) 검색 키워드를 이용한 멀티미디어 파일 검색 방법 및 그 휴대기기
CN116430999A (zh) 一种语音助手实现指尖视觉交互技术的方法和系统
JP2015091077A (ja) 情報表示装置、方法及びプログラム
CN102043771A (zh) 电子化翻译方法、便携式电子装置及翻译系统
KR20080083290A (ko) 디지털 파일의 컬렉션에서 디지털 파일을 액세스하기 위한방법 및 장치
JPH04311222A (ja) 電子ドキュメントを音声処理するポータブル・コンピュータ装置
TW200947241A (en) Database indexing algorithm and method and system for database searching using the same
CN105531765A (zh) 基于语音生成和识别条形码信息的方法以及记录介质
KR100974539B1 (ko) 전자화된 사전정보 관리장치 및 방법
JP6034541B1 (ja) 情報表示装置、情報表示方法及び情報表示プログラム
KR102636569B1 (ko) 사용자 맞춤형 음성 문서서식 설정시스템
CN1979468A (zh) 声控文件查询系统以及声控文件查询方法
KR20140136823A (ko) 전자 기기의 오디오 데이터의 관리 방법 및 장치
CN1979462A (zh) 声控多媒体播放器
US6928405B2 (en) Method of adding audio data to an information title of a document
TWI282086B (en) Speech-to-text conversion device and method thereof

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees