[go: up one dir, main page]

TW201327214A - 電子設備及其自然語言分析方法 - Google Patents

電子設備及其自然語言分析方法 Download PDF

Info

Publication number
TW201327214A
TW201327214A TW101100863A TW101100863A TW201327214A TW 201327214 A TW201327214 A TW 201327214A TW 101100863 A TW101100863 A TW 101100863A TW 101100863 A TW101100863 A TW 101100863A TW 201327214 A TW201327214 A TW 201327214A
Authority
TW
Taiwan
Prior art keywords
corpus
temporary
vocabulary
understanding
understanding result
Prior art date
Application number
TW101100863A
Other languages
English (en)
Other versions
TWI509432B (zh
Inventor
Yu-Kai Xiong
Xin Lu
Shih-Fang Wong
Hui-Feng Liu
Dong-Sheng Lv
yu-yong Zhang
Jian-Jian Zhu
xiang-lin Cheng
Xuan-Fen Huang
an-lin Jiang
Xiao-Shan Zhou
Xin-Hua Li
Original Assignee
Hon Hai Prec Ind Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hon Hai Prec Ind Co Ltd filed Critical Hon Hai Prec Ind Co Ltd
Publication of TW201327214A publication Critical patent/TW201327214A/zh
Application granted granted Critical
Publication of TWI509432B publication Critical patent/TWI509432B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一種自然語言分析方法,用於包括存儲有基礎語料庫和臨時語料庫的電子設備。該方法包括如下步驟:接收用戶輸入產生輸入訊號;將輸入訊號轉換為文本資訊;將文本資訊進行分析;根據基礎語料庫、詞彙切分結果和語句劃分結果得到第一理解結果;根據上下文判斷第一理解結果是否為恰當的理解結果;當第一理解結果不是恰當的理解結果時,確定一或多個代指詞彙,根據上下文確定其臨時理解結果以及對文本資訊的第二理解結果;及根據第二理解結果、基礎語料庫和臨時語料庫確定一回復資訊。本發明還提供了一種應用上述方法的電子設備。

Description

電子設備及其自然語言分析方法
本發明涉及一種電子設備及其自然語言分析方法。
隨著技術的發展,具有人機會話功能的電腦等智慧型的電子設備越來越受到消費者的親睞。然而,自然語言理解一直是人工智慧學科內引人注目而又困難重重的一個核心研究課題。在人機會話的過程中,電子設備將用戶的自然語言藉由詞彙切分法等方式進行切分,然後結合預存的基礎語料庫來理解用戶的自然語言,藉由轉換最終得到句子的語意。雖然基礎語料庫中已被注入大量的語言知識和語法規則知識,然而,當用戶的自然語言中出現語言代指時,例如,自然語言中的“然而圓規很不平,顯出鄙夷的神色,仿佛嗤笑法國人不知道拿破崙…(魯迅先生的《故鄉》)”、“學生吃食堂”、“老鄉吃大碗”等等,電子設備根據基礎語料庫就無法快速準確的理解用戶的自然語言。
有鑒於此,有必要提供一種用於電子設備的自然語言分析方法,可提高電子設備理解用戶的自然語言的準確度,以便於更有效的人機會話,以解決上述問題。
有鑒於此,還有必要提供一種採用自然語言分析方法的電子設備,以解決上述問題。
一種自然語言分析方法,用於包括存儲有基礎語料庫的電子設備。該基礎語料庫記錄了多個詞彙以及每一詞彙的使用頻率。該電子設備還存儲有記錄了至少一代指詞彙及其臨時理解結果的一一對應關係的臨時語料庫。該方法包括如下步驟:接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號;將該用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊;將該文本資訊切分為包括多個詞彙的多種詞彙切分結果,並在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果;從該基礎語料庫中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果;根據上下文理解法對用戶的一預設時段內的文本資訊進行分析,判斷該第一理解結果是否為一恰當的理解結果;當該第一理解結果不是恰當的理解結果時,確定導致該第一理解結果為不恰當的理解結果的一或多個代指詞彙,並將該一或多個代指詞彙與存儲在該臨時語料庫中的詞彙進行對比,判斷臨時語料庫中是否記錄了該一或多個代指詞彙;當該臨時語料庫中未記錄該一或多個代指詞彙時,根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫中;及根據該第二理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
一種電子設備,包括存儲有基礎語料庫的存儲單元和輸入單元。該基礎語料庫記錄了多個詞彙以及每一詞彙的使用頻率。該輸入單元用於接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號。該存儲單元還存儲了一臨時語料庫。該臨時語料庫記錄了至少一代指詞彙及其臨時理解結果的一一對應關係。該電子設備還包括:
一語言文字轉換模組,用於將該用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊;
一語言分析模組,用於將該文本資訊切分為包括多個詞彙的多種詞彙切分結果,並在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果;以及從該基礎語料庫中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果;
一判斷模組,用於根據上下文理解法對用戶的一預設時段內的文本資訊進行分析,判斷該第一理解結果是否為一恰當的理解結果,以及當該第一理解結果不是恰當的理解結果時,確定導致該第一理解結果為不恰當的理解結果的一或多個代指詞彙,並將該一或多個代指詞彙與存儲在該臨時語料庫中的詞彙進行對比,判斷臨時語料庫中是否記錄了該一或多個代指詞彙;
該語言分析模組,還用於當該臨時語料庫中未記錄該一或多個代指詞彙時,根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫中;及
一智慧會話模組,用於根據該第二理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
相對於現有技術,上述電子設備及其自然語言分析方法,使用上述電子設備及其自然語言分析方法,當用戶啟動電子設備後,用戶可以藉由輸入單元與電子設備進行人機會話,藉由將用戶的語音和/或文字輸入轉換為一文本資訊,將該文本資訊進行分析後確定一理解結果,判斷該理解結果為不恰當的理解結果時,確定一或多個導致該理解結果為不恰當的理解結果的一或多個詞彙(即代指詞彙)及其臨時理解結果並存儲於臨時語料庫,並確定一新的理解結果,同時,根據新的理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊,從而更準確的理解用戶的自然語言,提高了人機會話的效率。
請參閱圖1,其為本發明的一實施方式的電子設備100的功能模組圖。電子設備100可更準確的理解用戶自然語言,具有較高的人機會話效率。在本實施方式中,電子設備100為一電腦,在其他實施方式中,電子設備100還可以是手機等電子設備。
電子設備100包括一存儲單元10、一輸入單元20、一處理單元30、一顯示單元50和一語音輸出單元60。
存儲單元10存儲有基礎語料庫11。基礎語料庫11記錄了海量的詞彙以及每一詞彙的使用頻率。基礎語料庫11是按照明確的語言學標準選擇並排序的語言運用材料彙集,是按照明確的設計標準集成的可機讀的大型文本庫。在本實施方式中,基礎語料庫11是存有大量的中文自然語言的文本庫,在其他實施方式中,基礎語料庫11還可以存儲有英文、日文等其他語言種類的自然語言的文本庫。具體文本的語言種類可以根據需要設置。
暫存器40中存儲有臨時語料庫41。臨時語料庫41記錄了至少一代指詞彙及其臨時理解結果的一一對應關係。該臨時語料庫41是在電子設備100進行人際會話的過程中存儲的。例如,臨時語料庫41記錄了代指詞彙“圓規”與對其的臨時理解結果為“一人名”的對應關係、代指詞彙“吃食堂”與對其的臨時理解結果為“在食堂吃飯”等等。在一實施方式中,該臨時語料庫41暫存於存儲單元10中。
輸入單元20用於接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號,並將轉換得到的語音訊號和/或文字輸入訊號傳輸至處理單元30。
處理單元30包括一語音文字轉換模組31、一語言分析模組32、一判斷模組33和一智慧會話模組34。
當用戶開啟電子設備100後,輸入單元20即被啟動,用戶可以藉由輸入單元20與電子設備100進行人機會話。
語音文字轉換模組31用於將輸入單元20傳輸的用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊。在本實施方式中,該預設的語言為中文,該文本資訊可以為包括一個詞、一句話或一段話的文本資訊。在其他實施方式中,該預設的語言還可以是英文、日文等。
語言分析模組32用於首先將語音文字轉換模組31轉換得到的文本資訊切分為包括多個詞彙的多種詞彙切分結果;然後在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果。
語言分析模組32還用於從存儲在存儲單元10的基礎語料庫11中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果。語言分析模組32還用於將該第一理解結果即時的傳輸至判斷模組33。
判斷模組33用於根據上下文理解法(即語境理解法)對用戶的一預設時段內的文本資訊進行分析,判斷語言分析模組32傳輸的第一理解結果是否為一恰當的理解結果,並將判斷結果傳輸至語言分析模組32和智慧會話模組34。
當判斷模組33判斷語言分析模組32傳輸的第一理解結果為恰當的理解結果時:智慧會話模組34則根據該第一理解結果以及基礎語料庫11確定用於回應用戶的該文本資訊的一回復資訊。
當判斷模組33判斷語言分析模組32傳輸的第一理解結果為不恰當的理解結果時:
判斷模組33還用於確定導致該第一理解結果為不恰當的理解結果的一或多個詞彙(即代指詞彙),並將該一或多個代指詞彙與存儲在臨時語料庫41中的詞彙進行對比,判斷臨時語料庫41中是否記錄了該一或多個代指詞彙。
當臨時語料庫41中未記錄該一或多個代指詞彙時:語言分析模組32還用於根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並更新臨時語料庫41,即將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫41中;智慧會話模組34則根據該第二理解結果以及基礎語料庫11和臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊。
當臨時語料庫41中記錄了該一或多個代指詞彙時:語言分析模組32從臨時語料庫41中獲取該一或多個代指詞彙所對應的臨時理解結果,並據此確定對該文本資訊的第三理解結果;智慧會話模組34則根據該第三理解結果以及基礎語料庫11和臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊;智慧會話模組34則根據該第三理解結果以及基礎語料庫11和更新的臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊。
語音文字轉換模組31還用於將智慧會話模組34所確定的回復資訊轉換為自然語言的文本資訊和/或語音訊號;並控制將該文本資訊顯示於顯示單元50和/或將該語音訊號藉由語音輸出單元進行播放。
在本實施方式中,暫存器40還用於暫存語音文字轉換模組31轉換得到的文本資訊、語言分析模組32所切分的各個詞彙以及詞彙切分結果、語句劃分結果、語境分析結果、第一理解結果、第二理解結果、以及第三理解結果。一實施方式中,當暫存器40或存儲單元10中未存儲有臨時語料庫41時,判斷模組33還用於新建一臨時語料庫41,並將所確定的一或多個代指詞彙及其臨時理解結果一一對應後存儲於該新建的臨時語料庫41中。
在一實施方式中,判斷模組33還用於當判斷電子設備100與一用戶結束了當前會話時,將存儲於暫存器40或存儲單元10中的臨時語料庫41刪除。
請參閱圖2,其為本發明的電子設備100的自然語言分析方法的流程圖,用於存儲有基礎語料庫11的電子設備,基礎語料庫11記錄了海量的詞彙以及每一詞彙的使用頻率。該自然語言分析方法包括:
步驟S201,輸入單元20接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號。
步驟S202,語音文字轉換模組31將該用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊。在本實施方式中,該預設的語言為中文,該文本資訊可以為包括一個詞、一句話或一段話的文本資訊。在其他實施方式中,該預設的語言還可以是英文、日文等。
步驟S203,語言分析模組32首先將語音文字轉換模組31轉換得到的文本資訊切分為包括多個詞彙的多種詞彙切分結果,然後在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果。
步驟S204,語言分析模組32從存儲在存儲單元10的基礎語料庫11中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果。語言分析模組32還用於將該第一理解結果即時的傳輸至判斷模組33。
步驟S205,判斷模組33根據上下文理解法(即語境理解法)對用戶的一預設時段內的文本資訊進行分析,判斷語言分析模組32傳輸的第一理解結果是否為一恰當的理解結果,如果否,則進入步驟S206,否則,流程進入步驟S209。判斷模組33還將判斷結果傳輸至語言分析模組32和智慧會話模組34。
步驟S206,判斷模組33確定導致該第一理解結果為不恰當的理解結果的一或多個詞彙(即代指詞彙),並將該一或多個代指詞彙與存儲在臨時語料庫41中的詞彙進行對比,判斷臨時語料庫41中是否記錄了該一或多個代指詞彙。如果否,則進入步驟S207,否則,流程進入步驟S208。一實施方式中,當暫存器40或存儲單元10中未存儲有臨時語料庫41時,判斷模組33還用於新建一臨時語料庫41,並將所確定的一或多個代指詞彙及其臨時理解結果一一對應後存儲於該新建的臨時語料庫41中。
步驟S207,當臨時語料庫41中未記錄該一或多個代指詞彙時,語言分析模組32根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫41中。
步驟S208,當臨時語料庫41中記錄了該一或多個代指詞彙時,語言分析模組32從臨時語料庫41中獲取該一或多個代指詞彙所對應的臨時理解結果,並據此確定對該文本資訊的第三理解結果。
步驟S209,智慧會話模組34根據該語言分析模組32確定的理解結果以及基礎語料庫11和/或臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊。具體為:
當判斷語言分析模組32傳輸的第一理解結果為一恰當的理解結果時,智慧會話模組34根據該第一理解結果以及基礎語料庫11確定用於回應用戶的該文本資訊的一回復資訊;
當判斷語言分析模組32傳輸的第一理解結果為不恰當的理解結果,且臨時語料庫41中未記錄該一或多個代指詞彙時,智慧會話模組34根據該第二理解結果以及基礎語料庫11和臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊;及
當判斷語言分析模組32傳輸的第一理解結果為不恰當的理解結果,且臨時語料庫41中記錄了該一或多個代指詞彙時,智慧會話模組34根據該第三理解結果以及基礎語料庫11和臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊。
在一實施方式中,判斷模組33還用於當判斷電子設備100與一用戶結束了當前會話時,將存儲於暫存器40或存儲單元10中的臨時語料庫41刪除。
步驟S210,語音文字轉換模組31將智慧會話模組34所確定的回復資訊轉換為自然語言的文本資訊和/或語音訊號;並控制將轉換後的文本資訊顯示於顯示單元50和/或將該語音訊號藉由語音輸出單元進行播放。
使用上述電子設備100及其自然語言分析方法,當用戶啟動電子設備100後,用戶可以藉由輸入單元20與電子設備100進行人機會話,藉由將用戶的語音和/或文字輸入轉換為一文本資訊,將該文本資訊進行分析後確定一理解結果,判斷該理解結果為不恰當的理解結果時,確定一或多個導致該理解結果為不恰當的理解結果的一或多個詞彙(即代指詞彙)及其臨時理解結果並存儲於一新建或更新臨時語料庫41,並確定一新的理解結果,同時,根據新的理解結果以及基礎語料庫11和臨時語料庫41確定用於回應用戶的該文本資訊的一回復資訊,從而更準確的理解用戶的自然語言,提高了人機會話的效率。
本技術領域的普通技術人員應當認識到,以上的實施方式僅是用來說明本發明,而並非用作為對本發明的限定,只要在本發明的實質精神範圍之內,對以上實施例所作的適當改變和變化都落在本發明要求保護的範圍之內。
100...電子設備
10...存儲單元
11...基礎語料庫
41...臨時語料庫
20...輸入單元
30...處理單元
31...語音文字轉換模組
32...語言分析模組
33...判斷模組
34...智慧會話模組
40...暫存器
50...顯示單元
60...語音輸出單元
圖1為本發明一實施方式的電子設備的功能模組圖。
圖2為本發明中電子設備的自然語言分析方法的步驟流程圖。
100...電子設備
10...存儲單元
11...基礎語料庫
41...臨時語料庫
20...輸入單元
30...處理單元
31...語音文字轉換模組
32...語言分析模組
33...判斷模組
34...智慧會話模組
40...暫存器
50...顯示單元
60...語音輸出單元

Claims (10)

  1. 一種自然語言分析方法,用於包括存儲有基礎語料庫的電子設備,其改良在於,該基礎語料庫記錄了多個詞彙以及每一詞彙的使用頻率,該電子設備還存儲有記錄了至少一代指詞彙及其臨時理解結果的一一對應關係的臨時語料庫,該方法包括如下步驟:
    接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號;
    將該用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊;
    將該文本資訊切分為包括多個詞彙的多種詞彙切分結果,並在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果;
    從該基礎語料庫中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果;
    根據上下文理解法對用戶的一預設時段內的文本資訊進行分析,判斷該第一理解結果是否為一恰當的理解結果;
    當該第一理解結果不是恰當的理解結果時,確定導致該第一理解結果為不恰當的理解結果的一或多個代指詞彙,並將該一或多個代指詞彙與存儲在該臨時語料庫中的詞彙進行對比,判斷臨時語料庫中是否記錄了該一或多個代指詞彙;
    當該臨時語料庫中未記錄該一或多個代指詞彙時,根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫中;及
    根據該第二理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
  2. 如申請專利範圍第1項所述之方法,其中,還包括:
    將該回復資訊轉換為自然語言的文本資訊和/或語音訊號;及
    顯示該轉換後的文本資訊和/或播放該語音訊號。
  3. 如申請專利範圍第1或2項所述之方法,其中,還包括:新建一臨時語料庫,並將所確定的一或多個代指詞彙及其臨時理解結果一一對應後存儲於該新建的臨時語料庫中。
  4. 如申請專利範圍第1或2項所述之方法,其中,還包括:
    當該第一理解結果為不恰當的理解結果,且該臨時語料庫中記錄了該一或多個代指詞彙時,從臨時語料庫中獲取該一或多個代指詞彙所對應的臨時理解結果,並據此確定對該文本資訊的第三理解結果;及
    根據該第三理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
  5. 如申請專利範圍第1或2項所述之方法,其中,還包括:
    判斷當前會話是否已結束;及
    當當前會話已結束時,刪除該臨時語料庫。
  6. 一種電子設備,包括存儲有基礎語料庫的存儲單元和輸入單元,該基礎語料庫記錄了多個詞彙以及每一詞彙的使用頻率,該輸入單元用於接收用戶的語音和/或文字輸入,將接收的語音和/或文字輸入轉換為電訊號,其改良在於,該存儲單元還存儲了一臨時語料庫,該臨時語料庫記錄了至少一代指詞彙及其臨時理解結果的一一對應關係,該電子設備還包括:
    一語言文字轉換模組,用於將該用戶的語音訊號和/或文字輸入訊號轉換為一預設的語言的文本資訊;
    一語言分析模組,用於將該文本資訊切分為包括多個詞彙的多種詞彙切分結果,並在該多種詞彙切分結果的基礎上,根據句式構造規則將該文本資訊進行語句成分劃分,得到多種語句劃分結果;以及從該基礎語料庫中獲取切分後的每一詞彙的使用頻率,並在獲取的每一詞彙的使用頻率的基礎上,根據各種詞彙切分結果以及語句劃分結果綜合分析並得到一第一理解結果;
    一判斷模組,用於根據上下文理解法對用戶的一預設時段內的文本資訊進行分析,判斷該第一理解結果是否為一恰當的理解結果,以及當該第一理解結果不是恰當的理解結果時,確定導致該第一理解結果為不恰當的理解結果的一或多個代指詞彙,並將該一或多個代指詞彙與存儲在該臨時語料庫中的詞彙進行對比,判斷臨時語料庫中是否記錄了該一或多個代指詞彙;
    該語言分析模組,還用於當該臨時語料庫中未記錄該一或多個代指詞彙時,根據上下文分析確定該一或多個代指詞彙的臨時理解結果以及對該文本資訊的第二理解結果,並將該一或多個代指詞彙及其臨時理解結果一一對應存儲於臨時語料庫中;及
    一智慧會話模組,用於根據該第二理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
  7. 如申請專利範圍第6項所述之電子設備,其中,該語言文字轉換模組還用於將該回復資訊轉換為自然語言的文本資訊和/或語音訊號;及
    還包括用於顯示該轉換後的文本資訊的顯示單元和/或播放該語音訊號的語音輸出單元。
  8. 如申請專利範圍第6或7項所述之電子設備,其中:該判斷模組還用於新建一臨時語料庫,並將所確定的一或多個代指詞彙及其臨時理解結果一一對應後存儲於該新建的臨時語料庫中。
  9. 如申請專利範圍第6或7項所述之電子設備,其中:該語言分析模組還用於當該第一理解結果為不恰當的理解結果且該臨時語料庫中記錄了該一或多個代指詞彙時,從臨時語料庫中獲取該一或多個代指詞彙所對應的臨時理解結果,並據此確定對該文本資訊的第三理解結果;及
    該智慧會話模組還用於根據該第三理解結果以及基礎語料庫和臨時語料庫確定用於回應用戶的該文本資訊的一回復資訊。
  10. 如申請專利範圍第6或7項所述之電子設備,其中,該判斷單元還用於:判斷當前會話是否已結束;及當判斷當前會話已結束時,刪除該臨時語料庫。
TW101100863A 2011-12-30 2012-01-09 電子設備及其自然語言分析方法 TWI509432B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110451460.2A CN103186523B (zh) 2011-12-30 2011-12-30 电子设备及其自然语言分析方法

Publications (2)

Publication Number Publication Date
TW201327214A true TW201327214A (zh) 2013-07-01
TWI509432B TWI509432B (zh) 2015-11-21

Family

ID=48677694

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101100863A TWI509432B (zh) 2011-12-30 2012-01-09 電子設備及其自然語言分析方法

Country Status (3)

Country Link
US (1) US9026430B2 (zh)
CN (1) CN103186523B (zh)
TW (1) TWI509432B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI562000B (en) * 2015-12-09 2016-12-11 Ind Tech Res Inst Internet question answering system and method, and computer readable recording media

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160162576A1 (en) * 2014-12-05 2016-06-09 Lightning Source Inc. Automated content classification/filtering
US10467598B2 (en) 2015-04-30 2019-11-05 Samsung Electronics Co., Ltd. Apparatus and method for automatically converting note to action reminders
KR102397791B1 (ko) * 2015-04-30 2022-05-13 삼성전자주식회사 메모를 자동적으로 동작 리마인더로 변환하기 위한 장치 및 방법
US10606952B2 (en) * 2016-06-24 2020-03-31 Elemental Cognition Llc Architecture and processes for computer learning and understanding
CN106710592B (zh) * 2016-12-29 2021-05-18 北京奇虎科技有限公司 一种智能硬件设备中的语音识别纠错方法和装置
CN110489517B (zh) * 2018-05-09 2023-10-31 鼎捷软件股份有限公司 虚拟助理的自动学习方法及系统
CN112185351B (zh) * 2019-07-05 2024-05-24 北京猎户星空科技有限公司 语音信号处理方法、装置、电子设备及存储介质
US11829716B2 (en) 2019-09-06 2023-11-28 International Business Machines Corporation Suggestion of an output candidate

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003457B2 (en) * 2002-10-29 2006-02-21 Nokia Corporation Method and system for text editing in hand-held electronic device
CN1219266C (zh) * 2003-05-23 2005-09-14 郑方 一种实现多路对话的人-机汉语口语对话系统的方法
JP5082374B2 (ja) * 2006-10-19 2012-11-28 富士通株式会社 フレーズアラインメントプログラム、翻訳プログラム、フレーズアラインメント装置およびフレーズアラインメント方法
US7788099B2 (en) * 2007-04-09 2010-08-31 International Business Machines Corporation Method and apparatus for query expansion based on multimodal cross-vocabulary mapping
US8224087B2 (en) * 2007-07-16 2012-07-17 Michael Bronstein Method and apparatus for video digest generation
US8874443B2 (en) * 2008-08-27 2014-10-28 Robert Bosch Gmbh System and method for generating natural language phrases from user utterances in dialog systems
CN101645064B (zh) * 2008-12-16 2011-04-06 中国科学院声学研究所 一种浅层自然口语理解系统及方法
US9213687B2 (en) * 2009-03-23 2015-12-15 Lawrence Au Compassion, variety and cohesion for methods of text analytics, writing, search, user interfaces
JP5697860B2 (ja) * 2009-09-09 2015-04-08 クラリオン株式会社 情報検索装置,情報検索方法及びナビゲーションシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI562000B (en) * 2015-12-09 2016-12-11 Ind Tech Res Inst Internet question answering system and method, and computer readable recording media
US10713313B2 (en) 2015-12-09 2020-07-14 Industrial Technology Research Institute Internet question answering system and method, and computer readable recording media

Also Published As

Publication number Publication date
CN103186523B (zh) 2017-05-10
US20130173252A1 (en) 2013-07-04
TWI509432B (zh) 2015-11-21
CN103186523A (zh) 2013-07-03
US9026430B2 (en) 2015-05-05

Similar Documents

Publication Publication Date Title
TWI509432B (zh) 電子設備及其自然語言分析方法
RU2699399C2 (ru) Система и способ обнаружения орфанных высказываний
CN110457457B (zh) 对话生成模型的训练方法、对话生成方法及装置
CN112309365A (zh) 语音合成模型的训练方法、装置、存储介质以及电子设备
CN107437417B (zh) 基于循环神经网络语音识别中语音数据增强方法及装置
TWI512503B (zh) 電子設備及其自然語言分析方法
CN104142909A (zh) 一种汉字注音方法及装置
TW201606750A (zh) 使用外國字文法的語音辨識
CN109616096A (zh) 多语种语音解码图的构建方法、装置、服务器和介质
CN103956167A (zh) 一种基于Web的可视化手语翻译方法及设备
WO2021051514A1 (zh) 一种语音识别方法、装置、计算机设备及非易失性存储介质
CN102314778A (zh) 电子阅读器
JP7372402B2 (ja) 音声合成方法、装置、電子機器及び記憶媒体
CN113851106B (zh) 音频播放方法、装置、电子设备和可读存储介质
CN112669842A (zh) 人机对话控制方法、装置、计算机设备及存储介质
CN110517668A (zh) 一种中英文混合语音识别系统及方法
CN113838451B (zh) 语音处理及模型训练方法、装置、设备和存储介质
CN110245334B (zh) 用于输出信息的方法和装置
CN115620726A (zh) 语音文本生成方法、语音文本生成模型的训练方法、装置
CN115482823A (zh) 基于自动语音识别的音频处理方法及其装置
CN114360535B (zh) 语音对话的生成方法、装置、电子设备及存储介质
CN112951274A (zh) 语音相似度确定方法及设备、程序产品
CN112860995A (zh) 交互方法、装置、客户端、服务器以及存储介质
CN108268443A (zh) 确定话题点转移以及获取回复文本的方法、装置
CN113742517B (zh) 语音包的生成方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees