TWI712899B - 資訊查詢方法及裝置 - Google Patents
資訊查詢方法及裝置 Download PDFInfo
- Publication number
- TWI712899B TWI712899B TW105106907A TW105106907A TWI712899B TW I712899 B TWI712899 B TW I712899B TW 105106907 A TW105106907 A TW 105106907A TW 105106907 A TW105106907 A TW 105106907A TW I712899 B TWI712899 B TW I712899B
- Authority
- TW
- Taiwan
- Prior art keywords
- query
- information
- index
- feature information
- language
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3337—Translation of the query language, e.g. Chinese to English
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本申請案實施例公開了一種資訊查詢方法及裝置,所述方法包括:接收使用者輸入的查詢參數,所述查詢參數包括關鍵字資訊及一個或多個語種特徵資訊;根據所述關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串;根據預先建立的第一索引確定所述一個或多個語種特徵資訊在第二索引中對應的位置區間;所述第一索引包括語種特徵資訊與所述第二索引的各位置區間的映射關係;所述第二索引包括關鍵字與資訊頁面間的映射關係;根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取所述一個或多個查詢請求串對應的查詢結果。本申請案實施例公開的資訊查詢方法及裝置,可以降低多語言查詢的成本。
Description
本申請案涉及網際網路資訊搜索技術領域,特別涉及一種資訊查詢方法及裝置。
網際網路的發展使得資訊變得豐富且繁多,使用者可以應用資訊查詢技術查詢自己需要獲取的資料資訊。分散式資訊查詢技術因為能夠快速為使用者查找到符合使用者意圖的資訊而被廣泛使用。
現有的分散式資訊查詢方法一般包括如下步驟:根據使用者輸入的查詢詞及其他查詢準則生成查詢請求串,電腦根據所述查詢請求串利用分散式系統中的多個查詢裝置進行查詢,得到查詢結果並返回給使用者。當使用者需要查找不同語種類別的查詢結果時,需要利用不同語種類別下的分散式系統分別進行查找,再分別將查找到的不同語種類別的查詢結果回饋給使用者。
在實現本申請案過程中,發明人發現現有技術中至少存在如下問題:現有的分散式資訊查詢方法只能處理同一種語種類別的資訊查詢,每新增一個語種類別,則需要重
新搭建一套新的查詢系統,因此,現有的資訊查詢方法及系統運用維護和開發過程非常繁雜,成本較高。
本申請案實施例的目的是提供一種資訊查詢方法及裝置,以降低多語言查詢的成本。
為解決上述技術問題,本申請案實施例提供一種資訊查詢方法及裝置是這樣實現的:一種資訊查詢方法,包括:接收使用者輸入的查詢參數,所述查詢參數包括關鍵字資訊及一個或多個語種特徵資訊;根據所述關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串;根據預先建立的第一索引確定所述一個或多個語種特徵資訊在第二索引中對應的位置區間;所述第一索引包括語種特徵資訊與所述第二索引的各位置區間的映射關係;所述第二索引包括關鍵字與資訊頁面間的映射關係;根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取所述一個或多個查詢請求串對應的查詢結果。
較佳方案中,所述語種特徵資訊用於表示需要獲得的查詢結果的目標語種類別。
較佳方案中,所述根據關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串,具體包括:根據所述查詢參數中的一個或多個語種特徵資訊確定查詢結果的一個或多個目標語種類別,翻譯所述查詢
參數中的關鍵字為分別與所述語種特徵資訊對應的一個或多個目標語種關鍵字,根據所述一個或多個目標語種關鍵字分別生成一個或多個查詢請求串。
較佳方案中,所述關鍵字資訊包括一個或多個一種語種類別的關鍵字。
較佳方案中,所述第二索引中,語種特徵資訊相同的關鍵字所對應的關鍵字與資訊頁面之間的映射關係置於第二索引的相鄰位置。
較佳方案中,所述根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間,分別獲取所述一個或多個查詢請求串對應的查詢結果,具體包括:在所述確定的語種特徵資訊在第二索引的位置區間中,獲取該位置區間內與該語種特徵資訊的查詢請求串對應的查詢結果。
較佳方案中,所述查詢參數還包括:約束條件,所述約束條件用於確定返回給使用者的第一查詢結果。
較佳方案中,所述方法還包括:根據查詢參數中的約束條件對多個語種特徵資訊的查詢請求串對應的查詢結果進行第一處理,得到目標查詢結果。
較佳方案中,所述第一處理根據所述約束條件確定,所述第一處理與所述約束條件相對應。
一種資訊查詢裝置,包括:查詢參數接收單元、查詢請求串生成單元、位置區間確定單元和查詢結果單元;其中,所述查詢參數接收單元,用於接收使用者輸入的查詢
參數,所述查詢參數包括關鍵字資訊及一個或多個語種特徵資訊;所述語種特徵資訊用於表示需要獲得的查詢結果的目標語種類別;所述關鍵字資訊包括任意一種語種類別的關鍵字;所述關鍵字資訊包括一個或多個關鍵字;所述查詢請求串生成單元,用於根據所述關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串。
所述位置區間確定單元,用於根據預先建立的第一索引確定所述一個或多個語種特徵資訊在第二索引中對應的位置區間;第一索引包括語種特徵資訊與第二索引的各位置區間的映射關係。第二索引包括關鍵字與資訊頁面之間的映射關係。
所述查詢結果單元,用於根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取所述一個或多個查詢請求串對應的查詢結果。
較佳方案中,當所述查詢參數接收單元獲取的查詢參數還包括約束條件時,所述資訊裝置還包括:第一處理單元,用於根據所述約束條件處理所述查詢結果單元中的查詢結果,得到目標查詢結果。
由以上本申請案實施例提供的技術方案可見,本申請案實施例公開的資訊查詢的方法及裝置,可以根據語種特徵資訊將關鍵字翻譯為一種或多種目標語種的關鍵字,並分別生成與語種特徵資訊對應的查詢請求串,利用第一索引中語種特徵資訊與第二索引的各位置區間的映射關係,
可以確定所述語種特徵資訊在第二索引中的位置區間,並在確定的位置區間中分別獲取與查詢請求串對應的查詢結果,從而可以實現同時查找多種語言種類的查詢結果。同時,採用本申請案的資訊查詢方法及裝置只需要輸入不同的語種特徵資訊可以靈活擴展查詢語種,降低了現有技術的多語種查詢的成本。
201‧‧‧查詢參數接收單元
202‧‧‧查詢請求串生成單元
203‧‧‧位置區間確定單元
204‧‧‧查詢結果單元
為了更清楚地說明本申請案實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請案中記載的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本申請案一種資訊查詢方法實施例的流程圖;圖2是本申請案資訊查詢裝置一個實施例的模組圖。
本申請案實施例提供一種資訊查詢方法及裝置。
為了使本技術領域的人員更好地理解本申請案中的技術方案,下面將結合本申請案實施例中的附圖,對本申請案實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請案一部分實施例,而不是全部的實施例。基於本申請案中的實施例,本領域普通技術人
員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都應當屬於本申請案保護的範圍。
圖1是本申請案一種資訊查詢方法實施例的流程圖,如圖1所示,所述資訊查詢方法可以包括:
S101:接收使用者輸入的查詢參數,所述查詢參數包括關鍵字資訊及一個或多個語種特徵資訊。
電腦可以接收使用者輸入的查詢參數。
所述查詢參數可以包括關鍵字資訊及一個或多個語種特徵資訊。
所述語種特徵資訊可以用於表示需要獲得的查詢結果的目標語種類別。例如,當語種特徵資訊為“en”時,可以表示使用者需要獲得的查詢結果包括英語查詢結果;當語種特徵為“cn”時,可以表示使用者需要獲取的查詢結果包括中文查詢結果。
所述關鍵字資訊可以包括任意一種語種類別的關鍵字。所述關鍵字資訊可以包括一個或多個關鍵字。
在另一個實施方式中,所述查詢參數還可以包括查詢約束條件,所述約束條件可以用於確定顯示的查詢結果。例如,所述約束條件可以包括:返回結果的個數和返回結果的顯示方式等。
S102:根據所述關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串。
根據所述關鍵字資訊可以生成與所述一個或多個語種特徵分別對應的一個或多個查詢請求串。具體地,可以包
括:根據所述查詢參數中的一個或多個語種特徵資訊確定查詢結果的一個或多個目標語種,翻譯所述查詢參數中的關鍵字為分別與語種特徵資訊對應的一個或多個目標語種關鍵字,根據所述一個或多個目標語種關鍵字分別生成一個或多個查詢請求串。
每一目標語種的關鍵字可以對應一個查詢請求串。
例如,使用者輸入的查詢參數中,關鍵字可以包括西班牙語的“relojes+de+bolsillo”;語種特徵資訊可以包括“EN”和“ES”,表示查詢結果的語種包括英語和西班牙語,那麼根據所述關鍵字資訊和語種特徵資訊,可以分別生成西班牙語查詢請求串和英語查詢請求串。
西班牙語關鍵字“relojes+de+bolsillo”對應的英語關鍵字為“pocket+watches”,那麼,西班牙語查詢請求串可以表示為:query='relojes+de+bolsillo'&&kvpairs=layerfield:lang,layervalue;ES,&&analyzer=specific_index_analyzer:phrase#spanish_analyzer
英語查詢請求串可以表示為:query='pocket+watches'&&kvpairs=layerfield:lang,layervalue:EN,&&analyzer=specific_index_analyzer:phrase#spanish_analyzer
上述兩個查詢請求串的區別在於,語種特徵資訊不同,即分別為西班牙語和英語。上述兩個查詢請求串的區別還在於,關鍵字不同,即兩個查詢串中的關鍵字分別為西班牙語和英語對應的關鍵字。所述關鍵字不同,用於分析關鍵字的分詞器(即analyzer)也可以不同。所述分詞器可以與語種特徵資訊相對應。
在另一個實施方式中,所述查詢參數還可以包括約束條件,所述約束條件可以用於確定返回給使用者的第一查詢結果。例如,生成前述的西班牙語查詢請求串和英語查詢請求串時,例如,所述約束條件可以包括:返回前20個查詢結果,以及查詢結果以xml的格式進行顯示。那麼,西班牙語查詢請求串可以表示為:config=start:0,hit:20,format:xml,query='relojes+de+bolsillo'&&kvpairs=layerfield:lang,layervalue:ES,&&analyzer=specific_index_analyzer:phrase#spanish_analyzer
英語查詢請求串可以表示為:config=start:0,hit:20,format:xml,query='pocket+watches'&&kvpairs=layerfield:lang,layervalue:EN,&&analyzer=specific_index_analyzer:phrase#spanish_analyzer
透過該步驟,可以生成與每一語種特徵資訊對應的查詢請求串。
S103:根據預先建立的第一索引確定所述一個或多個語種特徵資訊在第二索引中對應的位置區間。
第二索引可以包括關鍵字與資訊頁面之間的映射關係。所述關鍵字與資訊頁面之間的映射關係可以是一對一、一對多、多對一或者多對多的映射關係。
所述第二索引可以將語種特徵資訊相同的關鍵字所對應的關鍵字與資訊頁面之間的映射關係置於第二索引的相鄰位置,即語種特徵資訊相同的關鍵字對應的關鍵字與資訊頁面之間的映射關係位於第二索引的一個位置區間內,而不是散佈在第二索引中。
第一索引可以包括語種特徵資訊與第二索引的各位置
區間的映射關係。第一索引和第二索引可以預先建立。根據預先建立的第一索引可以確定所述一個或多個語種特徵資訊在第二索引中對應的位置區間。
當使用者輸入的查詢參數包括多個語種特徵資訊時,可以生成與多個語種特徵資訊對應的多個查詢請求串,每一語種特徵資訊對應的查詢請求串可以分別對應於第二索引中與語種特徵資訊對應的位置區間。
例如,表1示出了第一索引中語種特徵資訊與所述第二索引的各位置區間之間的映射關係。
表1中第一列表示第二索引的各位置區間,第二列表示語種特徵資訊。那麼,根據第一索引,可以得知,語種特徵資訊為英語的關鍵字與資訊頁面之間的映射關係可以位於第二索引中的位置區間:第0~99行;語種特徵資訊為西班牙語的關鍵字與資訊頁面之間的映射關係可以位於第二索引中的位置區間:第240~309行。
S104:根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取所述一個或多個查詢請
求串對應的查詢結果。
根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間,可以分別獲取所述一個或多個查詢請求串對應的查詢結果。
具體地,可以在所述確定的語種特徵資訊在第二索引的位置區間中,獲取該位置區間內與該語種特徵資訊的查詢請求串對應的查詢結果。當根據使用者輸入的查詢參數生成了與多個語種特徵資訊對應的查詢請求串時,所述查詢結果可以包括多個語種特徵資訊分別對應的查詢結果。具體地,可以在第二索引中與多個語種特徵資訊分別對應的多個位置區間內分別查找語種特徵資訊的查詢請求串對應的查詢結果。
在另一個實施例中,當所述查詢參數包括約束條件時,可以根據所述查詢參數和所述查詢結果,確定目標查詢結果。具體地,根據查詢參數中的約束條件可以對多個語種特徵資訊的查詢請求串對應的查詢結果進行第一處理,得到目標查詢結果。
所述第一處理可以根據所述約束條件確定。所述第一處理與所述約束條件相對應。例如,約束條件為返回20個查詢結果,那麼第一處理可以是從所有查詢結果中篩選出20個查詢結果。
電腦可以返回所述查詢結果或目標查詢結果給使用者。
上述實施例公開的資訊查詢方法中,可以根據語種特
徵資訊將關鍵字翻譯為一種或多種目標語種的關鍵字,並分別生成與語種特徵資訊對應的查詢請求串,利用第一索引中語種特徵資訊與第二索引的各位置區間的映射關係,可以確定所述語種特徵資訊在第二索引中的位置區間,並在確定的位置區間中分別獲取與查詢請求串對應的查詢結果,從而可以實現同時查找多種語言種類的查詢結果。同時,採用本申請案的資訊查詢方法只需要輸入不同的語種特徵資訊可以靈活擴展查詢語種,降低了現有技術的多語種查詢的成本。
圖2是本申請案資訊查詢裝置一個實施例的模組圖。如圖2所示,所述資訊查詢裝置可以包括:查詢參數接收單元201、查詢請求串生成單元202、位置區間確定單元203和查詢結果單元204。其中,
所述查詢參數接收單元201,可以用於接收使用者輸入的查詢參數,所述查詢參數包括關鍵字資訊及一個或多個語種特徵資訊。所述語種特徵資訊可以用於表示需要獲得的查詢結果的目標語種類別。所述關鍵字資訊可以包括任意一種語種類別的關鍵字。所述關鍵字資訊可以包括一個或多個關鍵字。
所述查詢請求串生成單元202,可以用於根據所述關鍵字資訊生成與所述一個或多個語種特徵資訊分別對應的一個或多個查詢請求串。
所述位置區間確定單元203,可以用於根據預先建立的第一索引確定所述一個或多個語種特徵資訊在第二索引
中對應的位置區間。第一索引可以包括語種特徵資訊與第二索引的各位置區間的映射關係。第二索引可以包括關鍵字與資訊頁面之間的映射關係。
所述查詢結果單元204,可以用於根據確定的所述一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取所述一個或多個查詢請求串對應的查詢結果。
在另一個實施方式中,當所述查詢參數接收單元201獲取的查詢參數還包括約束條件時,所述查詢資訊的裝置還可以包括:第一處理單元,用於根據所述約束條件處理所述查詢結果單元204中的查詢結果,得到目標查詢結果。
上述實施例公開的資訊查詢裝置與本申請案資訊查詢方法實施例相對應,可以實現本申請案的資訊查詢方法實施例並達到方法實施例的技術效果。
在20世紀90年代,對於一個技術的改進可以很明顯地區分是硬體上的改進(例如,對二極體、電晶體、開關等電路結構的改進)還是軟體上的改進(對於方法流程的改進)。然而,隨著技術的發展,當今的很多方法流程的改進已經可以視為硬體電路結構的直接改進。設計人員幾乎都透過將改進的方法流程程式設計到硬體電路中來得到相應的硬體電路結構。因此,不能說一個方法流程的改進就不能用硬體實體模組來實現。例如,可程式設計邏輯裝置(Programmable Logic Device,PLD)(例如現場可程式設計閘陣列(Field Programmable Gate Array,FPGA))
就是這樣一種積體電路,其邏輯功能由使用者對裝置程式設計來確定。由設計人員自行程式設計來把一個數位系統“集成”在一片PLD上,而不需要請晶片製造廠商來設計和製作專用的積體電路晶片2。而且,如今,取代手工地製作積體電路晶片,這種程式設計也多半改用“邏輯編譯器(logic compiler)”軟體來實現,它與程式開發撰寫時所用的軟體編譯器相類似,而要編譯之前的原始代碼也得用特定的程式設計語言來撰寫,此稱之為硬體描述語言(Hardware Description Language,HDL),而HDL也並非僅有一種,而是有許多種,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)與Verilog2。本領域技術人員也應該清楚,只需要將方法流程用上述幾種硬體描述語言稍作邏輯程式設計並程式設計到積體電路中,就可以很容易得到實現該邏輯方法流程的硬體電路。
控制器可以按任何適當的方式實現,例如,控制器可以採取例如微處理器或處理器以及儲存可由該(微)處理器執行的電腦可讀程式碼(例如軟體或固件)的電腦可讀
媒體、邏輯閘、開關、專用積體電路(Application Specific Integrated Circuit,ASIC)、可程式設計邏輯控制器和嵌入微控制器的形式,控制器的例子包括但不限於以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,記憶體控制器還可以被實現為記憶體的控制邏輯的一部分。
本領域技術人員也知道,除了以純電腦可讀程式碼方式實現控制器以外,完全可以透過將方法步驟進行邏輯程式設計來使得控制器以邏輯閘、開關、專用積體電路、可程式設計邏輯控制器和嵌入微控制器等的形式來實現相同功能。因此這種控制器可以被認為是一種硬體部件,而對其內包括的用於實現各種功能的裝置也可以視為硬體部件內的結構。或者甚至,可以將用於實現各種功能的裝置視為既可以是實現方法的軟體模組又可以是硬體部件內的結構。
上述實施例闡明的系統、裝置、模組或單元,具體可以由電腦晶片或實體實現,或者由具有某種功能的產品來實現。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請案時可以把各單元的功能在同一個或多個軟體和/或硬體中實現。
透過以上的實施方式的描述可知,本領域的技術人員可以清楚地瞭解到本申請案可借助軟體加必需的通用硬體平臺的方式來實現。基於這樣的理解,本申請案的技術方
案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。該電腦軟體產品可以包括若干指令用以使得一台電腦設備(可以是個人電腦,伺服器,或者網路設備等)執行本申請案各個實施例或者實施例的某些部分所述的方法。該電腦軟體產品可以儲存在記憶體中,記憶體可能包括電腦可讀媒體中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀媒體的示例。電腦可讀媒體包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒體的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電可抹除可程式設計唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁片儲存或其他磁性存放裝置或任何其他非傳輸媒體,可用於儲存可以被計算設備訪問的資訊。按照本文中的界定,電腦可讀媒體不包括短暫電腦可讀媒體(transitory media),如調製的資料信號和載波。
本說明書中的各個實施例均採用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對於系統實施例而言,由於其基本相似於方法實施例,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
本申請案可用於眾多通用或專用的電腦系統環境或配置中。例如:個人電腦、伺服器電腦、手持設備或可擕式設備、平板型設備、多處理器系統、基於微處理器的系統、機上盒、可程式設計的消費電子設備、網路PC、小型電腦、大型電腦、包括以上任何系統或設備的分散式運算環境等等。
本申請案可以在由電腦執行的電腦可執行指令的一般上下文中描述,例如程式模組。一般地,程式模組包括執行特定任務或實現特定抽象資料類型的常式、程式、物件、元件、資料結構等等。也可以在分散式運算環境中實踐本申請案,在這些分散式運算環境中,由透過通信網路而被連接的遠端處理設備來執行任務。在分散式運算環境中,程式模組可以位於包括存放裝置在內的本地和遠端電腦儲存媒體中。
雖然透過實施例描繪了本申請案,本領域普通技術人員知道,本申請案有許多變形和變化而不脫離本申請案的精神,希望所附的申請專利範圍包括這些變形和變化而不脫離本申請案的精神。
Claims (11)
- 一種資訊查詢方法,其特徵在於,包括:接收使用者輸入的查詢參數,該查詢參數包括關鍵字資訊及一個或多個語種特徵資訊;根據該關鍵字資訊生成與該一個或多個語種特徵資訊分別對應的目標語種的一個或多個查詢請求串;根據預先建立的第一索引確定該一個或多個語種特徵資訊在第二索引中對應的位置區間;該第一索引包括語種特徵資訊與該第二索引的各位置區間的映射關係;該第二索引包括關鍵字與資訊頁面間的映射關係;根據確定的該一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取該目標語種的該一個或多個查詢請求串對應的查詢結果。
- 如申請專利範圍第1項所述的一種資訊查詢方法,其中,該語種特徵資訊用於表示需要獲得的查詢結果的目標語種類別。
- 如申請專利範圍第2項所述的一種資訊查詢方法,其中,該根據關鍵字資訊生成與該一個或多個語種特徵資訊分別對應的一個或多個查詢請求串,具體包括:根據該查詢參數中的一個或多個語種特徵資訊確定查詢結果的一個或多個目標語種類別,翻譯該查詢參數中的關鍵字為分別與該語種特徵資訊對應的一個或多個目標語種關鍵字,根據該一個或多個目標語種關鍵字分別生成一個或多個查詢請求串。
- 如申請專利範圍第2項所述的一種資訊查詢方法,其中,該關鍵字資訊包括一個或多個一種語種類別的關鍵字。
- 如申請專利範圍第1項所述的一種資訊查詢方法,其中,該第二索引中,語種特徵資訊相同的關鍵字所對應的關鍵字與資訊頁面之間的映射關係置於第二索引的相鄰位置。
- 如申請專利範圍第1項所述的一種資訊查詢方法,其中,所述根據確定的該一個或多個語種特徵資訊在第二索引中對應的位置區間,分別獲取該一個或多個查詢請求串對應的查詢結果,具體包括:在該確定的語種特徵資訊在第二索引的位置區間中,獲取該位置區間內與該語種特徵資訊的查詢請求串對應的查詢結果。
- 如申請專利範圍第1項所述的一種資訊查詢方法,其中,該查詢參數還包括:約束條件,該約束條件用於確定返回給使用者的第一查詢結果。
- 如申請專利範圍第7項所述的一種資訊查詢方法,其中,該方法還包括:根據查詢參數中的約束條件對多個語種特徵資訊的查詢請求串對應的查詢結果進行第一處理,得到目標查詢結果。
- 如申請專利範圍第8項所述的一種資訊查詢方法,其中,該第一處理根據該約束條件確定,該第一處理與該約束條件相對應。
- 一種資訊查詢裝置,其特徵在於,包括:查詢參 數接收單元、查詢請求串生成單元、位置區間確定單元和查詢結果單元;其中,該查詢參數接收單元,用於接收使用者輸入的查詢參數,該查詢參數包括關鍵字資訊及一個或多個語種特徵資訊;該語種特徵資訊用於表示需要獲得的查詢結果的目標語種類別;該關鍵字資訊包括任意一種語種類別的關鍵字;該關鍵字資訊包括一個或多個關鍵字;該查詢請求串生成單元,用於根據該關鍵字資訊生成與該一個或多個語種特徵資訊分別對應的一個或多個查詢請求串;該位置區間確定單元,用於根據預先建立的第一索引確定該一個或多個語種特徵資訊在第二索引中對應的位置區間;第一索引包括語種特徵資訊與第二索引的各位置區間的映射關係;第二索引包括關鍵字與資訊頁面之間的映射關係;該查詢結果單元,用於根據確定的該一個或多個語種特徵資訊在第二索引中對應的位置區間分別獲取該一個或多個查詢請求串對應的查詢結果。
- 如申請專利範圍第10項所述的一種資訊查詢裝置,其中,當該查詢參數接收單元獲取的查詢參數還包括約束條件時,該資訊裝置還包括:第一處理單元,用於根據該約束條件處理該查詢結果單元中的查詢結果,得到目標查詢結果。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510450235.5 | 2015-07-28 | ||
| CN201510450235 | 2015-07-28 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201706881A TW201706881A (zh) | 2017-02-16 |
| TWI712899B true TWI712899B (zh) | 2020-12-11 |
Family
ID=57882812
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW105106907A TWI712899B (zh) | 2015-07-28 | 2016-03-07 | 資訊查詢方法及裝置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US10467266B2 (zh) |
| EP (1) | EP3329388A4 (zh) |
| JP (1) | JP2018531440A (zh) |
| CN (1) | CN106407250B (zh) |
| TW (1) | TWI712899B (zh) |
| WO (1) | WO2017019710A1 (zh) |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107895037B (zh) * | 2017-11-28 | 2022-05-03 | 北京百度网讯科技有限公司 | 一种问答数据处理方法、装置、设备和计算机可读介质 |
| CN108717432B (zh) * | 2018-05-11 | 2022-02-18 | 腾讯科技(深圳)有限公司 | 资源查询方法及装置 |
| CN108984763B (zh) * | 2018-07-20 | 2021-10-01 | 深圳脉企大数据科技有限公司 | 查询方法、客户端、服务器以及计算机可读介质 |
| CN111767365A (zh) * | 2019-03-12 | 2020-10-13 | 株式会社理光 | 文档检索设备及方法 |
| CN110083627B (zh) * | 2019-04-28 | 2021-08-24 | 江苏满运软件科技有限公司 | 数据处理方法、系统、计算机设备和存储介质 |
| CN110134867A (zh) * | 2019-04-30 | 2019-08-16 | 麦格创科技(深圳)有限公司 | 企业信息查询方法及相关产品 |
| CN110245137B (zh) * | 2019-05-07 | 2023-06-27 | 创新先进技术有限公司 | 一种索引的处理方法、装置及设备 |
| CN110222074A (zh) * | 2019-06-14 | 2019-09-10 | 北京金山云网络技术有限公司 | 索引查找方法、查找装置、电子设备及存储介质 |
| CN116304226A (zh) * | 2019-06-20 | 2023-06-23 | 创新先进技术有限公司 | 一种信息查询方法、装置、设备及介质 |
| CN110851543A (zh) * | 2019-11-08 | 2020-02-28 | 深圳市彬讯科技有限公司 | 一种数据建模的方法、装置、设备以及存储介质 |
| CN111274453A (zh) * | 2020-01-14 | 2020-06-12 | 北京市商汤科技开发有限公司 | 数据运行方法、系统、电子设备以及计算机可读存储介质 |
| CN111581236A (zh) * | 2020-04-02 | 2020-08-25 | 中国邮政储蓄银行股份有限公司 | 数据查询方法和装置 |
| CN111488371A (zh) * | 2020-04-07 | 2020-08-04 | 中国人民财产保险股份有限公司 | 一种数据查询方法和装置 |
| CN112069175B (zh) * | 2020-08-25 | 2024-03-29 | 北京五八信息技术有限公司 | 数据查询的方法、装置及电子设备 |
| US11641665B2 (en) | 2020-09-09 | 2023-05-02 | Self Financial, Inc. | Resource utilization retrieval and modification |
| US20220075877A1 (en) | 2020-09-09 | 2022-03-10 | Self Financial, Inc. | Interface and system for updating isolated repositories |
| US11470037B2 (en) | 2020-09-09 | 2022-10-11 | Self Financial, Inc. | Navigation pathway generation |
| US11475010B2 (en) * | 2020-09-09 | 2022-10-18 | Self Financial, Inc. | Asynchronous database caching |
| CN112529217B (zh) * | 2020-12-04 | 2023-09-08 | 广东电网有限责任公司 | 电力设备信息查询方法、系统、装置、设备及存储介质 |
| CN112883082B (zh) * | 2021-02-24 | 2023-04-14 | 浪潮通用软件有限公司 | 一种查询动态列的实现方法、装置及设备 |
| CN113076456B (zh) * | 2021-03-25 | 2025-04-08 | 咪咕文化科技有限公司 | 一种数据搜索处理方法、装置、电子设备和存储介质 |
| CN113220706A (zh) * | 2021-04-07 | 2021-08-06 | 深圳市猎芯科技有限公司 | 元器件产品查询方法、装置、设备和介质 |
| CN113505303A (zh) * | 2021-07-28 | 2021-10-15 | 云账户技术(天津)有限公司 | 一种合同信息查询的方法及装置 |
| CN113821573B (zh) * | 2021-08-27 | 2024-09-20 | 济南浪潮数据技术有限公司 | 海量数据快速检索服务构建方法、系统、终端及存储介质 |
| CN116521713B (zh) * | 2023-06-30 | 2023-09-12 | 北京奥星贝斯科技有限公司 | 一种数据查询的方法、装置、设备及存储介质 |
| CN119226296B (zh) * | 2024-11-29 | 2025-05-13 | 之江实验室 | 一种天体数据索引构建方法、装置、存储介质及电子设备 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100005081A1 (en) * | 1999-11-12 | 2010-01-07 | Bennett Ian M | Systems for natural language processing of sentence based queries |
| CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
| CN103729386A (zh) * | 2012-10-16 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 信息查询系统与方法 |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5301109A (en) | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
| EP0856175A4 (en) | 1995-08-16 | 2000-05-24 | Univ Syracuse | SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON |
| US7146358B1 (en) | 2001-08-28 | 2006-12-05 | Google Inc. | Systems and methods for using anchor text as parallel corpora for cross-language information retrieval |
| US7260570B2 (en) | 2002-02-01 | 2007-08-21 | International Business Machines Corporation | Retrieving matching documents by queries in any national language |
| JP4458832B2 (ja) * | 2003-12-05 | 2010-04-28 | キヤノン株式会社 | 番組抽出装置およびその制御方法 |
| US20060106769A1 (en) * | 2004-11-12 | 2006-05-18 | Gibbs Kevin A | Method and system for autocompletion for languages having ideographs and phonetic characters |
| US20070022134A1 (en) | 2005-07-22 | 2007-01-25 | Microsoft Corporation | Cross-language related keyword suggestion |
| EP1975860A4 (en) * | 2006-01-13 | 2011-05-04 | Jfe Steel Corp | DEVICE AND METHOD FOR CREATING A PREDICTION FORMULA |
| US8015175B2 (en) | 2007-03-16 | 2011-09-06 | John Fairweather | Language independent stemming |
| US7720856B2 (en) | 2007-04-09 | 2010-05-18 | Sap Ag | Cross-language searching |
| US8799307B2 (en) | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
| US7890493B2 (en) * | 2007-07-20 | 2011-02-15 | Google Inc. | Translating a search query into multiple languages |
| US8051061B2 (en) | 2007-07-20 | 2011-11-01 | Microsoft Corporation | Cross-lingual query suggestion |
| US20110295857A1 (en) | 2008-06-20 | 2011-12-01 | Ai Ti Aw | System and method for aligning and indexing multilingual documents |
| US8451976B2 (en) * | 2010-07-30 | 2013-05-28 | Varian Medical Systems, Inc. | Cathode assembly for an X-ray tube |
| US8862458B2 (en) * | 2010-11-30 | 2014-10-14 | Sap Ag | Natural language interface |
| US8527518B2 (en) * | 2010-12-16 | 2013-09-03 | Sap Ag | Inverted indexes with multiple language support |
| US8484218B2 (en) | 2011-04-21 | 2013-07-09 | Google Inc. | Translating keywords from a source language to a target language |
| RU2474870C1 (ru) | 2011-11-18 | 2013-02-10 | Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" | Способ автоматизированного анализа текстовых документов |
| CN103488648B (zh) | 2012-06-13 | 2018-03-20 | 阿里巴巴集团控股有限公司 | 一种多语种混合检索方法和系统 |
| US20140032441A1 (en) * | 2012-07-26 | 2014-01-30 | Sap Ag | Field Extensibility Self Healing After Incompatible Changes |
| JP2014056503A (ja) * | 2012-09-13 | 2014-03-27 | International Business Maschines Corporation | 多言語環境でのコミュニケーションに適する非テキスト要素を特定するためのコンピュータ実装方法、プログラム、および、システム |
| CN104572767B (zh) | 2013-10-25 | 2017-11-10 | 北大方正集团有限公司 | 一种站点语种分类的方法和系统 |
-
2016
- 2016-03-07 TW TW105106907A patent/TWI712899B/zh not_active IP Right Cessation
- 2016-07-26 EP EP16831251.0A patent/EP3329388A4/en not_active Ceased
- 2016-07-26 US US15/220,282 patent/US10467266B2/en active Active
- 2016-07-26 WO PCT/US2016/044113 patent/WO2017019710A1/en not_active Ceased
- 2016-07-26 JP JP2017566128A patent/JP2018531440A/ja active Pending
- 2016-07-28 CN CN201610608904.1A patent/CN106407250B/zh active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100005081A1 (en) * | 1999-11-12 | 2010-01-07 | Bennett Ian M | Systems for natural language processing of sentence based queries |
| CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
| CN103729386A (zh) * | 2012-10-16 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 信息查询系统与方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20170032024A1 (en) | 2017-02-02 |
| TW201706881A (zh) | 2017-02-16 |
| CN106407250B (zh) | 2020-02-11 |
| EP3329388A1 (en) | 2018-06-06 |
| CN106407250A (zh) | 2017-02-15 |
| WO2017019710A1 (en) | 2017-02-02 |
| US10467266B2 (en) | 2019-11-05 |
| EP3329388A4 (en) | 2018-12-19 |
| JP2018531440A (ja) | 2018-10-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI712899B (zh) | 資訊查詢方法及裝置 | |
| JP2018531440A6 (ja) | 情報照会 | |
| JP7021228B2 (ja) | ブロックチェーンベースのデータ記憶および照会方法およびデバイス | |
| TWI718375B (zh) | 基於區塊鏈的資料處理方法及設備 | |
| US10423652B2 (en) | Knowledge graph entity reconciler | |
| TWI760381B (zh) | 確定推薦物件的方法、裝置及電腦儲存媒體 | |
| US9607048B2 (en) | Generation of synthetic context frameworks for dimensionally constrained hierarchical synthetic context-based objects | |
| JP6929278B2 (ja) | タイトル表示方法及び装置 | |
| WO2016004814A1 (zh) | 一种业务可视化方法及系统 | |
| CN105868411A (zh) | 一种非关系型与关系型数据库一体化数据查询方法与系统 | |
| CN109241026B (zh) | 数据管理的方法、装置及系统 | |
| TW201627888A (zh) | 正則表達式的生成方法及系統 | |
| WO2024046015A1 (zh) | 一种数据查询方法、装置、存储介质及电子设备 | |
| CN116521705A (zh) | 一种数据查询方法、装置、存储介质及电子设备 | |
| CN107402953A (zh) | 一种页面跳转方法及装置 | |
| TW201627863A (zh) | 一種資源度量方法及裝置 | |
| US20180218065A1 (en) | Graph-modeled data processing in a relational database | |
| CN108959330A (zh) | 一种数据库的处理、数据查询方法及设备 | |
| CN105183724A (zh) | 一种翻译方法及电子设备 | |
| US9910918B2 (en) | Presenting tags of a tag cloud in a more understandable and visually appealing manner | |
| TWI723535B (zh) | 資料計算方法及引擎 | |
| CN105243057A (zh) | 一种翻译网页内容的方法及电子设备 | |
| CN105242848A (zh) | 一种对网页上文字进行翻译的方法及电子设备 | |
| CN112182146A (zh) | 一种数据查询方法 | |
| CN109614082B (zh) | 一种针对数据查询脚本的翻译方法、装置及设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM4A | Annulment or lapse of patent due to non-payment of fees |