RU2018144177A - Способ и система генерирования признака для ранжирования документа - Google Patents
Способ и система генерирования признака для ранжирования документа Download PDFInfo
- Publication number
- RU2018144177A RU2018144177A RU2018144177A RU2018144177A RU2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A
- Authority
- RU
- Russia
- Prior art keywords
- past
- request
- document
- documents
- query
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Claims (101)
1. Реализуемый компьютером способ ранжирования по меньшей мере одного документа в ответ на запрос с использованием алгоритма машинного обучения (MLA), исполняемого сервером, при этом способ исполняется сервером, причем сервер подключен к базе данных журнала поиска, сервер подключен к электронному устройству по сети связи, причем способ содержит:
прием сервером упомянутого запроса;
генерирование сервером набора документов, релевантных упомянутому запросу, причем набор документов имеет множество признаков;
выбор сервером по меньшей мере одного документа из набора документов, причем по меньшей мере один документ не имеет соответствующего значения для некоторого признака из множества признаков;
извлечение из базы данных журнала поиска набора прошлых запросов, которые были обеспечены на сервер, причем каждый прошлый запрос из набора прошлых запросов представлял по меньшей мере один документ в качестве соответствующего результата поиска на соответствующей странице результатов поиска (SERP);
извлечение из базы данных журнала поиска для каждого соответствующего прошлого запроса, соответствующего значения упомянутого признака для по меньшей мере одного документа;
определение сервером соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов;
генерирование сервером соответствующего значения упомянутого признака для по меньшей мере одного документа, основываясь, по меньшей мере частично, на:
соответствующем параметре сходства по меньшей мере одного прошлого запроса из набора прошлых запросов, и
соответствующем значении для упомянутого признака по меньшей мере одного прошлого запроса из набора прошлых запросов;
ранжирование, посредством алгоритма машинного обучения, набора документов для получения ранжированного списка документов, причем ранжирование основано на множестве признаков, по меньшей мере один документ ранжируется на основе, по меньшей мере частично, соответствующего значения упомянутого признака; и
передачу на электронное устройство ранжированного списка документов, подлежащего представлению в качестве страницы результатов поиска.
2. Способ по п. 1, в котором
каждый соответствующий документ из набора документов, релевантных упомянутому запросу, имеет соответствующую аннотацию, причем соответствующая аннотация включает в себя:
по меньшей мере один соответствующий прошлый поисковый запрос, использованный для доступа к соответствующему документу на сервере поисковой системы; и в котором
извлечение набора прошлых запросов основано на соответствующей аннотации по меньшей мере одного документа.
3. Способ по п. 1, в котором
способ дополнительно содержит, до определения соответствующего параметра сходства:
извлечение из базы данных журнала поиска соответствующего набора прошлых документов для каждого соответствующего прошлого запроса из набора прошлых запросов, причем соответствующий набор прошлых документов был представлен в качестве соответствующих результатов поиска в ответ на соответствующий прошлый запрос; и при этом
определение соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов основано на:
наборе документов, релевантных упомянутому запросу, и
соответствующем наборе документов соответствующего прошлого запроса.
4. Способ по п. 3, в котором
по меньшей мере подмножество набора документов связано с соответствующими параметрами пользовательских взаимодействий; и в котором
каждый соответствующий документ из соответствующего набора прошлых документов для каждого соответствующего запроса связан с соответствующими параметрами прошлых пользовательских взаимодействий; и в котором
определение соответствующего параметра сходства дополнительно основано на:
соответствующих параметрах пользовательских взаимодействий для соответствующего запроса подмножества документов и
соответствующих параметрах пользовательских взаимодействий для соответствующего набора прошлых документов.
5. Способ по п. 1, в котором
сервер исполняет второй алгоритм машинного обучения, причем второй алгоритм машинного обучения был обучен для определения параметра сходства между запросами на основе их текстового содержимого; и
определение соответствующего параметра сходства исполняется вторым алгоритмом машинного обучения.
6. Способ по п. 5, при этом способ дополнительно содержит,
во время фазы обучения:
извлечение из базы данных журнала поиска множества поисковых запросов, обеспеченных на сервер поисковой системы, причем каждый из множества поисковых запросов связан с соответствующим набором результатов поиска, каждый соответствующий результат поиска из соответствующего набора результатов поиска связан с по меньшей мере одним соответствующим параметром пользовательского взаимодействия;
генерирование, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса, основанного на по меньшей мере одном соответствующем параметре пользовательского взаимодействия, связанном с каждым результатом поиска из соответствующего набора результатов поиска;
генерирование, для каждой возможной пары запросов в пределах множества поисковых запросов, на основе соответствующих векторов запросов для каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает степень сходства между запросами в паре запросов;
генерирования набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание соответствующей одной из каждой возможной пары запросов и соответствующего параметра сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов на основе текстового содержимого каждой новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не был включен в набор обучающих объектов.
7. Способ по п. 1, при этом способ дополнительно содержит до генерирования соответствующего значения упомянутого признака:
выбор сервером по меньшей мере одного соответствующего прошлого запроса на основе того, что соответствующий параметр сходства превышает предопределенный порог.
8. Способ по п. 1, в котором
извлечение соответствующего значения упомянутого признака по меньшей мере одного документа для каждого соответствующего прошлого запроса дополнительно содержит:
извлечение соответствующего показателя релевантности по меньшей мере одного документа соответствующему прошлому запросу; и в котором
генерирование соответствующего значения упомянутого признака дополнительно основано на соответствующем показателе релевантности.
9. Способ по п. 8, в котором генерирование соответствующего значения упомянутого признака для по меньшей мере одного документа дополнительно основано на:
соответствующем значении по меньшей мере одного другого признака из множества признаков для данного документа.
10. Способ по п. 9, в котором данный признак является одним из:
зависящего от запроса признака, и
параметра пользовательского взаимодействия.
11. Система ранжирования по меньшей мере одного документа в ответ на запрос с использованием алгоритма машинного обучения (MLA), исполняемого системой, при этом система подключена к базе данных журнала поиска, система подключена к электронному устройству, причем система содержит:
процессор;
долговременный считываемый компьютером носитель, содержащий инструкции;
причем процессор, при исполнении инструкций, сконфигурирован с возможностью:
приема упомянутого запроса;
генерирования набора документов, релевантных упомянутому запросу, причем набор документов имеет множество признаков;
выбора по меньшей мере одного документа из набора документов, причем упомянутый по меньшей мере один документ не имеет соответствующего значения для признака из множества признаков;
извлечения из базы данных журнала поиска набора прошлых запросов, которые были обеспечены на сервер, причем каждый прошлый запрос из набора прошлых запросов представлял по меньшей мере один документ в качестве соответствующего результата поиска на соответствующей странице результатов поиска (SERP);
извлечения из базы данных журнала поиска для каждого соответствующего прошлого запроса, соответствующего значения упомянутого признака для по меньшей мере одного документа;
определения соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов;
генерирования соответствующего значения упомянутого признака для по меньшей мере одного документа, основываясь, по меньшей мере частично, на:
соответствующем параметре сходства по меньшей мере одного прошлого запроса из набора прошлых запросов, и
соответствующем значении для упомянутого признака по меньшей мере одного прошлого запроса из набора прошлых запросов;
ранжирования, посредством алгоритма машинного обучения, набора документов для получения ранжированного списка документов, причем ранжирование основано на множестве признаков, по меньшей мере один документ ранжируется на основе, по меньшей мере частично, соответствующего значения упомянутого признака; и
передачи на электронное устройство ранжированного списка документов, подлежащего представлению в качестве страницы результатов поиска.
12. Система по п. 11, в которой
каждый соответствующий документ из набора документов, релевантных упомянутому запросу, имеет соответствующую аннотацию, причем соответствующая аннотация включает в себя:
по меньшей мере один соответствующий прошлый поисковый запрос, использованный для доступа к соответствующему документу на сервере поисковой системы; и
в которой извлечение набора прошлых запросов основано на соответствующей аннотации по меньшей мере одного документа.
13. Система по п. 11, в которой
процессор дополнительно сконфигурирован с возможностью, до определения соответствующего параметра сходства:
извлечения из базы данных журнала поиска соответствующего набора прошлых документов для каждого соответствующего прошлого запроса из набора прошлых запросов, причем соответствующий набор прошлых документов был представлен в качестве соответствующих результатов поиска в ответ на соответствующий прошлый запрос; и в которой
определение соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов основано на:
наборе документов, релевантных упомянутому запросу, и
соответствующем наборе документов соответствующего прошлого запроса.
14. Система по п. 13, в которой
по меньшей мере подмножество набора документов связано с соответствующими параметрами пользовательских взаимодействий; и в которой
каждый соответствующий документ из соответствующего набора прошлых документов для каждого соответствующего запроса связан с соответствующими параметрами прошлых пользовательских взаимодействий; и в которой
определение соответствующего параметра сходства дополнительно основано на:
соответствующих параметрах пользовательских взаимодействий для соответствующего запроса подмножества документов и
соответствующих параметрах пользовательских взаимодействий для соответствующего набора прошлых документов.
15. Система по п. 11, в которой
система исполняет второй алгоритм машинного обучения, причем второй алгоритм машинного обучения был обучен для определения параметра сходства между запросами на основе их текстового содержимого; и
определение соответствующего параметра сходства исполняется вторым алгоритмом машинного обучения.
16. Система по п. 15, в которой процессор дополнительно сконфигурирован с возможностью,
во время фазы обучения:
извлечения из базы данных журнала поиска множества поисковых запросов, обеспеченных на сервер поисковой системы, причем каждый из множества поисковых запросов связан с соответствующим набором результатов поиска, каждый соответствующий результат поиска из соответствующего набора результатов поиска связан с по меньшей мере одним соответствующим параметром пользовательского взаимодействия;
генерирования, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса, основанного на по меньшей мере одном соответствующем параметре пользовательского взаимодействия, связанном с каждым результатом поиска из соответствующего набора результатов поиска;
генерирования, для каждой возможной пары запросов в пределах множества поисковых запросов, на основе соответствующих векторов запросов для каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает степень сходства между запросами в паре запросов;
генерирования набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание соответствующей одной из каждой возможной пары запросов и соответствующего параметра сходства;
обучения второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов на основе текстового содержимого каждой новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не был включен в набор обучающих объектов.
17. Система по п. 11, в которой процессор дополнительно сконфигурирован с возможностью, до генерирования соответствующего значения упомянутого признака:
выбора по меньшей мере одного соответствующего прошлого запроса на основе того, что соответствующий параметр сходства превышает предопределенный порог.
18. Система по п. 11, в которой
для извлечения соответствующего значения упомянутого признака по меньшей мере одного документа для каждого соответствующего прошлого запроса процессор дополнительно сконфигурирован с возможностью:
извлечения соответствующего показателя релевантности по меньшей мере одного документа соответствующему прошлому запросу; и в которой
генерирование соответствующего значения упомянутого признака дополнительно основано на соответствующем показателе релевантности.
19. Система по п. 18, в которой генерирование соответствующего значения упомянутого признака для по меньшей мере одного документа дополнительно основано на:
соответствующем значении по меньшей мере одного другого признака из множества признаков для данного документа.
20. Система по п. 19, в которой данный признак является одним из:
зависящего от запроса признака, и
параметра пользовательского взаимодействия.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2018144177A RU2733481C2 (ru) | 2018-12-13 | 2018-12-13 | Способ и система генерирования признака для ранжирования документа |
| US16/571,870 US11194878B2 (en) | 2018-12-13 | 2019-09-16 | Method of and system for generating feature for ranking document |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| RU2018144177A RU2733481C2 (ru) | 2018-12-13 | 2018-12-13 | Способ и система генерирования признака для ранжирования документа |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2018144177A true RU2018144177A (ru) | 2020-06-15 |
| RU2018144177A3 RU2018144177A3 (ru) | 2020-06-15 |
| RU2733481C2 RU2733481C2 (ru) | 2020-10-01 |
Family
ID=71072626
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2018144177A RU2733481C2 (ru) | 2018-12-13 | 2018-12-13 | Способ и система генерирования признака для ранжирования документа |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US11194878B2 (ru) |
| RU (1) | RU2733481C2 (ru) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11403303B2 (en) * | 2018-09-07 | 2022-08-02 | Beijing Bytedance Network Technology Co., Ltd. | Method and device for generating ranking model |
| JP7456137B2 (ja) * | 2019-12-05 | 2024-03-27 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| US11526544B2 (en) * | 2020-05-07 | 2022-12-13 | International Business Machines Corporation | System for object identification |
| CN113792225B (zh) * | 2021-08-25 | 2023-08-18 | 北京库睿科技有限公司 | 一种多数据类型分层排序方法和装置 |
| US12321387B2 (en) * | 2023-03-10 | 2025-06-03 | Equifax Inc. | Automatically generating search indexes for expediting searching of a computerized database |
Family Cites Families (108)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6269368B1 (en) | 1997-10-17 | 2001-07-31 | Textwise Llc | Information retrieval using dynamic evidence combination |
| US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
| US7124129B2 (en) | 1998-03-03 | 2006-10-17 | A9.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
| US6189002B1 (en) | 1998-12-14 | 2001-02-13 | Dolphin Search | Process and system for retrieval of documents using context-relevant semantic profiles |
| US8775396B2 (en) | 1999-04-15 | 2014-07-08 | Intellectual Ventures I Llc | Method and system for searching a wide area network |
| US7567958B1 (en) | 2000-04-04 | 2009-07-28 | Aol, Llc | Filtering system for providing personalized information in the absence of negative data |
| US6701311B2 (en) | 2001-02-07 | 2004-03-02 | International Business Machines Corporation | Customer self service system for resource search and selection |
| US6738764B2 (en) | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
| US7149732B2 (en) | 2001-10-12 | 2006-12-12 | Microsoft Corporation | Clustering web queries |
| US20040249808A1 (en) | 2003-06-06 | 2004-12-09 | Microsoft Corporation | Query expansion using query logs |
| US8086619B2 (en) | 2003-09-05 | 2011-12-27 | Google Inc. | System and method for providing search query refinements |
| US7505964B2 (en) * | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
| US7689585B2 (en) | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
| US8135698B2 (en) | 2004-06-25 | 2012-03-13 | International Business Machines Corporation | Techniques for representing relationships between queries |
| US7958115B2 (en) | 2004-07-29 | 2011-06-07 | Yahoo! Inc. | Search systems and methods using in-line contextual queries |
| US7716198B2 (en) * | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
| US7698270B2 (en) | 2004-12-29 | 2010-04-13 | Baynote, Inc. | Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge |
| US20060149710A1 (en) | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
| EP1875336A2 (en) | 2005-04-11 | 2008-01-09 | Textdigger, Inc. | System and method for searching for a query |
| US20070005587A1 (en) * | 2005-06-30 | 2007-01-04 | Microsoft Corporation | Relative search results based off of user interaction |
| US8832100B2 (en) | 2005-09-14 | 2014-09-09 | Millennial Media, Inc. | User transaction history influenced search results |
| US20090234711A1 (en) | 2005-09-14 | 2009-09-17 | Jorey Ramer | Aggregation of behavioral profile data using a monetization platform |
| US7620607B1 (en) | 2005-09-26 | 2009-11-17 | Quintura Inc. | System and method for using a bidirectional neural network to identify sentences for use as document annotations |
| US9552420B2 (en) * | 2005-10-04 | 2017-01-24 | Thomson Reuters Global Resources | Feature engineering and user behavior analysis |
| US7577643B2 (en) | 2006-09-29 | 2009-08-18 | Microsoft Corporation | Key phrase extraction from query logs |
| US20080109285A1 (en) | 2006-10-26 | 2008-05-08 | Mobile Content Networks, Inc. | Techniques for determining relevant advertisements in response to queries |
| US20080114750A1 (en) | 2006-11-14 | 2008-05-15 | Microsoft Corporation | Retrieval and ranking of items utilizing similarity |
| JP2008181186A (ja) | 2007-01-23 | 2008-08-07 | Yahoo Japan Corp | クエリーログを利用したキーワードとサイトの関連度を求める方法 |
| US7603348B2 (en) | 2007-01-26 | 2009-10-13 | Yahoo! Inc. | System for classifying a search query |
| US8321448B2 (en) | 2007-02-22 | 2012-11-27 | Microsoft Corporation | Click-through log mining |
| US7792813B2 (en) | 2007-08-31 | 2010-09-07 | Microsoft Corporation | Presenting result items based upon user behavior |
| US8645390B1 (en) | 2007-08-31 | 2014-02-04 | Google Inc. | Reordering search query results in accordance with search context specific predicted performance functions |
| US8655868B2 (en) | 2007-09-12 | 2014-02-18 | Ebay Inc. | Inference of query relationships based on retrieved attributes |
| US7877385B2 (en) | 2007-09-21 | 2011-01-25 | Microsoft Corporation | Information retrieval using query-document pair information |
| US7895235B2 (en) | 2007-12-19 | 2011-02-22 | Yahoo! Inc. | Extracting semantic relations from query logs |
| US8392436B2 (en) | 2008-02-07 | 2013-03-05 | Nec Laboratories America, Inc. | Semantic search via role labeling |
| US7877404B2 (en) | 2008-03-05 | 2011-01-25 | Microsoft Corporation | Query classification based on query click logs |
| US8965786B1 (en) | 2008-04-18 | 2015-02-24 | Google Inc. | User-based ad ranking |
| US20090313286A1 (en) | 2008-06-17 | 2009-12-17 | Microsoft Corporation | Generating training data from click logs |
| US7958158B2 (en) | 2008-06-19 | 2011-06-07 | International Business Machines Corporation | Aggregating database queries |
| US8239370B2 (en) | 2008-06-27 | 2012-08-07 | Microsoft Corporation | Basing search results on metadata of prior results |
| US9183323B1 (en) | 2008-06-27 | 2015-11-10 | Google Inc. | Suggesting alternative query phrases in query results |
| US20100010895A1 (en) | 2008-07-08 | 2010-01-14 | Yahoo! Inc. | Prediction of a degree of relevance between query rewrites and a search query |
| US8515950B2 (en) | 2008-10-01 | 2013-08-20 | Microsoft Corporation | Combining log-based rankers and document-based rankers for searching |
| KR20100069118A (ko) | 2008-12-16 | 2010-06-24 | 한국전자통신연구원 | 질의어 색인 데이터베이스 구축 방법과 그 질의어 색인 데이터베이스를 이용한 질의어 추천 방법 |
| US8239334B2 (en) | 2008-12-24 | 2012-08-07 | Microsoft Corporation | Learning latent semantic space for ranking |
| US8341095B2 (en) | 2009-01-12 | 2012-12-25 | Nec Laboratories America, Inc. | Supervised semantic indexing and its extensions |
| US8156129B2 (en) | 2009-01-15 | 2012-04-10 | Microsoft Corporation | Substantially similar queries |
| US20100198816A1 (en) | 2009-01-30 | 2010-08-05 | Yahoo! Inc. | System and method for presenting content representative of document search |
| US9009146B1 (en) * | 2009-04-08 | 2015-04-14 | Google Inc. | Ranking search results based on similar queries |
| US8145623B1 (en) | 2009-05-01 | 2012-03-27 | Google Inc. | Query ranking based on query clustering and categorization |
| US8606786B2 (en) | 2009-06-22 | 2013-12-10 | Microsoft Corporation | Determining a similarity measure between queries |
| US20100332493A1 (en) | 2009-06-25 | 2010-12-30 | Yahoo! Inc. | Semantic search extensions for web search engines |
| US8214363B2 (en) | 2009-07-06 | 2012-07-03 | Abhilasha Chaudhary | Recognizing domain specific entities in search queries |
| US8543668B1 (en) | 2009-11-24 | 2013-09-24 | Google Inc. | Click tracking using link styles |
| US9317613B2 (en) | 2010-04-21 | 2016-04-19 | Yahoo! Inc. | Large scale entity-specific resource classification |
| US20120143790A1 (en) | 2010-12-01 | 2012-06-07 | Microsoft Corporation | Relevance of search results determined from user clicks and post-click user behavior obtained from click logs |
| US9064007B1 (en) | 2011-01-05 | 2015-06-23 | Google Inc. | Co-click based similarity score of queries and keywords |
| US9098571B2 (en) | 2011-01-24 | 2015-08-04 | Aol Inc. | Systems and methods for analyzing and clustering search queries |
| US8612367B2 (en) | 2011-02-04 | 2013-12-17 | Microsoft Corporation | Learning similarity function for rare queries |
| US8719257B2 (en) | 2011-02-16 | 2014-05-06 | Symantec Corporation | Methods and systems for automatically generating semantic/concept searches |
| US8898156B2 (en) | 2011-03-03 | 2014-11-25 | Microsoft Corporation | Query expansion for web search |
| US20120253792A1 (en) | 2011-03-30 | 2012-10-04 | Nec Laboratories America, Inc. | Sentiment Classification Based on Supervised Latent N-Gram Analysis |
| US9507861B2 (en) | 2011-04-01 | 2016-11-29 | Microsoft Technolgy Licensing, LLC | Enhanced query rewriting through click log analysis |
| US8423547B2 (en) | 2011-04-08 | 2013-04-16 | Microsoft Corporation | Efficient query clustering using multi-partite graphs |
| US8788477B1 (en) | 2011-09-19 | 2014-07-22 | Google Inc. | Identifying addresses and titles of authoritative web pages by analyzing search queries in query logs |
| US20130110824A1 (en) | 2011-11-01 | 2013-05-02 | Microsoft Corporation | Configuring a custom search ranking model |
| US9009148B2 (en) | 2011-12-19 | 2015-04-14 | Microsoft Technology Licensing, Llc | Clickthrough-based latent semantic model |
| US8463595B1 (en) | 2012-03-06 | 2013-06-11 | Reputation.Com, Inc. | Detailed sentiment analysis |
| US8775442B2 (en) | 2012-05-15 | 2014-07-08 | Apple Inc. | Semantic search using a single-source semantic model |
| JP6299596B2 (ja) | 2012-09-28 | 2018-03-28 | 日本電気株式会社 | クエリ類似度評価システム、評価方法、及びプログラム |
| US9104733B2 (en) | 2012-11-29 | 2015-08-11 | Microsoft Technology Licensing, Llc | Web search ranking |
| US9251292B2 (en) | 2013-03-11 | 2016-02-02 | Wal-Mart Stores, Inc. | Search result ranking using query clustering |
| US9519859B2 (en) | 2013-09-06 | 2016-12-13 | Microsoft Technology Licensing, Llc | Deep structured semantic model produced using click-through data |
| US9715660B2 (en) | 2013-11-04 | 2017-07-25 | Google Inc. | Transfer learning for deep neural network based hotword detection |
| US9633017B2 (en) | 2013-11-07 | 2017-04-25 | Yahoo! Inc. | Dwell-time based generation of a user interest profile |
| US9898554B2 (en) * | 2013-11-18 | 2018-02-20 | Google Inc. | Implicit question query identification |
| RU2556425C1 (ru) | 2014-02-14 | 2015-07-10 | Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") | Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители |
| US9818065B2 (en) | 2014-03-12 | 2017-11-14 | Microsoft Technology Licensing, Llc | Attribution of activity in multi-user settings |
| US9477654B2 (en) | 2014-04-01 | 2016-10-25 | Microsoft Corporation | Convolutional latent semantic models and their applications |
| US9535960B2 (en) | 2014-04-14 | 2017-01-03 | Microsoft Corporation | Context-sensitive search using a deep learning model |
| US10642845B2 (en) | 2014-05-30 | 2020-05-05 | Apple Inc. | Multi-domain search on a computing device |
| US20150356199A1 (en) | 2014-06-06 | 2015-12-10 | Microsoft Corporation | Click-through-based cross-view learning for internet searches |
| US9846836B2 (en) | 2014-06-13 | 2017-12-19 | Microsoft Technology Licensing, Llc | Modeling interestingness with deep neural networks |
| US10089580B2 (en) | 2014-08-11 | 2018-10-02 | Microsoft Technology Licensing, Llc | Generating and using a knowledge-enhanced model |
| RU2580516C2 (ru) | 2014-08-19 | 2016-04-10 | Общество С Ограниченной Ответственностью "Яндекс" | Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер |
| JP5957048B2 (ja) | 2014-08-19 | 2016-07-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム |
| RU2609079C2 (ru) * | 2015-02-27 | 2017-01-30 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и сервер обработки поискового предложения |
| US9946799B2 (en) * | 2015-04-30 | 2018-04-17 | Microsoft Technology Licensing, Llc | Federated search page construction based on machine learning |
| WO2016187705A1 (en) * | 2015-05-22 | 2016-12-01 | Coveo Solutions Inc. | System and method for ranking search results |
| US10606946B2 (en) | 2015-07-06 | 2020-03-31 | Microsoft Technology Licensing, Llc | Learning word embedding using morphological knowledge |
| US10133729B2 (en) * | 2015-08-28 | 2018-11-20 | Microsoft Technology Licensing, Llc | Semantically-relevant discovery of solutions |
| US20170060993A1 (en) | 2015-09-01 | 2017-03-02 | Skytree, Inc. | Creating a Training Data Set Based on Unlabeled Textual Data |
| US10354182B2 (en) | 2015-10-29 | 2019-07-16 | Microsoft Technology Licensing, Llc | Identifying relevant content items using a deep-structured neural network |
| US9659248B1 (en) | 2016-01-19 | 2017-05-23 | International Business Machines Corporation | Machine learning and training a computer-implemented neural network to retrieve semantically equivalent questions using hybrid in-memory representations |
| US10740678B2 (en) | 2016-03-31 | 2020-08-11 | International Business Machines Corporation | Concept hierarchies |
| RU2632143C1 (ru) | 2016-04-11 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Способ обучения модуля ранжирования с использованием обучающей выборки с зашумленными ярлыками |
| US10606847B2 (en) | 2016-05-31 | 2020-03-31 | Microsoft Technology Licensing, Llc | Generation of training data for ideal candidate search ranking model |
| CN106095983B (zh) | 2016-06-20 | 2019-11-26 | 北京百度网讯科技有限公司 | 一种基于个性化深度神经网络的相似度确定方法及装置 |
| US10762439B2 (en) | 2016-07-26 | 2020-09-01 | International Business Machines Corporation | Event clustering and classification with document embedding |
| US20180052853A1 (en) * | 2016-08-22 | 2018-02-22 | Salesforce.Com, Inc. | Adjusting feature weights for ranking entity based search results |
| RU2637998C1 (ru) | 2016-09-12 | 2017-12-08 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система создания краткого изложения цифрового контента |
| US20180121550A1 (en) | 2016-10-28 | 2018-05-03 | Facebook, Inc. | Ranking Search Results Based on Lookalike Users on Online Social Networks |
| US9767182B1 (en) | 2016-10-28 | 2017-09-19 | Searchmetrics Gmbh | Classification of search queries |
| RU2643466C1 (ru) | 2017-04-14 | 2018-02-01 | Алексей Валентинович Воронин | Способ и система формирования результатов поисковой выдачи |
| US10915524B1 (en) | 2017-06-27 | 2021-02-09 | Amazon Technologies, Inc. | Scalable distributed data processing and indexing |
| US20190205472A1 (en) * | 2017-12-28 | 2019-07-04 | Salesforce.Com, Inc. | Ranking Entity Based Search Results Based on Implicit User Interactions |
| US11126630B2 (en) * | 2018-05-07 | 2021-09-21 | Salesforce.Com, Inc. | Ranking partial search query results based on implicit user interactions |
-
2018
- 2018-12-13 RU RU2018144177A patent/RU2733481C2/ru active
-
2019
- 2019-09-16 US US16/571,870 patent/US11194878B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US11194878B2 (en) | 2021-12-07 |
| RU2733481C2 (ru) | 2020-10-01 |
| US20200192961A1 (en) | 2020-06-18 |
| RU2018144177A3 (ru) | 2020-06-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12499151B2 (en) | Embedding based retrieval for image search | |
| RU2018132848A (ru) | Способ и система для расширения поисковых запросов с целью ранжирования результатов поиска | |
| RU2018144177A (ru) | Способ и система генерирования признака для ранжирования документа | |
| US8429173B1 (en) | Method, system, and computer readable medium for identifying result images based on an image query | |
| US8185526B2 (en) | Dynamic keyword suggestion and image-search re-ranking | |
| RU2671047C2 (ru) | Понимание таблиц для поиска | |
| US9081861B2 (en) | Uniform resource locator canonicalization | |
| US10108699B2 (en) | Adaptive query suggestion | |
| US8332426B2 (en) | Indentifying referring expressions for concepts | |
| US9342601B1 (en) | Query formulation and search in the context of a displayed document | |
| CN104050235B (zh) | 基于集合选择的分布式信息检索方法 | |
| RU2018122689A (ru) | Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения | |
| KR101220557B1 (ko) | 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템 | |
| US20160085860A1 (en) | Search engine for textual content and non-textual content | |
| US20200201915A1 (en) | Ranking image search results using machine learning models | |
| US20200159765A1 (en) | Performing image search using content labels | |
| US20180210897A1 (en) | Model generation method, word weighting method, device, apparatus, and computer storage medium | |
| US11379527B2 (en) | Sibling search queries | |
| CN104636407B (zh) | 参数取值训练及搜索请求处理方法和装置 | |
| RU2017146890A (ru) | Способ и система создания векторов аннотации для документа | |
| CN107220307A (zh) | 网页搜索方法和装置 | |
| US9251136B2 (en) | Document tagging and retrieval using entity specifiers | |
| US8868591B1 (en) | Modifying a user query to improve the results | |
| KR20140091375A (ko) | 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법 | |
| CN119692469B (zh) | 答复文本生成方法和装置、存储介质及程序产品 |