[go: up one dir, main page]

RU2018144177A - Способ и система генерирования признака для ранжирования документа - Google Patents

Способ и система генерирования признака для ранжирования документа Download PDF

Info

Publication number
RU2018144177A
RU2018144177A RU2018144177A RU2018144177A RU2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A RU 2018144177 A RU2018144177 A RU 2018144177A
Authority
RU
Russia
Prior art keywords
past
request
document
documents
query
Prior art date
Application number
RU2018144177A
Other languages
English (en)
Other versions
RU2733481C2 (ru
RU2018144177A3 (ru
Inventor
Александр Валерьевич Сафронов
Василий Владимирович Завьялов
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2018144177A priority Critical patent/RU2733481C2/ru
Priority to US16/571,870 priority patent/US11194878B2/en
Publication of RU2018144177A publication Critical patent/RU2018144177A/ru
Publication of RU2018144177A3 publication Critical patent/RU2018144177A3/ru
Application granted granted Critical
Publication of RU2733481C2 publication Critical patent/RU2733481C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (101)

1. Реализуемый компьютером способ ранжирования по меньшей мере одного документа в ответ на запрос с использованием алгоритма машинного обучения (MLA), исполняемого сервером, при этом способ исполняется сервером, причем сервер подключен к базе данных журнала поиска, сервер подключен к электронному устройству по сети связи, причем способ содержит:
прием сервером упомянутого запроса;
генерирование сервером набора документов, релевантных упомянутому запросу, причем набор документов имеет множество признаков;
выбор сервером по меньшей мере одного документа из набора документов, причем по меньшей мере один документ не имеет соответствующего значения для некоторого признака из множества признаков;
извлечение из базы данных журнала поиска набора прошлых запросов, которые были обеспечены на сервер, причем каждый прошлый запрос из набора прошлых запросов представлял по меньшей мере один документ в качестве соответствующего результата поиска на соответствующей странице результатов поиска (SERP);
извлечение из базы данных журнала поиска для каждого соответствующего прошлого запроса, соответствующего значения упомянутого признака для по меньшей мере одного документа;
определение сервером соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов;
генерирование сервером соответствующего значения упомянутого признака для по меньшей мере одного документа, основываясь, по меньшей мере частично, на:
соответствующем параметре сходства по меньшей мере одного прошлого запроса из набора прошлых запросов, и
соответствующем значении для упомянутого признака по меньшей мере одного прошлого запроса из набора прошлых запросов;
ранжирование, посредством алгоритма машинного обучения, набора документов для получения ранжированного списка документов, причем ранжирование основано на множестве признаков, по меньшей мере один документ ранжируется на основе, по меньшей мере частично, соответствующего значения упомянутого признака; и
передачу на электронное устройство ранжированного списка документов, подлежащего представлению в качестве страницы результатов поиска.
2. Способ по п. 1, в котором
каждый соответствующий документ из набора документов, релевантных упомянутому запросу, имеет соответствующую аннотацию, причем соответствующая аннотация включает в себя:
по меньшей мере один соответствующий прошлый поисковый запрос, использованный для доступа к соответствующему документу на сервере поисковой системы; и в котором
извлечение набора прошлых запросов основано на соответствующей аннотации по меньшей мере одного документа.
3. Способ по п. 1, в котором
способ дополнительно содержит, до определения соответствующего параметра сходства:
извлечение из базы данных журнала поиска соответствующего набора прошлых документов для каждого соответствующего прошлого запроса из набора прошлых запросов, причем соответствующий набор прошлых документов был представлен в качестве соответствующих результатов поиска в ответ на соответствующий прошлый запрос; и при этом
определение соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов основано на:
наборе документов, релевантных упомянутому запросу, и
соответствующем наборе документов соответствующего прошлого запроса.
4. Способ по п. 3, в котором
по меньшей мере подмножество набора документов связано с соответствующими параметрами пользовательских взаимодействий; и в котором
каждый соответствующий документ из соответствующего набора прошлых документов для каждого соответствующего запроса связан с соответствующими параметрами прошлых пользовательских взаимодействий; и в котором
определение соответствующего параметра сходства дополнительно основано на:
соответствующих параметрах пользовательских взаимодействий для соответствующего запроса подмножества документов и
соответствующих параметрах пользовательских взаимодействий для соответствующего набора прошлых документов.
5. Способ по п. 1, в котором
сервер исполняет второй алгоритм машинного обучения, причем второй алгоритм машинного обучения был обучен для определения параметра сходства между запросами на основе их текстового содержимого; и
определение соответствующего параметра сходства исполняется вторым алгоритмом машинного обучения.
6. Способ по п. 5, при этом способ дополнительно содержит,
во время фазы обучения:
извлечение из базы данных журнала поиска множества поисковых запросов, обеспеченных на сервер поисковой системы, причем каждый из множества поисковых запросов связан с соответствующим набором результатов поиска, каждый соответствующий результат поиска из соответствующего набора результатов поиска связан с по меньшей мере одним соответствующим параметром пользовательского взаимодействия;
генерирование, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса, основанного на по меньшей мере одном соответствующем параметре пользовательского взаимодействия, связанном с каждым результатом поиска из соответствующего набора результатов поиска;
генерирование, для каждой возможной пары запросов в пределах множества поисковых запросов, на основе соответствующих векторов запросов для каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает степень сходства между запросами в паре запросов;
генерирования набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание соответствующей одной из каждой возможной пары запросов и соответствующего параметра сходства;
обучение второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов на основе текстового содержимого каждой новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не был включен в набор обучающих объектов.
7. Способ по п. 1, при этом способ дополнительно содержит до генерирования соответствующего значения упомянутого признака:
выбор сервером по меньшей мере одного соответствующего прошлого запроса на основе того, что соответствующий параметр сходства превышает предопределенный порог.
8. Способ по п. 1, в котором
извлечение соответствующего значения упомянутого признака по меньшей мере одного документа для каждого соответствующего прошлого запроса дополнительно содержит:
извлечение соответствующего показателя релевантности по меньшей мере одного документа соответствующему прошлому запросу; и в котором
генерирование соответствующего значения упомянутого признака дополнительно основано на соответствующем показателе релевантности.
9. Способ по п. 8, в котором генерирование соответствующего значения упомянутого признака для по меньшей мере одного документа дополнительно основано на:
соответствующем значении по меньшей мере одного другого признака из множества признаков для данного документа.
10. Способ по п. 9, в котором данный признак является одним из:
зависящего от запроса признака, и
параметра пользовательского взаимодействия.
11. Система ранжирования по меньшей мере одного документа в ответ на запрос с использованием алгоритма машинного обучения (MLA), исполняемого системой, при этом система подключена к базе данных журнала поиска, система подключена к электронному устройству, причем система содержит:
процессор;
долговременный считываемый компьютером носитель, содержащий инструкции;
причем процессор, при исполнении инструкций, сконфигурирован с возможностью:
приема упомянутого запроса;
генерирования набора документов, релевантных упомянутому запросу, причем набор документов имеет множество признаков;
выбора по меньшей мере одного документа из набора документов, причем упомянутый по меньшей мере один документ не имеет соответствующего значения для признака из множества признаков;
извлечения из базы данных журнала поиска набора прошлых запросов, которые были обеспечены на сервер, причем каждый прошлый запрос из набора прошлых запросов представлял по меньшей мере один документ в качестве соответствующего результата поиска на соответствующей странице результатов поиска (SERP);
извлечения из базы данных журнала поиска для каждого соответствующего прошлого запроса, соответствующего значения упомянутого признака для по меньшей мере одного документа;
определения соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов;
генерирования соответствующего значения упомянутого признака для по меньшей мере одного документа, основываясь, по меньшей мере частично, на:
соответствующем параметре сходства по меньшей мере одного прошлого запроса из набора прошлых запросов, и
соответствующем значении для упомянутого признака по меньшей мере одного прошлого запроса из набора прошлых запросов;
ранжирования, посредством алгоритма машинного обучения, набора документов для получения ранжированного списка документов, причем ранжирование основано на множестве признаков, по меньшей мере один документ ранжируется на основе, по меньшей мере частично, соответствующего значения упомянутого признака; и
передачи на электронное устройство ранжированного списка документов, подлежащего представлению в качестве страницы результатов поиска.
12. Система по п. 11, в которой
каждый соответствующий документ из набора документов, релевантных упомянутому запросу, имеет соответствующую аннотацию, причем соответствующая аннотация включает в себя:
по меньшей мере один соответствующий прошлый поисковый запрос, использованный для доступа к соответствующему документу на сервере поисковой системы; и
в которой извлечение набора прошлых запросов основано на соответствующей аннотации по меньшей мере одного документа.
13. Система по п. 11, в которой
процессор дополнительно сконфигурирован с возможностью, до определения соответствующего параметра сходства:
извлечения из базы данных журнала поиска соответствующего набора прошлых документов для каждого соответствующего прошлого запроса из набора прошлых запросов, причем соответствующий набор прошлых документов был представлен в качестве соответствующих результатов поиска в ответ на соответствующий прошлый запрос; и в которой
определение соответствующего параметра сходства между упомянутым запросом и каждым соответствующим прошлым запросом из набора прошлых запросов основано на:
наборе документов, релевантных упомянутому запросу, и
соответствующем наборе документов соответствующего прошлого запроса.
14. Система по п. 13, в которой
по меньшей мере подмножество набора документов связано с соответствующими параметрами пользовательских взаимодействий; и в которой
каждый соответствующий документ из соответствующего набора прошлых документов для каждого соответствующего запроса связан с соответствующими параметрами прошлых пользовательских взаимодействий; и в которой
определение соответствующего параметра сходства дополнительно основано на:
соответствующих параметрах пользовательских взаимодействий для соответствующего запроса подмножества документов и
соответствующих параметрах пользовательских взаимодействий для соответствующего набора прошлых документов.
15. Система по п. 11, в которой
система исполняет второй алгоритм машинного обучения, причем второй алгоритм машинного обучения был обучен для определения параметра сходства между запросами на основе их текстового содержимого; и
определение соответствующего параметра сходства исполняется вторым алгоритмом машинного обучения.
16. Система по п. 15, в которой процессор дополнительно сконфигурирован с возможностью,
во время фазы обучения:
извлечения из базы данных журнала поиска множества поисковых запросов, обеспеченных на сервер поисковой системы, причем каждый из множества поисковых запросов связан с соответствующим набором результатов поиска, каждый соответствующий результат поиска из соответствующего набора результатов поиска связан с по меньшей мере одним соответствующим параметром пользовательского взаимодействия;
генерирования, для каждого запроса из множества поисковых запросов, соответствующего вектора запроса, основанного на по меньшей мере одном соответствующем параметре пользовательского взаимодействия, связанном с каждым результатом поиска из соответствующего набора результатов поиска;
генерирования, для каждой возможной пары запросов в пределах множества поисковых запросов, на основе соответствующих векторов запросов для каждого запроса из пары запросов, соответствующего параметра сходства, причем соответствующий параметр сходства указывает степень сходства между запросами в паре запросов;
генерирования набора обучающих объектов, причем каждый обучающий объект из набора обучающих объектов включает в себя указание соответствующей одной из каждой возможной пары запросов и соответствующего параметра сходства;
обучения второго алгоритма машинного обучения на наборе обучающих объектов для определения параметра сходства новой пары запросов на основе текстового содержимого каждой новой пары запросов, причем по меньшей мере один запрос из новой пары запросов не был включен в набор обучающих объектов.
17. Система по п. 11, в которой процессор дополнительно сконфигурирован с возможностью, до генерирования соответствующего значения упомянутого признака:
выбора по меньшей мере одного соответствующего прошлого запроса на основе того, что соответствующий параметр сходства превышает предопределенный порог.
18. Система по п. 11, в которой
для извлечения соответствующего значения упомянутого признака по меньшей мере одного документа для каждого соответствующего прошлого запроса процессор дополнительно сконфигурирован с возможностью:
извлечения соответствующего показателя релевантности по меньшей мере одного документа соответствующему прошлому запросу; и в которой
генерирование соответствующего значения упомянутого признака дополнительно основано на соответствующем показателе релевантности.
19. Система по п. 18, в которой генерирование соответствующего значения упомянутого признака для по меньшей мере одного документа дополнительно основано на:
соответствующем значении по меньшей мере одного другого признака из множества признаков для данного документа.
20. Система по п. 19, в которой данный признак является одним из:
зависящего от запроса признака, и
параметра пользовательского взаимодействия.
RU2018144177A 2018-12-13 2018-12-13 Способ и система генерирования признака для ранжирования документа RU2733481C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2018144177A RU2733481C2 (ru) 2018-12-13 2018-12-13 Способ и система генерирования признака для ранжирования документа
US16/571,870 US11194878B2 (en) 2018-12-13 2019-09-16 Method of and system for generating feature for ranking document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018144177A RU2733481C2 (ru) 2018-12-13 2018-12-13 Способ и система генерирования признака для ранжирования документа

Publications (3)

Publication Number Publication Date
RU2018144177A true RU2018144177A (ru) 2020-06-15
RU2018144177A3 RU2018144177A3 (ru) 2020-06-15
RU2733481C2 RU2733481C2 (ru) 2020-10-01

Family

ID=71072626

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018144177A RU2733481C2 (ru) 2018-12-13 2018-12-13 Способ и система генерирования признака для ранжирования документа

Country Status (2)

Country Link
US (1) US11194878B2 (ru)
RU (1) RU2733481C2 (ru)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11403303B2 (en) * 2018-09-07 2022-08-02 Beijing Bytedance Network Technology Co., Ltd. Method and device for generating ranking model
JP7456137B2 (ja) * 2019-12-05 2024-03-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11526544B2 (en) * 2020-05-07 2022-12-13 International Business Machines Corporation System for object identification
CN113792225B (zh) * 2021-08-25 2023-08-18 北京库睿科技有限公司 一种多数据类型分层排序方法和装置
US12321387B2 (en) * 2023-03-10 2025-06-03 Equifax Inc. Automatically generating search indexes for expediting searching of a computerized database

Family Cites Families (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269368B1 (en) 1997-10-17 2001-07-31 Textwise Llc Information retrieval using dynamic evidence combination
US6185558B1 (en) 1998-03-03 2001-02-06 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US7124129B2 (en) 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6189002B1 (en) 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US8775396B2 (en) 1999-04-15 2014-07-08 Intellectual Ventures I Llc Method and system for searching a wide area network
US7567958B1 (en) 2000-04-04 2009-07-28 Aol, Llc Filtering system for providing personalized information in the absence of negative data
US6701311B2 (en) 2001-02-07 2004-03-02 International Business Machines Corporation Customer self service system for resource search and selection
US6738764B2 (en) 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
US7149732B2 (en) 2001-10-12 2006-12-12 Microsoft Corporation Clustering web queries
US20040249808A1 (en) 2003-06-06 2004-12-09 Microsoft Corporation Query expansion using query logs
US8086619B2 (en) 2003-09-05 2011-12-27 Google Inc. System and method for providing search query refinements
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7689585B2 (en) 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US8135698B2 (en) 2004-06-25 2012-03-13 International Business Machines Corporation Techniques for representing relationships between queries
US7958115B2 (en) 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7716198B2 (en) * 2004-12-21 2010-05-11 Microsoft Corporation Ranking search results using feature extraction
US7698270B2 (en) 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US20060149710A1 (en) 2004-12-30 2006-07-06 Ross Koningstein Associating features with entities, such as categories of web page documents, and/or weighting such features
EP1875336A2 (en) 2005-04-11 2008-01-09 Textdigger, Inc. System and method for searching for a query
US20070005587A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Relative search results based off of user interaction
US8832100B2 (en) 2005-09-14 2014-09-09 Millennial Media, Inc. User transaction history influenced search results
US20090234711A1 (en) 2005-09-14 2009-09-17 Jorey Ramer Aggregation of behavioral profile data using a monetization platform
US7620607B1 (en) 2005-09-26 2009-11-17 Quintura Inc. System and method for using a bidirectional neural network to identify sentences for use as document annotations
US9552420B2 (en) * 2005-10-04 2017-01-24 Thomson Reuters Global Resources Feature engineering and user behavior analysis
US7577643B2 (en) 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
US20080109285A1 (en) 2006-10-26 2008-05-08 Mobile Content Networks, Inc. Techniques for determining relevant advertisements in response to queries
US20080114750A1 (en) 2006-11-14 2008-05-15 Microsoft Corporation Retrieval and ranking of items utilizing similarity
JP2008181186A (ja) 2007-01-23 2008-08-07 Yahoo Japan Corp クエリーログを利用したキーワードとサイトの関連度を求める方法
US7603348B2 (en) 2007-01-26 2009-10-13 Yahoo! Inc. System for classifying a search query
US8321448B2 (en) 2007-02-22 2012-11-27 Microsoft Corporation Click-through log mining
US7792813B2 (en) 2007-08-31 2010-09-07 Microsoft Corporation Presenting result items based upon user behavior
US8645390B1 (en) 2007-08-31 2014-02-04 Google Inc. Reordering search query results in accordance with search context specific predicted performance functions
US8655868B2 (en) 2007-09-12 2014-02-18 Ebay Inc. Inference of query relationships based on retrieved attributes
US7877385B2 (en) 2007-09-21 2011-01-25 Microsoft Corporation Information retrieval using query-document pair information
US7895235B2 (en) 2007-12-19 2011-02-22 Yahoo! Inc. Extracting semantic relations from query logs
US8392436B2 (en) 2008-02-07 2013-03-05 Nec Laboratories America, Inc. Semantic search via role labeling
US7877404B2 (en) 2008-03-05 2011-01-25 Microsoft Corporation Query classification based on query click logs
US8965786B1 (en) 2008-04-18 2015-02-24 Google Inc. User-based ad ranking
US20090313286A1 (en) 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
US7958158B2 (en) 2008-06-19 2011-06-07 International Business Machines Corporation Aggregating database queries
US8239370B2 (en) 2008-06-27 2012-08-07 Microsoft Corporation Basing search results on metadata of prior results
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
US20100010895A1 (en) 2008-07-08 2010-01-14 Yahoo! Inc. Prediction of a degree of relevance between query rewrites and a search query
US8515950B2 (en) 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
KR20100069118A (ko) 2008-12-16 2010-06-24 한국전자통신연구원 질의어 색인 데이터베이스 구축 방법과 그 질의어 색인 데이터베이스를 이용한 질의어 추천 방법
US8239334B2 (en) 2008-12-24 2012-08-07 Microsoft Corporation Learning latent semantic space for ranking
US8341095B2 (en) 2009-01-12 2012-12-25 Nec Laboratories America, Inc. Supervised semantic indexing and its extensions
US8156129B2 (en) 2009-01-15 2012-04-10 Microsoft Corporation Substantially similar queries
US20100198816A1 (en) 2009-01-30 2010-08-05 Yahoo! Inc. System and method for presenting content representative of document search
US9009146B1 (en) * 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8145623B1 (en) 2009-05-01 2012-03-27 Google Inc. Query ranking based on query clustering and categorization
US8606786B2 (en) 2009-06-22 2013-12-10 Microsoft Corporation Determining a similarity measure between queries
US20100332493A1 (en) 2009-06-25 2010-12-30 Yahoo! Inc. Semantic search extensions for web search engines
US8214363B2 (en) 2009-07-06 2012-07-03 Abhilasha Chaudhary Recognizing domain specific entities in search queries
US8543668B1 (en) 2009-11-24 2013-09-24 Google Inc. Click tracking using link styles
US9317613B2 (en) 2010-04-21 2016-04-19 Yahoo! Inc. Large scale entity-specific resource classification
US20120143790A1 (en) 2010-12-01 2012-06-07 Microsoft Corporation Relevance of search results determined from user clicks and post-click user behavior obtained from click logs
US9064007B1 (en) 2011-01-05 2015-06-23 Google Inc. Co-click based similarity score of queries and keywords
US9098571B2 (en) 2011-01-24 2015-08-04 Aol Inc. Systems and methods for analyzing and clustering search queries
US8612367B2 (en) 2011-02-04 2013-12-17 Microsoft Corporation Learning similarity function for rare queries
US8719257B2 (en) 2011-02-16 2014-05-06 Symantec Corporation Methods and systems for automatically generating semantic/concept searches
US8898156B2 (en) 2011-03-03 2014-11-25 Microsoft Corporation Query expansion for web search
US20120253792A1 (en) 2011-03-30 2012-10-04 Nec Laboratories America, Inc. Sentiment Classification Based on Supervised Latent N-Gram Analysis
US9507861B2 (en) 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8423547B2 (en) 2011-04-08 2013-04-16 Microsoft Corporation Efficient query clustering using multi-partite graphs
US8788477B1 (en) 2011-09-19 2014-07-22 Google Inc. Identifying addresses and titles of authoritative web pages by analyzing search queries in query logs
US20130110824A1 (en) 2011-11-01 2013-05-02 Microsoft Corporation Configuring a custom search ranking model
US9009148B2 (en) 2011-12-19 2015-04-14 Microsoft Technology Licensing, Llc Clickthrough-based latent semantic model
US8463595B1 (en) 2012-03-06 2013-06-11 Reputation.Com, Inc. Detailed sentiment analysis
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
JP6299596B2 (ja) 2012-09-28 2018-03-28 日本電気株式会社 クエリ類似度評価システム、評価方法、及びプログラム
US9104733B2 (en) 2012-11-29 2015-08-11 Microsoft Technology Licensing, Llc Web search ranking
US9251292B2 (en) 2013-03-11 2016-02-02 Wal-Mart Stores, Inc. Search result ranking using query clustering
US9519859B2 (en) 2013-09-06 2016-12-13 Microsoft Technology Licensing, Llc Deep structured semantic model produced using click-through data
US9715660B2 (en) 2013-11-04 2017-07-25 Google Inc. Transfer learning for deep neural network based hotword detection
US9633017B2 (en) 2013-11-07 2017-04-25 Yahoo! Inc. Dwell-time based generation of a user interest profile
US9898554B2 (en) * 2013-11-18 2018-02-20 Google Inc. Implicit question query identification
RU2556425C1 (ru) 2014-02-14 2015-07-10 Закрытое акционерное общество "Эвентос" (ЗАО "Эвентос") Способ автоматической итеративной кластеризации электронных документов по семантической близости, способ поиска в совокупности кластеризованных по семантической близости документов и машиночитаемые носители
US9818065B2 (en) 2014-03-12 2017-11-14 Microsoft Technology Licensing, Llc Attribution of activity in multi-user settings
US9477654B2 (en) 2014-04-01 2016-10-25 Microsoft Corporation Convolutional latent semantic models and their applications
US9535960B2 (en) 2014-04-14 2017-01-03 Microsoft Corporation Context-sensitive search using a deep learning model
US10642845B2 (en) 2014-05-30 2020-05-05 Apple Inc. Multi-domain search on a computing device
US20150356199A1 (en) 2014-06-06 2015-12-10 Microsoft Corporation Click-through-based cross-view learning for internet searches
US9846836B2 (en) 2014-06-13 2017-12-19 Microsoft Technology Licensing, Llc Modeling interestingness with deep neural networks
US10089580B2 (en) 2014-08-11 2018-10-02 Microsoft Technology Licensing, Llc Generating and using a knowledge-enhanced model
RU2580516C2 (ru) 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
JP5957048B2 (ja) 2014-08-19 2016-07-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 曖昧性を解消する教師データの生成方法、生成システム、及び生成プログラム
RU2609079C2 (ru) * 2015-02-27 2017-01-30 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер обработки поискового предложения
US9946799B2 (en) * 2015-04-30 2018-04-17 Microsoft Technology Licensing, Llc Federated search page construction based on machine learning
WO2016187705A1 (en) * 2015-05-22 2016-12-01 Coveo Solutions Inc. System and method for ranking search results
US10606946B2 (en) 2015-07-06 2020-03-31 Microsoft Technology Licensing, Llc Learning word embedding using morphological knowledge
US10133729B2 (en) * 2015-08-28 2018-11-20 Microsoft Technology Licensing, Llc Semantically-relevant discovery of solutions
US20170060993A1 (en) 2015-09-01 2017-03-02 Skytree, Inc. Creating a Training Data Set Based on Unlabeled Textual Data
US10354182B2 (en) 2015-10-29 2019-07-16 Microsoft Technology Licensing, Llc Identifying relevant content items using a deep-structured neural network
US9659248B1 (en) 2016-01-19 2017-05-23 International Business Machines Corporation Machine learning and training a computer-implemented neural network to retrieve semantically equivalent questions using hybrid in-memory representations
US10740678B2 (en) 2016-03-31 2020-08-11 International Business Machines Corporation Concept hierarchies
RU2632143C1 (ru) 2016-04-11 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ обучения модуля ранжирования с использованием обучающей выборки с зашумленными ярлыками
US10606847B2 (en) 2016-05-31 2020-03-31 Microsoft Technology Licensing, Llc Generation of training data for ideal candidate search ranking model
CN106095983B (zh) 2016-06-20 2019-11-26 北京百度网讯科技有限公司 一种基于个性化深度神经网络的相似度确定方法及装置
US10762439B2 (en) 2016-07-26 2020-09-01 International Business Machines Corporation Event clustering and classification with document embedding
US20180052853A1 (en) * 2016-08-22 2018-02-22 Salesforce.Com, Inc. Adjusting feature weights for ranking entity based search results
RU2637998C1 (ru) 2016-09-12 2017-12-08 Общество С Ограниченной Ответственностью "Яндекс" Способ и система создания краткого изложения цифрового контента
US20180121550A1 (en) 2016-10-28 2018-05-03 Facebook, Inc. Ranking Search Results Based on Lookalike Users on Online Social Networks
US9767182B1 (en) 2016-10-28 2017-09-19 Searchmetrics Gmbh Classification of search queries
RU2643466C1 (ru) 2017-04-14 2018-02-01 Алексей Валентинович Воронин Способ и система формирования результатов поисковой выдачи
US10915524B1 (en) 2017-06-27 2021-02-09 Amazon Technologies, Inc. Scalable distributed data processing and indexing
US20190205472A1 (en) * 2017-12-28 2019-07-04 Salesforce.Com, Inc. Ranking Entity Based Search Results Based on Implicit User Interactions
US11126630B2 (en) * 2018-05-07 2021-09-21 Salesforce.Com, Inc. Ranking partial search query results based on implicit user interactions

Also Published As

Publication number Publication date
US11194878B2 (en) 2021-12-07
RU2733481C2 (ru) 2020-10-01
US20200192961A1 (en) 2020-06-18
RU2018144177A3 (ru) 2020-06-15

Similar Documents

Publication Publication Date Title
US12499151B2 (en) Embedding based retrieval for image search
RU2018132848A (ru) Способ и система для расширения поисковых запросов с целью ранжирования результатов поиска
RU2018144177A (ru) Способ и система генерирования признака для ранжирования документа
US8429173B1 (en) Method, system, and computer readable medium for identifying result images based on an image query
US8185526B2 (en) Dynamic keyword suggestion and image-search re-ranking
RU2671047C2 (ru) Понимание таблиц для поиска
US9081861B2 (en) Uniform resource locator canonicalization
US10108699B2 (en) Adaptive query suggestion
US8332426B2 (en) Indentifying referring expressions for concepts
US9342601B1 (en) Query formulation and search in the context of a displayed document
CN104050235B (zh) 基于集合选择的分布式信息检索方法
RU2018122689A (ru) Способ и система выбора для ранжирования поисковых результатов с помощью алгоритма машинного обучения
KR101220557B1 (ko) 사람의 활동 지식 데이터베이스를 이용한 모바일 어플리케이션 검색 방법 및 시스템
US20160085860A1 (en) Search engine for textual content and non-textual content
US20200201915A1 (en) Ranking image search results using machine learning models
US20200159765A1 (en) Performing image search using content labels
US20180210897A1 (en) Model generation method, word weighting method, device, apparatus, and computer storage medium
US11379527B2 (en) Sibling search queries
CN104636407B (zh) 参数取值训练及搜索请求处理方法和装置
RU2017146890A (ru) Способ и система создания векторов аннотации для документа
CN107220307A (zh) 网页搜索方法和装置
US9251136B2 (en) Document tagging and retrieval using entity specifiers
US8868591B1 (en) Modifying a user query to improve the results
KR20140091375A (ko) 사용자 질의 확장 기법을 이용한 시맨틱 콘텐츠 검색 시스템 및 방법
CN119692469B (zh) 答复文本生成方法和装置、存储介质及程序产品