[go: up one dir, main page]

CN105069077A - 搜索方法及装置 - Google Patents

搜索方法及装置 Download PDF

Info

Publication number
CN105069077A
CN105069077A CN201510463375.6A CN201510463375A CN105069077A CN 105069077 A CN105069077 A CN 105069077A CN 201510463375 A CN201510463375 A CN 201510463375A CN 105069077 A CN105069077 A CN 105069077A
Authority
CN
China
Prior art keywords
behavior
user
intention
result
historical search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510463375.6A
Other languages
English (en)
Inventor
熊峰
徐常有
吴博
李长城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510463375.6A priority Critical patent/CN105069077A/zh
Publication of CN105069077A publication Critical patent/CN105069077A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种搜索方法及装置。其中,所述方法包括:识别当前用户输入的目标搜索语句所属的意图类别;根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;基于预测结果,从所述候选搜索结果中确定本次输出的搜索结果。本发明实施例提供的技术方案,能够利用较为合理准确的用户行为模型,为用户提供更加优质的搜索结果,提升用户对搜索的满意度。

Description

搜索方法及装置
技术领域
本发明实施例涉及互联网技术领域,尤其涉及搜索方法及装置。
背景技术
随着网络基础设施的不断升级,为解决信息过载问题,用于为用户提供搜索服务的搜索引擎应用而生。目前,搜索引擎通常会线下预先学习得到用户行为模型,并在线上接收到用户实时输入的搜索语句(Query)后,基于该搜索语句利用用户行为模型进行用户行为理解,进而结合用户行为的理解结果确定出搜索结果。其中,用户行为模型用于预测用户对网页的行为,例如预测用户是否点击网页、浏览网页的时长或者对网页的满意度等。
然而,现有技术仅是基于用户的属性特征(例如所在地区、年龄、性别、职业)、文本特征(例如输入的历史搜索语句)、对历史搜索结果的搜索行为(例如是否点击、浏览时长)等,来建立用户行为模型。虽然这些特征覆盖广泛、内容丰富,但是并没有从本质上对用户行为进行理解建模,使得建立得到的用户行为模型不够合理,不能很好的理解用户的搜索需求,用户体验较差。
发明内容
本发明实施例提供一种搜索方法及装置,以能够利用较为合理准确的用户行为模型,为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
一方面,本发明实施例提供了一种搜索方法,该方法包括:
识别当前用户输入的目标搜索语句所属的意图类别;
根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
基于预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
另一方面,本发明实施例还提供了一种搜索装置,该装置包括:
意图类别识别单元,用于识别当前用户输入的目标搜索语句所属的意图类别;
用户行为预测单元,用于根据所述意图类别识别单元识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
搜索结果输出单元,用于基于所述用户行为预测单元得到的预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
本发明实施例提供的技术方案,基于历史用户输入的历史搜索语句所属的意图进行用户行为建模,能够深入理解用户行为,使得用户行为模型更为合理准确,进而利用该模型预测线上用户对候选搜索结果的行为,可以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
附图说明
图1是本发明实施例一提供的一种搜索方法的流程示意图;
图2是本发明实施例四提供的一种搜索方法的流程示意图;
图3是本发明实施例五提供的一种搜索装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
随着网络基础设施的日益完善,互联网资源越来越丰富,诸多用户都会有各式各样的搜索需求。为满足该搜索需求,用户通常是有意图地通过搜索框输入相应的搜索语句进行搜索,之后对搜索引擎返回的搜索结果进行诸如点击、浏览、收藏等之类的行为。这些用户行为是与意图动机有密切关联的。
目前,搜索引擎在接收到任意用户实时输入的搜索语句后,会基于该搜索语句,利用线下预先建立好的用户行为模型,预测用户对各个候选搜索结果的行为结果,进而基于该预测结果从多个候选搜索结果中选择本次要输出的搜索结果。其中,所述行为结果通常是用于表征用户对候选结果满意程度的度量参数值。
但是在已有技术中,线下对用户行为模型的建立方案,根本不会考虑意图动机这一因素,通过意图分析来进行用户行为理解,而是一味的不分意图地将历史用户在历史搜索语句下的历史搜索结果对应的通用行为特征与通用行为结果,作为训练实例进行建模。所以,已有技术并没有从本质上对用户行为进行理解建模,从而导致建立得到的用户行为模型并不能准确预测用户对候选搜索结果的行为结果,因为用户的行为结果与搜索意图有着密不可分的关系。
所谓通用行为特征指的是:不包含意图特征的历史用户的行为特征。示例性的,通用行为特征通常可包括如下至少一种特征:用户属性特征(例如包含用户所在地区、年龄、性别、职业等),用户输入特征(例如输入的历史搜索语句),历史搜索结果的文本特征(例如历史搜索结果所对应网页的主题、关键词)等。
所谓通用行为结果指的是:与意图特征无关的、采用统一的用于表征历史用户对历史搜索结果满意程度的度量参数得到的值。也即,不管历史用户是何意图的搜索动机,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数均相同。例如,对于任何搜索意图而言,度量参数均为历史用户对历史搜索结果的停留时间。但是,在历史用户的搜索意图为信息类意图下,历史用户对所满意的历史搜索结果的停留时间往往较长;而在历史用户的搜索意图为资源下载类意图下,历史用户对所满意的历史搜索结果的停留时间却很短,只有数次下载链接的点击。显然,这些用户行为的特点是与搜索意图有密切关联,不同搜索意图触发的用户行为在对搜索结果满意的情况下的表现是不一致的,因而采用统一的度量参数来表征用户对候选结果满意程度不够细致,相应的也就造成建立的用户行为模型对用户行为的理解力较差,准确度不高。
有鉴于此,本发明实施例引入意图分析的思想,基于意图特征建立用户行为模型,进而利用该模型预测线上用户对候选搜索结果的行为,以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
实施例一
图1是本发明实施例一提供的一种搜索方法的流程示意图。本实施例的方法可以由搜索装置来执行,该装置可通过软件实现,集成于为各式各样的终端设备提供搜索服务的搜索引擎中。参见图1,本实施例提供的搜索方法所包括的操作具体如下。
S110、识别当前用户输入的目标搜索语句所属的意图类别。
目标搜索语句为搜索引擎接收到的由终端上的搜索客户端或者浏览器发送的搜索请求中所包含的搜索语句。该搜索语句可以是当前用户以语音输入方式输入的语音搜索信息,或者以文本输入方式输入的文字搜索内容。
在获取到目标搜索语句后,基于设定的意图类别识别算法,对该搜索语句进行识别,以确定该搜索语句具体属于哪类意图类别。需要说明的是,本实施例并不具体对意图的种类以及个数加以限定。优选的,意图类别包括如下至少一种:寻址类意图(也即查找统一资源定位符的意图)、信息类意图(查询问题的信息或解决办法的意图)和商品类意图(查找商品信息的意图)。示例性的,可预先设定多种意图类别,并建立意图类别与关键词之间的映射关系加以存储。其中,每种意图类别可以同时映射有多个关键词。例如,与寻址类意图具有映射关系的关键词有:“网站”、“网址”等;与信息类意图具有映射关系的关键词有:“为什么”、“如何”、“怎样”、“是否”等;与商品类意图具有映射关系的关键词有:“京东”、“淘宝”、“天猫”、“大众点评”等。
相应的,识别当前用户输入的目标搜索语句所属的意图类别,可具体包括:对当前用户输入的目标搜索语句进行解析,以提取其中所包含的关键词;从预先创建的意图类别与关键词之间的映射关系中,查询与本次提取得到的关键词具有映射关系的意图类别,将该意图类别作为目标搜索语句所属的意图类别。
S120、根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为。
在本实施例中,可预先创建用户行为模型并进行存储。该用户行为模型根据历史用户的历史搜索语句所属的意图类别确定。示例性的,用户行为模型的创建过程,具体包括:获取历史用户的历史行为数据;识别历史行为数据中的历史搜索语句所属的意图类别;根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型。其中,对历史搜索语句所属意图类别的识别技术,与上述对目标搜索语句所属意图类别的识别技术相同。
在该示例中,需要预先创建包含有诸多历史用户的历史行为数据的语料库,基于机器学习的方法利用该语料库训练得到用户行为模型。每一个历史用户的历史行为数据可包括:该用户的属性特征数据;该用户输入过的历史搜索语句;搜索引擎根据历史搜索语句所返回的各个历史搜索结果的文本特征数据;该用户对各个历史搜索结果的行为记录,该行为记录可以是对包含如下至少一项内容的记录:是否点击历史搜索结果、在历史搜索结果所对应网页中的停留时长以及是否收藏该网页。
作为本实施例的一种具体实施方式,可线下分别针对各种意图类别,预先创建一个与该意图类别对应的用户行为模型。线上在获取到当前用户输入的目标搜索语句,并识别出其所属的意图类别之后,利用预先创建的本次识别得到的该意图类别所对应的用户行为模型,分别预测当前用户对各个候选搜索结果的行为,以得到行为结果。
作为本实施例的另一种具体实施方式,可线下预先创建一个通用的用户行为模型,在建立该用户行为模型时应增加一维意图特征,其中该特征为用于表征训练实例对应的历史搜索语句所属的意图类别的特征。线上在获取得到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,生成意图特征,而后根据该意图特征利用预先创建的用户行为模型,分别预测当前用户对各个候选搜索结果的行为,以得到行为结果。
S130、基于预测结果,从候选搜索结果中确定本次输出的搜索结果。
示例性的,可按照所对应的预测结果,对各个候选搜索结果进行排序;将位于前N(为大于或等于1的自然数)名的候选搜索结果,作为本次输出的搜索结果。
本实施例提供的技术方案,基于历史用户输入的历史搜索语句所属的意图进行用户行为建模,能够深入理解用户行为,使得用户行为模型更为合理准确,进而利用该模型预测线上用户对候选搜索结果的行为,可以为用户提供更加优质的搜索结果,提升用户对搜索的满意度。
实施例二
本实施例在上述实施例一的基础上,对用户行为模型的建立进行优化。在本实施例中,每一种意图类别对应一个用户行为模型。具体的,根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型,包括:
从历史行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中用户行为结果根据历史搜索语句所属的意图类别确定;
将用户行为特征和用户行为结果作为训练实例,基于机器学习算法建立与历史搜索语句所属的意图类别对应的用户行为模型。
其中,所提取的用户行为特征,可为已有技术中的通用行为特征中的部分特征或全部特征,例如包括:历史用户的属性特征,输入的历史搜索语句所对应的用户输入特征,以及历史搜索结果的文本特征等。
所提取的用户行为结果,区别于已有技术中的通用行为结果,为与历史搜索语句所属的意图类别对应的行为结果。在不同意图类别下,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数可相同,也可不同。例如,在信息类意图下,度量参数可以为历史用户对历史搜索结果的停留时间,该时间越长,表明用户越满意;而在资源下载类意图下,度量参数可以为历史用户对历史搜索结果是否点击。
在获取到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,针对各个候选搜索结果,执行如下操作:确定当前用户在目标搜索语句下的候选搜索结果对应的用户行为特征;利用本次确定的用户行为特征以及预先创建的本次识别得到的该意图类别所对应的用户行为模型,预测当前用户对候选搜索结果的行为,以得到行为结果。
实施例三
本实施例在上述实施例一的基础上,对用户行为模型的建立进行优化。在本实施例中,各种意图类别都对应同一个通用的用户行为模型。区别于现有技术,在建立该用户行为模型时应增加一维意图特征。具体的,可将历史搜索语句对应的意图类别作为用户行为模型的一个维度上的特征(简称意图特征),并且将与意图特征对应的、用于表征历史用户对历史搜索结果满意程度的度量参数的值作为用户行为结果,以形成训练实例;进而基于机器学习的方法利用训练实例进行训练,建立通用的用户行为模型。
根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型,包括:
从历史搜索行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中用户行为结果根据所述历史搜索语句所属的意图类别确定;
将用户行为特征、历史搜索语句所属的意图类别特征和用户行为结果作为训练实例,基于机器学习算法建立用户行为模型。
其中,所提取的用户行为特征,可为已有技术中的通用行为特征中的部分特征或全部特征,例如包括:历史用户的属性特征,输入的历史搜索语句所对应的用户输入特征,以及历史搜索结果的文本特征等。
所提取的用户行为结果,区别于已有技术中的通用行为结果,为与历史搜索语句所属的意图类别对应的行为结果。在不同意图类别下,所采用的用于表征历史用户对历史搜索结果满意程度的度量参数可相同,也可不同。
在获取到当前用户输入的目标搜索语句,并识别得到其所属的意图类别之后,针对各个候选搜索结果,执行如下操作:根据识别结果生成意图特征;确定当前用户在目标搜索语句下的候选搜索结果对应的用户行为特征;利用本次确定的用户行为特征、意图特征以及预先创建的通用的用户行为模型,预测当前用户对候选搜索结果的行为,以得到行为结果。
实施例四
图2是本发明实施例四提供的一种搜索方法的流程示意图。本实施例以上述实施例为基础,提供一优选实施例。在本实施例中以寻址类意图、信息类意图和商品类意图这3类意图为例进行介绍,但是本领域的普通技术人员应理解,在实际执行当中,意图类别还可以是其他划分方式,本实施例仅是以示例的方式对本发明提供的技术方案加以解释说明。参见图2,本实施例提供的搜索方法所包括的操作具体如下。
先是,执行获取多个历史用户的至少一组历史行为数据的操作。其中,每一组历史行为数据对应有:历史用户的属性特征数据;输入的一条历史搜索语句;搜索引擎根据该条历史搜索语句所返回的各个历史搜索结果的文本特征数据;该用户对各个历史搜索结果的行为记录,该行为记录可以是对包含如下至少一项内容的记录:是否点击历史搜索结果、在历史搜索结果所对应网页中的停留时长以及是否收藏该网页。
然后,执行根据其中所包含的历史搜索语句,对每组历史行为数据进行意图类别划分的操作。具体的,基于预先创建的意图类别与关键词之间的映射关系,识别各条历史搜索语句所属的意图类别;将该历史搜索语句所在历史行为数据划分为本次识别得到的意图类别下的历史行为数据。
再然后,针对各意图类别下的历史行为数据:从中提取在历史搜索语句下的各历史搜索结果对应的用户行为特征以及用户行为结果,将提取的用户行为特征和用户行为结果作为训练实例,基于机器学习算法进行各意图类别的用户行为建模。其中,用户行为结果根据历史搜索语句所属的意图类别确定。
进而,得到各意图类别对应的用户行为模型:寻址类意图对应的用户行为模型、信息类意图对应的用户行为模型和商品类意图对应的用户行为模型。
上述所有操作可在线下预先执行。
在线上,先是接收当前用户输入的目标搜索语句(也即新Query),识别新Query所属的意图类别;而后根据与识别结果对应的用户行为模型,预测当前用户对各个候选搜索结果的行为,进而基于预测结果从各个候选搜索结果中确定本次输出的搜索结果。具体的预测过程可参见上述实施例二中的相关描述,在此不再赘述。
本实施例能够针对Query相关的意图进行更加细致的建模,进而提升用户行为理解,因此可以提升用户行为理解的应用效果:为用户提供更加优质的搜索结果,最终提升用户体验满意度。
实施例五
图3是本发明实施例五提供的一种搜索装置的结构示意图。参见图3,该装置的具体结构如下:
意图类别识别单元310,用于识别当前用户输入的目标搜索语句所属的意图类别;
用户行为预测单元320,用于根据意图类别识别单元310识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
搜索结果输出单元330,用于基于用户行为预测单元320得到的预测结果,从候选搜索结果中确定本次输出的搜索结果。
示例性的,本实施例提供的搜索装置还包括用户行为模型建立单元300,其中用户行为模型建立单元300包括:
数据获取子单元301,用于获取历史用户的历史行为数据;
意图识别子单元302,用于识别历史行为数据中的历史搜索语句所属的意图类别;
模型建立子单元303,用于根据历史搜索语句所属的意图类别以及历史行为数据,建立用户行为模型。
作为本实施例的一种具体实施方式,所述模型建立子单元303,具体用于:
从历史行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中所述用户行为结果根据所述历史搜索语句所属的意图类别确定;
将用户行为特征和用户行为结果作为训练实例,基于机器学习算法建立与历史搜索语句所属的意图类别对应的用户行为模型。
作为本实施例的另一种具体实施方式,模型建立子单元303,具体用于:
从历史搜索行为数据中,提取在历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中用户行为结果根据所述历史搜索语句所属的意图类别确定;
将用户行为特征、历史搜索语句所属的意图类别特征和所述用户行为结果作为训练实例,基于机器学习算法建立用户行为模型。
在本实施例提供的上述技术方案的基础上,意图类别包括如下至少一种:寻址类意图、信息类意图和商品类意图。
上述搜索装置这一产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施例中详尽描述的技术细节,可参见本发明实施例中用于解释执行方法的实施例。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种搜索方法,其特征在于,包括:
识别当前用户输入的目标搜索语句所属的意图类别;
根据识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
基于预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取历史用户的历史行为数据;
识别所述历史行为数据中的历史搜索语句所属的意图类别;
根据所述历史搜索语句所属的意图类别以及所述历史行为数据,建立用户行为模型。
3.根据权利要求2所述的方法,其特征在于,根据所述历史搜索语句所属的意图类别以及所述历史行为数据,建立用户行为模型,包括:
从所述历史行为数据中,提取在所述历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中所述用户行为结果根据所述历史搜索语句所属的意图类别确定;
将所述用户行为特征和所述用户行为结果作为训练实例,基于机器学习算法,建立与所述历史搜索语句所属的意图类别对应的用户行为模型。
4.根据权利要求2所述的方法,其特征在于,根据所述历史搜索语句所属的意图类别以及所述历史行为数据,建立用户行为模型,包括:
从所述历史搜索行为数据中,提取在所述历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中所述用户行为结果根据所述历史搜索语句所属的意图类别确定;
将所述用户行为特征、所述历史搜索语句所属的意图类别特征和所述用户行为结果作为训练实例,基于机器学习算法建立用户行为模型。
5.根据权利要求1-4中任一项所述的方法,其特征在于,意图类别包括如下至少一种:寻址类意图、信息类意图和商品类意图。
6.一种搜索装置,其特征在于,包括:
意图类别识别单元,用于识别当前用户输入的目标搜索语句所属的意图类别;
用户行为预测单元,用于根据所述意图类别识别单元识别得到的意图类别以及预先创建的用户行为模型,预测当前用户对候选搜索结果的行为,其中所述用户行为模型根据历史用户的历史搜索语句所属的意图类别确定;
搜索结果输出单元,用于基于所述用户行为预测单元得到的预测结果,从所述候选搜索结果中确定本次输出的搜索结果。
7.根据权利要求6所述的装置,其特征在于,还包括用户行为模型建立单元,其中所述用户行为模型建立单元包括:
数据获取子单元,用于获取历史用户的历史行为数据;
意图识别子单元,用于识别所述历史行为数据中的历史搜索语句所属的意图类别;
模型建立子单元,用于根据所述历史搜索语句所属的意图类别以及所述历史行为数据,建立用户行为模型。
8.根据权利要求7所述的装置,其特征在于,所述模型建立子单元,具体用于:
从所述历史行为数据中,提取在所述历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中所述用户行为结果根据所述历史搜索语句所属的意图类别确定;
将所述用户行为特征和所述用户行为结果作为训练实例,基于机器学习算法,建立与所述历史搜索语句所属的意图类别对应的用户行为模型。
9.根据权利要求7所述的装置,其特征在于,所述模型建立子单元,具体用于:
从所述历史搜索行为数据中,提取在所述历史搜索语句下的历史搜索结果对应的用户行为特征以及用户行为结果,其中所述用户行为结果根据所述历史搜索语句所属的意图类别确定;
将所述用户行为特征、所述历史搜索语句所属的意图类别特征和所述用户行为结果作为训练实例,基于机器学习算法建立用户行为模型。
10.根据权利要求6-9中任一项所述的方法,其特征在于,意图类别包括如下至少一种:寻址类意图、信息类意图和商品类意图。
CN201510463375.6A 2015-07-31 2015-07-31 搜索方法及装置 Pending CN105069077A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510463375.6A CN105069077A (zh) 2015-07-31 2015-07-31 搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510463375.6A CN105069077A (zh) 2015-07-31 2015-07-31 搜索方法及装置

Publications (1)

Publication Number Publication Date
CN105069077A true CN105069077A (zh) 2015-11-18

Family

ID=54498447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510463375.6A Pending CN105069077A (zh) 2015-07-31 2015-07-31 搜索方法及装置

Country Status (1)

Country Link
CN (1) CN105069077A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
CN106951433A (zh) * 2017-02-04 2017-07-14 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN107194515A (zh) * 2017-05-27 2017-09-22 冯小平 确定用户当前行为以及预测用户意图的方法和装置
CN107274217A (zh) * 2017-05-27 2017-10-20 冯小平 确定用户当前行为以及预测用户意图的方法和装置
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN110968686A (zh) * 2018-09-28 2020-04-07 百度在线网络技术(北京)有限公司 意图识别方法、装置、设备及计算机可读介质
CN111798941A (zh) * 2019-04-04 2020-10-20 Iqvia 有限公司 用于生成临床查询的预测系统
WO2021057741A1 (zh) * 2019-09-23 2021-04-01 杭州海康威视数字技术股份有限公司 图像搜索方法、装置、服务器和存储介质
CN112699277A (zh) * 2019-10-23 2021-04-23 阿里巴巴集团控股有限公司 数据检测的方法和装置
CN113343028A (zh) * 2021-05-31 2021-09-03 北京达佳互联信息技术有限公司 意图确定模型的训练方法和装置
WO2024169406A1 (zh) * 2023-02-13 2024-08-22 深圳市优必选科技股份有限公司 人机对话方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060224587A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for modifying search results based on a user's history
CN102760138A (zh) * 2011-04-26 2012-10-31 北京百度网讯科技有限公司 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN103020289A (zh) * 2012-12-25 2013-04-03 浙江鸿程计算机系统有限公司 一种基于日志挖掘的搜索引擎用户个性化需求提供方法
CN103646070A (zh) * 2013-12-06 2014-03-19 北京趣拿软件科技有限公司 搜索引擎的数据处理方法及装置
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060224587A1 (en) * 2005-03-31 2006-10-05 Google, Inc. Systems and methods for modifying search results based on a user's history
CN102760138A (zh) * 2011-04-26 2012-10-31 北京百度网讯科技有限公司 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN103020289A (zh) * 2012-12-25 2013-04-03 浙江鸿程计算机系统有限公司 一种基于日志挖掘的搜索引擎用户个性化需求提供方法
CN103646070A (zh) * 2013-12-06 2014-03-19 北京趣拿软件科技有限公司 搜索引擎的数据处理方法及装置
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951433B (zh) * 2017-02-04 2020-08-28 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN106951433A (zh) * 2017-02-04 2017-07-14 百度在线网络技术(北京)有限公司 一种检索方法及装置
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
WO2018149115A1 (zh) * 2017-02-15 2018-08-23 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
CN106874467B (zh) * 2017-02-15 2019-12-06 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置
US11669579B2 (en) 2017-02-15 2023-06-06 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for providing search results
CN107194515A (zh) * 2017-05-27 2017-09-22 冯小平 确定用户当前行为以及预测用户意图的方法和装置
CN107274217A (zh) * 2017-05-27 2017-10-20 冯小平 确定用户当前行为以及预测用户意图的方法和装置
CN107357875A (zh) * 2017-07-04 2017-11-17 北京奇艺世纪科技有限公司 一种语音搜索方法、装置及电子设备
CN110968686A (zh) * 2018-09-28 2020-04-07 百度在线网络技术(北京)有限公司 意图识别方法、装置、设备及计算机可读介质
CN111798941A (zh) * 2019-04-04 2020-10-20 Iqvia 有限公司 用于生成临床查询的预测系统
CN111798941B (zh) * 2019-04-04 2023-10-13 Iqvia 有限公司 用于生成临床查询的预测系统
WO2021057741A1 (zh) * 2019-09-23 2021-04-01 杭州海康威视数字技术股份有限公司 图像搜索方法、装置、服务器和存储介质
CN112699277A (zh) * 2019-10-23 2021-04-23 阿里巴巴集团控股有限公司 数据检测的方法和装置
CN113343028A (zh) * 2021-05-31 2021-09-03 北京达佳互联信息技术有限公司 意图确定模型的训练方法和装置
WO2024169406A1 (zh) * 2023-02-13 2024-08-22 深圳市优必选科技股份有限公司 人机对话方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN105069077A (zh) 搜索方法及装置
JP7343568B2 (ja) 機械学習のためのハイパーパラメータの識別および適用
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
JP5721818B2 (ja) 検索におけるモデル情報群の使用
CN102073725B (zh) 结构化数据的搜索方法和实现该搜索方法的搜索引擎系统
CN102053983B (zh) 一种垂直搜索的查询方法、系统和装置
CN111680213B (zh) 信息推荐方法、数据处理方法及装置
CN108228873A (zh) 对象推荐、发布内容推送方法、装置、存储介质和设备
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN105224554A (zh) 推荐搜索词进行搜索的方法、系统、服务器和智能终端
CN102163198A (zh) 提供新词或热词的方法及系统
CN104216881A (zh) 一种个性化标签的推荐方法及装置
CN104915426B (zh) 信息排序方法、用于生成信息排序模型的方法及装置
CN102314452B (zh) 一种通过输入法平台进行导航的方法及系统
CN104699711A (zh) 一种推荐方法及服务器
CN105160545A (zh) 投放信息样式确定方法及装置
CN113190746B (zh) 推荐模型的评估方法、装置及电子设备
CN117591624B (zh) 一种基于语义索引关系的测试用例推荐方法
CN103970858A (zh) 推荐内容确定系统和方法
CN108959550B (zh) 用户关注点挖掘方法、装置、设备及计算机可读介质
CN112445893B (zh) 一种信息搜索方法、装置、设备及存储介质
CN103425767B (zh) 一种提示数据的确定方法和系统
CN110717095B (zh) 服务项目的推送方法及装置
CN114707510B (zh) 资源推荐信息推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151118

RJ01 Rejection of invention patent application after publication