[go: up one dir, main page]

HK1192035B - 一种提供搜索结果的方法及装置 - Google Patents

一种提供搜索结果的方法及装置 Download PDF

Info

Publication number
HK1192035B
HK1192035B HK14105111.7A HK14105111A HK1192035B HK 1192035 B HK1192035 B HK 1192035B HK 14105111 A HK14105111 A HK 14105111A HK 1192035 B HK1192035 B HK 1192035B
Authority
HK
Hong Kong
Prior art keywords
product information
determined
price
standard deviation
average
Prior art date
Application number
HK14105111.7A
Other languages
English (en)
Other versions
HK1192035A (zh
Inventor
李嘉森
姚建强
帅朝谦
Original Assignee
阿里巴巴集团控股有限公司
Filing date
Publication date
Application filed by 阿里巴巴集团控股有限公司 filed Critical 阿里巴巴集团控股有限公司
Publication of HK1192035A publication Critical patent/HK1192035A/zh
Publication of HK1192035B publication Critical patent/HK1192035B/zh

Links

Description

一种提供搜索结果的方法及装置
技术领域
本申请涉及通信技术领域,尤其涉及一种提供搜索结果的方法及装置。
背景技术
目前,大多购物网站都可以向用户提供搜索功能,用户可以通过该搜索功能搜索其想要的商品的商品信息。具体的,用户向购物网站的服务器发送搜索词,服务器基于接收到的搜索词,搜索与该搜索词相关的商品信息,并将搜索到的商品信息提供给用户。
在实际应用中,由于用户通常比较关注的是排序比较靠前的商品信息,因此服务器搜索到商品信息之后,需要对搜索到的商品信息进行排序,并将排序后的商品信息提供给用户。而由于一般用户对商品信息中包含的价格比较关注,因此,在现有技术中,服务器在对搜索到的商品信息进行排序时,可以按照所包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序。
但是,对于同一种商品而言,不同的卖家制定的该商品的出售价格也有所不同。例如,作为买家的用户向服务器发送的搜索词为某品牌的跑鞋,在服务器搜索到的商品信息中,10个商品信息中包含的价格为20元、20个商品信息中包含的价格为100元、5个商品信息中包含的价格为300元。而实际上该品牌的跑鞋的价格应该是120元,显然,作为买家的用户会直观的认为以100元出售该跑鞋更加合理,从而关注这20个所包含的价格为100元的商品信息。
然而,现有技术中服务器只能单一的按照所包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序,假设服务器按照价格由低到高的顺序对上例中搜索到的商品信息进行排序,则排序结果为:10个包含的价格为20元的商品信息、20个包含的价格为100元的商品信息、5个包含的价格为300元的商品信息。
显然,服务器并未将这20个包含的价格为100元的商品信息排在靠前的位置,而是将10个包含的价格为20元的商品信息排在了靠前的位置,因此服务器将排序后的商品信息提供给用户后,排序靠前的商品信息对应的商品往往并不是用户认为价格合理的商品,从而用户就会不断的设置筛选条件进行重新搜索,导致服务器的压力增大。
发明内容
本申请实施例提供一种提供搜索结果的方法及装置,用以解决现有技术中服务器将排序后的商品信息提供给用户后,用户仍需要不断的设置筛选条件进行重新搜索,导致服务器的压力较大的问题。
本申请实施例提供的一种提供搜索结果的方法,包括:
服务器基于接收到的搜索词搜索相关的商品信息;并
查找预先确定的所述搜索词对应的价格最优值;以及
分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
本申请实施例提供的一种提供搜索结果的装置,包括:
搜索模块,用于基于接收到的搜索词搜索相关的商品信息;
最优值确定模块,用于查找预先确定的所述搜索词对应的价格最优值;
提供模块,用于分别确定搜索到的商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
本申请实施例提供一种提供搜索结果的方法及装置,该方法服务器基于接收到的搜索词进行搜索时,查找预先确定的该搜索词对应的价格最优值,分别确定搜索到的每个商品信息中包含的价格与该价格最优值的差值的绝对值,并按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。通过上述方法,服务器向用户提供的商品信息中,排序靠前的商品信息即为包含的价格与价格最优值相差较小的商品信息,与现有技术中单一按照包含的价格从高到低或从低到高的顺序提供搜索结果的方法相比,可以有效减少用户设置筛选条件并重新搜索的次数,这减轻了服务器的压力。
附图说明
图1为本申请实施例提供的提供搜索结果的过程;
图2为本申请实施例提供的拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程;
图3为本申请实施例提供的一种提供搜索结果的装置结构示意图。
具体实施方式
由于现有技术中服务器只能单一的按照包含的价格由高到低或由低到高的顺序对搜索到的商品信息进行排序并提供,因此,现有技术中服务器提供的排序靠前的商品信息所包含的价格往往与大多用户所认为的合理价格相差甚远,这就会导致用户需要不断的设置筛选条件进行重新搜索,导致服务器的压力增大。
本申请实施例服务器预先确定搜索词对应的价格最优值,该搜索词对应的价格最优值即为在基于该搜索词所能搜索到的商品信息所包含的价格中,被大多用户所认为的合理价格,在基于搜索词进行搜索时,按照搜索到的商品信息中包含的价格与预先确定的该搜索词对应的价格最优值的差值的绝对值越小,排序越靠前的方式,对搜索到的商品信息进行排序并提供,从而向用户提供的排序靠前的商品信息即为包含的价格与该搜索词对应的价格最优值较为接近的商品信息,以降低用户通过设置筛选条件进行重新搜索的次数,减轻服务器的压力。
下面结合说明书附图,对本申请实施例进行详细描述。
图1为本申请实施例提供的提供搜索结果的过程,具体包括以下步骤:
S101:服务器基于接收到的搜索词搜索相关的商品信息。
与现有技术中类似的,用户想要搜索某种商品的商品信息时,向服务器发送相应的搜索词,服务器接收到用户发送的搜索词后,基于接收到的该搜索词,搜索与该搜索词相关的商品信息。
S102:查找预先确定的该搜索词对应的价格最优值。
在本申请实施例中,服务器预先针对搜索日志中记录的每个搜索词都确定了相应的价格最优值,因此服务器基于接收到的该搜索词进行搜索后,查找预先确定的该搜索词对应的价格最优值。
其中,预先确定该搜索词对应的价格最优值的方法可以为:根据基于该搜索词所能搜索到的所有商品信息中包含的价格,将该所有商品信息中包含的价格的平均价格作为该搜索词对应的价格最优值,或者将该所有商品信息中包含的价格的中位数作为该搜索词对应的价格最优值。当然,也可以人为设定该搜索词对应的价格最优值。
S103:分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
也即,在对搜索到的商品信息进行排序时,按照所包含的价格与价格最优值的差值的绝对值越小,排序越靠前的方式进行排序,由于预先确定的该搜索词对应的价格最优值更加贴近大多数用户认为的以该搜索词搜索到的商品的合理价格,因此,按照步骤S103中的排序方式对搜索到的商品信息进行排序并提供给用户后,可以有效减少用户设置筛选条件进行重新搜索的次数,从而减轻服务器的压力。
在本申请实施例中,服务器需要预先针对搜索日志中记录的每个使用过的搜索词确定对应的价格最优值,确定某个搜索词对应的价格最优值的方法具体为,服务器查找搜索日志中记录的过去每次基于该搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,并根据查找到的商品信息中包含的价格,确定该搜索词对应的价格最优值。其中,满足指定条件的商品信息包括被用户点击的商品信息。当然,满足指定条件的商品信息还可以包括被用户收藏的商品信息、订购了相应商品的商品信息、分享的商品信息,以及其他用户执行了指定操作的商品信息。并且,服务器在查找过去每次基于该搜索词搜索到的满足指定条件的商品信息时,可以查找过去的设定时间段内每次基于该搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息。
在实际应用中,服务器将基于该搜索词搜索到的商品信息提供给用户后,用户关注的往往是其认为包含的价格比较合理的商品信息,对于其认为包含的价格比较合理的商品信息,用户通常会进行点击操作以详细查看该商品信息,而对于其认为包含的价格不合理的商品信息,用户通常则不会进行点击操作而忽略该商品信息。因此,服务器根据过去每次基于该搜索词搜索到的商品信息中被点击的商品信息中包含的价格,确定该搜索词对应的价格最优值。
例如,假设要确定搜索词“1g显卡”对应的价格最优值,则服务器在搜索日志中查找过去以“1g显卡”为搜索词进行的搜索行为。假设查找到3次搜索行为,则进一步查找进行这3次搜索行为时每次搜索到的商品信息中满足指定条件的商品信息,也即查找每次以“1g显卡”为搜索词进行搜索后,搜索到的商品信息中被用户点击的商品信息。假设查找到第1次搜索到的商品信息中被点击的商品信息为商品A的信息,第2次搜索到的商品信息中被点击的商品信息为商品B的信息,第3次搜索到的商品信息中被点击的商品信息为商品C的信息,则服务器根据查找到的该商品A的信息中包含的价格、商品B的信息中包含的价格、商品C的信息中包含的价格,确定该搜索词“1g显卡”对应的价格最优值。其中,可以将查找到的商品信息中包含的价格的平均值确定为该搜索词对应的价格最优值,也即将商品A的信息、商品B的信息、商品C的信息中分别包含的价格的平均值作为该搜索词对应的价格最优值。
当然,在根据查找到的商品信息中包含的价格确定该搜索词对应的价格最优值时,可根据实际情况将查找到的商品信息中包含的价格转换为统一的度量价格。例如,根据实际情况将查找到的商品信息中包含的价格转换为每个商品的价格,或者每斤商品的价格,或者每升商品的价格,或者每平方米商品的价格等等。
通过上述方法服务器可以更加准确的确定出该搜索词对应的价格最优值,使后续基于该搜索词进行搜索时,通过图1所示的步骤S103对搜索到的商品信息进行排序并提供后,可以进一步减少用户设置筛选条件进行重新搜索的次数,以进一步减轻服务器的压力。
考虑到在实际应用中存在很多相似的搜索词,例如“1g显卡”和“显卡1g”,采用这两个搜索词搜索时,搜索到的商品信息是基本相同的,因此,服务器可以将搜索日志中记录的搜索词进行整理,将相似的搜索词整合为一个归一化搜索词,例如,将搜索词“1g显卡”和搜索词“显卡1g”整合为归一化搜索词“1g显卡”。在查找过去每次以该搜索词搜索到的商品信息中满足指定条件的商品信息时,则基于该搜索词的归一化搜索词在搜索日志中进行查找。
例如,将搜索日志中记录的搜索词“1g显卡”和搜索词“显卡1g”整合为归一化搜索词“1g显卡”后,如果要确定搜索词“显卡1g”对应的价格最优值,则确定该搜索词“显卡1g”的归一化搜索词为“1g显卡”,查找搜索日志中记录的过去每次基于“1g显卡”进行搜索时,搜索到的被用户点击的商品信息,并根据查找到的商品信息中包含的价格确定搜索词“显卡1g”对应的价格最优值。
较佳的,由于在实际应用中,对于以同一个搜索词搜索到的商品信息而言,搜索到的各商品信息中包含的价格的概率密度分布大致上是符合混合双高斯概率分布的,因此,服务器在根据查找到的各个满足指定条件的商品信息中包含的价格,确定该搜索词对应的价格最优值时,可以根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数,并根据拟合的概率密度函数,确定概率密度最大时对应的价格作为该搜索词对应的价格最优值。
其中,采用混合双高斯模型拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程具体如图2所示,图2为本申请实施例提供的拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数的过程,具体包括以下步骤:
S201:根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值。
例如,要确定搜索词“1g显卡”对应的价格最优值,服务器在搜索日志中查找过去以“1g显卡”为搜索词进行的搜索行时,搜索到的商品信息中满足指定条件的商品信息。假设共查找到n个满足指定条件的商品信息,其中,第i个商品信息中包含的价格记为xi,则确定这n个查找到的商品信息中包含的价格的总平均值
S202:根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差。
继续沿用上例,确定了n个商品信息中包含的价格的总平均值之后,采用公式确定这n个商品信息中包含的价格的总标准差σ。
较佳的,对于查找到的商品信息中包含的价格,如果某个商品信息中包含的价格与确定的总平均值相差较大,则该商品信息中包含的价格就是异常数据,异常数据会影响后续拟合的准确性,因此,本申请实施例中服务器还可以剔除查找到的各商品信息包含的价格中的异常数据。具体的,继续沿用上例,针对查找到的n个商品信息中的第i个商品信息中包含的价格xi,如果的值大于3,则确定该第i个商品信息中包含的价格xi为异常数据,剔除该第i个商品信息中包含的价格xi。或者,如果的值不在设定范围内,则确定该第i个商品信息中包含的价格xi为异常数据,剔除该第i个商品信息中包含的价格xi,该设定范围例如可以为0.2~1.8。
S203:将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,第一设定参数大于1,第二设定参数小于1。
继续沿用上例,确定的第一平均值确定的第二平均值其中,a为第一设定参数,b为第二设定参数,本申请实施例中只要保证a和b中一个大于1,另一个小于1即可,例如a为0.3,b为1.3。
S204:将确定的总标准差同时作为第一标准差和第二标准差。
继续沿用上例,确定的第一标准差σ1=σ,确定的第二标准差σ2=σ。
S205:针对查找到的每个商品信息中包含的价格,采用公式确定每个价格对应的中间值。
其中,p为初始设定的权值。初始设定的权值可以设定为0.5。
继续沿用上例,针对查找到的n个商品信息中的第i个商品信息中包含的价格xi,采用上述公式确定该第i个商品信息中包含的价格xi对应的中间值gamma(i)。
S206:根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式重新确定第二平均值。
S207:根据重新确定的第一平均值和第二平均值,采用公式 重新确定第一标准差,采用公式重新确定第二标准差。
其中,公式和中的 mu1和mu2为步骤S206中重新确定的第一平均值和第二平均值。
S208:采用公式重新确定权值。
其中,n为查找到的商品信息的数量。
S209:判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件,若是,则执行步骤S211,否则执行步骤S210。
在本申请实施例中,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件的方法具体为:判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内,判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内,判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内,判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内;当上述四个判断中的至少一个判断结果为是时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件。
当然,也可以当上述四个判断中的至少两个或所有判断结果均为是时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件。
S210:根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,返回步骤S206。
也即,基于重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值, 采用公式重新确定查找到 的每个商品信息中包含的价格对应的中间值,并根据重新确定的每个中间值继续确定第一 平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均 值、第一标准差、第二标准差满足设定条件为止。
S211:根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确 定函数作为拟合的基于所 述搜索词搜索到的商品信息中包含的价格的概率密度函数。
继续沿用上例,当得到满足设定条件的第一平均值、第二平均值、第一标准差、第 二标准差时,根据满足设定条件的第一平均值、第二平均值、第一标准差、第二标准差,以及 最终确定的权值得到函数 即为拟合的基于该搜索词“1g显卡”搜索到的商品信息中包含的价格的概率密度函数。
在后续的过程中,则可以确定概率密度最大时对应的价格作为该搜索词“1g显卡”对应的价格最优值,也即得到的上述函数取最大函数值f(x)max时对应的自变量x的值,就是该搜索词“1g显卡”对应的价格最优值。这是因为,得到上述概率密度函数是基于查找到的满足指定条件的商品信息中包含的价格确定的,而满足指定条件的商品信息是被用户点击的商品信息,因此上述概率密度函数反映了当以该搜索词“1g显卡”进行搜索时,用户点击搜索到的商品信息中包含不同价格的商品信息的概率,点击包含某个价格的商品信息的概率越大,说明认为该价格是合理价格的用户越多,因此将概率密度最大时对应的价格作为该搜索词对应的价格最优值,可以更加准确的确定出该搜索词对应的价格最优值,以进一步减少用户设置筛选条件进行重新搜索的次数,减轻服务器的压力。
其中,在得到拟合的基于该搜索词搜索到的商品信息中包含的价格的概率密度函 数之后,由于该函数的最大 值一定是在mu1和mu2之间出现,因此确定该函数取最大函数值f(x)max时对应的自变量x的值 的方法可以为:将mu1到mu2的范围划分为若干个子范围,例如,可以将mu1到mu2的范围划分 为n个子范围,分别为mu1到mu1+d、mu1+d到mu1+2d、mu1+2d到mu1+3d……、mu1+(n-1)d到mu2,其 中,在划分的每个子范围中随机选择一个x的值,根据得到的概率密度函数确定选择的每个x的值对应 的函数值f(x),将确定的每个函数值f(x)中最大的函数值所对应的x的值确定为该函数取 最大函数值f(x)max时对应的自变量x的值,也即该搜索词对应的价格最优函数。
较佳的,由于统计学中如果要确定某些样本的概率密度分布符合混合双高斯概率分布,就要求不同样本的数量要大于一定阈值,因此,本申请实施例中在采用图2所示的过程拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数之前,还要确定查找到的满足指定条件且所包含的不同价格的商品信息的数量大于设定阈值。
另外,考虑到实际应用中基于某些搜索词搜索到的商品信息中包含的价格往往较高,采用如图2所示的过程拟合基于该搜索词搜索到的商品信息中包含的价格的概率密度函数时所需要的计算量较大,因此,在上述步骤S201中,可以将查找到的每个商品信息中包含的价格进行取对数运算,将得到的结果重新作为每个商品信息中包含的价格。
例如,针对查找到的n个满足指定条件的商品信息中的第i个商品信息中包含的价格xi,可以将log2xi的值重新作为该第i个商品信息中包含的价格,后续则根据重新确定的每个商品信息中包含的价格进行如图2所示的拟合过程。假设根据图2所示的过程最终确定出该搜索词对应的价格最优值为X,则还要将2X重新作为确定的该搜索词对应的价格最优值。
在得到了该搜索词对应的价格最优值后,还可以对得到的该搜索词的价格最优值进行人工调整,并保存该搜索词的价格最优值,用以在后续基于该搜索词进行搜索时,查找该搜索词的价格最优值,并根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值对搜索到的商品进行排序并提供。当然,本申请实施例中服务器对搜索到的商品信息进行排序时,除了根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值进行排序之外,还可以综合搜索到的商品信息与该搜索词的相关性、搜索到的商品信息对应的商品的质量、提供搜索到的商品信息对应的卖家的质量等因素对搜索到的商品信息进行排序。
服务器也可以仅当接收到用户发送的按照价格最优值进行排序的请求时,才根据搜索到的各商品信息中包含的价格以及该搜索词对应的价格最优值对搜索到的商品信息进行排序并提供,未接收到按照价格最优值进行排序的请求时,则按照默认的排序规则对搜索到的商品信息进行排序并提供。
图3为本申请实施例提供的一种提供搜索结果的装置结构示意图,具体包括:
搜索模块301,用于基于接收到的搜索词搜索相关的商品信息;
最优值确定模块302,用于查找预先确定的所述搜索词对应的价格最优值;
提供模块303,用于分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。
所述最优值确定模块302具体用于,查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
所述最优值确定模块302具体用于,根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
所述最优值确定模块302具体包括:
初始化单元3021,用于根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值,根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差,将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;将确定的总标准差同时作为第一标准差和第二标准差;
训练单元3022,用于针对查找到的每个商品信息中包含的价格,采用公式确定每个价格对应的中间 值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为 第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品 信息中包含的价格对应的中间值;根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式重新确定第二 平均值;根据重新确定的第一平均值和第二平均值,采用公式 重新确定第一标准差,采用公式重新确定第二标准差;采用公 式重新确定权值,其中,n为查找到的商品信息的数量;判断重新确定的第 一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;当判断结果为否时,根 据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格 对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准 差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足 所述设定条件为止;
函数确定单元3023,用于当所述训练单元3022判断重新确定的第一平均值、第二平均 值、第一标准差、第二标准差满足设定条件时,根据重新确定的第一平均值、第二平均值、第一 标准差、第二标准、权值,确定函数 作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数。
所述训练单元3022具体用于,当判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内时,或者,当判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内时,或者,当判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内时,或者,当判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件。
本申请实施例提供一种提供搜索结果的方法及装置,该方法服务器基于接收到的搜索词进行搜索时,查找预先确定的该搜索词对应的价格最优值,分别确定搜索到的每个商品信息中包含的价格与该价格最优值的差值的绝对值,并按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供。通过上述方法,服务器向用户提供的商品信息中,排序靠前的商品信息即为包含的价格与价格最优值相差较小的商品信息,与现有技术中单一按照包含的价格从高到低或从低到高的顺序提供搜索结果的方法相比,可以有效减少用户设置筛选条件并重新搜索的次数,这减轻了服务器的压力。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种提供搜索结果的方法,其特征在于,包括:
服务器基于接收到的搜索词搜索相关的商品信息,所述商品信息包括商品的价格;并
从预先针对搜索日志中记录的每个搜索词确定的相应的价格最优值中,查找接收到的所述搜索词对应的价格最优值,其中,一个搜索词相应的价格最优值是通过查找搜索日志记录的过去基于所述一个搜索词进行搜索时,搜索到的满足指定条件的商品信息包含的价格确定的;以及
分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照分别确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供;
其中,预先确定的搜索词对应的价格最优值是用户认为的以该搜索词搜索到的商品的合理价格。
2.如权利要求1所述的方法,其特征在于,确定所述搜索词对应的价格最优值,具体包括:
所述服务器查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;
根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
3.如权利要求2所述的方法,其特征在于,根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值,具体包括:
根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数;
根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
4.如权利要求3所述的方法,其特征在于,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,具体包括:
根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值;
根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差;
将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;
将确定的总标准差同时作为第一标准差和第二标准差;
针对查找到的每个商品信息中包含的价格,采用公式确定每个价格对应的中间值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品信息中包含的价格对应的中间值;
根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式重新确定第二平均值;
根据重新确定的第一平均值和第二平均值,采用公式重新确定第一标准差,采用公式重新确定第二标准差;
采用公式重新确定权值,其中,n为查找到的商品信息的数量;
判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;
若是,则根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数;
否则,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件为止。
5.如权利要求4所述的方法,其特征在于,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件,具体包括:
判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内;或者
判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内;或者
判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内;或者
判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内。
6.一种提供搜索结果的装置,其特征在于,包括:
搜索模块,用于基于接收到的搜索词搜索相关的商品信息,所述商品信息包括商品的价格;
最优值确定模块,用于从预先针对搜索日志中记录的每个搜索词确定的相应的价格最优值中,查找接收到的所述搜索词对应的价格最优值,其中,一个搜索词相应的价格最优值是通过查找搜索日志记录的过去基于所述一个搜索词进行搜索时,搜索到的满足指定条件的商品信息包含的价格确定的;
提供模块,用于分别确定搜索到的每个商品信息中包含的价格与查找到的价格最优值的差值的绝对值,按照确定的绝对值由小到大的顺序对搜索到的商品信息进行排序并提供;
其中,预先确定的搜索词对应的价格最优值是用户认为的以该搜索词搜索到的商品的合理价格。
7.如权利要求6所述的装置,其特征在于,所述最优值确定模块具体用于,查找搜索日志中记录的过去每次基于所述搜索词进行搜索时,搜索到的商品信息中满足指定条件的商品信息,其中,满足指定条件的商品信息包括被用户点击的商品信息;根据查找到的商品信息中包含的价格,确定所述搜索词对应的价格最优值。
8.如权利要求7所述的装置,其特征在于,所述最优值确定模块具体用于,根据查找到的商品信息中包含的价格,采用混合双高斯模型拟合基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数,根据拟合的概率密度函数,确定概率密度最大时对应的价格作为所述搜索词对应的价格最优值。
9.如权利要求8所述的装置,其特征在于,所述最优值确定模块具体包括:
初始化单元,用于根据查找到的商品信息中包含的价格,确定查找到的商品信息中包含的价格的总平均值,根据查找到的商品信息中包含的价格以及确定的总平均值,确定查找到的商品信息中包含的价格的总标准差,将确定的总平均值与第一设定参数的乘积作为第一平均值,将确定的总平均值与第二设定参数的乘积作为第二平均值,其中,所述第一设定参数大于1,所述第二设定参数小于1;将确定的总标准差同时作为第一标准差和第二标准差;
训练单元,用于针对查找到的每个商品信息中包含的价格,采用公式确定每个价格对应的中间值,其中,p为初始设定的权值,mu1为第一平均值,mu2为第二平均值,σ1为第一标准差,σ2为第二标准差,xi为查找到的第i个商品信息中包含的价格,gamma(i)为查找到的第i个商品信息中包含的价格对应的中间值;根据确定的每个价格对应的中间值,采用公式重新确定第一平均值,采用公式重新确定第二平均值;根据重新确定的第一平均值和第二平均值,采用公式重新确定第一标准差,采用公式重新确定第二标准差;采用公式重新确定权值,其中,n为查找到的商品信息的数量;判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差是否满足设定条件;当判断结果为否时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准差、权值,重新确定每个价格对应的中间值,并根据重新确定的每个中间值继续确定第一平均值、第二平均值、第一标准差、第二标准差和权值,直至确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件为止;
函数确定单元,用于当所述训练单元判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足设定条件时,根据重新确定的第一平均值、第二平均值、第一标准差、第二标准、权值,确定函数作为拟合的基于所述搜索词搜索到的商品信息中包含的价格的概率密度函数。
10.如权利要求9所述的装置,其特征在于,所述训练单元具体用于,当判断重新确定的第一平均值与上一次确定的第一平均值的差值在设定范围内时,或者,当判断重新确定的第二平均值与上一次确定的第二平均值的差值在设定范围内时,或者,当判断重新确定的第一标准差与上一次确定的第一标准差的差值在设定范围内时,或者,当判断重新确定的第二标准差与上一次确定的第二标准差的差值在设定范围内时,判断重新确定的第一平均值、第二平均值、第一标准差、第二标准差满足所述设定条件。
HK14105111.7A 2014-05-30 一种提供搜索结果的方法及装置 HK1192035B (zh)

Publications (2)

Publication Number Publication Date
HK1192035A HK1192035A (zh) 2014-08-08
HK1192035B true HK1192035B (zh) 2021-01-22

Family

ID=

Similar Documents

Publication Publication Date Title
TWI518529B (zh) Search result sorting method and device
JP5860456B2 (ja) 検索語重み付けの決定および利用
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
JP5693746B2 (ja) 製品情報のランク付け
US9934293B2 (en) Generating search results
US8880513B2 (en) Presentation of items based on a theme
US20160070762A1 (en) Topic Profile Query Creation
EP2842060A1 (en) Recommending keywords
CN112579854A (zh) 信息处理方法、装置、设备和存储介质
CN103279486A (zh) 一种提供相关搜索的方法和装置
WO2015185020A1 (en) Information category obtaining method and apparatus
CN110427546A (zh) 一种信息展示方法和装置
CN109948048A (zh) 一种商品搜索、排序、展示方法及系统
CN107169821B (zh) 大数据查询推荐方法及其系统
CN114064728B (zh) 一种数据查询方法、装置、电子设备、介质及产品
CN103514187B (zh) 一种提供搜索结果的方法及装置
CN106909647B (zh) 一种数据检索方法及装置
CN104331823B (zh) 确定发布信息中关键词保留价格的方法及装置
CN110110267B (zh) 提取对象特征、搜索对象的方法和装置
US9646094B2 (en) System and method for performing a multiple pass search
HK1192035B (zh) 一种提供搜索结果的方法及装置
CN103631832A (zh) 业务对象排序方法、业务对象搜索方法及相关装置
CN111831796B (zh) 一种用户请求的处理方法、装置、电子设备及存储介质
US20160063109A1 (en) Query-breadth selected search result sorting mechanism
TWI486799B (zh) A method and a device for determining a weight value of a search word, a search result generating method, and a device