[go: up one dir, main page]

CN104008180A - 结构化数据与图片的关联方法与关联装置 - Google Patents

结构化数据与图片的关联方法与关联装置 Download PDF

Info

Publication number
CN104008180A
CN104008180A CN201410253722.8A CN201410253722A CN104008180A CN 104008180 A CN104008180 A CN 104008180A CN 201410253722 A CN201410253722 A CN 201410253722A CN 104008180 A CN104008180 A CN 104008180A
Authority
CN
China
Prior art keywords
picture
description information
structured data
text
extended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410253722.8A
Other languages
English (en)
Other versions
CN104008180B (zh
Inventor
陶哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 360 Zhiling Technology Co ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410253722.8A priority Critical patent/CN104008180B/zh
Publication of CN104008180A publication Critical patent/CN104008180A/zh
Priority to PCT/CN2015/080712 priority patent/WO2015188719A1/zh
Application granted granted Critical
Publication of CN104008180B publication Critical patent/CN104008180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Software Systems (AREA)

Abstract

本发明提供了结构化数据与图片的关联方法与关联装置,其中关联方法包括:获取图片的文字描述信息,对文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的至少一条结构化数据与图片进行关联。本发明能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。

Description

结构化数据与图片的关联方法与关联装置
技术领域
本发明涉及互联网应用领域,特别是涉及一种结构化数据与图片的关联方法与关联装置,以及一种生成结构化数据搜索结果项的方法、装置与系统。
背景技术
随着技术的发展,网络已经成为人们目前最大的资料来源。当用户需要了解某些特定信息时,最常用的方式就是到网上获取,网络资源库已以其内容的多、全的特性取代了曾经的纸质资源库。
当用户通过网络搜索到想要的图片后,虽然通过现有的图片描述文本能够获取到一定量的关于图片内容的信息,但现有的描述文本往往信息量少、不规范,且文本内容有限,一般的搜索引擎无法对其进行准确分类和识别,从而也无法为用户提供更多更精准的结果,也无法得到关于图片内容的扩展信息。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的结构化数据与图片的关联方法和相应的关联装置。
依据本发明实施例的一个方面,提供了一种结构化数据与图片的关联方法,包括:获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;将选择的所述至少一条结构化数据与所述图片进行关联。
可选地,对所述文字描述信息进行语意扩展,包括:分别对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词,或称作停用词;对删除后的部分进行语意扩展。
可选地,所述停止词包括下列至少之一:的、得、地。
可选地,所述图片的文字描述信息,包括下列至少之一:图片所在页面的标题;图片周围的文本;图片的anchor文本;图片的名称,其中,所述图片的名称由上述文本至少之一获得。
依据本发明实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的方法,包括:获取搜索查询词对应匹配的图片;根据所述图片被赋予的结构化数据,生成搜索结果项。
依据本发明实施例的另一个方面,还提供了一种结构化数据与图片的关联装置,包括:扩展模块,配置为获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;匹配模块,配置为将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;选择模块,配置为在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;关联模块,配置为将选择的所述至少一条结构化数据与所述图片进行关联。
可选地,所述扩展模块还配置为:对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;对删除后的部分进行语意扩展。
可选地,所述停止词包括下列至少之一:的、得、地。
可选地,所述图片的文字描述信息,包括下列至少之一:图片所在页面的标题;图片周围的文本;图片的anchor文本;图片的名称,其中,所述图片的名称由上述文本至少之一获得。
依据本发明实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的装置,包括:获取模块,配置为获取搜索查询词对应的图片;生成模块,配置为根据所述图片以及所述图片关联的结构化数据,生成搜索结果页。
依据本发明实施例的另一个方面,还提供了一种生成结构化数据搜索结果项的系统,包括:百科数据库,配置为包括多个主题,每个主题包括多条结构化数据;图片数据库,配置为存储有多张图片;对每张图片的文字描述信息进行语意扩展,得到扩展后的扩展描述信息;以及,根据所述扩展后的描述信息与百科数据库匹配,关联该图片与匹配得到的至少一条结构化数据;用户终端,配置为输入图片的搜索查询词;搜索引擎,配置为在所述图片数据库中搜索并获取所述搜索查询词对应的图片,以及,在所述百科数据库中搜索并获取与所述图片关联的结构化数据,结合获取的所述图片以及与所述图片关联的关联信息,生成搜索结果页。
本发明实施例中,为使图片与结构化数据相关联,首先获取图片的文字描述信息,并对图片的文字描述信息进行语意扩展得到扩展描述信息。扩展描述信息涵盖文字描述信息的内容并能够通过语意扩展将描述范围扩大。在百科数据库中,大量结构化数据按照主题进行分类存储,百科数据库中每个主题下包含多条结构化数据。利用扩展描述信息与百科数据库相匹配,确定与扩展描述信息相匹配的主题,进而在确定的主题下选择与扩展描述信息匹配的若干条结构化数据。由于扩展描述信息是在文字描述信息的基础上得到的,因此通过确定与扩展描述信息相匹配的主题,等同于确定与图片对应的结构化数据所属的主题,这种首先确定主题的匹配方式能够保证最后获得结构化数据的准确性,当不同图片的文字描述信息出现雷同情况时可以通过主题进行区分,避免出现图片与结构化数据的关联错误。通过设定指定相关度,选择相匹配的主题下与扩展描述信息的相关度超过指定相关度的至少一条结构化数据与图片进行关联,能够保证结构化数据与图片的匹配程度,并为图片关联到尽可能多的结构化数据。由此可见,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本发明实施例中的关联方法能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的结构化数据与图片的关联方法的处理流程图;
图2示出了根据本发明一个实施例的生成结构化数据搜索结果项的方法的处理流程图;
图3示出了根据本发明一个实施例的结构化数据与图片的关联装置的结构示意图;
图4示出了根据本发明一个实施例的生成结构化数据搜索结果项的装置的结构示意图;以及
图5示出了根据本发明一个实施例的生成结构化数据搜索结果项的系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为解决上述问题,达到向用户提供更精准的图片搜索结果,还向用户提供关于图片内容的扩展信息的目的,本发明实施例提供了一种将图片与结构化数据关联起来的新的发明构思。其中结构化数据是经过规定格式的字段所组成的数据,一般可以通过对存储在百科数据库中的词条对应的数据信息提取加工得到,充分利用百科数据库信息量大且信息可靠性较强的特性,将得到的结构化数据存储在百科数据库中。当然个别结构化数据也可以通过人工编辑的方式获取,但是仅仅依靠人工编辑无法满足海量的结构化数据生成及其字段更新的需要。
基于上述发明构思,本发明实施例提供了一种结构化数据与图片的关联方法。图1示出了根据本发明一个实施例的结构化数据与图片的关联方法的处理流程图。参见图1,该结构化数据与图片的关联方法至少包括步骤S102至步骤S108。
步骤S102、获取图片的文字描述信息,对文字描述信息进行语意扩展,得到扩展后的扩展描述信息。
步骤S104、将扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与扩展描述信息匹配的主题。
步骤S106、在匹配的主题包括的多条结构化数据中,选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据。
步骤S108、将选择的至少一条结构化数据与图片进行关联。
本发明实施例中,为使图片与结构化数据相关联,首先获取图片的文字描述信息,并对图片的文字描述信息进行语意扩展得到扩展描述信息。扩展描述信息涵盖文字描述信息的内容并能够通过语意扩展将描述范围扩大。在百科数据库中,大量结构化数据按照主题进行分类存储,百科数据库中每个主题下包含多条结构化数据。利用扩展描述信息与百科数据库相匹配,确定与扩展描述信息相匹配的主题,进而在确定的主题下选择与扩展描述信息匹配的若干条结构化数据。由于扩展描述信息是在文字描述信息的基础上得到的,因此通过确定与扩展描述信息相匹配的主题,等同于确定与图片对应的结构化数据所属的主题,这种首先确定主题的匹配方式能够保证最后获得结构化数据的准确性,当不同图片的文字描述信息出现雷同情况时可以通过主题进行区分,避免出现图片与结构化数据的关联错误。通过设定指定相关度,选择相匹配的主题下与扩展描述信息的相关度超过指定相关度的至少一条结构化数据与图片进行关联,能够保证结构化数据与图片的匹配程度,并为图片关联到尽可能多的结构化数据。由此可见,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本发明实施例中的关联方法能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
为使本发明实施例容易理解,现举例对其进行具体说明。以一张人物为明星刘小明的图片举例,图片内容是刘小明和张大亮一同出席亚洲电影节颁奖典礼,为使用户在检索明星刘小明的图片时,能够准确的检索到这张图片,还能获取关于明星刘小明的信息,应用本发明实施例的目的是将该图片与百科数据库中明星刘小明的结构化数据进行关联。关联的具体过程如下。首先获取图片的文字描述信息,文字描述信息是“刘小明和张大亮一同为亚洲电影节颁奖”,百科数据库中存在很多个不同的叫刘小明的名人,有著名教授刘小明、明星刘小明等,关于每个刘小明都有很多结构化数据,比如关于明星刘小明的结构化数据包括:明星刘小明的年龄、出生地、他最近的新闻、活动、以及影视作品、音乐作品等数据信息中的一项或几项的组合;关于教授刘小明的结构化数据包括:教授刘小明的年龄、工作学校、教学经历及所获荣誉中的一项或几项的组合。由此可以发现,由于百科数据库中存在若干个不同身份但名字相同的刘小明,针对每个刘小明都有很多结构化数据,因此仅仅通过图片的文字描述信息无法确定图片应当与哪个刘小明的结构化数据相关联。
为在若干个身份不同的刘小明的结构化数据中筛选出明星刘小明的结构化数据,并将其与图片进行关联,需要对百科数据库中的结构化数据进行分析。结构化数据是经过规定格式的字段所组成的数据,一般可以通过对存储在百科数据库中的词条对应的数据信息提取加工得到。
数据信息的提取加工过程可采用多种方式,比如首先提取百科数据库中全部词条对应的所有的数据信息,每个词条对应的数据信息通常是一个名称,然后对应一段描述的信息。然后对提取得到的所有数据信息中的每个词分别进行基于TF-IDF(term frequency—inverse document frequency,词频—反文档频率)算法的权值计算。基于TF-IDF算法的某个词的权值计算可以用所有数据信息中总词汇的个数除以该词出现的次数来实现。因此当所有数据信息中总词汇的个数一定时,对于天然出现次数就比较多的词,比如“的、了”等无实质意义的词,其权值就相对较小。通过权值计算可以排除天然出现次数较多、权值相对较小的无实质意义的词,从而筛选出数据信息中有实质意义的词。最后对权值计算后的数据信息进行一系列预设规则的处理,可以是对每个字段的格式处理等。至此就完成了数据信息的提取加工,得到了结构化数据。
百科数据库对结构化数据进行了主题划分,每个主题下包含大量同主题的结构化数据。百科数据库中对主题的确定是基于词共现来计算的。词共现指的是若干个词共同出现。如果若干个词经常共同出现,可以共同出现在一句话中,也可以是一个自然段中,则认为这些词的语意之间是相互关联的。比如“360”、“安全卫士”、“电脑体检”这三个词中经常共同出现在一句话中,因此认为这三个词之间的语意是关联的。词共现率指的是若干个词共同出现的概率。若干个词的共现率越高,则彼此之间的语意关联越密切。因此可以将词共现率较高的若干个词划分为一个主题。可以利用PLSA(Probability Latent SemanticAnalysis,概率潜在语义分析)主题模型,通过词共现计算和矩阵方程对结构化数据中的所有词进行计算分析,将共现率比较高的若干个词划分为一个主题,同时得到主题中每个词出现的概率,一个词可以在每个主题中重复出现。如利用PLSA主题模型,将“360”、“安全卫士”、“电脑体检”三个词划分在一个主题中,该主题中“360”出现的概率是0.6777,同时,PLSA主题模型也将“360”和“互联网企业”两个词划分在一个主题中,该主题中“360”出现的概率是0.553。同一个主题下的词可以按照一定的规则进行排序,可以按照词出现概率的由高到低进行排序,也可以按照其它规则进行排序。
基于以上结构化数据的获取和存储方法,百科数据库将关于明星刘小明的结构化数据存储在娱乐主题下,关于教授刘小明的结构化数据存储在教育主题下。基于这种分主题的存储方式,为了筛选出明星刘小明的结构化数据,可以首先确定图片对应的结构化数据所属的主题,然后在所属的主题下选择需要的结构化数据,从而避免由于人物重名等原因使图片关联错误的结构化数据。为了确定与图片对应的结构化数据所属的主题,可以对图片的文字描述信息进行语意扩展,得到涵盖文字描述信息的内容并且比文字描述信息范围更广的扩展描述信息,利用扩展描述信息与百科数据库相匹配,确定与扩展描述信息相匹配的主题,从而确定与图片对应的结构化数据所属的主题。
将本例中图片的文字描述信息“刘小明和张大亮一同为亚洲电影节颁奖”进行语意扩展,由于张大亮是著名影视导演,因此通过对人名“张大亮”进行扩展,能够得到“导演、影视、娱乐”等一系列有关的词。对“亚洲电影节”进行扩展,能够得到“电影、活动、娱乐、影视”等一系列词。由“张大亮”、“亚洲电影节”进行扩展后得到的词共同组成扩展描述信息。将上述扩展描述信息与百科数据库中主题的分类进行匹配可确定上述扩展描述信息所属的主题为娱乐主题,因此与该图片中的“刘小明”对应的结构化数据存储在娱乐主题下。
本例中,娱乐主题下存有很多娱乐类的结构化数据,为能够在大量的结构化数据中获取到与扩展描述信息相关度较高的数据,从而为图片提供准确的数据信息,设定指定相关度作为匹配结构化数据的标准。本例中计算扩展描述信息和某一条结构化数据的相关度时,首先取扩展描述信息和该条结构化数据的交集和并集,交集是扩展描述信息中和该条结构化数据中都包含的词的集合,并集是扩展描述信息中和该条结构化数据中出现的所有的词的集合。交集中词的个数与并集中词的个数之比,就是扩展描述信息和该条结构化数据的相关度。交集中词的个数与并集中词的个数之比越大,说明扩展描述信息和该条结构化数据相关度越高。
相关度具体计算公式为其中Sij表示文本i和文本j的相关度,Di表示文本i中所含有的词,Dj表示文本j中所含有的词,Di∩Dj表示文本i和文本j的交集,即文本i和文本j中都包含的词的集合,Di∪Dj表示文本i和文本j的并集,即文本i和文本j中出现的所有的词的集合。
在本发明实施例中,为了从娱乐类主题中获取到关于刘小明的结构化数据,设定指定相关度为70%。对于娱乐主题下关于其他明星的与刘小明无关的结构化数据,可以迅速判断出与扩展描述信息相关度小于70%。在相关度超过70%的结构化数据中,选择至少一条刘小明的结构化数据与图片进行关联,从而为用户提供关于刘小明的信息。基于本例中的扩展描述信息,本例中选择的刘小明的结构化数据可以是“刘小明,连续五年担任亚洲电影节的颁奖嘉宾,曾自爆想改行当导演。”
在本实例中,应用本发明实施例中的结构化数据与图片的关联方法,由于先利用扩展描述信息确定匹配的主题,即先确定与刘小明对应的娱乐主题,再从娱乐主题中进行结构化数据的选择,能够保证最后获得的结构化数据的准确性,避免图片与教授刘小明的结构化数据相互关联。设定指定相关度并选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据与图片进行关联,能够保证为用户提供准确的关于图片内容的扩展信息。
为图片关联结构化数据时,有时会出现无法建立关联关系的情况。比如对于图片主题名为“刘小明与王大川一同赴宴”的图片,对应主题名的这条文本描述信息,出现了“刘小明”、“王大川”、“赴宴”等词,通过对“王大川”扩展可得到“著名企业家、经济学家”等扩展信息,从而判断属于经济领域,而对“赴宴”进行扩展无法确定主题领域,而数据库中的几个“刘小明”都不存在与经济领域或类型相匹配的情况,因此此时就算通过扩展也无法确定文本描述信息所属的主题,从而也无法建立此图片与数据库中某一个刘小明的结构化数据的关联关系。
在主题下选择结构化数据时,可能存在有若干条相关度超过指定相关度的结构化数据,并且这些结构化数据具有相同的相关度的情况。在本发明另一个实施例中,同样提供了一张关于明星刘小明的图片,文字描述信息是“刘小明在横店拍戏”,通过对文字描述信息进行扩展得到“电影、娱乐、明星、拍摄”等扩展描述信息,这些扩展描述信息能够与百科数据库中的娱乐主题进行匹配,在娱乐主题下检索到关于刘小明的很多结构化数据,比如“刘小明,著名的电影演员,擅长拍摄武打戏”与“刘小明,曾拍摄过50多部电影,新戏刚在横店开机”等,这些结构化数据都是与扩展描述信息相关度为80%的结构化数据,这时如果这类结构化数据数量不多,满足同时与图片进行关联的数量要求,可以同时选择出来与图片进行匹配。如果这种相关度都很高的结构化数据数量大,比如多达数千条,无法同时与图片进行关联,可以从中选择内容最新的,信息最全面的若干条与图片进行匹配。当图片与多条结构化数据进行匹配时,可以将结构化数据按照相关度等级进行排序。
在某些情况下,在主题下进行搜索时,提起设定好的相关度可能会过高,导致检索不到合适的结构化数据。比如在某主题下,将指定相关度定为90%,通过检索可能发现找不到与扩展描述信息匹配的结构化数据,或者检索到的能匹配结构化数据很少,而检索过程中发现与扩展描述信息的相关度为80%的结构化数据很多,信息量比较大,这时可以自动降低相关度为80%,从而为用户提供尽可能多的关于图片内容的扩展信息。
上述具体实例中的相关度的数值、以及选择出的与图片匹配的结构化数据的条数均仅为例举,对本发明并未造成限定。在具体实施时,相关度的数值、以及选择出的与图片匹配的结构化数据的条数均由具体情况而定。
本发明另一个优选实施例还提供了一张展示白云和大地的图片,图片的文字描述信息是“大地,白云”,利用图1中所示的关联方法的目的是将大地的结构化数据与图片进行关联。百科数据库中可能存在若干种条关于大地的结构化数据,可能是自然景观中的大地的结构化数据,也可能是某首名为大地的歌曲的结构化数据,如果直接用文字描述信息与百科数据库相匹配,无法确定关联哪条结构化数据,同时关联肯定会出现错误。这时对图片的文字描述信息“大地,白云”进行扩展,通过扩展描述信息可以确定相匹配的主题是自然景观,从而在自然景观主题下选择相匹配的结构化数据,最终能够将自然景观中的关于大地结构化数据与图片进行关联,确保图片关联到准确的结构化数据。
由上述发明实施例可知,应用本发明实施例中的关联方法能够通过图片与对应的结构化数据相互匹配的手段,达到结构化数据与图片准确关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
在本发明的一个优选实施例中,图片的文字描述信息至少包括图片所在页面的标题、图片周围的文本、图片的anchor文本(链接锚文本)和图片的名称中的一项或多项。
在获取到图片后,可以通过图片所在页面的标题、图片周围的文本、图片的anchor文本(链接锚文本)和图片的名称中的一项或多项获得图片的名称。尽可能获取多的图片描述信息在扩展后更容易与百科数据库中的主题进行匹配。
在对文字描述信息进行扩展时,可以发现,有些词出现的频率很高,但是却又没有实质意义,这类词称为停止词。停止词的存在对于语意扩展没有帮助,因此在对文字描述信息进行扩展时,首先对文字描述信息进行分析,删除这些无实质意义的停止词,保证留下一些对于匹配操作有意义的词。常见的停止词有的、得、地等词。停止词包括但不仅限于的、得、地等词,还包括大量无意义的语义词。通常在百科数据库中出现次数越多的词,在扩展时会认为其越接近无意义,因此会认为是停止词而予以删除。对删除后的部分进行语意扩展,增加了语意扩展的准确性。通过对文字描述信息进行基于TF-IDF算法的权值计算,能够排除对于扩展没有意义的停止词。停止词也叫做停用词。
在本发明的另一个优选实施例中,对于在上述例子中提到的“刘小明和张大亮一同为亚洲电影节颁奖”这句文字描述信息,“和”、“为”就是停止词,在进行扩展时,首先对其进行删除。再分析句子“刘小明张大亮一同亚洲电影节颁奖”可以发现,“一同”和“颁奖”虽然不是无意义词,不属于停止词范畴,但也没有对匹配主题起到帮助作用,因此在删除停止词之后,还应对文字描述信息进行分析,提取出能作为检索关键字的名词,然后再进行扩展。可以发现,本例中有作用的名词是“张大亮”、“亚洲电影节”,因此对着两个词进行扩展,很容易就能够和百科数据库中的娱乐主题进行匹配。
本发明实施例中采用从文字描述信息中删除停止词,提取关键字,再进行语意扩展的方法对文字描述信息进行扩展,保证了扩展的有效性,能够在百科数据库中准确匹配到合适的主题。
基于同一发明构思,本发明实施例还提供了一种生成结构化数据搜索结果项的方法。图2示出了根据本发明一个实施例的生成结构化数据搜索结果项的方法的处理流程图。如图2所示,生成结构化数据搜索结果项的方法至少包括步骤S202至S204。
S202、获取搜索查询词对应匹配的图片。
S204、根据图片被赋予的结构化数据,生成搜索结果项。
本发明实施例中,在获取到查询词后,会自动获取与查询词相匹配的图片,并且图片已经通过图1所示的结构化数据与图片的关联方法与对应的结构化数据进行了关联,再根据图片与关联的结构化数据生成搜索结果项。生成的搜索结果项可以是一个与查询词相匹配的图片,并且图片和相应的结构化数据进行了链接,通过点击图片可以跳转到相应的结构化数据页面,也可以是一个包含图片和对应的结构化数据的网页,搜索结果项的具体实施方式视具体情况而定。
通过本发明实施例中的生成结构化数据搜索结果项的方法,根据查询词生成搜索结果项,能够为用户提供更准确的搜索结果,还能为用户提供关于图片内容的扩展信息。
以搜索刘小明的图片为例,应用本发明实施例中的生成结构化数据搜索结果项的方法,在获取到关键字“刘小明”后,会自动获取与“刘小明”相匹配的图片,图片已经通过图1所示的结构化数据与图片的关联方法与对应的结构化数据进行了关联,根据图片与关联的结构化数据生成搜索结果项。搜索结果项可以是一个包含刘小明图片的网页,同时网页自动链接关于刘小明的结构化数据,点击搜索到的刘小明的图片即可自动跳转到包含刘小明的结构化数据的页面,搜索结果项也可以是一个包含刘小明图片的网页,网页中还提供与刘小明对应的结构化数据。此处只是示意性的举例,搜索结果项也可以以其他形式展示给用户。
相应地,用户在搜索“刘小明”时,不仅能获取到刘小明的图片,还能获取到刘小明的结构化数据。本例中给出的用户获取刘小明的结构化数据的方法如点击图片只是适宜性的举例,对本发明并未造成限定。在具体实施时,具体方法视具体情况而定。
对应图1中示出的结构化数据与图片的关联方法,图3提供了结构化数据与图片的关联装置的结构示意图。如图3所示,本发明实施例提供一种结构化数据与图片的关联装置,包括:
扩展模块310,配置为获取图片的文字描述信息,对文字描述信息进行语意扩展,得到扩展后的扩展描述信息。
匹配模块320,配置为将扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与扩展描述信息匹配的主题。
选择模块330,配置为在匹配的主题包括的多条结构化数据中,选择与扩展描述信息相关度超过指定相关度的至少一条结构化数据。
关联模块340,配置为将选择的至少一条结构化数据与图片进行关联。
本发明实施例中,为使图片与结构化数据相匹配,利用扩展模块310获取图片的文字描述信息,然后并对图片的文字描述信息进行语意扩展得到扩展描述信息,扩展描述信息涵盖文字描述信息的内容并通过关联词扩大描述的范围。在百科数据库中,大量结构化数据按照主题进行分类存储,百科数据库中每个主题下包含多条结构化数据。将扩展描述信息与百科数据库相匹配,确定与扩展描述信息相关联的主题,进而在确定的主题下选择与扩展描述信息匹配的若干条结构化数据。这种利用匹配模块320首先确定主题的匹配方式保证了最后获得结构化数据的准确性,当不同图片的文字描述信息出现雷同情况时可以通过主题进行区分,避免出现图片与结构化数据的关联错误。在选择模块330中设定指定相关度,利用选择模块330选择相匹配的主题下超过指定相关度的至少一条结构化数据与图片进行关联,能够保证结构化数据与扩展描述信息的匹配程度,并为图片关联到尽可能多的结构化数据。由此可见,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本发明实施例中的关联装置能够通过图片与对应的结构化数据相互匹配的手段,达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
在本发明的另一个实施例中,扩展模块310还需要对文字描述信息进行分析,删除其中出现次数多又无意义的停止词,停止词包括但不限于的、得、地,还包括大量无意义的语义词。
在本发明的一个优选实施例中,图片的文字描述信息至少包括图片所在页面的标题、图片周围的文本、图片的anchor文本(链接锚文本)和图片的名称中的一项或多项。其中,图片的名称从上述文本中的至少一项获得。
对应图2中示出的生成结构化数据搜索结果项的方法,图4示出了根据本发明一个实施例的生成结构化数据搜索结果项的装置的结构示意图。如图4所示,本发明实施例提供了一种生成结构化数据搜索结果项的装置,包括:
获取模块410,配置为获取搜索查询词对应的图片。
生成模块420,配置为根据图片以及图片关联的结构化数据,生成搜索结果页。
本发明实施例中,在搜索图片的查询词后,通过获取模块410会自动获取与查询词相匹配的图片,图片已经通过图1所示的方法与对应的结构化数据进行了关联。利用生成模块420根据图片与关联的结构化数据生成搜索结果页面。搜索结果页面可以是一个包含搜索到的图片的网页,同时网页自动链接一个含有对应的结构化数据的网页,通过点击网页的方式即可跳转,也可以是一个包含图片和对应的结构化数据的网页,搜索结果项的具体实施方式视具体情况而定。
通过本发明实施例中的生成结构化数据搜索结果项的装置,根据查询词生成搜索结果项,能够为用户提供准确的搜索结果,还能为用户提供关于图片内容的扩展信息。
在另一个优选实施例中,用户利用本发明实施例中的生成结构化数据搜索结果项的装置在搜索“刘小明”时,不仅会获取刘小明的图片,通过点击图片还可以获得刘小明的结构化数据。本例中给出的用户获取刘小明的结构化数据的方法如点击图片只是适宜性的举例,对本发明并未造成限定。在具体实施时,具体方法视具体情况而定。
进一步地,综合上述内容,图5示出了根据本发明一个实施例的生成结构化数据搜索结果项的系统的结构示意图。该生成结构化数据搜索结果项的系统包括:
百科数据库510,配置为包括多个主题,每个主题包括多条结构化数据。
图片数据库520,配置为存储有多张图片;对每张图片的文字描述信息进行语意扩展,得到扩展后的扩展描述信息;以及,根据扩展后的描述信息与百科数据库匹配,关联该图片与匹配得到的至少一条结构化数据。
用户终端530,配置为输入图片的搜索查询词。
搜索引擎540,配置为在图片数据库中搜索并获取所述搜索查询词对应的图片,以及,在百科数据库中搜索并获取与图片关联的结构化数据,结合获取的所述图片以及与图片关联的关联信息,生成搜索结果页。
应用本发明实施例中提供的生成结构化数据搜索结果项的系统,能够对图片数据库520中的每张图片的文字描述信息进行语意扩展,得到扩展描述信息,再根据扩展描述信息与百科数据库510匹配,确定百科数据库510中与扩展描述信息相匹配的主题,再从对应的主题中选择与扩展描述信息相关度较高的超过指定阈值的至少一条结构化数据,关联到相应的图片上。其中百科数据库510中包括多个主题,每个主题包括多条结构化数据。至此就完成图片与结构化数据关联的过程。
本发明实施例中的系统具有用户终端530,用户能够利用用户终端530输入图片的搜索查询词。本发明实施例中的系统还具有搜索引擎540,搜索引擎540能够根据图片查询词在图片数据库520中搜索并获取对应的图片,还能在百科数据库510中获取到与图片相对应的结构化数据,根据图片和关联的结构化数据,能够生成搜索结果页。
利用本发明实施例中提供的生成结构化数据搜索结果项的系统,图片能够与对应的结构化数据进行关联,当用户搜素图片时,为用户提供准确的搜索结果,还能够提供关于图片内容的扩展信息。
由上可知,本发明一个实施例中,提供了一种结构化数据与图片的关联方法。为使图片与结构化数据相关联,首先获取图片的文字描述信息,并对图片的文字描述信息进行语意扩展得到扩展描述信息。扩展描述信息涵盖文字描述信息的内容并能够通过语意扩展将描述范围扩大。在百科数据库中,大量结构化数据按照主题进行分类存储,百科数据库中每个主题下包含多条结构化数据。利用扩展描述信息与百科数据库相匹配,确定与扩展描述信息相匹配的主题,进而在确定的主题下选择与扩展描述信息匹配的若干条结构化数据。由于扩展描述信息是在文字描述信息的基础上得到的,因此通过确定与扩展描述信息相匹配的主题,等同于确定与图片对应的结构化数据所属的主题,这种首先确定主题的匹配方式能够保证最后获得结构化数据的准确性,当不同图片的文字描述信息出现雷同情况时可以通过主题进行区分,避免出现图片与结构化数据的关联错误。通过设定指定相关度,选择相匹配的主题下与扩展描述信息的相关度超过指定相关度的至少一条结构化数据与图片进行关联,能够保证结构化数据与图片的匹配程度,并为图片关联到尽可能多的结构化数据。由此可见,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本发明实施例中的关联方法能够达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
对应上述结构化数据与图片的关联方法,本发明另一个实施例中还提供了一种结构化数据与图片的关联装置,相对于现有技术无法为用户提供更精准的搜索结果,也无法得到关于图片内容的扩展信息的问题,应用本发明实施例中的关联装置能够通过图片与对应的结构化数据相互匹配的手段,达到结构化数据与图片相关联的目的,基于相关联的结构化数据能够对图片进行准确的识别,从而能够为用户提供更精准的搜索结果,还能为用户提供关于图片内容的扩展信息。
本发明另一个实施例还提供了一种生成结构化数据搜索结果项的方法,能够根据查询词生成搜索结果项,从而能够为用户提供更准确的搜索结果,还能为用户提供关于图片内容的扩展信息。
对应上述生成结构化数据搜索结果项的方法,另一个实施例中还提供了一种生成结构化数据搜索结果项的装置,能够根据查询词生成搜索结果项,从而能够为用户提供更准确的搜索结果,还能为用户提供关于图片内容的扩展信息。
利用本发明另一个实施例中提供的生成结构化数据搜索结果项的系统,图片能够与对应的结构化数据进行关联,当用户搜素图片时,为用户提供准确的搜索结果,还能够提供关于图片内容的扩展信息。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的中结构化数据与图片的关联装置的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
本发明实施例还公开了A1、一种结构化数据与图片的关联方法,包括:
获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;
将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;
在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;
将选择的所述至少一条结构化数据与所述图片进行关联。
A2、根据A1所述的方法,其中,对所述文字描述信息进行语意扩展,包括:
分别对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;
对删除后的部分进行语意扩展。
A3、根据A1至A2任一项所述的方法,其中,所述停止词包括下列至少之一:的、得、地。
A4、根据A1至A3任一项所述的方法,其中,所述图片的文字描述信息,包括下列至少之一:
图片所在页面的标题;
图片周围的文本;
图片的anchor文本;
图片的名称,其中,所述图片的名称由上述文本至少之一获得。
B5、一种生成结构化数据搜索结果项的方法,包括:
获取搜索查询词对应匹配的图片;
根据所述图片被赋予的结构化数据,生成搜索结果项。
C6、一种结构化数据与图片的关联装置,包括:
扩展模块,配置为获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;
匹配模块,配置为将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;
选择模块,配置为在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;
关联模块,配置为将选择的所述至少一条结构化数据与所述图片进行关联。
C7、根据C6所述的装置,其中,所述扩展模块还配置为:
对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;
对删除后的部分进行语意扩展。
C8、根据C7所述的装置,其中,所述停止词包括下列至少之一:的、得、地。
C9、根据C6至C8任一项所述的装置,其中,所述图片的文字描述信息,包括下列至少之一:
图片所在页面的标题;
图片周围的文本;
图片的anchor文本;
图片的名称,其中,所述图片的名称由上述文本至少之一获得。
D10、一种生成结构化数据搜索结果项的装置,包括:
获取模块,配置为获取搜索查询词对应的图片;
生成模块,配置为根据所述图片以及所述图片关联的结构化数据,生成搜索结果页。
E11、一种生成结构化数据搜索结果项的系统,包括:
百科数据库,配置为包括多个主题,每个主题包括多条结构化数据;
图片数据库,配置为存储有多张图片;对每张图片的文字描述信息进行语意扩展,得到扩展后的扩展描述信息;以及,根据所述扩展后的描述信息与百科数据库匹配,关联该图片与匹配得到的至少一条结构化数据;
用户终端,配置为输入图片的搜索查询词;
搜索引擎,配置为在所述图片数据库中搜索并获取所述搜索查询词对应的图片,以及,在所述百科数据库中搜索并获取与所述图片关联的结构化数据,结合获取的所述图片以及与所述图片关联的关联信息,生成搜索结果页。

Claims (10)

1.一种结构化数据与图片的关联方法,包括:
获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;
将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;
在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;
将选择的所述至少一条结构化数据与所述图片进行关联。
2.根据权利要求1所述的方法,其中,对所述文字描述信息进行语意扩展,包括:
分别对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;
对删除后的部分进行语意扩展。
3.根据权利要求1至2任一项所述的方法,其中,所述停止词包括下列至少之一:的、得、地。
4.根据权利要求1至3任一项所述的方法,其中,所述图片的文字描述信息,包括下列至少之一:
图片所在页面的标题;
图片周围的文本;
图片的anchor文本;
图片的名称,其中,所述图片的名称由上述文本至少之一获得。
5.一种生成结构化数据搜索结果项的方法,包括:
获取搜索查询词对应匹配的图片;
根据所述图片被赋予的结构化数据,生成搜索结果项。
6.一种结构化数据与图片的关联装置,包括:
扩展模块,配置为获取图片的文字描述信息,对所述文字描述信息进行语意扩展,得到扩展后的扩展描述信息;
匹配模块,配置为将所述扩展描述信息与存储有结构化数据的百科数据库进行匹配,确定与所述扩展描述信息匹配的主题;
选择模块,配置为在匹配的主题包括的多条结构化数据中,选择与所述扩展描述信息相关度超过指定相关度的至少一条结构化数据;
关联模块,配置为将选择的所述至少一条结构化数据与所述图片进行关联。
7.根据权利要求6所述的装置,其中,所述扩展模块还配置为:
对所述文字描述信息进行分析,删除其中的停止词,其中,所述停止词是指出现多次但无实质意义的词;
对删除后的部分进行语意扩展。
8.根据权利要求6至7任一项所述的装置,其中,所述图片的文字描述信息,包括下列至少之一:
图片所在页面的标题;
图片周围的文本;
图片的anchor文本;
图片的名称,其中,所述图片的名称由上述文本至少之一获得。
9.一种生成结构化数据搜索结果项的装置,包括:
获取模块,配置为获取搜索查询词对应的图片;
生成模块,配置为根据所述图片以及所述图片关联的结构化数据,生成搜索结果页。
10.一种生成结构化数据搜索结果项的系统,包括:
百科数据库,配置为包括多个主题,每个主题包括多条结构化数据;
图片数据库,配置为存储有多张图片;对每张图片的文字描述信息进行语意扩展,得到扩展后的扩展描述信息;以及,根据所述扩展后的描述信息与百科数据库匹配,关联该图片与匹配得到的至少一条结构化数据;
用户终端,配置为输入图片的搜索查询词;
搜索引擎,配置为在所述图片数据库中搜索并获取所述搜索查询词对应的图片,以及,在所述百科数据库中搜索并获取与所述图片关联的结构化数据,结合获取的所述图片以及与所述图片关联的关联信息,生成搜索结果页。
CN201410253722.8A 2014-06-09 2014-06-09 结构化数据与图片的关联方法与关联装置 Active CN104008180B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410253722.8A CN104008180B (zh) 2014-06-09 2014-06-09 结构化数据与图片的关联方法与关联装置
PCT/CN2015/080712 WO2015188719A1 (zh) 2014-06-09 2015-06-03 结构化数据与图片的关联方法与关联装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410253722.8A CN104008180B (zh) 2014-06-09 2014-06-09 结构化数据与图片的关联方法与关联装置

Publications (2)

Publication Number Publication Date
CN104008180A true CN104008180A (zh) 2014-08-27
CN104008180B CN104008180B (zh) 2017-04-12

Family

ID=51368837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410253722.8A Active CN104008180B (zh) 2014-06-09 2014-06-09 结构化数据与图片的关联方法与关联装置

Country Status (2)

Country Link
CN (1) CN104008180B (zh)
WO (1) WO2015188719A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015188719A1 (zh) * 2014-06-09 2015-12-17 北京奇虎科技有限公司 结构化数据与图片的关联方法与关联装置
CN105488160A (zh) * 2015-11-30 2016-04-13 北大方正集团有限公司 一种图片挂接方法及装置、知识图谱的制作方法
CN108197239A (zh) * 2017-12-29 2018-06-22 北京奇元科技有限公司 一种生成兴趣点网络拓扑图的方法及装置
WO2018119593A1 (zh) * 2016-12-26 2018-07-05 华为技术有限公司 一种语句推荐方法及装置
CN108984740A (zh) * 2018-07-16 2018-12-11 百度在线网络技术(北京)有限公司 页面交互方法、装置、设备及计算机可读介质
CN111462478A (zh) * 2019-01-22 2020-07-28 北京中合云通科技发展有限公司 一种城市路网信号控制子区划分方法及装置
CN112204671A (zh) * 2018-05-30 2021-01-08 国际商业机器公司 用于主动健康监测和管理的个性化设备推荐
CN112330501A (zh) * 2020-10-30 2021-02-05 南京智慧图谱信息技术有限公司 一种文书处理方法、装置、电子设备及存储介质
CN113255349A (zh) * 2021-05-28 2021-08-13 北京字节跳动网络技术有限公司 一种信息处理的方法、装置以及计算机存储介质
CN113743438A (zh) * 2020-08-20 2021-12-03 北京沃东天骏信息技术有限公司 文本检测用数据集生成方法、装置和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200966A (zh) * 2011-06-01 2011-09-28 潍坊北大青鸟华光照排有限公司 一种版面信息提取和加工的方法
CN102902771A (zh) * 2012-09-27 2013-01-30 百度国际科技(深圳)有限公司 一种图片搜索方法、装置及服务器
CN103425780A (zh) * 2013-08-19 2013-12-04 曙光信息产业股份有限公司 一种数据的查询方法和装置
CN103793498A (zh) * 2014-01-22 2014-05-14 百度在线网络技术(北京)有限公司 图片搜索方法、装置以及搜索引擎

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012058794A1 (en) * 2010-11-01 2012-05-10 Microsoft Corporation Image search
CN103226601B (zh) * 2013-04-25 2019-03-29 百度在线网络技术(北京)有限公司 一种图片搜索的方法和装置
CN103559220B (zh) * 2013-10-18 2017-08-25 北京奇虎科技有限公司 图片搜索设备、方法及系统
CN104008180B (zh) * 2014-06-09 2017-04-12 北京奇虎科技有限公司 结构化数据与图片的关联方法与关联装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200966A (zh) * 2011-06-01 2011-09-28 潍坊北大青鸟华光照排有限公司 一种版面信息提取和加工的方法
CN102902771A (zh) * 2012-09-27 2013-01-30 百度国际科技(深圳)有限公司 一种图片搜索方法、装置及服务器
CN103425780A (zh) * 2013-08-19 2013-12-04 曙光信息产业股份有限公司 一种数据的查询方法和装置
CN103793498A (zh) * 2014-01-22 2014-05-14 百度在线网络技术(北京)有限公司 图片搜索方法、装置以及搜索引擎

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015188719A1 (zh) * 2014-06-09 2015-12-17 北京奇虎科技有限公司 结构化数据与图片的关联方法与关联装置
CN105488160A (zh) * 2015-11-30 2016-04-13 北大方正集团有限公司 一种图片挂接方法及装置、知识图谱的制作方法
WO2018119593A1 (zh) * 2016-12-26 2018-07-05 华为技术有限公司 一种语句推荐方法及装置
CN108197239A (zh) * 2017-12-29 2018-06-22 北京奇元科技有限公司 一种生成兴趣点网络拓扑图的方法及装置
CN112204671A (zh) * 2018-05-30 2021-01-08 国际商业机器公司 用于主动健康监测和管理的个性化设备推荐
CN108984740A (zh) * 2018-07-16 2018-12-11 百度在线网络技术(北京)有限公司 页面交互方法、装置、设备及计算机可读介质
CN111462478A (zh) * 2019-01-22 2020-07-28 北京中合云通科技发展有限公司 一种城市路网信号控制子区划分方法及装置
CN113743438A (zh) * 2020-08-20 2021-12-03 北京沃东天骏信息技术有限公司 文本检测用数据集生成方法、装置和系统
CN112330501A (zh) * 2020-10-30 2021-02-05 南京智慧图谱信息技术有限公司 一种文书处理方法、装置、电子设备及存储介质
CN113255349A (zh) * 2021-05-28 2021-08-13 北京字节跳动网络技术有限公司 一种信息处理的方法、装置以及计算机存储介质

Also Published As

Publication number Publication date
CN104008180B (zh) 2017-04-12
WO2015188719A1 (zh) 2015-12-17

Similar Documents

Publication Publication Date Title
CN104008180B (zh) 结构化数据与图片的关联方法与关联装置
JP6266080B2 (ja) 類似性スコアに基づきコンテンツアイテムと画像とのマッチングを評価する方法、およびシステム
JP6423845B2 (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
KR101659097B1 (ko) 복수의 저장된 디지털 이미지들을 탐색하기 위한 방법 및 장치
CN102364473B (zh) 融合地理信息与视觉信息的网络新闻检索系统及方法
CN104199833B (zh) 一种网络搜索词的聚类方法和聚类装置
JP2017508214A (ja) 検索推奨の提供
CN102893280B (zh) 数据搜索装置、数据搜索方法和程序
WO2017020451A1 (zh) 信息推送方法和装置
CN102708100A (zh) 挖掘相关实体词的关系关键词的方法和装置及其应用
US20130226559A1 (en) Apparatus and method for providing internet documents based on subject of interest to user
CN105874452B (zh) 从社交摘要中标记兴趣点
WO2021035227A1 (en) Systems and methods for retreiving videos using natural language description
CN104537065A (zh) 一种搜索结果的推送方法及系统
CN102349072A (zh) 识别查询方面
CN105900087A (zh) 用于查询答案的丰富内容
CN103518198A (zh) 改进数据库内搜索结果的方法
CN101802776A (zh) 应用语义向量和关键字分析关联数据集的方法和装置
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
CN102262670A (zh) 一种基于移动可视设备的跨媒体信息检索系统及方法
CN104537341A (zh) 人脸图片信息获取方法和装置
WO2017113592A1 (zh) 模型生成方法、词语赋权方法、装置、设备及计算机存储介质
CN112740202A (zh) 使用内容标签执行图像搜索
CN104462512A (zh) 基于知识图谱的汉语信息搜索方法和装置
CN104462504A (zh) 基于搜索中提供推理过程数据的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220802

Address after: 300450 No. 9-3-401, No. 39, Gaoxin 6th Road, Binhai Science Park, Binhai New Area, Tianjin

Patentee after: 3600 Technology Group Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230703

Address after: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: Beijing Hongxiang Technical Service Co.,Ltd.

Address before: 300450 No. 9-3-401, No. 39, Gaoxin 6th Road, Binhai Science Park, Binhai New Area, Tianjin

Patentee before: 3600 Technology Group Co.,Ltd.

TR01 Transfer of patent right
CP03 Change of name, title or address

Address after: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: Beijing 360 Zhiling Technology Co.,Ltd.

Country or region after: China

Address before: 1765, floor 17, floor 15, building 3, No. 10 Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee before: Beijing Hongxiang Technical Service Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address