[go: up one dir, main page]

CN110928917A - 一种目标用户的确定方法、装置、计算设备及介质 - Google Patents

一种目标用户的确定方法、装置、计算设备及介质 Download PDF

Info

Publication number
CN110928917A
CN110928917A CN201911096145.5A CN201911096145A CN110928917A CN 110928917 A CN110928917 A CN 110928917A CN 201911096145 A CN201911096145 A CN 201911096145A CN 110928917 A CN110928917 A CN 110928917A
Authority
CN
China
Prior art keywords
behavior
data
identifier
user
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911096145.5A
Other languages
English (en)
Inventor
黄与晶
林宇超
刘君妍
邝则通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Cheerbright Technologies Co Ltd
Original Assignee
Beijing Cheerbright Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Cheerbright Technologies Co Ltd filed Critical Beijing Cheerbright Technologies Co Ltd
Priority to CN201911096145.5A priority Critical patent/CN110928917A/zh
Publication of CN110928917A publication Critical patent/CN110928917A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种目标用户的确定方法、装置、计算设备及介质,该方法包括:接收客户端设备发出的目标用户的获取请求,所述获取请求包括至少一个行为标识以及与所述行为标识关联的数据标识;从行为数据表中,查询与所述获取请求对应的数据记录;对查询到的数据记录对应的用户标识进行去重处理;将去重处理后得到的用户标识作为目标用户的用户标识。

Description

一种目标用户的确定方法、装置、计算设备及介质
技术领域
本发明涉及互联网及大数据处理技术领域,特别涉及一种目标用户的确定方法、装置、计算设备及介质。
背景技术
在互联网大背景下,每一个用户都从原来的信息消费者逐步转变为现如今的信息生产者,这一阶段下用户活跃度及用户转化率成为互联网公司对自身产品进行评估的主要标准。对于这类企业,用户规模的增长,整体内容的提高,营销策略的精准,完成用户的留存和转化是企业发展的工作重点和难点。而对企业用户行为数据的分析和利用,实现目标人群的精准快速圈定是这一工作的基础。
目标人群圈定实际上就是一个目标用户的确定过程,目前主要可以分为两种方式:方式一是基于用户反馈行为,对用户发表信息的质量进行价值分析,使用自然语言处理的方法进行文本分析,运用相关算法识别发布信息质量相似的用户,找到目标人群;方式二是通过构建用户画像标签的方法来圈定人群,先收集用户在站内的数据,再对数据进行清洗、处理,按照既定的规则将数据汇总加工成用户画像标签,使用者通过选择标签和标签值,圈定出所需人群。
但方式一不适合用户无反馈行为的情况,当用户未发布内容时,就无法通过发布内容计算相关性来圈定目标人群,适用范围狭窄,而且还需要展开大量的自然语言处理任务,模型的训练成本高昂,由于数据噪声和异常,需要大量的预处理工作,耗费人力物力。方式二在标签建立时逻辑固定,能圈定的范围有限,即使要轻微改变圈人的数据口径,也需修改底层标签逻辑后,等待标签更新才可以圈定,导致圈人口径变化时流程复杂,整个处理过程繁琐、不灵活,且耗时长。因此,需要一种新的目标用户的确定方法来优化上述处理过程。
发明内容
为此,本发明提供一种目标用户的确定方案,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种目标用户的确定方法,该方法包括如下步骤:首先,接收客户端设备发出的目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识;从行为数据表中,查询与获取请求对应的数据记录;对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。
可选地,在根据本发明的目标用户的确定方法中,行为数据表包括多条数据记录,每条数据记录包括对应于行为的数据维度,数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一。
可选地,在根据本发明的目标用户的确定方法中,数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一,从行为数据表中,查询与获取请求对应的数据记录,包括:根据获取请求包括的行为标识和数据标识,从行为数据表中查询对应的数据维度,获取查询到的数据维度对应的数据记录。
可选地,在根据本发明的目标用户的确定方法中,还包括:将目标用户的用户标识发送至客户端设备。
可选地,在根据本发明的目标用户的确定方法中,还包括预先生成行为数据表,预先生成行为数据表包括:获取多条行为数据,每条行为数据关联一个行为事件;对多条行为数据中的每条行为数据,确定行为数据对应的数据维度,并基于数据维度形成数据记录;生成包含有多条数据记录的行为数据表。
可选地,在根据本发明的目标用户的确定方法中,确定行为数据对应的数据维度,包括:确定行为数据对应的用户标识;对行为数据关联的行为事件进行分类,以确定行为数据对应的行为标识;确定行为数据对应的内容标识、时间标识和状态标识中至少之一。
可选地,在根据本发明的目标用户的确定方法中,行为标识包括对比、互动、搜索、填写事实、点击、发布和浏览中至少之一。
可选地,在根据本发明的目标用户的确定方法中,用户标识包括用户ID和用户端中至少之一,内容标识包括物料标识和作者标识中至少之一,时间标识包括行为开始时间、结束时间、停留时长和是否有效时长中至少之一,状态标识包括设备信息、网络信息和地理信息中至少之一。
可选地,在根据本发明的目标用户的确定方法中,还包括更新行为数据表,更新行为数据表包括以下至少之一:在行为数据表中添加新的行为标识或内容标识;在行为数据表中添加新的数据维度;在行为数据表中添加副表,副表用于记录关联应用的行为或接入外部采集数据。
根据本发明的又一个方面,提供一种目标用户的确定装置,该装置包括接收模块、查询模块和去重模块。其中,接收模块适于接收客户端设备发出的目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识;查询模块适于从行为数据表中,查询与获取请求对应的数据记录;去重模块适于对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。
可选地,在根据本发明的目标用户的确定装置中,行为数据表包括多条数据记录,每条数据记录包括对应于行为的数据维度,数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一。
可选地,在根据本发明的目标用户的确定装置中,数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一,查询模块进一步适于:根据获取请求包括的行为标识和数据标识,从行为数据表中查询对应的数据维度,获取查询到的数据维度对应的数据记录。
可选地,在根据本发明的目标用户的确定装置中,还包括发送模块,发送模块适于将目标用户的用户标识发送至客户端设备。
可选地,在根据本发明的目标用户的确定装置中,还包括生成模块,适于预先生成行为数据表,进一步适于:获取多条行为数据,每条行为数据关联一个行为事件;对多条行为数据中的每条行为数据,确定行为数据对应的数据维度,并基于数据维度形成数据记录;生成包含有多条数据记录的行为数据表。
可选地,在根据本发明的目标用户的确定装置中,生成模块进一步适于:确定行为数据对应的用户标识;对行为数据关联的行为事件进行分类,以确定行为数据对应的行为标识;确定行为数据对应的内容标识、时间标识和状态标识中至少之一。
可选地,在根据本发明的目标用户的确定装置中,行为标识包括对比、互动、搜索、填写事实、点击、发布和浏览中至少之一。
可选地,在根据本发明的目标用户的确定装置中,用户标识包括用户ID和用户端中至少之一,内容标识包括物料标识和作者标识中至少之一,时间标识包括行为开始时间、结束时间、停留时长和是否有效时长中至少之一,状态标识包括设备信息、网络信息和地理信息中至少之一。
可选地,在根据本发明的目标用户的确定装置中,还包括更新模块,适于更新行为数据表,更新模块进一步适于:在行为数据表中添加新的行为标识或内容标识;在行为数据表中添加新的数据维度;在行为数据表中添加副表,副表用于记录关联应用的行为或接入外部采集数据。
根据本发明的又一个方面,提供一种计算设备,包括一个或多个处理器、存储器以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据本发明的目标用户的确定方法的指令。
根据本发明的又一个方面,还提供一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当由计算设备执行时,使得计算设备执行根据本发明的目标用户的确定方法。
根据本发明的目标用户的确定方案,接收目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识,从行为数据表中查询与获取请求对应的数据记录,对查询到的数据记录对应的用户标识进行去重处理,将去重处理后得到的用户标识作为目标用户的用户标识。其中,每条数据记录包括对应于行为的数据维度,数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一,可以涵盖全面的画像信息,从而构建出全面的行为数据表。在上述方案中,获取请求中的行为标识和数据标识可以由使用者自行选择,拥有极高的灵活性,支持使用者不断变更目标用户确定的标准和细节。而且,直接使用用户的行为作为目标用户的确定条件,允许管理者以多种方式灵活、快速地对底层数据进行修改和补充,让行为数据保持时效性。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的目标用户的确定系统100的示意图;
图2示出了根据本发明的一个实施例的计算设备200的结构框图;
图3示出了根据本发明的一个实施例的目标用户的确定方法300的示意图;以及
图4示出了根据本发明的一个实施例的目标用户的确定装置400的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明的一个实施例的目标用户的确定系统100的示意图。应当指出,图1中的目标用户的确定系统100仅是示例性的,在具体的实际情况中,目标用户的确定系统100中可以有不同数量的服务器和客户端设备,对此本发明并不限制。
如图1所示,目标用户的确定系统100包括服务器110、客户端设备120、客户端设备130和客户端设备140,其中,客户端设备120和客户端设备130为计算设备,客户端设备140为移动终端,对于客户端设备的类型和样式本发明不做限制。在该实施方式中,服务器110中驻留有目标用户的确定装置400(图中未示出)。
以客户端设备120为例,在客户端设备120中安装有用于目标用户获取的客户端应用。在该客户端应用的相应界面中,可以将行为标识以字段形式列出,以便使用者选择,待使用者选择了至少一个行为标识后,可进一步列出与行为标识关联的数据标识。当然,也可以在直接将行为标识及与其关联的数据标识一同显示在当前界面中。其中,数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一。该客户端应用结合至少一个行为标识以及与行为标识关联的数据标识形成对应的目标用户的获取请求,客户端设备120将该获取请求发送至服务器110,以便服务器110通过目标用户的确定装置400完成目标用户的确定。当确定好目标用户的用户标识后,服务器110将目标用户的用户标识发送至客户端设备120,用户标识包括用户ID和用户端中至少之一。
例如,使用者选择“浏览”这一行为标识后,界面中会列出“浏览”关联的内容标识和时间标识,内容标识具体为物料标识,时间标识具体为时间范围,使用者可以通过输入物料标识、选定相应的时间范围来确定目标用户的确定条件。此时,根据客户端应用将结合该目标用户的确定条件形成对应的目标用户的获取请求,该获取请求目标用户的获取请求包括行为标识“浏览”以及与“浏览”关联的数据标识。客户端120将该获取请求发送至服务器110,以便服务器110利用目标用户的确定装置400对基于上述获取请求中限定的目标用户的确定条件,确定目标用户的用户标识,并将目标用户的用户标识发送至客户端设备120。
根据本发明的一个实施例,上述目标用户的确定系统100中的服务器110,可以通过如下所述的计算设备200来实现。图2示出了根据本发明一个实施例的计算设备200的结构框图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器206可以包括操作系统220、一个或者多个程序222以及数据224。在一些实施方式中,程序222可以布置为在操作系统上由一个或多个处理器204利用数据224执行指令。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备200可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备200还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。
在一些实施例中,计算设备200被实现为服务器110,并被配置为执行根据本发明的目标用户的确定方法300。其中,计算设备200的程序222中包含执行根据本发明的目标用户的确定方法300多条程序指令,而数据224还可以存储目标用户的确定系统100的配置信息、行为数据表等。
图3示出了根据本发明的一个实施例的目标用户的确定方法300的流程图。如图3所示,方法300始于步骤S310。在步骤S310中,接收客户端设备发出的目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识。其中,行为标识包括对比、互动、搜索、填写事实、点击、发布和浏览中至少之一,数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一。
在该实施方式中,用户标识包括用户ID和用户端中至少之一,内容标识包括物料标识和作者标识中至少之一,时间标识包括行为开始时间、结束时间、停留时长和是否有效时长中至少之一,状态标识包括设备信息、网络信息和地理信息中至少之一。
服务器110接收客户端设备120发出的目标用户的获取请求,该获取请求包括一个行为标识“浏览”,行为标识“浏览”关联的数据标识包括内容标识、时间标识和用户标识,内容标识为物料标识“12123”,时间标识包括开始时间“2019/3/12 14:01”、结束时间“2019/3/12 14:12”,用户标识为用户端“PC端”。
随后,进入步骤S320,从行为数据表中,查询与所述获取请求对应的数据记录。根据本发明的一个实施例,行为数据表包括多条数据记录,每条数据记录包括对应于行为的数据维度,所述数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一。
表1示出了一条数据记录的示例:
Figure BDA0002268407870000091
表1
如表1所示,对于行为标识为“曝光”的数据记录,包括对应于曝光行为的数据维度,该数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识。其中,内容标识包括物料标识和作者标识,物料标识为13112,作者标识为29384818,时间标识包括开始时间和结束时间,开始时间为2019/9/1 14:00,结束时间为2019/9/1 14:01,用户标识包括用户ID和用户端,用户ID为29394919,用户端为手机端,状态标识包括设备信息和网络信息,设备信息为Huawei P30,网络信息为Wi-Fi。
根据本发明的一个实施例,可通过如下方式从行为数据表中,查询与获取请求对应的数据记录,例如可根据获取请求包括的行为标识和数据标识,从行为数据表中查询对应的数据维度,获取查询到的数据维度对应的数据记录。
在该实施方式中,根据步骤S310中获取请求包括的行为标识“浏览”、物料标识“12123”、开始时间“2019/3/12 14:01”、结束时间“2019/3/12 14:12”以及用户端“PC端”,从行为数据表中查询行为标识、物料标识、开始时间、结束时间和用户端均与前述内容对应的数据维度,获取查询到的数据维度对应的数据记录。
最后,执行步骤S330,对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。根据本发明的一个实施例,用户标识为用户ID,步骤S320中查询到的数据记录有100条,其中有5条数据记录对应的用户ID为29194317,其他95条数据记录对应的用户ID各不相同,则将用户ID“29194317”和其他95条数据记录对应的用户ID作为目标用户的用户标识。
在确定好目标用户后,根据本发明的又一个实施例,方法300还包括将目标用户的用户标识发送至客户端设备。在该实施方式中,将步骤S330中得到的那96个目标用户的用户标识发送至客户端设备120,以便客户端设备120向使用者展示目标用户的确定结果。
值得注意的是,步骤S320中使用到的行为数据表需要预先生成。根据本发明的又一个实施例,方法300还包括预先生成行为数据表,具体可以如下方式生成。首先,获取多条行为数据,每条行为数据关联一个行为事件。
在获取行为数据时,需要全面收集用户的动态数据,特别是要结合实际需求和场景,确定应进行数据埋点的行为和采集的数据维度。例如,对于电商页面,要重点了解用户在做出购买决策时的行为,因此要对用户点击、浏览行为进行埋点,并着重记录停留时间等数据维度。上述获取行为数据的处理方式,不依赖用户自主填写、发布信息,而是在网站或应用上埋点,通过记录用户的行为收集用户的行为数据。一方面,极大地提高了数据的获取效率和广度,另一方面,用户行为是用户偏好的真实反映,有很高可信度。
在该实施方式中,一条行为数据实际上就是对用户一次行为的描述,如用户ID为29564313的用户,在Wi-Fi网络环境下,通过设备“Huawei P30”中的手机端应用,于2019/5/15 14:11~14:16这段时间浏览了一篇作者标识为29384757的文章。其中,浏览即为这条行为数据关联的行为事件。
接下来,对多条行为数据中的每条行为数据,确定行为数据对应的数据维度,并基于数据维度形成数据记录。在确定行为数据对应的数据维度时,确定行为数据对应的用户标识,对行为数据关联的行为事件进行分类,以确定行为数据对应的行为标识,再确定行为数据对应的内容标识、时间标识和状态标识中至少之一。
具体而言,常见的行为事件包括曝光、搜索、线索、浏览、关注、登录、发布、评论、收藏、分享、点击、启动、点赞、对比等,按照对比(Contrast)、互动(Interact)、搜索(Search)、填写事实(State)、点击(Click)、发布(Add)和浏览(Read)来对行为事件分类。例如,所有的用户之间的互动行为都算在互动中,如关注、点赞、转发、评论、收藏、分享、回答问题等,所有填写个人事实的行为都算在填写事实中,如填写性别、婚姻状况,车辆认证、身份证认证等。
丰富的数据维度可以支持平台对用户进行不同维度的分析和使用。同时,在这个行为数据表的构建过程中,数据与实际业务需求、业务指标的联系越来越紧密,数据和事实间的关系也越来越明显,行为数据应根据当前业务需求不断进行维度的调整,进行持续性迭代优化。
根据本发明的一个实施例,确定上述行为数据对应的用户标识中的用户ID为29564313,用户端为手机端,对行为数据关联的行为事件“浏览”进行分类,确定行为数据对应的行为标识为浏览。继续确定行为数据对应的内容标识中的作者标识为29384757,时间标识中的开始时间为2019/5/15 14:11,结束时间为2019/5/15 14:16,状态标识中的设备信息为Huawei P30,网络信息为Wi-Fi。
在得到了每条行为数据对应的数据记录后,生成包含有多条数据记录的行为数据表。实际上,为了便于行为数据的维护,采集到的行为数据通常会先进行清洗和预处理,再存储至临时Hive表中,每天将临时Hive表中当天的行为数据处理以形成数据记录,将数据记录加入到行为数据表中。和传统的用户信息记录、用户画像相比,本发明实施例中的数据记录不是按用户数记录,每个用户一条记录,而是按行为来记录,每个行为都会有一条包含数据维度的数据记录。由于一个活跃用户每天可能有几百上千条行为,导致行为数据表的数据量庞大,难以写入索引供实时查询,因此,行为数据表一般以Hadoop技术储存在数据仓库中。
在现有的行为数据表无法满足目标用户的确定需求时,由于其简洁的数据架构,可以用多种方式便捷快速地更新行为数据表。根据本发明的又一个实施例,可通过以下方式至少之一更新行为数据表:
在行为数据表中添加新的行为标识或内容标识;
在行为数据表中添加新的数据维度,如新增记录行为发生时的手机电量百分比;
在行为数据表中添加副表,副表用于记录关联应用的行为或接入外部采集数据。
图4示出了根据本发明的一个实施例的目标用户的确定装置400的示意图。如图4所示,目标用户的确定装置400包括接收模块410、查询模块420和去重模块430。
接收模块410适于接收客户端设备发出的目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识。
根据本发明的一个实施例,行为标识包括对比、互动、搜索、填写事实、点击、发布和浏览中至少之一,数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一。
其中,用户标识包括用户ID和用户端中至少之一,内容标识包括物料标识和作者标识中至少之一,时间标识包括行为开始时间、结束时间、停留时长和是否有效时长中至少之一,状态标识包括设备信息、网络信息和地理信息中至少之一。
查询模块420适于从行为数据表中,查询与获取请求对应的数据记录。
根据本发明的一个实施例,行为数据表包括多条数据记录,每条数据记录包括对应于行为的数据维度,数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一。
在该实施方式中,查询模块420进一步适于根据获取请求包括的行为标识和数据标识,从行为数据表中查询对应的数据维度,获取查询到的数据维度对应的数据记录。
去重模块430适于对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。
根据本发明的又一个实施例,目标用户的确定装置400还包括发送模块(图中未示出),发送模块适于将目标用户的用户标识发送至客户端设备。
根据本发明的又一个实施例,目标用户的确定装置400还包括生成模块(图中未示出),适于预先生成行为数据表。
在该实施方式中,生成模块进一步适于获取多条行为数据,每条行为数据关联一个行为事件,对多条行为数据中的每条行为数据,确定行为数据对应的数据维度,并基于数据维度形成数据记录,生成包含有多条数据记录的行为数据表。
生成模块进一步适于确定行为数据对应的用户标识,对行为数据关联的行为事件进行分类,以确定行为数据对应的行为标识,确定行为数据对应的内容标识、时间标识和状态标识中至少之一。
根据本发明的又一个实施例,目标用户的确定装置400还包括更新模块(图中未示出),适于更新行为数据表。
在该实施方式中,更新模块进一步适于在行为数据表中添加新的行为标识或内容标识,在行为数据表中添加新的数据维度,在行为数据表中添加副表,副表用于记录关联应用的行为或接入外部采集数据。
关于目标用户的确定的具体步骤以及实施例,在基于图3的描述中已经详细公开,此处不再赘述。
关于现有的目标用户的确定方法,基于用户反馈行为实现目标用户确定的方式,对反馈行为依赖度较高,适用范围较窄,且需要耗费大量时间和人力物力去开展自然语言方法处理任务,而基于用户画像标签实现目标用户确定的方式,标签建立时逻辑固定,过程繁琐、不灵活。根据本发明实施例的目标用户的确定方案,接收目标用户的获取请求,获取请求包括至少一个行为标识以及与行为标识关联的数据标识,从行为数据表中查询与获取请求对应的数据记录,对查询到的数据记录对应的用户标识进行去重处理,将去重处理后得到的用户标识作为目标用户的用户标识。其中,每条数据记录包括对应于行为的数据维度,数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一,可以涵盖全面的画像信息,从而构建出全面的行为数据表。在上述方案中,获取请求中的行为标识和数据标识可以由使用者自行选择,拥有极高的灵活性,支持使用者不断变更目标用户确定的标准和细节。而且,直接使用用户的行为作为目标用户的确定条件,允许管理者以多种方式灵活、快速地对底层数据进行修改和补充,让行为数据保持时效性。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组间可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组间组合成一个模块或单元或组间,以及此外可以把它们分成多个子模块或子单元或子组间。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明还可以包括:A8、如A1-A7中任一项所述的方法,其中,所述用户标识包括用户ID和用户端中至少之一,所述内容标识包括物料标识和作者标识中至少之一,所述时间标识包括行为开始时间、结束时间、停留时长和是否有效时长中至少之一,所述状态标识包括设备信息、网络信息和地理信息中至少之一。A9、如A5-A8中任一项所述的方法,还包括更新所述行为数据表,所述更新所述行为数据表包括以下至少之一:在所述行为数据表中添加新的行为标识或内容标识;在所述行为数据表中添加新的数据维度;在所述行为数据表中添加副表,所述副表用于记录关联应用的行为或接入外部采集数据。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的目标用户的确定方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种目标用户的确定方法,包括:
接收客户端设备发出的目标用户的获取请求,所述获取请求包括至少一个行为标识以及与所述行为标识关联的数据标识;
从行为数据表中,查询与所述获取请求对应的数据记录;
对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。
2.如权利要求1所述的方法,其中,所述行为数据表包括多条数据记录,每条数据记录包括对应于行为的数据维度,所述数据维度包括内容标识、行为标识、时间标识、用户标识和状态标识中至少之一。
3.如权利要求2所述的方法,其中,所述数据标识包括内容标识、时间标识、用户标识和状态标识中至少之一,所述从行为数据表中,查询与所述获取请求对应的数据记录,包括:
根据所述获取请求包括的行为标识和数据标识,从所述行为数据表中查询对应的数据维度,获取查询到的数据维度对应的数据记录。
4.如权利要求1-3中任一项所述的方法,还包括:
将所述目标用户的用户标识发送至所述客户端设备。
5.如权利要求1-4中任一项所述的方法,还包括预先生成行为数据表,所述预先生成行为数据表包括:
获取多条行为数据,每条行为数据关联一个行为事件;
对所述多条行为数据中的每条行为数据,确定所述行为数据对应的数据维度,并基于所述数据维度形成数据记录;
生成包含有多条数据记录的行为数据表。
6.如权利要求5所述的方法,其中,所述确定所述行为数据对应的数据维度,包括:
确定所述行为数据对应的用户标识;
对所述行为数据关联的行为事件进行分类,以确定所述行为数据对应的行为标识;
确定所述行为数据对应的内容标识、时间标识和状态标识中至少之一。
7.如权利要求1-6中任一项所述的方法,其中,所述行为标识包括对比、互动、搜索、填写事实、点击、发布和浏览中至少之一。
8.一种目标用户的确定装置,包括:
接收模块,适于接收客户端设备发出的目标用户的获取请求,所述获取请求包括至少一个行为标识以及与所述行为标识关联的数据标识;
查询模块,适于从行为数据表中,查询与所述获取请求对应的数据记录;
去重模块,适于对查询到的数据记录对应的用户标识进行去重处理,并将去重处理后得到的用户标识作为目标用户的用户标识。
9.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述的方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1-7所述的方法中的任一方法。
CN201911096145.5A 2019-11-11 2019-11-11 一种目标用户的确定方法、装置、计算设备及介质 Pending CN110928917A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911096145.5A CN110928917A (zh) 2019-11-11 2019-11-11 一种目标用户的确定方法、装置、计算设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911096145.5A CN110928917A (zh) 2019-11-11 2019-11-11 一种目标用户的确定方法、装置、计算设备及介质

Publications (1)

Publication Number Publication Date
CN110928917A true CN110928917A (zh) 2020-03-27

Family

ID=69853812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911096145.5A Pending CN110928917A (zh) 2019-11-11 2019-11-11 一种目标用户的确定方法、装置、计算设备及介质

Country Status (1)

Country Link
CN (1) CN110928917A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651436A (zh) * 2020-04-14 2020-09-11 海南车智易通信息技术有限公司 用户生成内容的处理方法、系统及计算设备
CN112084403A (zh) * 2020-08-26 2020-12-15 深圳市华曦达科技股份有限公司 数据查询方法、装置、计算机设备和存储介质
CN112417281A (zh) * 2020-11-20 2021-02-26 京东方科技集团股份有限公司 数据分析方法、装置及设备
CN112732697A (zh) * 2021-01-21 2021-04-30 苏州达家迎信息技术有限公司 关联数据一致性处理方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593376A (zh) * 2012-08-17 2014-02-19 阿里巴巴集团控股有限公司 一种采集用户行为数据的方法及装置
CN103744929A (zh) * 2013-12-30 2014-04-23 传神联合(北京)信息技术有限公司 目标用户对象的确定方法
CN108334625A (zh) * 2018-02-09 2018-07-27 深圳壹账通智能科技有限公司 用户信息的处理方法、装置、计算机设备和存储介质
CN110008248A (zh) * 2014-02-21 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593376A (zh) * 2012-08-17 2014-02-19 阿里巴巴集团控股有限公司 一种采集用户行为数据的方法及装置
CN103744929A (zh) * 2013-12-30 2014-04-23 传神联合(北京)信息技术有限公司 目标用户对象的确定方法
CN110008248A (zh) * 2014-02-21 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN108334625A (zh) * 2018-02-09 2018-07-27 深圳壹账通智能科技有限公司 用户信息的处理方法、装置、计算机设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651436A (zh) * 2020-04-14 2020-09-11 海南车智易通信息技术有限公司 用户生成内容的处理方法、系统及计算设备
CN111651436B (zh) * 2020-04-14 2024-06-21 海南车智易通信息技术有限公司 用户生成内容的处理方法、系统及计算设备
CN112084403A (zh) * 2020-08-26 2020-12-15 深圳市华曦达科技股份有限公司 数据查询方法、装置、计算机设备和存储介质
CN112417281A (zh) * 2020-11-20 2021-02-26 京东方科技集团股份有限公司 数据分析方法、装置及设备
CN112732697A (zh) * 2021-01-21 2021-04-30 苏州达家迎信息技术有限公司 关联数据一致性处理方法、装置、存储介质及电子设备
CN112732697B (zh) * 2021-01-21 2022-09-09 苏州达家迎信息技术有限公司 关联数据一致性处理方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN105247507B (zh) 用于确定品牌的影响力得分的方法、系统和存储介质
US20170032251A1 (en) Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system
US20170140038A1 (en) Method and system for hybrid information query
US20140114822A1 (en) Method and system for creating tax configuration templates
CN105721629B (zh) 用户标识匹配方法和装置
CN110928917A (zh) 一种目标用户的确定方法、装置、计算设备及介质
US11620444B2 (en) Providing action associated with event detected within communication
US20170235726A1 (en) Information identification and extraction
JP2013534334A (ja) 照会結果をソートするための方法および装置
JP2022096632A (ja) コンピュータ実装方法、コンピュータシステムおよびコンピュータプログラム(データ属性に基づくデータセットのランク付け)
CN110442614B (zh) 元数据的搜索方法及装置、电子设备、存储介质
CN118170360A (zh) 请求处理的方法、装置、设备和存储介质
CN103514209A (zh) 基于对象信息库生成待推广对象的推广信息的方法与设备
US9367624B2 (en) Identity workflow that utilizes multiple storage engines to support various lifecycles
US11250080B2 (en) Method, apparatus, storage medium and electronic device for establishing question and answer system
CN108416645B (zh) 一种针对用户的推荐方法、装置、存储介质和设备
US20070266016A1 (en) System and method for selecting a sub-domain for a specified domain of the web
CN112070542A (zh) 信息转化率预测方法、装置、设备及可读存储介质
CN103559195A (zh) 一种搜索方法和终端
CN113313542B (zh) 一种推送频道页面的方法和装置
CN112905892A (zh) 应用于用户画像挖掘的大数据处理方法及大数据服务器
KR102864983B1 (ko) 광고효과 분석을 위한 다량의 포털게시물 노출도 및 경쟁도 분석시스템
CN117609175B (zh) 一种可配置的工控文件采集解析方法和系统
CN110851517A (zh) 一种源数据抽取方法、装置、设备及计算机存储介质
CN103235787A (zh) 一种用于提供关于目标对象的目标信息的方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200327