CN111143555B - 基于大数据的客户画像生成方法、装置、设备及存储介质 - Google Patents
基于大数据的客户画像生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111143555B CN111143555B CN201911264778.2A CN201911264778A CN111143555B CN 111143555 B CN111143555 B CN 111143555B CN 201911264778 A CN201911264778 A CN 201911264778A CN 111143555 B CN111143555 B CN 111143555B
- Authority
- CN
- China
- Prior art keywords
- information
- label
- target
- customer
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及大数据领域,公开了一种基于大数据的客户画像生成方法,包括以下步骤:通过hive将客户大数据映射成数据库表;采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签;监测当前是否存在客户画像生成请求;若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息;根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;对所述目标标签进行渲染处理,得到客户画像。本发明生成的客户画像满足用户在不同场景查看客户不同类别的信息。
Description
技术领域
本发明涉及大数据领域,尤其涉及基于大数据的客户画像生成方法、装置、设备及存储介质。
背景技术
客户画像是大数据技术的重要应用,其目标在于建立针对用户的描述性标签属性,从而利用这些标签属性对用户多方面的真实个人特征进行勾勒,因而可以利用客户画像发掘客户需求,分析客户偏好,为客户提供更优质、更有针对性的服务。而传统的画像分析平台功能较单一,计算成本较高,并且处理能力有限,大多数只有标签和画像信息展示,而且画像展示形式是固定不变的,无法快速展示客户的关键信息。
发明内容
本发明的主要目的在于提供一种基于大数据的客户画像生成方法、装置、设备及存储介质,旨在解决如何生成能够满足用户在不同场景查看客户不同类别的客户信息的客户画像的技术问题。
为实现上述目的,本发明提供的一种基于大数据的客户画像生成方法,所述客户画像生成方法包括以下步骤:
通过hive将客户大数据映射成数据库表;
采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
监测当前是否存在客户画像生成请求;
若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
对所述目标标签进行渲染处理,得到客户画像。
优选地,在所述基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签的步骤之后,还包括:
根据预置标签分类规则,对所述标签进行类别标记,得到带有类别标记的标签;
根据类别标记分类存储标签,得到第一标签数据库。
优选地,所述根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签包括:
解析所述目标展示信息,获得所述目标展示信息中指定展示的目标标签的信息;
根据所述信息,查询目标标签所在类别的第二标签数据库并访问;
从所述第二标签数据库中提取所述目标标签。
优选地,在所述对所述目标标签进行渲染处理,得到客户画像的步骤之后,还包括:
通过埋点统计所述目标标签被查看次数,得到所述目标标签的历史查看次数;
根据历史查看次数及预置标签的展示个数,展示历史查看次数最多的标签。
优选地,所述对所述目标展示标签进行渲染处理,得到客户画像包括:
将所述目标标签的数据按照预置的JSP模板进行渲染,得到客户画像框架;
根据所述目标标签的展示形式信息,计算所述目标标签在所述客户画像框架上的位置坐标并按所述位置坐标进行排列,得到客户画像。
进一步地,为实现上述目的,本发明还提供一种基于大数据的客户画像生成装置,所述客户画像生成装置包括:
映射模块,用于通过hive将客户大数据映射成数据库表;
分隔模块,用于采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
匹配模块,用于基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
监测模块,用于监测当前是否存在客户画像生成请求;
第一获取模块,用于若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
第二获取模块,用于根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
渲染模块,用于对所述目标标签进行渲染处理,得到客户画像。
优选地,所述客户画像生成装置还包括:
标记模块,用于根据预置标签分类规则,对所述标签进行类别标记,得到带有类别标记的标签;
存储模块,用于根据类别标记分类存储标签,得到第一标签数据库。
优选地,所述第二获取模块包括:
解析单元,用于解析所述目标展示信息,获得所述目标展示信息中指定展示的目标标签的信息;
查询单元,用于根据所述信息,查询目标标签所在类别的第二标签数据库并访问;
提取单元,用于从所述第二标签数据库中提取所述目标标签。
优选地,所述客户画像生成装置还包括:
统计模块,用于通过埋点统计所述目标标签被查看次数,得到所述目标标签的历史查看次数;
展示模块,用于根据历史查看次数及预置标签的展示个数,展示历史查看次数最多的标签。
优选地,所述渲染模块包括:
渲染单元,用于将所述目标标签的数据按照预置的JSP模板进行渲染,得到客户画像框架;
计算单元,用于根据所述目标标签的展示形式信息,计算所述目标标签在所述客户画像框架上的位置坐标并按所述位置坐标进行排列,得到客户画像。
进一步地,为实现上述目的,本发明还提供一种基于大数据的客户画像生成设备,所述客户画像生成设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的客户画像生成程序,所述客户画像生成程序被所述处理器执行时实现如上述任一项所述的客户画像生成方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有客户画像生成程序,所述客户画像生成程序被处理器执行时实现如上述任一项所述的客户画像生成方法的步骤。
本发明通过hive将客户大数据映射成数据库表,采用分隔符将客户信息流分隔成小段信息流,然后通过关键词匹配算法从小段信息流中匹配出客户的关键信息,以所述关键信息建立客户的标签,监测当前是否存在客户画像生成请求,若存在客户画像生成请求,则根据请求获取对应的目标标签,然后对目标标签进行渲染,生成客户画像,本发明满足用户在不同应用场景查看客户不同类别的客户信息,同时,可配置化的展示形式方便用户获取最需要的客户信息,提升用户体验。
附图说明
图1为本发明实施例方案涉及的基于大数据的客户画像生成设备运行环境的结构示意图;
图2为本发明基于大数据的客户画像生成方法第一实施例的流程示意图;
图3为本发明基于大数据的客户画像生成方法第二实施例的流程示意图;
图4为图2中步骤S60一实施例的细化流程示意图;
图5为本发明基于大数据的客户画像生成方法第三实施例的流程示意图;
图6为图2中步骤S70一实施例的细化流程示意图;
图7为本发明基于大数据的客户画像生成装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于大数据的客户画像生成设备。
参照图1,图1为本发明实施例方案涉及的客户画像生成设备运行环境的结构示意图。
如图1所示,该客户画像生成设备包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的客户画像生成设备的硬件结构并不构成对客户画像生成设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是管理和控制客户画像生成设备和软件资源的程序,支持客户画像生成程序以及其它软件和/或程序的运行。
在图1所示的客户画像生成设备的硬件结构中,网络接口1004主要用于接入网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001可以用于调用存储器1005中存储的客户画像生成程序,并执行以下客户画像生成方法的各实施例的操作。
基于上述基于大数据的客户画像生成设备的硬件结构,提出本发明客户画像生成方法的各个实施例。
参照图2,图2为本发明基于大数据的客户画像生成方法第一实施例的流程示意图。本实施例中,所述客户画像生成方法包括以下步骤:
步骤S10:通过hive将客户大数据映射成数据库表;
本实施例中,建立一个数据库表,通过hive将客户大数据进行映射处理,得到客户大数据的数据库表,以便为接下来获取客户信息提供查询条件。基于客户大数据的数据库表,使用类SQL的hiveQL语言进行数据查询,所有hive的数据都存储在Hadoop兼容的文件系统中。当加载客户大数据时,将客户大数据移动到hdfs中设定hive的目录下。其中,客户大数据保存在关系数据库中,大大减少查询时执行语义检查的时间,并且,可以直接使用存储在Hadoop文件系统中的数据。
步骤S20:采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
本实施例中,Hive没有专门的数据存储格式,也没为数据建立索引,用户可以自定义hive中的表,在创建表的时候设置hive中的列分隔符和行分隔符,控制分隔符对客户数据库表的客户信息流进行分隔处理,将客户信息流分隔成小段信息流。
进一步地,在hive的行分隔符或列分隔符对应配置文件中,声明分隔符在特定字符出进行分隔,当需要进行分隔时,先对待分隔信息进行文字识别,若识别到预置分隔字词,即通过分隔符进行分隔。
例如,对“姓名刘某某性别男职业程序员年龄28”进行分隔,根据预设分隔关键字为“姓名”、“体重”、“身高”、“职业”、“年龄”,将“姓名刘某某性别男职业程序员年龄28”分隔成“姓名刘某某”、“性别男”、“职业程序员”、“年龄28”的小段信息流。此外,客户大数据还包括客户的位置信息如所处城市、居住地址等;工作信息如公司地址、所任职位等;资产信息如名下房产、车产及其他各种个人所有资产等;保险信息如已投在保险种、在保时间、保险金额、理赔费率等信息。
步骤S30:基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
本实施例中,预置关键词库,并预设好关键字词,通过关键词匹配算法从小段信息流中进行匹配,判断分隔出的小段信息流与词库中的预设关键字词是否存在匹配关系,若存在匹配到该小段信息流存在预设关键字词,则提取该小段信息流,确定该小段信息流即为客户的关键信息,并以该小段信息流的关键信息建立客户的标签。其中,关键字词根据用户需要自定义设置;建立信息标签时,用户可以根据信息标签的关键信息类型,或自己喜好设置标签的展示形式,标签的展示形式可以是有规则进行横向或纵向排列、无规则平铺等。此外,关键词匹配算法包括kmp算法,在此之前需预建立关键词库,在词库中设定相关关键字词,以备为匹配关键信息提供比对初始数据。
进一步地,确定关键信息后,以所述关键信息制定客户的信息标签。其中,关键信息包括客户基本属性、资产特征、兴趣爱好、购物爱好、需求特征,以关键信息作为客户的信息标签,标识客户的特征。一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25岁,地域标签:广东,标签呈现出两个重要特征:语义化,人都能很方便、快速的理解每个标签含义,这也使得客户画像具有实际意义,较好的满足用户的业务需求,使用户可以针对客户属性提供开展相应业务;短文本,每个标签通常只表示一种含义,换言之,就是将客户的详细信息,抽取其中的关键信息,从关键信息中提取能够概括整段关键信息的关键字词表示客户的属性。
例如,关键词匹配算法中预设的匹配关键字为“姓名”,则调取某客户的小信息流进行匹配时,若在所述小段信息流的字词中匹配出“姓名XXX”等信息,则提取该段小段信息流,作为客户的关键信息,建立客户的标签。
步骤S40:监测当前是否存在客户画像生成请求;
步骤S50:若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
本实施例中,监测当前展示界面是否存在客户画像生成请求,若存在当前展示界面存在客户画像生成请求,则解析展示请求中携带的请求信息,从请求信息中确定目标展示信息,从目标展示信息中获取请求展示的目标标签的信息,查询目标展示标签所在类别的标签数据库,获取所述标签数据库的访问路径并进行访问,进而提取目标标签。
其中,根据应用场景的不同,可以设置同一工作环节关联多个信息标签类别,则在展示请求中,若有指明当前要展示一工作环节相关的信息标签,则需先获取该工作环节预设关联的信息标签类别信息,然后向中心服务器获取信息标签类别信息中所指定的类别标签数据库的访问路径,根据访问路径访问信息标签库,获取相关信息标签进行展示。
步骤S60:根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
本实施例中,从解析得到的目标展示信息中获取所要展示的标签信息,根据所述标签信息,访问所述标签信息中指向的目标标签所在类别的标签数据库,进而从所述标签数据库中获取目标标签。
步骤S70:对所述目标标签进行渲染处理,得到客户画像。
本实施例中,优选将所述目标标签的数据以哈希表的形式按照对应的JSP模板进行渲染,计算所述数据在渲染得到的客户画像框架中的位置坐标并按所述位置坐标对应排列,进而得到最终的客户画像。其中,标签的展示形式除了初始设置的展示形式外,还可由用户自定义设置。比如,用户可以设置信息标签的显示位置、顺序、形状;进一步地,用户还可以将部分标签隐藏起来,当需要查看时再通过点击显示进行查看,避免视觉干扰。
例如,获取反映客户基本信息的基本信息标签数据,将数据以哈希表的形式返回服务器,服务器将数据按照对应的JSP模板进行渲染,渲染生成对应的客户画像框架图形返回到显示界面,并计算数据中信息标签的预置展示形式在所述客户画像框架图形中的位置坐标,按所述位置坐标排列起来,得到最终的客户画像。其中,客户画像的框架图形可自定义设置,可以人物肖像、也可以是几何图形,具体视实际情况所需确定。
进一步地,同一客户的信息标签具有相同的标识,并在不同类别的信息标签数据库中,同一客户的信息标签存在关联关系,当需展示一客户的信息标签时,获取所述客户一信息标签类别的所有关联信息,然后根据预置展示形式进行展示,若信息过多,用户可根据需要,有选择的控制展示一部分信息标签,隐藏一部分信息标签,使用户能够快速了解客户信息,方便为客户制定相关服务内容,提高服务质量。
本实施例通过hive将客户大数据映射成数据库表,采用分隔符将客户信息流分隔成小段信息流,然后通过关键词匹配算法从小段信息流中匹配出客户的关键信息,以所述关键信息建立客户的标签,监测当前是否存在客户画像生成请求,若存在客户画像生成请求,则根据请求获取对应的目标标签,然后对目标标签进行渲染,生成客户画像,本发明满足用户在不同应用场景查看客户不同类别的客户信息,同时,可配置化的展示形式方便用户获取最需要的客户信息,提升用户体验。
参照图3,图3为本发明基于大数据的客户画像生成方法第二实施例的流程示意图。本实施例中,在步骤S30之后,还包括:
步骤S001:根据预置标签分类规则,对所述标签进行类别标记,得到带有类别标记的标签;
本实施例中,根据应用场景的不同,设定标签分类规则,将标签划分为不同的类别,根据类别对标签逐一建立类别标记,得到带有类别标记的标签。例如,根据销售场景制定类别,在保险销售场景中,根据客户的保险信息,服务时划分以下销售服务环节:保险续保环节、理赔处理环节、保险销售环节等。其中,如保险续保环节中,需查看客户的基本信息、已投保信息、续保信息,根据标签所表示的信息所述类别,如基本信息、保险信息、续保信息类别,将客户的标签进行类别标记,得到带类别标记的标签。
步骤S002:根据类别标记分类存储标签,得到第一标签数据库。
本实施例中,将所有类别的标签按类别分类之后,进一步的,对同一客户的标签进行关联处理,以便需要展示一个客户其中一类别的标签时,获取该客户这一类别的所有标签。
本实施例中,根据类别标记分类存储标签,相同类别标记的标签存储在同一个数据库中,得到不同类别的标签数据库。其中,本发明用于存储标签的数据库选择HBASE数据库。此外,应用场景的不同,标签的具体类别由实际应用场景确定,且可由用户自定义设置。
例如,在保险推销的应用场景中,若坐席在客户续保环节,需要客户的基本信息、投保信息和资产信息时,则将客户的基本信息对应标签标签、投保信息对应标签、资产信息对应标签建立类别标记,进而存储在数据库中,得到基本信息标签、投标信息标签、资产信息标签的标签数据库,进一步地,还可以将基本信息标签、投标信息标签、资产信息标签数据库标识为续保环节所需类别信息标签,当用户确定当前所处环节,即调取基本信息标签、投标信息标签、资产信息标签的信息标签。
参照图4,图4为图2中步骤S60一实施例的细化流程示意图。基于上述实施例,在本实施例中,步骤S60进一步包括:
步骤S601:解析所述目标展示信息,获得所述目标展示信息中指定展示的目标标签的信息;
本实施例中,解析展示请求的请求信息,获得请求中的目标展示信息,确定所述目标展示信息中指定需要展示的信息标签类别,以便访问相应类别的信息标签数据库,提取对应客户的信息标签。
步骤S602:根据所述信息,查询目标标签所在类别的第二标签数据库并访问;
本实施例中,根据上述步骤的目标展示信息,查询所要展示的标签所在类别的标签数据库,获取该类别的标签数据库对应的访问路径,根据所述访问路径访问该类别的标签数据库。
步骤S603:从所述第二标签数据库中获取所述目标标签。
本实施例中,基于上述步骤所得到的第二标签数据库的访问路径,访问相应的标签数据库,从标签数据库中提取带有需要展示的目标标签。例如,确定需要展示的标签为基本信息类别的标签后,从基本信息类别的标签数据库中,提取当前所查询的客户的基本信息类别的标签。
参照图5,图5为本发明基于大数据的客户画像生成方法第三实施例的流程示意图。基于上述实施例,本实施例中,在步骤S70之后,还包括:
步骤S010:通过埋点统计所述目标标签被查看次数,得到所述目标标签的历史查看次数;
本实施例中,通过对标签进行埋点处理,实时记录各个标签被查看次数,得到各个标签的历史查看次数。其中,本发明对于埋点方式不限,比如采用手动埋点、可视化埋点、自动埋点等方式。同时对于埋点代码的植入位置不限,比如在前端UI层进行埋点,在底层数据表或日志中进行埋点。
进一步地,预先在信息标签的展示位置植入埋点代码,当用户点击查看时,由埋点代码自动调用相关接口上传埋点数据至后端服务器,后端服务器通过统计埋点数据,得到标签的历史查看次数。
步骤S020:根据历史查看次数及预置信息标签的展示个数,展示历史查看次数最多的标签。
本实施例中,基于历史查看次数统计数据,对同一客户的同一类别的标签进行排序,历史查看次数最多的标签表明用户经常查看,进而根据历史查看次数,历史查看次数最多的标签排在优先展示队列中,展示历史查看次数最多的标签,其中,历史查看次数越多的标签,即证明被查看的频率越多,说明用户经常需要,故而设置这类标签优先展示,可用户能够最快速度获取需要的客户信息。
例如,预置一类别标签的展示个数为5个,统计该类别的各标签的历史查看次数,根据历史查看次数,从高到低进行排列,显示查看次数排名前5的5个标签,剩余部分标签进行隐藏。进一步地,隐藏的剩余部分标签用户通过点击显示全部进行查看,若未监测到用户查看请求,则默认显示5个历史查看次数高的标签。
参照图6,图6为图2中步骤S70一实施例的细化流程示意图。基于上述步骤,本实施例中,步骤S70进一步包括:
步骤S701:将所述目标标签的数据按照预置的JSP模板进行渲染,得到客户画像框架;
步骤S702:根据所述目标标签的标签展示形式信息,计算所述目标标签在所述客户画像框架上的位置坐标并按所述位置坐标进行排列,得到客户画像。
本实施例中,在建立信息标签时,用户根据标签的关键信息类型,或自己喜好设置标签的展示形式,标签的展示形式可以是有规则进行横向或纵向排列、无规则平铺等。优选将所述待展示标签的数据以哈希表的形式返回服务器,服务器按照所述数据对应的JSP模板进行渲染,其中,JSP模板为预设的Java服务器页面模板,得到客户画像框架,根据标签中预先配置的展示形式信息,计算所述标签在客户画像框架中的位置坐标并按所述位置坐标对应排列,进而得到最终的客户画像。
例如,获取反映客户基本信息的基本信息标签数据,将数据以哈希表的形式返回服务器,服务器将数据按照预置的JSP模板进行渲染,渲染生成对应的客户画像框架图形返回到显示界面,然后根据标签中预先配置的展示形式信息,计算数据中信息标签的预置展示形式在所述客户画像框架图形中的位置坐标,按所述位置坐标排列起来,得到最终的客户画像。其中,客户画像的框架图形可自定义设置,可以人物肖像、也可以是几何图形,具体视实际情况所需确定。
本发明还提供一种基于大数据的客户画像生成装置。
参照图7,图7为本发明客户画像生成装置一实施例的功能模块示意图。本实施例中,所述客户画像生成装置包括:
映射模块10,用于通过hive将客户大数据映射成数据库表;
分隔模块20,用于采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
匹配模块30,用于基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
监测模块40,用于监测当前是否存在客户画像生成请求;
第一获取模块50,用于若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
第二获取模块60,用于根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
渲染模块70,用于对所述目标标签进行渲染处理,得到客户画像。
本实施例中,映射模块10通过hive将客户大数据映射成数据库表,分隔模块20采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流,匹配模块30,用于基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,监测模块40监测当前是否存在客户画像生成请求,第一获取模块50在确定存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,第二获取模块60根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签,渲染模块70对所述目标标签进行渲染处理,得到客户画像。
本发明还提供一种计算机可读存储介质。
本实施例中,所述计算机可读存储介质上存储有客户画像生成程序,所述客户画像生成程序被处理器执行时实现如上述任一项实施例中所述的客户画像生成方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本发明的保护之内。
Claims (6)
1.一种基于大数据的客户画像生成方法,其特征在于,所述客户画像生成方法包括以下步骤:
通过hive将客户大数据映射成数据库表;
采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
根据预置标签分类规则,对所述标签进行类别标记,得到带有类别标记的标签;
根据类别标记分类存储标签,得到第一标签数据库;
监测当前是否存在客户画像生成请求;
若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
对所述目标标签进行渲染处理,得到客户画像;
通过埋点统计所述目标标签被查看次数,得到所述目标标签的历史查看次数;
根据历史查看次数及预置标签的展示个数,展示历史查看次数最多的标签;
所述根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签包括:
解析所述目标展示信息,获得所述目标展示信息中指定展示的目标标签的信息;
根据所述信息,查询目标标签所在类别的第二标签数据库并访问;
从所述第二标签数据库中提取所述目标标签。
2.如权利要求1所述的客户画像生成方法,其特征在于,所述对所述目标展示标签进行渲染处理,得到客户画像包括:
将所述目标标签的数据按照预置的JSP模板进行渲染,得到客户画像框架;
根据所述目标标签的展示形式信息,计算所述目标标签在所述客户画像框架上的位置坐标并按所述位置坐标进行排列,得到客户画像。
3.一种基于大数据的客户画像生成装置,其特征在于,所述客户画像生成装置包括:
映射模块,用于通过hive将客户大数据映射成数据库表;
分隔模块,用于采用分隔符对客户数据库表中与客户相关的信息流进行分隔处理,得到小段信息流;
匹配模块,用于基于预置的客户关键词,通过关键词匹配算法从所述小段信息流中匹配出客户的关键信息,并以所述关键信息建立标签,其中,所述标签中包含客户的信息和标签的展示形式信息;
标记模块,用于根据预置标签分类规则,对所述标签进行类别标记,得到带有类别标记的标签;
存储模块,用于根据类别标记分类存储标签,得到第一标签数据库;
监测模块,用于监测当前是否存在客户画像生成请求;
第一获取模块,用于若存在客户画像生成请求,则从所述客户画像生成请求中获取目标展示信息,其中,所述目标展示信息包含请求展示的目标标签的信息;
第二获取模块,用于根据所述目标展示信息,获取所述目标展示信息指定展示的目标标签;
渲染模块,用于对所述目标标签进行渲染处理,得到客户画像;
统计模块,用于通过埋点统计所述目标标签被查看次数,得到所述目标标签的历史查看次数;
展示模块,用于根据历史查看次数及预置标签的展示个数,展示历史查看次数最多的标签;
所述第二获取模块包括:
解析单元,用于解析所述目标展示信息,获得所述目标展示信息中指定展示的目标标签的信息;
查询单元,用于根据所述信息,查询目标标签所在类别的第二标签数据库并访问;
提取单元,用于从所述第二标签数据库中提取目标标签。
4.如权利要求3所述的客户画像生成装置,其特征在于,所述渲染模块包括:
渲染单元,用于将所述目标标签的数据按照预置的JSP模板进行渲染,得到客户画像框架;
计算单元,用于根据所述目标标签的展示形式信息,计算所述目标标签在所述客户画像框架上的位置坐标并按所述位置坐标进行排列,得到客户画像。
5.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的客户画像生成程序,所述客户画像生成程序被所述处理器执行时实现如权利要求1或权利要求2所述的基于大数据的客户画像生成方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有客户画像生成程序,所述客户画像生成程序被处理器执行时实现如权利要求1或权利要求2所述的基于大数据的客户画像生成方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911264778.2A CN111143555B (zh) | 2019-12-11 | 2019-12-11 | 基于大数据的客户画像生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911264778.2A CN111143555B (zh) | 2019-12-11 | 2019-12-11 | 基于大数据的客户画像生成方法、装置、设备及存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111143555A CN111143555A (zh) | 2020-05-12 |
| CN111143555B true CN111143555B (zh) | 2024-02-09 |
Family
ID=70518033
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201911264778.2A Active CN111143555B (zh) | 2019-12-11 | 2019-12-11 | 基于大数据的客户画像生成方法、装置、设备及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111143555B (zh) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111753026B (zh) * | 2020-06-28 | 2023-09-12 | 中国银行股份有限公司 | 一种用户画像生成系统、方法、装置、设备和介质 |
| CN111986744B (zh) * | 2020-09-03 | 2023-10-24 | 深圳赛安特技术服务有限公司 | 医疗机构的患者界面生成方法、装置、电子设备及介质 |
| CN113344714A (zh) * | 2021-05-27 | 2021-09-03 | 北京优全智汇信息技术有限公司 | 保险行业专用客户管理分析系统及其分析方法 |
| CN113641362A (zh) * | 2021-08-10 | 2021-11-12 | 中国平安人寿保险股份有限公司 | 客户画像的更新方法、装置、设备以及存储介质 |
| CN114003704A (zh) * | 2021-10-29 | 2022-02-01 | 平安消费金融有限公司 | 指定标签客群的创建方法、装置、电子设备及存储介质 |
| CN114359706A (zh) * | 2021-12-02 | 2022-04-15 | 深圳市普渡科技有限公司 | 信息传播方法与设备 |
| CN114417101A (zh) * | 2021-12-22 | 2022-04-29 | 浙江力石科技股份有限公司 | 一种基于数据埋点的用户识别方法及系统 |
| CN114493710B (zh) * | 2022-01-29 | 2025-07-15 | 深圳市小满科技有限公司 | 客户行为识别方法、装置、计算机设备及介质 |
| CN115659057A (zh) * | 2022-12-29 | 2023-01-31 | 北京易思汇商务服务有限公司 | 一种学校画像生成方法、装置、终端、系统及存储介质 |
| CN119336982A (zh) * | 2024-09-06 | 2025-01-21 | 海南巨量互娱科技有限公司 | 基于大数据的用户画像生成方法、装置及电子设备 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109146539A (zh) * | 2018-06-28 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户画像的更新方法及装置 |
| CN109492021A (zh) * | 2018-09-26 | 2019-03-19 | 平安科技(深圳)有限公司 | 企业画像信息查询方法、装置、计算机设备和存储介质 |
| CN109558530A (zh) * | 2018-10-23 | 2019-04-02 | 深圳壹账通智能科技有限公司 | 基于数据处理的用户画像自动生成方法和系统 |
| CN109784973A (zh) * | 2018-12-14 | 2019-05-21 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法、装置及电子设备 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8209320B2 (en) * | 2006-06-09 | 2012-06-26 | Ebay Inc. | System and method for keyword extraction |
| US10789287B2 (en) * | 2016-07-05 | 2020-09-29 | Baidu Usa Llc | Method and system for multi-dimensional image matching with content in response to a search query |
-
2019
- 2019-12-11 CN CN201911264778.2A patent/CN111143555B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109146539A (zh) * | 2018-06-28 | 2019-01-04 | 深圳市彬讯科技有限公司 | 用户画像的更新方法及装置 |
| CN109492021A (zh) * | 2018-09-26 | 2019-03-19 | 平安科技(深圳)有限公司 | 企业画像信息查询方法、装置、计算机设备和存储介质 |
| CN109558530A (zh) * | 2018-10-23 | 2019-04-02 | 深圳壹账通智能科技有限公司 | 基于数据处理的用户画像自动生成方法和系统 |
| CN109784973A (zh) * | 2018-12-14 | 2019-05-21 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法、装置及电子设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111143555A (zh) | 2020-05-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111143555B (zh) | 基于大数据的客户画像生成方法、装置、设备及存储介质 | |
| US11734287B2 (en) | Mapping images to search queries | |
| US10678838B2 (en) | Augmented reality display apparatus and related methods using database record data | |
| US11722575B2 (en) | Dynamic application content analysis | |
| US7925993B2 (en) | Method and system for aggregating and presenting user highlighting of content | |
| US10409874B2 (en) | Search based on combining user relationship datauser relationship data | |
| US9449215B2 (en) | Information processing apparatus, information processing method and information processing program | |
| CN106688215B (zh) | 针对内容效能优化的自动点击类型选择 | |
| US11205195B2 (en) | Information processing device, information processing method, and information processing program | |
| US9710440B2 (en) | Presenting fixed format documents in reflowed format | |
| CN109168047B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
| US11886556B2 (en) | Systems and methods for providing user validation | |
| JP2017500634A (ja) | ディスプレイコンテンツのイメージを抽出し、生成するシステムおよび方法 | |
| US20170287041A1 (en) | Information processing apparatus, information processing method, and information processing program | |
| US9569465B2 (en) | Image processing | |
| US10606884B1 (en) | Techniques for generating representative images | |
| JP7425126B2 (ja) | プラットフォームをまたいだコンテンツのミュート | |
| JP2016110260A (ja) | コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法 | |
| CN113051477B (zh) | 内容推荐方法、装置、电子设备和介质 | |
| CN119003531A (zh) | 基于大数据的电力客户画像管理方法及系统 | |
| CN116595955A (zh) | 表格生成方法、装置、服务器以及存储介质 | |
| US20150262196A1 (en) | Electronic Financial/Economic Modeling Environment | |
| US10445384B2 (en) | System and method for determining a search response to a research query | |
| CN119105827A (zh) | 一种基于客户身份属性的个性化页面展示方法及装置 | |
| CN116541760A (zh) | 用户分群处理方法、电子设备及计算机可读存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |