CN105046601A - 用户数据处理方法和系统 - Google Patents
用户数据处理方法和系统 Download PDFInfo
- Publication number
- CN105046601A CN105046601A CN201510402086.5A CN201510402086A CN105046601A CN 105046601 A CN105046601 A CN 105046601A CN 201510402086 A CN201510402086 A CN 201510402086A CN 105046601 A CN105046601 A CN 105046601A
- Authority
- CN
- China
- Prior art keywords
- data
- dweller
- user
- user data
- identification number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种用户数据处理方法和系统,其中方法包括:通过多个信息源分别对用户数据进行采集;从酒店PMS系统中提取当前住客对应的住客标识号;根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;对所述目标数据进行数据整合,得到统一数据格式的住客数据。本发明能够支持不同类型客户端,快速便捷的采集用户行为数据的方法和系统,通过整合目标用户的用户属性数据和用户行为数据,使用户数据多渠道实时生成,从而实现了管理不同类型的信息源的用户数据采集方式,进而及时了解目标用户特征;而且尽量避免用户在使用电视时主动进行输入,增强了操作效率和用户体验。
Description
技术领域
本发明涉及数据采集与处理,具体地,涉及用户数据处理方法和系统。
背景技术
在目前的用户信息采集过程,往往需要用户手动输入待注册的信息,这样采集到的信息虽然准确、稳定,但同时也往往增加了用户操作的繁琐过程。
在酒店行业中,一般各酒店应用PMS系统(PropertyManagementSystem)来对住客、房间以及账单的信息进行管理,住客在酒店办理信息登记、或者购买酒店的某些服务后,PMS系统会存储住客的个人信息和行为数据;酒店行业OTA是指酒店第三方在线旅行服务代理商(OnlineTravelAgency,简称OTA),用户通过OTA的网站或客户端向酒店下单时,OTA的服务平台也会存储用户的个人信息和预订数据;用户入住酒店,下载使用酒店的官方APP后,APP服务器也会存储用户的个人信息和服务信息。用户的个人信息和行为数据往往来自于多个渠道,但多个渠道的数据格式并不统一,服务器在分析采集用户的数据时,往往还需要用户重新手动输入个人信息,如用户的手机号、性别、偏爱的服务、喜好等,由于重复采集的过程过于繁琐或者出于隐私的考虑,用户往往怠于输入此类信息,降低了信息的丰富程度,也减慢了数据的统计分析效率。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种用户数据处理方法和系统,以解决如下技术问题:
1、如何自动、实时从信息源接收用户行为数据等用户数据;
2、如何不依赖于用户的输入来获取用户数据;
3、如何灵活配置用户数据的采集规则,从而通用性强,能够集中管理不同类型的用户行为数据采集。
根据本发明提供的一种用户数据处理方法,其包括如下步骤:
通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
从酒店PMS系统中提取当前住客对应的住客标识号;
根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
对所述目标数据进行数据整合,得到统一数据格式的住客数据。
根据本发明提供的一种用户数据处理系统,包括如下装置:
第一采集装置,用于通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
第一提取装置,用于从酒店PMS系统中提取当前住客对应的住客标识号;
第二提取装置,用于根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
第一整合装置,用于对所述目标数据进行数据整合,得到统一数据格式的住客数据。
与现有技术相比,本发明具有如下的有益效果:
本发明通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;从酒店PMS系统中提取当前住客对应的住客标识号;根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;对所述目标数据进行数据整合,得到统一数据格式的住客数据。本发明用户数据的采集规则定义灵活,具有通用性强的特点,不局限于特定业务(客户端)的优点,提高了信息的丰富程度,可实时对不同渠道获取的数据进行统计分析;通过多渠道可获得丰富的用户数据,进而可更准确的了解用户特征并以此实现智能推荐,而且尽量避免用户在使用电视时主动进行输入,增强了操作效率和用户体验。
本发明在用户于酒店PMS系统中登记成为当前住客后,再从多个信息源的用户数据中提取当前住客对应的目标数据;实现了以酒店PMS系统的住客登记为触发点,完成收集用户数据-触发目标数据-整合住客数据的过程,避免了在用户成为住客前对用户数据进行的提前处理,以减轻数据处理负担,在用户成为住客的最后时刻获取到最新的用户数据,以更准确地反映用户的特征。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的用户数据处理方法的流程示意图;
图2为本发明提供的用户数据处理系统的结构示意图;
图3为本发明中用户数据采集与处理的原理示意图;
图4为本发明中向用户推荐信息的原理示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明提供了一种能够支持不同类型客户端,快速便捷的采集用户行为数据的方法和系统。在本发明是采用了客户端、酒店PMS系统、在线预订渠道系统集成的技术方案,通过整合目标用户的用户属性数据和用户行为数据,使用户数据多渠道实时生成,从而实现了管理不同类型的信息源的用户数据采集方式,进而及时了解目标用户特征。
如图2所示,根据本发明提供的一种用户数据处理系统,包括如下装置:
第一采集装置,用于通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
第一提取装置,用于从酒店PMS系统中提取当前住客对应的住客标识号;
第二提取装置,用于根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
第一整合装置,用于对所述目标数据进行数据整合,得到统一数据格式的住客数据;
第一生成装置,用于将所述住客数据进行属性抽取,生成客人初级标签;
第一聚类装置,用于将所述客人初级标签利用既定的客人模型进行聚类,得到聚类结果;
第三处理装置,用于根据所述聚类结果得到客人次级标签作为客人优化标签;
第一推荐装置,用于根据所述客人优化标签向当前住客推荐对应的目标服务信息。
优选地,所述第一提取装置,包括如下装置:
第一获取装置,用于通过酒店PMS系统获取当前住客对应的信息载体,所述信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-除酒店PMS系统之外其它信息源对应的标识号;
-由除酒店PMS系统之外其它信息源采集到的用户行为数据;
-由除酒店PMS系统之外其它信息源采集到的用户属性数据;
第一解析装置,用于对所述信息载体进行解析,得到当前住客对应的住客标识号。
优选地,所述第二提取装置,包括如下装置:
-第二获取装置,用于根据所述其它信息源对应的标识号的指示,从所述其它信息源获取住客所属群体的共性用户数据作为目标数据;和/或
-第三获取装置,用于根据所述其它信息源对应的标识号的指示,访问所述其它信息源,并根据获取自所述信息载体的住客标识号从所述其它信息源获取与住客标识号相应的目标数据。
优选地,所述第二提取装置,包括如下装置:
第四获取装置,用于对各信息源采集的所述用户数据分别进行解析,分别获取各用户数据各自对应的属性内容;
第三提取装置,用于根据所述住客标识号分别在所述属性内容中进行实时提取,将所述用户数据中与所述住客标识号对应关联的属性内容作为目标数据。
优选地,所述第一整合装置,包括如下装置:
第一创建装置,用于创建记载有所述住客标识号的数据条目;
第一记载装置,用于将提取自各用户数据的目标数据分别记载于所述数据条目对应的属性字段中;
第一处理装置,用于将所述数据条目作为所述住客标识号对应的统一数据格式的住客数据。
优选地,所述第一记载装置,包括如下装置:
第一确定装置,用于确定所述目标数据所来自的信息源的类型;
第二处理装置,用于根据所述信息源的类型,从所述目标数据中提取出存在的目标字段,并获取所述目标字段与信息源的类型对应的关联规则;其中,所述信息源通过所述目标字段对目标数据进行区分和标识,所述关联规则用于指示目标字段分别与统一数据格式中各属性字段之间的对应关系;
第二记载装置,用于根据所述关联规则,将不同目标字段对应的目标数据分别记载到统一数据格式中对应的属性字段中,形成所述统一数据格式的住客数据。
在更多的优选例中:
优选地,所述第一获取装置,包括如下装置:
第一控制装置,用于令酒店PMS系统从一信息源接收第一信息载体,其中,所述第一信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-所述另一个或另多个信息源的标识号;
-由所述另一个信息源采集到的用户行为数据;
-由所述另一个信息源采集到的用户属性数据;
第二解析装置,用于对所述第一信息载体进行解析,得到当前住客对应的住客标识号;
所述第二提取装置,包括如下装置:
第五获取装置,用于根据接收自所述一信息源的所述另一个或另多个信息源的标识号的指示,从所述另一个或另多个信息源获取住客所属群体的共性用户数据作为目标数据;和/或
第六获取装置,用于根据接收自所述一信息源的所述另一个或另多个信息源的标识号的指示,访问所述另一个或另多个信息源,并根据接收自所述一信息源的住客标识号从所述另一个或另多个信息源获取与住客标识号相应的目标数据;
所述一信息源为手机,所述第一信息载体为二维码,所述另一个信息源为酒店PMS系统或者OTA系统,所述另一个或另多个信息源的标识号提取自所述手机访问所述另一个或另多个信息源所产生的行为记录文件;
优选地,所述第一获取装置,包括如下装置:
第一读取装置,用于从酒店PMS系统读取第二信息载体;其中,所述第二信息载体由酒店PMS系统和/或除酒店PMS系统之外的其它信息源生成,并植入当前住客对应的住客标识号,还植入如下任一种或任多种信息:
-所述其它信息源的标识号;
-由所述其它信息源采集到的用户行为数据;
-由所述其它信息源采集到的用户属性数据;
第三解析装置,用于对所述第二信息载体进行解析,得到当前住客对应的住客标识号;
优选地,所述对所述目标数据进行数据整合时:
由信息源对目标数据进行数据整合,信息源包括如下装置:
-第一信息源端处理装置,用于按照统一数据格式采集用户数据;或者
-第二信息源端处理装置,用于将采集到的用户数据转换为统一数据格式。
所述用户数据处理系统,还包括如下装置:
第一发送装置,用于向信息源发送数据格式指令,其中,数据格式指令用于向信息源指示所述统一数据格式。
所述数据格式指令包括采集规则、关联规则、格式信息,其中:
所述采集规则用于向信息源指示需采集的用户数据的目标字段,其中,信息源通过所述目标字段对用户数据进行区分和标识;
所述关联规则用于向信息源指示目标字段与格式信息之间的对应关系;
所述格式信息用于向信息源指示不同目标字段的用户数据在所述统一数据格式中的记录位置。
所述第一发送装置,包括如下装置:
第一确定装置,用于确定信息源的类型;
第二生成装置,用于根据信息源的类型,生成与格式信息对应的采集规则和关联规则;
第二发送装置,用于将包含格式信息、采集规则、关联规则的统一数据格式发送给信息源。
所述统一数据格式包括若干分区,其中的任一个或任多个分区记载如下任一种或任多种格式信息:
-信息源类型;
-信息源标识号;
-信息源中数据采集设备类型;
-数据采集设备标识号;
-用户识别号;
-用户操作信息;
-应用界面类型;
-应用标识号;
-应用版本号;
-应用界面标识号;
-应用界面父界面标识号;
-内容信息;
-内容类别;
-内容属性;
-行为标签。
所述数据格式指令还用于指示信息源根据统一数据格式中的采集规则在应用界面进行埋点。
所述数据格式指令还用于指示信息源发送所述用户数据的时间或者网络条件。
优选地,所述多个信息源包括酒店PMS系统,还包括用户客户端和/或OTA系统。
优选地,所述第二提取装置,包括如下装置:
第七获取装置,用于从酒店PMS系统中获取用户属性数据,其中,所述用户属性数据包括住客标识号;
第八获取装置,用于根据住客标识号从处酒店PMS系统之外的另一个或另多个信息源获取相应的用户数据,进而提取出所述目标数据。
具体地,如图1所示,所述用户数据处理系统可以通过如下说明的根据本发明提供的一种用户数据处理方法进行实现,其中,所述用户数据处理方法包括如下步骤:
通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
从酒店PMS系统中提取当前住客对应的住客标识号;
根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
对所述目标数据进行数据整合,得到统一数据格式的住客数据。
下面就所述通过多个信息源分别采集的用户数据进行说明。
如图3所示,所述多个信息源包括酒店PMS系统,还包括客户端和/或网站系统,客户端可以是酒店客房内的客户端,也可以是用户私人的客户端;网站系统可以是OTA(OnlineTravelAgent,是在线旅游社)站点。
所述用户数据根据不同的信息源可以是相应的数据,具体如下:
当信息源为酒店的PMS系统时,所述用户数据包括用户的日程信息和/或身份信息,并将用户的身份信息作为用户标识信息,其中,身份信息包括姓名、证件号、联系方式(例如手机号码、电子邮箱地址、微信号、QQ号等)。
当前用户到酒店办理入住手续时,酒店的PMS系统采集当前用户的用户数据,如当前用户的姓名、身份证号(护照号)、性别、入住时间、入住房间、入住天数、入住人数、联系方式,同行人的姓名、身份证号等。在当前用户已办理完毕入住手续,即表示当前用户已入住时,则触发整个用户数据处理过程,通过在当前用户所入住的房间所安装的电视机显示推荐信息。
又例如,所述用户数据还包括客户端和/或网站系统中的多种信息:操作记录、浏览记录、预订信息。例如,用户在酒店的智能电视客户端上进行操作和浏览,则可以采集该智能电视客户端对应的操作日志和/或浏览日志,提取所述操作日志和/或浏览日志中对应的日志内容,并对所述日志内容进行分析,将分析提取得到的关键字作为用户数据。具体地,用户数据还可以是通过分别记录用户在入住的房间内查看的智能电视中各页面和对应的停留时间、触发的各菜单选项和对应的菜单条目,分别统计各页面和对应的停留时间、各菜单条目的操作频率,提取菜单选项下排名靠前页面中的页面内容和页面停留时间与内容,并按页面内容中各组成部分(标题、副标题、正文)的权值统计关键词,将统计得到的关键词作为用户数据。
又例如,用户在OTA站点中进行访问和操作,可以对访问日志、操作日志中获取浏览信息和操作信息,并对浏览信息和操作信息提取得到关键字作为用户数据以表征用户的喜爱偏好。网站系统除了OTA站点之外,还可以是饭店订座系统、票务订购系统、电影订票系统、出租车预定系统、其它PMS系统等等可以获得更多用户信息的系统。
再例如,还可以从用户在智能手机中的上网记录,提取出手机端浏览的APP及APP内的页面内容及其关键词作为用户数据。优选地,酒店客户端包括设置在每间酒店的房间内的智能电视机,智能电视机预先与用户的智能手机关联,使智能手机发送控制指令对智能电视进行控制。当用户通过智能手机遥控智能电视时,通过智能电视机接收到的遥控指令记录用户的操作记录,根据操作记录对当前用户对应的操作日志和/或浏览日志进行提取,提取出用户在遥控电视时的操作记录和浏览记录,结合用户对应的操作记录和浏览记录分析用户的兴趣,将与用户兴趣对应的关键字作为用户数据。同样的,可以分别统计手机APP中各页面和对应的停留时间、各操作菜单条目的操作频率、用户输入的文本内容、通过APP预定过的服务信息等统计关键词,将各APP对应的关键词作为用户数据。
如一个“三十九岁的美国人”的用户从携程网预订了北京某酒店的入住,在酒店办理入住手续后,实时提取该用户在包括携程网在内的OTA网站中的访问日志,获取最近一段时间该用户在OTA站点中浏览的北京旅游攻略、爱好的餐厅等网页信息,通过这些网页信息进行分析,提取关键字。进一步地,还可以提取该用户手机在特定类型APP的访问日志,如在APP的预定模块中读取预订信息,其入住过什么样的酒店、叫过哪种类型的外卖等等,更全面地获取用户的喜好信息;还可以获取其在其它酒店中的PMS信息,如他以前在酒店订购过什么样的服务等;再进一步地,还可以从票务网站提取该用户在票务销售网站进行演出的订票信息,得到该演出的日期和地点,还可以从出租车预定系统获取该用户在什么日期和时间、到哪个目的地下车,途中经过哪些人文经典等等信息。更进一步,提取其操作房间的电视时的浏览记录和操作记录。
下面就从酒店PMS系统中提取当前住客对应的住客标识号进行说明。
所述从酒店PMS系统中提取当前住客对应的住客标识号时:
通过酒店PMS系统获取当前住客对应的信息载体,所述信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-除酒店PMS系统之外其它信息源对应的标识号;
-由除酒店PMS系统之外其它信息源采集到的用户行为数据;
-由除酒店PMS系统之外其它信息源采集到的用户属性数据;
对信息载体进行解析,得到当前住客对应的住客标识号。
相应地,所述从所述用户数据中分别提取当前住客对应的目标数据时:
-可以根据所述其它信息源对应的标识号的指示,从所述其它信息源获取住客所属群体的共性用户数据作为目标数据;
-也可以根据所述其它信息源对应的标识号的指示,访问所述其它信息源,并根据获取自所述信息载体的住客标识号从所述其它信息源获取与住客标识号相应的目标数据。
所述信息载体可以是第一信息载体或者第二信息载体,下面通过优选例对第一信息载体或者第二信息载体进行说明。
在一个优选例中,所述通过酒店PMS系统获取信息载体时:
令酒店PMS系统从一信息源接收第一信息载体,其中,所述第一信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-除酒店PMS系统之外其它信息源的标识号;
-由除酒店PMS系统之外其它信息源采集到的用户行为数据;
-由除酒店PMS系统之外其它信息源采集到的用户属性数据;
对所述第一信息载体进行解析,得到当前住客对应的住客标识号;
相应地,所述从所述用户数据中分别提取当前住客对应的目标数据时:
可以根据接收自所述酒店PMS系统之外其它信息源的标识号的指示,从所述酒店PMS系统之外其它信息源获取住客所属群体的共性用户数据作为目标数据。例如,从浏览器中获取用户浏览过网站的网站名称及网页中链接的链接名等文本信息,从网站名称以及链接名中提出关键词。比如住客经常浏览名为“美食家”的网站中川菜栏目的网页,则可以提取出“美食”、“川菜”等关键词,从而将住客所属的喜欢川菜的食客群体的共性“麻辣”、“鲜香”数据作为该住客的目标数据。
也可以根据接收自所述一信息源所包含的所述另一个或另多个信息源的住客标识号,从而根据所述住客标识号访问所述另一个或另多个信息源,并根据接收自所述一信息源的住客标识号从所述另一个或另多个信息源获取与住客标识号相应的目标数据。例如,当前住客通过酒店的PMS系统办理入住手续时,酒店的PMS系统读取当前住客在OTA站点预定时产生的住宿券,住宿券中除了包含该订单的信息之外,还包含当前住客在OTA站点的用户名,则服务器根据该用户名从该OTA站点中查找当前用户的相关信息,包括当前用户在该OTA站点所观看过的电影、从该OTA站点购买过的电影票等等,从而获知当前住客的偏好,并在客房电视中推荐同类影片,并避免推荐用户已观看过的电影,即利用从酒店PMS系统获得相应站点的session,并根据session从相应的网站获取该用户的个人行为数据。
所述一信息源可以为手机,所述第一信息载体可以为二维码,所述另一个信息源可以为酒店PMS系统或者OTA系统,所述另一个或另多个信息源的标识号提取自所述手机访问所述另一个或另多个信息源所产生的行为记录文件;具体地,当用户浏览OTA网站、酒店官网等不同渠道的信息时,会产生记录了用户浏览行为等的行为记录文件,行为记录文件可以为中可包含SessionID机制文件(包含SessionID)等用于指示用户的唯一标识数据(例如网站的域名)。当该用户使用用户客户端(例如手机)扫描了如上网站上的二维码时(此二维码可以是OTA网站、酒店官网与实施本发明所提供方法的服务商产生的),这些唯一标识数据通过二维码采集至手机中,然后再从手机中获取包含有该唯一标识数据的用户数据,从而依靠该唯一标识数据的指示(例如域名的链接指向)访问相应的网站,就可以采集到多渠道的用户行为数据,即可对应同一用户下的不同来源的数据进行数据分析,其中,优选地从相应的网站获取用户所属群体的共性行为数据。
第一信息载体还可以是条形码、混合码、彩色码等编码,所述第一信息载体中包含有如下任一种或任多种信息:
-所述另一个或另多个信息源的标识号;例如网站域名、链接、服务器地址等;
-用户标识号;例如用户的网名、登录ID等。
在另一个优选例中,所述通过酒店PMS系统获取信息载体时:
从酒店PMS系统读取第二信息载体,其中,第二信息载体可以是条形码、二维码、混合码、彩色码等编码,所述第二信息载体由酒店PMS系统和/或除酒店PMS系统之外的其它信息源生成,并植入当前住客对应的住客标识号,还植入如下任一种或任多种信息:
-所述其它信息源的标识号;
-由所述其它信息源采集到的用户行为数据;
-由所述其它信息源采集到的用户属性数据;
对所述第二信息载体进行解析,得到当前住客对应的住客标识号;
第二信息载体可以记载COOKIE机制文件中的信息(例如COOKIEID)。例如,当用户实施使用OTA、酒店提供的消费券、(优选记载于COOKIE中的)积分等行为时,用户名、COOKIEID等唯一标识数据随着积分、消费券被采集至酒店PMS系统中。本发明系统中的服务器获取酒店PMS数据后,可对不同渠道的数据进行对应的用户数据分析。也就是说,可以先从一信息源得到的唯一标识数据(例如COOKIE机制文件中注册网站会员时的手机号码),然后根据与唯一标识数据一同接收的相关信息(与手机绑定的QQ号码)所另行指向的其他信息源(例如QQ商城)获取用户数据,其中,手机号码、与手机绑定的QQ号码可以均记载在一作为第二信息载体的二维码中。
下面就所述根据所述住客标识号对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据进行说明。
具体地,对各信息源采集的所述用户数据分别进行解析,分别获取各用户数据各自对应的属性内容;根据所述住客标识号分别在所述属性内容中进行提取,将用户数据中与所述住客标识号对应关联的属性内容作为目标数据;
其中,属性内容中包含有或者标注有住客标识号,若一属性内容中包含的或标注的住客标识号与所述当前住客对应的住客标识号一致,则认为该属性内容与所述当前住客对应的住客标识号对应关联,即当前住客对应的住客标识号与属性内容中包含有的或标注的住客标识号进行匹配,若两者一致匹配成功,则认为当前住客对应的住客标识号与属性内容相对应关联。
例如,对于以手机作为信息源来说,对采集的微信的朋友圈等用户数据进行解析,得到众多用户的评论信息及发布信息,然后根据作为住客标识号的一手机号在众多用户的评论信息及发布信息中查找到该通过该手机号提交的评论信息、发布信息以及发布信息的被评论信息等属性内容(评论信息中包含了该手机号,以表示该评论是由该手机号提交的),从而将这些属性内容作为该住客的目标数据,经关键词提取和处理后,能够分析得到该住客的兴趣爱好和关注焦点。
还可以对来自与上述手机号相关联的订餐网站中的用户数据进行解析,得到住客通过该手机号在历史上最近时期内预定的菜品名称等属性内容(菜品名称可以标注有该手机号,以表示该菜品是该手机号预定的),从而将这些属性内容作为该住客的目标数据,经分析后能够得到住客的口味偏好。
所述从所述用户数据中分别提取当前住客对应的目标数据时:
-从酒店PMS系统中获取用户属性数据,其中,所述用户属性数据包括住客标识号;
-根据住客标识号从酒店PMS系统之外的另一个或另多个信息源获取相应的用户数据,进而提取出所述目标数据。
在一个优选例中,所述住客标识号为指示用户个人的用户标识信息,从酒店PMS系统获取用户标识信息后,可以通过用户标识信息(例如护照号码)可以唯一确定用户表示信息对应的用户身份,从而在各个其它信息源中依据该用户身份找到相应的用户数据。例如根据用户的手机号识别PMS端、客户端、酒店预订渠道中的用户数据是否对应于同一用户,若对应于同一用户,则能够分别对同一用户下的来自各信息源的用户数据进行分析统计,从而不需要当前用户额外在其他信息源中输入自己的姓名、手机等个人私密信息即可直接从其他信息源中获取当前用户对应的目标数据。
例如,上述其它的信息源中包括OTA站点,所述OTA站点在用户操作时记录用户行为作为用户数据;其中,用户行为包括用户在OTA站点中的访问日志、操作日志,这些用户数据将有助于在本发明所提供方法的后续步骤中分析得到该用户兴趣偏好。
下面就所述对所述目标数据进行数据整合进行说明。
为了使得本发明能够对接收自客户端、PMS酒店管理系统、其它酒店预订渠道系统等信息源的用户数据进行集成化的数据处理,本发明一方面优选地实时从多个信息源接收用户数据,本发明另一方面,通过将各个信息源获得的用户进行统一数据格式化,能够实现具有管理不同类型信息源的用户行为数据采集的优势,进而及时全面地了解目标用户特征并以此实现智能内容推荐。
将获取到的目标数据按照各信息源对应发送的先后顺序或者其它顺序(例如随机顺序或者按照预设的信息源的优先级排序)组合为一个数据帧作为整合手段,也可以按照预先设定的数据帧格式分别将目标数据填写入统一数据格式的住客数据中相应的属性字段中。
所述对所述目标数据进行数据整合时,对用户数据的统一数据格式化由数据源完成,为此,信息源可以按照统一数据格式分别采集用户数据,信息源也可以将已采集到的用户数据分别转换为统一数据格式。
为了使统一数据格式的住客数据能够与各信息源进行匹配,在所述通过多个信息源分别对用户数据进行采集之前还包括如下步骤:
向信息源发送数据格式指令,其中,数据格式指令用于向信息源指示所述统一数据格式。这样,就可以针对不同的信息源的类型(例如手机或者电视,又例如不同的APP)分别发送对应的数据格式指令,使得不同的信息源的用户数据能够转换为统一数据格式的住客数据,以便都能够利用到这些用户数据并且统一处理。其中,同一类型的信息源之间的目标字段相同,例如同一款APP的不同版本之间可以认为属于同一类型的信息源。当然,如果之前已经对于某类型的信息源生成过对应的数据格式指令,则可以将该目标字段指令保存在字典表中,以便后续遇到同一类型的信息源时直接提取使用。
所述数据格式指令包括采集规则、关联规则、属性字段,其中:
所述采集规则用于向信息源指示需采集的用户数据的目标字段,其中,信息源通过所述目标字段对用户数据进行区分和标识;
所述关联规则用于向信息源指示目标字段与统一数据格式的住客数据中各属性字段之间的对应关系;
其中,属性字段用于向信息源指示不同目标字段的用户数据在所述统一数据格式中的记录位置。
例如,在一作为信息源的网络站点中,读取浏览器服务器的用户日志,将用户的点击行为区分为“超链点击”的目标字段和“选中点击”的目标字段,而在统一数据格式中仅存在一“鼠标点选”的属性字段,则通过预先对该浏览器服务器的用户日志进行分析,可以建立针对该浏览器的字典表,该字典表中记载了浏览器服务器日志中的目标字段,并含有目标字段与统一数据格式中的各项属性字段之间的关联规则(即对应关系),从而根据该字典表,能够得知“超链点击”的目标字段和“选中点击”的目标字段均关联于统一数据格式的住客数据中“鼠标点选”的属性字段,从而“超链点击”得到的网站名和“选中点击”得到的文本内容记载到“鼠标点选”对应的属性字段中,形成统一数据格式的住客数据。
下面就所述得到统一数据格式的住客数据进行说明。
所述得到统一数据格式的住客数据时:
创建记载有住客标识号的数据条目;
将提取自各用户数据的目标数据分别记载于数据条目对应的属性字段中;
将数据条目作为所述住客标识号对应的统一数据格式的住客数据。
所述将提取自各用户数据的目标数据分别记载于数据条目对应的属性字段中时:
确定所述目标数据所来自的信息源的类型;
根据所述信息源的类型,从所述目标数据中提取出存在的目标字段,并获取所述目标字段与信息源的类型对应的关联规则;其中,所述信息源通过所述目标字段对目标数据进行区分和标识,所述关联规则用于指示目标字段分别与统一数据格式中各属性字段之间的对应关系;
根据所述关联规则,将不同目标字段对应的目标数据分别记载到统一数据格式中对应的属性字段中,形成所述统一数据格式的住客数据。
所述统一数据格式的住客数据中,包括若干分区,其中的任一个或任多个分区记载如下任一种或任多种格式信息:
-信息源类型;例如可以用于指示信息源是智能手机、智能电视、在线旅游网站、APP等;
-信息源标识号;例如可以用于记载手机的识别号、酒店客房内智能电视的编号;
-信息源中数据采集设备类型;例如信息源为酒店PMS系统,则数据采集设备类型可以是显示屏、电梯键盘、空调等;
-数据采集设备标识号;例如可以用于记载空调的编号;
-用户识别号;例如可以是用户的姓名、微信号、游戏中心的注册名等等;
-用户操作信息;例如可以是用户的鼠标点击次数、在网页页面的停留时间长度、触控、声音控制、重力感应等等;
-应用界面类型;例如可以是地图页面、列表页面、详情页面等等;
-应用标识号;例如可以是APP在APP商城中的编号等等;
-应用版本号;
-应用界面标识号;例如可以是APP中界面的编号;
-应用界面父界面标识号;
-内容信息;例如是内容所记载的信息等等;
-内容类别;内容信息所属的类型,例如可以是图片、文本、视频、链接等;
-内容属性;内容信息所属的属性类别,例如可以是景点、美食、传统演出等等;
-行为标签。
相应地,可以对不同格式的用户数据按照统一的编码规则进行编码,得到统一数据格式的用户数据。例如,可以采用如下的编码规则:
编码按分区划分,整体编码组成为:A区|B区|C区|D区|E区|F区
所述A区的编码,主要包含区域、设备、用户编码,用于标记酒店和用户。具体组成为:区域编码|设备类型|设备编码|用户|操作时间;一个编码由多个字段组成时,由英文逗号分隔标识;
标注说明:
-区域编码:指酒店编码,能唯一识别酒店的编码,如钓鱼台;长度4Byte;
-设备类型:指采集数据的来源,用于区分TV端、手机端、PMS系统、其它酒店预订渠道;长度1Byte;
-设备编码:指电视机设备唯一编码;若编码值出现字符,需要将字符转成ASCII码的二进制数字方式标识;长度:30Byte;
-用户编码:指用户ID;支持多个用户ID组合,多个组合间由英文逗号分隔标识,如ID1,ID2;不超过10个用户;长度:40Byte;
-操作时间:指用户操作的具体时间,精确到毫秒级;长度:8Byte;
所述B区编码,主要包含客户端应用相关,用于标记客户端的操作界面。具体组成:应用编码|界面编码|父页面编码|界面类型|版本号编码;
标注说明:
-应用编码:指具体某个客户端应用;长度:2Byte;
-界面编码:指某客户端应用的某个界面;长度:1Byte;
-父界面编码:指当前界面的父界面编码;长度:1Byte;
-界面类型:指界面的类型,如地图、列表、详情页等;长度:1Byte;
-版本号编码:指当前应用的具体版本号编码;长度:1Byte;
所述C区编码,主要包含内容相关,用于标记客户端提供的服务内容。具体组成:内容编码|内容类别编码|内容属性编码;
标注说明:
-内容编码:具体内容ID,如某个美食内容、某个灵感视频、某个线路、某个直播频道;长度:4Byte;
-内容类别编码:内容所属类别ID组合,如ID1,ID2,ID3;类别指美食、KTV、SPA、商场等;长度:40Byte;
-内容属性编码:内容具体的属性组合,如DATA1,DATA2,DATA3;长度:120Byte;具体地,内容属性是指内容类别对应的详细信息,例如美食内容类别的内容属性可以为“家常菜”、“酒宴菜”等等,又例如SPA内容类别的内容属性可以为“泰式水疗抗压”、“中式草药排毒”、“法式泉水理疗”等等。
所述D区编码,主要指行为标签,用于标记当前住客的用户行为;
标签说明:
-行为标签:时间轴上的用户行为标签组合,如ACT1,ACT2,ACT3;标签如午餐、夜宵、SPA等;40Byte;行为标签表征了用户行为的特征;
所述E区编码,主要指遥控器按键,用于指示用户的操作。遥控器按键通过APP设置在手机端,根据用户对手机端的操作产生对应的触发信号,触发信号对应产生的编码写入E区编码;
标签说明:
-按键编码:遥控器按键;长度:1Byte;例如音响模式键等。
所述F区编码,用于预留扩展。
进一步地,在与信息源的信息传输过程中,由于可能会涉及到用户的私密信息,因此可以采用AES加密算法加密用户数据。与信息源之间采用HTTPPOST方法传输用户数据,一次上报所有数据;若上报成功则客户端删除已上报的用户行为数据,若上报失败则保留数据待下次再次上报。
进一步地,所述数据格式指令还用于指示信息源发送所述用户数据的时间或者网络条件。例如指示客房内的智能电视、空调等信息源定时提供用户数据,又例如,指示由用户的智能手机自行监测气无线网络条件,在连接WIFI状态下上报用户数据,优点是可节省用户自己的网络流量。遇到异常关机闪退等造成数据丢失,可忽略不计。
进一步地,所述数据格式指令还用于指示信息源根据统一数据格式中的采集规则在应用界面进行埋点。在客户端中具体的界面下、具体的操作功能下,根据用户行为数据采集规则埋入采集点,当用户具体操作该功能时,能够获得用户的行为数据。例如从客户端采集用户数据时,采集用户的触控信息,如用户点击或滑动按键的时间间隔、操作的时间间隔,页面的停留时间等,进一步判断用户对对应页面内容的喜好:
下面就如何根据住客数据向住客推荐服务信息进行说明。
优选地,所述用户数据处理方法,还包括如下步骤:
将住客数据进行属性抽取,生成客人初级标签;
将客人初级标签利用既定的客人模型进行聚类,得到聚类结果;
根据聚类结果得到客人次级标签作为客人优化标签;
根据客人优化标签向当前住客推荐对应的目标服务信息。
其中,所述客人模型可以是对转换为统一数据格式的大量用户数据(大数据)进行属性抽取(如对历史数据采用TF/IDF的统计方法)并进行训练,建立客人模型,通过客人模型分别对各住客数据进行打分聚类,即通过静态分类的方法,将数据分类到预先设置的不同类别特征中,从而判断住客数据的某类别倾向。对当前采集到的数据进行属性抽取,将抽取得到的属性信息在模型中进行匹配,获取聚类的处理结果,即住客喜好的各类标签,后续将根据这些标签向住客推荐对应的服务信息。如一个“三十九岁的美国人”从携程网预定了北京某酒店的入住,在酒店办理入住手续后,服务器实时提取其在网站中所注册的用户信息,其手机号、年龄等基本信息被服务器获取,该用户可以随时通过手机接收该酒店的服务信息,同时他入住房间的智能电视也接收服务器发送的相应的个性化信息并显示,不用用户另行进行填写信息、注册、认证等繁琐的操作,提高了信息的丰富程度和数据的统计分析效率。同时,提取的该用户的用户信息在对应在用户模型中进行匹配,在模型中“中年”、“欧美”、“高热量食物”、“环境好餐厅”、“OTA”、“三里屯”等标签相应分值偏高,而“相声”、“动物园”、“儿童乐园”、“亲子”则相应分值偏低。
具体地,本领域技术人员可以利用现有技术得到所述客人模型,例如从经营大数据业务的第三方网络公开得到,又例如可以如图4所示,在全网中分别通过客户端、PMS系统、预订系统等多个用户数据,将历史上已采集得到的用户数据进行属性、行为、特征等信息的抽取,经统计后进行训练,得到所述客人模型。优选地,所述客人模型中包括多个分类,其中,每个分类中包括多个既定标签,这些分类和既定标签可以通过经验认为预设得到,也可以通过样本训练得到。
进一步地,所述根据住客数据生成客人初级标签包括如下步骤:
分析客人属性信息和/或客人行为信息得到客人特征;
将客人属性信息、客人行为信息以及客人特征中的任一个或任多个信息作为客人初级标签。
对每一个客人初级标签进行聚类时,执行如下步骤:
将该客人初级标签匹配于客人模型中的一分类;
确定该客人初级标签与客人模型中该分类的关联度,作为该初级标签属于该分类的概率,记为概率A;
将该分类中的各个既定标签分别作为该客人初级标签所对应客人的一次级标签;其中,在该分类中,每一个既定标签匹配于该分类的概率记为概率B;
确定各个次级标签的权重值,其中,所述权重值等于概率A与概率B的乘积;
将权重值由大到小排序中靠前的若干权重值对应的次级标签作为聚类结果中的信息。
本发明对用户数据进行客人属性信息和客人行为信息的抽取,从而得到客人特征,将客人属性信息、客人行为信息、客人特征作为该客人的初级标签,例如一客人的初级标签为“男性”、“旅游自然景点网页的浏览次数较多”、“购买了冲锋衣”、“背包客”,其中,初级标签“男性”是来自酒店PMS系统的用户属性信息,初级标签“旅游自然景点网页的浏览次数较多”、“购买了冲锋衣”是来自客人手机浏览器的用户行为信息,“背包客”为根据用户属性信息和用户行为信息提取出的客人特征。
然后将客人的各个初级标签分别在既定的客人模型中的各个既定分类进行匹配,判断各个初级标签分别与各个分类的关联度,从而在客人模型中进行聚类打分,得到所述初级标签在客人模型中属于各分类的概率,并将最高概率的分类作为与对应初级标签匹配的分类。进一步地,再从分类中提取出既定的标签,得到该住客的客人优化标签。
例如,抽取的当前住客的属性信息和行为信息对应的初级标签为“40岁”、“一人”、“美国人”(PMS系统中提取),“OTA预订”、“牛尾汤”、“世纪谭府”(OTA系统提取),“外卖酒”、“外卖披萨”(手机客户端提取),在客人模型中进行匹配后得到初级标签与各自相匹配分类及匹配百分比的情况为“中年-95%”、“欧美-90%”、“高热量食物-80%”、“环境好餐厅-60%”、“网络达人-90%”、“动物园-5%”、“相声-10%”,将“中年”分类中对应的次级标签“中高价位”、“SPA”,“欧美”分类中既定的次级标签“爱酒”、“基督教”、“西餐”,“高热量食物”分类中既定的次级标签“披萨”、“炸鸡”、“可乐”,“环境好餐厅”分类中对应的既定次级标签“三里屯”、“金钱豹”,“网络达人”分类中的既定次级标签“wifi”、“在线支付”分别结合对应的匹配百分比进行匹配,例如,在本实施例中,将初级标签对于分类的匹配百分比分别与该分离中各个次级标签在该分类中各自对应的概率分值相乘,得到每个次级标签的分值,然后将“SPA”、“三里屯”、“基督教”、“西餐”等分值较高的次级标签作为客人优化标签。
在一个优选的具体实施方式中,由智能手机、票务预定网站等网络站点、酒店PMS系统等多个信息源对用户数据进行采集,此时数据采集所针对的用户并不一定针对与酒店所相关的住客,而是已成为过或者未来可能成为住客的大众用户以获得涉及面较广的数据供后续流程中筛选。即在一用户登记成为住客之前,该用户的用户数据处于非激活状态,仅当用户登记成为住客后,才激活获取该用户的用户数据并进行处理。也就是说,酒店PMS系统是用户成为住客的识别点,在用户成为住客之前,用户的行为数据等都属于所述用户数据,而不是所述住客数据或者目标数据;在多个信息源采集用户数据后,并且在用户在酒店登记后该住客对应的用户数据才成为该用户的住客数据。当然,此处的用户也可以是与酒店所相关的人员,例如酒店的注册会员。
在众多的用户中,以某用户为例说明如何进行用户数据采集(其余用户的用户数据采集过程可参考该用户的用户数据采集过程),智能手机通过计步APP采集到该用户(该用户在后续将称为酒店的住客)的性别男、年龄30的用户属性数据以及每天深度睡眠时间5小时的用户行为数据,票务预定网站通过该用户的浏览行为采集到该用户喜欢观看NBA球赛和游泳锦标赛的用户行为数据以及该用户以二维码的形式购买了舒适堡健身中心会员资格的用户属性数据。当该用户在酒店登记成为住客后,从酒店PMS系统中可以获取该住客的个人邮箱地址作为住客标识号。然后根据该个人邮箱地址从计步APP的后台服务器采集到该个人邮箱地址所对应的运动数据,还根据该个人邮箱地址从票务预定网站采集到该个人邮箱地址所注册用户的NBA和游泳比赛的历史订票信息,还可以从优惠券中扫描二维码得到舒适堡健身中心会员信息,其中,对用户数据进行分析的过程可以是住客标识号与用户数据之间匹配的过程,匹配成功后从相应的用户数据中提取目标数据。
进一步地,将该住客的目标数据整合为一个数据帧,其中,该数据帧通过不同字段记载了从多个信息源获得的该住客的年龄信息、性别信息、睡眠信息、球赛观摩信息、健身会员信息等目标信息;再进一步地,通过由大数据训练得到的客人模型,得到该住客属于睡眠时间少、喜欢运动、高消费的体育爱好者,因此通过酒店客房电视向其推荐酒店最近的提供游泳池的健身中心的地址信息作为目标服务信息,而不像其推荐博物馆等安静的旅游景点。其中,优惠券可以是酒店和舒适堡健身中心联合提供的积分共享的优惠券,其上的二维码记录了酒店信息和舒适堡健身中心会员信息,从而酒店PMS系统通过扫描二维码能够得到该住客的舒适堡健身中心会员信息。
在一个变化例中,该二维码也可以是通过住客的智能手机显示的;在另一个变化例中,也可以是由与酒店合作的舒适堡健身中心将二维码贴在公共场所,住客在成为住客之前通过智能手机扫描该二维码,该二维码中记载有舒适堡网站的域名,从而能够在智能手机中记录该住客浏览舒适堡健康网站时注册的会员信息,从而也可以从住客的智能手机中获取舒适堡健身中心会员信息作为目标服务信息。
进一步地,所述多个信息源,包括用户在酒店登记成为住客之前已知的信息源,还可以包括在获得住客标识号后根据住客标识号的指示找到的补充信息源,例如,在用户登记成为住客之前,仅将其微博、微信朋友圈作为多个已知信息源,在当前用户通过PMS系统办理过入住登记,成为住客后,酒店PMS系统还获取了当前住客的个人邮箱地址,从而根据个人邮箱地址作为住客标识号找到了当前住客用该个人邮箱地址注册的票务网站以及社交网络作为补充信息源,然后从所述已知信息源和所述补充信息源中获得全面的该住客对应的用户数据。
本发明通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;从酒店PMS系统中提取当前住客对应的住客标识号;根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;对所述目标数据进行数据整合,得到统一数据格式的住客数据。本发明用户数据的采集规则定义灵活,具有通用性强的特点,不局限于特定业务(客户端)的优点,提高了信息的丰富程度,可实时对不同渠道获取的数据进行统计分析;通过多渠道可获得丰富的用户数据,进而可更准确的了解用户特征并以此实现智能推荐,而且尽量避免用户在使用电视时主动进行输入,增强了操作效率和用户体验。
本发明在用户于酒店PMS系统中登记成为当前住客后,再从多个信息源的用户数据中提取当前住客对应的目标数据;实现了以酒店PMS系统的住客登记为触发点,完成收集用户数据-触发目标数据-整合住客数据的过程,避免了在用户成为住客前对用户数据进行的提前处理,以减轻数据处理负担,在用户成为住客的最后时刻获取到最新的用户数据,以更准确地反映用户的特征。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (13)
1.一种用户数据处理方法,其特征在于,包括如下步骤:
通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
从酒店PMS系统中提取当前住客对应的住客标识号;
根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
对所述目标数据进行数据整合,得到统一数据格式的住客数据。
2.根据权利要求1所述的用户数据处理方法,其特征在于,所述从酒店PMS系统中提取当前住客对应的住客标识号时:
通过酒店PMS系统获取当前住客对应的信息载体,所述信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-除酒店PMS系统之外其它信息源对应的标识号;
-由除酒店PMS系统之外其它信息源采集到的用户行为数据;
-由除酒店PMS系统之外其它信息源采集到的用户属性数据;
对所述信息载体进行解析,得到当前住客对应的住客标识号。
3.根据权利要求2所述的用户数据处理方法,其特征在于,所述从所述用户数据中分别提取当前住客对应的目标数据时:
-根据所述其它信息源对应的标识号的指示,从所述其它信息源获取住客所属群体的共性用户数据作为目标数据;和/或
-根据所述其它信息源对应的标识号的指示,访问所述其它信息源,并根据获取自所述信息载体的住客标识号从所述其它信息源获取与住客标识号相应的目标数据。
4.根据权利要求1所述的用户数据处理方法,其特征在于,所述根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析时:
对各信息源采集的所述用户数据分别进行解析,分别获取各用户数据各自对应的属性内容;
根据所述住客标识号分别在所述属性内容中进行实时提取,将所述用户数据中与所述住客标识号对应关联的属性内容作为目标数据。
5.根据权利要求1所述的用户数据处理方法,其特征在于,所述得到统一数据格式的住客数据时:
创建记载有所述住客标识号的数据条目;
将提取自各用户数据的目标数据分别记载于所述数据条目对应的属性字段中;
将所述数据条目作为所述住客标识号对应的统一数据格式的住客数据。
6.根据权利要求5所述的用户数据处理方法,其特征在于,所述将提取自各用户数据的目标数据分别记载于所述数据条目对应的属性字段中时:
确定所述目标数据所来自的信息源的类型;
根据所述信息源的类型,从所述目标数据中提取出存在的目标字段,并获取所述目标字段与信息源的类型对应的关联规则;其中,所述信息源通过所述目标字段对目标数据进行区分和标识,所述关联规则用于指示目标字段分别与统一数据格式中各属性字段之间的对应关系;
根据所述关联规则,将不同目标字段对应的目标数据分别记载到统一数据格式中对应的属性字段中,形成所述统一数据格式的住客数据。
7.根据权利要求1所述的用户数据处理方法,其特征在于,还包括:
将所述住客数据进行属性抽取,生成客人初级标签;
将所述客人初级标签利用既定的客人模型进行聚类,得到聚类结果;
根据所述聚类结果得到客人次级标签作为客人优化标签;
根据所述客人优化标签向当前住客推荐对应的目标服务信息。
8.一种用户数据处理系统,其特征在于,包括如下装置:
第一采集装置,用于通过多个信息源分别对用户数据进行采集,其中,所述用户数据包括用户属性数据和用户行为数据;
第一提取装置,用于从酒店PMS系统中提取当前住客对应的住客标识号;
第二提取装置,用于根据所述住客标识号实时对由多个信息源各自采集到的用户数据进行分析,从所述用户数据中分别提取当前住客对应的目标数据;
第一整合装置,用于对所述目标数据进行数据整合,得到统一数据格式的住客数据。
9.根据权利要求8所述的用户数据处理系统,其特征在于,所述第一提取装置,包括如下装置:
第一获取装置,用于通过酒店PMS系统获取当前住客对应的信息载体,所述信息载体中包含当前住客对应的住客标识号,还包含有如下任一种或任多种信息:
-除酒店PMS系统之外其它信息源对应的标识号;
-由除酒店PMS系统之外其它信息源采集到的用户行为数据;
-由除酒店PMS系统之外其它信息源采集到的用户属性数据;
第一解析装置,用于对所述信息载体进行解析,得到当前住客对应的住客标识号。
10.根据权利要求9所述的用户数据处理系统,其特征在于,所述第二提取装置,包括如下装置:
-第二获取装置,用于根据所述其它信息源对应的标识号的指示,从所述其它信息源获取住客所属群体的共性用户数据作为目标数据;和/或
-第三获取装置,用于根据所述其它信息源对应的标识号的指示,访问所述其它信息源,并根据获取自所述信息载体的住客标识号从所述其它信息源获取与住客标识号相应的目标数据。
11.根据权利要求8所述的用户数据处理系统,其特征在于,所述第二提取装置,包括如下装置:
第四获取装置,用于对各信息源采集的所述用户数据分别进行解析,分别获取各用户数据各自对应的属性内容;
第三提取装置,用于根据所述住客标识号分别在所述属性内容中进行实时提取,将所述用户数据中与所述住客标识号对应关联的属性内容作为目标数据。
12.根据权利要求8所述的用户数据处理系统,其特征在于,所述第一整合装置,包括如下装置:
第一创建装置,用于创建记载有所述住客标识号的数据条目;
第一记载装置,用于将提取自各用户数据的目标数据分别记载于所述数据条目对应的属性字段中;
第一处理装置,用于将所述数据条目作为所述住客标识号对应的统一数据格式的住客数据。
13.根据权利要求8所述的用户数据处理系统,其特征在于,还包括:
第一生成装置,用于将所述住客数据进行属性抽取,生成客人初级标签;
第一聚类装置,用于将所述客人初级标签利用既定的客人模型进行聚类,得到聚类结果;
第三处理装置,用于根据所述聚类结果得到客人次级标签作为客人优化标签;
第一推荐装置,用于根据所述客人优化标签向当前住客推荐对应的目标服务信息。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510402086.5A CN105046601A (zh) | 2015-07-09 | 2015-07-09 | 用户数据处理方法和系统 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201510402086.5A CN105046601A (zh) | 2015-07-09 | 2015-07-09 | 用户数据处理方法和系统 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN105046601A true CN105046601A (zh) | 2015-11-11 |
Family
ID=54453124
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201510402086.5A Pending CN105046601A (zh) | 2015-07-09 | 2015-07-09 | 用户数据处理方法和系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN105046601A (zh) |
Cited By (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106095924A (zh) * | 2016-06-12 | 2016-11-09 | 北京万物语联技术有限公司 | 个人数据集系统和个人数据集生成与应用方法 |
| CN106487886A (zh) * | 2016-09-30 | 2017-03-08 | 广州特道信息科技有限公司 | 大数据信息发布系统及方法 |
| CN106776693A (zh) * | 2016-11-10 | 2017-05-31 | 福建中金在线信息科技有限公司 | 一种网站数据采集方法及装置 |
| CN106920124A (zh) * | 2017-02-20 | 2017-07-04 | 湖南云连天地网络科技有限公司 | 一种数据采集和分析方法及装置 |
| CN107153659A (zh) * | 2016-03-04 | 2017-09-12 | 朱开 | 一种应用于社交网络的推荐方法与推荐系统 |
| CN107168787A (zh) * | 2017-07-03 | 2017-09-15 | 赵桂银 | 一种移动终端运行性能改善方法与装置 |
| CN107203563A (zh) * | 2016-03-18 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 结构化数据生成方法及装置 |
| CN107239978A (zh) * | 2017-06-23 | 2017-10-10 | 北京好豆网络科技有限公司 | 美食内容的分析方法和装置 |
| CN107436897A (zh) * | 2016-05-26 | 2017-12-05 | 冯小平 | 一种用户当前行为的确定方法及装置 |
| CN107493315A (zh) * | 2017-06-28 | 2017-12-19 | 武汉斗鱼网络科技有限公司 | 一种行为数据的收集方法、资源服务器及存储介质 |
| WO2018023619A1 (zh) * | 2016-08-04 | 2018-02-08 | 汤隆初 | 一种推送客户记录时的信息提示方法以及记录装置 |
| WO2018023620A1 (zh) * | 2016-08-04 | 2018-02-08 | 汤隆初 | 一种客户要求记录技术的使用数据采集方法和记录装置 |
| CN107742246A (zh) * | 2017-11-08 | 2018-02-27 | 携程计算机技术(上海)有限公司 | 海外酒店订单确认方法和系统 |
| WO2018202171A1 (zh) * | 2017-05-05 | 2018-11-08 | 平安科技(深圳)有限公司 | 埋点验证系统及方法 |
| WO2018201330A1 (zh) * | 2017-05-03 | 2018-11-08 | 深圳市智晟达科技有限公司 | 一种酒店数字电视节目个性化的方法和数字电视 |
| CN109325186A (zh) * | 2018-08-11 | 2019-02-12 | 桂林理工大学 | 一种用户偏好特征与地理特征融合的行为动机推断方法 |
| CN109359998A (zh) * | 2018-08-15 | 2019-02-19 | 中国平安人寿保险股份有限公司 | 客户数据处理方法、装置、计算机装置及存储介质 |
| CN109416684A (zh) * | 2016-06-29 | 2019-03-01 | 伊姆西Ip控股有限责任公司 | 分析平台的摄取管理器 |
| CN109634827A (zh) * | 2018-12-12 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
| WO2019157652A1 (zh) * | 2018-02-13 | 2019-08-22 | 徐璇炫 | 为举办会议的酒店确定其可为参会者提供的服务 |
| CN111064976A (zh) * | 2018-10-17 | 2020-04-24 | 武汉斗鱼网络科技有限公司 | 一种直播信息的发送方法及服务器 |
| CN111090879A (zh) * | 2019-12-05 | 2020-05-01 | 达闼科技成都有限公司 | 数据处理方法、装置、可读存储介质、电子设备和系统 |
| CN111144359A (zh) * | 2019-12-31 | 2020-05-12 | 安徽智恒信科技股份有限公司 | 一种展品评价装置和方法及展品推送方法 |
| CN111784402A (zh) * | 2020-06-30 | 2020-10-16 | 深圳前海微众银行股份有限公司 | 基于多通路的下单率预测方法、设备及可读存储介质 |
| CN112351441A (zh) * | 2019-08-06 | 2021-02-09 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
| CN112612818A (zh) * | 2020-12-21 | 2021-04-06 | 贝壳技术有限公司 | 一种数据处理方法及装置、计算设备和存储介质 |
| CN112785459A (zh) * | 2019-11-11 | 2021-05-11 | 上海复创互联网科技有限公司 | 一种酒店管理系统及方法 |
| CN112818398A (zh) * | 2021-02-06 | 2021-05-18 | 陈笑男 | 针对大数据隐私保护的数据处理方法及大数据处理设备 |
| CN113254835A (zh) * | 2021-06-15 | 2021-08-13 | 湖南中惠旅智能科技有限责任公司 | 智慧景区服务器架构及其数据处理方法 |
| CN113343111A (zh) * | 2021-06-30 | 2021-09-03 | 北京百易数字技术有限公司 | 会议活动数字化管理方法及系统 |
| CN114283910A (zh) * | 2022-03-04 | 2022-04-05 | 广州科犁医学研究有限公司 | 基于多渠道信息的临床数据采集分析系统 |
| CN116701534A (zh) * | 2023-06-08 | 2023-09-05 | 内蒙古领先青年科技有限公司 | 一种基于区块链的大数据信息共享系统及方法 |
| US12174924B2 (en) | 2019-01-29 | 2024-12-24 | Suanhua Intelligent Technology Co., Ltd. | Systems and methods for tracking events of a client device |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103024471A (zh) * | 2012-12-07 | 2013-04-03 | 康佳集团股份有限公司 | 一种用于智能云电视的快捷推荐方法 |
| CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
| JP2013196653A (ja) * | 2012-03-22 | 2013-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 興味分析方法、装置及びプログラム |
| CN103377397A (zh) * | 2012-04-26 | 2013-10-30 | 安美世纪(北京)科技有限公司 | 一种为酒店客人提供个性化服务的系统与方法 |
| CN103399891A (zh) * | 2013-07-22 | 2013-11-20 | 百度在线网络技术(北京)有限公司 | 网络内容自动推荐方法、装置和系统 |
-
2015
- 2015-07-09 CN CN201510402086.5A patent/CN105046601A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013196653A (ja) * | 2012-03-22 | 2013-09-30 | Nippon Telegr & Teleph Corp <Ntt> | 興味分析方法、装置及びプログラム |
| CN103377397A (zh) * | 2012-04-26 | 2013-10-30 | 安美世纪(北京)科技有限公司 | 一种为酒店客人提供个性化服务的系统与方法 |
| CN103024471A (zh) * | 2012-12-07 | 2013-04-03 | 康佳集团股份有限公司 | 一种用于智能云电视的快捷推荐方法 |
| CN103139616A (zh) * | 2013-02-27 | 2013-06-05 | 中山大学 | 基于多用户的数字电视节目的个性化云推荐方法及系统 |
| CN103399891A (zh) * | 2013-07-22 | 2013-11-20 | 百度在线网络技术(北京)有限公司 | 网络内容自动推荐方法、装置和系统 |
Cited By (41)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107153659A (zh) * | 2016-03-04 | 2017-09-12 | 朱开 | 一种应用于社交网络的推荐方法与推荐系统 |
| CN107203563A (zh) * | 2016-03-18 | 2017-09-26 | 阿里巴巴集团控股有限公司 | 结构化数据生成方法及装置 |
| CN107436897A (zh) * | 2016-05-26 | 2017-12-05 | 冯小平 | 一种用户当前行为的确定方法及装置 |
| CN106095924A (zh) * | 2016-06-12 | 2016-11-09 | 北京万物语联技术有限公司 | 个人数据集系统和个人数据集生成与应用方法 |
| CN109416684A (zh) * | 2016-06-29 | 2019-03-01 | 伊姆西Ip控股有限责任公司 | 分析平台的摄取管理器 |
| CN109416684B (zh) * | 2016-06-29 | 2023-10-17 | 伊姆西Ip控股有限责任公司 | 分析平台的摄取管理器 |
| WO2018023619A1 (zh) * | 2016-08-04 | 2018-02-08 | 汤隆初 | 一种推送客户记录时的信息提示方法以及记录装置 |
| WO2018023620A1 (zh) * | 2016-08-04 | 2018-02-08 | 汤隆初 | 一种客户要求记录技术的使用数据采集方法和记录装置 |
| CN106487886A (zh) * | 2016-09-30 | 2017-03-08 | 广州特道信息科技有限公司 | 大数据信息发布系统及方法 |
| CN106776693A (zh) * | 2016-11-10 | 2017-05-31 | 福建中金在线信息科技有限公司 | 一种网站数据采集方法及装置 |
| CN106920124A (zh) * | 2017-02-20 | 2017-07-04 | 湖南云连天地网络科技有限公司 | 一种数据采集和分析方法及装置 |
| WO2018201330A1 (zh) * | 2017-05-03 | 2018-11-08 | 深圳市智晟达科技有限公司 | 一种酒店数字电视节目个性化的方法和数字电视 |
| WO2018202171A1 (zh) * | 2017-05-05 | 2018-11-08 | 平安科技(深圳)有限公司 | 埋点验证系统及方法 |
| CN107239978A (zh) * | 2017-06-23 | 2017-10-10 | 北京好豆网络科技有限公司 | 美食内容的分析方法和装置 |
| CN107493315A (zh) * | 2017-06-28 | 2017-12-19 | 武汉斗鱼网络科技有限公司 | 一种行为数据的收集方法、资源服务器及存储介质 |
| CN107168787A (zh) * | 2017-07-03 | 2017-09-15 | 赵桂银 | 一种移动终端运行性能改善方法与装置 |
| CN107742246A (zh) * | 2017-11-08 | 2018-02-27 | 携程计算机技术(上海)有限公司 | 海外酒店订单确认方法和系统 |
| WO2019157652A1 (zh) * | 2018-02-13 | 2019-08-22 | 徐璇炫 | 为举办会议的酒店确定其可为参会者提供的服务 |
| CN109325186A (zh) * | 2018-08-11 | 2019-02-12 | 桂林理工大学 | 一种用户偏好特征与地理特征融合的行为动机推断方法 |
| CN109325186B (zh) * | 2018-08-11 | 2021-08-17 | 桂林理工大学 | 一种用户偏好与地理特征融合的行为动机推断算法 |
| CN109359998A (zh) * | 2018-08-15 | 2019-02-19 | 中国平安人寿保险股份有限公司 | 客户数据处理方法、装置、计算机装置及存储介质 |
| CN111064976A (zh) * | 2018-10-17 | 2020-04-24 | 武汉斗鱼网络科技有限公司 | 一种直播信息的发送方法及服务器 |
| CN111064976B (zh) * | 2018-10-17 | 2022-01-04 | 武汉斗鱼网络科技有限公司 | 一种直播信息的发送方法及服务器 |
| CN109634827A (zh) * | 2018-12-12 | 2019-04-16 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
| US12174924B2 (en) | 2019-01-29 | 2024-12-24 | Suanhua Intelligent Technology Co., Ltd. | Systems and methods for tracking events of a client device |
| CN112351441A (zh) * | 2019-08-06 | 2021-02-09 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
| CN112351441B (zh) * | 2019-08-06 | 2023-08-15 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
| CN112785459A (zh) * | 2019-11-11 | 2021-05-11 | 上海复创互联网科技有限公司 | 一种酒店管理系统及方法 |
| CN111090879B (zh) * | 2019-12-05 | 2023-07-21 | 达闼机器人股份有限公司 | 数据处理方法、装置、可读存储介质、电子设备和系统 |
| CN111090879A (zh) * | 2019-12-05 | 2020-05-01 | 达闼科技成都有限公司 | 数据处理方法、装置、可读存储介质、电子设备和系统 |
| CN111144359B (zh) * | 2019-12-31 | 2023-06-30 | 安徽智恒信科技股份有限公司 | 一种展品评价装置和方法及展品推送方法 |
| CN111144359A (zh) * | 2019-12-31 | 2020-05-12 | 安徽智恒信科技股份有限公司 | 一种展品评价装置和方法及展品推送方法 |
| CN111784402A (zh) * | 2020-06-30 | 2020-10-16 | 深圳前海微众银行股份有限公司 | 基于多通路的下单率预测方法、设备及可读存储介质 |
| CN111784402B (zh) * | 2020-06-30 | 2025-04-25 | 深圳前海微众银行股份有限公司 | 基于多通路的下单率预测方法、设备及可读存储介质 |
| CN112612818B (zh) * | 2020-12-21 | 2022-04-15 | 贝壳找房(北京)科技有限公司 | 一种数据处理方法及装置、计算设备和存储介质 |
| CN112612818A (zh) * | 2020-12-21 | 2021-04-06 | 贝壳技术有限公司 | 一种数据处理方法及装置、计算设备和存储介质 |
| CN112818398A (zh) * | 2021-02-06 | 2021-05-18 | 陈笑男 | 针对大数据隐私保护的数据处理方法及大数据处理设备 |
| CN113254835A (zh) * | 2021-06-15 | 2021-08-13 | 湖南中惠旅智能科技有限责任公司 | 智慧景区服务器架构及其数据处理方法 |
| CN113343111A (zh) * | 2021-06-30 | 2021-09-03 | 北京百易数字技术有限公司 | 会议活动数字化管理方法及系统 |
| CN114283910A (zh) * | 2022-03-04 | 2022-04-05 | 广州科犁医学研究有限公司 | 基于多渠道信息的临床数据采集分析系统 |
| CN116701534A (zh) * | 2023-06-08 | 2023-09-05 | 内蒙古领先青年科技有限公司 | 一种基于区块链的大数据信息共享系统及方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105046601A (zh) | 用户数据处理方法和系统 | |
| CN105046600A (zh) | 一种酒店用电视的个性化信息推荐方法及系统 | |
| US20200273063A1 (en) | Dynamic campaign analytics via hashtag detection | |
| US10992609B2 (en) | Text-messaging based concierge services | |
| CN103649981B (zh) | 用于输送目标内容的方法和装置 | |
| CN105227971A (zh) | 一种酒店用电视的信息推荐方法及系统 | |
| US10909564B2 (en) | Fast and versatile graphical scoring device and method | |
| US9262481B1 (en) | Determining popular venues | |
| US20160299973A1 (en) | Interactive Internet Interfaces | |
| KR101950870B1 (ko) | 맛성향평가를 이용한 개인 음식 성향의 분석 장치 및 방법 | |
| CN102129452A (zh) | 未来信息获取系统及获取方法 | |
| CN103635905A (zh) | 信息提供装置、信息提供方法、信息提供程序和存储该程序的计算机可读取的记录介质 | |
| Potwarka et al. | Autonomous agents and destination image formation of an Olympic Host city: The case of Sochi 2014 | |
| KR102028752B1 (ko) | 사주 및 궁합을 이용한 커플 매칭 서비스 제공 방법 | |
| KR101559719B1 (ko) | 효과적인 마케팅을 도출하는 자동학습 시스템 및 방법 | |
| KR101922182B1 (ko) | 소셜 네트워킹 시스템에서 컨셉에 대한 범용 소셜 컨텍스트의 제공 | |
| CN103873945A (zh) | 与视频节目中对象进行社交的系统、方法 | |
| KR101269205B1 (ko) | 하나의 웹사이트 상에서의 다국어 정보 제공시스템 | |
| JP5809511B2 (ja) | 人脈に基づく文書を提供するシステムおよび方法 | |
| US20130046620A1 (en) | Fast and Versatile Graphical Scoring Device and Method, and of Providing Advertising Based Thereon | |
| KR20180065395A (ko) | Sns를 이용한 맞춤형 광고 제공 시스템 및 광고 제공 방법 | |
| KR20140100595A (ko) | 소셜 네트워크 서비스를 이용한 미디어 콘텐츠 추천 방법 | |
| US11151586B2 (en) | Methods and apparatus to identify non-traditional asset-bundles for purchasing groups using social media | |
| KR20140083637A (ko) | 사용자의 감성에 기반한 맞춤형 콘텐츠를 제공하는 서버 및 방법 | |
| KR101976056B1 (ko) | 추천 시스템 및 추천 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| RJ01 | Rejection of invention patent application after publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151111 |