[go: up one dir, main page]

CN114820005A - 用户留存预测处理方法、装置、计算机设备和存储介质 - Google Patents

用户留存预测处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114820005A
CN114820005A CN202110075537.4A CN202110075537A CN114820005A CN 114820005 A CN114820005 A CN 114820005A CN 202110075537 A CN202110075537 A CN 202110075537A CN 114820005 A CN114820005 A CN 114820005A
Authority
CN
China
Prior art keywords
time node
data
user
user retention
accumulated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110075537.4A
Other languages
English (en)
Other versions
CN114820005B (zh
Inventor
李沁妤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110075537.4A priority Critical patent/CN114820005B/zh
Publication of CN114820005A publication Critical patent/CN114820005A/zh
Application granted granted Critical
Publication of CN114820005B publication Critical patent/CN114820005B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及互联网技术领域,提供了一种用户留存预测处理方法、装置、计算机设备和存储介质。该方法包括:根据各历史时间节点在各自后续时间节点具有的用户留存数据,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据,并基于这些累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势,再由变化趋势以及相应历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取得到历史时间节点在预测时间节点对应的预测用户留存数据,能够充分挖掘和利用历史的用户留存数据表征的留存数据变化规律准确地对未来的用户留存数据进行预测,提高对用户留存数据的预测准确性和稳定性。

Description

用户留存预测处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及互联网技术领域,特别是涉及一种用户留存预测处理方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的发展,出现了对用户访问行为、用户留存预测等分析处理技术。在互联网技术中,用户在某段时间内开始使用某项应用或某项应用服务,经过一段时间后仍继续使用的用户,可被认作留存用户,该部分用户占当时新增用户的比例为留存率,一般来说可按照每隔例如日、周和月等时间单位对留存率进行统计。
目前的技术中所提供的对用户留存数据的预测通常是用前一年的用户留存数据直接拟合今年的用户留存数据,但这种方式存在对用户留存数据的预测准确性较低的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种用户留存预测处理方法、装置、计算机设备和存储介质。
一种用户留存预测处理方法,所述方法包括:
获取各历史时间节点在各自后续时间节点具有的用户留存数据;
根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;
基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
一种用户留存预测处理装置,所述装置包括:
留存数据获取模块,用于获取各历史时间节点在各自后续时间节点具有的用户留存数据;
累积数据获取模块,用于根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;
变化趋势获取模块,用于基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
留存数据预测模块,用于根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取各历史时间节点在各自后续时间节点具有的用户留存数据;根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取各历史时间节点在各自后续时间节点具有的用户留存数据;根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方法的步骤。
上述用户留存预测处理方法、装置、计算机设备和存储介质,可根据各历史时间节点在各自后续时间节点具有的用户留存数据,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据,并基于这些累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势,再由变化趋势以及相应历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取得到历史时间节点在预测时间节点对应的预测用户留存数据。该方案通过将各历史时间节点的用户留存数据分别进行累计得到在各后续时间节点对应的累积数据,通过这些累积数据进一步获知其在相邻时间节点间呈现的变化趋势或变化规律,进而利用该变化趋势或变化规律对预测时间节点的累积数据进行预测后即可反推出对应的用户留存数据,能够充分挖掘和利用多年用户留存数据表征的留存数据变化规律准确地对未来的用户留存数据进行预测,提高对用户留存数据的预测准确性和预测稳定性。
附图说明
图1为一个实施例中用户留存预测处理方法的应用环境图;
图2为一个实施例中用户留存预测处理方法的流程示意图;
图3为一个实施例中获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势步骤的流程示意图;
图4(a)至图4(d)为一些实施例中对用户留存数据处理的示意图;
图5为一个实施例中获取活跃用户数步骤的流程示意图;
图6为另一个实施例中用户留存预测处理方法的流程示意图;
图7为一个实施例中用户留存预测处理装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的用户留存预测处理方法,可以应用于如图1所示的应用环境中,该方法可以由服务器120执行,该服务器120可以独立的服务器或者是多个服务器组成的服务器集群来实现。其中,该服务器120可以为应用程序提供后台服务,不同用户可在各自的终端下载并使用应用程序。本申请中,服务器120可根据各历史时间节点11在各自后续时间节点具有的用户留存数据对各历史时间节点在未来一个或者多个预测时间节点13对应的用户留存数据进行预测,该用户留存数据可以是用户留存率或具体的用户留存数,在数据处理方式一致的情况下,为了对本申请方案作描述的清晰,本申请后续部分中将以用户留存率作为用户留存数据对方案进行描述。
另外,服务器120对预测时间节点13对应的用户留存数据进行预测后,可进一步基于预测所得的用户留存数据对未来例如某年度的日活跃用户数(DAU,Daily Active User)及总时长进行预测,该预测所得的某年度的日活跃用户数及总时长可供相关业务在年度资源规划时提供可靠的数据支持。
下面结合实施例和相应附图对本申请提供的用户留存预测处理方法进行详细说明。
在一个实施例中,如图2所示,提供了一种用户留存预测处理方法,以该方法应用于图1中的服务器120为例进行说明,该方法可以包括如下步骤:
步骤S201,获取各历史时间节点在各自后续时间节点具有的用户留存数据;
具体的,时间节点可按照预测所需的时间粒度进行划分或设定,时间粒度可以是小时、天、周、月和年等,例如从应用程序发布开始,每一天都可以作为一个时间节点。
其中,当前时间节点及其以前的时间节点可作为历史时间节点,举例来说,以月为时间粒度,若当前时间节点为2020年12月,则2020年12月、2020年11月、……、2020年1月、……,等都可作为历史时间节点,每个历史时间节点各自均具有新用户,而随着时间的推移,各历史时间节点各自具有的新用户可能会部分或全部留存在后续的时间节点当中,服务器120可根据各历史时间节点各自具有的新用户在后续的时间节点留存数量,获得每一历史时间节点在各自后续时间节点具有的用户留存率,即服务器120可得到每个历史时间节点新增的用户各自有多少比例仍留存在后续时间节点中。对于后续时间节点,举例来说,仍以月为时间粒度,针对2020年1月这一历史时间节点,其后续时间节点可以包括0、1、2、3、……,该历史时间节点在其后续时间节点具有的用户留存数据具体含义为2020年1月产生的新用户,在2020年1月的后续0、1、2、3、……个月的留存率。
在实际应用中,日活跃用户数或者月活跃用户数可由各历史时间节点(例如历史各月、历史各天)所留存下来的用户组成,若历史时间节点从例如应用发布当天起算,则该应用的日活跃用户数主要历史上每一天所留存下来的新用户组成,本申请可基于各历史时间节点在各自后续时间节点具有的用户留存率,对各历史时间节点在未来的某个或某段预测时间节点的用户留存率进行预测,基于此预测结果可进一步推算出该预测时间节点的活跃用户数。
步骤S202,根据各历史时间节点在各自后续时间节点具有的用户留存数据,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据;
本步骤主要是服务器120计算各历史时间节点在各自后续时间节点对应的累积用户留存数据,也即单独针对每一历史时间节点,计算其在各自在后续时间节点对应的累积用户留存数据,其中,各后续时间节点对应的累积用户留存数是该后续时间节点之前的所有后续时间节点对应的用户留存数据之和。
在一个实施例中,步骤S202可以包括:
服务器120针对每一历史时间节点,将在各自后续时间节点具有的用户留存数据依时序正向进行累计,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据。
示例性的,针对2019年9月这一历史时间节点,设其后续时间节点包括0、1和2,设这些后续时间节点对应的用户留存数据分别为100%、57.26%和51.73%,依时序正向是指从后续时间节点0至后续时间节点2的方向,那么得到该历史时间节点在后续时间节点0的累积用户留存数据为100%、在后续时间节点1的累积用户留存数据为157.26%、在后续时间节点1的累积用户留存数据为208.99%。本实施例,服务器120可针对每一历史时间节点进行同样处理,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据。
步骤S203,基于各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
本步骤主要是服务器120基于每一历史时间节点在各自后续时间节点对应的累积用户留存数据,获取通过这些累积用户留存数据反馈的在每一相邻的后续时间节点间呈现的关于累积用户留存数据的变化趋势,该变化趋势可反映出各历史时段在整体上的累积用户留存数据逐年、逐月或者逐日的变化情况。
步骤S204,根据变化趋势以及历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取历史时间节点在预测时间节点对应的预测用户留存数据。
本步骤中,服务器120根据相邻时间节点间呈现的关于累积用户留存数据的变化趋势,并结合各历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据可推算出各历史时间节点在预测时间节点对应的预测累积用户留存数据,该预测累积用户留存数据与相应历史时间节点在前一时间节点具有的累积用户留存数据相减即可得到在预测时间节点对应的预测用户留存数据。
示例性的,服务器120可根据后续0个月和后续1个月间呈现的关于累积用户留存数据的变化趋势,结合历史时间节点2020年12月在预测时间节点2021年1月的前一时间节点即2020年12月具有的累积用户留存数据,可推算出历史时间节点2020年12月在预测时间节点2021年1月对应的预测累积用户留存率例如为158.9%,服务器120将预测累积用户留存率158.9%减去历史时间节点2020年12月对应的累积用户留存数据100%,可得到2020年12月在预测时间节点2021年1月对应的预测用户留存率为58.9%。通过此种方式,服务器120可预测出每个历史时间节点在预测时间节点对应的预测用户留存率,服务器120还可以依据已预测的用户留存率滚动估计出该预测时间节点以后的时间节点对应的用户留存率,即服务器120可以在对2021年1月进行预测的基础上,对例如2021年1月至12月的用户留存率进行预测,在具体应用中,服务器120可针对历史上每一天进行后续365天的用户留存率预估,数据量越大,预估稳定性和准确性都越高,进而据此所预估的日活跃用户数也越准确稳定。
上述用户留存预测处理方法,服务器120可根据各历史时间节点在各自后续时间节点具有的用户留存数据,得到各历史时间节点在各自后续时间节点对应的累积用户留存数据,并基于这些累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势,再由变化趋势以及相应历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,服务器120可获取得到历史时间节点在预测时间节点对应的预测用户留存数据。该方案,服务器120通过将各历史时间节点的用户留存数据分别进行累计得到在各后续时间节点对应的累积数据,服务器120通过这些累积数据进一步获知其在相邻时间节点间呈现的变化趋势或变化规律,进而利用该变化趋势或变化规律对预测时间节点的累积数据进行预测后即可反推出对应的用户留存数据,能够充分挖掘和利用多年用户留存数据表征的留存数据变化规律准确地对未来的用户留存数据进行预测,提高对用户留存数据的预测准确性和预测稳定性。
在一个实施例中,服务器120可采用如下方式获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势,如图3所示并结合图4(a)至图4(c)进行说明,上述步骤S203可以包括:
步骤S301,针对每一后续时间节点,确定与各后续时间节点相适应的关于累积用户留存数据的数据统计范围。
其中,设历史时间节点包括T1至T4,各后续时间节点包括t0至t3,示例性的,该历史时间节点T1至T4具体可以对应2020年1月至2020年4月,后续时间节点t0至t3具体可以对应后续第0、1、2和3个月。在图4(a)中所示出的X10至X40表示各历史时间节点在各自后续时间节点具有的用户留存率,例如用户留存率X10表示历史时间节点T1在后续时间节点t0具有的用户留存率,服务器120通过针对各历史时间节点T1至T4分别进行累计的方式,可计算出各历史时间节点T1至T4在各自后续时间节点对应的累积用户留存率,如图4(b)中示出的L10至L40即为各历史时间节点T1至T4各自在后续时间节点t0至t3对应的累积用户留存率。
本步骤中,服务器120需要针对各后续时间节点t1至t3,确定与各后续时间节点t1至t3相适应的关于累积用户留存数据的数据统计范围。具体的,服务器120针对后续时间节点t1至t3所确定的数据统计范围包括对每一个后续时间节点t1至t3的第一数据统计范围以及针对每一个后续时间节点t1至t3的前一后续时间节点的第二数据统计范围,并且该第一数据统计范围与第二数据统计范围的大小相同。如图4(b)所示,针对后续时间节点t1,第一数据统计范围具体是指由L11、L21和L31所占据的列范围,第二数据统计范围具体是指由L10、L20和L30所占据的列范围;针对后续时间节点t2,第一数据统计范围具体是指由L12和L22所占据的列范围,第二数据统计范围具体是指由L11和L21所占据的列范围;针对后续时间节点t3,第一数据统计范围具体是指由L13所占据的列范围,第二数据统计范围具体是指由L12所占据的列范围。
步骤S302,基于各历史时间节点分别在第一数据统计范围和第二数据统计范围对应的累积用户留存数据,得到第一累积用户留存数据统计信息和第二累积用户留存数据统计信息;
具体的,如图4(b)所示,针对后续时间节点t1,服务器120可对各历史时间节点在由L11、L21和L31所占据的列范围,以及在由L10、L20和L30所占据的列范围对应的累积用户留存数据进行统计,得到针对该后续时间节点t1的第一累积用户留存数据统计信息和第二累积用户留存数据统计信息,同理服务120可以得到针对后续时间节点t2和t3的第一累积用户留存数据统计信息和第二累积用户留存数据统计信息。
在一些实施例中,针对后续时间节点t1,服务器120可将L11、L21和L31进行求和,得到第一累积用户留存数据,将L10、L20和L30进行求和,得到第二累积用户留存数据,同理可计算出针对后续时间节点t2和t3的第一、第二累积用户留存数据。也即,针对各后续时间节点,第一累积用户留存数据统计信息可以包括各历史时间节点在相应的第一数据统计范围对应的累积用户留存数据之和,以及,第二累积用户留存数据统计信息可以包括各历史时间节点在相应的第二数据统计范围对应的累积用户留存数据之和。
步骤S303,根据第一累积用户留存数据统计信息和第二累积用户留存数据统计信息,获取变化趋势。
本步骤中,针对各后续时间节点,服务器120可对所获得的第一、第二累积用户留存数据统计信息进行比较,获知针对各后续时间节点的关于累积用户留存数据呈现的变化趋势。
进一步的,上述步骤S303具体可以包括:服务器120根据各历史时间节点在第一数据统计范围对应的累积用户留存数据之和与各历史时间节点在第二数据统计范围对应的累积用户留存数据之和之间的比值,得到变化趋势。
也即,针对各后续时间节点,服务器120所获取的第一累积用户留存数据统计信息包括各历史时间节点在相应的第一数据统计范围对应的累积用户留存数据之和(简称为第一累积和),所获取的第二累积用户留存数据统计信息包括各历史时间节点在相应的第二数据统计范围对应的累积用户留存数据之和(简称为第二累积和),由此服务器120可计算第一累积和与第二累积和的比值(简称为累积和比值),如图4(b),服务器120可得到各后续时间节点t1至t3的累积和比值分别为F01、F12和F23,该累积和比值可反映出后续时间节点t0与t1间关于累积用户留存数据呈现的变化趋势、后续时间节点t1与t2间关于累积用户留存数据呈现的变化趋势和后续时间节点t2与t3间关于累积用户留存数据呈现的变化趋势等变化趋势信息,基于此服务器120可以准确且可靠地推算出各历史时间节点在预测时间节点对应的累积用户留存数据。
进一步的,在一些实施例中,服务器120可通过如下方式推算各历史时间节点在预测时间节点对应的预测用户留存数据,上述步骤S204具体包括:
服务器120根据表征变化趋势的上述比值与历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据的乘积,得到历史时间节点在预测时间节点对应的预测累积用户留存数据;服务器120将预测累积用户留存数据与历史时间节点在前一时间节点具有的累积用户留存数据相减,得到预测用户留存数据。
参考图4(b),不失一般性地,以服务器120对历史时间节点T4在后续时间节点t1对应的累积用户留存率进行预测,对于历史时间节点T4而言,该后续时间节点t1是预测时间节点,又如服务器120可对历史时间节点T3在后续时间节点t2对应的累积用户留存率进行预测,对于历史时间节点T3而言,后续时间节点t2为预测时间节点。具体的,参考图4(b)和图4(c),服务器120获取到由累积和比值F01表征的后续时间节点t0与t1间关于累积用户留存数据呈现的变化趋势后,服务器120可将该累积和比值F01与历史时间节点T4在预测时间节点的前一时间节点即后续时间节点t0具有的累积用户留存数据即L40相乘,得到的乘积即为历史时间节点T4在预测时间节点t1对应的预测累积用户留存数据L41。
以此类推,服务器120可计算填充图4(b)中所有空白格子中的元素,即可得到每个历史时间节点在预测时间节点对应的预测累积用户留存数据(L23至L43)。在此基础上,服务器120可按照反向相减的方式,将如图4(c)所示的预测累积用户留存数据以及原本已知的累积用户留存数据还原至如图4(d)所示的相应的预测用户留存数据(即X23至X43)和原本已知的用户留存数据(即X10至X40)。示例性的,对于预测用户留存数据X41的推算,服务器120可将预测累积用户留存数据L41与历史时间节点T4在前一时间节点t0具有的累积用户留存数据L40相减,得到预测用户留存数据X41。采用本实施例提供的方案,服务器120可准确可靠地推算出各历史时间节点在一个或者多个预测时间节点对应的预测用户留存数据。
服务器120获得各历史时间节点在预测时间节点对应的预测用户留存率后,可利用预测用户留存率计算预测时间节点对应的活跃用户数。在具体的业务场景中,未来例如每天的日活跃用户数主要是由历史上所有留存下来的新用户和老用户组成,对于第一类用户即新用户,服务器120可采用如上实施例所述的方式对历史上所有留存下来的新用户在未来的每天、每周、每月或者每年的留存率进行预估,即服务器120可通过上述方式预估针对第一类用户的预测用户留存率,进一步的,服务器120还可获取第二类用户即老用户在该预测时间节点对应的活跃用户数,基于此服务器120即可对某个或者某段预测时间节点对应的活跃用户数进行评估。具体的,在一些实施例中,如图5所示,上述方法还可以包括如下步骤:
步骤S501,服务器120确定各历史时间节点对应的第一类用户数;
本步骤中,服务器120可获取每个历史时间节点对应的新用户数,例如获取历史上每个月所加入的新用户的数量。
步骤S502,根据各历史时间节点具有的第一类用户数以及对应的预测用户留存率,得到第一类用户在预测时间节点对应的第一活跃用户数;
以历史上每天作为历史时间节点为例,本步骤中,服务器120可将在历史上每天对应的新用户数量与其在预测时间节点对应的预测用户留存率对应相乘,即可得到新用户在预测时间节点对应的活跃用户数,作为第一活跃用户数。在具体应用中,服务器120可根据各历史时间节点具有的新用户数以及对应的预测用户留存率推算例如2021年所有新用户留存到12月31日的数量。
步骤S503,服务器120获取第二类用户在所述预测时间节点对应的第二活跃用户数;
除新用户对应的活跃用户数外,为了对预测时间节点的活跃用户数进行更合理精确的预测,服务器120还获取第二类用户及老用户在该预测时间节点对应的第二活跃用户数。其中,以资讯类应用为例,老用户具体可以是在前述各历史时间节点之前,已注册或者使用该资讯类应用的用户。
在一些实施例中,步骤S503可以包括:服务器120确定第二类用户在该预测时间节点前的一所选时间节点对应的第二类用户基础数;服务器120获取针对该第二类用户的用户数衰减历史趋势,并基于该用户数衰减历史趋势以及第二类用户基础数得到第二活跃用户数。
本实施例主要是服务器120可根据第二类用户的用户数衰减历史趋势,从所选时间节点开始推算第二类用户在预测时间节点对应的用户数,作为第二活跃用户数。其中,用户数衰减历史趋势是指关于该第二类用户即老用户的数量在前述所选时间节点前具有的衰减趋势。示例性的,服务器120可预测2020年的老用户留存到2021年12月31日的数量,此时,2021年每一天都可看作预测时间节点,服务器120可选取2020年12月31日(即一所选时间节点)具有的日活跃用户数作为前述第二类用户基础数,在获得用户数衰减历史趋势的情况下,服务器120可根据该用户数衰减历史趋势按天对第二类用户基础数进行衰减,即可推算出老用户留存到2021年每一天的数量由此也可以得到留存到2021年12月31日的数量。其中,对于用户数衰减历史趋势的运算,服务器120可以2020年12月31日具有的日活跃用户数为基础,先查询出其中所包含的一年以前的老用户占比如52%,还可以获取2020年12月31日具有的日活跃用户数中除去该日新用户的数量占比如98%,从而服务器120可计算出老用户从一年以前留存到2020年12月31日的数量占比为46%,该比例均摊到2020年的每一天,即可得到老用户在2020年的流失速度即用户数衰减历史趋势约为99.87%,得到该用户数衰减历史趋势后服务器120即可根据2020年12月31日具有的日活跃用户数推算老用户在2021年每一天的用户量作为前述第二活跃用户数。通过这种方式,服务器120可以借助例如前一年所具有的对老用户的衰减规律应用到例如未来一年中,准确预测每一天对应针对老用户的活跃用户数。
步骤S504,根据第一活跃用户数和第二活跃用户数,得到预测时间节点对应的活跃用户数。
本步骤中,服务器120可将第一活跃用户数和第二活跃用户数相加得到预测时间节点对应的活跃用户数,例如服务器120可对2021年每一天的第一、第二活跃用户数求和得到每一天的活跃用户数。
本申请实施例提供的方案,可供服务器120基于对新老用户在未来年度各天的留存数量预测,获知未来年度各天的日活跃用户数DAU。
在一个实施例中,提供一种用户留存预测处理方法,该方法由服务器120执行,如图6所示,该方法可以包括如下步骤:
步骤S601,服务器120获取各历史时间节点在各自后续时间节点具有的用户留存率;
步骤S602,服务器120根据各历史时间节点在各自后续时间节点具有的用户留存率,得到各历史时间节点在各自后续时间节点对应的累积用户留存率;
步骤S603,服务器120针对每一历史时间节点,将在各自后续时间节点具有的用户留存率依时序正向进行累计,得到各历史时间节点在各自后续时间节点对应的累积用户留存率;
步骤S604,服务器120针对每一后续时间节点,确定与各后续时间节点相适应的关于累积用户留存率的数据统计范围;
其中,数据统计范围包括针对每一后续时间节点的第一数据统计范围以及针对每一后续时间节点的前一后续时间节点的第二数据统计范围,且该第一数据统计范围与第二数据统计范围的大小相同。
步骤S605,服务器120根据各历史时间节点在第一数据统计范围对应的累积用户留存率之和与各历史时间节点在第二数据统计范围对应的累积用户留存率之和之间的比值,得到相邻时间节点间呈现的关于累积用户留存率的变化趋势;
步骤S606,服务器120根据上述比值与各历史时间节点在预测时间节点的前一时间节点具有的累积用户留存率的乘积,得到各历史时间节点在预测时间节点对应的预测累积用户留存率;
步骤S607,服务器120将各预测累积用户留存率与相应历史时间节点在前一时间节点具有的累积用户留存率相减,得到各历史时间节点在预测时间节点对应的预测用户留存率;
步骤S608,服务器120根据各历史时间节点具有的新用户数以及对应的预测用户留存率,得到新用户在预测时间节点对应的第一活跃用户数,以及服务器120根据老用户的用户数衰减历史趋势和老用户基础数,得到老用户在预测时间节点对应的第二活跃用户数;
步骤S609,服务器120将第一活跃用户数和第二活跃用户数求和,得到上述预测时间节点对应的活跃用户数。
本申请实施例,服务器120可进行多年维度的新用户留存率滚动估计且预估过程中会持续结合历史留存率数据,针对每一天可进行后续例如365天的留存率预估,所具有的预估稳定性和准确性都较高,对于老用户留存估计,服务器120则可根据老用户在上一年度的留存规律预测未来一年度的留存率,结合两者可最终预估未来年度每日的日活跃用户数DAU。由此,便于互联网业务或应用服务提供方根据各自实际情况对未来年度各天的日活跃用户数DAU进行预测,制定相应的业务服务资源供给策略。
应该理解的是,虽然如上流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种用户留存预测处理装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,其中,该装置700具体包括:
留存数据获取模块701,用于获取各历史时间节点在各自后续时间节点具有的用户留存数据;
累积数据获取模块702,用于根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;
变化趋势获取模块703,用于基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
留存数据预测模块704,用于根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
在一个实施例中,累积数据获取模块702,用于针对每一历史时间节点,将在所述各自后续时间节点具有的所述用户留存数据依时序正向进行累计,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据。
在一个实施例中,变化趋势获取模块703,用于针对每一后续时间节点,确定与各后续时间节点相适应的关于累积用户留存数据的数据统计范围;其中,所述数据统计范围包括针对每一后续时间节点的第一数据统计范围以及针对每一后续时间节点的前一后续时间节点的第二数据统计范围;所述第一数据统计范围与所述第二数据统计范围的大小相同;基于所述各历史时间节点分别在所述第一数据统计范围和第二数据统计范围对应的累积用户留存数据,得到第一累积用户留存数据统计信息和第二累积用户留存数据统计信息;根据所述第一累积用户留存数据统计信息和所述第二累积用户留存数据统计信息,获取所述变化趋势。
在一个实施例中,所述第一累积用户留存数据统计信息包括所述各历史时间节点在所述第一数据统计范围对应的累积用户留存数据之和;所述第二累积用户留存数据统计信息包括所述各历史时间节点在所述第二数据统计范围对应的累积用户留存数据之和;变化趋势获取模块703,用于根据所述各历史时间节点在所述第一数据统计范围对应的累积用户留存数据之和与所述各历史时间节点在所述第二数据统计范围对应的累积用户留存数据之和之间的比值,得到所述变化趋势。
在一个实施例中,留存数据预测模块704,用于根据表征所述变化趋势的所述比值与所述历史时间节点在所述预测时间节点的前一时间节点具有的累积用户留存数据的乘积,得到所述历史时间节点在所述预测时间节点对应的预测累积用户留存数据;将所述预测累积用户留存数据与所述历史时间节点在所述前一时间节点具有的累积用户留存数据相减,得到所述预测用户留存数据。
在一个实施例中,所述预测用户留存数据包括针对第一类用户的预测用户留存率;上述装置700还可以包括:活跃用户数预测模块,用于确定所述各历史时间节点对应的第一类用户数;根据所述各历史时间节点具有的第一类用户数以及对应的预测用户留存率,得到所述第一类用户在所述预测时间节点对应的第一活跃用户数;获取第二类用户在所述预测时间节点对应的第二活跃用户数;根据所述第一活跃用户数和第二活跃用户数,得到所述预测时间节点对应的活跃用户数。
在一个实施例中,活跃用户数预测模块,用于确定所述第二类用户在所述预测时间节点前的一所选时间节点对应的第二类用户基础数;获取针对所述第二类用户的用户数衰减历史趋势;所述用户数衰减历史趋势为关于所述第二类用户的数量在所述所选时间节点前具有的衰减趋势;基于所述用户数衰减历史趋势以及所述第二类用户基础数,得到所述第二活跃用户数。
关于用户留存预测处理装置的具体限定可以参见上文中对于用户留存预测处理方法的限定,在此不再赘述。上述用户留存预测处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备800包括通过系统总线810连接的处理器820、存储器和网络接口840。其中,该计算机设备800的处理器820用于提供计算和控制能力。该计算机设备800的存储器包括非易失性存储介质8310、内存储器8320。该非易失性存储介质8310存储有操作系统8311、计算机程序8312和数据库8313。该内存储器8320为非易失性存储介质8310中的操作系统8311和计算机程序8312的运行提供环境。该计算机设备800的数据库8313可以用于存储用户留存数据、累积用户留存数据、变化趋势、预测用户留存数据和活跃用户数等数据。该计算机设备800的网络接口840用于与外部的终端通过网络连接通信。该计算机程序8312被处理器820执行时以实现一种用户留存预测处理方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种用户留存预测处理方法,其特征在于,所述方法包括:
获取各历史时间节点在各自后续时间节点具有的用户留存数据;
根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;
基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,包括:
针对每一历史时间节点,将在所述各自后续时间节点具有的所述用户留存数据依时序正向进行累计,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势,包括:
针对每一后续时间节点,确定与各后续时间节点相适应的关于累积用户留存数据的数据统计范围;其中,所述数据统计范围包括针对每一后续时间节点的第一数据统计范围以及针对每一后续时间节点的前一后续时间节点的第二数据统计范围;所述第一数据统计范围与所述第二数据统计范围的大小相同;
基于所述各历史时间节点分别在所述第一数据统计范围和第二数据统计范围对应的累积用户留存数据,得到第一累积用户留存数据统计信息和第二累积用户留存数据统计信息;
根据所述第一累积用户留存数据统计信息和所述第二累积用户留存数据统计信息,获取所述变化趋势。
4.根据权利要求3所述的方法,其特征在于,所述第一累积用户留存数据统计信息包括所述各历史时间节点在所述第一数据统计范围对应的累积用户留存数据之和;所述第二累积用户留存数据统计信息包括所述各历史时间节点在所述第二数据统计范围对应的累积用户留存数据之和;所述根据所述第一累积用户留存数据统计信息和所述第二累积用户留存数据统计信息,获取所述变化趋势,包括:
根据所述各历史时间节点在所述第一数据统计范围对应的累积用户留存数据之和与所述各历史时间节点在所述第二数据统计范围对应的累积用户留存数据之和之间的比值,得到所述变化趋势。
5.根据权利要求4所述的方法,其特征在于,所述根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据,包括:
根据表征所述变化趋势的所述比值与所述历史时间节点在所述预测时间节点的前一时间节点具有的累积用户留存数据的乘积,得到所述历史时间节点在所述预测时间节点对应的预测累积用户留存数据;
将所述预测累积用户留存数据与所述历史时间节点在所述前一时间节点具有的累积用户留存数据相减,得到所述预测用户留存数据。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述预测用户留存数据包括针对第一类用户的预测用户留存率;所述获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据之后,所述方法还包括:
确定所述各历史时间节点对应的第一类用户数;
根据所述各历史时间节点具有的第一类用户数以及对应的预测用户留存率,得到所述第一类用户在所述预测时间节点对应的第一活跃用户数;
获取第二类用户在所述预测时间节点对应的第二活跃用户数;
根据所述第一活跃用户数和第二活跃用户数,得到所述预测时间节点对应的活跃用户数。
7.根据权利要求6所述的方法,其特征在于,所述获取第二类用户在所述预测时间节点对应的第二活跃用户数,包括:
确定所述第二类用户在所述预测时间节点前的一所选时间节点对应的第二类用户基础数;
获取针对所述第二类用户的用户数衰减历史趋势;所述用户数衰减历史趋势为关于所述第二类用户的数量在所述所选时间节点前具有的衰减趋势;
基于所述用户数衰减历史趋势以及所述第二类用户基础数,得到所述第二活跃用户数。
8.一种用户留存预测处理装置,其特征在于,所述装置包括:
留存数据获取模块,用于获取各历史时间节点在各自后续时间节点具有的用户留存数据;
累积数据获取模块,用于根据所述各历史时间节点在各自后续时间节点具有的用户留存数据,得到所述各历史时间节点在各自后续时间节点对应的累积用户留存数据;
变化趋势获取模块,用于基于所述各历史时间节点在各自后续时间节点对应的累积用户留存数据,获取相邻时间节点间呈现的关于累积用户留存数据的变化趋势;
留存数据预测模块,用于根据所述变化趋势以及所述历史时间节点在预测时间节点的前一时间节点具有的累积用户留存数据,获取所述历史时间节点在所述预测时间节点对应的预测用户留存数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110075537.4A 2021-01-20 2021-01-20 用户留存预测处理方法、装置、计算机设备和存储介质 Active CN114820005B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110075537.4A CN114820005B (zh) 2021-01-20 2021-01-20 用户留存预测处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110075537.4A CN114820005B (zh) 2021-01-20 2021-01-20 用户留存预测处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN114820005A true CN114820005A (zh) 2022-07-29
CN114820005B CN114820005B (zh) 2025-10-24

Family

ID=82524993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110075537.4A Active CN114820005B (zh) 2021-01-20 2021-01-20 用户留存预测处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114820005B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039498A (ja) * 2010-08-10 2012-02-23 Kddi Corp コンテンツ視聴傾向分析システム、方法およびプログラム
CN107833063A (zh) * 2017-11-30 2018-03-23 上海科瓴医疗科技有限公司 药店会员流失预警和智能干预系统及方法
CN109360031A (zh) * 2018-11-16 2019-02-19 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN111767520A (zh) * 2020-06-12 2020-10-13 北京奇艺世纪科技有限公司 一种用户留存率计算方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012039498A (ja) * 2010-08-10 2012-02-23 Kddi Corp コンテンツ視聴傾向分析システム、方法およびプログラム
CN107833063A (zh) * 2017-11-30 2018-03-23 上海科瓴医疗科技有限公司 药店会员流失预警和智能干预系统及方法
CN109360031A (zh) * 2018-11-16 2019-02-19 北京奇虎科技有限公司 一种活跃用户数的预测方法及装置
CN111767520A (zh) * 2020-06-12 2020-10-13 北京奇艺世纪科技有限公司 一种用户留存率计算方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YINGHAO DU等: "Analysis and Design of Activity Degree Monitoring Algorithm", INTERNATIONAL JOURNAL OF MATHEMATICAL MODELS AND METHODS IN APPLIED SCIENCES, vol. 14, 31 January 2020 (2020-01-31), pages 126 - 130 *
范琳琳: "客户活跃度在活期储蓄客户基础分析中的应用", 现代商业, no. 05, 15 February 2010 (2010-02-15), pages 40 - 41 *

Also Published As

Publication number Publication date
CN114820005B (zh) 2025-10-24

Similar Documents

Publication Publication Date Title
CN108681482B (zh) 基于图数据的任务调度方法和装置
CN111797250B (zh) 媒体内容的推送控制方法、装置、计算机设备和存储介质
JP6911670B2 (ja) 情報提供プログラム、情報提供装置および情報提供方法
US20160034835A1 (en) Future cloud resource usage cost management
US9251051B2 (en) Capacity forecasting for backup storage
CN106547481B (zh) 一种数据预分配方法和设备
CN105095646A (zh) 数据预测方法及电子设备
CN109922212B (zh) 一种时段话务量占比的预测方法及装置
CN112269661B (zh) 基于Kafka集群的分区迁移方法和装置
CN110166498B (zh) 用户类别确定方法及装置、计算机设备及存储介质
CN111368412B (zh) 用于护理需求预测的仿真模型构建方法和装置
CN113516404A (zh) 一种绩效数据处理方法、装置及电子设备
CN114820005B (zh) 用户留存预测处理方法、装置、计算机设备和存储介质
CN108764553B (zh) 用户规模预测方法、装置及计算机设备
CN110928748A (zh) 业务系统运行监测方法及装置
CN110795035B (zh) 一种迁移时间确定方法、装置、设备及可读存储介质
CN120045354A (zh) 一种微服务响应延迟预测方法、装置、设备、介质及产品
Stanford et al. Erlangian approximation to finite time ruin probabilities in perturbed risk models
CN114465957A (zh) 一种数据写入方法及装置
JP6764302B2 (ja) 電力需要予測システム、電力需要予測方法及び電力需要予測プログラム
JP2015184965A (ja) 仮想マシン管理装置、仮想マシン管理方法、及び仮想マシン管理システム
CN111078588A (zh) 垃圾回收方法、装置、设备及存储介质
Vile et al. A Queueing Theoretic Approach to Set Staffing Levels in Time‐Dependent Dual‐Class Service Systems
CN115619031A (zh) 停电时长预测方法、装置、设备和存储介质
US20210065033A1 (en) Synthetic data generation using bayesian models and machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant