客户流失预测方法、装置、处理器及电子设备与流程



1.本技术涉及人工智能领域,具体而言,涉及一种客户流失预测方法、装置、处理器及电子设备。


背景技术:



2.客户流失在多个行业中都属于备受关注的问题,因此如何预测客户是否会流失,进而对可能流失的客户进行挽留是各行业的重要关注点。
3.相关技术中,客户流失预测方法大都是从单一角度出发,直接通过专家经验或业务规则武断的判定客户是否流失。比如通过客户不接电话直接判定客户已流失的行为,这种方法是不具有说服力和不负责任的。进一步地,随着人工智能技术的流行,研究人员又使用不同的机器学习分类算法来预测客户流失的概率值。但由于流失客户相比于全量客户占比过低,分类学习算法如逻辑回归模型、决策树模型等不能很好的运用于不平衡数据集,传统的分类算法对少数类的分类效果存在问题,因此目前在数据层面的解决方法主要是应用重采样来改变不平衡数据集中多数或少数类的个数来使数据集达到平衡状态,然后对平衡后的数据集再进行分类训练。但这种做法会造成多数类数据集中重要样本的大量丢失,影响分类算法的效果。而复制少数类样本的合成策略容易造成分类器过拟合的缺点。对于预测出来的可能流失的客户如何进行挽留也是各行页的关注点。
4.相关技术中,对客户进行挽留的方式是通过客户流失前对可能流失的客户进行预警、客户流失后对客户流失原因进行分析等。例如,通过客户的动户动账情况给有可能流失的客户发短信。对流失原因分析只是借助专家经验与传统业务规则来判断,而没有进行深入全面的分析。例如,仅对客户的行为特征进行分析,了解有多少客户流失,客户是什么时候流失的,以及客户是如何流失的基础问题,只是简单地监控客户流失、实施客户关怀。
5.针对相关技术中由于参考维度较少,导致预测客户流失结果不准确的问题,目前尚未提出有效的解决方案。


技术实现要素:



6.本技术的主要目的在于提供一种客户流失预测方法、装置、处理器及电子设备,以解决相关技术中由于参考维度较少,导致预测客户流失结果不准确的问题。
7.为了实现上述目的,根据本技术的一个方面,提供了一种客户流失预测方法。该方法包括:确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;通过第一评估结果、第二评估
结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况。
8.可选地,获取待测客户的目标特征包括:获取待测客户的客户属性特征、资产信息特征和客户归属特征,其中,资产信息特征为待测客户在目标交易方存储的资产的信息,客户归属特征为待测客户与目标交易方进行交易的交易场所;对客户属性特征、资产信息特征和客户归属特征进行预处理,得到处理后的特征,其中,预处理用于将客户属性特征、资产信息特征和客户归属特征转化为标准数据特征;通过随机森林算法从处理后的特征中确定与客户流失情况相关联的多个关联特征,并将多个关联特征确定为目标特征。
9.可选地,该方法还包括:获取多个评估算法,并分别依据评估算法对多个样本客户的目标特征进行评估,得到每个评估算法的评估结果;确定每个评估算法的评估结果的准确率,并将准确率最高的评估结果对应的评估算法确定为初始评估模型的算法;通过多个样本客户的目标特征对初始评估模型进行训练,得到目标模型。
10.可选地,确定多个样本客户的目标特征包括:获取预设时间段内与目标交易方进行交易的客户,得到多个候选样本客户,并获取预设时间段内每个候选样本客户的交易金额和交易次数;计算预设时间段内每个候选样本客户的交易金额与交易次数的比值,得到多个比值;将多个比值按照从大到小的顺序排列,得到序列,并将序列中位于前列的预设比例的候选样本客户确定为已流失样本客户;从序列的已流失样本客户之外的候选样本客户中随机获取预设数量的样本客户,得到未流失样本客户,其中,预设数量由已流失样本客户的数量确定。
11.可选地,依据多个客户属性特征确定第二评估结果包括:对多个客户属性特征进行离散量化处理,得到处理后的客户属性特征;确定每个处理后的客户属性特征的多个属性值,计算已流失样本客户的每个客户属性特征下的不同属性值的客户数量占已流失的客户的数量的比例,并将比例确定为对应属性值的评分;确定每个客户属性特征在多个客户属性特征中的权重,得到多个客户属性特征权重;通过下式确定待测客户的属性评估得分:
[0012][0013]
其中,
[0014]
其中,ava为待测客户的属性评估得分,α为第一区间调整常数,pi为待测客户在第i个客户属性特征中的属性值的评分,ki为第i个客户属性特征权重,n为多个客户属性特征的数量;根据属性评估得分确定第二评估结果。
[0015]
可选地,根据属性评估得分确定第二评估结果包括:通过下述公式对属性评估得分进行标准化处理,得到第二评估结果:
[0016][0017]
其中,ava′
为第二评估结果,ava为待测客户的属性评估得分,θ为预设参数,max(ava)为所有待测客户的属性评估得分中的最大属性评估得分,其中,预设参数用于防止除数为0,n为多个客户属性特征的数量。
[0018]
可选地,依据交易信息确定第三评估结果包括:从交易信息中获取交易场所的种类的数量、交易频率、交易金额、交易时间段的数量以及活跃时间段的数量,其中活跃时间
段为客户的交易次数超过预设次数的交易时间段;通过下述公式确定第三评估结果:
[0019][0020]
其中,lo为每个待测客户的第三评估结果,β为第二区间调整常数,fr为交易频率,mo为交易金额,di为交易场所种类数量,cs为活跃时间段,m为交易时间段。
[0021]
可选地,依据沟通信息确定第四评估结果包括:获取沟通信息中的多个沟通渠道,确定每个沟通渠道的沟通频率以及转化率,其中,转化率为在该沟通渠道下客户进行交易的次数与沟通次数的比值;通过下述公式确定第四评估结果:
[0022][0023]
其中,at为待测客户的第四评估结果,δ为第三区间调整常数,ci为沟通渠道的类型,ci的取值为1,ch为多个沟通渠道的类型的数量,n为多个沟通渠道的数量,fi为沟通频率,pi为转化率。
[0024]
可选地,依据评价信息确定第五评估结果包括:确定评价信息中每个沟通渠道下的正向评价次数和负向评价次数;通过下述公式确定第五评估结果:
[0025][0026]
其中,sa为每个待测客户的第五评估结果,gevi为第i个渠道下的正向评价次数,ε为投诉权重,tsi为第i个渠道下的负向评价次数,evi为第i个渠道下的总评价次数,n为多个沟通渠道的数量。
[0027]
可选地,通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况包括:将待测客户的第一评估结果、第二评估结果、第三评估结果、第四评估结果和第五评估结果分别进行数据归一化处理,得到归一化后的第一评估结果、归一化后的第二评估结果、归一化后的第三评估结果、归一化后的第四评估结果和归一化后的第五评估结果,其中,数据归一化处理用于将不同数值区间的值统一到同一数值区间;确定第一评估结果的第一评估权重、第二评估结果的第二评估权重、第三评估结果的第三评估权重、第四评估结果的第四评估权重和第五评估结果的第五评估权重;通过下述公式计算待测客户的预测结果:
[0028]
l=-μ1·
m-μ2·
ava′
+μ3·
lo+μ4·
at+μ5·
sa;
[0029]
其中,
[0030]
其中,l为待测客户的预测结果,μ1为归一化后的第一评估权重,m为归一化后的第一评估结果,μ2为归一化后的第二评估权重,ava′
为第二评估结果,μ3为第三评估权重,lo为第三评估结果,μ4为第四评估权重,at为第四评估结果,μ5为第五评估权重,sa为第五评估结果;在预测结果大于等于预设分值的情况下,确定待测客户流失,在预测结果小于预设分值的情况下,确定待测客户未流失。
[0031]
为了实现上述目的,根据本技术的另一方面,提供了一种客户流失预测装置。该装置包括:第一获取单元,用于确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;输入单元,用于将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;第二获取单元,用于从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;确定单元,用于通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况。
[0032]
通过本技术,采用以下步骤:确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况,解决了相关技术中由于预测客户流失的参考维度较少,导致预测客户流失结果不准确的问题。通过对待测客户的目标特征、客户属性特征、交易信息、沟通信息、评价信息等多个角度综合分析来预测客户的流失情况,进而达到了提高预测客户流失结果的准确率的效果。
附图说明
[0033]
构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0034]
图1是根据本技术实施例提供的客户流失预测方法的流程图;
[0035]
图2是根据本技术实施例提供的客户流失预测装置的示意图;
[0036]
图3是根据本技术实施例提供的电子设备的示意图。
具体实施方式
[0037]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0038]
为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
[0039]
需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0040]
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
[0041]
下面结合优选的实施步骤对本发明进行说明,图1是根据本技术实施例提供的客户流失预测方法的流程图,如图1所示,该方法包括如下步骤:
[0042]
步骤s101,确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户。
[0043]
具体地,目标交易可以为金融机构,例如,为x银行,待测客户为与x银行存在交易的客户,目标特征可以包括客户属性特征、资产信息特征和客户归属特征,客户属性特征例如客户的年龄、学历、职业、资产风险等级等。资产信息特征如客户在x银行的服务星级、贡献星级、金融资产总额等。客户归属特征如客户在x银行办理业务所属网点信息和为客户服务的客户经理信息等。
[0044]
步骤s102,将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户。
[0045]
具体地,目标模型可以为通过样本客户的目标特征训练出的模型,通过确定样本客户中的未流失客户样本和已流失客户样本,将未流失客户样本的目标特征和已流失客户样本的目标特征作为模型的训练数据集,经过分类模型算法训练得到目标模型。分类模型算法可以为逻辑回归,决策树,随机森林等算法。
[0046]
步骤s103,从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果。
[0047]
具体地,交易信息可以包括客户进行交易时所在交易场所的种类的数量、交易频率,也即客户与目标交易方进行交易的次数、交易金额,也即客户与目标交易方进行交易的总交易额、交易时间段的数量,也即一年内客户与目标交易方进行交易的月份的数量、活跃时间段的数量,也即交易时间段内交易频率较高的月份的数量,沟通信息可以包括客户与目标交易方的沟通渠道、每个沟通渠道下的沟通频率和转化率,沟通渠道例如目标交易方通过短信与客户进行沟通,沟通频率例如目标交易方向客户发送的短信的条数,转化率例如客户在收到短信后与目标交易方进行交易的次数与目标交易方的次数的比值。
[0048]
评价信息可以包括客户在与目标交易方进行交易后评价的好评数和差评数。通过将多个客户属性特征输入与客户属性特征对应的公式计算第二评估结果,通过将交易信息输入与交易信息对应的公式计算第三评估结果,通过将沟通信息输入与沟通信息对应的公
式计算第四评估结果,通过将评价信息输入与评价信息对应的公式计算第五评估结果。
[0049]
步骤s104,通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况。
[0050]
具体地,综合多角度的评估结果来确定待测客户与目标交易方进行交易后的流失情况。上述五个评估结果可以任意选取其中的部分评估结果用来预测待测客户的流失情况,例如,可以综合全部的五个评估结果来预测待测客户的流失情况,先确定各个评估结果在预测中的权重,将各个评估结果与对应的权重的积的累加值作为最终待测客户的预测流失评分,当预测流失评分超过预设分值时,确定待测客户与目标交易方进行交易后会流失。
[0051]
本技术实施例提供的客户流失预测方法,通过确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况,解决了相关技术中由于预测客户流失的参考维度较少,导致预测客户流失结果不准确的问题。通过对待测客户的目标特征、客户属性特征、交易信息、沟通信息、评价信息等多个角度综合分析来预测客户的流失情况,进而达到了提高预测客户流失结果的准确率的效果。
[0052]
目标特征是从待测客户的多种特征筛选出来的,可选地,在本技术实施例提供的客户流失预测方法中,获取待测客户的目标特征包括:获取待测客户的客户属性特征、资产信息特征和客户归属特征,其中,资产信息特征为待测客户在目标交易方存储的资产的信息,客户归属特征为待测客户与目标交易方进行交易的交易场所;对客户属性特征、资产信息特征和客户归属特征进行预处理,得到处理后的特征,其中,预处理用于将客户属性特征、资产信息特征和客户归属特征转化为标准数据特征;通过随机森林算法从处理后的特征中确定与客户流失情况相关联的多个关联特征,并将多个关联特征确定为目标特征。
[0053]
具体地,在获取目标特征前,先确定待测客户的全量属性特征,全量属性特征也即从目标交易方获取到的关于待测客户的所有特征,按照选定的特征维度提取客户数据,拼接宽表,进行特征工程工作,也即预处理。特征工程主要包括对所有特征的数据进行缺失值补充(中位数或均值补充),对所有特征的数据进行数据分箱处理,也即对数据进行分组,更正错误数据,去除与客户流失情况无关的特征数据,还要去除特定分布区域之外的数据噪音、有些特征还需将数据变换为均值为0,标准差为1的分布。
[0054]
然后对所有特征的数据剔除部分无效的变量,如身份证号、电话号码、绝对日期、地址数据等。这些变量对训练目标模型没有用处。最后对所有特征的数据加入衍生变量,衍生变量是对特征数据深入的分析后,生成一组对目标模型具有训练意义的衍生变量。例如不同时间段内的交易金额差,交易频率差等。通过随机森林的算法对所有特征的重要性进行排序,从而到重要性高的、客户流失的最大影响因素进行重点关注。将经过随机森林算法筛选后的特征确定为目标特征,例如选取客户属性特征,资产信息特征,行为信息特征和
客户归属特征作为目标特征,表1为各类目标特征。
[0055]
表1
[0056][0057][0058]
需要说明的是,在机器学习领域,选取的有效特征越多,对客户流失的预测结果就越准确,然而在实际情况下,数据仓库中存储的数据是有限的,而且考虑到数据安全的问题,无法引入外部数据进行参考,所以在机器学习模块下,本技术重点聚焦客户的客户属性特征、资产信息特征和客户归属特征。
[0059]
确定目标特征后,筛选出准确率最高的算法来训练目标模型,可选地,在本技术实施例提供的客户流失预测方法中,该方法还包括:获取多个评估算法,并分别依据评估算法对多个样本客户的目标特征进行评估,得到每个评估算法的评估结果;确定每个评估算法的评估结果的准确率,并将准确率最高的评估结果对应的评估算法确定为初始评估模型的算法;通过多个样本客户的目标特征对初始评估模型进行训练,得到目标模型。
[0060]
具体地,评估算法也即分类模型算法,例如逻辑回归,决策树,随机森林等。为了选择准确率最高的分类模型算法,通过将多个样本客户的目标特征输入各个模型算法中进行分类,得到每个算法的分类结果,通过对比不同的算法的分类结果,按照效果对比,确定每个分类算法对应的分类结果的auc值(area under roc curve,一种度量分类模型好坏的一个标准)。也即每个评估算法的评估结果的准确率,将auc值最高的分类算法确定为初始评估模型的算法。
[0061]
对目标模型进行训练时,为了防止模型过拟合。从表1中随机抽取70%的数据作为训练集,用于训练模型的参数;剩余的30%作为测试集,用于检验训练模型的性能。通过初始评估模型的算法对目标特征中的训练集和测试集进行二分类,即确定训练集的未流失客户样本和已流失客户样本,以及确定测试集的未流失客户样本和已流失客户样本。通过测试集的分类结果检验经训练集训练后的目标模型的性能。通过对比多种算法的准确率,确定目标模型的算法,并通过目标特征中的训练集对初始评估模型进行训练,得到目标模型,然后通过目标特征中的测试集检验目标模型的性能。
[0062]
需要说明的是,目标模型的训练方法可以为:首先,整合和筛选多个样本客户的全量属性特征中的客户属性特征集合、资产信息特征集合、客户归属特征集合,得到多个样本客户的目标特征集合fu。其中已流失客户样本的目标特征集为f
p
。已流失客户样本集p,多个样本客户集u。
[0063]
对于目标模型m
t
,将已流失客户样本集p作为正样本,p对应的目标特征集为f
t,p
;从多个样本客户集u中随机筛选出与p等人数的未流失样本客户作为负样本u
t,n
,负样本对应的目标特征集为f
t,n
;而u中未被选出的客户集合u
t,u
作为测试集,测试集对应的目标特征集为f
t,u

[0064]
然后将f
t,p
∪f
t,n
作为训练数据集,通过训练数据集训练好的模型为目标模型m
t
。接着使用目标模型m
t
对未被选中的客户集合对应的目标特征集f
t,u
进行预测分类,得到u
t,u
的分类结果集s
t

[0065]
在通过多个样本客户训练目标模型前,需要先确定多个样本客户中的未流失样本客户和已流失样本客户,可选地,在本技术实施例提供的客户流失预测方法中,确定多个样本客户的目标特征包括:获取预设时间段内与目标交易方进行交易的客户,得到多个候选样本客户,并获取预设时间段内每个候选样本客户的交易金额和交易次数;计算预设时间段内每个候选样本客户的交易金额与交易次数的比值,得到多个比值;将多个比值按照从大到小的顺序排列,得到序列,并将序列中位于前列的预设比例的候选样本客户确定为已流失样本客户;从序列的已流失样本客户之外的候选样本客户中随机获取预设数量的样本客户,得到未流失样本客户,其中,预设数量由已流失样本客户的数量确定。
[0066]
具体地,预设时间段可以为m个月,候选样本客户也即多个样本客户,使用机器学习的方法对待测客户进行分类评估之前,首先要确定机器学习的正样本和负样本,正样本也即已流失样本客户,负样本也即未流失样本客户。将候选样本客户中的一段时间前有频繁交易行为,一段时间后无交易行为的部分客户作为正样本,预设时间段的取值取决于能获取足够的正样本的数量,使得正样本在总样本数中处于平衡状态。
[0067]
正样本可以按活跃程度进行划分,选取m月内交易金额amt与交易频数f差值的比值的前百分之30客户,即y值的前百分之30作为正样本。正样本基础划分算法为:
[0068][0069]
其中,amt
n-amt
n-m
为样本客户截止到n月在目标交易方的交易额减去截止到n-m月在目标交易方的交易额,也即m个月内样本客户的交易额。f
n-f
n-m
是m个月样本客户的交易频数,也即样本客户在m个月内共交易了多少次。k为整体比值的系数,用来方便比较不同比值的差异,让y值处在合理的取值范围区间内。为了避免f
n-f
n-m
为0,引入预设的小正数σ来防止除数为0。(例如σ取0.1或0.01)。
[0070]
确定客户属性特征后,可以根据客户属性特征确定待测客户的属性评估得分,可选地,在本技术实施例提供的客户流失预测方法中,依据多个客户属性特征确定第二评估结果包括:对多个客户属性特征进行离散量化处理,得到处理后的客户属性特征;确定每个处理后的客户属性特征的多个属性值,计算已流失样本客户的每个客户属性特征下的不同属性值的客户数量占已流失的客户的数量的比例,并将比例确定为对应属性值的评分;确定每个客户属性特征在多个客户属性特征中的权重,得到多个客户属性特征权重;通过下式确定待测客户的属性评估得分:
[0071]
[0072]
其中,
[0073]
其中,ava为待测客户的属性评估得分,α为第一区间调整常数,pi为待测客户在第i个客户属性特征中的属性值的评分,ki为第i个客户属性特征权重,n为多个客户属性特征的数量;根据属性评估得分确定第二评估结果。
[0074]
具体地,部分客户属性特征的属性值需要处理为离散值的形式,部分客户属性特征的属性值需要分成多个区间的离散值,也即,针对连续型客户属性特征需要被转变为离散型。因为相邻值代表的效果和意义差别不大。例如,将学历、职业、年龄、行龄进行离散量化处理后得到各个客户属性特征的属性值分类结果:学历={大专以下,大专,本科,硕士,博士,博士后}。职业={金融投资,制造业,教育,军事,文化艺术,医疗,外资,it互联网,法律,其他}。年龄={未成年(小于18周岁),青年(18-45岁),中年(46-69岁),老年(》69岁)}。行龄={新客户(0-5年),中长期客户(5-15年),长期粉丝客户(15年以上)}。
[0075]
接下来,对各个客户属性特征的属性值分类结果确定序号j,学历的各类属性值的序号可以对应设置为{1,2,3,4,5,6};职业的各类属性值的序号可以对应设置为{1,2,3,4,5,6,7,8,9,0};年龄的各类属性值的序号可以对应设置为{1,2,3,4};行龄的各类属性值的序号可以对应设置为{1,2,3}。每个客户属性特征下的第j类属性值的评分用p
xj
来表示,p
xj
的计算公式为:
[0076][0077]
其中,n为候选样本客户的总数量,p
xj
为客户属性x第j项的评分,n为候选样本客户中客户属性x是j的客户数量。例如,假设候选样本客户a中未成年客户占15%,那么“未成年”的得分为0.15;青年客户占客42%,那么“青年”的得分为0.42。p
xj
体现了拥有这项属性的客户在流失行为中的表现。计算p
xj
是将客户属性特征与客户流失结果之间量化出相关性。
[0078]
每个待测客户均对应存在学历、职业、年龄、行龄这几个属性的属性值,将这待测客户在每个客户属性特征中的评分记为p1,p2,p3,p4。通过上述公式计算每个待测客户的属性评估得分。由于专家经验中会对待测客户不同的客户属性特征有侧重考虑情况,因此整体待测客户的属性评估得分是以加权平均值的形式来保障各个客户属性特征得分得分的公平性。
[0079]
需要说明的是,第二评估结果主要研究客户重要的客户属性特征。通过统计分析的方法到重要的客户属性特征与待测客户最终流失结果的关联关系。统计分析的方法主要会用到一些业务专家经验,虽然条件相对较少,但这些经验规则往往能总结出客户属性特征中对客户流失结果相关性较大的客户属性特征。客户属性特征主要包括客户的基本信息,如客户姓名、年龄、行龄、学历、身高、体重、身份证号、手机号、职业等等。这些属性全部参与了机器学习的特征入模过程,由随机森林算法得到这些特征与预测客户流失结果的重要程度相关性。统计分析的方法就是要从上述基本信息属性中筛选出关联性较高的核心固有属性。例如本技术中选择的核心固有属性为年龄、行龄、学历、职业。
[0080]
确定待测客户的属性评估得分后,对属性评估得分进行标准化处理得到第二评估结果,可选地,在本技术实施例提供的客户流失预测方法中,根据属性评估得分确定第二评估结果包括:通过下述公式对属性评估得分进行标准化处理,得到第二评估结果:
[0081][0082]
其中,ava′
为第二评估结果,ava为待测客户的属性评估得分,θ为预设参数,max(ava)为所有待测客户的属性评估得分中的最大属性评估得分,其中,预设参数用于防止除数为0,n为多个客户属性特征的数量。
[0083]
具体地,待测客户的属性评估得分表征的是待测客户的流失可能性与正样本的流失得分的相似程度,ava为一个累加值,为了将属性评估得分与其他评估维度统一化,需要将属性评估得分进行标准化处理。处理方式为通过上述公式将ava得分区间转化为与频率取值范围相同,即将属性评估得分处理为(0,1]之间的值。其中θ值为预设的小正数防止除数为0。(例如0.1或0.01)。通过对属性评估得分进行标准化处理,使其能够与其他维度的评估结果进行统一处理。
[0084]
确定第二评估结果后,从交易信息的维度确定待测客户的第三评估结果,可选地,在本技术实施例提供的客户流失预测方法中,依据交易信息确定第三评估结果包括:从交易信息中获取交易场所的种类的数量、交易频率、交易金额、交易时间段的数量以及活跃时间段的数量,其中活跃时间段为客户的交易次数超过预设次数的交易时间段;通过下述公式确定第三评估结果:
[0085][0086]
其中,lo为每个待测客户的第三评估结果,β为第二区间调整常数,fr为交易频率,mo为交易金额,di为交易场所种类数量,cs为活跃时间段,m为交易时间段。
[0087]
具体地,第三评估结果可以为客户忠诚度评估结果,交易频率可以为一年内待测客户进行交易的总次数,交易金额可以为为一年内待测客户在目标交易方进行交易的总金额。交易时间段的数量可以为一年内待测客户在当月存在交易的月份的数量,例如,a客户在1、3、5、9月在目标交易方存在交易,则交易时间段的数量为4个月。活跃时间段的数量为在交易时间段中客户的交易次数超过预设次数的月份的数量,例如,a客户在1月进行了5次交易,在3月进行了1次交易,在5月进行了3次交易,在9月进行了2次交易,若预设次数为3,则只有1月和5月属于活跃的月份,也即活跃时间段的数量为两个月。
[0088]
首先从待测客户的全量属性特征中提取出影响客户对目标交易方的忠诚度的特征。忠诚度主要体现在客户对某些服务或产品的粘性,有持续的消费行为等。本技术根据待测客户的4个与忠诚度关联的维度来计算忠诚度评估结果。这4个与忠诚度关联的维度包括:一定时间范围内的交易商户种类数量、交易频率、交易金额、交易持续性。从这四个维度提取到的交易特征分别为:交易场所的种类的数量、交易频率、交易金额、交易时间段的数量以及活跃时间段的数量。
[0089]
待测客户对目标交易方的忠诚度与客户的交易特征息息相关,其中,待测客户交易场所的种类的数量越多,说明待测客户对目标交易方的忠诚度越高。同样的,待测客户在目标交易方进行交易的频率越高的客户,也说明待测客户对目标交易方的忠诚度越高。另外,单位时间内的交易金额越大,近一年待测客户的活跃时间段的数量越多,也说明待测客户对目标交易方的忠诚度越高。通过上述公式计算待测客户的第三评估结果。
[0090]
确定第三评估结果过后,通过待测客户的沟通信息确定第四评估结果,可选地,在
本技术实施例提供的客户流失预测方法中,依据沟通信息确定第四评估结果包括:获取沟通信息中的多个沟通渠道,确定每个沟通渠道的沟通频率以及转化率,其中,转化率为在该沟通渠道下客户进行交易的次数与沟通次数的比值;通过下述公式确定第四评估结果:
[0091][0092]
其中,at为待测客户的第四评估结果,δ为第三区间调整常数,ci为沟通渠道的类型,ci的取值为1,ch为多个沟通渠道的类型的数量,n为多个沟通渠道的数量,fi为沟通频率,pi为转化率。
[0093]
具体地,沟通渠道可以为目标交易方联系待测客户的方式,例如发短信,电话外呼,推送,专属app的推荐等。第四评估结果可以为吸引力评估结果,除了待测客户自身的属性特征导致的客户流失因素外,还需要从目标交易方的角度考虑是否有部分因素会影响客户流失情况。目标交易方适时提供一些普遍或个性的策略和产品来吸引客户长久的留存,从而达到降低客户流失率的效果。那么影响客户吸引力的特征主要包括如下角度:沟通渠道,每种沟通渠道对应的待测客户收到信息的频度,也即沟通频率。还包括转化率,通过m沟通渠道的第m次联系客户后的一段时间内,如果客户有持续的交易行为,那么说明客户产生了转化,达到了吸引客户的目的,计算m沟通渠道下达成转化的次数与总沟通次数的比值,也即m沟通渠道对应的转化率。客户产生吸引力的原因是来自多方面多渠道的,由于不一定每种渠道都会产生正向的转化,所以需要对多种渠道的频率和转化率进行求和得到综合的吸引力得分。通过上述公式计算待测客户的第四评估结果。
[0094]
确定第四评估结果后,还可以通过评价信息确定第五评估结果,可选地,在本技术实施例提供的客户流失预测方法中,依据评价信息确定第五评估结果包括:确定评价信息中每个沟通渠道下的正向评价次数和负向评价次数;通过下述公式确定第五评估结果:
[0095][0096]
其中,sa为每个待测客户的第五评估结果,gevi为第i个渠道下的正向评价次数,ε为投诉权重,tsi为第i个渠道下的负向评价次数,evi为第i个渠道下的总评价次数,n为多个沟通渠道的数量。
[0097]
具体地,正向评价次数可以为待测客户对交易的好评次数,负向评价次数可以为待测客户对交易的差评次数。第五评估结果可以为客户满意度评估结果,客户满意度一直是吸引客户留存,抵御客户流失的重要因素,客户只有享受到了优质的服务,才会更加对目标交易方的产品产生信赖。待测客户对交易对应的目标交易方的服务情况进行评分。评分包括线下服务满意度打分,线上办理业务服务满意度评分,高效解决问题满意度评分,投诉后积极解决问题满意度评分等。这些评分分为好评和差评两类,统计好评次数和差评次数。通过上述公式计算待测客户的第五评估结果。
[0098]
需要说明的是,由于差评和投诉对客户满意程度影响较大,极有可能产生客户流失的行为,因此在差评次数前设定一个系数ε来强调投诉的严重性,例如取值为10、100等。
好评次数与差评次数差值与总的服务次数的比值即为客户服务水平得分。输出值sa越高,说明待测客户对目标交易方的服务水平满意程度值越高,越不可能发生流失行为,客户粘性也就越强。
[0099]
确定第五评估结果后,需要对各个评估结果进行归一化处理,可选地,在本技术实施例提供的客户流失预测方法中,通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况包括:将待测客户的第一评估结果、第二评估结果、第三评估结果、第四评估结果和第五评估结果分别进行数据归一化处理,得到归一化后的第一评估结果、归一化后的第二评估结果、归一化后的第三评估结果、归一化后的第四评估结果和归一化后的第五评估结果,其中,数据归一化处理用于将不同数值区间的值统一到同一数值区间;确定第一评估结果的第一评估权重、第二评估结果的第二评估权重、第三评估结果的第三评估权重、第四评估结果的第四评估权重和第五评估结果的第五评估权重;通过下述公式计算待测客户的预测结果:
[0100]
l=-μ1·
m-μ2·
ava′
+μ3·
lo+μ4·
at+μ5·
sa;
[0101]
其中,
[0102]
其中,l为待测客户的预测结果,μ1为归一化后的第一评估权重,m为归一化后的第一评估结果,μ2为归一化后的第二评估权重,ava′
为第二评估结果,μ3为第三评估权重,lo为第三评估结果,μ4为第四评估权重,at为第四评估结果,μ5为第五评估权重,sa为第五评估结果;在预测结果大于等于预设分值的情况下,确定待测客户流失,在预测结果小于预设分值的情况下,确定待测客户未流失。
[0103]
具体地,归一化处理也即将各个评估结果同一在相同的数值区间,首先需要对五个评估结果进行标准化,统一各个评估结果的性质,由于部分评估结果是概率值,部分评估结果是频率积。用m值来表征第一评估结果,m值越高说明发生流失行为概率的可能性越大,m值越低说明发生流失行为概率的可能性越小。用ava′
表征第二评估结果,ava′
的值越大说明发生流失行为概率的可能性越大,ava′
值越低说明发生流失行为概率的可能性越小。用lo表征第三评估结果,客户忠诚度lo体现的是待测客户的交易行为频率值,lo的值越大说明发生流失行为概率的可能性越小,lo值越小说明发生流失行为概率的可能性越大。用at表征第四评估结果,at的值越大说明发生流失行为概率的可能性越小,at值越小说明发生流失行为概率的可能性越大。用sa表征第五评估结果,sa的值越大说明发生流失行为概率的可能性越小,sa值越小说明发生流失行为概率的可能性越大。
[0104]
由于第一评估结果为机器学习后的分类结果的评估分值,通过对第一评估结果乘上合适的系数将评估分值调整至(0,1]之间的数值,第二评估结果经标准化处理后的值属于(0,1]之间,第三评估结果、第四评估结果和第五评估结果本就是频率值,自然取值范围在(0,1]之间,因此不需进行归一化处理。通过业务人员和技术专家结合实际业务情况和数学期望共同得出各个评估结果的重要性系数值,也即权重,通过上述公式计算待测客户的预测结果。本技术的评估结果可分为机器学习指标和统计分析指标两大类,这两类指标角度既可以处理海量数据属性与流失结果的关联关系,又可以在可解释的视角下,聚焦重点属性淡化全量数据质量的偏离问题,借助业务经验弥补建模者经验差异,从而达到更优效
果。
[0105]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0106]
本技术实施例还提供了一种客户流失预测装置,需要说明的是,本技术实施例的客户流失预测装置可以用于执行本技术实施例所提供的用于客户流失预测方法。以下对本技术实施例提供的客户流失预测装置进行介绍。
[0107]
图2是根据本技术实施例的客户流失预测装置的示意图。如图2所示,该装置包括:
[0108]
第一获取单元10,用于确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;
[0109]
输入单元20,用于将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;
[0110]
第二获取单元30,用于从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;
[0111]
确定单元40,用于通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况。
[0112]
本技术实施例提供的客户流失预测装置,通过第一获取单元10,确定待测客户,并获取待测客户的目标特征,其中,待测客户是与目标交易方进行交易的客户;输入单元20,将目标特征输入目标模型,得到第一评估结果,其中,目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与目标交易方进行交易后得到的未流失样本客户和已流失样本客户;第二获取单元30,从目标特征中获取多个客户属性特征,获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据多个客户属性特征确定第二评估结果,依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,依据评价信息确定第五评估结果;确定单元40,通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户与目标交易方进行交易后的流失情况,解决了相关技术中由于预测客户流失的参考维度较少,导致预测客户流失结果不准确的问题。通过对待测客户的目标特征、客户属性特征、交易信息、沟通信息、评价信息等多个角度综合分析来预测客户的流失情况,进而达到了提高预测客户流失结果的准确率的效果。
[0113]
可选地,在本技术实施例提供的客户流失预测装置中,第一获取单元10包括:第一获取模块,用于获取待测客户的客户属性特征、资产信息特征和客户归属特征,其中,资产信息特征为待测客户在目标交易方存储的资产的信息,客户归属特征为待测客户与目标交易方进行交易的交易场所;预处理模块,用于对客户属性特征、资产信息特征和客户归属特征进行预处理,得到处理后的特征,其中,预处理用于将客户属性特征、资产信息特征和客户归属特征转化为标准数据特征;第一确定模块,用于通过随机森林算法从处理后的特征中确定与客户流失情况相关联的多个关联特征,并将多个关联特征确定为目标特征。
[0114]
可选地,在本技术实施例提供的客户流失预测装置中,该装置还包括:第三获取单元,用于获取多个评估算法,并分别依据评估算法对多个样本客户的目标特征进行评估,得到每个评估算法的评估结果;算法确定单元,用于确定每个评估算法的评估结果的准确率,并将准确率最高的评估结果对应的评估算法确定为初始评估模型的算法;训练单元,用于通过多个样本客户的目标特征对初始评估模型进行训练,得到目标模型。
[0115]
可选地,在本技术实施例提供的客户流失预测装置中,该装置还包括:第四获取单元,用于获取预设时间段内与目标交易方进行交易的客户,得到多个候选样本客户,并获取预设时间段内每个候选样本客户的交易金额和交易次数;计算单元,用于计算预设时间段内每个候选样本客户的交易金额与交易次数的比值,得到多个比值;排序单元,用于将多个比值按照从大到小的顺序排列,得到序列,并将序列中位于前列的预设比例的候选样本客户确定为已流失样本客户;第五获取单元,用于从序列的已流失样本客户之外的候选样本客户中随机获取预设数量的样本客户,得到未流失样本客户,其中,预设数量由已流失样本客户的数量确定。
[0116]
可选地,在本技术实施例提供的客户流失预测装置中,第二获取单元30包括:处理模块,用于对多个客户属性特征进行离散量化处理,得到处理后的客户属性特征;第二确定模块,用于确定每个处理后的客户属性特征的多个属性值,计算已流失样本客户的每个客户属性特征下的不同属性值的客户数量占已流失的客户的数量的比例,并将比例确定为对应属性值的评分;第三确定模块,用于确定每个客户属性特征在多个客户属性特征中的权重,得到多个客户属性特征权重;第四确定模块,用于通过下式确定待测客户的属性评估得分:
[0117][0118]
其中,
[0119]
其中,ava为待测客户的属性评估得分,α为第一区间调整常数,pi为待测客户在第i个客户属性特征中的属性值的评分,ki为第i个客户属性特征权重,n为多个客户属性特征的数量;第五确定模块,用于根据属性评估得分确定第二评估结果。
[0120]
可选地,在本技术实施例提供的客户流失预测装置中,第五确定模块包括:标准化处理子模块,用于通过下述公式对属性评估得分进行标准化处理,得到第二评估结果:
[0121][0122]
其中,ava′
为第二评估结果,ava为待测客户的属性评估得分,θ为预设参数,max(ava)为所有待测客户的属性评估得分中的最大属性评估得分,其中,预设参数用于防止除数为0,n为多个客户属性特征的数量。
[0123]
可选地,在本技术实施例提供的客户流失预测装置中,第二获取单元30包括:第二获取模块,用于从交易信息中获取交易场所的种类的数量、交易频率、交易金额、交易时间段的数量以及活跃时间段的数量,其中活跃时间段为客户的交易次数超过预设次数的交易时间段;第六确定模块,用于通过下述公式确定第三评估结果:
[0124]
[0125]
其中,lo为每个待测客户的第三评估结果,β为第二区间调整常数,fr为交易频率,mo为交易金额,di为交易场所种类数量,cs为活跃时间段,m为交易时间段。
[0126]
可选地,在本技术实施例提供的客户流失预测装置中,第二获取单元30包括:第三获取模块,用于获取沟通信息中的多个沟通渠道,确定每个沟通渠道的沟通频率以及转化率,其中,转化率为在该沟通渠道下客户进行交易的次数与沟通次数的比值;第七确定模块,用于通过下述公式确定第四评估结果:
[0127][0128]
其中,at为待测客户的第四评估结果,δ为第三区间调整常数,ci为沟通渠道的类型,ci的取值为1,ch为多个沟通渠道的类型的数量,n为多个沟通渠道的数量,fi为沟通频率,pi为转化率。
[0129]
可选地,在本技术实施例提供的客户流失预测装置中,第二获取单元30包括:第八确定模块,用于确定评价信息中每个沟通渠道下的正向评价次数和负向评价次数;第九确定模块,用于通过下述公式确定第五评估结果:
[0130][0131]
其中,sa为每个待测客户的第五评估结果,gevi为第i个渠道下的正向评价次数,ε为投诉权重,tsi为第i个渠道下的负向评价次数,evi为第i个渠道下的总评价次数,n为多个沟通渠道的数量。
[0132]
可选地,在本技术实施例提供的客户流失预测装置中,确定单元40包括:归一化处理模块,用于将待测客户的第一评估结果、第二评估结果、第三评估结果、第四评估结果和第五评估结果分别进行数据归一化处理,得到归一化后的第一评估结果、归一化后的第二评估结果、归一化后的第三评估结果、归一化后的第四评估结果和归一化后的第五评估结果,其中,数据归一化处理用于将不同数值区间的值统一到同一数值区间;第十确定模块,用于确定第一评估结果的第一评估权重、第二评估结果的第二评估权重、第三评估结果的第三评估权重、第四评估结果的第四评估权重和第五评估结果的第五评估权重;第十一确定模块,用于通过下述公式计算待测客户的预测结果:
[0133]
l=-μ1·
m-μ2·
ava′
+μ3·
lo+μ4·
at+μ5·
sa;
[0134]
其中,
[0135]
其中,l为待测客户的预测结果,μ1为归一化后的第一评估权重,m为归一化后的第一评估结果,μ2为归一化后的第二评估权重,ava′
为第二评估结果,μ3为第三评估权重,lo为第三评估结果,μ4为第四评估权重,at为第四评估结果,μ5为第五评估权重,sa为第五评估结果;第十二确定模块,用于在预测结果大于等于预设分值的情况下,确定待测客户流失,在预测结果小于预设分值的情况下,确定待测客户未流失。
[0136]
客户流失预测装置包括处理器和存储器,上述第一获取单元10、输入单元20、第二
获取单元30和确定单元40等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0137]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高预测客户流失结果的准确率。
[0138]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0139]
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现客户流失预测方法。
[0140]
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行客户流失预测方法。
[0141]
如图3所示,本发明实施例提供了一种电子设备,设备301包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:客户流失预测方法。本文中的设备可以是服务器、pc、pad、手机等。
[0142]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:客户流失预测方法。
[0143]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0144]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0145]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0146]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0147]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0148]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介
质的示例。
[0149]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0150]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0151]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0152]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。

技术特征:


1.一种客户流失预测方法,其特征在于,包括:确定待测客户,并获取所述待测客户的目标特征,其中,所述待测客户是与目标交易方进行交易的客户;将所述目标特征输入目标模型,得到第一评估结果,其中,所述目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与所述目标交易方进行交易后得到的未流失样本客户和已流失样本客户;从所述目标特征中获取多个客户属性特征,获取所述待测客户在与所述目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据所述多个客户属性特征确定第二评估结果,依据所述交易信息确定第三评估结果,依据所述沟通信息确定第四评估结果,依据所述评价信息确定第五评估结果;通过所述第一评估结果、所述第二评估结果、所述第三评估结果、所述第四评估结果以及所述第五评估结果中的至少一个确定所述待测客户与所述目标交易方进行交易后的流失情况。2.根据权利要求1所述的方法,其特征在于,获取所述待测客户的目标特征包括:获取所述待测客户的客户属性特征、资产信息特征和客户归属特征,其中,所述资产信息特征为所述待测客户在所述目标交易方存储的资产的信息,所述客户归属特征为所述待测客户与所述目标交易方进行交易的交易场所;对所述客户属性特征、所述资产信息特征和所述客户归属特征进行预处理,得到处理后的特征,其中,所述预处理用于将所述客户属性特征、所述资产信息特征和所述客户归属特征转化为标准数据特征;通过随机森林算法从所述处理后的特征中确定与客户流失情况相关联的多个关联特征,并将所述多个关联特征确定为所述目标特征。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取多个评估算法,并分别依据所述评估算法对所述多个样本客户的目标特征进行评估,得到每个所述评估算法的评估结果;确定每个所述评估算法的评估结果的准确率,并将准确率最高的评估结果对应的评估算法确定为初始评估模型的算法;通过所述多个样本客户的目标特征对所述初始评估模型进行训练,得到所述目标模型。4.根据权利要求3所述的方法,其特征在于,确定所述多个样本客户的目标特征包括:获取预设时间段内与所述目标交易方进行交易的客户,得到多个候选样本客户,并获取所述预设时间段内每个候选样本客户的交易金额和交易次数;计算所述预设时间段内每个候选样本客户的所述交易金额与所述交易次数的比值,得到多个比值;将所述多个比值按照从大到小的顺序排列,得到序列,并将所述序列中位于前列的预设比例的候选样本客户确定为所述已流失样本客户;从所述序列的所述已流失样本客户之外的候选样本客户中随机获取预设数量的样本客户,得到所述未流失样本客户,其中,所述预设数量由所述已流失样本客户的数量确定。5.根据权利要求1所述的方法,其特征在于,依据所述多个客户属性特征确定第二评估
结果包括:对所述多个客户属性特征进行离散量化处理,得到处理后的客户属性特征;确定每个处理后的客户属性特征的多个属性值,计算所述已流失样本客户的每个客户属性特征下的不同属性值的客户数量占所述已流失的客户的数量的比例,并将所述比例确定为对应属性值的评分;确定每个客户属性特征在所述多个客户属性特征中的权重,得到多个客户属性特征权重;通过下式确定所述待测客户的属性评估得分:其中,其中,av
a
为所述待测客户的属性评估得分,α为第一区间调整常数,p
i
为所述待测客户在第i个客户属性特征中的属性值的评分,k
i
为第i个客户属性特征权重,n为所述多个客户属性特征的数量;根据所述属性评估得分确定所述第二评估结果。6.根据权利要求5所述的方法,其特征在于,根据所述属性评估得分确定所述第二评估结果包括:通过下述公式对所述属性评估得分进行标准化处理,得到所述第二评估结果:其中,av
a

为所述第二评估结果,av
a
为所述待测客户的属性评估得分,θ为预设参数,max(av
a
)为所有待测客户的属性评估得分中的最大属性评估得分,其中,所述预设参数用于防止除数为0,n为所述多个客户属性特征的数量。7.根据权利要求1所述的方法,其特征在于,依据所述交易信息确定第三评估结果包括:从所述交易信息中获取交易场所的种类的数量、交易频率、交易金额、交易时间段的数量以及活跃时间段的数量,其中所述活跃时间段为客户的交易次数超过预设次数的交易时间段;通过下述公式确定所述第三评估结果:其中,lo为每个所述待测客户的第三评估结果,β为第二区间调整常数,fr为所述交易频率,mo为所述交易金额,di为所述交易场所种类数量,cs为所述活跃时间段,m为所述交易时间段。8.根据权利要求1所述的方法,其特征在于,依据所述沟通信息确定第四评估结果包括:获取所述沟通信息中的多个沟通渠道,确定每个所述沟通渠道的沟通频率以及转化率,其中,所述转化率为在该沟通渠道下客户进行交易的次数与沟通次数的比值;通过下述公式确定所述第四评估结果:
其中,at为所述待测客户的第四评估结果,δ为第三区间调整常数,c
i
为所述沟通渠道的类型,c
i
的取值为1,ch为所述多个沟通渠道的类型的数量,n为所述多个沟通渠道的数量,f
i
为所述沟通频率,p
i
为所述转化率。9.根据权利要求8所述的方法,其特征在于,依据所述评价信息确定第五评估结果包括:确定所述评价信息中每个所述沟通渠道下的正向评价次数和负向评价次数;通过下述公式确定所述第五评估结果:其中,sa为每个所述待测客户的第五评估结果,gev
i
为第i个渠道下的正向评价次数,ε为投诉权重,ts
i
为第i个渠道下的负向评价次数,ev
i
为第i个渠道下的总评价次数,n为所述多个沟通渠道的数量。10.根据权利要求1所述的方法,其特征在于,通过所述第一评估结果、所述第二评估结果、所述第三评估结果、所述第四评估结果以及所述第五评估结果中的至少一个确定所述待测客户与所述目标交易方进行交易后的流失情况包括:将所述待测客户的所述第一评估结果、所述第二评估结果、所述第三评估结果、所述第四评估结果和所述第五评估结果分别进行数据归一化处理,得到归一化后的第一评估结果、归一化后的第二评估结果、归一化后的第三评估结果、归一化后的第四评估结果和归一化后的第五评估结果,其中,所述数据归一化处理用于将不同数值区间的值统一到同一数值区间;确定所述第一评估结果的第一评估权重、所述第二评估结果的第二评估权重、所述第三评估结果的第三评估权重、所述第四评估结果的第四评估权重和所述第五评估结果的第五评估权重;通过下述公式计算所述待测客户的预测结果:l=-μ1·
m-μ2·
av
a

+μ3·
lo+μ4·
at+μ5·
sa;其中,其中,l为所述待测客户的预测结果,μ1为所述归一化后的第一评估权重,m为所述归一化后的第一评估结果,μ2为所述归一化后的第二评估权重,av
a

为所述第二评估结果,μ3为所述第三评估权重,lo为所述第三评估结果,μ4为所述第四评估权重,at为所述第四评估结果,μ5为所述第五评估权重,sa为所述第五评估结果;在所述预测结果大于等于预设分值的情况下,确定所述待测客户流失,在所述预测结果小于所述预设分值的情况下,确定所述待测客户未流失。11.一种客户流失预测装置,其特征在于,包括:
第一获取单元,用于确定待测客户,并获取所述待测客户的目标特征,其中,所述待测客户是与目标交易方进行交易的客户;输入单元,用于将所述目标特征输入目标模型,得到第一评估结果,其中,所述目标模型由多个样本客户的目标特征训练得到,多个样本客户中包含与所述目标交易方进行交易后得到的未流失样本客户和已流失样本客户;第二获取单元,用于从所述目标特征中获取多个客户属性特征,获取所述待测客户在与所述目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,并依据所述多个客户属性特征确定第二评估结果,依据所述交易信息确定第三评估结果,依据所述沟通信息确定第四评估结果,依据所述评价信息确定第五评估结果;确定单元,用于通过所述第一评估结果、所述第二评估结果、所述第三评估结果、所述第四评估结果以及所述第五评估结果中的至少一个确定所述待测客户与所述目标交易方进行交易后的流失情况。12.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至10中任意一项所述的客户流失预测方法。13.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至10中任意一项所述的客户流失预测方法。

技术总结


本申请公开了一种客户流失预测方法、装置、处理器及电子设备。涉及人工智能领域,该方法包括:获取待测客户的目标特征;将目标特征输入目标模型,得到第一评估结果;获取待测客户在与目标交易方进行交易过程中产生的交易信息、进行交易前的沟通信息、以及进行交易后的评价信息,依据多个客户属性特征确定第二评估结果;依据交易信息确定第三评估结果,依据沟通信息确定第四评估结果,并依据评价信息确定第五评估结果;通过第一评估结果、第二评估结果、第三评估结果、第四评估结果以及第五评估结果中的至少一个确定待测客户的流失情况。通过本申请,解决了相关技术中由于预测客户流失的参考维度较少,导致预测客户流失结果不准确的问题。确的问题。确的问题。


技术研发人员:

胡瑾瑜 李祯 刘铁

受保护的技术使用者:

中国工商银行股份有限公司

技术研发日:

2022.09.15

技术公布日:

2022/12/19

本文发布于:2024-09-24 13:14:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/44053.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:客户   评估结果   特征   多个
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议