一种客户信贷申请数据处理方法及装置

著录项
  • CN202210747376.3
  • 20220629
  • CN115099947A
  • 20220923
  • 中国工商银行股份有限公司
  • 杨丝与;何艳;谢玥;张雪吟
  • G06Q40/02
  • G06Q40/02

  • 北京市西城区复兴门内大街55号
  • 北京(11)
  • 北京三友知识产权代理有限公司
  • 董骁毅;赵秀峰
摘要
本发明可用于大数据技术在金融方面应用的技术领域,本发明提供了一种客户信贷申请数据处理方法及装置,客户信贷申请数据处理方法包括:接收目标客户的信贷申请;确定所述目标客户所对应的最优特征信息序列;所述最优特征信息序列是基于历史客户的信贷数据生成的;根据所述最优特征信息序列审批所述目标客户的信贷申请。本发明提供一个灵活且成本较低的方法,可以对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。
权利要求

1.一种客户信贷申请数据处理方法,其特征在于,包括:

接收目标客户的信贷申请数据;

确定所述目标客户所对应的最优特征信息序列的数值;所述最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;

根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据。

2.如权利要求1所述的客户信贷申请数据处理方法,其特征在于,生成所述最优特征信息序列的方法包括以下步骤:

提取所述历史客户的特征信息;

计算所述特征信息的信息值;

根据所述信息值对所述特征信息进行筛选;

对筛选后的多个特征信息进行组合,以生成多个特征信息序列;

计算所述多个特征信息序列的KS值,以确定所述最优特征信息序列。

3.如权利要求2所述的客户信贷申请数据处理方法,其特征在于,所述计算所述多个特征信息序列的KS值包括:

对多个特征信息序列进行分箱;

计算每个分箱区间的所述历史客户的违约数据;

根据所述违约数据生成所述多个特征信息序列的KS曲线;

根据所述KS曲线计算所述多个特征信息序列的KS值。

4.如权利要求2所述的客户信贷申请数据处理方法,其特征在于,所述提取所述历史客户的特征信息包括:

根据所述历史客户的违约数据提取所述历史客户的特征信息。

5.如权利要求1所述的客户信贷申请数据处理方法,其特征在于,所述根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据,包括:

根据所述数值对应的历史客户的信贷数据确定所述最优特征信息序列所对应的历史客户的违约数据;

根据所述违约数据处理所述目标客户的信贷申请数据。

6.如权利要求1所述的客户信贷申请数据处理方法,其特征在于,还包括:

周期性的确定所述最优特征信息序列的PSI值;

根据所述PSI值更新所述最优特征信息序列。

7.一种客户信贷申请数据处理装置,其特征在于,包括:

信贷申请接收模块,用于接收目标客户的信贷申请数据;

最优序列确定模块,用于确定所述目标客户所对应的最优特征信息序列的数值;所述最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;

信贷申请审批模块,用于根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据。

8.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6任一项所述客户信贷申请数据处理方法的步骤。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述客户信贷申请数据处理方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述客户信贷申请数据处理方法的步骤。

说明书
技术领域

本申请属于大数据技术领域,具体涉及一种客户信贷申请数据处理方法及装置。

随着信贷金融业务的飞速发展,信贷申请数量呈几何数量增长,但于此带来的是信贷业务的审批不良率较高。在审批的流程中,相关审批程序主要依赖于建立黑名单以及相应的业务规则进行判断。若信贷申请客户命中相关黑名单以及不符合相关规则,则客户信贷申请将会被拒绝。此方法有以下技术缺点,黑名单构建较为费时费力且一定程度上依赖于外部数据以及数据共享,成本较高;通过规则进行客户筛选,则较为依赖对规则的配置,其配置修改较为固化,灵活程度不够高。

本发明可用于大数据技术在金融方面应用的技术领域,也可用于除金融领域之外的任意领域,本发明可以提供一个灵活且成本较低的方法对信贷客户风险进行一个全面、灵活且可解释的评估,该方法将使用大量历史数据以及一定的统计方法建立一个可解释的评价矩阵以避免打分标准不统一且无法反应以往的客观事实的问题。

为解决本申请背景技术中的技术问题,本发明提供以下技术方案:

第一方面,本发明提供一种客户信贷申请数据处理方法包括:

接收目标客户的信贷申请数据;

确定所述目标客户所对应的最优特征信息序列的数值;所述最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;

根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据。

一实施例中,生成所述最优特征信息序列的方法包括以下步骤:

提取所述历史客户的特征信息;

计算所述特征信息的信息值;

根据所述信息值对所述特征信息进行筛选;

对筛选后的多个特征信息进行组合,以生成多个特征信息序列;

计算所述多个特征信息序列的KS值,以确定所述最优特征信息序列。

一实施例中,所述计算所述多个特征信息序列的KS值包括:

对多个特征信息序列进行分箱;

计算每个分箱区间的所述历史客户的违约数据;

根据所述违约数据生成所述多个特征信息序列的KS曲线;

根据所述KS曲线计算所述多个特征信息序列的KS值。

一实施例中,所述提取所述历史客户的特征信息包括:

根据所述历史客户的违约数据提取所述历史客户的特征信息。

一实施例中,所述根据所述最优特征信息序列审批所述目标客户的信贷申请,包括:

根据所述数值对应的历史客户的信贷数据确定所述最优特征信息序列所对应的历史客户的违约数据;

根据所述违约数据处理所述目标客户的信贷申请数据。

一实施例中,客户信贷申请数据处理方法还包括:

周期性的确定所述最优特征信息序列的PSI值;

根据所述PSI值更新所述最优特征信息序列。

第二方面,本发明提供一种客户信贷申请数据处理装置,该装置包括:

信贷申请接收模块,用于接收目标客户的信贷申请数据;

最优序列确定模块,用于确定所述目标客户所对应的最优特征信息序列的数值;所述最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;

信贷申请审批模块,用于根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据。

一实施例中,客户信贷申请数据处理装置还包括:最优序列生成模块,用于生成所述最优特征信息序列,所述最优序列生成模块包括:

特征信息提取单元,用于提取所述历史客户的特征信息;

信息值计算单元,用于计算所述特征信息的信息值;

特征信息筛选单元,用于根据所述信息值对所述特征信息进行筛选;

特征序列生成单元,用于对筛选后的多个特征信息进行组合,以生成多个特征信息序列;

最优序列生成单元,用于计算所述多个特征信息序列的KS值,以确定所述最优特征信息序列。

一实施例中,最优序列生成单元包括:

序列分箱单元,用于对多个特征信息序列进行分箱;

违约数据计算单元,用于计算每个分箱区间的所述历史客户的违约数据;

KS曲线生成单元,用于根据所述违约数据生成所述多个特征信息序列的KS曲线;

KS值计算单元,用于根据所述KS曲线计算所述多个特征信息序列的KS值。

一实施例中,特征信息提取单元包括:

特征信息提取子单元,用于根据所述历史客户的违约数据提取所述历史客户的特征信息。

一实施例中,信贷申请审批模块包括:

违约数据确定单元,用于根据所述数值对应的历史客户的信贷数据确定所述最优特征信息序列所对应的历史客户的违约数据;

信贷申请审批单元,用于根据所述违约数据处理所述目标客户的信贷申请数据。

一实施例中,客户信贷申请数据处理装置还包括:

PSI值确定模块,用于周期性的确定所述最优特征信息序列的PSI值;

最优序列更新模块,用于根据所述PSI值更新所述最优特征信息序列。

第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现客户信贷申请数据处理方法的步骤。

第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现客户信贷申请数据处理方法的步骤。

从上述描述可知,本发明实施例提供一种客户信贷申请数据处理方法及装置,对应的方法包括:首先接收目标客户的信贷申请数据;接着,确定目标客户所对应的最优特征信息序列的数值;最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;最后根据数值、数值对应的历史客户的信贷数据处理信贷申请数据。本发明提供一个灵活且成本较低的方法,可以对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的实施例中客户信贷申请数据处理方法的流程示意图一;

图2为本发明的实施例中客户信贷申请数据处理方法的流程示意图二;

图3为本发明的实施例中步骤400的流程示意图;

图4为本发明的实施例中步骤405的流程示意图;

图5为本发明的实施例中步骤401的流程示意图;

图6为本发明的实施例中步骤300的流程示意图;

图7为本发明的实施例中客户信贷申请数据处理方法的流程示意图二;

图8为本发明的具体实施方式中客户信贷申请数据处理方法的流程示意图;

图9为本发明的具体实施方式中客户信贷申请数据处理方法的思维导图;

图10为本发明的实施例中客户信贷申请数据处理装置的方块图一;

图11为本发明的实施例中客户信贷申请数据处理装置的方块图二;

图12为本发明的实施例中最优序列生成模块40的方块图;

图13为本发明的实施例中最优序列生成单元405的方块图;

图14为本发明的实施例中特征信息提取单元401的方块图;

图15为本发明的实施例中信贷申请审批模块30的方块图;

图16为本发明的实施例中客户信贷申请数据处理装置的方块图三;

图17为本发明的实施例中的电子设备的结构示意图。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。

基于上述的现有技术中的技术痛点,本发明的实施例提供一种客户信贷申请数据处理方法的具体实施方式,参见图1,该方法具体包括如下内容:

步骤100:接收目标客户的信贷申请数据;

信贷,即信用贷款,是指以借款人的信誉发放的贷款,借款人不需要提供担保。其特征就是债务人无需提供抵押品或第三方担保仅凭自己的信誉就能取得贷款,并以借款人信用程度作为还款保证。这种信用贷款是银行长期以来的主要放款方式。但不难想到的是,与此带来的是较多的违约的情况,虽说可以通过法律途径来解决违约问题,但给借贷方也带来了不必要的麻烦。优选地,信贷申请包括:信用卡申请以及信用贷款等。

步骤200:确定所述目标客户所对应的最优特征信息序列的数值;所述最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;

需要说明的是,历史客户的信贷数据包括该用户是否违约,即所谓的“好客户”或者“坏客户”,以及年龄、职业、性别等等。

步骤200在实施时具体为:首先确定目标客户的多个特征信息,并且按照最优特征信息序列的格式进行组合,以确定目标客户的最优特征信息序列(可以理解的是,多个特征信息的组合排列方式多种多样,需要从中优选出最优表征客户违约性质的序列)。

步骤300:根据所述数值、所述数值对应的历史客户的信贷数据处理所述信贷申请数据。

在步骤200的基础上,基于历史客户数据,根据目标客户的最优特征信息序列映射出目标客户是“好客户”还是“坏客户”。

从上述描述可知,本发明实施例提供一种客户信贷申请数据处理方法,包括:首先接收目标客户的信贷申请数据;接着,确定目标客户所对应的最优特征信息序列的数值;最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;最后根据数值、数值对应的历史客户的信贷数据处理信贷申请数据。本发明提供一个灵活且成本较低的方法对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。

一实施例中,参见图2,客户信贷申请数据处理方法还包括:

步骤400:生成所述最优特征信息序列。进一步地,参见图3,步骤400包括:

步骤401:提取所述历史客户的特征信息;

具体地,通过抽取历史样本,从各张客户信息的数据表中抽取客户特征信息X=(X1,X1,…,Xt)、以及根据一年后是否违约打好黑白样本标签并对数据进行清洗,去除空值太多的数据,形成数据集备用。

该部分可使用SQL抽取数据:

SELECT客户ID,

特征1,特征2,...,特征t,

客户账户透支期限段信息,

CASE WHEN账户违约THEN 0,

ELSE 1END AS黑白标签

FROM存储相关数据的表

WHERE条件

步骤402:计算所述特征信息的信息值;

观察数据集Xfiltered=(X1,X1,…,Xs)的特征相对于黑白标签的分布,并对每个特征计算信息值的计算则如式(1)所示

其中RG为该特征属性信用度好的客户百分比,RB为该特征属性信用度差的客户百分比。

步骤403:根据所述信息值对所述特征信息进行筛选;

通过将计算得到的IV乘以1000,即Power=1000·IV,可以获得该指标的评价标准Power。一般地,当power大于200,可认为该指标与客户好坏具有区分度,否则将其进行删除。

步骤404:对筛选后的多个特征信息进行组合,以生成多个特征信息序列;

步骤405:计算所述多个特征信息序列的KS值,以确定所述最优特征信息序列。

在步骤404以及步骤405中,获得一定量的特征信息之后,可以应用评分卡对客户特征信息进行打分。具体地,获取100万个已有好坏标签的客户以及其相关特征,选择不同的特征组装不同的评分维度,并比照评分卡进行打分并加总,从而获得客户评分。比较不同特征组装下,用户好坏的区分度,并选择区分度最大的特征组合。

一实施例中,参见图4,步骤405具体包括:

步骤4051:对多个特征信息序列进行分箱;

步骤4052:计算每个分箱区间的所述历史客户的违约数据;

步骤4053:根据所述违约数据生成所述多个特征信息序列的KS曲线;

步骤4054:根据所述KS曲线计算所述多个特征信息序列的KS值。

在步骤4051至步骤4054中,KS统计量是基于经验分布函数建立的,定义为:

ks=max{|cum(bad_rate)-cum(good_rate)|} (2)

接着,采用等距的办法对变量进行分箱,计算每个分箱区间的好坏标签客户数。计算每个分箱区间的累计好客户数占总好客户数比率(cum_good_rate)和累计坏客户数占总坏账户数比率(cum_bad_rate),计算每个分箱区间累计坏客户占比与累计好客户占比差的绝对值,得到KS曲线,即ks=|cum_goodrate-cum_badrate|;在这些绝对值中取最大值,得到最终变量的KS值。

一实施例中,参见图5,步骤401包括:

步骤4011:根据所述历史客户的违约数据提取所述历史客户的特征信息。

具体地,根据特定的历史客户的违约情况提取其特征信息,并建立两者之间的映射关系。

一实施例中,参见图6,步骤300包括:

步骤301:根据所述数值对应的历史客户的信贷数据确定所述最优特征信息序列所对应的历史客户的违约数据;

步骤302:根据所述违约数据处理所述目标客户的信贷申请数据。

在步骤301以及步骤302中,当最优特征信息序列所对应的历史客户的违约数据为未违约时,批准目标客户的信贷申请,否则,当最优特征信息序列所对应的历史客户的违约数据为违约时,拒绝目标客户的信贷申请。

一实施例中,参见图7,客户信贷申请数据处理方法还包括:

步骤500:周期性的确定所述最优特征信息序列的PSI值;

步骤600:根据所述PSI值更新所述最优特征信息序列。

在步骤500以及步骤600中,一段时间之后,因为模型的监控将会使样本数据发生变化,此时需要重新评估数据和之前建模相比是否稳定,本发明选择PSI(式3)对当前好坏占比与历史好坏占比进行评估,若PSI高于0.25则表示数据分布变化。若数据变化,模型的监控效力将减弱,此时需要重新计算KS值,获得新的评分卡以及评分组合。

其中ai表示当前的数据好坏分布,ei表示当时训练模型时的数据好坏分布。

从上述描述可知,本发明实施例提供一种客户信贷申请数据处理方法,包括:首先接收目标客户的信贷申请数据;接着,确定目标客户所对应的最优特征信息序列的数值;最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;最后根据数值、数值对应的历史客户的信贷数据处理信贷申请数据。本发明提供一个灵活且成本较低的方法对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。

在一种具体实施方式中,本发明还以申请信用卡为例,提供一种客户信贷申请数据处理方法的具体实施方式,参见图8以及图9,具体包括以下内容。

S1:准备数据集。

具体地,进行历史数据抽样、客户特征选取、黑白样本打标。

S2:对特征信息下的各类属性进行分组。

首先处理数值型特征信息,具体地,将数值型特征划分为不同的区间段待用。如年龄,可以划分为20岁以下,20-25岁,25-50岁,50-65岁,65岁以上。

接着处理类别型特征信息,若类别型特征下的属性较少,可保持原样不合并,如性别特征下仅为男、女或未知。若类别型特征下的属性比较多,可以将不同特征进行组合,如职业,可以将具体的职业归类为八大类。

S3:计算特征信息的信息值。

S4:特征信息打分。

首先估算特征信息权重,在特征打分中,比较常用的方法是信息权重打分方法。目前,通过信息权重进行打分一般可获得具有一定意义及区分度的打分。以区分客户好坏为目标计算,具体的计算方法可以写为式(4)。

其中αi为特征或指标i的评分,gij代表特征i内不同属性分组j的信誉度优良的客户,Gi代表指标i下优良客户的总和,bij代表指标内i不同分组j的信誉度差的客户,Bi代表指标i下信誉度差的客户。

接着,对特征信息进行缩放,由于采用信息权重计算评分,其中如果对大于0小于1的数字取对数会得到负值,且对数之后的数字较小因此需要进行一定程度的线性缩放以获得不同指标的积分。

αi=f(αi) (5)

其中,αi为特征或指标通过式(1.2)得到的评分,f(·)为线性缩放。缩放的总体原则如下:

(1)尽量保证总分为正;

(2)对于每一项指标的各组分类的积分不为负数;

(3)数值要具有一定的意义,如30分可以代表一个客户在这个指标表现是好是坏;

(4)数值具有一定的区分度。

基于这样的总体原则,可以选择对同一指标下的不同分组都进行补正,即统一加上一个分数让组内没有负值。

比如,当对年龄这一指标进行信息权重计算后,发现20岁以下的信息权重为-2.48,20-25岁的信息权重为1,25-35岁为3,35-50岁3.5,50-65岁2.5,65岁以上为2。这一情况,可以让这个指标的组内分组分数不为负数,整体都加2.48,获得新的评分为20岁以下的信息权重为0分,20-25岁的信息权重为3.48分,25-35岁为5.48分,35-50岁为5,98分,50-65岁以上为4.98分,65岁以上为4.48。之后可以进一步进行倍数缩放,这里将所有指标乘以10并取整,20岁以下的信息权重为0分,20-25岁的信息权重为35分,25-35岁为55分,35-50岁为60分,50-65岁以上为50分,65岁以上为45。这样就完成了对年龄的打分,获得了年龄的评分卡如表1所示:

表1信用评分卡样例

年龄 <20 20-25 25-35 35-50 50-65 65岁以上 评分 0 35 55 60 50 45

S5:灵活组装不同特征打分组合并进行评估筛选。

获得一定量的特征之后,可以应用评分卡对客户进行打分。获取100万个已有好坏标签的客户以及其相关特征,选择不同的特征组装不同的评分维度,并比照评分卡进行打分并加总,从而获得客户评分。比较不同特征组装下,用户好坏的区分度,并选择区分度最大的特征组合。具体地参见如下步骤。

1.KS统计量是基于经验分布函数建立的,定义为

ks=max{|cum(bad_rate)-cum(good_rate)|}。采用等距的办法对变量进行分箱,计算每个分箱区间的好坏标签客户数。

2.计算每个分箱区间的累计好客户数占总好客户数比率(cum_good_rate)和累计坏客户数占总坏账户数比率(cum_bad_rate)

3.计算每个分箱区间累计坏客户占比与累计好客户占比差的绝对值,得到KS曲线,即ks=|cum_goodrate-cum_badrate|

4.在这些绝对值中取最大值,得到最终变量的KS值。

KS值越大,表明好坏客户区分程度越好,一般KS值大于0.4则表明有良好区分好坏客户的能力,大于0.75则说明好坏客户区分能力较强但存在过拟合风险。最后选择区分能力最大的特征组合以及记录下该特征组合的分数阈值。

S6:模型监控及重评。

一段时间之后,因为模型的监控将会使样本数据发生变化,此时需要重新评估数据和之前建模相比是否稳定,选择PSI(式3)对当前好坏占比与历史好坏占比进行评估,若PSI高于0.25则表示数据分布变化。若数据变化,模型的监控效力将减弱,此时需要重新启动流程一到流程五,获得新的评分卡以及评分组合。

从上述描述可知,本发明实施例提供一种客户信贷申请数据处理方法,包括:首先接收目标客户的信贷申请数据;接着,确定目标客户所对应的最优特征信息序列的数值;最优特征信息序列是基于历史客户的特征信息以及信贷数据生成的;最后根据数值、数值对应的历史客户的信贷数据处理信贷申请数据。本发明提供一个灵活且成本较低的方法对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。

基于同一发明构思,本申请实施例还提供了一种客户信贷申请数据处理装置,可以用于实现上述实施例所描述的方法,如下面的实施例。由于客户信贷申请数据处理装置解决问题的原理与客户信贷申请数据处理方法相似,因此客户信贷申请数据处理装置的实施可以参见客户信贷申请数据处理方法实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

本发明的实施例提供一种能够实现客户信贷申请数据处理方法的客户信贷申请数据处理装置的具体实施方式,参见图10,客户信贷申请数据处理装置具体包括如下内容:

信贷申请接收模块10,用于接收目标客户的信贷申请;

最优序列确定模块20,用于确定所述目标客户所对应的最优特征信息序列;所述最优特征信息序列是基于历史客户的信贷数据生成的;

信贷申请审批模块30,用于根据所述最优特征信息序列审批所述目标客户的信贷申请。

一实施例中,参见图11,客户信贷申请数据处理装置还包括:最优序列生成模块40,用于生成所述最优特征信息序列,参见图12,所述最优序列生成模块40包括:

特征信息提取单元401,用于提取所述历史客户的特征信息;

信息值计算单元402,用于计算所述特征信息的信息值;

特征信息筛选单元403,用于根据所述信息值对所述特征信息进行筛选;

特征序列生成单元404,用于对筛选后的多个特征信息进行组合,以生成多个特征信息序列;

最优序列生成单元405,用于计算所述多个特征信息序列的KS值,以确定所述最优特征信息序列。

一实施例中,参见图13,最优序列生成单元405包括:

序列分箱单元4051,用于对多个特征信息序列进行分箱;

违约数据计算单元4052,用于计算每个分箱区间的所述历史客户的违约数据;

KS曲线生成单元4053,用于根据所述违约数据生成所述多个特征信息序列的KS曲线;

KS值计算单元4054,用于根据所述KS曲线计算所述多个特征信息序列的KS值。

一实施例中,参见图14,特征信息提取单元401包括:

特征信息提取子单元4011,用于根据所述历史客户的违约数据提取所述历史客户的特征信息。

一实施例中,参见图15,信贷申请审批模块30包括:

违约数据确定单元301,用于根据所述数值对应的历史客户的信贷数据确定所述最优特征信息序列所对应的历史客户的违约数据;

信贷申请审批单元302,用于根据所述违约数据处理所述目标客户的信贷申请数据。

一实施例中,参见图16,客户信贷申请数据处理装置还包括:

PSI值确定模块50,用于周期性的确定所述最优特征信息序列的PSI值;

最优序列更新模块60,用于根据所述PSI值更新所述最优特征信息序列。

从上述描述可知,本发明实施例提供一种客户信贷申请数据处理装置,包括:首先接收目标客户的信贷申请;接着,确定目标客户所对应的最优特征信息序列;最优特征信息序列是基于历史客户的信贷数据生成的;最后,根据最优特征信息序列审批目标客户的信贷申请。本发明提供一个灵活且成本较低的方法对信贷客户风险进行一个全面、灵活且可解释的评估,本发明将使用大量历史数据以及改进的统计方法建立一个可解释的评价矩阵,以避免打分标准不统一且无法反应以往的客观事实的问题。

本申请的实施例还提供能够实现上述实施例中的客户信贷申请数据处理方法中全部步骤的一种电子设备的具体实施方式,参见图17,电子设备具体包括如下内容:

处理器(processor)1201、存储器(memory)1202、通信接口(CommunicationsInterface)1203和总线1204;

其中,处理器1201、存储器1202、通信接口1203通过总线1204完成相互间的通信;通信接口1203用于实现服务器端设备以及客户端设备等相关设备之间的信息传输;

处理器1201用于调用存储器1202中的计算机程序,处理器执行计算机程序时实现上述实施例中的客户信贷申请数据处理方法中的全部步骤,例如,处理器执行计算机程序时实现下述步骤:

步骤100:接收目标客户的信贷申请;

步骤200:确定所述目标客户所对应的最优特征信息序列;所述最优特征信息序列是基于历史客户的信贷数据生成的;

步骤300:根据所述最优特征信息序列审批所述目标客户的信贷申请。

本申请的实施例还提供能够实现上述实施例中的客户信贷申请数据处理方法中全部步骤的一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的客户信贷申请数据处理方法的全部步骤,例如,处理器执行计算机程序时实现下述步骤:

步骤100:接收目标客户的信贷申请;

步骤200:确定所述目标客户所对应的最优特征信息序列;所述最优特征信息序列是基于历史客户的信贷数据生成的;

步骤300:根据所述最优特征信息序列审批所述目标客户的信贷申请。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

虽然本申请提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

本文发布于:2024-09-25 02:30:03,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/85681.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议