异常申请识别方法及设备

著录项
  • CN202111609530.2
  • 20211227
  • CN114282988A
  • 20220405
  • 深圳前海微众银行股份有限公司
  • 蔡远航;郑少杰;范增虎
  • G06Q40/02
  • G06Q40/02 G06Q40/04 G06Q10/06 G06N3/04 G06N3/08

  • 广东省深圳市前海深港合作区前湾一路1号A栋201室
  • 广东(44)
  • 北京同立钧成知识产权代理有限公司
  • 屈蓓;黄健
摘要
本申请提供一种异常申请识别方法及设备。该方法包括:获取至少一个借款方的申请地址信息,包括:对应不同行政区域的贷款方地址和借款方地址;根据贷款方地址和借款方地址对至少一个借款方进行聚类,得到至少一个借款方;根据该借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取该借款方对应的异地贷款概率,该预设转移矩阵用于指示不同行政区域之间的异地贷款概率;根据借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。本申请可以在地址聚类的基础上结合不同行政区域之间的异常贷款概率识别异常贷款的目标借款方。不需要人为进行处理和不同渠道的数据,降低了识别成本,提高了识别准确度。
权利要求

1.一种异常申请识别方法,其特征在于,所述方法包括:

通过深度学习模型获取至少一个借款方的申请地址信息,所述申请地址信息中包括:贷款方地址和借款方地址,所述贷款方地址对应的行政区域和所述借款方地址对应的行政区域不同;

根据所述贷款方地址和所述借款方地址对所述至少一个借款方进行聚类,得到至少一个借款方;

针对每个所述借款方,根据所述借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取所述借款方对应的异地贷款概率,所述预设转移矩阵用于指示不同行政区域之间的异地贷款概率;

根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

2.根据权利要求1所述的方法,其特征在于,所述根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方,包括:

根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,所述异常贷款数据包括以下至少一项:所述借款方中各借款方已逾期的贷款总金额、所述借款方中各借款方的贷款逾期总天数。

3.根据权利要求2所述的方法,其特征在于,所述根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,包括:

确定所述借款方中已出现的异常贷款数据与所述借款方的异地贷款概率的比值;

根据所述比值从至少一个借款方中确定存在异常申请的目标借款方。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述不同行政区域之间的异地贷款概率是通过以下步骤生成的:

对借款方地址对应的第一行政区域和贷款方地址对应的第二行政区域之间的至少一种关联属性进行加权运算得到所述异地贷款概率,所述至少一种关联属性包括以下至少一项:所述第一行政区域与所述第二行政区域之间的距离、所述第二行政区域的生产总值和所述第一行政区域的生产总值之间的比值、借款方地址属于所述第一行政区域且贷款方地址属于所述第二行政区域的未逾期贷款在异地贷款中的占比。

5.根据权利要求1至3任一项所述的方法,其特征在于,所述借款方地址中包括至少一个层级的行政区域,所述通过深度学习模型获取至少一个借款方的申请地址信息,包括:

将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域,所述深度学习模型是通过预设训练样本训练得到的,所述训练样本包括以下至少一项:样本地址文本,所述样本地址文本中的每个字符对应有所述字符的样本类型,所述样本类型为以下一项:一个层级的行政区域的开始字符、一个层级的行政区域的结束字符、其余字符。

6.根据权利要求5所述的方法,其特征在于,所述深度学习模型包括:输入层、双向LSTM层、CRF层,在训练过程中,所述输入层用于接收所述样本地址文本,所述双向LSTM层用于对所述样本地址文本进行处理得到向量,所述CRF层用于根据所述向量预测所述样本地址文本中每个字符的预测类型,所述样本类型和所述预测类型用于确定损失值,在所述损失值满足收敛条件时,结束训练,在所述损失值不满足收敛条件时,根据所述损失值对所述深度学习模型的参数进行调整,以进行以下一轮训练。

7.根据权利要求5所述的方法,其特征在于,所述将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域之后,还包括:

若所述至少一个层级的行政区域中缺失部分层级的行政区域,则根据预设行政区域树确定缺失的行政区域,所述预设行政区域树用于表示行政区域之间的层级关系;和/或,

若所述至少一个层级的行政区域中缺失部分层级的行政区域,则将所述借款方地址文本输入至第三方接口,得到缺失的行政区域。

8.一种异常申请识别装置,其特征在于,包括:

申请地址信息获取模块,用于通过深度学习模型获取至少一个借款方的申请地址信息,所述申请地址信息中包括:贷款方地址和借款方地址,所述贷款方地址对应的行政区域和所述借款方地址对应的行政区域不同;

地址聚类模块,用于根据所述贷款方地址和所述借款方地址对所述至少一个借款方进行聚类,得到至少一个借款方;

异地贷款概率获取模块,用于针对每个所述借款方,根据所述借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取所述借款方对应的异地贷款概率,所述预设转移矩阵用于指示不同行政区域之间的异地贷款概率;

异常识别模块,用于根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述电子设备实现如权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,使计算设备实现如权利要求1至7任一项所述的方法。

说明书
技术领域

本申请实施例涉及金融科技技术领域,尤其涉及一种异常申请识别方法及设备。

随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Finteh)转变,贷款的异常申请识别技术也不例外,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。在金融科技(Fintech)技术领域中,申请贷款是很常见的场景。申请贷款之后需要按时还款,如果不按时还款,那么会给贷款方造成经济损失。为了避免给贷款方带来经济损失,需要识别贷款申请中哪些是异常申请。

现有技术中,识别异常申请的方式有两种。图1是现有技术提供的一种异常申请识别过程示意图。参照图1所示,首先,将多个贷款申请信息输入到聚类算法中进行聚类,得到一个或多个贷款方;然后,分析人员利用经验知识对贷款方进行分析,以确定哪些贷款方是存在异常申请的贷款方。其中,贷款申请信息中可以包括:基础信息、登录信息、关联信息和贷款信息。基本信息包括:借款方的年龄、借款方的收入。登录信息可以包括:登录所使用设备的型号和登录所使用设备的网络(IP,Internet protocol)地址。关联信息可以包括:联系人信息和家庭成员信息。贷款信息可以包括:贷款金额和消费地址。

现有技术中识别异常申请的第二种方式是通过关联图谱实现的。具体地,首先,从各个渠道获取大量借款方的基本信息、贷款交易信息;然后,分析贷款方身份、收入、偏好等信息,对贷款方打一个标签;再然后,建立大量的标签与贷款交易信息之间的对应关系形成关联图谱;最后,根据该关联图谱识别异常申请。

然而,上述第一种方式需要分析人员进行分析,并且聚类过程中各个维度的权重也需要人为确定,导致异常申请的识别成本较高。上述第二种方法需要大量不同渠道的数据作为支撑。但是实际应用中很难拿到多渠道的数据,导致得到的关系图谱不够全面,降低了异常申请识别准确度。

本申请提供一种异常申请识别方法及设备,以降低异常贷款的识别成本,提高识别准确度。

第一方面,本申请提供一种异常申请识别方法,所述方法包括:

通过深度学习模型获取至少一个借款方的申请地址信息,所述申请地址信息中包括:贷款方地址和借款方地址,所述贷款方地址对应的行政区域和所述借款方地址对应的行政区域不同;

根据所述贷款方地址和所述借款方地址对所述至少一个借款方进行聚类,得到至少一个借款方;

针对每个所述借款方,根据所述借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取所述借款方对应的异地贷款概率,所述预设转移矩阵用于指示不同行政区域之间的异地贷款概率;

根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方,包括:

根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,所述异常贷款数据包括以下至少一项:所述借款方中各借款方已逾期的贷款总金额、所述借款方中各借款方的贷款逾期总天数。

可选地,所述根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,包括:

确定所述借款方中已出现的异常贷款数据与所述借款方的异地贷款概率的比值;

根据所述比值从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述不同行政区域之间的异地贷款概率是通过以下步骤生成的:

对借款方地址对应的第一行政区域和贷款方地址对应的第二行政区域之间的至少一种关联属性进行加权运算得到所述异地贷款概率,所述至少一种关联属性包括以下至少一项:所述第一行政区域与所述第二行政区域之间的距离、所述第二行政区域的生产总值和所述第一行政区域的生产总值之间的比值、借款方地址属于所述第一行政区域且贷款方地址属于所述第二行政区域的未逾期贷款在异地贷款中的占比。

可选地,所述借款方地址中包括至少一个层级的行政区域,所述通过深度学习模型获取至少一个借款方的申请地址信息,包括:

将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域,所述深度学习模型是通过预设训练样本训练得到的,所述训练样本包括以下至少一项:样本地址文本,所述样本地址文本中的每个字符对应有所述字符的样本类型,所述样本类型为以下一项:一个层级的行政区域的开始字符、一个层级的行政区域的结束字符、其余字符。

可选地,所述深度学习模型包括:输入层、双向LSTM层、CRF层,在训练过程中,所述输入层用于接收所述样本地址文本,所述双向LSTM层用于对所述样本地址文本进行处理得到向量,所述CRF层用于根据所述向量预测所述样本地址文本中每个字符的预测类型,所述样本类型和所述预测类型用于确定损失值,在所述损失值满足收敛条件时,结束训练,在所述损失值不满足收敛条件时,根据所述损失值对所述深度学习模型的参数进行调整,以进行以下一轮训练。

可选地,所述将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域之后,还包括:

若所述至少一个层级的行政区域中缺失部分层级的行政区域,则根据预设行政区域树确定缺失的行政区域,所述预设行政区域树用于表示行政区域之间的层级关系;和/或,

若所述至少一个层级的行政区域中缺失部分层级的行政区域,则将所述借款方地址文本输入至第三方接口,得到缺失的行政区域。

第二方面,本申请提供一种异常申请识别装置,包括:

申请地址信息获取模块,用于通过深度学习模型获取至少一个借款方的申请地址信息,所述申请地址信息中包括:贷款方地址和借款方地址,所述贷款方地址对应的行政区域和所述借款方地址对应的行政区域不同;

地址聚类模块,用于根据所述贷款方地址和所述借款方地址对所述至少一个借款方进行聚类,得到至少一个借款方;

异地贷款概率获取模块,用于针对每个所述借款方,根据所述借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取所述借款方对应的异地贷款概率,所述预设转移矩阵用于指示不同行政区域之间的异地贷款概率;

异常识别模块,用于根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述异常识别模块还用于:

根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,所述异常贷款数据包括以下至少一项:所述借款方中各借款方已逾期的贷款总金额、所述借款方中各借款方的贷款逾期总天数。

可选地,所述异常识别模块还用于:

在根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方时,确定所述借款方中已出现的异常贷款数据与所述借款方的异地贷款概率的比值;

根据所述比值从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述不同行政区域之间的异地贷款概率是通过以下模块生成的:

第一贷款概率生成模块,用于对借款方地址对应的第一行政区域和贷款方地址对应的第二行政区域之间的至少一种关联属性进行加权运算得到所述异地贷款概率,所述至少一种关联属性包括以下至少一项:所述第一行政区域与所述第二行政区域之间的距离、所述第二行政区域的生产总值和所述第一行政区域的生产总值之间的比值、借款方地址属于所述第一行政区域且贷款方地址属于所述第二行政区域的未逾期贷款在异地贷款中的占比。

可选地,所述借款方地址中包括至少一个层级的行政区域,所述申请地址信息获取模块还用于:

将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域,所述深度学习模型是通过预设训练样本训练得到的,所述训练样本包括以下至少一项:样本地址文本,所述样本地址文本中的每个字符对应有所述字符的样本类型,所述样本类型为以下一项:一个层级的行政区域的开始字符、一个层级的行政区域的结束字符、其余字符。

可选地,所述深度学习模型包括:输入层、双向LSTM层、CRF层,在训练过程中,所述输入层用于接收所述样本地址文本,所述双向LSTM层用于对所述样本地址文本进行处理得到向量,所述CRF层用于根据所述向量预测所述样本地址文本中每个字符的预测类型,所述样本类型和所述预测类型用于确定损失值,在所述损失值满足收敛条件时,结束训练,在所述损失值不满足收敛条件时,根据所述损失值对所述深度学习模型的参数进行调整,以进行以下一轮训练。

可选地,所述装置还包括:

行政区域补全模块,用于在将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域之后,若所述至少一个层级的行政区域中缺失部分层级的行政区域,则根据预设行政区域树确定缺失的行政区域,所述预设行政区域树用于表示行政区域之间的层级关系;和/或,

若所述至少一个层级的行政区域中缺失部分层级的行政区域,则将所述借款方地址文本输入至第三方接口,得到缺失的行政区域。

第三方面,本申请提供一种电子设备,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述电子设备实现如前述第一方面的方法。

第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,使计算设备实现如前述第一方面的方法。

第五方面,本申请提供一种计算机程序,所述计算机程序用于实现如前述第一方面的方法。

本申请提供的异常申请识别方法及设备,该方法包括:通过深度学习模型获取至少一个借款方的申请地址信息,申请地址信息中包括:贷款方地址和借款方地址,贷款方地址对应的行政区域和借款方地址对应的行政区域不同;根据上述贷款方地址和借款方地址对至少一个借款方进行聚类,得到至少一个借款方;针对每个借款方,根据该借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取该借款方对应的异地贷款概率,该预设转移矩阵用于指示不同行政区域之间的异地贷款概率;根据借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。本申请实施例可以按照贷款方地址和借款方地址对借款方进行聚类,得到至少一个借款方,然后再结合转移矩阵中不同行政区域之间的异常贷款概率识别异常贷款的目标借款方。这整个过程不需要人为进行处理,从而降低了识别成本。此外,本申请实施例仅需要贷款方地址和借款方地址即可,并不需要其余渠道的数据,从而可以避免由于无法拿到较多渠道的数据而导致识别准确度较低的问题。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是现有技术提供的一种异常申请识别过程示意图;

图2是本申请实施例提供的异常申请识别方法的具体步骤流程图;

图3是本申请实施例提供的深度学习模型的结构示意图;

图4是本申请实施例提供的异常申请识别装置的一种结构框图;

图5是本申请实施例提供的电子设备的一种结构框图。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例可以适用于贷款场景中。借款方可以向贷款方提供贷款申请,贷款申请中可以指定审核所需要的信息。贷款方对贷款申请进行审核,在审核通过之后贷款成功。

为了避免贷款带来的经济损失,需要准确的识别异常贷款。这个识别过程可以在审核过程中进行,当将贷款识别为异常贷款时,可以将审核结果确定为审核未通过。该识别过程还可以在贷款之后进行,以通知借款方尽快还款。

图2是本申请实施例提供的异常申请识别方法的具体步骤流程图。参照图2所示,该方法可以包括:

S101:通过深度学习模型获取至少一个借款方的申请地址信息,申请地址信息中包括:贷款方地址和借款方地址,贷款方地址对应的行政区域和借款方地址对应的行政区域不同。

其中,借款方地址可以包括以下至少一种:借款方的户口地址、借款方的居住地址、借款方的工作地址。

对于上述贷款方地址,其可以包括贷款方所在的行政区域。贷款方所在的行政区域可以根据借款方提交贷款申请时,所使用的贷款方的电子设备的IP(internetprotocol,因特网协议)地址确定。行政区域和IP地址之间的对应关系是预设的,一个行政区域可以对应有一个或多个IP地址。例如,借款方需要到贷款方的线下服务点,使用贷款方提供的电子设备提交贷款申请。该贷款申请可以是贷款方自己输入的,也可以是借款方的工作人员输入的。在这种情况下,可以获取该贷款方的电子设备的IP地址,在得到IP地址之后可以得到对应的行政区域。现有技术中提供有将IP地址转换为行政区域的工具,可调用该工具将IP地址转换为行政区域。

对于上述借款方地址,其通常是借款方申请贷款时输入的,借款方地址通常包括行政区域和行政区域以下的细化地址。借款方地址对应的行政区域和借款方地址对应的行政区域。上述借款方地址中的行政区域可以通过深度学习模型获取到。借款方输入一个地址文本,该地址文本中包括省、市和县(或区)、街道和小区。例如,借款方地址文本可以为“XXXX省XXXX市XXXX县XXX街道XXXX小区”。此时,可以从该地址文本中识别行政区域。

可以看出,上述行政区域是具有层级的。例如,省是第一层级,市是第二层级,县(或区)是第三层级,一个省可以包括一个或多个市,一个市可以包括一个或多个县。

本申请实施例可以通过深度学习模型从借款方地址文本中识别到至少一个层级的行政区域。

具体地,可以将借款方的借款方地址文本输入到深度学习模型中,得到至少一个层级的行政区域。该深度学习模型是通过大量的预设训练样本训练得到的,该训练样本包括以下至少一项:样本地址文本,样本地址文本中的每个字符对应有该字符的样本类型,该样本类型为以下一项:一个层级的行政区域的开始字符、一个层级的行政区域的结束字符、其余字符。

其中,样本地址文本与借款方地址文本包括的内容类似,区别在于样本地址文本中的每个字符均对应一个样本类型。例如,多个层级的行政区域包括:省、市和县时,省的开始字符和结束字符分别为“B-PROV”和“E-PROV”,市的开始字符和结束字符分别为“B-CITY”和“E-CITY”,县的开始字符和结束字符分别为“B-COUNTY”和“E-COUNTY”,其余字符为“O”。从而,一个样本地址文本可以为“X\B-PROV\X\O\省\E-PROV\X\B-CITY\X\O\市\E-CITY\X\B-COUNTY\X\O\县\E-COUNTY\X\O\X\O\街\O\道\O\X\O\X\O\X\O\X\O\小\O\区\O”。

上述深度学习模型可以是现有的任意深度学习模型,本申请实施例对其不加以限制。经过本申请实施例的多次试验得出,一种识别准确度较高的深度学习模型。图3是本申请实施例提供的深度学习模型的一种结构示意图。参照图3所示,该深度学习模型可以包括:输入层、双向LSTM(long short term memory,长短期记忆网络)层、CRF层。

其中,输入层用于接收样本地址文本,双向LSTM层用于对样本地址文本进行处理得到向量,CRF层用于根据该向量预测样本地址文本中每个字符的预测类型。

当然,在应用时,输入层用于接收借款方地址文本,双向LSTM层用于对借款方地址文本进行处理得到向量,CRF(conditional random field,条件随机场)层用于根据该向量预测借款方地址文本中每个字符的类型,从而可以根据该类型从借款方地址文本中提取到各个层级的行政区域。

上述每个字符的预测类型与样本地址文本中的标注的其中一个样本类型对应,同理,每个字符的类型与样本地址文本中的标注的其中一个样本类型对应。但是同一个字符对应的预测类型和样本类型可能相同也可能不同。

通过上述训练样本对深度学习模型进行训练的过程可以包括多轮迭代。在每一轮迭代中,可以将一组训练样本输入到深度学习模型中得到每个训练样本中每个字符的预测类型,然后,将这一组训练样本的每个字符的预测类型和每个字符的样本类型,输入到损失函数中得到损失值;最后,确定损失值是否满足收敛条件,在损失值满足收敛条件时,结束训练,在损失值不满足收敛条件时,根据损失值对深度学习模型的参数进行调整,以进行以下一轮训练。

其中,上述损失函数可以采用现有技术常用的损失函数,例如,交叉熵损失函数、绝对值损失函数,平方和损失函数。

上述损失函数满足收敛条件可以包括但不限于:损失值小于或等于预设损失值阈值、多轮迭代之后的损失值不再减小。

可以看出,在理想情况下,如果借款方输入的借款方地址文本中包括每个层级的行政区域,那么从借款方地址文本中识别得到的行政区域包括了所有层级。

但是,在实际应用中,借款方输入的借款方地址文本可能缺失部分行政区域的信息,从而从借款方地址文本中识别得到的行政区域缺失部分层级。这样,会导致根据该借款方地址进行的后续处理不准确。为了提高后续处理的准确度,需要对借款方地址的行政区域进行补全。

具体地,若至少一个层级的行政区域中缺失部分层级的行政区域,则根据预设行政区域树确定缺失的行政区域;和/或,将借款方地址文本输入至第三方接口,得到缺失的行政区域,该预设行政区域树用于表示行政区域之间的层级关系。

其中,预设行政区域树中是一个树状结构,其中包括了所有行政区域之间的层级关系。行政区域树中的节点之间构成父子关系,子节点的行政区域属于唯一一个父节点的行政区域。从而,如果至少一个层级的行政区域中存在低层级的行政区域,但缺失高层级的行政区域,那么可以根据该低层级的行政区域所对应的节点,确定父节点,从而将该父节点对应的行政区域确定为高层级的行政区域。

然而,如果上述预设区域树无法补全行政区域时,还可以调用第三方接口根据借款方地址文本中的细化地址确定缺失的行政区域。例如,可以根据“小区或街道”确定所归属的县。

S102:根据上述贷款方地址和借款方地址对至少一个借款方进行聚类,得到至少一个借款方。

具体地,首先,将贷款方地址转换为经纬度坐标,以及将借款方地址转换为经纬度坐标,然后,按照贷款方的经纬度坐标和借款方的经纬度坐标对借款方进行聚类。

可以理解的是,上述聚类可以采用现有的聚类算法,当现有的聚类算法仅能按照一个维度进行聚类时,多次调用该聚类算法进行聚类。例如,先调用聚类算法按照贷款方地址的经纬度坐标对至少一个借款方进行聚类,得到至少一个第一借款方;针对每个第一借款方,再调用聚类算法按照借款方地址的经纬度坐标对该第一借款方中的各个借款方进行聚类,得到至少一个第二借款方,各个第一借款方的各个第二借款方为S102所得到的至少一个借款方。

当上述借款方地址包括:借款方的居住地址、户口地址、工作地址时,上述调用聚类算法按照借款方地址的经纬度坐标对该第一借款方中的各个借款方进行聚类,得到至少一个第二借款方的过程,可以包括:首先,调用聚类算法按照居住地址的经纬度坐标对该第一借款方中的各个借款方进行聚类得到至少一个第一子;然后,调用聚类算法按照户口地址的经纬度坐标,对每个第一子中的各个借款方进行聚类得到至少一个第二子;最后,调用聚类算法按照工作地址的经纬度坐标,对每个第二子中的各个借款方进行聚类得到至少一个第三子。这样,每个第三子为一个第二借款方。

当然,上述贷款方地址、借款方的居住地址、户口地址、工作地址之间的聚类顺序可以灵活调整,本申请实施例对其不加以限制。

可以理解的是,经过S102的上述聚类,得到的每个借款方中的各个借款方具有相同的借款方地址(称为借款方方的借款方地址),以及具有相同的贷款方地址(称为借款方方的贷款方地址)。

S103:针对每个借款方,根据该借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取该借款方对应的异地贷款概率,该预设转移矩阵用于指示不同行政区域之间的异地贷款概率。

其中,预设转移矩阵的第m行第n列的取值可以为第m个行政区域至第n个行政区域的异地贷款概率。

可以理解的是,异地贷款概率越大,代表第m个行政区域到第n个行政区域进行贷款的可能性越高,异地贷款概率通常是两个行政区域之间的属性确定的,该属性可以包括但不限于:距离、GPD(gross domestic product,国内生产总值)差距、未逾期的贷款占比。若距离越小,GDP差距越大,未逾期的贷款占比越大,则异地贷款概率越大。从而,越小异地贷款概率的借款方越有可能存在异常贷款。

其中,距离可以是两个行政区域之间可行驶的路线长度,不是两个行政区域之间的直线距离。

具体地,上述不同行政区域之间的异地贷款概率可以通过以下步骤生成:

对借款方地址对应的第一行政区域和贷款方地址对应的第二行政区域之间的至少一种关联属性进行加权运算,得到第一行政区域到第二行政区域的异地贷款概率。该至少一种关联属性包括以下至少一项:第一行政区域与第二行政区域之间的距离、第二行政区域的生产总值和第一行政区域的生产总值之间的比值、借款方地址属于第一行政区域且贷款方地址属于第二行政区域的未逾期贷款在异地贷款中的占比。

其中,异地贷款是指借款方地址和贷款方地址属于不同行政区域的贷款申请。

上述占比可以是数量占比,也可以是贷款总额占比。

可以理解的是,上述步骤可以周期性进行,例如,一年或一月进行一次,每次使用当前周期内所有行政区域的贷款信息。

上述转移矩阵中的行政区域可以是任一层级的所有行政区域。当然,如果层级越低,行政区域的数量越多,转移矩阵越大,准确度越高。从而可以根据县或区生成转移矩阵。

在得到上述转移矩阵之后,可以从该转移矩阵中获取到任意借款方的异地贷款概率。具体地,首先,确定借款方的借款方地址所对应的行政区域作为借款方行政区域,以及确定借款方的贷款方地址所对应的行政区域作为贷款方行政区域;然后,从转移矩阵中获取行为借款方行政区域,且列为贷款方行政区域的异地贷款概率,作为该借款方的异地贷款概率。

S104:根据借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

其中,目标借款方的确定策略可以包括多个。

在第一种策略中,可以将异地贷款概率最小或较小的借款方确定为目标借款方。

在第二种策略中,结合异地贷款概率和其余信息确定目标借款方。具体地,根据借款方的异地贷款概率和借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,该异常贷款数据包括以下至少一项:借款方中各借款方已逾期的贷款总金额、借款方中各借款方的贷款逾期总天数。

其中,异地贷款概率越小、且已逾期的贷款总金额越大、且贷款逾期总天数越大的借款方为目标借款方。

在一种示例中,可以按异地贷款概率的倒数、已逾期的贷款总金额、贷款逾期总天数,对借款方进行综合降序排序。从而可以将排序靠前的借款方确定为目标借款方。

在另一种示例中,针对每个借款方,确定该借款方中已出现的异常贷款数据与该借款方的异地贷款概率的比值;然后,根据该比值从至少一个借款方中确定存在异常申请的目标借款方。

具体地,当已出现的异地贷款数据为借款方中各借款方已逾期的贷款总金额、借款方中各借款方的贷款逾期总天数时,确定该借款方中已出现的异常贷款数据与该借款方的异地贷款概率的比值,可以包括:首先,确定借款方中各借款方已逾期的贷款总金额和借款方中各借款方的贷款逾期总天数的乘积;然后,确定该乘积与该借款方的异地贷款概率的比值。

在得到上述比值之后,可以将比值较大的一个或多个借款方确定为目标借款方。

在得到目标借款方之后,可以避免这些目标借款方的贷款申请审核通过,还可以对已经审核通过的贷款申请的目标借款方进行提示,包括但不限于:电话或短信提示。

对应于上文实施例的异常申请识别方法,图4是本申请实施例提供的异常申请识别装置的一种结构框图。为了便于说明,仅示出了与本申请实施例相关的部分。参照图4,上述异常申请识别装置200包括:申请地址信息获取模块201、地址聚类模块202、异地贷款概率获取模块203和异常识别模块204。

申请地址信息获取模块201,用于通过深度学习模型获取至少一个借款方的申请地址信息,所述申请地址信息中包括:贷款方地址和借款方地址,所述贷款方地址对应的行政区域和所述借款方地址对应的行政区域不同。

地址聚类模块202,用于根据所述贷款方地址和所述借款方地址对所述至少一个借款方进行聚类,得到至少一个借款方。

异地贷款概率获取模块203,用于针对每个所述借款方,根据所述借款方对应的贷款方地址和借款方地址,从预设转移矩阵中获取所述借款方对应的异地贷款概率,所述预设转移矩阵用于指示不同行政区域之间的异地贷款概率。

异常识别模块204,用于根据所述借款方的异地贷款概率,从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述异常识别模块204还用于:

根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方,所述异常贷款数据包括以下至少一项:所述借款方中各借款方已逾期的贷款总金额、所述借款方中各借款方的贷款逾期总天数。

可选地,所述异常识别模块204还用于:

在根据所述借款方的异地贷款概率和所述借款方中已出现的异常贷款数据,从至少一个借款方中确定存在异常申请的目标借款方时,确定所述借款方中已出现的异常贷款数据与所述借款方的异地贷款概率的比值;根据所述比值从至少一个借款方中确定存在异常申请的目标借款方。

可选地,所述不同行政区域之间的异地贷款概率是通过以下模块生成的:

第一贷款概率生成模块,用于对借款方地址对应的第一行政区域和贷款方地址对应的第二行政区域之间的至少一种关联属性进行加权运算得到所述异地贷款概率,所述至少一种关联属性包括以下至少一项:所述第一行政区域与所述第二行政区域之间的距离、所述第二行政区域的生产总值和所述第一行政区域的生产总值之间的比值、借款方地址属于所述第一行政区域且贷款方地址属于所述第二行政区域的未逾期贷款在异地贷款中的占比。

可选地,所述借款方地址中包括至少一个层级的行政区域,所述申请地址信息获取模块201还用于:

将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域,所述深度学习模型是通过预设训练样本训练得到的,所述训练样本包括以下至少一项:样本地址文本,所述样本地址文本中的每个字符对应有所述字符的样本类型,所述样本类型为以下一项:一个层级的行政区域的开始字符、一个层级的行政区域的结束字符、其余字符。

可选地,所述深度学习模型包括:输入层、双向LSTM层、CRF层,在训练过程中,所述输入层用于接收所述样本地址文本,所述双向LSTM层用于对所述样本地址文本进行处理得到向量,所述CRF层用于根据所述向量预测所述样本地址文本中每个字符的预测类型,所述样本类型和所述预测类型用于确定损失值,在所述损失值满足收敛条件时,结束训练,在所述损失值不满足收敛条件时,根据所述损失值对所述深度学习模型的参数进行调整,以进行以下一轮训练。

可选地,所述装置还包括:

行政区域补全模块,用于在将所述借款方的借款方地址文本输入到深度学习模型中,得到所述至少一个层级的行政区域之后,若所述至少一个层级的行政区域中缺失部分层级的行政区域,则根据预设行政区域树确定缺失的行政区域,所述预设行政区域树用于表示行政区域之间的层级关系;和/或,若所述至少一个层级的行政区域中缺失部分层级的行政区域,则将所述借款方地址文本输入至第三方接口,得到缺失的行政区域。

图5是本申请实施例提供的电子设备的一种结构框图。该电子设备600包括存储器602和至少一个处理器601。

其中,存储器602存储计算机执行指令。至少一个处理器601执行存储器602存储的计算机执行指令,使得电子设备601实现图2中的方法。

此外,该电子设备还可以包括接收器603和发送器604,接收器603用于接收从其余装置或设备的信息,并转发给处理器601,发送器604用于将信息发送到其余装置或设备。

本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,使计算设备实现前述图2所述的方法。

本申请实施例还提供一种计算机程序,所述计算机程序用于实现前述图2所述的方法。

最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

本文发布于:2024-09-25 14:30:30,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/86136.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议