信贷风控模型架构

风控业务背景
互联网金融相对于传统金融出现更多机遇和挑战。如何将机器学习、深度学习等前沿人工智能技术赋能于金融风控领域,打造金融科技(FINTECH),已经成为大家关注的焦点。高性能、高可靠、易维护的风控模型是支持风控策略迭代的基础。本文主要探讨一种适用于大数据风控的建模框架,并尝试分析功能模块设计、优势与不足、解决方案。
Part 1. 大数据风控的特点和挑战
Part 2. 传统评分卡的优势和不足
Part 3. 机器学习的优势和不足
Part 4. 大数据信贷风控模型架构
Part 5. 总结
1
Part 1. 大数据风控的特点和挑战互联网金融相对于传统金融在业务模式上具有诸多不同点:传统金融的订单数少、订单金额高、贷款期限长、客资质好、风控预算高。
互联网金融订单数多、订单金额低、贷款期限短、客资质差、风控预算低。互联网金融相对于传统金融在风控上具有更多挑战,这包括:
长尾劣质客更加不稳定,这容易导致样本波动,加大风控建模难度。
互金市场波动剧烈,需加快模型迭代更新周期。例如,2018年6、7月份的“P2P潮"。
聚焦镜数据源采集上种类更多,弱相关数据更多,处理难度更大。这就需要人工智能技术。
政策合规要求,数据采集和使用更加规范化。例如,近期国家对数据非法爬取的集中整治。
随着监管趋严和行业愈加规范化,大数据风控,尤其是基于弱数据的风控正成为线上信用贷业务最重要的核心竞争力。数据是风控的基础,只有对借款人全方位的理解,我们才能做好风控。一般可将风控数据分为四部分:
资质类数据:包括真实的身份信息、学历(大专、本科、研究生等)、收入、职业(白领、蓝领等)、人脉信息等。
信贷类数据:包括央行征信报告、内部信贷历史(申请、还款、催收)、第三方征信数据、第三方多头借贷数据等。
消费类数据:包括电商消费记录、信用卡账单、借记卡流水等。
行为类数据:包括埋点行为(前端、后端)、设备App、活动轨迹、内容偏好(浏览商品、新闻)等。
自上而下,这些数据与逾期信用风险的相关性逐渐降低。通常,我们也称为强金融属性和弱金融属性数据。
2
Part 2. 传统评分卡的优势和不足传统评分卡一直在银行信贷业务中成功实践了几十年,禁得起时间的检验。因此,我们必然要取其精华。传统评分卡的优势在于:刘光亭
泛化性强:简单模型泛化性能相对复杂模型更强。
稳定性好:通过WOE分箱技术提高了变量的鲁棒性。
税务总局曝光5起涉税违法案件可解释性强:线性模型,变量系数可以判断对最终结果的影响。
小样本学习:信贷样本相对更少,利用较少样本就可以训练模型。
其劣势在于:
特征要求强相关,这就强依赖建模人员的业务经验。
线性特征对于挖掘的信息价值相对有限。
通常需要分建模,这将带来很多额外工作量。(可参考:《利用样本分提升风控模型性能》)
3
Part 3. 机器学习的优势和不足
随着大数据的出现,机器学习慢慢焕发出其生命力。其优势在于:
引入了非线性因素,模型拟合能力更强,能从海量的、贫瘠的数据中挖掘出数据价值。
通过集成学习可将弱模型打造出强模型,如随机森林、GBDT、XGBoost、LightGBM等。
全息打印支持更多弱特征入模,而不必像评分卡模型需要花大量时间筛选特征。
其劣势在于:开明国语课本 pdf
由于引入了大量的非线性因素,模型可解释性降低。药网
样本量较少的情况下容易产生过拟合现象。
复杂模型参数过多,调参依赖于人工经验。
4
Part 4. 大数据信贷风控模型架构我们认识到了传统评分卡和现代机器学习各自的优势和不足,自然会萌生一种朴素的想法:能不能将两者取长补短,有机结合起来?
目前业内主要有三个探索方向:
方向一:利用数据挖掘算法构建特征,再使用评分卡模型。
方向二:保持传统风控特征筛选的严格标准,但使用机器学习模型。
方向三:大规模样本结合机器学习,保证模型的稳定和泛化。
本文借鉴了以上思路,提出一种大数据信贷风控模型架构,如图1所示。自底向上可分为六个层次:
1.原始数据域:主要包括运营商、通讯录、电商、公积金、设备、短信、自填信息、外部数据等数据域(domain)。

本文发布于:2024-09-22 05:27:25,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/335620.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   模型   金融   学习   传统   机器   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议