谈谈信贷的风险标签
关注 “番茄风控大数据”,获取更多数据分析与风控大数据的实用干货
在互联网逐步步入大数据时代后,不可避免的给企业和用户行为带来一系列改变与重塑;其中最大的变化莫过于,用户的一切行为在企业面前是“可视化”的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值。于是,用户画像的概念也就应运而生。
在推荐系统中,做好了标签可以实现精准化营销和推送;在信贷行业,有了标签体系不仅可以帮我们实现客户分群,实现风险把控。业内,我们除了模型也一直在想方设法构建客群的标签体系,今天我们就来聊一下与风险相关的标签情况。
一.系统功能架构
首先一个完整的标签体系,用户画像及应用项目包括底层数据源采集和存储、画像标签模型构建、数据模型应用三个层级,系统功能架构如下:
二.模型架构
画像标签模型分析主要分原始数据统计分析、统计标签建模分析、模型标签预测分析三块,具体如下:
三.用户画像模型
用户画像模型是结合用户基本属性分析,对互联网行为特征进行描述,包括用户登录、搜索、关注、消费等各方面数据,在信贷风控的全流程中,我们就会除了会判断客户的档案信息也更会参考他的征信情况、还款行为、催收数据,以标签方式展示每个用户的个性化特征,画像是系统分析结果的总结,是系统数据挖掘的起始。目前在画像中所用到的一些分析方法如下:
-
聚类分析
聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在用户研究中,很多问题可以借助聚类分析来解决,比如用户活跃度行为聚类、用户消费情况聚类等.
-
分类算法
分类是按照某种标准给用户贴标签,再根据标签来区分归类,分类是事先定义好类别,类别数不变.根据用户群的文化观念,订单消费、行为习惯等不同细分新的类别,企业根据用户的不同制定品牌推广战略和营销策略,将资源针对目标用户集中使用.
-
时间序列分析
时间序列分析是一种动态的数据统计方法.该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题.比如用户的周期性行为分析、因子回归分析建模等.
-
RFM模型
RFM模型较为动态地显示一个用户的全部轮廓,R表示用户购买的时间有多远,F表示用户在时间内购买的次数,M表示用户在时间内购买的金额,加权得到RFM得分.
-
推荐系统算法
利用用户的一些行为,通过一些算法(协同过滤、LFM、打分模型、关联分析等),推测出用户可能喜欢的东西.推荐讲究准确性,提高用户-内容(订单、知识等)等组合的匹配度,提升服务质量.
-
关联分析
关联分析就是在关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构,挖掘潜在的行为和消费关联特征.
四.贷款属性标签
因为篇幅有限,今天就稍微列出跟风险标签稍微相关的贷款情况的标签内容,另外还有更详细的档案情况跟贷后表现数据标签,请参考知识星球上的内容:
我们的课程已经上架了配套的****并且关于之前文章里提到的代码和数据,如果有兴趣学习的同学,也可以加一下官微了解下。谢谢!
报名星球请添加小番微信,备注下行业+风控从业模块,谢谢您!
番茄学院管理员:小番
备注请填写行业岗位,谢谢啦!
还有关于标签的相关的图表、热力图、词云就不做过多展示:
我们的课程已经上架了配套的****并且关于之前文章里提到的代码和数据,如果有兴趣学习的同学,也可以加一下官微了解下。谢谢!
报名星球请添加小番微信,备注下行业+风控从业模块,谢谢您!
番茄学院管理员:小番
备注请填写行业岗位,谢谢啦!