谈谈互金跟银行里数据逻辑的差异

要说互金跟银行的不同的地方,先得从最近接触到的一份五级分类表说起来,然后再说说欺诈的指标的区别;最后再讲讲银行跟互金在数据方面的区别。

 

五级分类

 

目前国内多数银行、互金根据金融办的相关要求,对资产逾期情况的分类——具体的资产的五级分类如下: 

 

谈谈互金跟银行里数据逻辑的差异

 

正常情况下,关于以上分类,银行机构跟互金虽然都是按照金融办的要求的分类方法,但执行起来却有所不同,比如对于大部分的互金来讲dpd90+已经是坏账的阶段了,但是对于银行而言仍然是不良(银行对于坏账的定义一般都是180+)

 

除了以上的不同,另外笔者在做反欺诈项目的时候也发现在欺诈领域,互金跟银行上的定义也不一样。

 

欺诈指标

 

在银行里,欺诈一般都是基于业务经验的判断的场景和专家定义。以信用卡的为例,欺诈的定义一般都是卡是否有被盗刷,或者信用卡是被冒用等场景。而在互金里,因为客户群数量实在太大,专家定义效率太慢,我们需要能量化成统计的指标,所以我们引进了首逾7天或者首逾30天这样的指标。

 

我们分析首逾7天和首逾30天,直接滚动到坏账的比例非常高,所以在互金中,这两类指标也是非常好用、常用的统计指标。但就这个常用的指标,其实跟很多银行从业很久的同学交流的时候,很多人也不知道有这类指标存在。

 

以上统计指标跟方法的差异,对互金跟银行两者的业态来讲还只是冰上一角,以下再跟各位读者谈谈互金跟银行的数据方面的差异。

 

银行

 

相对于互金,银行的各类产品、管理体制无疑是最成熟了,毕竟经过了几百年的发展,银行已经形成了一套非常科学与标准化的体系,而互金也只是凭着着互联网+金融的概念,在最近些年弯道超车,实现了各种飞跃。

 

曾几何时,互金要升天,银行消灭论的声音在好几年前是时起彼浮。君不见,当时互金最疯狂的时候,也正是P2P一路高歌的时候迈进的时候,一栋金融大厦一天就能冒出来几十个做P2P的公司,层出不穷。当然P2P从银行挖人的新闻,也诱惑着银行业的从业者屡屡下海。

 

现在看来,很多金融创新都是需要经过市场考验的。这一两年,银行老大哥的实力因为非银相关的产品的暴雷,而再一次受到广大从业者的青睐。

 

金融是严谨的。银行沉淀了几百年的的市场考量就告诉我们这样的定律。金融就是金融,金融还是最原始的跟最基础的逻辑。什么是最原始的逻辑,具体拿信贷而言,判断一个人有没有还款能力,最好的仍是查看他的历史的信贷的表现。

 

这里就不得不得提一下,目前在金融业里,用得最多的fico评分。FICO(Fair Isaac Company) 信用分是由美国个人消费信用评估公司开发出的一种个人信用评级法。为什么金融银行业喜欢英fico的评分,因为FICO 评分模型主要就是围绕个人的历史借贷行为等征信类信息展开的。

 

它基本包括了我刚才说到的金融严谨的数据性的问题。

 

看看fico评分的数据组成就知道了。它包括付款历史 ( 占比 35% 左右,包括各类信用 / 贷款账户的还款记录,公开记录即支票存款记录,逾期偿还情况等 )、未尝债务 ( 占比约 30%,包括仍需偿还的信用账户总数,信用账户余额,总额度使用率等 )、信贷时长 ( 占比约 15%,信贷账户的账龄 )、新开立信用账户 ( 占比 10%,包括新开立信用账户数,新开里账户账龄,正在申请的信用账户数量,查询查询记录等 ),正在使用的信贷组合 ( 占比 10% 左右,包括信用卡账户、零售账户、分期付款账户、抵押贷款账户等混合使用情况 )。

 

目前fico评分而言其分值在 300-850之间,信用分低于 600 分, 借款人违约的比例是 1/8, 信用分介于 700 ~ 800 分,违约率为 1/123,信用分高于 800 分,违约率为 1/1292。一般认为, FICO 分高于 680 分,就属于信用卓著的用户了 ; 而若低于 620 分, 则很可能被拒贷, 或被要求增加担保或抵质押。

 

银行所有能获取到相关金融逻辑的前提都是基于银行到底有多少自己的数据能参考,比如对于一个在工商银行的客户,他的所有的信息因为在工商银行能参考到,所以他在工商银行就能判断这个客户的资产情况如何,是否有钱,是否有支付期他所申请的房贷或者车贷。

 

但也因为金融也是严谨的,所以导致了银行也有一些致命缺点,就是每家银行间的数据是割裂的。工商银行能判断本行客户的情况,但是无法判断在中国银行的客户的情况,很有可能客户A在工商能申请到贷款,但是在A在建设却一分钱贷款都无法申请。所以在我们申请房贷跟车贷的时候,往往需要提供不同银行间的流水清单证明自己的信用能力。

 

虽然目前银行间有共享的征信数据能接入,但是对比国内庞大的用户人群,目前征信数据占有的程度仍然不高。还有8亿多的人没有征信数据。对于这类下沉的客户,一样有信贷需求,这时互金也就进场了。

 

互金

 

互金行业,因为目前无法从金融的角度去判断客户的金融属性,没有相关的历史交易数据,所以互金行业的判断往往的标签都是带有客户行为的数据。具体点就是客户浏览某个网页端的时间,安装某些APP的数据情况,查询或者申请某些多头的数量,所以这里就有很多跟客户金融非相关的数据在使用了。

 

目前几家做得非常大的阿里、京东,因为自有的数据非常非常庞大,整条生态圈上的数据除了自用也已经能成熟向外提供征信数据产品供外部使用了。事实证明,基于自己的客户行为所产生的客户的行为所产生的金融属性也非常良好,当然这中间经过非常多的数据的验证。

 

分析过芝麻信用评分的,就知道对于芝麻评分中有个客户购买商品类型的字段,凡是客户有购买大型家具,比如像床和沙发这样的商品,抑或是客户频繁购买母婴类用品的用户,其得分也会相对高很多。这背后的逻辑,芝麻信用的逻辑虽然没有公开,但是我们作为从业人员也能了解到大型家具的购买证明客户的偏向有固定的住所,这在金融属性中对于着固定工作单位或者有稳定的居住环境;而母婴用品相对比也偏向了客户有稳定的家庭关系,类比金融属性也是已婚的人群比未婚的人群的评分也更高。

 

以上提到的几家大的数据公司有自己庞大的数据体量,能有非常好的数据可以做验证,但是相比其他的互金公司,更多的仍是不断加入接入非常多的外部数据源来加强自己金融数据产品的缺失。当然对于更多的这类客户行为的数据,目前业内都是以观察为主,并选择合适自己的数据源。

 

结语

 

银行业也一直在加大征信数据的普及和推广,但相对目前整体的环境来说,普及征信的活跃率,相对互联网病毒式的拓展速度来讲,速度仍是太慢了。

 

所以在目前发展的形势下,该怎么用其他的数据去补充自身数据的体量的不足,也成为银行非常需要解决的痛点。但很明显的是,对于互金的头部公司而言不可能共享这类数据。

 

 

但从目前发展的态势而言,银行也在思变进取,也在接入其他各类数据源,银行在不断做一些尝试。所以笔者也非常期待,在征信尚未普及的未来,银行能利用自身的优势,结合着一些相当不错的外部数据源提供更多的符合客群的产品。

 

最后是想跟各位知识星球的同学,本篇文章里提到的关于芝麻信用评分的资料,虽然很多同学都看过,不过细细研读几篇,每次都能有些许收获,有兴趣的同学请到上面围观,谢谢。

谈谈互金跟银行里数据逻辑的差异

报名星球请添加小番微信,备注下行业+风控从业模块,谢谢您! 

谈谈互金跟银行里数据逻辑的差异

番茄学院管理员:小番
备注请填写行业岗位,谢谢啦!

更多干货资料,请关注公众号:番茄风控大数据