Palantir的研究到金融风控(二)
目前人工智能已经深入金融、零售、汽车等行业,其中在金融行业的应用场景比较明确,所以AI在金融行业的发展比较快,应用相对要比其它行业来说要成熟。承接上篇文章Palantir的研究到金融风控(一),这里着重总结一下知识图谱在金融领域的应用:
一、知识图谱能帮金融做什么?
举几个例子:
以股票投研情报分析为例:
通过知识图谱相关技术从招股书、年报、公司公告、券商研究报告、新闻等半结构化表格和非结构化文本数据中批量自动抽取公司的股东、子公司、供应商、客户、合作伙伴、竞争对手等信息,构建出公司的知识图谱。在某个宏观经济事件或者企业相关事件发生的时候,券商分析师、交易员、基金公司基金经理等投资研究人员可以通过此图谱做更深层次的分析和更好的投资决策,比如在美国限制向中兴通讯出口的消息发布之后,如果我们有中兴通讯的客户供应商、合作伙伴以及竞争对手的关系图谱,就能在中兴通讯停牌的情况下快速地筛选出受影响的国际国内上市公司从而挖掘投资机会或者进行投资组合风险控制。
二、金融知识图谱的数据来源
三、金融领域之风控
金融的核心是风险控制,研究AI金融就必须提及到金融风控,所以首先总结一下风控的基本知识如下:
- 风控数据的来源
一是客户授权数据,包括手机设备信息、网络节点信息、浏览数据埋点、LBS位置信息、通讯录、通话记录数据等。
二是人行报告数据,包含大量自然属性、贷款办理、还款能力、逾期行为、用卡行为、担保、抵押等大量信息。
三是外部征信数据,涵盖各类黑灰名单、金融信息、网络借贷行为数据、各类收入数据、个人资产信息、消费能力、移动通信详细信息、社交信息等。
四是机构日常积累的其他合规数据源。
- 风控场景
常见的业务场景有信贷、支付、登录、注册、精准营销等。关于大数据风控的应用,主要从如下场景展开分析:
信贷场景中为信贷企业预防贷前、贷后等场景的欺诈风险。对借款人的历史借贷、消费特征等行为进行分析,前置性判断用户的还款能力(经济实力)和还款意愿(道德风险),为信贷决策提供可参考依据。构建整体风控解决方案,提供全方位的大数据分析,协助互联网信贷企业,尤其是小微金融企业客户,更广泛利用大数据提升风控和获益能力,减少潜在的资金和信用损失。
支付场景中通过高质量的金融黑名单等海量合规数据,为精准识别风险交易提供风控依据。基于大量风险数据和强大的机器学习技术,建立精准风控模型。通过事前预测,事中监测预警,事后关联分析,全程实时监测业务潜在威胁,精准识别资金风险、套现、盗卡、盗号、钓鱼支付等行为,保护用户财产安全。同时通过对用户的个人信息(姓名、身份证号、手机号、银行卡号等)进行真实性校验,帮助第三方支付机构降低审核个人信息时的人力和时间成本,有效控制恶意欺诈风险。
登录及注册场景中结合目前领先的风控模型,对登录及注册环节可能存在的账户安全隐患进行实时监测并预警。有效防范撞库攻击、暴力**、垃圾注册等账号安全风险。
精准营销的实现是基于大数据模型从而找到精准用户,同时识别虚假交易、恶意下单、库存绑架等欺诈行为,保护平台交易安全。
- 创新型应用技术
风控工具的开发及使用可促进多维度第三方数据充分利用从而提升风控效果。
设备指纹技术。基于国际领先的设备识别技术,通过获取上网设备的软件、硬件、行为等多层次指纹信息,为每一个操作设备生成全球唯一的设备ID,精准分析设备用户的操作轨迹,对设备进行标识、评估欺诈风险。设备指纹技术普遍用于反欺诈的事前、事中、事后各个环节。
身份认证技术。身份认证解决方案中融合了数字签名、人脸识别、时空码及设备指纹等多项核心安全技术,从而确保整个身份认证过程的安全性与便捷性。
兼顾移动端与PC端。用户无需携带除手机外的任何额外认证设备(如U盾)即可完成身份认证;无需获取用户数据(如姓名、身份证等),无数据泄露风险,同时保护用户隐私信息。另外,无需使用额外认证设备(如USB Key),同时减少因使用USB Key而带来的运维管理,大大降低银行的业务运营成本。
身份认证解决了平台用户账号登录、管理授权、转账汇款、支付交易、资金提现等关键环节的二次身份确认问题。
流式大数据计算技术。流式大数据计算技术是基于时间窗口移动的动态数据快速处理技术。采用高速的流处理技术及分布式缓存技术,可实现超低延时、超高并发、高可靠、高扩展、高可运维,支持复杂事件的计算,组件均为松耦合设计,能够跟其他平台进行无缝对接。目前集群吞吐能力少量节点即可达百万笔每秒,平均延时1毫秒。风控系统对数据的分析处理能力,在时效性方面达到毫秒级,才算正真的事中风控,从而实现风险实时识别和拦截。
智能决策引擎。智能决策引擎主要作用是实时对交易进行风险判断。它是在传统的规则引擎的基础上,结合目前主流的模型引擎,使规则引擎与模拟引擎配合使用,将机器学习嵌入到整个反欺诈过程中。提供相关业务策略的全生命周期的统一管理,包括简单规则、决策表、决策树和规则流等组件的编辑、部署、运行、监控等功能,为用户提供高效的决策管理服务。总的来说,模型更多的是辅助规则,并能在某些风险场景下提高规则的准确率。但基于机器学习的智能决策引擎,将越来越受到重视,并在风险防控中发挥更大的作用。
- 大数据风控解决方案
终端环境及应用的安全检测。应用设备指纹技术,给予终端唯一设备ID,对设备进行root/越狱检测、修改器及模拟器检测;同时对终端应用进行安全检测,帮助主动挖掘未知漏洞、发现恶意代码和后门程序。上述检测过程在手机终端的移动应用开始启动时自动运行,联合云端病毒库进行扫描检测,并在检测完成后向该应用报告扫描结果,扫描结果以风险评级的方式输出。
应用行业先进技术构建反欺诈模型。在海量数据的基础上,采用分布式并行计算、存储管理和实时检索,并运用关联、分析和建模,解决实际业务问题。纵深多重账户防护体系,有效识别欺诈分子,有效防范拖库撞库、账号盗用等账号风险,从而保障账户安全;多维数据深度学习,分析设备行为异常,高效预警垃圾注册、恶意刷单等欺诈风险;多渠道数据交叉验证,实时信用监控,及时发现多头借贷、恶意欠款等业务风险。
基于生物识别的身份认证与交易验证。生物特征具有唯一性,可以测量或可自动识别人类的生理特征和行为特征来进行个人身份认证的鉴定。可用于生物识别的生物特征有手形、指纹、脸形、虹膜、视网膜、脉搏、耳廓等,行为特征有签字、声音、按键力度等。基于这些特征,发展了指纹识别、声纹识别、面部识别、发音识别、虹膜识别、签名识别等多种生物识别技术。生物识别技术具有传统的身份认证手段无法比拟的优点。采用生物识别技术,可不必再记忆和设置密码,使用更加安全方便。生物识别技术可以在1秒内迅速识别身份信息,大大高于人类肉眼的识别准确率与速度;通过交叉验证,可以极大的提升用户远程认证的便捷性与流程效率,生物识别技术已经实现了精准身份验证,包括1:1人脸验证、身份证真伪验证、活体验证等,这就可使其远程、便捷对用户身份进行验证,进而减少恶意欺诈、降低审核成本、提高金融安全度,构建多因子风险防护,保障金融科技安全。
智能决策流实现秒级审批。近年来,随着人工智能崛起,机器学习技术也得以较快发展,智能决策引擎就是基于机器学习的基础上实现的。可以利用海量历史数据训练模型,基于客观的数据进行风险把控,来提升基于专家规则的风控系统的准确率和覆盖率。同时结合大数据技术,把风控系统提升到了实时反欺诈,通过低延时、高吞吐量的数据处理能力为实时风控系统,尤其是模型的训练提供了强有力的支持。
四、传统的风控建模方式
传统的风控建模是通过FICO信用分以及ABCF卡模型来评价客户的信用,涉及到的数据量比较少,其建模流程和形式也都比较标准化:
五、基于AI和知识图谱的风控
目前与人工智能相关的技术很多,其中大数据、机器学习、深度学习、知识图谱等比较火热,于是有人就提出了基于AI的金融风控体系:
该体系以知识图谱为数据管理工具,把多种异构数据源进行融合,利用深度神经网络做特征提取,利用机器学习模型来建模,这应该是比较先进的体系框架了,毕竟每一块构建起来的成本不小。
金融知识图谱风控平台
欢迎关注微信公号:数联未来(zycnb1)