【风险管理】科技金融大数据风控代码逻辑
写在前面:
此文为一个简单的风控决策模型的开发逻辑及细节,仅供科技金融领域做风控建模的新手参考,具备能够看懂并且尝试风控模型开发及部署的能力。
看官如果能够看懂下文内容,并且跃跃欲试,那么可联系我来要代码(会提供脱敏后的代码给大家做参考)。
一 模型开发流程
1、模型开发
(1)数据源测试: 测试需要对接的三方数据源,可分为线下测试和线上测试两种。通过类似覆盖率、交叉矩阵、KS等指标判断数据质量。
(2)aip测试接口对接:如果数据源质量ok,开发人员对接数据源接口,取数调参。
(3)函数式编程代码块:代码结构化分块编程,防止重复编写,同样提升调用效率。
2、模型部署
(1)路由配置: 配置好模型路由
(2)api正式接口对接: 完成数据源接口的对接,部署到线上。
(3)模型调用: 支持传参调用整个模型(包括规则集和机器学习模型),返回最终决策结果。
3、模型监测
(1)运营指标
-
①数据源调用率
-
②单模型拒绝率
-
③整体通过率
-
④单一规则触碰比
(2)风控指标
- ①AUC
- ②KS
4、模型调优
-
①调整数据源的部署逻辑
-
②调整规则集
-
③调整评分卡
-
④整体上的目的就是降低损失的同时提高通过。
二 代码逻辑
整体逻辑如下:
1、测试文件test或线上访问url
2、调用视图views中的模型解释器@app.route
3、数据源derived
4、规则集rule
5、机器学习模型model
这里评分卡模型,基本是用标准评分卡和树结构的评分卡实现的。