信用评分卡总结11:模型检测报告、学习资料来源
在评分卡实施之前和之后,都需要连续编制大量的报告,以评价评分卡的表现。这些报告可以分为两类。
-
实施前报告:通常,这些报告被用来计算得分在不同变量的范围和类别之间的分布。它们还可以用来比较这些变量分配的分值和观测到的违约率。
-
实施后报告:这些报告的重点是评估评分卡在防止违约率以及被赋予的分值。
通常,评分卡被认为是帮助企业回答以下问题的工具:
1、如何将评分卡与企业的总体经营战略相结合?
2、如何衡量客户行为的变化,并在信贷策略中对其原因进行说明?
3、评分卡是否运行良好?何时需要对评分卡进行升级或重建评分卡?
这些报告中的大部分只是简单的计算不同分数段和分段的总数和频率,以及业务获取的不同变量。
稳定性报告是用于评估和检测评分卡表现的,也被称为系统稳定性报告或评分卡稳定性报告,该报告的目的是生成一个能够代表总体的分值分布随时间的移动或变化的指数。这种情况之所以会发生时因为评分卡开发使用的是历史数据,因此得分代表的是获取这些数据时的客户行为,而不是实施评分卡时的客户行为。客户行为的变化可以被解释为以下两种因素的结果:
-
客户群体发生变化:像所有提供服务的企业一样,提供信用产品的公司也要不停的接受新客户,同时,由于违约、清收和客户不忠,已有客户也会流失,因此,客户群体会以这两种过程之差的速度发生替换,其他改变客户群体的机制包括合并、兼并和向新市场的扩张。
-
市场发生变化:市场力量,如通货膨胀、新竞争者的加入以及一般经济周期,将影响已有或正在寻求新的信贷产品的客户的行为,例如,可以发现,当失业率上升时,不同类型的信贷产品的违约率都将上升。
稳定性指数是计算实际的和预期的分值分布之间差异的一个衡量指标。
总体稳定性指数
案例:在10分为一段中的实际的和预期的记录频数,表中的频率是记录总数的百分比形式。如下为稳定性指数的计算过程。
等分 | 分数 | 实际 | 预期 | 实际-预期 | log(实际/预期) | 指数 |
1 | <200 | 8% | 6% | 0.02 | 0.2877 | 0.00575 |
2 | 201~210 | 9% | 8% | 0.01 | 0.1178 | 0.00118 |
3 | 211~220 | 14% | 10% | 0.04 | 0.3365 | 0.01346 |
4 | 221~230 | 19% | 22% | -0.03 | -0.1466 | 0.00440 |
5 | 231~240 | 24% | 21% | 0.03 | 0.1335 | 0.00401 |
6 | 241~250 | 11% | 11% | 0 | 0.0000 | 0.00000 |
7 | 251~260 | 9% | 9% | 0 | 0.0000 | 0.00000 |
8 | 261~270 | 3% | 6% | -0.03 | -0.6931 | 0.02079 |
9 | 271~280 | 2% | 4% | -0.02 | -0.6931 | 0.01386 |
10 | >280 | 1% | 3% | -0.02 | -1.0986 | 0.02197 |
合计 | 100% | 100% | 0.08542 |
稳定性指数=(实际-预期)*ln(实际/预期)
可将总体稳定性指数I定义为:
其中,A是实际值,E为预期值
公式类似于求IV值,信息值IV衡量的是两个离散变量之间的关联性,较低的取值表明这两个变量的类别分布相似。如果实际A和预期频数E相等,则稳定值指数为0.
使用稳定性指数的准则:
-
0~0.1,无显著性变化,无须采取实际行动
-
0.1~0.25 发现某些变化,建议进行检查
-
>0.25 发现显著变化,建议重新构建评分卡
通常,稳定性指数可以用于三个目的:
-
作为验证统计量,以确保开发数据集的分值分布与用验证数据集得到的分值分布之间没有显著差异。如果开发数据集和验证数据集之间存在显著差异,需要用不同的变量、分段、分组、样本或所有这些重建评分卡
-
稳定性指数还可以检测评分卡实施后表现的控制措施。评分卡实施一段时间后,稳定性指数可以用以评估分值分布相对于评分卡开发时,可能发生的变化。如果结果表明发生了显著的变化,需要对这种变化的原因进行调查,必要时甚至需要重建评分卡。
-
稳定性指数还可以检验名义预测变量的类别分布或连续预测变量的分段分布自评分卡开发以来是否发生了变化。因此关注的不是分值分布的变化,而是用以生成这些分值的变量的变化。
评分卡要素分析:
评分卡要素分析报告的目的是评估自变量分布的变化对于最终评分结果的冲击。
如下为变量年龄的评分卡要素分析报告示例。
年龄 |
分数 |
实际 |
预期 |
(实际-预期)*分数 |
<26 |
5 |
24% |
10% |
0.7 |
26-31 |
10 |
25% |
14% |
1.1 |
31-39 |
14 |
11% |
15% |
-0.56 |
39-50 |
25 |
16% |
23% |
-1.75 |
50-66 |
27 |
13% |
21% |
-2.16 |
>66 |
22 |
11% |
17% |
-1.32 |
指数 |
|
100% |
100% |
-3.99 |
指数公式如下,计算了实际的和预期的分值分布两者之间差异的净效应。
对变量的类别或分组求和,需要注意的是,由于公式给出的是实际的和预期的频率都是百分比的形式,分组的效应恰好是加权的。给出了变量对总得分的平均效应,变量年龄的分布差异的平均效应是评分将使分数降低3.99分。
书本参考:信用风险评分卡研究_基于sas的开发与实施
链接:http://pan.baidu.com/s/1mhVtbYg 密码:718f
建模过程中常用到的sas宏清单列表及分类总结如下: