因子分析参考:波动率因子分析
from: https://www.ricequant.com/community/topic/4185/
第二篇.波动率因子
在现代投资组合理论中,马科维茨首先提出可以使用资产收益序列的标准差来衡量其波动情况,自此以后收益波动率成为最常用的风险度量之一。在传统的资产定价理论中,资产波动率是最重要的参数之一。波动率越大,资产预期收益的不确定性越高,资产公允价格也越高,来作为投资者承担收益不确定性的风险补偿。从我们下文分析结果来看,个股波动率因子暴露度和其未来预期收益总体上存在负相关(详见“IC分析”和“收益分析”),表明投资者更偏好于持有低波动率的个股,而高波动率的个股长期而言并未获得相应的风险补偿。
在上一期多因子检验研究报告中,我们对估值因子进行了系统检验。在本期报告中,我们进一步使用股票量价数据的波动率作为选股因子。传统的套利定价理论(Arbitrage Pricing Theory,APT)把影响股票价格的因子分成公共因子/风格因子(common/style factors)及特异因子(Idiosyncratic factor)两类。其中公共因子用于刻画影响全市场股票价格的共同因素,而特异因子则用于捕捉个股自身的波动特征。在本期报告中,我们选取了2个公共波动率因子和5个特异波动率因子进行系统检验(图1)。测试时间区间为2015年1月1日~2017年8月1日,测试股票池为全市场,调仓时间为每周一。
一、因子定义
本次报告所采用的波动率因子定义见表1,其中,STD和VOLBT为公共波动率因子,用于刻画影响全市场股票指标波动的共同因素;其余5个因子为特质波动率因子,用于捕捉个股自身的波动特征。具体波动率因子计算表达式详见附录1。
表1 波动率因子及其描述
大类因子 |
具体因子 |
因子描述 |
波动率因子 |
STD |
日收益率标准差(个股的总风险=过去30天的收益率的标准差) |
VOLBT |
成交量的Beta(个股最近120天每日成交量的变化率和上证指数成交量变化率的回归系数) |
|
IVCAPM |
基于CAPM的特质波动率(个股过去30天的日收益率和市场因子(1)的回归的残差项的标准差) |
|
IVFF |
基于Fama-French的特质波动率(个股过去30天的日收益率和市场因子(1),市值因子(2),估值因子(3)回归的残差项的标准差) |
|
IVFF-DOWN |
基于Fama-French的特质下行波动率(个股过去30天的日收益率和市场因子(1),市值因子(2),估值因子(3)回归所得残差项中小于零部分的标准差) |
|
IVFF-UP |
基于Fama-French的特质上行波动率(个股过去30天的日收益率和市场因子(1),市值因子(2),估值因子(3)回归所得残差项中大于零部分的标准差) |
|
IVCARHART |
基于Carhart的特质波动率(个股过去30天的日收益率和市场因子(1),市值因子(2),估值因子(3),动量因子(4)回归所得残差项的标准差) |
备注:
1、 市场因子:上证指数的日收益率
2、 市值因子:定期取流通市值最小的1/3只股票和市值最大的1/3只股票,分别按照流通市值加权计算收益率,使用小市值股票组合和大市值股票组合的收益差作为市值因子。
3、 估值因子:定期取估值最小(即PB最小)的1/3只股票和估值最大的1/3只股票,分别按照流通市值加权计算收益率,使用估值小的股票组合和估值大的股票组合的收益差作为估值因子。
4、 动量因子:定期取过去30天累计收益率最小的1/3只股票和累计收益率最大的1/3只股票,分别按照流通市值加权计算收益率,使用累计收益高的股票组合和累计收益低的股票组合的收益差作为动量因子。
二、 因子暴露度的相关性
图2.1和图2.2展示了因子暴露度的平均相关性,基于2016年8月1日到2017年8月1日STD,VOLBT,IVCAPM,IVFF,IVFF_DOWN,IVFF_UP,IVCARHART七个因子的暴露度数据,计算出各个因子之间暴露度的平均相关系数如图2.1和2.2所示。可以看出采用FF模型和CARHART模型的计算出的特质波动率因子的相关性都较高,其中IVFF和IVCARHART因子之间,使用两种方式(pearson、spearman)计算的平均相关系数都是0.98。但是VOLBT与其他因子的相关系数不高,说明了根据成交量计算的VOLBT与其他因子的表现可能有所不同。
图2.1 波动率因子暴露度的Pearson相关性
图2.2 波动率因子暴露度的spearman相关性
三、 因子暴露度的自相关关系
图3.1和图3.2展示了使用pearson和spearman计算的波动率因子自相关系数,这两种计算方式结果并没有太大区别;std因子的衰减速率最低,IVFF和IVCARHART两个因子的自相关性衰减速率没有明显差异,IVFF_UP因子的自相关性衰退速率最快。这说明股票的波动特征具有较强的延续性,而不同时期的特异波动率则变化较快。
图3.1 波动率因子的pearson自相关性对比图
图3.2 波动率因子的spearman自相关性对比图
四、 IC分析
因子有效性是指因子是否可以获得持续、稳定的alpha收益,本次报告主要使用IC分析及其衍生的指标对因子的有效性进行评估。
4.1 IC的统计分析
IC(信息系数): |
在本次报告中,我们定义IC为每个时间截点上因子在各个股票的暴露度和股票下期收益的pearson相关系数,IC值越高意味着该因子的暴露度与未来收益率存在较明显的相关关系。 |
IR(信息比): |
信息率原意是指残差收益率的年化预测值与其年化波动率之比,在本次报告中,我们将IR简化定义为因子在测试期间内IC的均值与IC的标准差的比值。 |
对于所有因子我们分别在整个测试时期进行相关系数统计量分析。根据表4.1,可以看出波动率因子的IC平均值都小于零,其中,特质波动率因子的IC平均值的绝对值比较高,并且IR(信息率)的绝对值较大,说明特质波动率因子和收益率有较明显的负相关关系,对于预测未来收益率存在一定的参考价值;VOLBT因子的IC标准差最小,说明VOLBT的IC分布较集中,但是在测试期间内的IR值偏小,说明该因子对未来收益率上没有可以太多的参考价值。
图4.1展示了因子的IC的分布直方图,可以看出VOLBT的IC分布更加集中,但是偏离零的距离不大,其余的因子相对于零有左偏的趋势;
表4.1 基于测试期间样本计算的因子IC相关统计量
|
IC平均值 |
IC的标准差 |
IR |
std |
-0.020195 |
0.127192 |
-0.158779 |
volbt |
-0.003158 |
0.088825 |
-0.035552 |
ivcapm |
-0.031459 |
0.126870 |
-0.247960 |
ivff |
-0.048068 |
0.128613 |
-0.373740 |
ivff_up |
-0.033301 |
0.102809 |
-0.323909 |
ivff_down |
-0.051556 |
0.103131 |
-0.499910 |
ivcarhart |
-0.051030 |
0.132148 |
-0.386159 |
图4.1波动率因子的IC分布直方图
4.2 IC的特征分析
一般而言,市场风格不是一层不变的,而是轮动的,所以根据上面定义的IC会存在符号上的切换,所以在选择因子的时候,一般是计算相关系数正负的比例,选择相关比例较高的一个方向作为因子在未来的预测方向。这里选择了正相关显著比例、负相关显著比例、同向比例和状态切换比例作为衡量因子方向的指标。
假如同向显著比例占上风,则意味着该段时间内因子的风格延续性较强,可以使用动态权重来调整因子的权重;同理,如果状态切换比例占上风,对于因子的赋权应该使用静态权重。
特征分析中相关名词的定义如下:
显著: |
是指采用相关系数的显著性水平小于一定阈值的样本。 |
正相关显著比例: |
显著的正相关系数占样本的比例 |
负相关显著比例: |
显著的负相关系数占样本的比例 |
状态切换比例: |
前后两期中相关系数符号相反占样本的比例。 |
同向比例: |
前后两期中相关系数符号相同占样本的比例。 |
表4.2展示了测试期间波动率因子的相关系数的特征分析,可以看出IVFF、IVCARHART两个波动率因子的负相关显著比例和同向切换比例较突出,即IVFF和IVCARHART两个因子暴露度与收益率可能存在较明显的负相关关系的趋势。
表 4.2 基于测试期间样本计算的IC的特征分析
ivcarhart |
ivff_down |
ivff_up |
ivff |
ivcapm |
volbt |
std |
|
正相关显著比例 |
0.200 |
0.133 |
0.156 |
0.215 |
0.203 |
0.198 |
0.203 |
负相关显著比例 |
0.504 |
0.467 |
0.430 |
0.511 |
0.380 |
0.203 |
0.428 |
同向比例 |
0.530 |
0.567 |
0.575 |
0.522 |
0.575 |
0.489 |
0.532 |
状态切换比例 |
0.470 |
0.433 |
0.425 |
0.478 |
0.425 |
0.511 |
0.468 |
4.3 IC的时间序列分析
此次我们采用了移动平均窗口为24周的移动平均线对比不同波动率因子在时间序列上的不同。图4.3展示了波动率因子IC移动平均对比情况,可以看出剔除市值因素和估值因素的特质波动率因子与未剔除这两个因素的因子(IVCAPM)表现存在差异,IVCAPM在股灾期间的IC移动平均线迅速下降;VOLBT因子在测试期间在移动平均线在2015到2016年出现反转,在2016年的下半年至今VOLBT因子的IC移动平均线在0到0.02之间波动,根据成交量回归计算的VOLBT因子在股灾期间的IC有由负到正的趋势,说明对上证成交量敏感的大盘股在股灾期间比小盘股的预期收益更高;其余根据价格计算的波动率因子的移动平均线在股灾期间在负半轴上的绝对值增大,说明价格波动率越大,预期收益越小。
波动率因子的IC时间序列图与对比图见附录2
图4.3 波动率因子24周移动平均对比图
五、 因子市值分析
本次报告中我们将全市场股票的市值取对数后由小至大分成5组宽度相等的市值区间,即按照从小到大依次将市值区间定义为超小规模、小规模、中等规模、大规模、超大规模的市值分组类型。
5.1 因子暴露度的市值分布差异
表5.1展示了VOLBT因子的平均暴露度在测试时期内与市值有明显单调递增关系。但是STD因子和特质波动率因子在小市值规模的平均暴露度大于大市值规模的平均暴露度,即小市值规模的股票有较大的波动率。对比因子暴露度和平均IC的市值分布差异,波动率因子的暴露度和平均IC在分布上没有明显的相似性,建议在使用上述波动率因子选股时使用市值中性化处理。
波动率因子在测试区间的市值分布差异的具体分布情况图详见附录3
表5.1 波动率因子暴露度的市值分布差异
市值分组 |
std |
volbt |
ivcapm |
ivff |
ivff_up |
ivff_down |
ivcarhart |
超小规模 |
11.99859 |
0.880332 |
0.164069 |
0.283574 |
0.21046 |
0.144243 |
4.205816 |
小规模 |
13.47889 |
1.012519 |
0.1622 |
0.288199 |
0.210853 |
0.146727 |
4.269581 |
中等规模 |
12.37633 |
1.201447 |
0.15271 |
0.254104 |
0.183528 |
0.132256 |
3.746056 |
大规模 |
12.88961 |
1.410127 |
0.153678 |
0.213041 |
0.153154 |
0.113047 |
3.133962 |
超大规模 |
7.994204 |
1.575401 |
0.156399 |
0.134564 |
0.093919 |
0.073892 |
1.975904 |
5.2 IC的市值分布差异
表5.2展示了波动率因子IC的市值分布差异,其中IC市值分布差异较大的是VOLBT因子,其在超小规模、小规模、超大规模市值区间上的平均IC是正值,说明在超小规模或者超大规模的股票中,根据成交量计算的VOLBT波动率因子的暴露度与预期收益存在正相关关系; IVCARHART因子平均IC的市值分布差异较小,剔除了市值因素和估值因素的IVFF、IVFF-DOWN、IVCARHART因子在小市值股票上的平均IC绝对值都大于大市值上的平均IC绝对值,说明假设大市值股票和小市值股票在IVFF、IVFF-DOWN、IVCARHART的因子暴露度均下降一单位,小市值股票的预期收益率有可能上升更大幅度。
表5.2 波动率因子平均IC的市值分布差异
市值分组 |
std |
volbt |
ivcapm |
ivff |
ivff_down |
ivff_up |
ivcarhart |
超小规模 |
-0.0181 |
0.0028 |
-0.0298 |
-0.0479 |
-0.0464 |
-0.0278 |
-0.0543 |
小规模 |
-0.0197 |
0.0003 |
-0.0404 |
-0.0503 |
-0.0563 |
-0.0365 |
-0.0532 |
中等规模 |
-0.0117 |
-0.0019 |
-0.0473 |
-0.0590 |
-0.0674 |
-0.0392 |
-0.0589 |
大规模 |
0.0108 |
-0.0079 |
-0.0281 |
-0.0475 |
-0.0353 |
-0.0290 |
-0.0462 |
超大规模 |
-0.0157 |
0.0015 |
-0.0570 |
-0.0298 |
-0.0058 |
-0.0546 |
-0.0380 |
六、 行业分析
表6.1展示了测试期间内各因子在各行业的平均暴露度和平均IC差异。其中红色表示每个因子平均暴露度或平均IC前5的行业,蓝色表示每个因子平均暴露度或平均IC后5的行业。各因子暴露度和IC的行业分布直方图可参看附录4和附录5。
从表6.1中在各因子的暴露度行业分布差异上可以看出,std因子暴露度在银行、钢铁、采掘、交通运输和公用事业五个行业的收益波动率较低,而经过多因子回归后,钢铁、采掘、交通运输三个行业的特异波动率(IVFF、IVFF_UP、IVFF_DOWN和IVCARHART)接近全市场平均水平,说明其低波动的特征主要来源于共同因素(市场因子、市值因子、估值因子和动量因子);而银行和公用事业的的公共收益和特异收益波动均较低,反正其低波动的特征是由共同因素和行业内个股波动较低同时决定的。
类似地,在收益波动较高的行业中,通信、医药生物和传媒的高波动特征主要来源于共同因素,而计算机及国防军工的高波动的特征是由共同因素和行业内个股波动较低同时决定的。
用于评估成交量波动情况的VOLBT因子和其它用于评估收益波动情况的因子行业分布存在明显差异。 其中,银行、交通运输的成交量波动明显高于市场平均水平。由于上证指数较多成分股分布在这些行业中,因此该结果具有相当合理性。
从表6.1中在各因子的IC行业分布差异上可以看出VOLBT因子的平均IC在国防军工、通信、电气设备、电子等行业表现为正,在非银金融、有色金属、食品饮料、建筑材料等行业表现为负,说明VOLBT因子的IC在行业上的表现情况存在较大差异,其余波动率因子的平均IC在绝大部分行业均表现为正。通过对比各个波动率因子的暴露度和IC的行业分布差异,波动率因子的暴露度和IC值在分布上没有相似性,因此使用波动率因子在全市场上选股时,建议进行行业的中性化处理。
表6.1 波动率因子暴露度和平均IC的行业分布差异
七、 收益率分析
图7.1到图7.7展示了七个波动率因子在测试期间的五组累计收益,从1到5分别表示因子暴露度从小到大的股票组合,可以看出除了VOLBT因子分组累计收益没有明显差异之外,其余的因子的分组累计收益均随着因子暴露度增加而减小,其中,STD和IVCAPM的第一组累计收益较高,IVFF-DOWN和IVCARHART因子的分组累计收益的差距明显。这说明股票的收益波动越大,其未来的预期收益越低,这和上面IC分析的结果是一致的。
图7.1 STD分组累计收益
图7.2 VOLBT分组累计收益
图7.3 IVCAPM分组累计收益
图7.4 IVFF分组累计收益
图7.5 IVFF-UP分组累计收益
图7.6 IVFF-DOWN分组累计收益
图7.7 IVCARHART分组累计收益
八、 总结
根据各个波动率因子的特征分析进行总结,STD因子的暴露度具有较强的持续性,而其他因子的暴露度持续性较差;
从相关性分析结果来看,特质波动率因子之间具有较高的相关性,而在其他测试中特质波动率因子的表现结果接近,所以在实际使用中,可以考虑将这些特质波动率因子合成一个因子;
行业分析表明,各因子的暴露度和平均IC的行业分布差异没有规律性,选股时建议进行行业中性化处理;
市值分析表明,各因子的暴露度和平均IC的市值分布差异没有规律性,选股时建议进行市值中性化处理;
IC分析和收益率分析的结果表示,STD因子对市场的反应程度不高,因子的有效性不高;VOLBT因子波动幅度大,受交易量影响大,因子较不稳定,在股灾期间有一定的指示性效果,特质波动率因子表现相似,其中IVFF、IVCARHART的趋势性较好,IVCAPM因子低暴露度的股票组合累计收益较高,IVFF-DOWN和IVCARHART因子的多空收益差较明显。
参考文献:《东方证券_20150909_因子选股系列研究之二:低特质波动,高超额收益》
《华泰单因子测试之波动率类因子》
《东方证券_20150626_因子选股系列研究之一:单因子有效性检验》
附录1 波动率因子的计算公式
附录2 波动率因子的IC/RANK-IC时间序列与对比图(时间窗口=6周)
图1 STD的IC时间序列图
图2 VOLBT的IC时间序列图
图3 IVCAPM的IC时间序列图
图4 IVFF的IC时间序列图
图5 IVFF-UP的IC时间序列图
图6 IVFF-DOWN的IC时间序列图
图7 IVCARHART的IC时间序列图
附录3 波动率因子暴露度的市值分布差异
图8 STD因子平均暴露度的市值分布差异
图9 VOLBT因子平均暴露度的市值分布差异
图10 IVCAPM因子平均暴露度的市值分布差异
图11 IVFF因子平均暴露度的市值分布差异
图12 IVFF-DOWN因子平均暴露度的市值分布差异
图13 IVFF-UP因子平均暴露度的市值分布差异
图14 IVCARHART因子平均暴露度的市值分布差异
附录4 波动率因子暴露度的行业分布差异
图15 STD因子平均暴露度的行业分布差异
图16 VOLBT因子平均暴露度的行业分布差异
图17 IVCAPM因子平均暴露度的行业分布差异
图18 IVFF因子平均暴露度的行业分布差异
图19 IVFF_DOWN因子平均暴露度的行业分布差异
图20 IVFF_UP因子平均暴露度的行业分布差异
图21 IVCARHART因子平均暴露度的行业分布差异
附录5 波动率因子平均IC的行业分布差异
图22 STD的IC行业分布差异
图23 VOLBT的IC行业分布差异
图24 IVCAPM的IC行业分布差异
图25 IVFF的IC行业分布差异
图26 IVFF-DOWN的IC行业分布差异
图27 IVFF-UP的IC行业分布差异
图28 IVCARHART的IC行业分布差异