纵向LR+同态加密+feature binning方法
转自官方文档 FATE:新一代联邦学习技术及应用实战.PDF。
—————————————图示——————————————
—————————————说明——————————————
(一)算法步骤:
(1)guest把 {idi, Encry(yi), Encry(1-yi)},发送给host;
(2)host根据分箱情况,对于每个bin,计算{Encode(id_set_i),sum(Encry(yi)),sum(Encry(1-yi))}发送给guest;
(3)guest根据同态加密和标签的特性(0-1分类),guest可以计算出npos_i=Decry(sum(Encry(yi)));nneg_i= Decry(sum(Encry(1-yi)));
(4)guest可以计算出最后结果:WOE和IV值;distpos_i= npos_i/pos_total; distneg_i=nneg_i/neg_total. Woe_i= 100 * log(distpos_i/ distneg_i);IV =sum((distpos_i - distneg_i)*log(distpos_i/disneg_i)
(二)理解说明
(1)guest把label加密发过去,id是明文发过去;收到的host的计算结果后再解密,进而可以计算WOE;从而可以计算IV;
(2)对确定的feature字段,host根据自己的(或者约定好的)分箱规则和guest发过来的id,可以得到每个bin里面的id是多少,从而可以对每个bin里id对应的label求和(密文求和);然后把所有的箱子和它的label的和发给guest;
(3)这个分箱策略依赖于同态加密的特点和0-1分类问题的特点。