信息增益的计算

信息增益有的也成为信息获取量(Information Gain)。
这里主要介绍在决策树中的使用。
Gain(A)=Infor(D)Infor_A(D)
信息增益的计算
这里以特征A为例,特征A的信息增益计算方式如下:

  • 计算整个信息(就是计算是否买电脑)的熵:
    Infor(D)=(914log2(914)+514log2(514))=0.94bits
  • 计算依照年龄分类时购买电脑的熵:
    Inforage(D)=514×(25log22535log235)++514(35log23525log225)=0.694bits
  • 按照公式计算:
    Gain(age)=Infor(D)Inforage(D)=0.940.694=0.246bits