信息增益有的也成为信息获取量(Information Gain)。
这里主要介绍在决策树中的使用。
Gain(A)=Infor(D)−Infor_A(D)

这里以特征A为例,特征A的信息增益计算方式如下:
- 计算整个信息(就是计算是否买电脑)的熵:
Infor(D)=−(914log2(914)+514log2(514))=0.94bits
- 计算依照年龄分类时购买电脑的熵:
Inforage(D)=514×(−25log225−35log235)+⋯+514(−35log235−25log225)=0.694bits
- 按照公式计算:
Gain(age)=Infor(D)−Inforage(D)=0.94−0.694=0.246bits