决策树之四:ID3.0算法实例2

可复制数据集在如下评论第一条!

决策树之四:ID3.0算法实例2

第1步计算决策属性的熵

S1  (买)  = 641
S2(不买)= 383
S=  S1+S2  = 1024
P1=641/1024= 0.625976563
P2=383/1024= 0.374023438

第二步计算各类属性的熵

分类属性共有4个。分别是年龄、收入、学生、信誉。
分别计算不同属性的信息增益

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

年龄信息增益=0.9537-0.6877=0.2660
收入信息增益=0.9537-0.9361=0.0176
学生信息增益=0.9537-0.7811=0.1726
信誉信息增益=0.9537-0.9048=0.0453

决策树之四:ID3.0算法实例2


决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2

决策树之四:ID3.0算法实例2