您的位置: 首页 > 文章 > 试将对缺失值的处理机制推广到基尼指数的计算中去 试将对缺失值的处理机制推广到基尼指数的计算中去 分类: 文章 • 2025-01-09 22:49:52 试将对缺失值的处理机制推广到基尼指数的计算中去 基尼指数的定义 基尼值:用于描述数据集的纯度,Gini(D)越小说明数据集D的纯度越高 其中,p_k是指样本集合D中第k类样本所占的频率。 属性a的基尼指数: 在候选属性集合A中,选择那个使得划分后基尼指数最小的属性作为最优划分属性。即 基于基尼指数算法处理缺失值 (参考了《机器学习》——周志华)基于上述定义,我们将基尼指数的计算式推广为