R语言 实验三 数据探索和预处理

R语言 实验三 数据探索和预处理

 

计算缺失值个数

计算缺失率

 R语言 实验三 数据探索和预处理

R语言 实验三 数据探索和预处理

 

简单统计量:计算最值

 R语言 实验三 数据探索和预处理

 

 

箱形图分析

 R语言 实验三 数据探索和预处理

 

 

分布分析:画出频率直方图

 R语言 实验三 数据探索和预处理

 

统计量分析:对于连续属性值,求出均值以及标准差

 R语言 实验三 数据探索和预处理

 

       

缺失值处理:删除法

 R语言 实验三 数据探索和预处理

 

 

去除无用属性:删除“ID”属性

R语言 实验三 数据探索和预处理

或者

 R语言 实验三 数据探索和预处理

 

 

离散化:把“Children”属性转换成分类型的两个值“YES”“NO”;把income属性按照节点12640.317390.12962243228.2离散化。

 

 R语言 实验三 数据探索和预处理