数据清洗

1. to_datatime 转化成时间类型

数据清洗

转换成时间类型,要通过format 指定之前的格式

数据清洗

转换后可以看到Boarding_time 变成 datatime64类型

数据清洗

2. astype 转化成其他类型,如这里转化成浮点型

数据清洗

3. duplicated 查看重复值

数据清洗

drop_duplicates 去重, inplace = True 表示更改数据源data

数据清洗

4. 空值

isnull 判断哪个位置为空,用any判断哪列有空值

数据清洗

 dropna 删除空值

数据清洗

 fillna 将空值替换成其他值,如gender 取众数,age取平均值,income取中位数

数据清洗