用python进行数据分析:时间戳的处理

python:时间戳处理

时间戳

时间戳脱敏后的恢复,格式处理,数据清洗,数据分析(两种时间提取方法)

数据来自科大讯飞算法营销大赛,处理时间数据的目的是为了探索时间与广告点击率的关系。
用python进行数据分析:时间戳的处理
(文章内出现的df_info与df_new_new视为等同)
1.将脱敏后的时间恢复为正常时间格式
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理

时间值的提取以及可视化分析

维度一:小时

2.在这里我们选择小时的单位来进行分析探索,提取hour
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
3.将hour的ge是转化为整数型后,简单探索下hour
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
4.我们将时间分桶,按时间段来探索数据
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
5.探索不同时间段内广告点击率的情况,可视化信息
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
6.来看下曝光量和点击量的情况,这里我们在python中得出数据,在其他软件中制作图表。
用python进行数据分析:时间戳的处理

7.总结(一):
1.除深夜凌晨时段外,其他时间段广告点击率表现良好均超0.2。
2.晚间6点至9点的曝光率最高,白天的点击量均等。

维度二:工作日与周末

这里,维度二的处理将用另外一种数据清洗方法。

1.确保要提取数据的一列格式为datetime
用python进行数据分析:时间戳的处理
2.提取weekday信息
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
3.处理weekday数据,新建一列判断是否周末
用python进行数据分析:时间戳的处理
4.顺便提及int32与int64的转化,用np.int64
用python进行数据分析:时间戳的处理
5.得出一系列数据,利用其它软件进行数据可视化
用python进行数据分析:时间戳的处理
用python进行数据分析:时间戳的处理
6.总结(二):
1.工作日与周末的平均点击率几乎均等,工作日略高。
2.工作日与周末的平均每日曝光量与每日点击量均等。
3.工作日与周末的差别对广告点击率的影响几乎没有。