对某电商交易数据的分析(数据经后期加工处理,不造成任何隐私泄露问题)
分类:
文章
•
2024-08-14 16:56:16
-
数据来源:某电商真实交易数据,经过后期处理,不会造成任何隐私的泄露。
-
分析分为两步进行:
-
数据清洗:主要是基于numpy和pandas库来进行重复值的处理和空值的处理,以及一些异常值的清洗。
-
数据分析:该部分以不同的维度来进行分析,包括以产品、城市为维度并以销量和GMV指标进行分析;以价格为维度,并使用cut来进行分桶处理;通过对不同渠道下的订单量和GMV进行排序和分析;以及下单的时间分布情况等进行了分析和可视化。
-
用到的主要技术有:unique()函数查询重复值,datetime()函数对时间类型进行转化,groupby()分组函数和排序函数的组合使用等,以及基于matplotib进行数据的可视化操作。
- 详细的清洗过程和分析过程如下:
-
结论:
- 城市id为110001的销量与销售额最多,均排在第一位,其中销售额高达612.77万元,其次销售额排在第二的城市id为220002,销售额达440.67万元。缺陷则是由于数据不完整,无法匹配出城市id对应的城市名称。
- 该电商在暑期该电商在11月份受到淘宝天猫“双11”活动影响较大,需要针对此进行强有力的应对措施。