对某电商交易数据的分析(数据经后期加工处理,不造成任何隐私泄露问题)

  1. 数据来源:某电商真实交易数据,经过后期处理,不会造成任何隐私的泄露。
  2. 分析分为两步进行
    • 数据清洗:主要是基于numpy和pandas库来进行重复值的处理和空值的处理,以及一些异常值的清洗。
    • 数据分析:该部分以不同的维度来进行分析,包括以产品、城市为维度并以销量和GMV指标进行分析;以价格为维度,并使用cut来进行分桶处理;通过对不同渠道下的订单量和GMV进行排序和分析;以及下单的时间分布情况等进行了分析和可视化。
  3. 用到的主要技术有:unique()函数查询重复值,datetime()函数对时间类型进行转化,groupby()分组函数和排序函数的组合使用等,以及基于matplotib进行数据的可视化操作。
  4. 详细的清洗过程和分析过程如下:
    对某电商交易数据的分析(数据经后期加工处理,不造成任何隐私泄露问题)
  5. 结论
    1. 城市id为110001的销量与销售额最多,均排在第一位,其中销售额高达612.77万元,其次销售额排在第二的城市id为220002,销售额达440.67万元。缺陷则是由于数据不完整,无法匹配出城市id对应的城市名称。
    2. 该电商在暑期该电商在11月份受到淘宝天猫“双11”活动影响较大,需要针对此进行强有力的应对措施。