四种数据分析
描述性分析
- 定义
- 以组成事件的关键环节为基础,通过设置合理的指标对各环节进行量化,以达到还原事件的目的。同时可以根据科学的评价标准,发现事件发生过程中的异常。
- 分析目的
- 描述现实
- What-什么事件
- Who-谁参与的
- When-什么时候
- Where-在哪里
- Why-什么原因
- Result-结果是什么
- 发现问题—依据相应指标评判
- Good-好的结果?
- Bad-坏的结果?
- 描述现实
- 分析步骤—全链路描述分析方法
- 确定描述对象
- 明确业务目标,熟悉业务逻辑
- 分割业务环节,确定关键节点
- 利益关系人及关系人的关注点
- 确定可以描述分析对象的指标
- 确定指标的评价标准
- 要有对比
- 数据的展示
- 应用
- 监控现状
诊断性分析
没有找到具体原因的解决方案都是假方案
- 定义
- 根据业务逻辑,通过数据寻找引起最终结果的原因和可以改变未来结果的方法。
- 分析目的
- 解决问题
- 坏的结果—产生问题的原因和解决方案
- 发现机会
- 好的结果—在机会出现时发现机会
- 解决问题
- 分析步骤
- 确定问题的描述指标,以及指标的统计逻辑
- 确定指标的类别,是基础指标还是复合指标
- 对复合指标进行分解,分解到基础指标
- 公式法
- 对指标的描述对象进行分解,分解到基础对象
- 通过业务逻辑解释基础对象产生基础指标的原因
- 逻辑分析法——因果关系较为清晰,可通过业务逻辑或逻辑分析找到事情产生的原因
- 对比分析——通过对比分析找到分析因素可能产生的影响
- 相关性分析——多用于影响因素多或逻辑关系不明确的事件分析,通过分析因素与结果的相关性,找到可能影响结果的原因
- 应用
- 诊断问题
预测性分析
-
通过统计学、数据挖掘模型来对数据进行处理,发现隐藏的信息或预测分析对象的某些未知属性。
-
分析目的
- 挖掘机会
-
分类
- 确定对象属于哪一预定义的目标类
- 常见算法:SVM,逻辑回归
-
聚类
- 根据在数据中发现的描述对象的信息,将对象进行分组
- 常见算法:K-Means
-
关联分析
- 发现隐藏在大型数据集中的有意义的联系,如啤酒与尿布
- 相关指标支持度和置信度
- 常见算法:Apriori,FP-Tree
-
离群点检测
-
发现与其他对象不同的对象,如信用卡欺诈检测 、羊毛党识别、故障设备识别
-
检测方法
-
基于统计
-
基于邻近度,适用于二维、三维的数据
-
基于密度
-
-
-
- 挖掘机会
-
应用
- 预测未来
决策性分析
-
定义
通过数据分析,挖掘确定事件的最佳执行时间,以实现增加收入、降低成本、提升效率、控制风险的目的。
-
分析目的—实现目标
- 决策支持
- 现状及目前存在的问题
- 可以达成的最优目标
- 达成目标的方案
- 达成目标的收益和成本
- 输出分析报告,给出分析结论
- 决策系统
- 优化方案系统化
- 输出作业指令,指导作业
- 决策支持
-
应用
-
决策支持
-
案例
在巡视管理区域的时候你发现,门店的补货一直是门店经营的难题,
补货数量过多,会造成库存积压,给仓库带来存储压力。r而补货数量过
少,则销售有缺货的风险,影响销售。多个门店负责人向你抱怨补货不
合理带来的种种问题。你下定决心要解决这个老大难的问题,可是应该
怎么做呢? -
诊断分析
-
Q:怎样才算补货合理?
既能保证正常的销售,又不会导致缺货,库存周转率在25天左右已经算业内非常好的库存管理水平了。
-
Q:如何才能保证库存周转率在25天?
进货后商品的库存量满足25天的销量。
-
Q:怎么确定商品25天的销量是多少?
通过对每个商品的发货量进行预测。
-
Q:怎么确定商品不发生缺货?
系统下发补货指令,保证补货及时。
-
-
通过机器学习实现:
-