《深入浅出数据分析》读书心得与笔记
《深入浅出数据分析》 笔记
数据分析是怎么回
确认问题
找问题的提出人,确认清楚更细节性的问题。
分解
将数据和问题,分解成更小块的问题。 数据= 原始收据 + 汇总数据
统计效果的方法ps: 考虑清楚,所有的假设条件和别人给出的结论正确吗
1) 调查问卷方法
分类:
地域;
人群;
年龄段;
职业等等
2) A/B测试法
控制组和对照组对比:
二者的唯一区别在于比较因子(避免混杂因素);
3)寻找最大值/最优方案
目标函数;
约束条件;
约束变量之间的正向和反向联系;
客观因素的制约(例如,市场的吸收能力)
4) 假设检验
变量之间可以正相关也可以负相关;
列出所有可能的方案, 一一排除最不可能的--->剩下的方案,判断现有的证据对哪个方案的概率最大;
找出检验性最强的那个;
5)贝叶斯统计
6)主观概率
场景: n个人对m件事有多种看法
方案:
对n个人 分别统计 m件事的概率:p(n,m);
统计每个事件的概率的集中分布区域即可;
7) 启发法
场景: 直接用数据统计代价太大了(比如: 统一垃圾量减少)
方案:
以【启发树】方式,统计问卷的问题;
调查问卷(人们的意识提高);
根据问卷统计比例;
8)直方图
9) 回归方式进行预测