学习笔记 | 《谁说菜鸟不会数据分析》| 第1章 数据分析那些事
第1章 数据分析那些事
数据分析三字经:
1⃣️ 学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新;
2⃣️ 方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手;
3⃣️ 分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议。
1.1 数据分析是“神马”
1.1.1 何谓数据分析——对数据进行分析
-
数据分析
是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。 -
数据分析
是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。(这里的数据也称观测值,是通过实验、测量、观察、调查等方式获取的结果,常常以数量的形式展现出来。) -
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,从而帮助管理者进行判断和决策,以便采取适当策略和行动。
1.1.2 数据分析的作用——“从矿山中挖掘出金子”
1.2 数据分析六步曲
1.2.1 明确分析目的和思路
- 明确目的,一切以解决问题为中心。
- 目的明确后,梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
- 最后确保分析框架的体系化(以营销、管理等理论为指导,结合实际业务情况,搭建分析框架),使分析结果具有说服力。
营销方面的理论模型有:
4P
、用户使用行为
、STP理论
、SWOT
等管理方面的理论模型有:
PEST
、5W2H
、时间管理
、生命周期
、逻辑树
、金字塔
、SMART原则
等
1.2.2 数据收集
数据收集
是按照确定的数据分析框架,收集相关数据的过程。
- 它为数据分析提供了素材和依据。
-
一手数据
:指可直接获取的数据。 -
二手数据
:指经过加工整理后得到的数据。
一般数据源
主要有一下几种方式:
- 数据库
- 公开出版物
- 互联网
- 市场调查:作为参考
1.2.3 数据处理
数据处理
是指对收集到的原始数据进行加工整理,形成适合数据分析的样式,并且保证数据的一致性和有效性。
-
数据处理
主要包括数据清洗
、数据转化
、数据提取
、数据计算
等处理方法。 -
数据处理
是数据分析
的基础,是数据分析
前必不可少的阶段。
1.2.4 数据分析
数据分析
是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。
-
数据挖掘
是一种高级的数据分析方法。 -
数据挖掘
侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。
1.2.5 数据展现
一般情况下,数据通过表格
和图形
的方式来呈现的。
常用的数据图表包括:
饼图
柱形图
-
条形图
???? 折线图
散点图
雷达图
可以对这些图表进一步加工整理,变为金字塔图
、矩阵图
、漏斗图
、帕累托图
等。
1.2.6 报告撰写
数据分析报告
其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,供决策者参考。
- 一份好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。
- 结构清晰、主次分明可以使阅读者正确理解报告内容;
- 图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
- 另外,数据分析报告需要有明确的结论。
- 最后,好的分析报告一定要有建议或解决方案。
1.3 数据分析的三大误区
⚠️分析目的不明确,为分析而分析。
⚠️缺乏业务知识,分析结果偏离实际
⚠️一味追求使用高级分析方法,热衷研究模型
1.4 数据分析师的职业发展
1.4.1 数据分析的广阔前景
将数据转化为知识、结论和规律,就是数据分析的作用和价值。
1.4.2 数据分析师的职业要求
- 懂业务:数据敏感的体现。
- 懂管理:作用是针对数据分析结论提出有指导意义的分析建议。
- 懂分析:掌握数据分析的基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效地开展数据分析。
- 懂工具:Excel、Access 、SPSS、SAS等
-
懂设计:图表????的设计遵循一定的设计原则。
1.4.3 数据分析师的基本素质
- 态度严谨负责:保持中立立场,客观评价企业在发展过程中存在的问题,为决策层提供有效的参考依据。
- 好奇心强烈:积极主动地发现和挖掘隐藏在数据内部的真相、刨根问底找寻结果不是预期的原因。
- 逻辑思维清晰:结构为王。
- 擅长模仿学习:非直接照搬。
- 勇于创新
1.5 几个常用指标和术语
平均数
- 它的特点是将总体内各单位的数量差异抽象化、代表总体的一般水平,掩盖了总体内各单位的差异。
绝对数与相对数
-
绝对数
是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。 -
相对数
是指两个有联系的指标对比计算而得到的数值,用以反应客观现象之间数量联系程度的综合指标。 -
相对数
一般以倍数、成数、百分数等表示。
百分比与百分点
-
百分点
是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。
频数与频率
-
频数
是指一组数据中个别数据重复出现的次数。 - 频数是绝对数,频率是相对数。
比例与比率
-
比例
是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。 -
比率
是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。
倍数与番数
-
番数
是指原来数量的2的N次方倍。 - 比如,翻一番为原来数量的2倍,翻两番为4倍。
同比与环比
-
同比
是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。 -
环比
是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。