Excel基础之何为数据分析及思路
数据分析的定义及意义:
数据分析:是指通过恰当的统计方法和 可行的分析手段,对数据进行收集汇总,然后再加工处理。最后对处理过后的有效数据进行分析,通过数据发现有效的决策、可行的方案、现存问题,从而帮助人们采取更科学的行动 。
数据不局限于狭义上的“数字”,一切可分析的信息都能称之为数据,包括文字、图形、行为方式。
数据分析类型 (三类)
描述性统计分析 概括、表述事物关系
探索性数据分析 发现数据新征
验证性数据分析 对假设进行证实
数据分析的实际应用
分析现状 分析原因 进行预测
控制企业成本 留住核心客户 精准进货
数据分析6步法:
1. 目标导向
以目标为驱动的数据分析不仅可以保证信息收集的效率,还可以在数据分析时选择有效的分析方式和工具。
2. 数据收集
内部数据库: 企业、商家自成立以来建立起的数据库;
多网络平台会定期发布相关的数据统计;
现在有许多出版物中都可以查寻到相关的数据统计;
如果经过网络、出版物等多方查阅都无法收集到的数据,可以利用市场调查来进行;
有很多专业的数据机构,提供各行业、各种类数据获取服务(购买);
3. 数据处理
成功收集到原始数据往往比较杂乱、数据量大,此时需要对其进行数据处理;
数据处理的目的在于提高数据质量,手段包括对收集到的数据进行检查、清洗、转换、提取、计算;
经过处理的数据会更具准确性、更有规律,为数 据分析打下基础;
4. 数据分析
通常需要运用多种工具,如透视表、Excel中的数据分析工具,等等
5. 数据展现
数据展现的目的在于将枯燥的数据转化成图表等更直观的形象。数据展现有两个作用:
第一,帮助人们从抽象 、枯燥的数据中发现规律;
第二,在后期制作数据分析报告时,用直观的数据形象作为展现方式,帮助报告读者理解 数据信息。
6. 数据报告
扫除专业术语的障碍
平均数:
表示的是一组数据的集中趋势量数,其计算方法是这组数据所有之和再除以这组数据的个数 ;
众数:
众数是一组数据中出现次数最多的数值。在统计学中,众数代表着数据集中趋势。有时 在一组数值中,可能存在多个众数。具有一个众数的数据集合叫单峰(unimodal),二个 众数的数据集合叫双峰(bimodal);
中位数 :
指一组数据按照从大小顺序排列,处在最在中间的数据(或中间两个数据的 平均数)叫这组数据的中位数
绝对值与相对值:
在进行数据分析时,将绝对值与相对值相结合进行分析是常用的一种分析模型。
百分比与百分点 :
百分比也称为百分率或百分数,表示一个数是另一个数的百分之几,用百分号%来表示。而百分点指不同时间段百分比的变化幅度,1%的百分比变化幅度 =1个百分点。
比例与比率:
在统计学概念中,比例表示总体中部分数值与总体数值的比较,反映的是部分与整体的 关系。而比率表示总体中一部分数值与另一部分数值的比较,反映的是部分与部分的关系 。
同比与环比:
同比,指今年某个时期与去年相同时期的数据比较。
环比,指某个时期与前一时期的数据比较。
5种分析模型:
1. SWOT模型
SWOT模型又称态势分析法,该模型是20世纪80年代初由旧金山大学的管理学教授提出,是一种能够较客观而 准确地分析和研究一个单位现实情况的方法。 SWOT模型中,分为内部因素和外部因素。
内部因素包括,S代表 strength(优势),W代表weakness(劣势 );
外部因素包括,O代表opportunity(机会),T代表threat(威胁)。
2 .PEST模型
PEST模型指的是企业宏观环境的分析模型,其中,P是政治(politics),E是经济(economy),S是社会(society) ,T是技术(technology)。
该模型适合用来分析企业集团所处的客观背景。
3. 5W2H模型
5W2H模型又叫七问分析法 ,该模型简单、方便、容易理解 ,且富有启发意义。广泛应用于企业问题分析、决策措施的寻找 、疏漏问题弥补等情况的数据分析。
4. 4P营销模型
4P营销理论模型是随着营销组合理论的提出而出现的,产生于20世纪60年代的美国。该模型常用于企业营销状况 分析、商品销售策略分析。
4P营销模型由4个要素构成,即产品(Product)、价格(Price)、渠道(Place)、宣传(Promotion)。
5. 逻辑树模型
逻辑树模型又称问题树、演绎树或分解树模型。是一种通用的分析模型,广泛适合于各种情况下的问题分析,作用在于层层分解、追本溯源,找到问题的症结所在。
逻辑树的基本结构是,从最高层开始,逐步向下扩展分解。即将一个已知的大问题当成最高层,然后考虑与该问题相关的因素,每考虑到一个点,就添加一根“树枝”,以此类推,将每个问题都细化到最小处,最终形成一颗“逻辑树 ”。
3个学习数据分析的优秀网站
艾瑞网——学习分析思路、报告撰写方法
网易数读——学习数据展现
.UED——学习数据分析在用户研究上的应用
数据分析的11种思路
1. 发现走势:预测的思路
预测分析实质是根据现在和过去的数据进行未来趋势预测;
关键点:
一是数据在时间上的连续性,二是数据的 数量,三是数据的全面性,
时间点上的数据越多、连续性越高、全面性越好,预测结果越准确。
2. 理清关系:交叉的思路
简单的交叉分析法是建立在纵向分析法和横向分析法的基础上,从数据交叉的点出发,进行数据分析。
总而言之,通过数据交叉分析的思路,可以:(1)理清数据间的关系;(2)快速分析每个交叉点的值; (3)方便地对数值进行求和计算;(4)将注意力集中在目标数据项上。
3. 验证结论:假设的思路
1.基本思路 数据分析的实际运用时,会遇到这样的情况:目标分析对象的样本数量太大或者是无法获取全面,只能通过 样本分析总体情况。如某大型网站进行了改版设计,现在需要调查改版是否影响了销量。于是统计了改版前 后15天的销量数据,并做出假设,然后利用数据计算检验假设是否正确。
2.检验方法 在前期假设分析过程中,确定了原假设和备设假设,接下来就需要选定统计方法来验证哪个假设是客观正确 的。根据数据的类型和特点,可以选择T检验、Z检验、卡方检验等方法。其中T检验和Z检验是比较常用, 也可以利用Excel工具进行方便分析的两个方法。
4. 判断好坏:对比的思路
对事物做出客观判断是数据分析的主要目的,判断的主要方法之一便是依靠事物的对比。有对比才能识别数据的 差异,发现表现优秀的数据项目、找到数据下滑的项目、不符合标准的数据项目、最好和最差的项目。
5. 万物归宗:分组的思路
数据分组的第一步便是要确定分组依据。同一份数据,可以有多种分组方法,关键在于分组是否有实际意义, 是否对分析有用。分组依据决定了数据分析的后期过程及结果。
6. 查看比例:概率的思路
互斥事件的概率
当事件A和事件B只会发生其中一种事件时,这两种称为互斥事件,互斥事件的概率相加为100%。
相互事件的概率
互斥事件的概率分析往往比较简单。然而现实生活中,很多事件是相互关联和影响的;
7. 指标为王:平均的思路
关注数据的平均数,是数据分析的重要方法。使用平均数指标,可以了解数据的大体情况,也可以对比 单项数据的表现。
8. 客观评价:指标综合的思路
在数据分析中,对比分析、概率分析、平均分析,此类分析法都建立在比较单一的情况下。但是随着情况的复杂 性加强,这类分析简单问题的思路似乎不再适用。例如评价企业员工的好坏,发现各有所长,却又都有缺点。那 么谁更优秀,如何判断?
第一步:确定指标
第二步:收集指标数据/信息
第三步:确定指标权重
第四步:完成综合计算
9. 追根溯源:杜邦分析的思路
杜邦分析的核心
是将企业的权益净利率使用结构化的相关因素表现出来,并通过加减乘除等运算符号体现因素间 的内在联系。有助于企业管理层更加清晰地看到权益资本收益率的决定因素、销售净利润率与总资产周转率、债 务比率之间的相互关联关系。
杜邦分析的广泛应用
杜邦分析的思路最早运用在企业资产分析,但是找到项目的各项影响因素,并结构化地呈现,这种基本思路可以 广泛应用于现代各行各业的数据分析中。
10. 找到症结:漏斗分析的思路
寻找问题原因,找到多个环节中出纰漏最大的一步,建议使用漏斗分析的思路。 漏斗分析是流程式的数据分析思路,能够科学、全面、流程化地反映对象从开始到结束的各阶段状态,通过比较 各状态,找到问题阶段所在,做出针对性改进措施。漏斗分析的思路被广泛应用于网站数据分析、电商数据分析 、流量监控、目标转化等领域中。
11. 具有全局观:象限分析的思路
常规象限分析法
常规的象限分析法适用两个因素相互作用的情况。例如网站商品的销量情况,与商品的流量和收藏量有关,两者 相互影响。在这两种因素的作用下,商品就会出现四种不同的类型
象限分析法拓展
在常规象限分析法中,可以发现一个弊端。那就是只能从两个维度分析对象的情况。例如上面的例子中,只能分 析商品的流量和收藏量。可是流量大收藏量也不能百分之百说明商品的销量就会大,销量也是衡量商品是否有前 途的重要因素。如何将销量的维度加入到象限分析过程中?这就需要在常规象限分析的基础上进行拓展。常规象 限分析用小圆点的X、Y坐标来表示数据的两个维度,如果改变圆点的大小,就可以增加第三个维度,即用圆点 大小来体现销量大小。
6个数据分析基本工具
海量数据的克星——数据透视表
让抽象数据直观展现的利器——图表
简单工具也能有大用处——条件格式
麻雀虽小五脏俱全——迷你图
数据归类统计利器——分类汇总
交互式数据可视化工具——Power BI