用excel进行数据分析(一)
一、基础操作
数据分析的定义
- 简单来说,数据分析就是对数据进行分析
- 专业的说是指用适当的统计方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化的开发属功能,发挥数据的 作用。
数据分析的工作流程
- 明确分析目的和思路
- 数据收集
- 数据处理
- 数据分析
- 数据展示
- 报告撰写
excel中数据分析的插件
- power query 数据的查询和清洗
- power view 交互式报表
- power pivot 数据建模
- power map 三维地图
基本数据导入
- 文本导入
- web导入
- access导入
数据的清洗与转换
条件格式的使用
- 色阶
- 简化版的热力地图,用于识别数据整体的终点关注区间
- 颜色渐变区间
- 图标集
- 分类图示,标示数据属于哪一个区域当前的状态
- 数据范围/图标种类
- 迷你图
- 提供对数据的形象表示
- 可以显示数值系列中的趋势
- 数据条
- 查看某个单元格相对于其他单元格的值
合并计算
- 去重
- 在任意一列旁边添加一个数字
- 在选择添加位置的时候,要选择添加数字的那列
- 标签选择最左侧
- 求和
- 随机函数
- randbetween(最小值,最大值)
函数
- 函数输入要满足的条件
- 输入表达式前需输入"="
- 括号必须成对出现
- 参数中需使用英文状态下的逗号
- 最基本的函数
- sum 求和
- average 平均值
- max 最大值
- min 最小值
- count 对数值的计数
- counta 对文本的计数
if函数
- 基础if函数
- if(logical_test,value_if_true,value_if_false)
- if(判断的逻辑值,满足的为真的条件,不满足的条件)
- sumif 带条件的求和
- sumif(range,criteria,sum_range)
- range 范围
- criteria 条件
- sum_range 求和的范围
- sumif(range,criteria,sum_range)
- sumifs(sum_range,criteria_range1,…)
- sum_range 和的范围
- criteria_range1 第一个条件的范围
- averageif 带条件的平均值
- range 范围
- criteria 条件
- average_range 平均值的范围
- averageifs 多个条件的平均值
- average_range 平均值的范围
- criteria_range 第一个条件的范围
- countif 计数的范围
- 范围
- 条件
- countifs 满足多个条件的计数
- countifs(criteria_range,criteria1…)
- 条件1的范围
- 条件1…
- rank 排名
- rank(number,ref,[order])
- number 条件1
- ref 条件的范围
- []中的内容可有可无 asc 升序 desc 降序
闰年判断
=IF(OR(AND(MOD(H21,4)=0,NOT(MOD(H21,100)=0)),MOD(H21,400)=0),“闰年”,“平年”)
文本函数
- 提取
- left 左侧提取
- left(文本,要提取的数值)
- right 右侧提取
- right(文本,要提取的数值)
- mid 中间提取
- mid(文本,从第几个开始,提取几个)
- 转换
- upper 将英文小写转大写
- lower 将英文大写转小写
- 合并
- &
- concatenate 直接添加文本
- 查找
- find 精确查找
- find(查找的文本,源文本,从第几个开始)
- search 模糊查找
- search(查找的文本,源文本,从第几个开始)
- 替换
- replace
- replace(源文本,从第几个开始,替换的数值,新文本)
- subsistute
- subsistute(文本,源文本,新文本)
- 重复
- rept
- rept(跟重复的次数)
数据函数
- vlookup 列查找
- lookup_value 用谁去找
- table_array 去哪找(表的区域)
- col_index_num 找的范围
- range_lookup (0 精确 1 模糊)
- hlookup 行查找 (使用方法同上)
- indirect 设置二级下拉菜单
- indirect(通过谁查找)
- match 获取某个数据在所有数据的位置
- match(用谁去找,找的范围,排序)
- match_type=1 lookup_array为升序排序
- match_type=-1 lookup_array为降序排序
- match_type=0 lookup_array为无序 (可以省略)
- index 通过坐标找数值
- index(表的区域,行坐标,纵坐标)
数据透视表
创建数据透视表
透视表
显示区域
数据透视表字段
数据透视图
柱形图 进行元素和元素之间的比较
条形图 元素多时使用
饼图 表现的是占比情况以及面积
折线图 表现的是趋势/走势(和时间有关)
散点图 表现的是相关关系