Excel筛选某一单元格值重复次数大于特定值的记录(count函数的使用)——excel对问卷数据预处理

Excel筛选某一单元格值重复次数大于特定值的记录(count函数的使用)——问卷数据预处理

  • 在做一些社科类的研究的时候,经常会需要做问卷收集数据,收集数据之后呢,当然就是要对数据做一个预处理,在众多数据处理软件中,Excel是最便捷快速也是最容易入门的了,所以这篇文章里,我会介绍如何用excel对新收集的数据做一个剔除和预处理。

1、对于无效的数据——剔除

  • 无效数据有很多种情况,最普遍的就是不在你的问卷目标人群之内。所以这个时候就需要在我们的问卷中安排一块内容调查调查对象的基本情况,比如她的职业、年龄等等。
  • 之后在EXCEL中通过筛选剔除掉非目标人群的填写记录。

2、对于瞎填的数据——剔除

  • 首先,我们要判断一下,什么样的数据是瞎填的。当然了,现在有很多做问卷的网站都有甄别题这种,我们可以在做问卷的时候就留个心眼。比如下图这样:
    Excel筛选某一单元格值重复次数大于特定值的记录(count函数的使用)——excel对问卷数据预处理
  • 在通过甄别题剔除了部分数据之后,我们再把数据导出到Excel。再来判断瞎填的数据。一般呢更多的情况是看每条记录中的同一个选项的重复率,一般如果大于70%就要剔除掉。
  • 那这个重复率用Excel怎么实现呢。因为我收集的数据比较少,所以我就是用了,count()函数来算一个数量,再跟总题数对比, 重复次数高于一个值我就会把那条记录删掉。公式如下图:
    Excel筛选某一单元格值重复次数大于特定值的记录(count函数的使用)——excel对问卷数据预处理
  • 基本上通过这个 就能剔除大部分的瞎填数据了。