利用Excel处理OTU表
1 OTU表数据一维化(使用excel2016版本以上)
现在的数据有2个维度,OTU和样本,接下来我们要把维度降低到一维,只保留OTU这个维度,原样本信息以数据标签的形式标注在值的后面。
选择数据→从表格,这里会打开一个查询编辑器
将第一行设置为列名,选中第一列和最后一列,点转换,逆透视其他列
现在数据全都在一列了,原样本信息在属性列
开始→关闭并上载,
修改一下C列名称为sampleID后,新建一个sheet,将样本分组等信息录入
回到刚刚上载的数据表,在值列后面新建2列,protocol和goat,在protocol列任意一单元格内输入“=VLOOKUP([@sampleID], Sheet1!$A:$C,2,0)”,在goat列任意一单元格内输入“=VLOOKUP([@sampleID], Sheet1!$A:$C,3,0)”,得到这样一个表
接下来把物种注释信息拆分,选中OTUConTaxonomy列,剪切到最后一列,数据→分列,分隔符号选分号,完成
将列名分别命名为k,p,c,o,f,g,s,代表界门纲目科属种7个水平的注释结果
选中A1单元格,插入→数字透视表,将值2放入值框中,修改为求和项,将k放入列中,可见15个样本一共有479449条序列
接下来我们直接看属水平的注释结果,将g项放入列,删除k项。行中放入protocol.
点击列标签下三角,选其他排序选项,选中降序,改为求和项:值2
这里显示的的是序列的数量,我们可以修改成显示比例,选择求和项:值2下三角,值字段设置,值显示方式→行汇总的百分比
现在数据显示为相对丰度,且按照从大到小的顺序排列
现在想更直观的看一下数据,就要打开数据透视图,选择百分比堆积柱形图
直观的一看,处理还是很明显的
接下来我们要看一下处理对同一动物影响是不是一致的,将goat项放入行框中
结果还是相当的一致,YM处理降低了蓝色真菌(g__Orpinomyces)和橙色真菌(g__Caecomyces),对每个动物的的影响是一致的。结果怎么样,要导出结果用统计软件统计后才知道,下面整理数据。首先修改透视表的显示方式为列表,清除所有的汇总结果,并重复所有项目标签
将所有的样品信息内容放入行中,就得到以下表格,直接导出就可以进行统计分析了