对16S数据使用PICRUSt预测输出KEGG和COG表

step1  原材料:

1. OTU表 

对16S数据使用PICRUSt预测输出KEGG和COG表

2. OTU.fasta

对16S数据使用PICRUSt预测输出KEGG和COG表

 

step2  利用qiime转换为GreenGene ID替换原来的OTU_num

#qiime 的 OTU 序列注释过程
assign_taxonomy.py -i otu.fasta -r gg_13_5_otus/rep_set/97_otus.fasta -t gg_13_5_otus/taxonomy/97_otu_taxonomy.txt --uclust_max_accepts 1 -o gg97 
 
#根据具体的注释细节,对应 greengene id(这里用了一个手写的 R 脚本实现转换,在网盘附件中)
grep 'H' gg97/otu_tax_assignments.log > gg97/otu_tax_assignments2.log
Rscript replace_id.r gg97/otu_tax_assignments2.log otu_table.txt otu_table2.txt
 
#转为 biom 格式
sed -i '1i\# Constructed from biom file' otu_table2.txt
biom convert -i otu_table2.txt -o otu_table2.biom --table-type="OTU table" --to-json
 

step3  可选校正16S拷贝数

 

  #校正 16S 拷贝数 normalize_by_copy_number.py -i otu_table2.biom -o normalized_otus.biom #转为 txt 表格 biom convert -i normalized_otus.biom -o normalized_otus.txt --to-tsv

对16S数据使用PICRUSt预测输出KEGG和COG表

 

step4   群落功能预测

#预测 KEGG 功能
predict_metagenomes.py -i normalized_otus.biom -o ko.biom -a nsti_ko.txt
#转为 txt 表格(分别为 KO 层级和 KO 功能描述)
biom convert -i ko.biom -o ko_pathways.txt --to-tsv --header-key KEGG_Pathways
biom convert -i ko.biom -o ko_description.txt --to-tsv --header-key KEGG_Description
 
#预测 COG 功能
predict_metagenomes.py -i normalized_otus.biom -o cog.biom -a nsti_cog.txt --type_of_prediction cog
#转为 txt 表格(分别为 COG 层级和 COG 功能描述)
biom convert -i cog.biom -o cog_category.txt --to-tsv --header-key COG_Category
biom convert -i cog.biom -o cog_description.txt --to-tsv --header-key COG_Description

 

对16S数据使用PICRUSt预测输出KEGG和COG表