对16S数据使用PICRUSt预测输出KEGG和COG表
step1 原材料:
1. OTU表
2. OTU.fasta
step2 利用qiime转换为GreenGene ID替换原来的OTU_num
#qiime 的 OTU 序列注释过程 assign_taxonomy.py -i otu.fasta -r gg_13_5_otus/rep_set/97_otus.fasta -t gg_13_5_otus/taxonomy/97_otu_taxonomy.txt --uclust_max_accepts 1 -o gg97 #根据具体的注释细节,对应 greengene id(这里用了一个手写的 R 脚本实现转换,在网盘附件中) grep 'H' gg97/otu_tax_assignments.log > gg97/otu_tax_assignments2.log Rscript replace_id.r gg97/otu_tax_assignments2.log otu_table.txt otu_table2.txt #转为 biom 格式 sed -i '1i\# Constructed from biom file' otu_table2.txt biom convert -i otu_table2.txt -o otu_table2.biom --table-type="OTU table" --to-json
step3 可选校正16S拷贝数
#校正 16S 拷贝数 normalize_by_copy_number.py -i otu_table2.biom -o normalized_otus.biom #转为 txt 表格 biom convert -i normalized_otus.biom -o normalized_otus.txt --to-tsv
step4 群落功能预测
#预测 KEGG 功能 predict_metagenomes.py -i normalized_otus.biom -o ko.biom -a nsti_ko.txt #转为 txt 表格(分别为 KO 层级和 KO 功能描述) biom convert -i ko.biom -o ko_pathways.txt --to-tsv --header-key KEGG_Pathways biom convert -i ko.biom -o ko_description.txt --to-tsv --header-key KEGG_Description #预测 COG 功能 predict_metagenomes.py -i normalized_otus.biom -o cog.biom -a nsti_cog.txt --type_of_prediction cog #转为 txt 表格(分别为 COG 层级和 COG 功能描述) biom convert -i cog.biom -o cog_category.txt --to-tsv --header-key COG_Category biom convert -i cog.biom -o cog_description.txt --to-tsv --header-key COG_Description