不同真菌物种注释数据库对群落组成的影响

不同真菌物种注释数据库对群落组成的影响

Journal:Biology and Fertility of Soils

IF=3.788

Corresponding authors: Qirong Shen &James M. Tiedje


背景

本文以三种生物燃料作物的根际真菌群落为研究对象,考察了不同参考数据库对得到物种的影响。

三种数据库:Unite, warcupLSU

引物:ITS9 (GAACGCAGCRAAIIGYGA) /ITS4 (TCCTCCGCTTATTGATATGC) 扩增ITS2;

LR3 (CCGTGTTTCAAGACGGG) LR0R (ACCCGCTGAACTTAAGC) 扩增 LSU;

LSU区域在454上测序,ITSIllumina Miseq上测序。

数据处理

RDPipeline (http://pyro.cme.msu.edu中进行数据处理。去除低质量序列(Q score < 20 for LSU and < 26 for ITS reads) 和短序列(length < 220 bp). Uchime 去除嵌合体. Resample数为 4217。

LSU序列和LSU 数据库比对,数据库包含11,442 条序列,1895 个属。ITS 序列分别和UNITE Warcup数据库比对。 Warcup 数据库包含17,923 条序列,1461个属, UNITE数据库包含145,019条序列,2137个属。

结果

1. UNITE鉴定出的物种数量最多,未鉴定的物种百分比也最多。移除了未鉴定的物种后,LSU鉴定的比例最高,其次是WarcupUNITE

不同真菌物种注释数据库对群落组成的影响

Fig. 1 LSU, UNITE, Warcup从门到属可鉴定的比例

2. LSU覆盖度较低。UNITEWarcup这两个ITS区域的数据库得到的群落更相似。不同数据库覆盖度不同,相同序列用不同的数据库得到的群落也会有差异。

不同真菌物种注释数据库对群落组成的影响

Fig. 2 UNITE, WARCUP, LSU 门到属独有和共有的物种数

3. PERMANOVAMRT表明植物类型(一年 vs 多年生)是驱动群落变化的主要动力。MRT中占据了第一次分枝。WarcupLSU其次按照生物燃料类型分开,最后是采样时间。而UNITE先按照时间最后按照生物燃料类型。

不同真菌物种注释数据库对群落组成的影响

不同真菌物种注释数据库对群落组成的影响

不同真菌物种注释数据库对群落组成的影响

Fig. 3 LSU, UNITE, Warcup属水平上的多元回归树Multipleregression tree (MRT)

4. Beta多样性在三个数据库无显著差异。而三种生物燃料及旱季或者雨季之间的差异很大,和数据库无关。

作者讨论

虽然ITS可以精确到种,但是只有小部分的序列达到了这个标准(35.1% Warcup, 16.3% UNITE)。且ITS的物种信息存在更多的冲突,这可能是因为ITS序列更多造成的。

不同数据库侧重点不同。Warcup侧重植物相关的真菌,UNITE致力于提高所有真菌类群的覆盖度。LSU有着更好的系统发育等级。

只有不到50%的属在不同数据库之间共享,表明了数据库对物种分类影响很大。但是不同数据库分类的模式(pattern)相同,表明对群落beta多样性影响不大。

我的一些想法

1. 该文章讨论了不同数据库对物种注释带来的影响。但是观测到的影响到底是数据库的差异还是引物带来的差异呢?ITSLSU每个区域都只选择一对引物,不同引物对之间的偏好性可能已经很强了。本来引物扩增的物种就不一样,再经过不同数据库的放大,我们看到的差异可能就更大了。

2. Resample数只有4127,太少了。文中也没有稀释曲线,不清楚测序深度如何。但是看resample数应该不够。

[1]  Xue C, Hao Y, Pu X, et al. Effect of LSUand ITS genetic markers and reference databases on analyses of fungalcommunities [J]. Biology andFertility of Soils, 2018.


一个环境工程专业却做生信分析的深井冰博士,深受拖延症的困扰。想给自己一点压力,争取能够不定期分享学到的生信小技能,亦或看文献过程中的一些笔记与小收获,记录生活中的杂七杂八。

欢迎大家扫描下方二维码关注我的公众号,若有问题也可直接加我的微信:水岸风堤(lii32703)。

欢迎分享,转载请联系我。

不同真菌物种注释数据库对群落组成的影响

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外3000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

不同真菌物种注释数据库对群落组成的影响

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

不同真菌物种注释数据库对群落组成的影响