SILVAngs:免费在线宏基因组扩增子分析系统
SILVAngs - rDNA-based microbial community analysis using next-generation
sequencing (NGS) data
简介
SILVAngs是著名rDNA数据库SILVA刚上线的一个功能插件,可以实现基于rDNA(包括16S/18S/ITS/23S/28S)扩增子高通量数据的在线自动化分析。
目的
本系统是对高通量rDNA扩增子测序数据的自动化分析流程。使用SILVA数据进行物种注释,可以注释更丰富的物种;而且免除用户本地安装软件和数据库的烦恼。
结果解读
先看结果好不好,再决定是否学习使用。
可以先用网站的demo帐号查看分析过程和结果。
结果,主要分为Chart Gallery(主要图表)、Figerprints(差异菌比较)和原始数据、参数和流程运行相关信息;
下图为Chart Gallery中的统计图形结果。
包括各步统计结果的可视化,如序列长度分布、序列分类、稀释曲线、OTU与参考序列相似度、比对相似度/质量等;每个图都可以放大查看或下载矢量图svg格式。
如下图:样品稀释曲线及其标准误差Figerprints面板可选择不同分类级别(Taxonomic depth),采用气泡图显示各组间的相对丰度(颜色)和数据量(大小)。
直接展示了样品或组间的差异菌种类或分类单元,气泡图一目了然。最右侧结果导出类型有4种,支持HTML,PDF,在线交互KRONA分类圈图,及所有文件下载。结果已经比较全面了,大家快点用起来吧。
下图为在KRONA分类学组成圈图,可操作展示不同分类级别。
工作流程
本系统的主要分析流程如下:
- 比对
- 质量控制
- 去冗余
- OTU聚类
- OTUs表生成和物种注释
输入数据要求: 建议每个样品使用干净的fasta文件,支持.gz压缩格式加速上传;
上图为5个fasta示例文件:在非登陆状态下,可使用demo用户体验分析系统。
使用方法
- 帐号注册:打开SiLVAngs主页:https://www.arb-silva.de/ngs 。第一次使用,请按要求注册,如果有学术邮箱(大学或科研单位邮箱)最好,因为本系统对学术免费。注册成功会收到**邮件,点击邮件中链接即**帐户并登陆。
- 新建项目:点击主页最上方My Project,再点Creat new新建项目;比如我创建名为”test”的项目;sequence type选择16S/18S SSU;Sequence technolog选择Illumina(MiSeq/HiSeq);expect sequence我填写100000 (根据项目数据量实际添写,数量越小分析越快),序列长度填写300 (根据引物区域计算);
- 上传文件 :点击Uplade file,选择本地干净的数据文件*.fa.gz(双端合并,且去除barcode和引物的序列),并点击upload。
- 参数设置:点击Setting选项卡,可以常用分析参数,如聚类相似度,默认98%;物种注释相似度最小值93%等,如下图。
- 执行分析流程:点击右侧的execute按扭,弹窗中再点击execute即开始分析。开始后你后收到任务开始的邮件。
- 等待分析结束后会再次收到邮件通知,点击链接,结果选项卡中会出现show result按钮;点击查看详细结果。
提示:可依赖的物种分类需要以下两方面
1. 采用BLAST最好结果分类是非常危险的:因为最佳匹配结果也可能序列相关较大;相似度是基因匹配部分而非全长。因此设定(序列相似+比对范围)/2 >=93。这一结果是经验值,可获得较折中的结果。
2. 本分析不采用NCBI末经人工校正的数据,错误太多。只使用SILVA中校正的数据集做注释和分类鉴定。
Reference
- Christian Quast, Elmar Pruesse, Pelin Yilmaz, Jan Gerken, Timmy Schweer, Pablo Yarza, Jörg Peplies, and Frank Oliver Glöckner. The SILVA ribosomal RNA gene database project: improved data processing and web-based tools. Nucleic Acids Research, 41(D1):D590-D596, 2013. doi: 10.1093/ nar/gks1219.
- Yilmaz P, Parfrey LW, Yarza P, Gerken J, Pruesse E, Quast C, Schweer T, Peplies J, Ludwig W, Glöckner FO (2014) The SILVA and “All-species Living Tree Project (LTP)” taxonomic frameworks. Nucleic Acids Research 42:D643-D648. Doi: 10.1093/nar/gkt1209
- Anna Klindworth, Elmar Pruesse, Timmy Schweer, Jörg Peplies, Christian Quast, Matthias Horn, and Frank Oliver Glöckner. Evaluation of general 16S ribosomal RNA gene PCR primers for classical and next-generation sequencing-based diversity studies. Nucleic Acids Research, 41(1):e1, 2013. doi: 10.1093/nar/gks808.
- Elmar Pruesse, Jörg Peplies, and Frank Oliver Glöckner. SINA: accurate high throughput multiple sequence alignment of ribosomal rna genes. Bioinformatics, 2012. doi: 10.1093/bioinformatics/bts252.
- 软件主页地址 https://www.arb-silva.de/ngs
- 英文原版使用手册下载 https://www.arb-silva.de/ngs/service/file/?file=SILVAngs_User_Guide_15_12_15.pdf
注:文中链接被微信屏蔽,点击文末”阅读原文”,访问链接更方便。
想了解更多16S/ITS/18S扩增子、宏基因组、宏转录组文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。
系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。