SILVAngs:免费在线宏基因组扩增子分析系统

SILVAngs:免费在线宏基因组扩增子分析系统
SILVAngs - rDNA-based microbial community analysis using next-generation
sequencing (NGS) data

简介

SILVAngs是著名rDNA数据库SILVA刚上线的一个功能插件,可以实现基于rDNA(包括16S/18S/ITS/23S/28S)扩增子高通量数据的在线自动化分析。

目的

本系统是对高通量rDNA扩增子测序数据的自动化分析流程。使用SILVA数据进行物种注释,可以注释更丰富的物种;而且免除用户本地安装软件和数据库的烦恼。

结果解读

先看结果好不好,再决定是否学习使用。

  1. 可以先用网站的demo帐号查看分析过程和结果。

  2. 结果,主要分为Chart Gallery(主要图表)、Figerprints(差异菌比较)和原始数据、参数和流程运行相关信息;
    下图为Chart Gallery中的统计图形结果。
    SILVAngs:免费在线宏基因组扩增子分析系统
    包括各步统计结果的可视化,如序列长度分布、序列分类、稀释曲线、OTU与参考序列相似度、比对相似度/质量等;每个图都可以放大查看或下载矢量图svg格式。
    如下图:样品稀释曲线及其标准误差
    SILVAngs:免费在线宏基因组扩增子分析系统

  3. Figerprints面板可选择不同分类级别(Taxonomic depth),采用气泡图显示各组间的相对丰度(颜色)和数据量(大小)。
    直接展示了样品或组间的差异菌种类或分类单元,气泡图一目了然。
    SILVAngs:免费在线宏基因组扩增子分析系统

  4. 最右侧结果导出类型有4种,支持HTML,PDF,在线交互KRONA分类圈图,及所有文件下载。结果已经比较全面了,大家快点用起来吧。
    下图为在KRONA分类学组成圈图,可操作展示不同分类级别。
    SILVAngs:免费在线宏基因组扩增子分析系统

工作流程

本系统的主要分析流程如下:
- 比对
- 质量控制
- 去冗余
- OTU聚类
- OTUs表生成和物种注释

输入数据要求: 建议每个样品使用干净的fasta文件,支持.gz压缩格式加速上传;
SILVAngs:免费在线宏基因组扩增子分析系统
上图为5个fasta示例文件:在非登陆状态下,可使用demo用户体验分析系统。

使用方法

英文原版使用手册下载

  1. 帐号注册:打开SiLVAngs主页:https://www.arb-silva.de/ngs 。第一次使用,请按要求注册,如果有学术邮箱(大学或科研单位邮箱)最好,因为本系统对学术免费。注册成功会收到**邮件,点击邮件中链接即**帐户并登陆。
  2. 新建项目:点击主页最上方My Project,再点Creat new新建项目;比如我创建名为”test”的项目;sequence type选择16S/18S SSU;Sequence technolog选择Illumina(MiSeq/HiSeq);expect sequence我填写100000 (根据项目数据量实际添写,数量越小分析越快),序列长度填写300 (根据引物区域计算);
    SILVAngs:免费在线宏基因组扩增子分析系统
  3. 上传文件 :点击Uplade file,选择本地干净的数据文件*.fa.gz(双端合并,且去除barcode和引物的序列),并点击upload。
  4. 参数设置:点击Setting选项卡,可以常用分析参数,如聚类相似度,默认98%;物种注释相似度最小值93%等,如下图。
    SILVAngs:免费在线宏基因组扩增子分析系统
  5. 执行分析流程:点击右侧的execute按扭,弹窗中再点击execute即开始分析。开始后你后收到任务开始的邮件。
    SILVAngs:免费在线宏基因组扩增子分析系统
  6. 等待分析结束后会再次收到邮件通知,点击链接,结果选项卡中会出现show result按钮;点击查看详细结果。
    SILVAngs:免费在线宏基因组扩增子分析系统

提示:可依赖的物种分类需要以下两方面
1. 采用BLAST最好结果分类是非常危险的:因为最佳匹配结果也可能序列相关较大;相似度是基因匹配部分而非全长。因此设定(序列相似+比对范围)/2 >=93。这一结果是经验值,可获得较折中的结果。
2. 本分析不采用NCBI末经人工校正的数据,错误太多。只使用SILVA中校正的数据集做注释和分类鉴定。

Reference

  1. Christian Quast, Elmar Pruesse, Pelin Yilmaz, Jan Gerken, Timmy Schweer, Pablo Yarza, Jörg Peplies, and Frank Oliver Glöckner. The SILVA ribosomal RNA gene database project: improved data processing and web-based tools. Nucleic Acids Research, 41(D1):D590-D596, 2013. doi: 10.1093/ nar/gks1219.
  2. Yilmaz P, Parfrey LW, Yarza P, Gerken J, Pruesse E, Quast C, Schweer T, Peplies J, Ludwig W, Glöckner FO (2014) The SILVA and “All-species Living Tree Project (LTP)” taxonomic frameworks. Nucleic Acids Research 42:D643-D648. Doi: 10.1093/nar/gkt1209
  3. Anna Klindworth, Elmar Pruesse, Timmy Schweer, Jörg Peplies, Christian Quast, Matthias Horn, and Frank Oliver Glöckner. Evaluation of general 16S ribosomal RNA gene PCR primers for classical and next-generation sequencing-based diversity studies. Nucleic Acids Research, 41(1):e1, 2013. doi: 10.1093/nar/gks808.
  4. Elmar Pruesse, Jörg Peplies, and Frank Oliver Glöckner. SINA: accurate high throughput multiple sequence alignment of ribosomal rna genes. Bioinformatics, 2012. doi: 10.1093/bioinformatics/bts252.
  5. 软件主页地址 https://www.arb-silva.de/ngs
  6. 英文原版使用手册下载 https://www.arb-silva.de/ngs/service/file/?file=SILVAngs_User_Guide_15_12_15.pdf

注:文中链接被微信屏蔽,点击文末”阅读原文”,访问链接更方便。

想了解更多16S/ITS/18S扩增子、宏基因组、宏转录组文献阅读和分析相关文章,快关注“宏基因组”公众号,干货第一时间推送。
SILVAngs:免费在线宏基因组扩增子分析系统

系统学习生物信息,快关注“生信宝典”,那里有几千志同道合的小伙伴一起学习。
SILVAngs:免费在线宏基因组扩增子分析系统