GAGE:基因组组装评估的金标准

欢迎关注"生信修炼手册"

GAGE全称Genome Assembly Gold-Standard Evaluations,该项目选取了4个物种,然后用常用的几款基因组组装软件分别进行组装,最后对所有组装结果进行评估,为选取基因组组装软件提供了参考 。

官网如下:

http://gage.cbcb.umd.edu/index.html

该项目组织了基因组组装方面的专家团队,对以下4个物种的基因组组装效果进行了评测

  1. Staphylococcus aureus

  2. Rhodobacter sphaeroides

  3. Human (e.g. chromosome 14)

  4. Bombus impatiens (a species of bee)

对于组装而言,最核心的问题是组装软件和参数的设置,GAGE 评估了以下8款软件

  1. AByss

  2. ALLPATHS-LG

  3. Bambus2

  4. Celera Assembler

  5. MSR-CA

  6. SGA

  7. SOAPdenovo

  8. Velvet

官网提供了上述四个物种的原始序列,可以用于下载测试,链接如下

http://gage.cbcb.umd.edu/data/index.html

GAGE:基因组组装评估的金标准

官网还开源了不同组装软件的用法和参数设置,链接如下

http://gage.cbcb.umd.edu/recipes/index.html
soapdenovo为例,结果如下

GAGE:基因组组装评估的金标准

对于不同物种不同软件的组装结果,从contig和scaffold 两方面进行了评估。以human为例,评估结果如下

GAGE:基因组组装评估的金标准

对于一个组装结果而言,其组装序列数目越小,N50越大,说明组装效果越好。从上表可以看出,Allpaths-LG的组装效果是最好的。

GAGE不仅为选取组装软件提供了参考,同时也可以作为一个基因组组装的学习资源。官网提供了测序序列,也提供软件运行的代码,我们只需要照着分析,就可以完成基本的分析工作了。

扫描关注微信号,更多精彩内容等着你!

GAGE:基因组组装评估的金标准