GAGE:基因组组装评估的金标准
欢迎关注"生信修炼手册"!
GAGE全称Genome Assembly Gold-Standard Evaluations,该项目选取了4个物种,然后用常用的几款基因组组装软件分别进行组装,最后对所有组装结果进行评估,为选取基因组组装软件提供了参考 。
官网如下:
http://gage.cbcb.umd.edu/index.html
该项目组织了基因组组装方面的专家团队,对以下4个物种的基因组组装效果进行了评测
Staphylococcus aureus
Rhodobacter sphaeroides
Human (e.g. chromosome 14)
Bombus impatiens (a species of bee)
对于组装而言,最核心的问题是组装软件和参数的设置,GAGE 评估了以下8款软件
AByss
ALLPATHS-LG
Bambus2
Celera Assembler
MSR-CA
SGA
SOAPdenovo
Velvet
官网提供了上述四个物种的原始序列,可以用于下载测试,链接如下
http://gage.cbcb.umd.edu/data/index.html
官网还开源了不同组装软件的用法和参数设置,链接如下
http://gage.cbcb.umd.edu/recipes/index.html
以soapdenovo
为例,结果如下
对于不同物种不同软件的组装结果,从contig和scaffold 两方面进行了评估。以human
为例,评估结果如下
对于一个组装结果而言,其组装序列数目越小,N50越大,说明组装效果越好。从上表可以看出,Allpaths-LG的组装效果是最好的。
GAGE不仅为选取组装软件提供了参考,同时也可以作为一个基因组组装的学习资源。官网提供了测序序列,也提供软件运行的代码,我们只需要照着分析,就可以完成基本的分析工作了。
扫描关注微信号,更多精彩内容等着你!