参考基因组及注释文件如何下载?

从三大核酸数据库NCBI、Ensembl、UCSC 下载参考序列及注释文件

0.人类基因组版本对应关系

NCBI Ensembl UCSC
GRCh36 release_52 hg18
GRCh37 release_59/61/64/68/69/75 hg19
GRCh38 release_76/77/78/80/81/82 hg38

 1.NCBI

人类基因组

GRCh38(默认):

文末

GRCh37:

文末

GRCh36及其他版本:

文末

 

常用的GRCh37基因组大小压缩约900Mb,解压后约3G。人类的注释文件一直在更新,默认为GFF3格式。gff和gtf格式文件关系及相互转换见:

也可以通过NCBI的genome数据库下载,默认是GRCh38,若要下载其他版本,直接检索关键词。

如输入GRCh37或hg19:

参考基因组及注释文件如何下载?

 

 

地址及文章剩余内容<<<<