参考基因组及注释文件如何下载?
从三大核酸数据库NCBI、Ensembl、UCSC 下载参考序列及注释文件
0.人类基因组版本对应关系
NCBI | Ensembl | UCSC |
GRCh36 | release_52 | hg18 |
GRCh37 | release_59/61/64/68/69/75 | hg19 |
GRCh38 | release_76/77/78/80/81/82 | hg38 |
1.NCBI
人类基因组
GRCh38(默认):
文末
GRCh37:
文末
GRCh36及其他版本:
文末
常用的GRCh37基因组大小压缩约900Mb,解压后约3G。人类的注释文件一直在更新,默认为GFF3格式。gff和gtf格式文件关系及相互转换见:
也可以通过NCBI的genome数据库下载,默认是GRCh38,若要下载其他版本,直接检索关键词。
如输入GRCh37或hg19: