一步法中混合线性模型方程组构建和控制--blupf90

参考文献

http://nce.ads.uga.edu/wiki/lib/exe/fetch.php?media=singlestepblupf90.pdf

一步法中混合线性模型方程组构建和控制--blupf90

1,ABLUP VS SSGBLUP

传统ABLUP与SSGBLUP的区别在于,原来的A逆矩阵变为了H逆矩阵

一步法中混合线性模型方程组构建和控制--blupf90

传统的动物模型计算BLUP值

根据系谱计算A矩阵,然后使用Henderson方程组计算BLUP(EBV值)

一步法中混合线性模型方程组构建和控制--blupf90

SSGBLUP计算BLUP值

一步法中混合线性模型方程组构建和控制--blupf90

2,BLUPF90怎么进行SSGBLUP分析

  • RENUMF90进行命令对数据预处理
  • BLUPF90进行SSGBLUP的计算(已知方差组分时)
  • AIREMLF90进行SSGBLUP方差组分估算(未知方差组分时)
  • PREGSF90进行H逆矩阵的计算

一步法中混合线性模型方程组构建和控制--blupf90

2.1 renumf90预处理数据

一步法中混合线性模型方程组构建和控制--blupf90

2.2 blupf90计算H矩阵以及育种值

一步法中混合线性模型方程组构建和控制--blupf90

2.3 pregsf90计算H矩阵

主要作用:

  • 根据基因组数据构建G矩阵
  • 根据系谱构建A矩阵
  • 根据公式构建H逆矩阵

一步法中混合线性模型方程组构建和控制--blupf90

3, 构建H矩阵的参数设置

一步法中混合线性模型方程组构建和控制--blupf90

一步法中混合线性模型方程组构建和控制--blupf90

4, 基因组数据的筛选

一步法中混合线性模型方程组构建和控制--blupf90

5, 亲子鉴定的作用

一步法中混合线性模型方程组构建和控制--blupf90

6, G矩阵结果数据挖掘

6.1 检测异常个体

G矩阵中,某些个体对角线有较高的值, 有可能这个个体不是群体内的个体, 可能来源其它群体或者家系, 或者call rate值较低.

一步法中混合线性模型方程组构建和控制--blupf90

6.2 检测重复样本

如果某两个个体的亲缘关系大于0.9, 则表明这两个个体可能是重复样本

一步法中混合线性模型方程组构建和控制--blupf90

6.3 G矩阵和A22矩阵的关系

G矩阵和A22矩阵是相同个体构建的G矩阵和A矩阵, 他们应该是由很高的相似性. 如果对角线和非对角线相似度较低, 表明是有一些问题的. 需要引起重视, 可能是测序个体ID错误, 可能是数据量较少等等

一步法中混合线性模型方程组构建和控制--blupf90

6.4 根据基因组数据进行PCA分析

一步法中混合线性模型方程组构建和控制--blupf90

7, 构建A22矩阵时的高效方法

一步法中混合线性模型方程组构建和控制--blupf90

一步法中混合线性模型方程组构建和控制--blupf90

一步法中混合线性模型方程组构建和控制--blupf90

可以看出, 构建A22矩阵时, 使用57000系谱数据, 6500测序个体, Tabular用了311s, 内存占用12G, 而Colleau method用了45s, 内存占用322Mb. 使用Colleau方法更合适

一步法中混合线性模型方程组构建和控制--blupf90

8, 使用BLUPF90构建H逆矩阵输出

如果想要使用DMU, ASREML或者WOMBAT利用blupf90构建好的H逆矩阵, 需要输出Original ID的形式. 然后转化为DMU和ASREML的格式即可.

一步法中混合线性模型方程组构建和控制--blupf90

一步法中混合线性模型方程组构建和控制--blupf90