为什么GEO2R/GEOquery的结果可能是错的?

为什么GEO2R/GEOquery的结果可能是错的?

在准备GEO/TCGA培训时,因为数据部分来自NCBI GEO数据库,就系统梳理了GEO数据库的结构和存储方式,顺便也看了GEO2R的使用。然后就发现了一个问题,可能直接使用GEO2R的分析结果是错误的。

原因见下图 (官网介绍截图)

为什么GEO2R/GEOquery的结果可能是错的?

而GEO2R的R代码使用的是GEOquery获取GSEMatrix,所以如果我们自己写代码这样获取非原始数据时,也有可能得到的数据是不可比的。

为什么GEO2R/GEOquery的结果可能是错的?

所以,还是建议使用工具或命令之前,好好读一下帮助文档,做到心中有数,知其所以然。如果能基于原始数据进行分析,可以做更多的质控和更深入的比较。如果不能,分析之前看下数据的分布是否均一 (median-centered)

所以生信宝典的原理类文章,值得好好阅读。

典型医学设计实验GEO数据分析 (step-by-step) - Limma差异分析、火山图、功能富集

典型医学设计实验GEO数据分析 (step-by-step) - 数据获取到标准化

GO、GSEA富集分析一网打进

GSEA富集分析 - 界面操作

WGCNA分析,简单全面的最新教程

PCA主成分分析实战和可视化 附R代码和测试数据

一文掌握GSEA,超详细教程

从课件中截取GEO简介部分分享如下 (只占课件很小一部分):

为什么GEO2R/GEOquery的结果可能是错的?