geo数据差异分析_GEO2R:对GEO数据库中的数据进⾏差异 分析
GEO数据库中的数据是公开的,很多的科研⼯作者会下载其中的数据⾃⼰去分析,其中差异表达分析是最常见的分析策略之⼀,为了⽅便⼤家更好的挖掘GEO中的数据,官⽹提供了⼀个⼯具GEO2R, 可以⽅便的进⾏差异分析。 从名字也可以看出,该⼯具实现的功能就是将GEO数据库中的数据导⼊到R语⾔中,然后进⾏差异分析,本质上是通过以下两个bioconductor上的R包实现的GEOquery
limma
GEOquery⽤于⾃动下载GEO数据,并读取到R环境中;limma是⼀个经典的差异分析软件,⽤于执⾏差异分析。
在⽹页上可以看到GEO2R的按钮,点击这个按钮就可以进⾏分析了, 除了差异分析外,GEO2R还提供了⼀些简单的数据可视化功能。
1. Value distribution
该选项⽤箱线图展⽰所有样本中表达量的分布,结果⽰意如下 2. Profile graph
该选项⽤于展⽰某个探针/基因在所有样本中的分布,结果⽰意如下
点击Sample values, 可以看到对应的表达量值,⽰意如下
GEO2R进⾏差异分析的步骤如下
1. 定义样本分组
通过Define groups按钮定义样本分组,⾸先输⼊⼀个group的名字,然后选择对应的样本,⽰意如下
2. 参数调整
通过页⾯下⽅的Options菜单,可以调整差异分析时的参数,⽰意如下
第⼀个参数⽤于选择多重假设检验的P值校正算法,第⼆个参数表⽰是否对原始的表达量进⾏log转换,第三个参数调整最终结果中展⽰的对应的platfrom的注释信息,是基于客户提供的supplement file中的信息, 还是使⽤soft⽂件中的信息。
3. 执⾏
点击如下所⽰的Top 250按钮,执⾏差异分析。
结果⽰意如下,在页⾯上只显⽰最显著的250个差异基因
全部基因的结果可以通过Save all results导出,通过GEO2R, 可以在没有任何编程基础的情况下,顺序的完成差异分析。·end·