热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

差异表达基因变化倍数_GEO2R差异表达分析软件

前两天我们对GEO数据库来了一个大致的介绍。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。所有的表达芯片做的差异表达分析都是基

前两天我们对GEO数据库来了一个大致的介绍。我们对于目标数据集,我们做的第一个事情就是差异分析,来寻找有差异的结果。所有的表达芯片做的差异表达分析都是基于limma的算法来的。我们今天介绍的这个GEO2R也只是把这个算法更加方便使用了而已。

PS:GEO2R只是适用于表达谱芯片。对于二代测序是不适用的,我们下面说到的数据类型都是表达谱芯片来进行阐述的。

1 所谓差异分析

我们在进行科学研究的时候,同样也是需要比较才能得到结果的。通常我们研究一个疾病的时候,其实都会有一个隐藏的目标伴随着来进行研究的。例如我们要研究TP53是否和胃癌的发生相关,那我们收集的数据除了胃癌患者当中的TP53的基因表达水平,也要收集正常对照人群的表达变化,通过两者的对比来确定TP53的表达变化是否和胃癌有关。

对于表达谱芯片而言,我们会得到上万的基因的表达量变化,但是这上万的基因不一定都参与疾病的发生。我们进行差异分析的目的也是要得到和疾病相关的那些变化基因。毕竟这些基因才是符合我们研究目的的。

237013945825a34a232272d143b1e7f3.png

2 GEO2R

GEO2R就是一个基于GEO数据库来对表达谱芯片进行差异分析的一个软件。我们在每个数据集的下面都可以看到这个软件的的入口。例如:GSE79973我们就可以在数据集的下面看到这个分析入口。

2a00564700e60aad05a7839e7f4a3567.png

软件的整体操作还是很简单的,我们需要做的就是

2.1 制定数据分组

前面提到,我们需要两组或者多组之间比较才能得到差异的结果,所以我们第一步需要做的就是来制定我们想要的分组。这里我们可以基于自己想要的分组名称来填写即可。

需要注意的是,如果是两组的话,我们要先选择对照组;再选择处理组。如果这里输入反了,就导致我们结果是反的。

2e5bebefc543c5dbd65f0dd35b181b5e.png

2.2 选择相对应的样本

在制定好分组之后,我们需要在所有数据样本当中来符合我们分组的样本。我们可以通过点击某一个列名来进行排序。

8ab0bb7329feabd2408301dd22f9a869.png

2.3 进行差异表达分析

我们把界面往下拉,有一个TOP250/Save All Results的地方。这个地方就是我们用来查看结果的地方。

a0a28b9c81ed180f34f31af753acfca9.png
  • TOP250,可以查看所有差异结果当中,前250的基因。
585e8da5360b55f553370296e5baaa24.png

在这个结果当中,包括了:芯片当中探针ID号、差异分析的P值和logFC值,以及相对应的基因名。我们点击ID下面每一个探针前面的▶️,就可以看到这个数据集里面相对应的样本在不同分组的表达量变化了。

具体结果的筛选标准我们后面再说。

  • Save All Results 则会弹出另外一个界面。这里面包括芯片当中作用的数据的差异表达结果。每一列的内容和之前的TOP250是一样的
dd629d876a313770f787e9d05c1640dc.png

如果我们需要保存所有的结果。那么全选—复制—打开excel—粘贴即可。

3 结果解读

通过以上的过程&#xff0c;我们就得到了这个数据集所有差异 表达的结果。但是所有的结果&#xff0c;并不是都有意义的结果&#xff0c;所以我们要进行一定的筛选。目前对于差异的筛选结果&#xff0c;其实并没有一个严格意义上的标准。但是都有一个默认的最低标准&#xff1a;那就是logFC的绝对值 > 1. 且 矫正P值(adj.P.Val) <0.05

8697413fb222b0df26b6a816fbfa30ea.png

关于logFC

logFC&#xff0c;全称是log2 foldchange。foldchange可以代表变化倍数&#xff0c;如果处理组的表达均值是8&#xff1b;对照组的表达均值是2&#xff0c;那么foldchange就是4。而log2 fold change就是2。所以我们默认的logFC > 1,则代表两组之前差异在2倍以上的为有意义。

logFC的绝对值, 由于相较于对照组&#xff0c;基因的变化并不一定是升高的。也有降低的。所以logFC会有一个方向性&#xff0c;如果为 则代表&#xff0c;相较于对照组是低表达的&#xff0c;如果为 则代表是高表达。

由于表达是有方向性的&#xff0c;所以再次抢到在输入分组命名的时候先输入对照组的名字。不然的话&#xff0c;按照系统的分析方法&#xff0c;我们得到的结果有可能方向就完全是相反的了。



推荐阅读
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • SQL中UPDATE SET FROM语句的使用方法及应用场景
    本文详细介绍了SQL中UPDATE SET FROM语句的使用方法,通过具体示例展示了如何利用该语句高效地更新多表关联数据。适合数据库管理员和开发人员参考。 ... [详细]
  • IT项目管理过程中的方法、工具、技术
    工欲善其事,必先利其器。而对于一个软件开发项目,最重要的器就是方法,工具和技术。而这三要素中重要的又是方法论,方法是基础&# ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文介绍如何使用 Python 的 xlrd 库读取 Excel 文件,并将其数据处理后存储到数据库中。通过实际案例,详细讲解了文件路径、合并单元格处理等常见问题。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 在过去两周中,我们利用 ReportViewer 开发了与生产良率相关的报表,其中每个制程的直通率是所有测试项良率的乘积。由于 ReportViewer 没有内置的累乘函数,因此需要借助自定义代码来实现这一功能。本文将详细介绍实现步骤和相关代码。 ... [详细]
  • 本文介绍如何使用 Python 获取文件和图片的创建、修改及拍摄日期。通过多种方法,如 PIL 库的 _getexif() 函数和 os 模块的 getmtime() 和 stat() 方法,详细讲解了这些技术的应用场景和注意事项。 ... [详细]
  • NPOI 2.1.3 学习笔记:在Excel中创建多个工作表
    本文介绍如何使用NPOI库在Excel文件中创建多个工作表。通过简单的代码示例,详细讲解了创建和命名工作表的方法,并展示了最终效果。 ... [详细]
  • 如何在Excel中批量生成条形码
    本文将详细介绍如何利用Excel快速批量生成条形码,适用于需要为大量产品编码创建条形码的企业和用户。我们将逐步讲解从准备数据到最终生成条形码的完整过程,并提供实用的操作技巧。 ... [详细]
  • 制程能力分析:Cpk及其相关指数的深入探讨
    本文详细介绍了制程能力指数(Cpk)的概念及其与Cp、Pp、Ppk之间的关系,通过具体案例和图表展示如何评估和改进生产过程的能力。文章还提供了使用Excel和Minitab进行批量计算的实际操作步骤。 ... [详细]
author-avatar
蒋军利
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有