作者:mobiledu2502877091 | 来源:互联网 | 2023-09-24 20:41
文章目录GeneOntology(GO)数据库简介GO注释原理方式一方式二利用eggnog可视化富集分析原理操作GeneOntology(GO)数据库简介GO数据库把生物的生命活动
文章目录
- GeneOntology(GO)数据库简介
- GO注释
- 富集分析
GeneOntology(GO)数据库简介
- GO数据库把生物的生命活动主要分为三个过程:
细胞组分
分子功能
生化过程 - 主要针对的是基因(Gene)的产物(RNA或Protein),而不只是gene本身;因为某个gene存在可变剪切,同一个gene有多种表达产物;这个gene 产物有个专有ID即GO term。
- GO term之间的关系(Relationship):
is a
part of
has part
regulates
occurs in
GO注释
原理
- 其实现有的很多数据库之间已经实现互相注释,即表示nr-swissport-go-Ko等等之间的ID是一一对应起来的;
- 所谓的注释即获得该基因表达产物的GO term ID就行了。
方式一
- 利用blast、diamond等工具将序列比对并获得到nr、swissport等数库中对应的序列ID(gene id或gene symbol等等);
- 根据数据库ID对应字典(idmapping.tb.gz)查询获得GO term ID。
方式二
- 利用interproscan等工具注释序列的功能域(Domain)或Motif,并获得对应的GO term ID。
利用eggnog
最简单快捷的方式。
可视化
利用WEGO
富集分析
原理
常用的富集分析方法有Fisher精准概率法。以GO富集分析为例:
在单基因分析筛选差异表达基因基础上,Fisher精准概率法利用几何分布(hypergeometric distribution)原理,推断每个基因集中的差异表达基因的比例是否与整个基因集中差异表达基因的***比例***相同。该方法包括两个假设:
- 基因是否为差异表达基因(DE)
- 基因是否属于GO术语定义的基因集S
Fisher’s Exact Test原理:https://www.pathwaycommons.org/guide/primers/statistics/fishers_exact_test/
Fisher’s Exact Test和卡方检验的区别:
https://blog.csdn.net/u011955252/article/details/50704459
富集分析:https://www.jianshu.com/p/3cd3fc14ba16?utm_campaign=haruki&utm_cOntent=note&utm_medium=seo_notes&utm_source=recommendation
操作
利用GeneOntology的AmiGO