欢迎关注”生信修炼手册”!
在组学数据分析中,基因富集分析是最常用的方法之一,所有的基因数据分析最终都要落实到功能上去,富集分析作为一种最基础的功能研究方法,通过go, kegg pathway等不同的基因功能注释数据库,再结合对应的富集分析算法,可以探究输入的基因富集在哪些功能上。
富集分析的必要性和重要性不言而喻,有很多的成熟的软件可以来进行这样的分析,比如clusterProfiler, GSEA等等,然而这些工具的使用还是具备一定的门槛,对于没有编程经验的生物学家而言通过这些软件得到富集分析的结果并不是一件容易的事情。
为了方便广大科研工作者进行富集分析,有很多的在线工具被开发出来,其操作简便,更易上手,最著名的当属DAVID这个网站了,有接近4000次的引用。然而该网站数据更新并不及时,在现在看来,其数据库版本过于老旧,而且不支持一些新出的功能注释数据库。
webgestalt是一个专注于富集分析的在线网站,支持多种富集分析算法,而且涵盖的功能注释数据库较为全面,在今年5月份刚刚升级了版本,对数据库进行了更新。对应的文章发表在Nucleic Acids Research上,链接如下
https://academic.oup.com/nar/article/47/W1/W199/5494758
网址如下
http://www.webgestalt.org
支持12个物种,324种基因ID格式,功能注释不仅包括了常见的go,kegg, 还涵盖了蛋白质相互作用,miRNA靶基因,疾病注释,药物靶点等各种注释信息。支持3种富集分析算法
Overrepresentation Enrichment AnalysisORA
Gene Set Enrichment Analysis(GSEA)
Network Topology-based Analysis(NTA)
官网提供了3种算法的示例,通过示例数据可以快速掌握其用法,无论哪种富集算法,基本上都分以下两个部分
1. Basic parameters
基本参数指定物种,富集分析的算法,对应的功能注释数据库,输入的基因列表,背景基因列表等信息,示意如下
2. Advanced parameters
高级参数用于对输出结果的过滤,不同富集算法对应的参数列表也稍有不同,ORA算法的参数示意如下
设置好对应参数,直接点击submit
按钮,提交即可。不同富集算法和数据库,结果展示也不尽相同,但是基本的表格数据, 柱状图,GSEA的富集图片等结果都是有的,几种常见的结果示意如下
1. 富集分析的表格
2. 富集分析的柱状图
3. GSEA富集分析结果图
4. GO DAG 有向无环图
webgestalt通过鼠标点击就可以轻松实现各种富集分析,而且数据库更新的也非常及时,如果需要进行富集分析,该网站绝对值得推荐和使用。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!