热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

宏基因组学经典文献重现(一):利用ggplot2进行散点图可视化分析

之前写了不少微生物多样性的数据可视化案例,但是始终没有与宏基因组接触,如今大势所趋不得不走上这条道路,论文复现也得早日提上日程,今天就让我们开始来复现下述论文中的图Expanded catalog o

之前写了不少微生物多样性的数据可视化案例,但是始终没有与宏基因组接触,如今大势所趋不得不走上这条道路,论文复现也得早日提上日程,今天就让我们开始来复现下述论文中的图



Expanded catalog of microbial genes and metagenome-assembled genomes from the pig gut microbiome





宏基因组经典论文复现(1) ggplot2绘制散点图




今天先从图a开始,本打算将全部图片代码一起展示,但是的确很耗时遂作罢,值得一提的是本文作者给出了分析过程及绘图代码,真是业界少有的良心,我在作者的基础上进行了某些细节的微调,希望能画出更好的作品





宏基因组经典论文复现(1) ggplot2绘制散点图



本文数据集:https://github.com/zhouyunyan/PIGC/blob/master/Pre-processed_Files/F6_faeces_301_geneNum.xls

下面开始我们的可视化之旅:

library(tidyverse)

首先通过lm( )计算出R值与P值

data % summary()

Residuals:
Min 1Q Median 3Q Max
-202784 -20931 2759 27390 104915
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 27705 12818 2.161 0.0315 *
data$depth 18576 1005 18.478

此图就是一个常见的散点图+回归曲线,但是下面的代码我对多个细节进行了调整,大家可以仔细查看

(p % mutate(gene_num=gene_num/1000) %>%
ggplot(aes(depth,gene_num))+
geom_point()+
geom_smooth(method = "loess")+
labs(x="Sequencing depth (Gb)",y="Gene numbers(x 1000)")+
theme(axis.title.y=element_text(size = 15,color="black",
margin=margin(r=5),face="bold"),
axis.title.x = element_text(size = 15,color="black",
margin=margin(t=5),face="bold"),
axis.text.y = element_text(size = 12,color="black"),
axis.text.x = element_text(size = 12,color="black"),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
panel.background=element_rect(colour="black",size=1,fill="white"),
plot.margin=unit(c(0.5,0.5,0.5,0.5),units=,"cm"))+
annotate("text",x=17,y=80,label = "italic(R) ^ 2==0.53",
parse = TRUE,size=5,colour="black")+
annotate("text",x=20.5,y=80,size=5,colour="black",
label = "paste(p, "

ggsave(p,file="QH.D240.depth.GeneNum1.pdf",
in")



宏基因组经典论文复现(1) ggplot2绘制散点图





  • panel.background( ) 将四周边框加宽

  • plot.margin( ) 控制图像四周边距 (上,右,下,左)

  • annotate( ) 添加R值与P值

  • margin=margin(t=5) 控制标签与文本之间的距离

喜欢的小伙伴欢迎关注我的公众号


R语言数据分析指南,持续分享数据可视化的经典案例及一些生信知识,希望对大家有所帮助





推荐阅读
  • 2018-2019学年第六周《Java数据结构与算法》学习总结
    本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容,重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • 本文详细介绍了如何在Kendo UI for jQuery的数据管理组件中,将行标题字段呈现为锚点(即可点击链接),帮助开发人员更高效地实现这一功能。通过具体的代码示例和解释,即使是新手也能轻松掌握。 ... [详细]
  • 本文探讨了如何在Classic ASP中实现与PHP的hash_hmac('SHA256', $message, pack('H*', $secret))函数等效的哈希生成方法。通过分析不同实现方式及其产生的差异,提供了一种使用Microsoft .NET Framework的解决方案。 ... [详细]
  • Java多线程实现:从1到100分段求和并汇总结果
    本文介绍如何使用Java编写一个程序,通过10个线程分别计算不同区间的和,并最终汇总所有线程的结果。每个线程负责计算一段连续的整数之和,最后将所有线程的结果相加。 ... [详细]
  • 本教程详细介绍了如何使用 TensorFlow 2.0 构建和训练多层感知机(MLP)网络,涵盖回归和分类任务。通过具体示例和代码实现,帮助初学者快速掌握 TensorFlow 的核心概念和操作。 ... [详细]
  • 目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 本文详细介绍了在不同操作系统中查找和设置网卡的方法,涵盖了Windows系统的具体步骤,并提供了关于网卡位置、无线网络设置及常见问题的解答。 ... [详细]
  • #print(34or4 ... [详细]
  • 斯特林数与幂
    参考资料:https:www.luogu.com.cnblogchtholly-willemsolution-p5408https:blog.csdn.netguizhiyuart ... [详细]
  • 本文介绍两道有趣的编程问题:一是寻找给定数字n的连续数字序列及其个数,二是模拟一个翻杯子的游戏。同时附带一道智商题供读者思考。 ... [详细]
  • 本章详细介绍SP框架中的数据操作方法,包括数据查找、记录查询、新增、删除、更新、计数及字段增减等核心功能。通过具体示例和详细解析,帮助开发者更好地理解和使用这些方法。 ... [详细]
  • 本文探讨了符号三角形问题,该问题涉及由相同数量的“+”和“-”符号组成的三角形。通过递归回溯法,可以有效地搜索并计算符合条件的符号三角形的数量。 ... [详细]
author-avatar
chroalist
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有