热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

宏基因组学经典文献重现(一):利用ggplot2进行散点图可视化分析

之前写了不少微生物多样性的数据可视化案例,但是始终没有与宏基因组接触,如今大势所趋不得不走上这条道路,论文复现也得早日提上日程,今天就让我们开始来复现下述论文中的图Expanded catalog o

之前写了不少微生物多样性的数据可视化案例,但是始终没有与宏基因组接触,如今大势所趋不得不走上这条道路,论文复现也得早日提上日程,今天就让我们开始来复现下述论文中的图



Expanded catalog of microbial genes and metagenome-assembled genomes from the pig gut microbiome





宏基因组经典论文复现(1) ggplot2绘制散点图




今天先从图a开始,本打算将全部图片代码一起展示,但是的确很耗时遂作罢,值得一提的是本文作者给出了分析过程及绘图代码,真是业界少有的良心,我在作者的基础上进行了某些细节的微调,希望能画出更好的作品





宏基因组经典论文复现(1) ggplot2绘制散点图



本文数据集:https://github.com/zhouyunyan/PIGC/blob/master/Pre-processed_Files/F6_faeces_301_geneNum.xls

下面开始我们的可视化之旅:

library(tidyverse)

首先通过lm( )计算出R值与P值

data % summary()

Residuals:
Min 1Q Median 3Q Max
-202784 -20931 2759 27390 104915
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 27705 12818 2.161 0.0315 *
data$depth 18576 1005 18.478

此图就是一个常见的散点图+回归曲线,但是下面的代码我对多个细节进行了调整,大家可以仔细查看

(p % mutate(gene_num=gene_num/1000) %>%
ggplot(aes(depth,gene_num))+
geom_point()+
geom_smooth(method = "loess")+
labs(x="Sequencing depth (Gb)",y="Gene numbers(x 1000)")+
theme(axis.title.y=element_text(size = 15,color="black",
margin=margin(r=5),face="bold"),
axis.title.x = element_text(size = 15,color="black",
margin=margin(t=5),face="bold"),
axis.text.y = element_text(size = 12,color="black"),
axis.text.x = element_text(size = 12,color="black"),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank(),
panel.background=element_rect(colour="black",size=1,fill="white"),
plot.margin=unit(c(0.5,0.5,0.5,0.5),units=,"cm"))+
annotate("text",x=17,y=80,label = "italic(R) ^ 2==0.53",
parse = TRUE,size=5,colour="black")+
annotate("text",x=20.5,y=80,size=5,colour="black",
label = "paste(p, "

ggsave(p,file="QH.D240.depth.GeneNum1.pdf",
in")



宏基因组经典论文复现(1) ggplot2绘制散点图





  • panel.background( ) 将四周边框加宽

  • plot.margin( ) 控制图像四周边距 (上,右,下,左)

  • annotate( ) 添加R值与P值

  • margin=margin(t=5) 控制标签与文本之间的距离

喜欢的小伙伴欢迎关注我的公众号


R语言数据分析指南,持续分享数据可视化的经典案例及一些生信知识,希望对大家有所帮助





推荐阅读
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 使用Numpy实现无外部库依赖的双线性插值图像缩放
    本文介绍如何仅使用Numpy库,通过双线性插值方法实现图像的高效缩放,避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理,并提供了完整的代码示例。 ... [详细]
  • 本文详细介绍 Go+ 编程语言中的上下文处理机制,涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • C++实现经典排序算法
    本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出,帮助读者全面了解这些排序方法的特点。 ... [详细]
  • 深入理解 SQL 视图、存储过程与事务
    本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式,存储过程则封装了复杂的SQL逻辑,而事务确保了数据库操作的完整性和一致性。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
  • 本文探讨如何使用 PHP 进行字符串处理,特别是如何检测一个字符串是否存在于另一个字符串中,并确定其具体位置。通过实例代码展示,帮助读者掌握这一常用功能。 ... [详细]
  • 本文提供了一个详细的PHP用户认证和管理的代码示例,包括用户登录验证、数据库连接、错误处理等关键部分的实现。 ... [详细]
  • 对 manual_async_fn 进行了改进,确保其能够正确处理和捕获输入的生命周期。 ... [详细]
  • 本文详细解析了 MySQL 中的 ibdata1 文件,探讨其存储内容、快速增长的原因及解决策略。 ... [详细]
author-avatar
chroalist
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有