当前位置: 开发笔记 > 编程语言 > 正文

宏基因组学经典文献重现（一）：利用ggplot2进行散点图可视化分析

作者：chroalist | 来源：互联网 | 2024-10-30 16:50

之前写了不少微生物多样性的数据可视化案例，但是始终没有与宏基因组接触，如今大势所趋不得不走上这条道路，论文复现也得早日提上日程，今天就让我们开始来复现下述论文中的图Expanded catalog o

之前写了不少微生物多样性的数据可视化案例，但是始终没有与宏基因组接触，如今大势所趋不得不走上这条道路，论文复现也得早日提上日程，今天就让我们开始来复现下述论文中的图

Expanded catalog of microbial genes and metagenome-assembled genomes from the pig gut microbiome

今天先从图a开始，本打算将全部图片代码一起展示，但是的确很耗时遂作罢，值得一提的是本文作者给出了分析过程及绘图代码，真是业界少有的良心，我在作者的基础上进行了某些细节的微调，希望能画出更好的作品

本文数据集：https://github.com/zhouyunyan/PIGC/blob/master/Pre-processed_Files/F6_faeces_301_geneNum.xls

下面开始我们的可视化之旅:

library(tidyverse)

首先通过lm( )计算出R值与P值

data % summary()

Residuals: Min 1Q Median 3Q Max -202784 -20931 2759 27390 104915 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 27705 12818 2.161 0.0315 * data$depth 18576 1005 18.478

此图就是一个常见的散点图+回归曲线，但是下面的代码我对多个细节进行了调整，大家可以仔细查看

(p % mutate(gene_num=gene_num/1000) %>% ggplot(aes(depth,gene_num))+ geom_point()+ geom_smooth(method = "loess")+ labs(x="Sequencing depth (Gb)",y="Gene numbers(x 1000)")+ theme(axis.title.y=element_text(size = 15,color="black", margin=margin(r=5),face="bold"), axis.title.x = element_text(size = 15,color="black", margin=margin(t=5),face="bold"), axis.text.y = element_text(size = 12,color="black"), axis.text.x = element_text(size = 12,color="black"), panel.grid.major = element_blank(), panel.grid.minor = element_blank(), panel.background=element_rect(colour="black",size=1,fill="white"), plot.margin=unit(c(0.5,0.5,0.5,0.5),units=,"cm"))+ annotate("text",x=17,y=80,label = "italic(R) ^ 2==0.53", parse = TRUE,size=5,colour="black")+ annotate("text",x=20.5,y=80,size=5,colour="black", label = "paste(p, "

ggsave(p,file="QH.D240.depth.GeneNum1.pdf", in")

panel.background( ) 将四周边框加宽

plot.margin( ) 控制图像四周边距 (上,右,下,左)

annotate( ) 添加R值与P值

margin=margin(t=5) 控制标签与文本之间的距离

喜欢的小伙伴欢迎关注我的公众号

R语言数据分析指南，持续分享数据可视化的经典案例及一些生信知识，希望对大家有所帮助

推荐阅读

filter
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
string
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
range
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
range
Go+ 中的上下文处理指南

本文详细介绍 Go+ 编程语言中的上下文处理机制，涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]

蜡笔小新 2024-12-28 11:05:31
main
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
string
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
string
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
main
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
main
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
php
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
main
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
php
PHP 字符串处理：检测子字符串及位置

本文探讨如何使用 PHP 进行字符串处理，特别是如何检测一个字符串是否存在于另一个字符串中，并确定其具体位置。通过实例代码展示，帮助读者掌握这一常用功能。 ... [详细]

蜡笔小新 2024-12-15 19:09:50
default
PHP用户认证与管理完整代码实例

本文提供了一个详细的PHP用户认证和管理的代码示例，包括用户登录验证、数据库连接、错误处理等关键部分的实现。 ... [详细]

蜡笔小新 2024-12-14 22:32:23
input
考虑输入生命周期的 manual_async_fn

对 manual_async_fn 进行了改进，确保其能够正确处理和捕获输入的生命周期。 ... [详细]

蜡笔小新 2024-12-12 11:27:50
php
MySQL ibdata1 文件解析与优化

本文详细解析了 MySQL 中的 ibdata1 文件，探讨其存储内容、快速增长的原因及解决策略。 ... [详细]

蜡笔小新 2024-12-08 20:00:51

chroalist

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章