分计算iv值_TwoSampleMR实战教程之提取IV在结局中的信息

作者：四木子1982 | 来源：互联网 | 2024-10-14 00:45

在读取完暴露文件并去除掉存在连锁不平衡的SNP后，我们接下来要做的一件事就是提取IV在结局中的信息，完成这一步主要有两种方法：(1)利用T

在读取完暴露文件并去除掉存在连锁不平衡的SNP后&＃xff0c;我们接下来要做的一件事就是提取IV在结局中的信息&＃xff0c;完成这一步主要有两种方法&＃xff1a;

(1)利用TwoSampleMR获取MR base提供的结局信息

(2)读取自己结局的GWAS文件并提取相关信息

第一种方法使用起来非常简洁高效&＃xff0c;可以批量读取多个结局文件&＃xff0c;但是存在的问题是有的结局数据可能有问题(米老鼠做研究的过程确认过)&＃xff1b;第二种方法一次读取一个GWAS文件&＃xff0c;如果批量处理的话可能会占用大量内存&＃xff0c;得不偿失。接下来我将为大家详细介绍一下这两种方法&＃xff0c;希望大家能明白这两种读取方法的差异。

1. 利用TwoSampleMR获取MR base提供的结局信息

首先咱们先提取IV的信息并去除存在连锁不平衡的SNP&＃xff0c;这里咱们还是以BMI作为暴露&＃xff0c;但是ID号需要改成&＃39;ieu-a-835&＃39;&＃xff0c;这主要是因为之前ID号’ieu-a-2’的GWAS是在混合人群中做的(也即把欧洲人、非洲人等不同人群合在一起做的GWAS)&＃xff0c;而’ieu-a-835’则是在欧洲人中做的。在之前的理论学习中&＃xff0c;我曾和大家解释过人群的混杂会带来估计结果的偏倚&＃xff0c;因此我们需要选择遗传背景一致的人群进行MR研究(如暴露和结局的GWAS都是在欧洲人群中进行的)。

library(TwoSampleMR)bmi_exp outcomes&＃61;&＃39;ieu-a-835&＃39;, clump&＃61;TRUE, r2&＃61;0.01, kb&＃61;5000,access_token &＃61; NULL )dim(bmi_exp)# [1] 80 15t2d_out snps&＃61;bmi_exp$SNP, outcomes&＃61;&＃39;ieu-a-26&＃39;, proxies &＃61; FALSE, maf_threshold &＃61; 0.01, access_token &＃61; NULL)dim(t2d_out)# [1] 80 16

这里我要和大家简单介绍一下extract_outcome_data()函数的关键参数&＃xff1a;

snps&＃xff1a;它是一串以rs开头的SNP ID

outcomes&＃xff1a;它是outcome在MR base中的ID&＃xff1b;

proxies&＃xff1a;它表示是否使用代理SNP&＃xff0c;默认值是TRUE&＃xff0c;也即当一个SNP在outcome中找不到时可以使用与其存在强连锁不平衡的SNP信息来替代&＃xff0c;我个人喜欢设置成FALSE。

maf_threshold&＃xff1a;它表示的是SNP在outcome中的最小等位基因频率&＃xff0c;默认值是0.3&＃xff0c;不过大样本GWAS可以适当调低&＃xff0c;我这里设置的是0.01。

access_token&＃xff1a;大陆用户必须设置成access_token&＃61;NULL。

2. 从自己的GWAS结果中提取IV在结局中的信息

米老鼠从DIAGRAM研究中下载了与&＃39;ieu-a-26&＃39;对应的完整GWAS数据然后提取IV&＃xff0c;代码如下&＃xff1a;

#install.packages(&＃39;data.table&＃39;) 安装data.table包library(data.table) # 加载R包t2d &＃39;DIAGRAMv3.2012DEC17.txt&＃39;,header&＃61;T) head(t2d) # 查看数据

t2d$phenotype &＃39;Type 2 diabetes&＃39; t2d$beta log(t2d$OR) t2d$se abs(t2d$beta/qnorm(t2d$P_VALUE/head(t2d) # 查看数据

t2d_out dat&＃61;t2d, type &＃61; "outcome", snps &＃61; bmi_exp$SNP, header &＃61; TRUE, phenotype_col &＃61; "phenotype", snp_col &＃61; "SNP", beta_col &＃61; "beta", se_col &＃61; "se", effect_allele_col &＃61; "RISK_ALLELE", other_allele_col &＃61; "OTHER_ALLELE", pval_col &＃61; "P_VALUE", ncase_col &＃61; "N_CASES", ncontrol_col &＃61; "N_CONTROLS", chr_col &＃61; "CHROMOSOME", pos_col &＃61; "POSITION")head(t2d_out)

由于原始的GWAS结果中没有phenotype、beta和se的信息&＃xff0c;因此米老鼠先将它读取到R中&＃xff0c;然后转换格式。米老鼠这里是先把原始的GWAS使用data.table包的fread()函数读到R中&＃xff0c;因为这个fread()函数读取大文件的速度非常快&＃xff0c;接着我再使用format_data()函数将该数据框转化成TwoSampleMR的格式&＃xff0c;关于format_data()函数的用法参见往期内容TwoSampleMR包实战教程之读取暴露文件。

当然&＃xff0c;如果各位小伙伴们的文件里的信息很完整&＃xff0c;可以考虑使用read_outcome_data()函数&＃xff0c;它的用法与read_expsoure_data()类似&＃xff0c;具体可以使用?read_outcome_data查询。

大家可以自行比对一下本文中的两个方法得出的t2d_out结果&＃xff0c;米老鼠看了一下&＃xff0c;他们的beta和p值是一致&＃xff0c;但se有微小差异&＃xff0c;这是由于精确位数不同导致&＃xff0c;不会对结果产生实质影响。

另外&＃xff0c;今天的内容里还介绍了OR和beta的转换以及se的计算&＃xff0c;这个非常重要&＃xff0c;希望大家掌握&＃xff01;

最后&＃xff0c;米老鼠整理好了MR base里以IEU开头的outcome信息&＃xff0c;有兴趣的朋友可以私聊我获取。DIAGRAM consortium的GWAS数据库网站可以点击阅读原文后下载第一个文件即可&＃xff0c;当然也可以私聊米老鼠获取。

推荐阅读

require
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
require
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
js
解析JSON格式文本并处理数据

本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本，并进行数据处理和保存。 ... [详细]

蜡笔小新 2024-12-26 16:06:09
web
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
go
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
go
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
match
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
go
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
bash
Linux 自动化安装脚本详解

本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建，还处理了系统服务的配置和启动，确保在多种 Linux 发行版上都能顺利运行。 ... [详细]

蜡笔小新 2024-12-27 16:33:32
match
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
js
android知识杂记（三）

andr ... [详细]

蜡笔小新 2024-12-26 13:29:32
go
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
scala
Scala 实现 UTF-8 编码属性文件读取与克隆

本文介绍如何使用 Scala 以 UTF-8 编码方式读取属性文件，并实现属性文件的克隆功能。通过这种方式，可以确保配置文件在多线程环境下的一致性和高效性。 ... [详细]

蜡笔小新 2024-12-26 08:25:19
go
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
email
Ionic 5 APK打包与QRScanner插件优化：常见问题及解决方案

本文总结了在使用Ionic 5进行Android平台APK打包时遇到的问题，特别是针对QRScanner插件的改造。通过详细分析和提供具体的解决方法，帮助开发者顺利打包并优化应用性能。 ... [详细]

蜡笔小新 2024-12-27 12:10:17

四木子1982

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章