当前位置: 开发笔记 > 编程语言 > 正文

Fisher'sexacttest（费希尔精确检验）验证链偏差

作者：悦爱张晓桀 | 来源：互联网 | 2023-06-01 21:00

1.strandbias简介2.Fisher\x26#39;sexacttest理解3.Fish

1. strand bias 简介

2. Fisher's exact test 理解

3. Fisher's exact test 估计链偏差

strand bias 简介

overview

Strand bias（链偏差），当由正向链和反向链提供的信息推断出的基因型不一致时，链偏差就发生了。当reads映射到正向和反向链显著不同，出现一种不平衡链映射现象。

Strand bias（链偏倚），链偏倚是一种测序偏倚，其中一条DNA链比另一条更受青睐，这可能导致对一个等位基因与另一个等位基因观测到的证据量的不正确评估。

当然，也不能简单对Strand bias简单地定义，如下：

Strand bias scores

Strand bias scores 的测量是基于2x2的二联表，二联表中每个单元格代表的意义详细如下：

	Fwd	Rev
Ref	a	c
Alt	b	d

a. Forward strand reference allele.

b. Forward strand non reference allele.

c. Reverse strand reference allele.

d. Reverse strand non reference allele

按文献讲述，测量Strand bias scores 有如下3种方式：

SB和GATK-SB分数的范围都是0到无穷，而Fisher分数的范围是0到1。对于我们定义的所有3个分数，较低的值意味着较少的Strand bias ，较高的分数意味着更严重的Strand bias。

Cause of strand bias

以下罗列可能引入Strand bias的情况：

1. 分析时局部重新排列和BAQ；

2. 由于文库准备如PCR扩增；

3. 上机测序测序错误；

4. 测序过程中的取样变化引起。

Fisher精确检验理解

见《第5章 - 假设检验-Pearson卡方检验与Fisher精确检验》

Fisher's exact test估计链偏差

实现

按上面描述的有三种方法可以可以估算链偏差的值，这里讲述第三种Fisher's exact test实现过程。

R实现，调用函数fisher.test(）

Usage:
fisher.test(x, y = NULL, workspace = 200000, hybrid = FALSE,
control = list(), or = 1, alternative = "two.sided",
conf.int = TRUE, conf.level = 0.95,
simulate.p.value = FALSE, B = 2000)

x <- matrix(c(11,2,20,0),nrow=2)
Ftest <- fisher.test(x)

Fisher's Exact Test for Count Data

data: x
p-value = 0.1477
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.000000 3.374997
sample estimates:
odds ratio
0

pvalue= round(Ftest$p.value, 5) = 0.14773
oddsRatio= round(Ftest$estimate, 5) = 0

python实现，第三方包scipy.stats中，有直接表达Fisher's exact test的函数fisher_exact()

import scipy.stats
fisher = scipy.stats.fisher_exact([[20, 11], [0, 2]])
fisher
(inf, 0.14772727272727287)

oddsRatio = fisher[0]
pvalue = fisher[1]

解读

由Fisher's exact test的函数执行后，可得到两个相关值，一个为pvalue，另一个为oddsRatio。

pvalue

pvalue= 0.14773

意义：由于P>α（显著性水平α=0.01),表示链不存在显著性的偏差。（也可以理解为 p值为 0.14773 ，即有14.773%的可能性没有统计上令人信服的偏差证据，）

Fisher Scores = 1 - pvalue = 0.85227

意义：较低的值意味着较少的Strand bias ，较高的分数意味着更严重的Strand bias。

回顾假设检验相关知识点：

p值为各样本统计量的差异来自抽样误差的概率

显著水平α为犯第一类错误（H0为真时却被拒绝，即实验没有效果却被判定为有效果）的概率，一般设置阈值为0.05,0.01,0.001。

若P>α，就没有理由怀疑H0的真实性，结论为不拒绝H0，不否定此样本是来自于该总体的结论，也即差别无显著意义。

若P≤α，则拒绝H0，接受H1，也就是这些统计量来自不同的总体，其差别不能仅由抽样误差来解释，结论为差别有显著性意义。

oddsRatio

参考：

The effect of strand bias in Illumina short-read sequencing data an Guo,

Jiang Li,Chung-I Li,Jirong Long,David C Samuels &Yu Shyr BMC Genomics volume 13, Article number: 666 (2012) Cite this article

https://gatk.broadinstitute.org/hc/en-us/articles/360035532152-Fisher-s-Exact-Test

https://mathworld.wolfram.com/FishersExactTest.html

https://gitee.com/ChitandaSatou/VarDict/blob/master/teststrandbias.R

https://www.biostars.org/p/16033/

推荐阅读

text
UILabel的混合显示动画效果

UILabel的混合显示动画效果 ... [详细]

蜡笔小新 2024-09-29 20:18:24
import
找出字符串中重复字符

2019独角兽企业重金招聘Python工程师标准packagejavaBasic;importjava.util.HashMap;importjava.util.Map; ... [详细]

蜡笔小新 2024-09-30 11:23:11
import
[二分图]JZOJ 4612 游戏

DescriptionInputOutputSampleInput44#****#****#*xxx#SampleOutput5DataConstraint分析非常眼熟࿰ ... [详细]

蜡笔小新 2024-09-28 18:03:01
import
查看tensorflowgpu能否使用GPU进行加速

运行以下代码fromtensorflow.python.clientimportdevice_libprint(device_lib.list_local_devices()) ... [详细]

蜡笔小新 2024-09-30 19:46:53
text
自定义RecyclerView添加EmptyView

你知道RecyclerView里没有Em ... [详细]

蜡笔小新 2024-09-30 15:31:47
python
python基础（二、pycharm安装、卸载）

3.在Ubuntu中安装PyCharmPyCharm的官方网站地址是：https:www.jetbrains.compycharm注意：安装时不要使用root用户安装，否则后期使用 ... [详细]

蜡笔小新 2024-09-30 13:43:10
import
在JAVA代码的不同部分多次使用数组列表

我正在使用数组列表通过构建一个交互式菜单供用户选择来存储来自用户输入的值。到目前为止，我的两个选择是为用户提供向列表输入数据和读取列表的全部内容。到目前为止，我创建的代码由两个类组成。 ... [详细]

蜡笔小新 2024-09-30 10:25:00
import
IOS开发Xib 九宫格应用管理

Xib九宫格应用管理使用xib封装一个自定义view的步骤1新建一个继承UIView的自定义view,假设类名叫做(AppView)2新建一个AppView.xib文件来描述 ... [详细]

蜡笔小新 2024-09-29 23:11:30
text
在for循环中测试索引 - Python [重复] - Testing an index in a for loop - Python [duplicate]

Thisquestionalreadyhasananswerhere:这个问题在这里已有答案：Iteratealistaspair(current,n ... [详细]

蜡笔小新 2024-09-29 17:33:30
text
《每个设计师都应该掌握的50个css代码段》11~20段

2019独角兽企业重金招聘Python工程师标准11.胶卷边框img.polaroid{background:#000;*Changethistoabackgroundima ... [详细]

蜡笔小新 2024-09-29 11:18:42
text
IOSUITableView解析（一）

UITableView的作用由于Iphone的大小有限，所以UITableView的作用是巨大的。比如QQ，微博等应用都用到了该控件。UITableVi ... [详细]

蜡笔小新 2024-09-28 23:27:38
text
Educational Codeforces Round 43 (Rated for Div. 2)

EducationalCodeforcesRound43(RatedforDiv.2)https:codeforces.comcontest976A ... [详细]

蜡笔小新 2024-09-28 14:07:52
search
如何自行分析定位SAP BSP错误

The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]

蜡笔小新 2023-12-14 19:58:05
import
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
import
如何通过全新应用内评价获取更多优质用户反馈？

Google Play推出全新的应用内评价API，帮助开发者获取更多优质用户反馈。用户每天在Google Play上发表数百万条评论，这有助于开发者了解用户喜好和改进需求。开发者可以选择在适当的时间请求用户撰写评论，以获得全面而有用的反馈。全新应用内评价功能让用户无需返回应用详情页面即可发表评论，提升用户体验。 ... [详细]

蜡笔小新 2023-12-13 17:23:03

悦爱张晓桀

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章