一文搞懂A/Btest与假设检验

作者：妖姬脸似花甘露_545 | 来源：互联网 | 2023-09-14 14:33

ABtest应用场景①产品UI：红色or紫色？，动态iconor静态icon?②文案内容：免费注册or注册送大礼包？③页面布局：登录框置于导航栏or页面左侧？④产品功能：看似冗余的

A/B test

应用场景

①产品UI：红色 or 紫色？，动态icon or 静态icon?
②文案内容：免费注册 or 注册送大礼包？
③页面布局：登录框置于导航栏 or 页面左侧？
④产品功能：看似冗余的功能下掉 or 留着？
⑤算法模型：根据用户的历史记录推荐 or 根据相似用户的行为推荐？

流程

①确定对比指标
②创建变体
③生成假设
④收集数据
⑤运行实验
⑥分析结果

样本规模

对于比率类的指标：

n

=

2

×

[

Z

α

/

2

+

Z

β

d

]

2

×

P

(

1

−

p

)

n=2\times \left[ \dfrac{Z_{\alpha /2}+Z_{\beta }}{d}\right] ^{2}\times P\left( 1-p\right)

n=2×[dZα/2+Zβ]2×P(1−p)
其中Z为Z系数，有一个固定的Z值表，可以依据

α

\alpha

α和

β

\beta

β指标确定。
工业应用中一般默认

α

=

0.1

（

单

尾

）

\alpha=0.1（单尾）

α=0.1（单尾）和

β

=

0.2

\beta=0.2

β=0.2，因此公式的分子部分

Z

α

/

2

+

Z

β

Z_{\alpha /2}+Z_{\beta }

Zα/2+Zβ可以固定为2.4849.
p为对照指标的历史月均值；
d为p与新方案预期提升率的乘积。

测试结果分析

A/B test的本质是假设检验，即进行显著性检验以拒绝或接受原假设。

假设检验

定义

先对总体参数提出一个假设值，然后利用样本信息判定这一假设是否成立。

生成假设

原假设（H0假设）：一般是统计者想要拒绝的假设，原假设的设置一般为：=、≥、≤
备择假设（H1假设）：一般是统计者想要接受的假设，备择假设的设置一般为：≠、＞、＜
例如，在做新旧版本的A/B test时，假设为：

H

0

：

u

(

旧

版

本

)

≥

u

(

新

版

本

)

H0：u(旧版本)≥u(新版本)

H0：u(旧版本)≥u(新版本)

H

1

：

u

(

旧

版

本

)

＜

u

(

新

版

本

)

H1：u(旧版本)＜u(新版本)

H1：u(旧版本)＜u(新版本)

为什么把想要接受的假设作为原假设？
因为原假设被拒绝如果出错的话，只能犯第Ⅰ类错误（弃真错误），而犯第Ⅰ类错误的概率已经被规定的显著性水平所控制。

两类错误

第Ⅰ类错误：也叫弃真错误或α错误，指拒绝了正确的原假设，这个错误的概率记为α，该值也是显著性水平，在假设检验前会规定这个概率的大小。
第Ⅱ类错误：也叫取伪错误或β错误，指接受了错误的原假设，错误的概率即为β。

显著性水平α

显著性水平指原假设实际正确时，检验统计量落在拒绝域的概率，显著性水平α越小，犯第Ⅰ类错误的概率越小，一般取0.01，0.05，0.1等。
1-α即为置信度。

检验方式

双侧检验和单侧检验
双侧检验：备择假设没有特定的方向性，形式为≠；
单侧检验：备择假设带有特定的方向性，形式为>、<，>称为右侧检验，<称为左侧检验；

t检验和z检验
场景不同：t检验用于样本量小(n<30),总体标准差未知的正态分布：z检验用于大样本(n>30)的平均值差异性检验。
原理不同：t检验是检验一个样本平均数与总体平均数的差异是否显著：z检验是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
联系：z检验虽然能够进行均值差异性检验,但是它要求总体标准差已知且样本容量足够大,而这两个条件很难达成：于是可以从正态总体中抽取小规模的样本数据,并计算均值与标准差用来替代总体的均值和标准差。

拒绝域

拒绝域的功能是判断是否拒绝原假设，如果计算的检验统计量值落在拒绝域内，就拒绝原假设，否则接受原假设。
确定显著性水平后，查表即可得到拒绝域的临界值。
在这里插入图片描述

p值

使用p值的原因：
根据检验统计量落入的区域做出是否拒绝原假设的方式不够精确，例如，拒绝域的临界值为1.96，显著性水平α为0.05，则统计量t=2.5和t=2.0都落入拒绝域，且拒绝原假设面临的风险都是0.05.
使用方式：
如果p>α 拒绝原假设 —>单边检验
如果p/2>α 拒绝原假设 —>双击检验
计算方式：
P=P{X P=P{X>C} 右侧检验
P=P{|X|>C} 双侧检验

q值

可以理解为FDR(错误发现率),计算公式:假正数/预测为正的数.α =0.05时,一次假设检验的错误率为5%,那么多次假设时如何评估和控制错误率呢,就是通过q值.
如何控制:找到最大的正整数i,使得p(i)≤(i*q)/m.

算法

推荐阅读

算法
Go语言基础：Hello World 实践

本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]

蜡笔小新 2024-12-27 21:29:35
算法
线性Kalman滤波器在多自由度车辆悬架主动控制中的应用研究

本文探讨了线性Kalman滤波器（LKF）在不同自由度（2、4、7）的车辆悬架系统中进行主动控制的应用。通过详细的仿真分析，展示了LKF在提升悬架性能方面的潜力，并总结了调参过程中的关键要点。 ... [详细]

蜡笔小新 2024-12-27 20:47:55
机器学习
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
算法
LeetCode 991：故障计算器的最优解法

探讨一个显示数字的故障计算器，它支持两种操作：将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]

蜡笔小新 2024-12-27 14:34:44
算法
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
算法
设计一个安全的加密与验证算法

本文探讨如何设计一个安全的加密和验证算法，确保生成的密码具有高随机性和低重复率，并提供相应的验证机制。 ... [详细]

蜡笔小新 2024-12-27 13:49:45
机器学习
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
算法
C语言实现小写金额转换为大写金额

在金融和会计领域，准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据，还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法，确保数据的标准化和规范化。 ... [详细]

蜡笔小新 2024-12-27 12:39:06
算法
每日一题：寻找与众不同的数字

在给定的数组中，除了一个数字外，其他所有数字都是相同的。任务是找到这个唯一的不同数字。例如，findUniq([1, 1, 1, 2, 1, 1]) 返回 2，findUniq([0, 0, 0.55, 0, 0]) 返回 0.55。 ... [详细]

蜡笔小新 2024-12-27 12:19:16
神经网络
理解感受野与锚框在目标检测中的应用

本文探讨了卷积神经网络（CNN）中感受野的概念及其与锚框（anchor box）的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小，而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]

蜡笔小新 2024-12-27 12:03:44
算法
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
算法
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
算法
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
算法
深度学习理论解析与理解

梯度方向指示函数值增加的方向，由各轴方向的偏导数综合而成，其模长表示函数值变化的速率。本文详细探讨了导数、偏导数、梯度等概念，并结合Softmax函数、卷积神经网络（CNN）中的卷积计算、权值共享及池化操作进行了深入分析。 ... [详细]

蜡笔小新 2024-12-26 18:23:11
人工智能
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02

妖姬脸似花甘露_545

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章