热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据分析【实践】——AB测试的应用、案例及关键点

阅读之前看这里????:博主是正在进行数据分析师求职的一员,博客记录的是在学习和求职过程中一些总结,也希望和大家一起进步,在记录之时,未免存在很多疏漏和不全,如有问题,还请私聊博主指正。
博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能在这学习的过程中肯定自己,超越自己,最终创造自己。

目录

    • 1.AB测试的三种应用场景
    • 2.AB测试的流程
      • 设定目标
      • 流量分配:最少样本量
      • 流量分配:样本分配质量
      • 数据分析:实验天数
      • 数据分析:提升是否显著
      • 数据结论

关于假设检验的基础和数学统计知识看这里数据分析面试【统计学】-----假设检验知识点归纳 ,本篇文章主要是实际的应用和案例分析。

1.AB测试的三种应用场景

  • UI选取:新增用户进入的时候建议核心功能的按钮换成绿色
  • 运营活动:建议对过去30天支付宝未活跃,短期画像是理财的老用户,推送理财优惠券
  • 功能添加:建议发布新版本增加短视频功能

在做AB测试的时候这三种场景有什么不同:

  • UI选取: 实验组和对照组一般是流量均衡
  • 运营活动:实验组95%流量,对照组5%流量 刺激用户
  • 功能添加:实验中5%流量,对照组95%流量 验证功能

2.AB测试的流程

主要流程如下:
数据分析【实践】——AB测试的应用、案例及关键点
关于在整个测试流程中的问题

  • 设定目标
    实验组和对照组只有一个变量不一样,其它要一样
    最终通过哪些指标来评估效果
  • 流量分配
    样本量究竟选取多少合适
    怎么判断实验组和对照组的无差异性
  • 数据分析
    测试的时间多久比较合适
    怎么判断实验组提升的显著性
  • 输出结论
    怎么去输出结论

设定目标

类型 建议 实验组 对照组 观察指标
设计 新增用户进入的时候建议核心功能边上增加两个字"点击" 点击 空白 点击率、留存率
运营 建议对过去30天支付宝未活跃,短期画像是理财的老用户,推送理财优惠券 推送 不推送 流失率、触达率、点击率、ROI
产品 建议发布新版本增加短视频功能 有短视频功能 无短视频功能 渗透率、功能留存率、大盘留存率、人均时长、卸载率

只有一个变量,观察指标要确定

流量分配:最少样本量

案例:某客户端当前大盘次日留存率45%,最近决定准备上线一个直播功能,预估至少提升0.2%留存率,问最少需要多少样本量。

理论上:样本越多越好,当样本量很少的时候,容易造成试验结果的不稳定。
工作上:样本量越少越好,流量往往都是很有限的,最重要的是试验成本不能太高。

流量太大有问题:试验成本太高

具体的可以通过各方面情况进行评估,还有一个快捷的方式:
通过 https://www.evanmiller.org/ab-testing/sample-size.html 这个网站,确定当前的基准率,以及想要提升的变化率,便可得到预估的实验最少样本量。

如下图所示:
数据分析【实践】——AB测试的应用、案例及关键点
我们经过计算,当前留存率为45%,提升0.2%,最少需要样本量为97.2万左右。

同时需要设定检验效能和显著性水平,具体概念可看之前的文章定义。
数据分析【实践】——AB测试的应用、案例及关键点

检验情形 原假设成立 原假设不成立
接受原假设 正确 第二类错误 β\beta
拒绝原假设 第一类错误α\alpha 正确

流量分配:样本分配质量

案例:某客户端当前大盘次日留存率45%,最近决定准备上线一个直播功能,预估至少提升0.2%留存率,最终也上线了一周的数据,发现实验组与对照组留存率一直差不多(或者提升太多),怀疑是不是实验组和对照组本身就有差异。

这种情况下:测试之前应该要做一个AA测试

实验组:10w
对照1组:10w
对照2组:10w

通过对比对照1组和对照2组的留存率指标看流量分配是否有问题。

数据分析:实验天数

案例:某客户端当前大盘次日留存率45%,最近决定准备上线一个直播功能,预估至少提升0.2%留存率,每天只有10w的用户量可以做测试,问实验需要多久。

最少样本量为:98w,每天10w,至少需要10天
用户新鲜效应:3天
用户行为周期:周末与平时产品差异很大,需要覆盖一个周末

因此总共实验天数为10+3=13天,也就是测试大约2周

数据分析【实践】——AB测试的应用、案例及关键点

而且在上线后的实验组前几天数据是不可信的,需要长期观察。

数据分析:提升是否显著

案例:某客户端每天有5万用户进入,最近2级功能UI整改,目的是提升点击率,用户在第一次进入的时候被随机分配到A/B组,并后续持续为该组用户。

统计结果:实验组点击率0.02,对照组0.018
问题:现在业务方无法判断提升是否明显?

可以用z检验进行去计算,一般取95%置信区间,求出对应的z值,求出P值,对比其显著性。

数据分析【实践】——AB测试的应用、案例及关键点
这里1.637小于z值1.645,所以提升不明显。

数据结论

  • 即时实验效果不会也要及时同步数据,并及时排查原因
    例子:对过去30天薅羊毛特征未活跃用户,实验组通过短信方法发送优惠券,最好和对照组相比数据没有任何提升,排查发现是短信点击率非常低,后改为app弹窗效果明显提升。
  • 即时实验组功能指标好于对照组,仍然要评估两组的收入成本指标
    例子:某汽车页面实验组增加了一个点击按钮,对照组没有增加,实验组点击率显著优于对照组,但在最终交易额上,对照组更高,因此选择对照组方案。
  • 实验组和对照组可以按照用户基础属性来做拆分,看的更加全面
    例子:对于新用户往往产品接受度更高,实验组UI改版上转化率明显要提高;而对于老用户产品习惯已经养成,实验组UI改版上转化率反而下降。

—————————————————————————————————————————————————
博主码字不易,大家关注点个赞转发再走呗 ,您的三连是激发我创作的源动力^ - ^
数据分析【实践】——AB测试的应用、案例及关键点


推荐阅读
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • Monkey《大话移动——Android与iOS应用测试指南》的预购信息发布啦!
    Monkey《大话移动——Android与iOS应用测试指南》的预购信息已经发布,可以在京东和当当网进行预购。感谢几位大牛给出的书评,并呼吁大家的支持。明天京东的链接也将发布。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了使用Java实现大数乘法的分治算法,包括输入数据的处理、普通大数乘法的结果和Karatsuba大数乘法的结果。通过改变long类型可以适应不同范围的大数乘法计算。 ... [详细]
  • Windows下配置PHP5.6的方法及注意事项
    本文介绍了在Windows系统下配置PHP5.6的步骤及注意事项,包括下载PHP5.6、解压并配置IIS、添加模块映射、测试等。同时提供了一些常见问题的解决方法,如下载缺失的msvcr110.dll文件等。通过本文的指导,读者可以轻松地在Windows系统下配置PHP5.6,并解决一些常见的配置问题。 ... [详细]
  • 微信商户扫码支付 java开发 [从零开发]
    这个教程可以用作了解扫码支付的整体运行过程,已经实现了前端扫码,记录订单,回调等一套完整的微信扫码支付。相关链接:微信支 ... [详细]
  • 数据库技术:execute immediate
    首先在这里发发牢骚,指责下那些刻板的书写方式,不考虑读者理不理解,感觉就是给专业人员用来复习用的一样,没有前戏,直接就高潮,实在受不了!没基础或基础差的完全不知道发生了什么,一脸懵 ... [详细]
  • AndroidJetpackNavigation基本使用本篇主要介绍一下AndroidJetpack组件Navigation导航组件的基本使用当看到Navigation单词的时候应 ... [详细]
  • 如何关闭迅雷会员自动续费详细介绍
    友情提示:教程内容为了更好的解决大家的问题,所以电脑教程网的每一篇内容都是图文并茂的在多端设备下呈现给大家。告诉大家的是,文章内里的图片也尤为重要, ... [详细]
  • php实现文件下载代码一例,
    php教程|php手册php,实现,文件下载,代码,一例,php,实现,文件下载,代码,一例,我们,需要,用到,header,函数,来,发送,php教程-php手册php实现文件下 ... [详细]
  • 一、申明slice会产生什么1.1申明slice当咱们申明一个slice类型,它理论的值什么?{代码}如上咱们申明了一个[]int的slice切片类型输入如下:{代码 ... [详细]
author-avatar
猥琐叔装嫩小孩
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有