热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

R语言quantile()和fivenum()的差别在于——加权平均与算术平均(转载)

转自:http:blog.sina.com.cnsblog_a184ae810102xqwe.htmlquantile()和fivenum()的本质差别在于,quantile()函

转自:http://blog.sina.com.cn/s/blog_a184ae810102xqwe.html

quantile()和fivenum()的本质差别在于,
quantile()函数的算法是采用加权平均,
fivenum()是算术平均。这么说可能不易理解,其实很简单的,下面举个例子说明就容易理解了。

例如,一组数据 x <- 11 : 18,则如下图,第一位是11,第二位是12,,,第8位是18,
《R语言 quantile()和fivenum()的差别在于——加权平均与算术平均(转载)》

对于
quantile()算法——加权平均,
0%位第1位
1+(8-1)*0%=1
),值为11
25%位是第2.75位(1+(8-1)*25%=2.75
),第2.75位介于第2位和第3位之间,距离哪位较近,哪位数据的权重较大,所以第3位数据的权重是0.75,第2位数据是权重是0.25,则25%位值=13*0.75+12*0.25=12.75
《R语言 quantile()和fivenum()的差别在于——加权平均与算术平均(转载)》

同理,50%位第4.5位
1+(8-1)*50%=4.5
),值=14*0.5+15*0.5=14.5
75%位第6.25位
1+(8-1)*75%=6.25
),值=16*0.75+17*0.25=16.25
100%位第8位
1+(8-1)*100%=8
),值为18

对于fivenum
()算法——算术平均,
0%位第1位
1+(8-1)*0%=1
),值为11
25%位是第2.75位(1+(8-1)*25%=2.75
),第2.75位介于第2位和第3位之间,用算术平均法,则25%位值=(13+12)/2=12.5
同理,50%位第4.5位
1+(8-1)*50%=4.5
),值=(14+15)/2=14.5
75%位第6.25位
1+(8-1)*75%=6.25
),值=(16+17)/2=16.5
100%位第8位
1+(8-1)*100%=8
),值为18

用r语言验证:
《R语言 quantile()和fivenum()的差别在于——加权平均与算术平均(转载)》

quantile()的代码

  1. x <- 1:100
  2. n <- length(x)
  3. probs = seq(0, 1, 0.25)
  4. index <- 1 + (n &#8211; 1) * probs
  5. lo <- floor(index)
  6. hi <- ceiling(index)
  7. x <- sort(x, partial = unique(c(lo, hi)))
  8. qs <- x[lo]
  9. i <- which(index > lo)
  10. h <- (index &#8211; lo)[i]
  11. qs[i] <- (1 &#8211; h) * qs[i] + h * x[hi[i]]
  12. qs
  13. quantile(x=1:100)



fivenum
()的代码

  1. x <- 1:100
  2. n <- length(x)
  3. n4 <- floor((n + 3)/2)/2
  4. d <- c(1, n4, (n + 1)/2, n + 1 &#8211; n4, n)
  5. 0.5 * (x[floor(d)] + x[ceiling(d)])
  6. fivenum(x=1:100)

推荐阅读
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 本文介绍如何在 Android 中通过代码模拟用户的点击和滑动操作,包括参数说明、事件生成及处理逻辑。详细解析了视图(View)对象、坐标偏移量以及不同类型的滑动方式。 ... [详细]
  • 深入理解OAuth认证机制
    本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准,旨在为第三方应用提供安全的用户资源访问授权,同时确保用户的账户信息(如用户名和密码)不会暴露给第三方。 ... [详细]
  • 2023 ARM嵌入式系统全国技术巡讲旨在分享ARM公司在半导体知识产权(IP)领域的最新进展。作为全球领先的IP提供商,ARM在嵌入式处理器市场占据主导地位,其产品广泛应用于90%以上的嵌入式设备中。此次巡讲将邀请来自ARM、飞思卡尔以及华清远见教育集团的行业专家,共同探讨当前嵌入式系统的前沿技术和应用。 ... [详细]
  • QBlog开源博客系统:Page_Load生命周期与参数传递优化(第四部分)
    本教程将深入探讨QBlog开源博客系统的Page_Load生命周期,并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先,通过change事件监听用户选择的省份,并动态加载对应的城市列表。其次,详细讲解了使用Validation插件进行表单验证的方法,包括内置规则、自定义规则及实时验证功能。 ... [详细]
  • 本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建,还处理了系统服务的配置和启动,确保在多种 Linux 发行版上都能顺利运行。 ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
author-avatar
暴力的西红柿
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有