热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

整理总结:深入浅出统计学——置信区间的构建

参考资料:电子工业出版社的《深入浅出统计学》前言我们的确可以使用点估计量来估计总体均值、方差或一定比例的精确值,但是我们始终无法确定我们使用的样本一

参考资料:电子工业出版社的《深入浅出统计学》


前言

我们的确可以使用点估计量来估计总体均值、方差或一定比例的精确值,但是我们始终无法确定我们使用的样本一定是无偏样本,因此我们考虑使用置信区间的方法来估计总体统计量,因为它是考虑了不确定性的方法。


本篇目录

  • 参考资料:电子工业出版社的《深入浅出统计学》
    • 前言
    • 具体内容
      • 一、置信区间的求解 —— 总体正态、样本正态
        • 1、选择总体统计量
        • 2、求出其抽样分布
        • 3、决定置信水平
        • 4、求出置信上下限
      • 二、置信区间的简便算法
        • 1、统计量的抽样分布符合正态分布时
        • 2、统计量的抽样分布符合T分布时
      • 三、特殊情况 —— 总体正态、样本T分布
        • 1、选择总体统计量
        • 2、求X‾\overline XX的概率分布
        • 3、决定置信水平
        • 4、求出μ\muμ的置信上下限


具体内容

糖果公司用一个包含100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,于是便在电视节目黄金时段宣布其公司糖球口味的平均持续时间为62.7分钟,但有人自行做了测试,得出了不同的结果,威胁要起诉糖果公司。
此时,我们应该制定的是总体均值的估计值的区间范围,而不是一个精确值,因为这样的话会给予我们更大的误差空间,就不容易被人起诉了。


一、置信区间的求解 —— 总体正态、样本正态


1、选择总体统计量

在问题中,需要为糖球口味持续时间的均值来构建区间,于是需要为总体均值μ\muμ来构建一个置信区间。


2、求出其抽样分布

为了求出总体均值的抽样分布,我们需要先计算出X‾\overline XX的期望、方差和分布。而这些在上一节中已经计算过了。在这里插入图片描述
此时一个问题是我们现在并不知道总体的方差是多少,但是我们可以借用点估计法μ^\hat{\mu}μ^s2s^2s2 来近似替代,因为这已经是我们目前所具有的数据中可以得到的最近似的值了。公式进一步推导成如下形式。在这里插入图片描述
对于样本均值的分布,我们可以根据"若X符合正态分布,那么X‾\overline XX也符合正态分布"的定理来得知,其应符合正态分布。在本题中即是X‾∼N(μ,s2n)\overline X \thicksim N(\mu,\frac{s^2}{n})XN(μ,ns2)


3、决定置信水平

置信水平表明你希望自己对于“总体统计量落入置信区间”的这一说法有多大的把握,比如我们希望总体均值的执行水平为95%,这表明总体均值处于置信区间的概率为0.95,当然可以更高如99%,这样糖果公司就可以更有信心在广告宣称“总体均值位于这个置信区间”这一说法。
值得注意的是,置信水平越高,区间越宽,也就是确定的概率越大,范围越广,也越对说法有把握。
为了防止说法几乎毫无意义,我们需要确定一个合适的置信水平,确保范围小而可靠,对此,我们一般采用95%作为常用置信水平。在这里插入图片描述


4、求出置信上下限

根据抽样分布和选择好的置信水平来求出置信上下限,从而确定置信区间的范围。在这里插入图片描述
此时我们再将X‾\overline XX进行标准化,从而利用正态分布表来查出其对应的区间值。
在这里插入图片描述
此时我们将括号里面的不等式进行展开,即可确定置信区间范围,其中X‾\overline XX可以通过样本x‾\overline xx来计算。
在这里插入图片描述
得出最后结果。
在这里插入图片描述


二、置信区间的简便算法


1、统计量的抽样分布符合正态分布时

在这里插入图片描述在这里插入图片描述


2、统计量的抽样分布符合T分布时

在这里插入图片描述


三、特殊情况 —— 总体正态、样本T分布

糖果公司想求出糖球重量的置信区间,但只抽取了少量的样本,比如抽取了一个具有代表性的样本,共10颗,然后称了每一粒糖球的重量,计算出这个样本的X‾\overline XX=0.5,s2s^2s2=0.09,此时该如何求出其置信区间。


1、选择总体统计量

我们需要为糖球重量均值构建一个置信区间,也就是要为总体均值μ\muμ构建置信区间。


2、求X‾\overline XX的概率分布

当总体符合正态分布,δ2\delta^2δ2未知,且可供支配的样本很小时,X‾\overline XX符合T分布。而当样本数量为n个时,T分布的形式为T∼t(n−1)T\thicksim t(n-1)Tt(n1),而T=X‾−us/nT=\frac{\overline X - u}{s/\sqrt{n}}T=s/n

Xu,也就是说在这道题中T=X‾−us/n∼t(9)T=\frac{\overline X - u}{s/\sqrt{n}} \thicksim t(9)T=s/n

Xut(9)在这里插入图片描述


3、决定置信水平

一般设置为95%。


4、求出μ\muμ的置信上下限

在这里插入图片描述
再利用T分布概率表可求出P(T>t)=pP(T>t)=pP(T>t)=p中的t值,在这道题中p=0.025。
在这里插入图片描述


推荐阅读
  • 信用评分卡的Python实现与评估
    本文介绍如何使用Python构建和评估信用评分卡模型,涵盖数据预处理、模型训练及验证指标选择。附带详细代码示例和视频教程链接。 ... [详细]
  • 在 Flutter 开发过程中,开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说,理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景,并通过实例帮助你更好地掌握这一重要工具。 ... [详细]
  • 深入理解一致性哈希算法及其应用
    本文详细介绍了分布式系统中的一致性哈希算法,探讨其原理、优势及应用场景,帮助读者全面掌握这一关键技术。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • Linux 学习路径与核心框架
    本文提供了一套系统化的 Linux 学习路径,旨在帮助初学者和中级用户构建全面的知识体系。通过逐步深入的学习方法,掌握从基础命令到高级系统管理的技能。 ... [详细]
  • 本文详细介绍了 Flink 和 YARN 的交互机制。YARN 是 Hadoop 生态系统中的资源管理组件,类似于 Spark on YARN 的配置方式。我们将基于官方文档,深入探讨如何在 YARN 上部署和运行 Flink 任务。 ... [详细]
  • 2018年3月31日,CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会(BTA)核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]
  • 开发笔记:9.八大排序
    开发笔记:9.八大排序 ... [详细]
  • 在使用 Flutter 进行开发时,可能会遇到热更新功能无法正常工作的问题。本文将探讨一种常见的错误:无法连接到 Dart 观察站,并提供详细的解决方法。 ... [详细]
  • 本书系统介绍了概率论的基础概念,包括样本空间、事件及其概率定义,条件概率和独立性,并深入探讨了贝叶斯公式。随后,书中详细讲解了多种类型的随机变量,如离散型(伯努利、二项、几何、泊松)和连续型(均匀、指数、伽玛、正态)。此外,还涵盖了随机变量的期望值计算、联合分布特性、矩母函数以及极限定理等内容。特别地,本书对马尔可夫链、泊松过程及其扩展形式进行了详尽分析,为读者提供了丰富的理论依据和实际应用案例。 ... [详细]
  • 无线通信设备的OTA测试及其重要性
    随着智能设备和无线通信技术的广泛应用,确保这些产品在各种应用场景中的稳定性和可靠性变得至关重要。OTA(Over The Air)测试作为一种关键手段,能够有效验证无线传输设备的整体性能,解决通信问题并提升用户体验。 ... [详细]
  • 本题探讨了在一个有向图中,如何根据特定规则将城市划分为若干个区域,使得每个区域内的城市之间能够相互到达,并且划分的区域数量最少。题目提供了时间限制和内存限制,要求在给定的城市和道路信息下,计算出最少需要划分的区域数量。 ... [详细]
  • 本文探讨了如何使用自增和自减运算符遍历二维数组中的元素。通过实例详细解释了指针与二维数组结合使用的正确方法,并解答了常见的错误用法。 ... [详细]
  • Hybrid 应用的后台接口与管理界面优化
    本文探讨了如何通过优化 Hybrid 应用的后台接口和管理界面,提升用户体验。特别是在首次加载 H5 页面时,为了减少用户等待时间和流量消耗,介绍了离线资源包的管理和分发机制。 ... [详细]
  • 给定行数 numRows,生成帕斯卡三角形的前 numRows 行。例如,当 numRows 为 5 时,返回的结果应为:[[1], [1, 1], [1, 2, 1], [1, 3, 3, 1], [1, 4, 6, 4, 1]]。 ... [详细]
author-avatar
迷人的小刀
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有