热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

数据学习(八)参数估计

1.参数估计的一般问题2.一个总体参数的区间估计3.两个总体参数的区间估计4.样本容量的确定1.参数估计得一般问题所谓参数估计也就是用样本统计量取估计总体的参数。例如,用样本均值x

1.参数估计的一般问题

2.一个总体参数的区间估计

3. 两个总体参数的区间估计

4. 样本容量的确定

1.参数估计得一般问题

所谓参数估计也就是用样本统计量取估计总体的参数。例如,用样本均值x估计总体均值u等。

1.1 估计量与估计值
用来估计总体参数的统计量的名称,称为估计量,用符号O表示。
用来估计总体参数时计算出来的估计量的具体数值,称为估计值。

1.2 点估计与区间估计
参数估计方法有点估计和 区间估计两种。
用样本估计量O的值直接作为总体参数O的估计值,称为参数的点估计。
在点估计得基础上,给出总体参数估计的一个范围,称为参数的区间估计。

1.3 置信区间
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给他取名叫置信区间。
如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值得次数所占的比率,称为置信水平,或称为置信系数。

对置信区间的理解,有以下几点需要注意:
如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值, 5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平 为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表 述。但在实际问题中,进行估计时往往只抽取一个样本,所构造的是与该样本相联系的置信水平为95%的置信区间。由于用该样本所构造的区间是一 个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真 值,所以,我们只能是希望这个区间是大量包含总体参数真值的区间中的一 个,但它也可能是少数几个不包含参数真值的区间中的一个。
之所以这样啰嗦地来表述罝信区间,原因是总体参数的真值是固定的、 未知的,而用样本构造的区间则是不固定的。抽取不同的样本,用该方法可 以得到不同的区间,从这个意义上说,罝信区间是一个随机区间,它会因样本 的不同而不同,而且不是所有的区间都包含总体参数的真值。
例如我们用95%的置倍水平得到某班学生考试成绩(单位:分)的置信区 间为60〜80,需要特别注意的是:我们不能说60〜肋这个区间以95%的概 率包含全班学生平均考试成绩的真值,我们只是知道在多次抽样中有95%的 样本得到的区间包含全班学生平均考试成绩的真值4它的真正意义是如果 做了 100次抽祥,大概有95次找到的区间包含真值,有5次找到的区间不包 含真值。假定全班考试成绩平均数的真值70,60〜80这个区间一定包含真 值,如果全班考试成绩平均数的真值为50,那么区间60〜80就绝对不包含真 值,无论你做多少次试验。因此,这个概率不是用来描述某个特定的区间包 含总体参数真值可能性的。—个特定的区间“总是包含”或“绝对不包含”参数 的真值。不存在“可能包含”或“可能不包含”的问題9但是,用概率可以知道 在多次抽样得到的区间中大槪有多少个区间包含了参数的真值。

1.4 评估估计量的标准

无偏性
无偏性是指估计量抽样分布的数学期望等于被估计得总体参数。设总体参数为O,所选择的估计量为O-,如果E(O-)=O,称O为O-的无偏估计量。

有效性
一个无偏的估计量并不意味着他就非常接近被估计得参数,他还必须与总体参数的离散程度比较小。对于同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。假定有两个用于估计总体参数的无偏估计量,分为用O1h和O2表示,他们的方差分为用D(O1)he和D(O2)表示。在无偏估计的条件下,估计量方差越小估计也就越有效。

一致性
一致性是指随着样本容量的增大,点估计的值越来越接近被估总体的参数。

2.一个总体参数的区间估计

当我们研究一个总体时,所关心的参数主要有总体均值,总体比例,总体方差等。这一节我们将介绍如何用样本统计量来构造总体参数的置信区间。

2.1 总体均值的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
2.2 总体比例的区间估计

这里我们只讨论大样本的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
2.3 总体方差的区间估计

《数据学习(八)-参数估计》
《数据学习(八)-参数估计》

3. 两个总体参数的区间估计

对于两个总体,我们所关心的参数主要有两个总体的均值之差,两个总体的比例之差,两个总体的方差比等。
3.1 两个总体均值之差的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
3.2 两个总体比例之差的区间估计

《数据学习(八)-参数估计》
3.2 两个总体方差比的区间分布

《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》

4. 样本容量的确定

在进行参数估计之前,首先应该确定一个适当的样本容量,也就是应该抽取一个多大的样本来估计总体参数。在进行估计时,我们总是希望提高估计得可靠程度。通常,样本容量的确定与我们愿意容忍的置信区间的宽度以此区间设置的置信水平有一定关系。因此如何确定适当的样本容量,也是抽样估计的一个要考虑的问题。

4.1 估计总体均值时的样本容量的确定
《数据学习(八)-参数估计》
4.2 估计总体比例时的样本容量估计
《数据学习(八)-参数估计》
4.3 估计两个总体均值之差的样本容量确定
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
4.4 估计两个总体比例之差的样本容量确定
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》


推荐阅读
  • Søren Kierkegaard famously stated that life can only be understood in retrospect but must be lived moving forward. This perspective delves into the intricate relationship between our lived experiences and our reflections on them. ... [详细]
  • 计算机网络复习:第五章 网络层控制平面
    本文探讨了网络层的控制平面,包括转发和路由选择的基本原理。转发在数据平面上实现,通过配置路由器中的转发表完成;而路由选择则在控制平面上进行,涉及路由器中路由表的配置与更新。此外,文章还介绍了ICMP协议、两种控制平面的实现方法、路由选择算法及其分类等内容。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • 题目描述:给定n个半开区间[a, b),要求使用两个互不重叠的记录器,求最多可以记录多少个区间。解决方案采用贪心算法,通过排序和遍历实现最优解。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 本文探讨如何设计一个安全的加密和验证算法,确保生成的密码具有高随机性和低重复率,并提供相应的验证机制。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 在金融和会计领域,准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据,还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法,确保数据的标准化和规范化。 ... [详细]
  • 在给定的数组中,除了一个数字外,其他所有数字都是相同的。任务是找到这个唯一的不同数字。例如,findUniq([1, 1, 1, 2, 1, 1]) 返回 2,findUniq([0, 0, 0.55, 0, 0]) 返回 0.55。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
  • 网络攻防实战:从HTTP到HTTPS的演变
    本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程,探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
author-avatar
爷W很幸福_448
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有