热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

数据学习(八)参数估计

1.参数估计的一般问题2.一个总体参数的区间估计3.两个总体参数的区间估计4.样本容量的确定1.参数估计得一般问题所谓参数估计也就是用样本统计量取估计总体的参数。例如,用样本均值x

1.参数估计的一般问题

2.一个总体参数的区间估计

3. 两个总体参数的区间估计

4. 样本容量的确定

1.参数估计得一般问题

所谓参数估计也就是用样本统计量取估计总体的参数。例如,用样本均值x估计总体均值u等。

1.1 估计量与估计值
用来估计总体参数的统计量的名称,称为估计量,用符号O表示。
用来估计总体参数时计算出来的估计量的具体数值,称为估计值。

1.2 点估计与区间估计
参数估计方法有点估计和 区间估计两种。
用样本估计量O的值直接作为总体参数O的估计值,称为参数的点估计。
在点估计得基础上,给出总体参数估计的一个范围,称为参数的区间估计。

1.3 置信区间
由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给他取名叫置信区间。
如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值得次数所占的比率,称为置信水平,或称为置信系数。

对置信区间的理解,有以下几点需要注意:
如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值, 5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平 为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表 述。但在实际问题中,进行估计时往往只抽取一个样本,所构造的是与该样本相联系的置信水平为95%的置信区间。由于用该样本所构造的区间是一 个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真 值,所以,我们只能是希望这个区间是大量包含总体参数真值的区间中的一 个,但它也可能是少数几个不包含参数真值的区间中的一个。
之所以这样啰嗦地来表述罝信区间,原因是总体参数的真值是固定的、 未知的,而用样本构造的区间则是不固定的。抽取不同的样本,用该方法可 以得到不同的区间,从这个意义上说,罝信区间是一个随机区间,它会因样本 的不同而不同,而且不是所有的区间都包含总体参数的真值。
例如我们用95%的置倍水平得到某班学生考试成绩(单位:分)的置信区 间为60〜80,需要特别注意的是:我们不能说60〜肋这个区间以95%的概 率包含全班学生平均考试成绩的真值,我们只是知道在多次抽样中有95%的 样本得到的区间包含全班学生平均考试成绩的真值4它的真正意义是如果 做了 100次抽祥,大概有95次找到的区间包含真值,有5次找到的区间不包 含真值。假定全班考试成绩平均数的真值70,60〜80这个区间一定包含真 值,如果全班考试成绩平均数的真值为50,那么区间60〜80就绝对不包含真 值,无论你做多少次试验。因此,这个概率不是用来描述某个特定的区间包 含总体参数真值可能性的。—个特定的区间“总是包含”或“绝对不包含”参数 的真值。不存在“可能包含”或“可能不包含”的问題9但是,用概率可以知道 在多次抽样得到的区间中大槪有多少个区间包含了参数的真值。

1.4 评估估计量的标准

无偏性
无偏性是指估计量抽样分布的数学期望等于被估计得总体参数。设总体参数为O,所选择的估计量为O-,如果E(O-)=O,称O为O-的无偏估计量。

有效性
一个无偏的估计量并不意味着他就非常接近被估计得参数,他还必须与总体参数的离散程度比较小。对于同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。假定有两个用于估计总体参数的无偏估计量,分为用O1h和O2表示,他们的方差分为用D(O1)he和D(O2)表示。在无偏估计的条件下,估计量方差越小估计也就越有效。

一致性
一致性是指随着样本容量的增大,点估计的值越来越接近被估总体的参数。

2.一个总体参数的区间估计

当我们研究一个总体时,所关心的参数主要有总体均值,总体比例,总体方差等。这一节我们将介绍如何用样本统计量来构造总体参数的置信区间。

2.1 总体均值的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
2.2 总体比例的区间估计

这里我们只讨论大样本的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
2.3 总体方差的区间估计

《数据学习(八)-参数估计》
《数据学习(八)-参数估计》

3. 两个总体参数的区间估计

对于两个总体,我们所关心的参数主要有两个总体的均值之差,两个总体的比例之差,两个总体的方差比等。
3.1 两个总体均值之差的区间估计
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
3.2 两个总体比例之差的区间估计

《数据学习(八)-参数估计》
3.2 两个总体方差比的区间分布

《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》

4. 样本容量的确定

在进行参数估计之前,首先应该确定一个适当的样本容量,也就是应该抽取一个多大的样本来估计总体参数。在进行估计时,我们总是希望提高估计得可靠程度。通常,样本容量的确定与我们愿意容忍的置信区间的宽度以此区间设置的置信水平有一定关系。因此如何确定适当的样本容量,也是抽样估计的一个要考虑的问题。

4.1 估计总体均值时的样本容量的确定
《数据学习(八)-参数估计》
4.2 估计总体比例时的样本容量估计
《数据学习(八)-参数估计》
4.3 估计两个总体均值之差的样本容量确定
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》
4.4 估计两个总体比例之差的样本容量确定
《数据学习(八)-参数估计》
《数据学习(八)-参数估计》


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
  • 本文介绍了游戏开发中的人工智能技术,包括定性行为和非定性行为的分类。定性行为是指特定且可预测的行为,而非定性行为则具有一定程度的不确定性。其中,追逐算法是定性行为的具体实例。 ... [详细]
  • JavaScript设计模式之策略模式(Strategy Pattern)的优势及应用
    本文介绍了JavaScript设计模式之策略模式(Strategy Pattern)的定义和优势,策略模式可以避免代码中的多重判断条件,体现了开放-封闭原则。同时,策略模式的应用可以使系统的算法重复利用,避免复制粘贴。然而,策略模式也会增加策略类的数量,违反最少知识原则,需要了解各种策略类才能更好地应用于业务中。本文还以员工年终奖的计算为例,说明了策略模式的应用场景和实现方式。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • 本文详细介绍了相机防抖的设置方法和使用技巧,包括索尼防抖设置、VR和Stabilizer档位的选择、机身菜单设置等。同时解释了相机防抖的原理,包括电子防抖和光学防抖的区别,以及它们对画质细节的影响。此外,还提到了一些运动相机的防抖方法,如大疆的Osmo Action的Rock Steady技术。通过本文,你将更好地理解相机防抖的重要性和使用技巧,提高拍摄体验。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 无损压缩算法专题——LZSS算法实现
    本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程,以及代码中的注释。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • JVM 学习总结(三)——对象存活判定算法的两种实现
    本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法:引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活,虽然简单高效,但无法解决循环引用的问题;可达性分析算法通过判断对象是否可达来确定存活对象,是主流的Java虚拟机内存管理算法。 ... [详细]
  • 本文介绍了数模国赛的报名参加方法,包括学校报名和自己报名的途径。同时给出了建模竞赛的建议,重在历练的同时掌握方法以及弥补自己的短板。此外,还分享了论文的结构和模型求解部分的注意事项,包括数学命题的表述规范和计算方法的原理等。 ... [详细]
author-avatar
爷W很幸福_448
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有