热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

t分布f分布与样本均值抽样分布_常见的统计分布数据分析

大纲:常见的离散型概率分布(二项,几何,超几何,泊松)常见的连续型概率分布(指数,正态,均匀)三大抽样分布(卡方,t,F)一些推论和分布之间的关系离散型分布二项分布实验重复n次,每

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

大纲:

  1. 常见的离散型概率分布(二项,几何,超几何,泊松)
  2. 常见的连续型概率分布(指数,正态,均匀)
  3. 三大抽样分布(卡方,t,F)
  4. 一些推论和分布之间的关系

离散型分布

  • 二项分布

实验重复n次,每次实验相互独立(伯努利实验),实验有两种结果,成功概率p,失败概率1-p。

在二项分布中,我们关注的是在n次试验中成功的次数(区别于几何分布)。

举个栗子:

当我们要计算抛硬币n次,恰巧有x次正面朝上的概率,可以使用二项分布的公式:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

二项概率的数学期望为E(x) = np,方差D(x) = np(1-p)。

  • 几何分布

几何分布(英语:Geometric distribution)指的是以下两种离散型概率分布中的一种:

  • 在伯努利试验中,得到一次成功所需要的试验次数 X
  • 在得到第一次成功之前所经历的失败次数 X

n重伯努利实验

在第X次成功的概率:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 超几何分布

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还 (without replacement))。

例如:从N个样本中抽取n个,N个中有r个不合格的,求抽到x个不合格样本的概率。

超几何分布的概率分布,均值和方差:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 泊松分布

泊松概率的成立条件是在任意两个长度相等的时间区间中,事件发生的概率是相同的,并且事件是否发生都是相互独立的。

x代表发生x次,u代表发生次数的数学期望,概率函数为:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

实际计算过程中用这个公式更好理解:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t是你要计算的时间区间长度,t=1时即为泊松分布(单位时间),扩展后的函数是泊松过程。

泊松分布的数学期望和方差相等,因此E(x) = D(x) = λ。

连续型分布

  • 均匀分布

在取值区间内出现概率相同(常数)

概率密度函数,均值和方差:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 指数分布

指数分布是连续型概率分布!!!放在这里是因为它跟泊松分布关系密切,可以由泊松分布推导而来。

指数分布是事件的时间间隔的概率。时间间隔大于t,等同于t时间内事件次数为0的概率,而后者的概率可以由泊松过程给出。

推导过程:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

指数分布的期望和方差:若以λ为参数,则是E(X)=1/λ D(X)=1/λ²

  • 正态分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

正态分布的经验法则:

均值±标准差:68.3%

均值±2标准差:95.4%

均值±3标准差:99.7%

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

抽样分布

  • 点估计和区间估计

点估计:用样本统计量估计总体参数,未给出估计的可靠程度(置信度)

区间估计:给定置信水平,以估计值为中心给出真实值可能出现的区间范围。

  • 大数定律和中心极限定理

大数定律:样本量趋近于无穷时,样本均值收敛到总体期望

中心极限定理:

1,样本均值约等于总体均值

2,抽样次数趋近于无穷时,样本均值围绕总体均值呈现正态分布(无论总体分布是否服从正态分布)

  • 标准差与标准误

标准差 = 一次抽样中个体分数间的离散程度,反映了个体分数对样本均值的代表性,用于描述统计

标准误 = 多次抽样中样本均值间的离散程度,反映了样本均值对总体均值的代表性,用于推论统计

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 卡方分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其形状:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

当自由度n增大时,卡方分布的概率密度函数趋于对称。

卡方分布的性质:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • t分布

在讲t分布之前先了解下t检验和z检验:

  1. Z-Test 用于大样本(n>30),或总体方差已知;
  2. T-Test 在小样本(n<30),且总体方差未知时,适用性优于Z-Test,而在大样本时,T-Test 与 Z-Test 结论趋同。

单样本t统计量:由于总体标准差未知,一般用样本标准差S估计总体标准差

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

双样本t统计量:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t统计量的分布服从t分布。当样本量无限大时,t分布无限接近于正态分布N(0,1)。

自由度为n的t分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其形状:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

t变量的性质:当n趋向于无穷大时,t变量的极限分布为N(0,1)。

  • F分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

概率密度函数及其图形:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

自由度为m,n的F分布的密度函数

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

F分布的自由度mn是有顺序的, 当m≠n时, 若将自由度mn的顺序颠倒一下, 得到的是两个不同的F分布.

F变量的性质:

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

几个重要推论和分布间的关系

  • 正态变量线性函数的分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 正态变量样本均值和样本方差的分布

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

  • 一些推论

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

《t分布f分布与样本均值抽样分布_常见的统计分布--数据分析》

参考资料:

小白都能看懂的95%置信区间_bitcarmanlee的博客-CSDN博客

https://blog.csdn.net/anshuai_aw1/article/details/82656691

《商务与经济统计》学习笔记(七)-各统计分布知识点归纳_天阑之蓝的博客-CSDN博客

如何七周成为数据分析师15:读了本文,你就懂了概率分布 | 人人都是产品经理


推荐阅读
  • 深入剖析 DEX 赛道:从 60 大头部项目看五大趋势
    本文通过分析 60 大头部去中心化交易平台(DEX),揭示了当前 DEX 赛道的五大发展趋势,包括市场集中度、跨链协议、AMM+NFT 结合、新公链崛起以及稳定币和衍生品交易的增长潜力。 ... [详细]
  • 深入解析Android自定义View面试题
    本文探讨了Android Launcher开发中自定义View的重要性,并通过一道经典的面试题,帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识,还提供了实际操作建议。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 本文探讨了如何在给定整数N的情况下,找到两个不同的整数a和b,使得它们的和最大,并且满足特定的数学条件。 ... [详细]
  • 采用IKE方式建立IPsec安全隧道
    一、【组网和实验环境】按如上的接口ip先作配置,再作ipsec的相关配置,配置文本见文章最后本文实验采用的交换机是H3C模拟器,下载地址如 ... [详细]
  • 非公版RTX 3080显卡的革新与亮点
    本文深入探讨了图形显卡的进化历程,重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]
  • 本文详细探讨了Java中的24种设计模式及其应用,并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类,帮助开发者更好地理解和应用这些模式,提升代码质量和可维护性。 ... [详细]
  • 探讨一个显示数字的故障计算器,它支持两种操作:将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
author-avatar
十分风格的功夫_723
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有