热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

正态分布是离散分布还是连续分布_正态分布,谁与争峰

大千世界随机现象众多,其分布各异。按数据变量类型划分可以分为离散型与连续性两类:离散型变量根据名称很好理解,就是数据的取值是不连续的。例如

大千世界随机现象众多,其分布各异。

按数据变量类型划分可以分为离散型与连续性两类:

离散型变量根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种结果。你可以把离散数据想象成一块一块垫脚石,你可以从一个数值调到另一个数值,同时每个数值之间都有明确的间隔。

3d4b5dfe1e4c7f1dbfc5e2826489d114.png

离散型(r,v)随机变量的研究工具是概率分布律,即r.v X在它的各个可能取值点的概率。

例:x-b(30,0.1)

fe110ec8263a46587bdc333f435d9e2a.png

例:参数为6的泊松分布

9e9324335e3b982e8d78c0a14c34bf31.png

第2种是连续型变量数据。连续数据正好相反,它能取任意的数值。连续数据就像一条平滑的、连绵不断的道路,你可以沿着这条道路一直走下去。

c2addb20e59ad658b95479a10d5d6394.png

研究连续型随机变量的工具是密度函数(pdf).

570ecd2358610abc2caf12f4c476d26c.png

概率论中最重要的分布--正态分布

正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布.

冠名权那是一个很高的荣誉。早年德国的钢镚和10马克的纸币上都留有高斯的头像和正态密度曲线。正态分布被冠名高斯分布,我们也容易认为是高斯发现了正态分布,其实不然,不过高斯对于正态分布的历史地位的确立是起到了决定性的作用。

0293b1ed3ce1a593f2f63b81ac05efbc.png

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

这个钟型的分布曲线不但形状优雅,其密度函数更加的简洁漂亮,两个最重要的数学常量π,e 都出现在了公式之中。在我个人的审美之中,它也属于top-N的最美丽的数学公式之一,如果有人问我数理统计领域哪个公式最能让人感觉到上帝的存在,那我一定投正态分布的票。因为这个分布戴着神秘的面纱,在自然界中无处不在,让你在纷繁芜杂的数据背后看到隐隐的秩序。

0766ea3cc593bd1d0c1b3cd5f73f54ca.png

:标准正态分布图像

dbdd45b74cf4f9a2dcdf5614f5311a4e.png

正态分布无处不在,有些人甚至会觉得正态分布是否存在于世界上的任何分布里?统计学史上的重要人物弗郎西斯高尔顿正是这样认为的,真是正态分布一出,谁与争峰!

统计学中最常用的三大分布卡方分布、t-分布、F-分布,当它们的自由度变大时都会趋向于正态分布。

为什么说正态分布是概率论中最重要的分布?

答:正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

【正态分布——教育统计学】

统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。

【正态分布——友谊、爱情、婚姻和人生】

生活里处处都是正态分布。

最要好,贴心的朋友,伙计儿,哥们儿不会很多,明争暗斗,勾心斗角的朋友也是少数,大部分的朋友都是不冷不热,不疏远也不亲近。见面笑嘻嘻,分别忘干净。一个很标准的正态分布。大多数人都在95%的置信区间,少数人在两尾。所以要珍惜那些在右尾上的好朋友们。而对在95%的那些朋友也就少些期待和要求。

爱情也是这样,随着早期的甜蜜一日不见如隔三秋,据科学研究是2年的时限,我们的大脑不再分泌爱情荷尔蒙的时候,大部分的日子都是平淡不浪漫的的,谈点小情说点小爱,小吵小闹组成了爱情这个钟型图。而绝裂的争吵憎恨也是少数。有了这些少数的争吵,我现在假设他们都是正面的积极的,就会产生一个反重用导致爱的突然上升,于是有一些在另一尾的极少的甜蜜和缠绵。

人生自然也是符合正态分布的。生命历程里的大多数日子里我们都在95%或99%这个区间内,注定碌碌无为平庸无奇,相信总结出人生的真谛就是平淡,平凡,平常的人一定也可能根据借鉴过理论。那些惨绝无伦的日子毕竟还是少数。平淡日子里积攒的力量也许为的就是那一尾的精彩爆发。

从社会构建主义的理论出发,人生是一个动态的,多元的过程。凡是没有绝对,比如什么是真理,事实,美,丑都不再有统一的定论。那这个正态分布也是一样的。有一般朋友向知己的过渡,也有好朋友最后变为陌路人。有危机重重的婚姻爱情最后坚守并甜蜜久久,也有柔情似水假期如梦的爱情最后随风而逝,飘过无痕。关键是心态和行动的问题。

发挥主观能动性,培养主人翁精神,这些读书时看是死板教条的东东换个角度来看,其实也不无道理。毕竟,人生只有一回。怀着感恩的,宽广的心,享受给与也乐于回报。接受不能实现的现实,不能完成的心愿,不能把握的人或事儿。快不快乐,幸不幸福都在我们的一念之间。

【正态分布——范跑跑】

在大洋网开展的“是否赞成对教师实施‘禁跑令’”的调查中,有近70%的网友持反对意见,认为这样的硬性规定太过漠视教师的生命。况且舍己救人的行为,主要取决于一个人的思想境界,而不是绝对应该和必须的。因为从心理学角度来说,人类的社会道德是呈正态分布的,就是一个纺锤形的曲线――英雄是少数的,罪人是少数的,大多数人是中间态的。我们必须接受这个现实,不能要求人人成为英雄,以英雄的标准去要求常人甚至当成基本的要求。



推荐阅读
  • 回顾2003年的非典疫情,那段经历不仅改变了无数人的生活,也给整个国家带来了深远的影响。本文通过一位亲历者的视角,分享了那段特殊时期的点滴故事,并探讨了传染病对社会和个体的影响。 ... [详细]
  • 利用决策树预测NBA比赛胜负的Python数据挖掘实践
    本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据,结合《Python数据挖掘入门与实践》一书中的方法,展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]
  • 本文提供了 CIW Dreamweaver MX2004 认证考试的详细试题解析,涵盖不同难度级别的选择题、多项选择题和判断题。通过这些题目,考生可以更好地理解考试内容并为实际考试做好准备。 ... [详细]
  • 在Fedora 31上部署PostgreSQL 12
    本文详细介绍如何在Fedora 31操作系统上安装和配置PostgreSQL 12数据库。包括环境准备、安装步骤、配置优化以及安全设置,确保数据库能够稳定运行并提供高效的性能。 ... [详细]
  • 本文介绍如何通过CMD命令筛选特定类型的文件路径,并将其导出为TXT文件,同时提供进一步处理这些文件的方法,如批量重命名或合并为PDF。 ... [详细]
  • 设计模式在软件开发中被广泛应用,但如果不当使用,可能会导致系统复杂性增加。例如,过度添加类可能导致类图难以理解,代码跟踪变得复杂。本文探讨如何在使用设计模式时保持系统的简洁和高效。 ... [详细]
  • 精选免费PHP幻灯片模板及图片资源
    提供一系列高质量的免费PHP幻灯片模板和图片资源,涵盖多种风格和应用场景,满足您的各种需求。 ... [详细]
  • 本文详细介绍了如何在Excel中有效利用颜色和代码,解释了不同颜色和代码的具体含义,并提供了实用的操作技巧。通过学习这些内容,用户可以更好地管理和分析数据。 ... [详细]
  • 本文深入探讨了MySQL中常见的面试问题,包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析,帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]
  • 程序员如何优雅应对35岁职业转型?这里有深度解析
    本文探讨了程序员在职业生涯中如何通过不断学习和技能提升,优雅地应对35岁左右的职业转型挑战。我们将深入分析当前热门技术趋势,并提供实用的学习路径。 ... [详细]
  • 优化后的摘要:本文详细分析了当前面临的挑战和机遇,结合具体实例探讨了如何通过创新和改革来推动长期可持续发展。文中还介绍了多种可行的解决方案,并强调了在不同阶段实施这些方案的重要性。 ... [详细]
  • 由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络(TP-GAN),该技术能通过单一侧面照片生成逼真的正面人脸图像,显著提升了不同姿态下的人脸识别效果。 ... [详细]
  • 本文介绍如何在 Visual Studio Code 中使用 Jupyter Notebook 插件,包括创建、编辑和运行笔记本的基本操作。 ... [详细]
  • 多核环境下大规模线性分类的并行对偶坐标下降算法
    本文介绍了一种适用于多核环境的大规模线性分类问题的并行对偶坐标下降算法。该方法通过优化计算资源的分配,显著提高了处理效率和模型性能。论文《Parallel Dual Coordinate Descent Method for Large-scale Linear Classification in Multi-core Environments》详细探讨了这一算法,并提供了实验验证。 ... [详细]
  • ML学习笔记20210824分类算法模型选择与调优
    3.模型选择和调优3.1交叉验证定义目的为了让模型得精度更加可信3.2超参数搜索GridSearch对K值进行选择。k[1,2,3,4,5,6]循环遍历搜索。API参数1& ... [详细]
author-avatar
vm经典全屏
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有