首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 人工智能 > 正文

《R语言数据挖掘：实用项目解析》——2.5解读分布

作者：Victory学德语 | 来源：互联网 | 2023-09-12 17:26

本节书摘来自华章计算机《R语言数据挖掘：实用项目解析》一书中的第2章，第2.5节，作者［印度］普拉迪帕塔·米什拉（Pradeepta Mishra），译黄芸，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.5　解读分布

计算概率分布、将数据点拟合于一些特定类型的分布以及后续的解读有助于建立假设。此假设可用于在给定一组参数下估算事件的概率。我们来看看对不同类型分布的解读。

解读连续型数据

一个数据集的任何变量都可通过拟合一个分布来得到其分布参数的最大似然估计。密度函数适用于诸如“贝塔”“柯西”“卡方”“指数”“f”“伽马”“几何”“对数正态”“logistic”“负二项”“正态”“泊松”“t”和“威布尔”等分布。这些分布都是常用的，这里不给出示例。对于连续型数据，我们采用正态分布和t分布：

《R语言数据挖掘：实用项目解析》——2.5　解读分布

在上面的代码中，我们用的是Cars93数据集中的MPG.highway变量。通过让t分布拟合这个变量，我们得到参数估计、标准误差估计、协方差矩阵估计、对数似然值还有总数。类似的操作也适用于对连续型变量执行正态分布拟合：

《R语言数据挖掘：实用项目解析》——2.5　解读分布

现在我们来看如何图形化地表示变量的正态性：

《R语言数据挖掘：实用项目解析》——2.5　解读分布

可以看到，所表示的偏离的数据点距离直线很远。

下面解读离散数据，因为其中有所有分类：

《R语言数据挖掘：实用项目解析》——2.5　解读分布

为了将结果可视化，我们需要用到下图所示的盒状图：

《R语言数据挖掘：实用项目解析》——2.5　解读分布

数据挖掘

推荐阅读

数据挖掘
大数据分析Python有哪些爬虫框架

一、ScrapyScrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。。用 ... [详细]

蜡笔小新 2024-09-29 13:04:13
机器学习
AI 学习路线：从Python开始机器学习

AI 学习路线：从Python开始机器学习 ... [详细]

蜡笔小新 2024-09-28 14:04:30
数据挖掘
数据分析的组成部分及其商业价值

本文介绍了数据分析的组成部分，包括数据采集、数据挖掘和数据可视化，并强调了数据挖掘的商业价值和数据可视化的重要性。数据分析是通过挖掘数据中的规律来指导业务的过程，而数据可视化则可以直观地呈现数据分析的结果。 ... [详细]

蜡笔小新 2023-12-09 18:47:39
数据挖掘
PHP组合工具以及开发所需的工具

本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件，包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境，包括推荐的AppServ等版本。 ... [详细]

蜡笔小新 2023-12-09 17:36:44
机器学习
数据结构与算法的重要性及基本概念、存储结构和算法分析

数据结构与算法在编程领域中的重要性不可忽视，无论从事何种岗位，都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外，还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]

蜡笔小新 2023-12-09 10:17:45
svm
PRML读书会第十四章 Combining Models（committees，Boosting，AdaBoost，决策树，条件混合模型）...

主讲人网神（新浪微博:豆角茄子麻酱凉面）网神(66707180)18:57:18大家好，今天我们讲一下第14章combiningmodel ... [详细]

蜡笔小新 2023-10-17 17:04:24
机器学习
python可以做什么工作好Python入门后，想要从事自由职业可以做哪方面工作？

Python入门后，想要从事自由职业可以做哪方面工作？1.爬虫很多人入门Python的必修课之一就是web开发和爬虫。但是这两项想要赚钱的话 ... [详细]

蜡笔小新 2023-10-17 16:29:09
算法
SmartMining

应用场景当遇到数据分类，聚类，预测等场景问题，普通的SQL方法无法解决，需要借助算法这件武器，比如聚类算法，分类算法，预测算法等等，但是手动去研究一个算法比较吃力，有没有那种工具， ... [详细]

蜡笔小新 2023-10-17 15:45:01
算法
【Python学习】基于 KNN 模型的葡萄酒种类预测

算法原理K最近邻(KNN，k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。给定测试样本，基于某种距离度量找出训练集中与其最靠近的K个训练样本，然后 ... [详细]

蜡笔小新 2023-10-17 12:17:00
数据挖掘
数据仓库、LODP、OLAP

数据仓库:也称为企业数据仓库，是一种数据存储系统，它将来自于不同数据源的数据进行结构化数据聚合起来，用于业务智能领域的比较和分析 ... [详细]

蜡笔小新 2023-10-16 16:39:29
算法
一份来自清华的数据分析笔记，请查收！

之前发过很多数据分析的文章，收到不少好评，但也有一些困惑：入门数据分析该学哪些知识点？该看哪些书？是从Pyth ... [详细]

蜡笔小新 2023-10-16 12:27:43
数据挖掘
使用python进行自动化打分

数据挖掘研讨课结束了，这门课的考核方法是每个同学根据班里面同学的课堂表现打分，然后老师再取截断平均值作为最后的分数。于是我就想，能否用p ... [详细]

蜡笔小新 2023-10-16 12:18:20
数据挖掘
未来大行其道的仿真×××机器人，你会花10万块钱买一个吗？

这两天小编在追脑洞科幻剧《西部世界》，看到下面这一幕时↓↓不禁让小编想起了“仿真机器人”。今日无写作灵感的小编，立马用超级写手Giiso写作机器人小智& ... [详细]

蜡笔小新 2023-10-16 11:17:12
机器学习
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
深度
NLPIR语义智能平台指引未来文本挖掘的发展方向

　　数据挖掘作为近年来新兴的一门计算机边缘学科，其在国内外引起了越来越多的关注。并且随着数据挖掘技术的不断改进和数据挖掘工具的不断完善，数据挖掘必将在各行各业中得到广泛的应用。　　 ... [详细]

蜡笔小新 2023-10-15 21:37:37

Victory学德语

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有