当前位置: 开发笔记 > 前端 > 正文

七月机器学习之决策树随机森林和adaboost11

作者：手机用户2502910523 | 来源：互联网 | 2023-05-18 14:57

信息是对不确定性的度量平均互信息是衡量两个概率分布之间的相似性，互信息高那么相似性就比较大他们之间的运算关系都在这个图里I是互信息熵减去条件熵就是互信息条件熵是衡量差异性的

信息是对不确定性的度量
平均互信息是衡量两个概率分布之间的相似性，互信息高那么相似性就比较大
这里写图片描述

他们之间的运算关系都在这个图里
I是互信息
熵减去条件熵就是互信息
条件熵是衡量差异性的
也就是说，之前的不确定性减去之后的不确定性等于不确定性的减少，不确定性的减少意味着确定性的增加，实际上就是我们寻找的相关性

这里写图片描述

这里写图片描述
主要理解ID3即可

A是特征，D是标签label
这里写图片描述

决策树的面试会问
这里写图片描述

由以下公式可知，基尼系数实际上是熵的一种近似
Pk是某一个样本基于这一类特征属于某一类的概率
0.5时取最大值
这里写图片描述

这里写图片描述

adaboost实际上是对不同的分类器设置权重，如果所有的分类器都是决策树的话，那么实际上bagging就变成了随机森林，随机森林的随机是样本的选取是随机的，特征的选取是随机的，样本的随机抽取是有放回的。随机森林对分类器没有权重，对样本有权重

这里写图片描述

G和阿尔法都是需要选择的
这里写图片描述

推荐阅读

label
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
label
基于贪心算法的字母区间划分

本题要求将由小写字母组成的字符串划分为多个片段，确保每个字母只出现在一个片段中。目标是生成尽可能多的片段，并返回每个片段的长度列表。本文将详细解释问题描述、解题思路及代码实现。 ... [详细]

蜡笔小新 2024-12-25 10:58:39
label
优化Element UI组件边框样式

本文介绍如何调整Element UI组件的边框样式，以确保内容与边框之间有足够的间距，并展示如何通过CSS实现更好的布局效果。 ... [详细]

蜡笔小新 2024-12-24 21:08:43
js
深入理解网易NEC CSS框架：规范、应用与学习心得

本文将介绍网易NEC CSS框架的规范及其在实际项目中的应用。通过详细解析其分类和命名规则，探讨如何编写高效、可维护的CSS代码，并分享一些实用的学习心得。 ... [详细]

蜡笔小新 2024-12-24 18:08:51
label
Unity编辑器插件：NGUI资源引用检测工具

本文介绍了一款基于NGUI的资源引用检测工具，该工具能够帮助开发者快速查找和管理项目中的资源引用。其功能涵盖Atlas/Sprite、字库、UITexture及组件的引用检测，并提供了替换和修复功能。文末提供源码下载链接。 ... [详细]

蜡笔小新 2024-12-24 17:17:06
label
React 表单验证：构建无第三方库的表单处理机制

本文将深入探讨如何在不依赖第三方库的情况下，使用 React 处理表单输入和验证。我们将介绍一种高效且灵活的方法，涵盖表单提交、输入验证及错误处理等关键功能。 ... [详细]

蜡笔小新 2024-12-24 15:48:48
js
利用公共数据启动数据驱动型项目

探索如何使用公共数据集为您的编程项目提供动力。无论您是编程新手还是有经验的开发者，本文将为您提供实用建议和资源，帮助您启动并运行一个创新的数据驱动型项目。 ... [详细]

蜡笔小新 2024-12-24 13:08:35
label
分组获取最大N条记录的优化方案及新年祝福

探讨如何从数据库中按分组获取最大N条记录的方法，并分享新年祝福。本文提供多种解决方案，适用于不同数据库系统，如MySQL、Oracle等。 ... [详细]

蜡笔小新 2024-12-24 12:30:56
label
Python 数据可视化：图表绘制与分析

本文介绍了如何使用 Python 的 Matplotlib 和 Pandas 库进行数据可视化。通过示例代码展示了折线图、柱状图和水平柱状图的创建方法，并解释了图表参数设置的具体细节。 ... [详细]

蜡笔小新 2024-12-24 09:47:01
label
利用生成对抗网络生成多标签离散电子健康记录

本文探讨了通过生成对抗网络（GAN）生成合成电子健康记录（EHR）的方法，旨在解决隐私保护问题并促进医学研究。论文地址为：https://arxiv.org/abs/1703.06490v1。该方法通过生成高维离散变量的综合EHR数据，显著提升了医学研究中的数据可用性和安全性。 ... [详细]

蜡笔小新 2024-12-23 17:28:39
dialog
在Xcode中配置自定义文本样式

本文探讨了如何在iOS开发环境中，特别是在Xcode 6.1中，设置和应用自定义文本样式。我们将详细介绍实现方法，并提供一些实用的技巧。 ... [详细]

蜡笔小新 2024-12-23 14:36:31
label
Kubernetes 持久化存储与数据卷详解

本文深入探讨 Kubernetes 中持久化存储的使用场景、PV/PVC/StorageClass 的基本操作及其实现原理，旨在帮助读者理解如何高效管理容器化应用的数据持久化需求。 ... [详细]

蜡笔小新 2024-12-23 12:10:22
label
使用 NumPy 和 Matplotlib 绘制线图

本文介绍如何利用 Python 中的 NumPy 和 Matplotlib 库，从 NumPy 数组中绘制线图。通过具体的代码示例和详细解释，帮助读者理解并掌握这一技能。 ... [详细]

蜡笔小新 2024-12-23 09:40:01
label
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
label
使用.NET Framework实现图形移动功能

本文介绍如何使用.NET Framework开发一个简单的Windows Forms应用程序，以实现图形在窗口内的动态移动。文章详细描述了代码结构、关键逻辑以及最终的实现效果。 ... [详细]

蜡笔小新 2024-12-22 19:41:19

手机用户2502910523

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章