热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

r语言决策树,归一化怎么算

归一化就是要把你需要处理的数据经过处理后限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。1.数据的中心化所谓数据的中心化是指数据集中的各


规范化是指对需要处理的数据进行处理后,将其限制在所需范围内(通过某种算法)。 首先正规化是为了方便后面的数据处理,其次保正程序运行时的收敛会变快。


r语言中的正则化函数: scale


数据规范化包括数据中心化和数据标准化。


1 .数据中心化


数据中心化是指从数据集中的每个数据中减去数据集的平均值。


例如,如果存在数据集1、2、3、6、3,并且其平均值为3,则中心化的数据集可为1-3、2-3、3-3、6-3、3-3,也就是-2、-1、0、3、- 3


2 .数据标准化


数据标准化是指将中心化的数据除以数据集的标准偏差,然后从数据集中的每个数据中减去数据集的平均值,再除以数据集的标准偏差。


例如,假设存在平均值为3并且标准偏差为1.87的数据集1、2、3、6和3,则标准化的数据集为(1-3)/1.87,(2-3)/1.87,(3-3)/1.87


数据中心化和标准化的意义相同,是为了消除维度对数据结构的影响。 r语言可以使用scale方法来中心化和标准化数据。


scale函数处理组的数量。 默认情况下,组中的每个数减去组的平均值,然后除以组数的标准差。


有以下两个参数。


center=真。 默认情况下,从组中的每个数中减去平均值,如果为false,则不减去平均值。


比例=真。 默认情况下,组中的每个数除以标准偏差。


默认情况下,scale从组数的每个数中减去组数的平均值,然后除以组数的标准差。


是scale(ss )


[,1]


[1,] -1.3805850


[2,] -0.6371931


[3,] 0.1061988


[4,] 0.8495908


[5,] 1.5929827


[6,] 0.1061988


[7,] -0.6371931


attr (,' scaled:center ' )。


[1] 2.857143


attr (,' scaled:scale ' )。


[1] 1.345185


到目前为止,我们已经介绍了r语言规范化处理的实例,关于r语言规范化处理的内容,请检索脚本房屋的以前的文章,或者继续阅读下一篇相关文章。 我想今后继续支持脚本屋。


推荐阅读
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 最近团队在部署DLP,作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么,他们都以商业秘密为由避而不谈,不得已只能自己查资料学习,于是有了下面的浅见。身为甲方,虽然不需要开发DLP产品,但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器,只有在懂这个工具的原理之后才能更加灵活地使用这个工具,即使出现意外情况也能快速排错,越接近底层,越接近真相。根据DLP的实际用途,本文将DLP检测分为2部分,泄露关键字检测和近似重复文档检测。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 使用Numpy实现无外部库依赖的双线性插值图像缩放
    本文介绍如何仅使用Numpy库,通过双线性插值方法实现图像的高效缩放,避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理,并提供了完整的代码示例。 ... [详细]
  • 本文介绍如何使用Perl编写一个简单的爬虫,从丁香园网站获取意大利的新冠病毒感染情况。通过LWP::UserAgent模块模拟浏览器访问并解析网页内容,最终提取所需数据。 ... [详细]
  • 探讨如何使用正则表达式从类 SQL 查询语句中提取字段及其对应的值。 ... [详细]
  • 本文详细介绍了如何使用Python的re库进行正则表达式匹配,特别是针对URL中的特定参数提取。适合初学者理解和应用。 ... [详细]
  • 百度搜索结果链接提取工具 UrlGetter V1.43
    该工具专为获取百度搜索引擎的结果页面中的网址链接而设计,能够解析并转换为原始URL。通过正则表达式匹配技术,精准提取网页链接,并提供详细的使用说明和下载资源。 ... [详细]
  • 深入解析Nginx中的Location指令及其属性
    本文将详细探讨Nginx配置文件中关键的location指令,包括其三种匹配方式(精准匹配、普通匹配和正则匹配),以及如何在实际应用中灵活运用这些匹配规则。此外,还将介绍location下的重要子元素如root、alias和proxy_pass,并解释相关参数的使用方法。 ... [详细]
  • 本文介绍了多个关于JavaScript的书籍资源、实用工具和编程实例,涵盖从入门到进阶的各个阶段,帮助读者全面提升JavaScript编程能力。 ... [详细]
  • 本文介绍了一段使用jQuery实现的用户注册页面表单验证代码,适用于前端开发人员学习和参考。该示例结合了HTML、CSS和JavaScript,确保用户输入的数据格式正确。 ... [详细]
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • 解决Python中 'NoneType' 对象无属性 'find_all' 错误
    本文详细探讨了在Python编程中遇到的常见错误——'NoneType'对象没有属性'find_all',并深入分析其原因及解决方案。通过理解find_all函数的工作原理和常见用法,帮助读者避免类似问题。 ... [详细]
  • Ihaveastringwithquotesaroundthepathasfollows:我在路径周围有一个带引号的字符串,如下所示:C:\ProgramFiles(x ... [详细]
author-avatar
莪乜子12
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有