作者:莪乜子12 | 来源:互联网 | 2023-07-09 03:25
归一化就是要把你需要处理的数据经过处理后限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。1.数据的中心化所谓数据的中心化是指数据集中的各
规范化是指对需要处理的数据进行处理后,将其限制在所需范围内(通过某种算法)。 首先正规化是为了方便后面的数据处理,其次保正程序运行时的收敛会变快。
r语言中的正则化函数: scale
数据规范化包括数据中心化和数据标准化。
1 .数据中心化
数据中心化是指从数据集中的每个数据中减去数据集的平均值。
例如,如果存在数据集1、2、3、6、3,并且其平均值为3,则中心化的数据集可为1-3、2-3、3-3、6-3、3-3,也就是-2、-1、0、3、- 3
2 .数据标准化
数据标准化是指将中心化的数据除以数据集的标准偏差,然后从数据集中的每个数据中减去数据集的平均值,再除以数据集的标准偏差。
例如,假设存在平均值为3并且标准偏差为1.87的数据集1、2、3、6和3,则标准化的数据集为(1-3)/1.87,(2-3)/1.87,(3-3)/1.87
数据中心化和标准化的意义相同,是为了消除维度对数据结构的影响。 r语言可以使用scale方法来中心化和标准化数据。
scale函数处理组的数量。 默认情况下,组中的每个数减去组的平均值,然后除以组数的标准差。
有以下两个参数。
center=真。 默认情况下,从组中的每个数中减去平均值,如果为false,则不减去平均值。
比例=真。 默认情况下,组中的每个数除以标准偏差。
默认情况下,scale从组数的每个数中减去组数的平均值,然后除以组数的标准差。
是scale(ss )
[,1]
[1,] -1.3805850
[2,] -0.6371931
[3,] 0.1061988
[4,] 0.8495908
[5,] 1.5929827
[6,] 0.1061988
[7,] -0.6371931
attr (,' scaled:center ' )。
[1] 2.857143
attr (,' scaled:scale ' )。
[1] 1.345185
到目前为止,我们已经介绍了r语言规范化处理的实例,关于r语言规范化处理的内容,请检索脚本房屋的以前的文章,或者继续阅读下一篇相关文章。 我想今后继续支持脚本屋。