当前位置: 开发笔记 > 后端 > 正文

正则化项与归一化

作者：淡若无诤 | 来源：互联网 | 2023-05-25 10:30

http:blog.csdn.netgshgsh1228articledetails52199870转载首先了解一下正则性（regularity）&#x

http://blog.csdn.net/gshgsh1228/article/details/52199870转载

首先了解一下正则性&＃xff08;regularity&＃xff09;&＃xff0c;正则性衡量了函数光滑的程度&＃xff0c;正则性越高&＃xff0c;函数越光滑。&＃xff08;光滑衡量了函数的可导性&＃xff0c;如果一个函数是光滑函数&＃xff0c;则该函数无穷可导&＃xff0c;即任意n阶可导&＃xff09;。

正则化是为了解决过拟合问题。在Andrew Ng的机器学习视频中有提到&＃xff08;详见http://www.cnblogs.com/jianxinzhou/p/4083921.html&＃xff09;。解决过拟合的两种方法&＃xff1a;

方法一&＃xff1a;尽量减少选取变量的数量。人工检查每一个变量&＃xff0c;并以此来确定哪些变量更为重要&＃xff0c;然后&＃xff0c;保留那些更为重要的特征变量。显然这种做法需要对问题足够了解&＃xff0c;需要专业经验或先验知识。因此&＃xff0c;决定哪些变量应该留下不是一件容易的事情。此外&＃xff0c;当你舍弃一部分特征变量时&＃xff0c;你也舍弃了问题中的一些信息。例如&＃xff0c;也许所有的特征变量对于预测房价都是有用的&＃xff0c;我们实际上并不想舍弃一些信息或者说舍弃这些特征变量。

最好的做法是采取某种约束可以自动选择重要的特征变量&＃xff0c;自动舍弃不需要的特征变量。

方法二&＃xff1a;正则化。采用正则化方法会自动削弱不重要的特征变量&＃xff0c;自动从许多的特征变量中”提取“重要的特征变量&＃xff0c;减小特征变量的数量级。这个方法非常有效&＃xff0c;当我们有很多特征变量时&＃xff0c;其中每一个变量都能对预测产生一点影响。正如在房价预测的例子中看到的那样&＃xff0c;我们可以有很多特征变量&＃xff0c;其中每一个变量都是有用的&＃xff0c;因此我们不希望把它们删掉&＃xff0c;这就导致了正则化概念的发生。

正则化的作用&＃xff1a;

&＃xff08;1&＃xff09;防止过拟合&＃xff1b;

&＃xff08;2&＃xff09;正则化项的引入其实是利用了先验知识&＃xff0c;体现了人对问题的解的认知程度或者对解的估计&＃xff1b;例如正则化最小二乘问题如下&＃xff1a;

N表示所有样本的数量&＃xff0c;n表示参数的个数。

lambda合适即可&＃xff0c;太大又会导致欠拟合。

归一化&＃xff1a;加快收敛速度&＃xff0c;尽快找到最优值

我们在对数据进行分析的时候&＃xff0c;往往会遇到单个数据的各个维度量纲&＃xff08;度量单位&＃xff09;不同的情况&＃xff0c;比如对房子进行价格预测的线性回归问题中&＃xff0c;我们假设房子面积&＃xff08;平方米&＃xff09;、年代&＃xff08;年&＃xff09;和几居室&＃xff08;个&＃xff09;三个因素影响房价&＃xff0c;其中一个房子的信息如下&＃xff1a;

面积(S)&＃xff1a;150 平方米
年代(Y)&＃xff1a;5 年

转:https://www.cnblogs.com/8335IT/p/5868196.html

推荐阅读

cookie
PHP 过滤器详解

本文深入探讨了 PHP 中的过滤器机制，包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时，详细介绍了各种过滤器的用途和用法。 ... [详细]

蜡笔小新 2024-12-23 19:05:02
cookie
QBlog开源博客系统：Page_Load生命周期与参数传递优化（第四部分）

本教程将深入探讨QBlog开源博客系统的Page_Load生命周期，并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解，帮助开发者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-12-28 10:39:53
ci
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
ci
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
cookie
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
api
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
api
HTTP 请求与响应详解

本文深入探讨了HTTP请求和响应的结构，详细解释了每个部分的作用，并提供了相关示例。通过本文，读者可以全面理解HTTP协议中请求和响应的工作原理。 ... [详细]

蜡笔小新 2024-12-27 13:24:07
php
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
php
深入解析JMeter中的JSON提取器及其应用

本文详细介绍了如何在JMeter中使用JSON提取器来获取和处理API响应中的数据。特别是在需要将一个接口返回的数据作为下一个接口的输入时，JSON提取器是一个非常有用的工具。 ... [详细]

蜡笔小新 2024-12-25 16:34:37
cookie
百度搜索结果链接提取工具 UrlGetter V1.43

该工具专为获取百度搜索引擎的结果页面中的网址链接而设计，能够解析并转换为原始URL。通过正则表达式匹配技术，精准提取网页链接，并提供详细的使用说明和下载资源。 ... [详细]

蜡笔小新 2024-12-24 18:46:35
cookie
深入解析Nginx中的Location指令及其属性

本文将详细探讨Nginx配置文件中关键的location指令，包括其三种匹配方式（精准匹配、普通匹配和正则匹配），以及如何在实际应用中灵活运用这些匹配规则。此外，还将介绍location下的重要子元素如root、alias和proxy_pass，并解释相关参数的使用方法。 ... [详细]

蜡笔小新 2024-12-24 17:53:47
php
基于jQuery的用户注册页面表单验证代码分享

本文介绍了一段使用jQuery实现的用户注册页面表单验证代码，适用于前端开发人员学习和参考。该示例结合了HTML、CSS和JavaScript，确保用户输入的数据格式正确。 ... [详细]

蜡笔小新 2024-12-24 14:37:46
api
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
port
导航栏样式练习：项目实例解析

本文详细介绍了如何创建一个具有动态效果的导航栏，包括HTML、CSS和JavaScript代码的实现，并附有详细的说明和效果图。 ... [详细]

蜡笔小新 2024-12-27 19:42:28
ci
深入理解Java中的volatile、内存屏障与CPU指令

本文详细探讨了Java中volatile关键字的作用机制，以及其与内存屏障和CPU指令之间的关系。通过具体示例和专业解析，帮助读者更好地理解多线程编程中的同步问题。 ... [详细]

蜡笔小新 2024-12-27 17:26:33

淡若无诤

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章