当前位置: 开发笔记 > 后端 > 正文

smoothl1函数_PyTorch中的损失函数L1Loss/L2Loss/SmoothL1Loss

作者：oko123 | 来源：互联网 | 2023-06-03 16:34

L1Loss也就是L1Loss了，它有几个别称：L1范数损失最小绝对值偏差(LAD)最小绝对值误差(LAE)最常看到的MAE也是指L1Loss损失函数。

L1Loss

也就是L1 Loss了&＃xff0c;它有几个别称&＃xff1a;L1 范数损失

最小绝对值偏差(LAD)

最小绝对值误差(LAE)

最常看到的MAE也是指L1 Loss损失函数。它是把目标值

与模型输出(估计值)

做绝对值得到的误差。

什么时候使用&＃xff1f;回归任务

简单的模型

由于神经网络通常是解决复杂问题&＃xff0c;所以很少使用。

L2Loss

也就是L2 Loss了&＃xff0c;它有几个别称&＃xff1a;L2 范数损失

最小均方值偏差(LSD)

最小均方值误差(LSE)

最常看到的MSE也是指L2 Loss损失函数,PyTorch中也将其命名为torch.nn.MSELoss

它是把目标值

与模型输出(估计值)

做差然后平方得到的误差

什么时候使用&＃xff1f;回归任务

数值特征不大

问题维度不高

SmoothL1Loss

简单来说就是平滑版的L1 Loss。

原理

SoothL1Loss的函数如下&＃xff1a;

仔细观察可以看到&＃xff0c;当预测值和ground truth差别较小的时候(绝对值差小于1)&＃xff0c;其实使用的是L2 Loss&＃xff1b;而当差别大的时候&＃xff0c;是L1 Loss的平移。SooothL1Loss其实是L2Loss和L1Loss的结合&＃xff0c;它同时拥有L2 Loss和L1 Loss的部分优点。

1. 当预测值和ground truth差别较小的时候(绝对值差小于1)&＃xff0c;梯度不至于太大。(损失函数相较L1 Loss比较圆滑)

2. 当差别大的时候&＃xff0c;梯度值足够小(较稳定&＃xff0c;不容易梯度爆炸)。

什么时候使用&＃xff1f;回归

当特征中有较大的数值

适合大多数问题

size_average&＃61;True or False

在pytorch中&＃xff0c;所有的损失函数都带这个参数&＃xff0c;默认设置为True。

当size_average为True的时候&＃xff0c;计算出来的结果会对mini-batch取平均。反之&＃xff0c;为False的时候&＃xff0c;那算出来的绝对值不会除以n。

推荐阅读

api
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
api
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
vb
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
vb
从一维到三维的模型扩展

本文源自Coursera平台吴恩达教授的深度学习课程，重点探讨了卷积神经网络（ConvNets）从二维图像处理向一维信号及三维数据处理的拓展应用。 ... [详细]

蜡笔小新 2024-11-20 16:09:22
漏洞
新浪微博热搜暂停更新；即刻APP回归；Android 11 Beta版发布 | 科技新闻速递

为您带来最新的科技资讯，涵盖社交媒体动态、软件更新及行业重大事件。CSDN携手您共同关注科技前沿。 ... [详细]

蜡笔小新 2024-11-20 12:38:19
nlp
计算机学报精选论文概览（2020-2022）

本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文，旨在为即将投稿的研究者提供参考。 ... [详细]

蜡笔小新 2024-11-20 11:08:21
nlp
机器学习（ML）三之多层感知机

深度学习主要关注多层模型，现在以多层感知机（multilayerperceptron，MLP）为例，介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]

蜡笔小新 2024-11-19 19:02:28
nlp
微软等企业捐赠首批AI有声读物，助力视障人士

12月2日，微软联合鹿音苑文化传播公司及150多名志愿者，共同捐赠了首批由人工智能生成的有声内容，旨在为视障人士提供更多文化资源。 ... [详细]

蜡笔小新 2024-11-17 19:13:27
session
mybatis 详解（七）一对一、一对多、多对多

mybatis详解（七）------一 ... [详细]

蜡笔小新 2024-11-17 10:03:06
api
python包requests 发送http请求，获取响应数据

文章目录python包-requests关于requests包安装和使用pythonrequests请求超时设置工作中遇到的常见问题整理访问https网站，报错cer ... [详细]

蜡笔小新 2024-11-17 09:54:22
api
iOS 百度地图使用指南：基本定位与地理编码

本文详细介绍如何在 iOS 应用中集成百度地图，实现基本的地图定位和地理编码功能。配置详情请参考官方文档：http://developer.baidu.com/map/index.php?title=iossdk ... [详细]

蜡笔小新 2024-11-16 14:37:27
api
Java 中的控制流与作用域

本文详细介绍了 Java 中的控制流语句，包括块作用域、if 语句、for 循环、while 循环、do-while 循环、switch 语句以及 break 和 continue 语句的使用方法。通过具体的代码示例，帮助读者更好地理解和应用这些控制流结构。 ... [详细]

蜡笔小新 2024-11-16 13:45:31
token
LeetCode 实战：寻找三数之和为零的组合

给定一个包含 n 个整数的数组，判断该数组中是否存在三个元素 a、b、c，使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]

蜡笔小新 2024-11-15 18:39:48
curl
嵌入式Linux工程师笔试题精选

本文整理了一份基础的嵌入式Linux工程师笔试题，涵盖填空题、编程题和简答题，旨在帮助考生更好地准备考试。 ... [详细]

蜡笔小新 2024-11-15 10:42:13
curl
直播带货系统中的推流技术详解

本文介绍了RTMP（实时消息传输协议）及其在直播带货系统中的应用，并详细探讨了带货直播系统的连麦方案，包括服务端合流和客户端合流的优势与劣势。 ... [详细]

蜡笔小新 2024-11-14 23:35:26

oko123

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章