当前位置: 开发笔记 > 编程语言 > 正文

python里的jh是啥意思_1.Yolov5学习率调整策略_jhsignal的博客CSDN博客

作者：Angkaka | 来源：互联网 | 2023-09-25 18:57

原文作者：jhsignal原文标题：1.Yolov5学习率调整策略发布时间：置顶1.Yolov5学习率调整策略:lr_scheduler.

原文作者：jhsignal

原文标题：1.Yolov5学习率调整策略

发布时间：置顶

1.Yolov5学习率调整策略:lr_scheduler.LambdaLR

本代码模拟yolov5的学习率调整，深度解析其中torch.optim.lr_scheduler在yolov5的使用方法，有助于提高我们对该代码的理解。

为了简单实现模拟yolov5的学习率调整策略，在此代码中我使用resnet18网络，yolov5则使用的是darknet网络骨架。

在yolov5代码训练的过程中，作者对不同的层使用不同的学习率调整方法，分别分为权重层weight，偏执层bais，和BN层，单独调整不同层的学习率可以使得模型训练的更好。

另外，yolov5在对学习率更新也采用了warmp-up的的方法预热学习率。在warmp-up阶段，采用的是一维线性插值来进行对每次迭代的学习率进行更新，在warmp-up阶段以后采用的余弦退火算法来对学习率进行更新。所以接下来我们会分别详细介绍一下代码的组成以及其中所用到的方法：

如下是我模拟yolov5训练代码学习率调整的方法：

1.我定义了训练的总epoch是100，样本总数量是600个，训练的batch_size是20。

import matplotlib.pyplot as plt

import torch

import torch.optim as optim

from torch.optim.lr_scheduler import LambdaLR

from torchvision.models import resnet18

import seaborn as sns

import math

import torch.nn as nn

import numpy as np

num_epochs = 100

nums = 600

batch_size = 20

n = nums/batch_size

#定义10分类网络

model = resnet18(num_classes=10)

# optimizer parameter groups 设置了个优化组：权重，偏置，其他参数

pg0, pg1, pg2 = [], [], []

for k, v in model.named_parameters():

v.requires_grad = True

if &＃39;.bias&＃39; in k:

pg2.append(v) # biases

elif &＃39;.weight&＃39; in k and &＃39;.bn&＃39; not in k:

pg1.append(v) # apply weight decay

else:

pg0.append(v) # all else

optimizer = optim.SGD(pg0, lr=0.01,momentum=0.937, nesterov=True)

#给optimizer管理的参数组中增加新的组参数，

#可为该组参数定制lr,momentum,weight_decay 等在finetune 中常用。

optimizer.add_param_group({&＃39;params&＃39;: pg1,&＃39;weight_decay&＃39;:0.0005 }) # add pg2 (biases)

optimizer.add_param_group({&＃39;params&＃39;: pg2}) # add pg2 (biases)

lf = lambda x: ((1 + math.cos(x * math.pi / num_epochs)) / 2) * (1 - 0.2) + 0.2

scheduler = LambdaLR(

optimizer=optimizer,

lr_lambda=lf, #传入一个函数或一个以函数为元素列表，作为学习率调整的策略

)

start_epoch=0

scheduler.last_epoch = start_epoch - 1

lr0,lr1,lr2, epochs = [], [], [] ,[]

optimizer.zero_grad()

for epoch in range(start_epoch,num_epochs):

for i in range(n):

#训练的迭代次数

ni = i + n * epoch

# Warmup 热身的迭代次数

if ni <= 1000:

xi = [0, 1000]

for j, x in enumerate(optimizer.param_groups):

#一维线性插值

x[&＃39;lr&＃39;] = np.interp(ni, xi, [0.1 if j == 2 else 0.0, 0.01 * lf(epoch)])

if &＃39;momentum&＃39; in x:

x[&＃39;momentum&＃39;] = np.interp(ni, xi, [0.8, 0.937])

pass # iter and train here

# Scheduler 学习率衰减

lr = [x[&＃39;lr&＃39;] for x in optimizer.param_groups]

lr0.append(lr[0])

lr1.append(lr[1])

lr2.append(lr[2])

#学习率更新

scheduler.step()

epochs.append(epoch)

plt.figure()

plt.subplot(221)

plt.plot(epochs, lr0, color="r",label=&＃39;l0&＃39;)

plt.legend()

plt.subplot(222)

plt.plot(epochs, lr1, color="b",label=&＃39;l1&＃39;)

plt.legend()

plt.subplot(223)

plt.plot(epochs, lr2,color="g",label=&＃39;l2&＃39;)

plt.legend()

plt.show()

如下图所示我分别绘制出训练100个epoch时的学习率变化情况。

2.余弦退火算法

如果想看懂上面的学习率调整算法，我们得需要理解余弦退火算法，它的公式和解释如下：

−

(

−

)

∗

(

−

∗

)

new_-lr=eta_-min+(initial_-lr-eta_-min)*((1+cos(\frac{cur_-epoch}{T_-max}*\pi ))/2)

new−lr=eta−min+(initial−lr−eta−min)∗((1+cos(T−maxcur−epoch∗π))/2)

new_-lr：新得到的学习率。

initial_lr：初始学习率。

eta_min：表示最小学习率。

cur_epoch：代表当前训练到某个epoch对应的值。

T_max：代表训练的总epoch数。

last_epoch：最后一个epoch的index，如果是训练了很多个epoch后中断了，继续训练，这个值就等于加载的模型的epoch。默认为-1表示从头开始训练，即从epoch=1开始。

比如当我们initial_-lr为0.01，eta_-min为0.002，epoch为200，T_max为也就是200时，可以绘制如下的学习率图。

余弦退火函数的深度剖析：

那么这个函数的具体含义是什么呢？它的结构为什么是这个形式呢？其实只看函数很简单，它就是由一个余弦函数cos和一些简单的加法乘法组合而成，接下来我来深度剖析这个函数的具体含义：

为了方便计算和展示函数的意义，假设初始学习率为1，最小学习率为0.2。我们一层一层的对函数进行解析，它的内部是cos函数，而cos函数的取值范围为[-1,1]。

我们绘制出

(

−

∗

)

cos(\frac{cur_-epoch}{T_-max}*\pi )

cos(T−maxcur−epoch∗π)的曲线如图一所示：

(

−

∗

)

(1+cos(\frac{cur_-epoch}{T_-max}*\pi ))

(1+cos(T−maxcur−epoch∗π))函数的曲线如图2所示:

(

−

∗

)

((1+cos(\frac{cur_-epoch}{T_-max}*\pi ))/2)

((1+cos(T−maxcur−epoch∗π))/2)函数的曲线绘制如图3所示:

(

−

)

∗

(

−

∗

)

(initial_-lr-eta_-min)*((1+cos(\frac{cur_-epoch}{T_-max}*\pi ))/2)

(initial−lr−eta−min)∗((1+cos(T−maxcur−epoch∗π))/2)如图4所示:

−

(

−

)

∗

(

−

∗

)

eta_-min+(initial_-lr-eta_-min)*((1+cos(\frac{cur_-epoch}{T_-max}*\pi ))/2)

eta−min+(initial−lr−eta−min)∗((1+cos(T−maxcur−epoch∗π))/2)如图5所示。

就这么简单，我们一步一步的解刨了函数的具体含义，接下类我们来解析一下预热过程中所使用的线性插值方法来更新学习率

3. 一维线性插值：np.interp(x**,** xp**,** fp)

它的定义是将一维分段线性插值返回给具有给定离散数据点(xp，fp)且在x处求值的函数。

x:待插入数据的横坐标.

xp:原始数据点的横坐标

fp：原始数据点的y坐标，与xp的长度相同。

返回值

浮点数或复数(对应于fp值)或ndarray. 插入数据的纵坐标，和x形状相同。

例1：可以看到当x=2.5的时候，得到的y值是1。

import numpy as np

import matplotlib.pyplot as plt

x = 2.5

xp = [1, 2, 3]

fp = [3, 2, 0]

y = np.interp(x, xp, fp) # 1.0

plt.plot(xp, fp,&＃39;ro&＃39;)

plt.plot(x, y, &＃39;x&＃39;)

plt.show()

如下图所示，其中蓝色的点是插值后的点。

例2：在红色的十个点之间进行插入50个蓝色标记的点如下所示：

import numpy as np

import matplotlib.pyplot as plt

x = np.linspace(0, 2 * np.pi, 10)

y = np.sin(x)

xvals = np.linspace(0, 2 * np.pi, 50)

yinterp = np.interp(xvals, x, y)

plt.plot(x, y, &＃39;ro&＃39;)

plt.plot(xvals, yinterp, &＃39;x&＃39;)

plt.show()

Post Views:

推荐阅读

list
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
list
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
list
如何将Python与Excel高效结合：常用操作技巧解析

本文深入探讨了如何将Python与Excel高效结合，涵盖了一系列实用的操作技巧。文章内容详尽，步骤清晰，注重细节处理，旨在帮助读者掌握Python与Excel之间的无缝对接方法，提升数据处理效率。 ... [详细]

蜡笔小新 2024-11-11 15:18:30
list
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
list
使用 Python 封装依赖方法构建测试用例的依赖关系

本文介绍如何通过 Python 的 `unittest` 和 `functools` 模块封装一个依赖方法，用于管理测试用例之间的依赖关系。该方法能够确保在某个测试用例失败时，依赖于它的其他测试用例将被跳过。 ... [详细]

蜡笔小新 2024-11-13 10:42:38
python
使用多项式拟合分析淘宝双11销售趋势

根据天猫官方数据，2019年双11成交额达到2684亿元，再次刷新历史记录。本文通过多项式拟合方法，分析并预测未来几年的销售趋势。 ... [详细]

蜡笔小新 2024-11-12 16:57:26
python
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
python
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
python
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
python
Python 中 UTF-8 编码的中文字符被误识别为 GB2312

探讨了 Python 中 UTF-8 编码的中文字符在某些情况下被误识别为 GB2312 的问题，并提供了详细的代码示例和环境信息。 ... [详细]

蜡笔小新 2024-11-12 20:45:01
list
技术分享：使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统

技术分享：使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统 ... [详细]

蜡笔小新 2024-11-11 15:24:24
int
客户端与服务器之间的交互过程解析

本文详细解析了客户端与服务器之间的交互过程，重点介绍了Socket通信机制。IP地址由32位的4个8位二进制数组成，分为网络地址和主机地址两部分。通过使用 `ipconfig /all` 命令，用户可以查看详细的IP配置信息。此外，文章还介绍了如何使用 `ping` 命令测试网络连通性，例如 `ping 127.0.0.1` 可以检测本机网络是否正常。这些技术细节对于理解网络通信的基本原理具有重要意义。 ... [详细]

蜡笔小新 2024-11-11 15:09:25
spring
遗传算法的自我问答与解析

遗传算法中选择算子为何置于交叉算子和变异算子之前？本文探讨了这一问题，并详细介绍了遗传算法中常用的选择算子类型及其作用机制。此外，还分析了不同选择算子对算法性能的影响，为实际应用提供了理论依据。 ... [详细]

蜡笔小新 2024-11-11 13:00:19
list
如何将TS文件转换为M3U8直播流：HLS与M3U8格式详解

在视频传输领域，MP4虽然常见，但在直播场景中直接使用MP4格式存在诸多问题。例如，MP4文件的头部信息（如ftyp、moov）较大，导致初始加载时间较长，影响用户体验。相比之下，HLS（HTTP Live Streaming）协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段，并生成一个M3U8播放列表文件，实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流，包括技术原理和具体操作步骤，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 12:12:04
list
每日一练917：仅反转字母——Python代码解析

本文介绍了如何通过 Python 代码实现对字符串的特定反转操作。具体而言，给定一个字符串 s，要求在保持所有非英文字母字符位置不变的情况下，将所有英文字母（无论是小写还是大写）的位置进行反转。最终返回经过处理后的字符串 s。 ... [详细]

蜡笔小新 2024-11-11 11:27:55

Angkaka

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章