Tensorflow2“自动求梯度”tf.GradientTape.gradient()

作者：mobiledu2502875483 | 来源：互联网 | 2023-09-01 15:36

Tensorflow2“自

Tensorflow 2 “自动求梯度” - tf.GradientTape.gradient

一、单次调用（一阶导数）
二、计算同个函数的多阶导数（注意要手动释放资源）
三、高阶导数
四、对python控制流求梯度
五、举例-MSE Gradient、Crossentropy gradient

在深度学习中，我们经常需要对函数求梯度（gradient）， tensorflow2.0 提供的 GradientTape 可自动求梯度。

一、单次调用（一阶导数）

x = tf.constant(3.0) #创建tensor with tf.GradientTape() as g: # 创建一个GradientTape对象 g.watch(x) # 监视watch要求导的变量 y = x * x dy_dx = g.gradient(y, x) # 对函数进行求导二、计算同个函数的多阶导数（注意要手动释放资源）

默认情况下，调用 GradientTape.gradient() 方法时， GradientTape 占用的资源会立即得到释放。通过创建一个持久的梯度带， 参数 persistent=True, 可以计算同个函数的多个导数，但是注意要手动释放资源del tape。例如：

with tf.GradientTape(persistent=True) as g: g.watch(x) y = x * x z = y * Y dz_dx = g.gradient(z, x) # 求一阶导数 dy_dx = g.gradient(y, x) # 求二阶导数 del g #手动释放资源三、高阶导数

在 ‘GradientTape’ 上下文管理器中记录的操作会用于自动微分。如果导数是在上下文中计算的，导数的函数也会被记录下来，因此 “同个 API ” 可以用于高阶导数。例如：

二阶导数（高阶导数同理）

x = tf.Variable(1.0) # 创建可优化的tensor（具有可求导的特性） with tf.GradientTape() as t: with tf.GradientTape() as t2: y = x * x * x dy_dx = t2.gradient(y, x) #计算一阶导数 d2y_dx2 = t.gradient(dy_dx, x) #计算二阶导数四、对python控制流求梯度

请添加图片描述

五、举例-MSE Gradient、Crossentropy gradient

##coding:utf-8 import tensorflow as tf #举例-MSE Gradient x = tf.random.normal([2,4],seed=1) w = tf.random.normal([4,3],seed=1) b = tf.zeros([3]) y = tf.constant([2,0]) with tf.GradientTape() as tape: tape.watch([w,b]) prob = tf.nn.softmax(x@w+b,axis=1) loss = tf.reduce_mean(tf.losses.MSE(tf.one_hot(y,depth=3),prob)) grads = tape.gradient(loss,[w,b]) print(grads[0]) """ 输出： tf.Tensor( [[-5.5192433e-02 -4.8389734e-06 5.5197272e-02] [ 3.6337111e-02 1.7934163e-04 -3.6516447e-02] [-4.5821436e-02 1.3292905e-04 4.5688514e-02] [ 3.6436778e-02 -5.4880476e-04 -3.5887983e-02]], shape=(4, 3), dtype=float32) """ print(grads[1]) """ 输出： tf.Tensor([-0.02586884 0.00025355 0.0256153 ], shape=(3,), dtype=float32) """ #举例-Crossentropy gradient x = tf.random.normal([2,4],seed=1) w = tf.random.normal([4,3],seed=1) b = tf.zeros([3]) y = tf.constant([2,0]) with tf.GradientTape() as tape: tape.watch([w,b]) logits = x@w+b loss = tf.reduce_mean(tf.losses.categorical_crossentropy(tf.one_hot(y,depth=3),logits)) grads = tape.gradient(loss,[w,b]) print(grads[0]) """ 输出： tf.Tensor( [[-0.08838065 -0.06390739 0.03672602] [ 0.08741999 0.23320754 0.04906246] [-0.0506487 0.09553305 0.0874298 ] [-0.03325637 -0.55674076 -0.25375524]], shape=(4, 3), dtype=float32) """ print(grads[1]) """ 输出： tf.Tensor([0.00102822 0.24761406 0.12357714], shape=(3,), dtype=float32) """

参考：
https://blog.csdn.net/suiyueruge1314/article/details/103963598

推荐阅读

import
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
function
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
import
基于TensorFlow的鸢尾花数据集神经网络模型深度解析

基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]

蜡笔小新 2024-10-22 11:56:51
import
python模块之正则

re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求，从一段字符串中找到符合要求的内容。在 ... [详细]

蜡笔小新 2024-11-14 15:52:38
import
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
web
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
header
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
import
Pandas 散点图矩阵（scatter_matrix）绘图功能及其参数详解

通过使用 `pandas` 库中的 `scatter_matrix` 函数，可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵，还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置，以满足不同的可视化需求。此外，`diagonal` 参数允许用户选择对角线上的图表类型，例如直方图或密度图，从而提供更多的数据洞察。 ... [详细]

蜡笔小新 2024-11-09 12:03:42
import
PyTorch常见预训练模型的下载链接及使用指南

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。 ... [详细]

蜡笔小新 2024-10-27 13:57:42
import
利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口

作者|VincentMühle编译|姗姗出品|人工智能头条（公众号ID：AI_Thinker）【导读】随着深度学习方法的应用，浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]

蜡笔小新 2024-10-23 10:50:38
import
Go Echo 框架入门指南【1】

本文介绍了 Go 语言中的高性能、可扩展、轻量级 Web 框架 Echo。Echo 框架简单易用，仅需几行代码即可启动一个高性能 HTTP 服务。 ... [详细]

蜡笔小新 2024-11-14 18:30:58
utf-8
使用ArcGIS for Java和Flex浏览自定义ArcGIS Server 9.3地图

本文介绍了如何在Flex应用程序中实现浏览自定义ArcGIS Server 9.3发布的地图。这是一个基本的入门示例，适用于初学者。 ... [详细]

蜡笔小新 2024-11-13 14:40:13
import
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
import
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
header
使用Python和smtplib实现邮件发送功能

本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件，并提供了完整的代码示例。作者：多测师_王sir，时间：2020年5月20日 17:24，微信：15367499889，公司：上海多测师信息有限公司。 ... [详细]

蜡笔小新 2024-11-12 12:21:27

mobiledu2502875483

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章