TensorFlow入门使用tf.train.Saver()保存模型

作者：百万会员XTN_859 | 来源：互联网 | 2022-01-07 04:08

这篇文章主要介绍了TensorFlow入门使用tf.train.Saver()保存模型，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

关于模型保存的一点心得

saver = tf.train.Saver(max_to_keep=3)

在定义 saver 的时候一般会定义最多保存模型的数量，一般来说，如果模型本身很大，我们需要考虑到硬盘大小。如果你需要在当前训练好的模型的基础上进行 fine-tune，那么尽可能多的保存模型，后继 fine-tune 不一定从最好的 ckpt 进行，因为有可能一下子就过拟合了。但是如果保存太多，硬盘也有压力呀。如果只想保留最好的模型，方法就是每次迭代到一定步数就在验证集上计算一次 accuracy 或者 f1 值，如果本次结果比上次好才保存新的模型，否则没必要保存。

如果你想用不同 epoch 保存下来的模型进行融合的话，3到5 个模型已经足够了，假设这各融合的模型成为 M，而最好的一个单模型称为 m_best, 这样融合的话对于M 确实可以比 m_best 更好。但是如果拿这个模型和其他结构的模型再做融合的话，M 的效果并没有 m_best 好，因为M 相当于做了平均操作，减少了该模型的“特性”。

但是又有一种新的融合方式，就是利用调整学习率来获取多个局部最优点，就是当 loss 降不下了，保存一个 ckpt，然后开大学习率继续寻找下一个局部最优点，然后用这些 ckpt 来做融合，还没试过，单模型肯定是有提高的，就是不知道还会不会出现上面再与其他模型融合就没提高的情况。

如何使用 tf.train.Saver() 来保存模型

之前一直出错，主要是因为坑爹的编码问题。所以要注意文件的路径绝对不不要出现什么中文呀。

import tensorflow as tf
cOnfig= tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(cOnfig=config)

# Create some variables.
v1 = tf.Variable([1.0, 2.3], name="v1")
v2 = tf.Variable(55.5, name="v2")

# Add an op to initialize the variables.
init_op = tf.global_variables_initializer()

# Add ops to save and restore all the variables.
saver = tf.train.Saver()

ckpt_path = './ckpt/test-model.ckpt'
# Later, launch the model, initialize the variables, do some work, save the
# variables to disk.
sess.run(init_op)
save_path = saver.save(sess, ckpt_path, global_step=1)
print("Model saved in file: %s" % save_path)

Model saved in file: ./ckpt/test-model.ckpt-1

注意，在上面保存完了模型之后。应该把 kernel restart 之后才能使用下面的模型导入。否则会因为两次命名 “v1” 而导致名字错误。

import tensorflow as tf
cOnfig= tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(cOnfig=config)

# Create some variables.
v1 = tf.Variable([11.0, 16.3], name="v1")
v2 = tf.Variable(33.5, name="v2")

# Add ops to save and restore all the variables.
saver = tf.train.Saver()

# Later, launch the model, use the saver to restore variables from disk, and
# do some work with the model.
# Restore variables from disk.
ckpt_path = './ckpt/test-model.ckpt'
saver.restore(sess, ckpt_path + '-'+ str(1))
print("Model restored.")

print sess.run(v1)
print sess.run(v2)

INFO:tensorflow:Restoring parameters from ./ckpt/test-model.ckpt-1
Model restored.
[ 1. 2.29999995]
55.5

导入模型之前，必须重新再定义一遍变量。

但是并不需要全部变量都重新进行定义，只定义我们需要的变量就行了。

也就是说，你所定义的变量一定要在 checkpoint 中存在；但不是所有在checkpoint中的变量，你都要重新定义。

import tensorflow as tf
cOnfig= tf.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.Session(cOnfig=config)

# Create some variables.
v1 = tf.Variable([11.0, 16.3], name="v1")

# Add ops to save and restore all the variables.
saver = tf.train.Saver()

# Later, launch the model, use the saver to restore variables from disk, and
# do some work with the model.
# Restore variables from disk.
ckpt_path = './ckpt/test-model.ckpt'
saver.restore(sess, ckpt_path + '-'+ str(1))
print("Model restored.")

print sess.run(v1)

INFO:tensorflow:Restoring parameters from ./ckpt/test-model.ckpt-1
Model restored.
[ 1. 2.29999995]

tf.Saver([tensors_to_be_saved]) 中可以传入一个 list，把要保存的 tensors 传入，如果没有给定这个list的话，他会默认保存当前所有的 tensors。一般来说，tf.Saver 可以和 tf.variable_scope() 巧妙搭配，可以参考：【迁移学习】往一个已经保存好的模型添加新的变量并进行微调

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

tensorflow

推荐阅读

tensorflow
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
tensorflow
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
tensorflow
Keras 实战：自编码器入门指南

本文介绍了使用 Keras 框架实现自编码器的基本方法。自编码器是一种用于无监督学习的神经网络模型，主要功能包括数据降维、特征提取等。通过实际案例，我们将展示如何使用全连接层和卷积层来构建自编码器，并讨论不同维度对重建效果的影响。 ... [详细]

蜡笔小新 2024-12-18 17:30:35
tensorflow
优化运行选择器中的名称换行功能

本改进旨在提升运行选择器中名称换行的显示效果，以提高用户体验。 ... [详细]

蜡笔小新 2024-12-17 17:46:13
算法
【度量学习】Siamese Network

基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章：《LearningtoCompar ... [详细]

蜡笔小新 2024-12-12 19:11:33
tensorflow
基于Keras和TensorFlow在Windows上实现YOLOv3目标检测

本文详细介绍了如何在Windows环境下配置GPU支持，并使用Keras和TensorFlow实现YOLOv3模型进行图像目标检测。对于环境搭建的具体步骤，可参考外部链接提供的指南。 ... [详细]

蜡笔小新 2024-12-12 17:28:25
tensorflow
Logistic Regression 实现与解析

本文详细介绍了使用NumPy和TensorFlow实现的逻辑回归算法。通过具体代码示例，解释了数据加载、模型训练及分类预测的过程。 ... [详细]

蜡笔小新 2024-12-12 14:21:41
算法
在Ubuntu 16.04中使用Anaconda安装TensorFlow

本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先，需要下载并安装Anaconda，然后配置环境变量以确保系统能够识别Anaconda命令。接着，创建一个特定的Python环境用于安装TensorFlow，并通过指定的镜像源加速安装过程。最后，通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]

蜡笔小新 2024-12-11 19:07:39
tensorflow
使用Anaconda 3.5.01快速安装TensorFlow

本文详细介绍如何通过Anaconda 3.5.01快速安装TensorFlow，包括环境配置和具体步骤。 ... [详细]

蜡笔小新 2024-12-09 18:54:40
算法
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
算法
C++ 实现非极大值抑制 (NMS) 算法详解

本文详细介绍了非极大值抑制（Non-Maximum Suppression, NMS）算法的原理及其在目标检测中的应用，并提供了C++语言的具体实现代码。NMS算法通过筛选出高得分的检测框并移除重叠度高的其他检测框，有效提高了检测结果的准确性和可靠性。 ... [详细]

蜡笔小新 2024-12-08 07:18:24
算法
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
算法
TensorFlow 入门：MNIST 数据集实战

本文详细介绍了 TensorFlow 的入门实践，特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构，并解释了各部分的作用，随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]

蜡笔小新 2024-12-05 13:06:15
tensorflow
基于Keras实现的卷积神经网络（CNN）示例

本文介绍了一个使用Keras框架构建的卷积神经网络（CNN）实例，主要利用了Keras提供的MNIST数据集以及相关的层，如Dense、Dropout、Activation等，构建了一个具有两层卷积和两层全连接层的CNN模型。 ... [详细]

蜡笔小新 2024-12-03 19:35:35
tensorflow
TensorFlow 2.0 中的 Keras 数据归一化实践

数据预处理是机器学习任务中的关键步骤，特别是在深度学习领域。通过将数据归一化至特定范围，可以在梯度下降过程中实现更快的收敛速度和更高的模型性能。本文探讨了如何使用 TensorFlow 2.0 和 Keras 进行有效的数据归一化。 ... [详细]

蜡笔小新 2024-12-03 18:24:01

百万会员XTN_859

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章