热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

tf.estimatorAPI技术手册(13)——LinearRegressor(线性回归器)

tf.estimatorAPI技术手册(12)——LinearRegressor(线性分类器)(一࿰

tf.estimator API技术手册(12)——LinearRegressor(线性分类器)

  • (一)简 介
  • (二)初始化
  • (三)属 性(Properties)
  • (四)方 法(Methods)
    • (1)evaluate(评估)
    • (2)predict(预测)
    • (3)train(训练)


(一)简 介

继承自Estimator,定义在tensorflow/python/estimator/canned/linear.py中,用来建立线性回归器。示例如下:

categorical_column_a = categorical_column_with_hash_bucket(...)
categorical_column_b = categorical_column_with_hash_bucket(...)categorical_feature_a_x_categorical_feature_b = crossed_column(...)# 创建一个线性分类器
estimator = LinearRegressor(feature_columns=[categorical_column_a,categorical_feature_a_x_categorical_feature_b])# 构建数据输入函数
def input_fn_train: # returns x, y (where y represents label's class index)....
def input_fn_eval: # returns x, y (where y represents label's class index)....
estimator.train(input_fn=input_fn_train)
estimator.evaluate(input_fn=input_fn_eval)
estimator.predict(input_fn=input_fn_predict)

(二)初始化

__init__(feature_columns,model_dir=None,label_dimension=1,weight_column=None,optimizer='Ftrl',config=None,partitioner=None,warm_start_from=None,loss_reduction=losses.Reduction.SUM,sparse_combiner='sum'
)

参数如下:

  • feature_columns:
    特征列

  • model_dir:
    保存模型的目录

  • label_dimension:
    每一个样例中回归目标的个数,这是标签的最后维度和logit张量对象的大小,典型的结构为[批处理大小,标签维度]。

  • weight_column:
    由 tf.feature_column.numeric_column创建的一个字符串或者数字列用来呈现特征列。它将会被乘以example的训练损失。

  • label_vocabulary:
    一个字符串列表用来呈现可能的标签取值,如果给出,则必须为字符型,如果没有给出,则会默认编码为整型,为{0, 1,…, n_classes-1} 。

  • optimizer:
    选择优化器,默认使用Adagrad optimizer,激活函数为tf.nn.relu。

  • config:
    一个运行配置对象,用来配置运行时间。

  • warm_start_from:
    热启动选项。

  • loss_reduction:
    定义损失函数,默认为SUM方法。

  • partitioner:
    可选的。输入层分割器

  • sparse_combiner:
    稀疏组合器,当一个绝对特征列是多价的时候,指定如何去减少损失。


(三)属 性(Properties)
  • config
  • model_dir
  • model_fn
    Returns the model_fn which is bound to self.params.

返回:
model_fn 附有以下标记: def model_fn(features, labels, mode, config)

(四)方 法(Methods)

(1)evaluate(评估)

evaluate(input_fn,steps=None,hooks=None,checkpoint_path=None,name=None
)

评估函数,使用input_fn给出的评估数据评估训练好的模型,参数列表如下:

  • input_fn:
    一个用来构造用于评估的数据的函数,这个函数应该构造和返回如下的值:一个tf.data.Dataset对象或者一个包含 (features, labels)的元组,它们应当满足model_fn函数对输入数据的要求,在后面的实例中我们会详细介绍。
  • checkpoint_path:
    用来保存训练好的模型
  • name:
    如果用户需要在不同的数据集上运行多个评价,如训练集和测试集,则为要进行评估的名称,不同的评估度量被保存在单独的文件夹中,并分别出现在tensorboard中。

(2)predict(预测)

predict(input_fn,predict_keys=None,hooks=None,checkpoint_path=None,yield_single_examples=True
)

使用训练好的模型对新实例进行预测,以下为参数列表:

  • input_fn:
    一个用来构造用于评估的数据的函数,这个函数应该构造和返回如下的值:一个tf.data.Dataset对象或者一个包含 (features, labels)的元组,它们应当满足model_fn函数对输入数据的要求,在后面的实例中我们会详细介绍。

  • predict_keys:
    预测函数最终会返回一系列的结果,但我们可以有选择地让其输出,可供选择的keys列表为[‘logits’, ‘logistic’, ‘probabilities’, ‘class_ids’, ‘classes’],如果不指定的话,默认返回所有值。

  • hooks:
    tf.train.SessionRunHook的子类实例列表,在预测调用中用于传回。

  • checkpoint_path:
    训练好的模型的目录

  • yield_single_examples:
    可以选择False或是True,如果选择False,由model_fn返回整个批次,而不是将批次分解为单个元素。当model_fn返回的一些的张量的第一维度和批处理数量不相等时,这个功能是很用的。


(3)train(训练)

train(input_fn,hooks=None,steps=None,max_steps=None,saving_listeners=None
)

用于训练模型,以下为参数列表:

  • input_fn:
    一个用来构造用于评估的数据的函数,这个函数应该构造和返回如下的值:一个tf.data.Dataset对象或者一个包含 (features, labels)的元组,它们应当满足model_fn函数对输入数据的要求,在后面的实例中我们会详细介绍。

  • hooks:
    tf.train.SessionRunHook的子类实例列表,在预测调用中用于传回。

  • steps:
    模型训练的次数,如果不指定,则会一直训练知道input_fn传回的数据消耗完为止。如果你不想要增量表现,就设置max_steps来替代,注意设置了steps,max_steps必须为None,设置了max_steps,steps必须为None。

  • max_steps:
    模型训练的总次数,注意设置了steps,max_steps必须为None,设置了max_steps,steps必须为None。

  • saving_listeners:
    CheckpointSaverListener对象的列表,用于在检查点保存之前或之后立即运行的回调。


推荐阅读
  • 本文介绍了如何使用 Python 的 Pyglet 库加载并显示图像。Pyglet 是一个用于开发图形用户界面应用的强大工具,特别适用于游戏和多媒体项目。 ... [详细]
  • 本文探讨了如何使用Scrapy框架构建高效的数据采集系统,以及如何通过异步处理技术提升数据存储的效率。同时,文章还介绍了针对不同网站采用的不同采集策略。 ... [详细]
  • Hadoop MapReduce 实战案例:手机流量使用统计分析
    本文通过一个具体的Hadoop MapReduce案例,详细介绍了如何利用MapReduce框架来统计和分析手机用户的流量使用情况,包括上行和下行流量的计算以及总流量的汇总。 ... [详细]
  • Gradle 是 Android Studio 中默认的构建工具,了解其基本配置对于开发效率的提升至关重要。本文将详细介绍如何在 Gradle 中定义和使用共享变量,以确保项目的一致性和可维护性。 ... [详细]
  • 汇总了2023年7月7日最新的网络安全新闻和技术更新,包括最新的漏洞披露、工具发布及安全事件。 ... [详细]
  • 使用Python构建网页版图像编辑器
    本文详细介绍了一款基于Python开发的网页版图像编辑工具,具备多种图像处理功能,如黑白转换、铅笔素描效果等。 ... [详细]
  • 本文分享了作者在使用LaTeX过程中的几点心得,涵盖了从文档编辑、代码高亮、图形绘制到3D模型展示等多个方面的内容。适合希望深入了解LaTeX高级功能的用户。 ... [详细]
  • binlog2sql,你该知道的数据恢复工具
    binlog2sql,你该知道的数据恢复工具 ... [详细]
  • 本文介绍了一种在 Android 开发中动态修改 strings.xml 文件中字符串值的有效方法。通过使用占位符,开发者可以在运行时根据需要填充具体的值,从而提高应用的灵活性和可维护性。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 2023年1月28日网络安全热点
    涵盖最新的网络安全动态,包括OpenSSH和WordPress的安全更新、VirtualBox提权漏洞、以及谷歌推出的新证书验证机制等内容。 ... [详细]
  • 本文探讨了如何选择一个合适的序列化版本ID(serialVersionUID),包括使用生成器还是简单的整数,以及在不同情况下应如何处理序列化版本ID。 ... [详细]
  • Excel技巧:单元格中显示公式而非结果的解决方法
    本文探讨了在Excel中如何通过简单的方法解决单元格显示公式而非计算结果的问题,包括使用快捷键和调整单元格格式两种方法。 ... [详细]
  • C/C++ 应用程序的安装与卸载解决方案
    本文介绍了如何使用Inno Setup来创建C/C++应用程序的安装程序,包括自动检测并安装所需的运行库,确保应用能够顺利安装和卸载。 ... [详细]
  • 本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法,并提供了多个实际应用的代码示例。通过这些示例,读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]
author-avatar
饱和深潜者_463
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有