开发笔记:Keras官方中文文档：工具

作者：手机用户2602927383 | 来源：互联网 | 2023-08-31 12:44

utils工具本模块提供了一系列有用工具

utils 工具
本模块提供了一系列有用工具

CustomObjectScope

keras.utils.generic_utils.CustomObjectScope()

提供定制类的作用域，在该作用域内全局定制类能够被更改，但在作用域结束后将回到初始状态。
以with声明开头的代码将能够通过名字访问定制类的实例，在with的作用范围，这些定制类的变动将一直持续，在with作用域结束后，全局定制类的实例将回归其在with作用域前的状态。

with CustomObjectScope({"MyObject":MyObject}): layer = Dense(..., W_regularizer="MyObject") # save, load, etc. will recognize custom object by name

HDF5Matrix

keras.utils.io_utils.HDF5Matrix(datapath, dataset, start=0, end=None, normalizer=None)

这是一个使用HDF5数据集代替Numpy数组的方法

提供start和end参数可以进行切片，另外，还可以提供一个正规化函数或匿名函数，该函数将会在每片数据检索时自动调用。

x_data = HDF5Matrix(‘input/file.hdf5‘, ‘data‘) model.predict(x_data)

datapath: 字符串，HDF5文件的路径

dataset: 字符串，在datapath路径下HDF5数据库名字

start: 整数，想要的数据切片起点

end: 整数，想要的数据切片终点

normalizer: 在每个切片数据检索时自动调用的函数对象

Sequence

keras.utils.data_utils.Sequence()

序列数据的基类，例如一个数据集。
每个Sequence必须实现__getitem__和__len__方法

下面是一个例子：

from skimage.io import imread from skimage.transform import resize import numpy as np __Here, `x_set` is list of path to the images__ # and `y_set` are the associated classes. class CIFAR10Sequence(Sequence): def __init__(self, x_set, y_set, batch_size): self.X,self.y = x_set,y_set self.batch_size = batch_size def __len__(self): return len(self.X) // self.batch_size def __getitem__(self,idx): batch_x = self.X[idx*self.batch_size:(idx+1)*self.batch_size] batch_y = self.y[idx*self.batch_size:(idx+1)*self.batch_size] return np.array([ resize(imread(file_name), (200,200)) for file_name in batch_x]), np.array(batch_y)

to_categorical

to_categorical(y, num_classes=None)

将类别向量(从0到nb_classes的整数向量)映射为二值类别矩阵, 用于应用到以categorical_crossentropy为目标函数的模型中.

参数

y: 类别向量

num_classes:总共类别数

normalize

normalize(x, axis=-1, order=2)

对numpy数组规范化，返回规范化后的数组

参数

x：待规范化的数据

axis: 规范化的轴

order：规范化方法，如2为L2范数

custom_object_scope

custom_object_scope()

本函数返回CustomObjectScope对象

with custom_object_scope({"MyObject":MyObject}): layer = Dense(..., W_regularizer="MyObject") # save, load, etc. will recognize custom object by name

get_custom_objects

get_custom_objects()

检索全局定制类，推荐利用custom_object_scope更新和清理定制对象，但get_custom_objects可被直接用于访问_GLOBAL_CUSTOM_OBJECTS。本函数返回从名称到类别映射的全局字典。

get_custom_objects().clear() get_custom_objects()["MyObject"] = MyObject

convert_all_kernels_in_model

convert_all_kernels_in_model(model)

将模型中全部卷积核在Theano和TensorFlow模式中切换

plot_model

plot_model(model, to_file=‘model.png‘, show_shapes=False, show_layer_names=True)

绘制模型的结构图

serialize_keras_object

serialize_keras_object(instance)

将keras对象序列化

deserialize_keras_object

eserialize_keras_object(identifier, module_objects=None, custom_objects=None, printable_module_name=‘object‘)

从序列中恢复keras对象

get_file

get_file(fname, origin, untar=False, md5_hash=None, file_hash=None, cache_subdir=‘datasets‘, hash_algorithm=‘auto‘, extract=False, archive_format=‘auto‘, cache_dir=None)

从给定的URL中下载文件, 可以传递MD5值用于数据校验(下载后或已经缓存的数据均可)

默认情况下文件会被下载到~/.keras中的cache_subdir文件夹，并将其文件名设为fname，因此例如一个文件example.txt最终将会被存放在`~/.keras/datasets/example.txt~

tar,tar.gz.tar.bz和zip格式的文件可以被提取，提供哈希码可以在下载后校验文件。命令喊程序shasum和sha256sum可以计算哈希值。

参数

fname: 文件名，如果指定了绝对路径/path/to/file.txt,则文件将会保存到该位置。

origin: 文件的URL地址

untar: 布尔值,是否要进行解压

md5_hash: MD5哈希值,用于数据校验，支持sha256和md5哈希

cache_subdir: 用于缓存数据的文件夹，若指定绝对路径/path/to/folder则将存放在该路径下。

hash_algorithm: 选择文件校验的哈希算法，可选项有‘md5‘, ‘sha256‘, 和‘auto‘. 默认‘auto‘自动检测使用的哈希算法

extract: 若为True则试图提取文件，例如tar或zip tries extracting the file as an Archive, like tar or zip.

archive_format: 试图提取的文件格式，可选为‘auto‘, ‘tar‘, ‘zip‘, 和None. ‘tar‘ 包括tar, tar.gz, tar.bz文件. 默认‘auto‘是[‘tar‘, ‘zip‘]. None或空列表将返回没有匹配。

cache_dir: 缓存文件存放地在，参考FAQ

返回值

下载后的文件地址

multi_gpu_model

keras.utils.multi_gpu_model(model, gpus)

将模型在多个GPU上复制

特别地，该函数用于单机多卡的数据并行支持，它按照下面的方式工作：

（1）将模型的输入分为多个子batch
（2）在每个设备上调用各自的模型，对各自的数据集运行
（3）将结果连接为一个大的batch（在CPU上）

例如，你的batch_size是64而gpus=2，则输入会被分为两个大小为32的子batch，在两个GPU上分别运行，通过连接后返回大小为64的结果。该函数线性的增加了训练速度，最高支持8卡并行。

该函数只能在tf后端下使用

参数如下：

model: Keras模型对象，为了避免OOM错误（内存不足），该模型应在CPU上构建，参考下面的例子。

gpus: 大或等于2的整数，要并行的GPU数目。

该函数返回Keras模型对象，它看起来跟普通的keras模型一样，但实际上分布在多个GPU上。

例子：

import tensorflow as tf from keras.applications import Xception from keras.utils import multi_gpu_model import numpy as np num_samples = 1000 height = 224 width = 224 num_classes = 1000 # Instantiate the base model # (here, we do it on CPU, which is optional). with tf.device(‘/cpu:0‘): model = Xception(weights=None, input_shape=(height, width, 3), classes=num_classes) # Replicates the model on 8 GPUs. # This assumes that your machine has 8 available GPUs. parallel_model = multi_gpu_model(model, gpus=8) parallel_model.compile(loss=‘categorical_crossentropy‘, optimizer=‘rmsprop‘) # Generate dummy data. x = np.random.random((num_samples, height, width, 3)) y = np.random.random((num_samples, num_classes)) # This `fit` call will be distributed on 8 GPUs. # Since the batch size is 256, each GPU will process 32 samples. parallel_model.fit(x, y, epochs=20, batch_size=256)

艾伯特(http://www.aibbt.com/)国内第一家人工智能门户

推荐阅读

main
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
main
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
go
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
main
Leetcode学习成长记：天池leetcode基础训练营Task01数组

前言这是本人第一次参加由Datawhale举办的组队学习活动，这个活动每月一次，之前也一直关注，但未亲身参与过，这次看到活动 ... [详细]

蜡笔小新 2024-11-14 18:01:31
go
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
web
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
go
更新vuex的数据为什么用mutation?

更新vuex的数据为什么用mutation?,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2024-11-13 18:30:04
buffer
Java初学者必备的六大核心知识点

本文总结了Java初学者需要掌握的六大核心知识点，帮助你更好地理解和应用Java编程。无论你是刚刚入门还是希望巩固基础，这些知识点都是必不可少的。 ... [详细]

蜡笔小新 2024-11-13 18:24:59
bit
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
web
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
main
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
text
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
go
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
window
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
int
深入解析JDK 8 HashMap源代码：put方法详解及capacity、size、loadFactor和红黑树转换阈值的设定原理

本文深入解析了JDK 8中HashMap的源代码，重点探讨了put方法的工作机制及其内部参数的设定原理。HashMap允许键和值为null，但键为null的情况只能出现一次，因为null键在内部通过索引0进行存储。文章详细分析了capacity（容量）、size（大小）、loadFactor（加载因子）以及红黑树转换阈值的设定原则，帮助读者更好地理解HashMap的高效实现和性能优化策略。 ... [详细]

蜡笔小新 2024-11-10 14:10:53