当前位置: 开发笔记 > 编程语言 > 正文

【进阶篇】命令行参数使用案例

作者： | 来源：互联网 | 2023-09-18 12:14

导语本周起将推送【使用指南—进阶篇】推文。在进阶篇，我们将向您介绍PaddlePaddle的使用说明、开发标准、模型配置等内容。在使用进阶篇推文之前，请

导语

本周起将推送【使用指南—进阶篇】推文。在进阶篇&＃xff0c;我们将向您介绍PaddlePaddle的使用说明、开发标准、模型配置等内容。在使用进阶篇推文之前&＃xff0c;请参考安装与编译部分推文完成PaddlePaddle的安装

本周推文目录如下&＃xff1a;

周一&＃xff1a;【进阶篇】命令行参数细节描述

周二&＃xff1a;【进阶篇】命令行参数使用案例

周三&＃xff1a;【进阶篇】在不同的集群框架下完成分布式训练

周四&＃xff1a;【进阶篇】编译 PaddlePaddle 预测库

周五&＃xff1a;【进阶篇】C-API 使用流程

编写&＃xff5c;PaddlePaddle

排版&＃xff5c;wangp

本地训练

本地训练的实验&＃xff0c;诸如图像分类&＃xff0c;自然语言处理等&＃xff0c;通常都会使用下面这些命令行参数

paddle train \

--use_gpu&＃61;1/0 \

#1:GPU,0:CPU(默认为1)

--config&＃61;network_config \

--save_dir&＃61;output \

--trainer_count&＃61;COUNT \

#(默认为1)

--test_period&＃61;M \

#(默认为0)

--num_passes&＃61;N \

#(默认为100)

--log_period&＃61;K \

#(默认为100)

--dot_period&＃61;1000 \

#(默认为1)

#[--show_parameter_stats_period&＃61;100] \

#(默认为0)

#[--saving_period_by_batches&＃61;200] \

#(默认为0)

根据你的任务&＃xff0c;可以选择是否使用参数show_parameter_stats_period 和saving_period_by_batches

1) 将命令参数传给网络配置

config_args是一个很有用的参数&＃xff0c;用于将参数传递给网络配置&＃xff1a;

--config_args&＃61;generating&＃61;1,beam_size&＃61;5,

layer_num&＃61;10 \

get_config_arg可用于在网络配置中解析这些参数&＃xff0c;如下所示&＃xff1a;

generating &＃61; get_config_arg(&＃39;generating&＃39;, bool, False)

beam_size &＃61; get_config_arg(&＃39;beam_size&＃39;,int, 3)

layer_num &＃61; get_config_arg(&＃39;layer_num&＃39;, int, 8)

get_config_arg&＃xff1a;

get_config_arg(name, type, default_value)

---name: --config_args中指定的名字

---type: 值类型&＃xff0c;包括bool, int, str, float等

---default_value: 默认值

2) 使用模型初始化网络

增加如下参数&＃xff1a;

--init_model_path&＃61;model_path

--load_missing_parameter_strategy&＃61;rand

本地测试

方法一&＃xff1a;

paddle train --job&＃61;test \

--use_gpu&＃61;1/0 \

--config&＃61;network_config \

--trainer_count&＃61;COUNT \

--init_model_path&＃61;model_path \

---使用init_model_path指定测试的模型

---只能测试单个模型

方法二&＃xff1a;

paddle train --job&＃61;test \

--use_gpu&＃61;1/0 \

--config&＃61;network_config \

--trainer_count&＃61;COUNT \

--model_list&＃61;model.list \

---使用model_list指定测试的模型列表

---可以测试多个模型&＃xff0c;文件model.list如下所示&＃xff1a;

./alexnet_pass1

./alexnet_pass2

方法三&＃xff1a;

paddle train --job&＃61;test \

--use_gpu&＃61;1/0 \

--config&＃61;network_config \

--trainer_count&＃61;COUNT \

--save_dir&＃61;model \

--test_pass&＃61;M \

--num_passes&＃61;N \

这种方式必须使用Paddle存储的模型路径格式&＃xff0c;如&＃xff1a;model/pass-%5d。测试的模型包括从第M轮到第N-1轮存储的所有模型。例如&＃xff0c;M&＃61;12&＃xff0c;N&＃61;14这种写法将会测试模型model/pass-00012 和 model/pass-00013

稀疏训练

当输入是维度很高的稀疏数据时&＃xff0c;通常使用稀疏训练来加速计算过程。例如&＃xff0c;输入数据的字典维数是1百万&＃xff0c;但是每个样本仅包含几个词。在Paddle中&＃xff0c;稀疏矩阵的乘积应用于前向传播过程&＃xff0c;而稀疏更新在反向传播之后的权重更新时进行

1) 本地训练

用户需要在网络配置中指定sparse_update&＃61;True。请参照网络配置的文档了解更详细的信息

2) 集群训练

在集群上训练一个稀疏模型需要加上下面的参数。同时用户需要在网络配置中指定sparse_remote_update

&＃61;True。请参照网络配置的文档了解更详细的信息

--ports_num_for_sparse&＃61;1

#(默认为0)

parallel_nn

用户可以设置parallel_nn来混合使用GPU和CPU计算网络层的参数。也就是说&＃xff0c;你可以将网络配置成某些层使用GPU计算&＃xff0c;而其他层使用CPU计算。另一种方式是将网络层划分到不同的GPU上去计算&＃xff0c;这样可以减小GPU内存&＃xff0c;或者采用并行计算来加速某些层的更新

如果你想使用这些特性&＃xff0c;你需要在网络配置中指定设备的ID号(表示为deviceId)&＃xff0c;并且加上下面的命令行参数:

--parallel_nn&＃61;true

案例一&＃xff1a;GPU和CPU混合使用

请看下面的例子&＃xff1a;

#command line:

paddle train --use_gpu&＃61;true --parallel_nn&＃61;true trainer_count&＃61;COUNT

default_device(0)

fc1&＃61;fc_layer(...)

fc2&＃61;fc_layer(...)

fc3&＃61;fc_layer(...,layer_attr&＃61;ExtraAttr(device&＃61;-1))

default_device(0): 设置默认设备号为0。这意味着除了指定device&＃61;-1的层之外&＃xff0c;其他所有层都会使用GPU计算&＃xff0c;每层使用的GPU号依赖于参数trainer_count和gpu_id(默认为0)。在此&＃xff0c;fc1和fc2层在GPU上计算

device&＃61;-1: fc3层使用CPU计算

trainer_count:

---trainer_count&＃61;1: 如果未设置gpu_id&＃xff0c;那么fc1和fc2层将会使用第1个GPU来计算。否则使用gpu_id指定的GPU

---trainer_count>1: 在trainer_count个GPU上使用数据并行来计算某一层。例如&＃xff0c;trainer_count&＃61;2意味着0号和1号GPU将会使用数据并行来计算fc1和fc2层

案例二&＃xff1a;在不同设备上指定层

#command line:

paddle train --use_gpu&＃61;true --parallel_nn&＃61;true --trainer_count&＃61;COUNT

#network:

fc2&＃61;fc_layer(input&＃61;l1, layer_attr&＃61;ExtraAttr(device&＃61;0), ...)

fc3&＃61;fc_layer(input&＃61;l1, layer_attr&＃61;ExtraAttr(device&＃61;1), ...)

fc4&＃61;fc_layer(input&＃61;fc2, layer_attr&＃61;ExtraAttr(device&＃61;-1), ...)

在本例中&＃xff0c;我们假设一台机器上有4个GPU

trainer_count&＃61;1:

---使用0号GPU计算fc2层

---使用1号GPU计算fc3层

---使用CPU计算fc4层

trainer_count&＃61;2:

---使用0号和1号GPU计算fc2层。

---使用2号和3号GPU计算fc3层。

---使用CPU两线程计算fc4层。

trainer_count&＃61;4:

---运行失败&＃xff08;注意到我们已经假设机器上有4个GPU&＃xff09;&＃xff0c;因为参数allow_only_one_model_on_one_gpu默认设置为真

当device!&＃61;-1时设备ID号的分配&＃xff1a;

(deviceId &＃43; gpu_id &＃43; threadId * numLogicalDevices_) % numDevices_

deviceId: 在层中指定

gpu_id: 默认为0

threadId: 线程ID号&＃xff0c;范围: 0,1,..., trainer_count-1

numDevices_: 机器的设备(GPU)数目

numLogicalDevices_: min(max(deviceId &＃43; 1), numDevices_)

*值班小Paddle&＃xff1a;wangp

*欢迎在留言区分享您的观点

推荐阅读

ip
Oracle RMAN 增量备份详解：差异增量与累积增量

本文详细介绍了Oracle RMAN中的增量备份机制，重点解析了差异增量和累积增量备份的概念及其在不同Oracle版本中的实现。通过对比两种备份方式的特点，帮助读者选择合适的备份策略。 ... [详细]

蜡笔小新 2024-11-25 19:07:53
less
Programmatic Agent Definition in Faust

Exploring issues and solutions when defining multiple Faust agents programmatically. ... [详细]

蜡笔小新 2024-11-24 20:28:30
ip
物联网学习之旅：微信小程序控制STM32（三）STM32代码编写

STM32代码编写STM32端不需要写关于连接MQTT服务器的代码，连接的工作交给ESP8266来做，STM32只需要通过串口接收和发送数据，间接的与服务器交互。串口三配置串口一已 ... [详细]

蜡笔小新 2024-11-23 21:37:55
install
Frida环境搭建与基础使用教程

本文详细介绍了如何在本地环境中安装配置Frida及其服务器组件，以及如何通过Frida进行基本的应用程序动态分析，包括获取应用版本和加载的类信息。 ... [详细]

蜡笔小新 2024-11-25 17:43:00
random
进程管理：并发、并行、子进程启动与进程池应用

本文介绍了进程的基本概念及其在操作系统中的重要性，探讨了进程与程序的区别，以及如何通过多进程实现并发和并行。文章还详细讲解了Python中的multiprocessing模块，包括Process类的使用方法、进程间的同步与异步调用、阻塞与非阻塞操作，并通过实例演示了进程池的应用。 ... [详细]

蜡笔小新 2024-11-25 16:40:13
include
深入解析C++ Atomic编程中的内存顺序

在多线程环境中，为了防止多个线程同时修改同一数据导致的竞争条件，通常会使用内核级同步对象，如事件、互斥锁和信号量等。然而，这些方法往往伴随着高昂的上下文切换成本。本文将探讨如何利用C++11中的原子操作和内存顺序来优化多线程编程，减少不必要的开销。 ... [详细]

蜡笔小新 2024-11-25 15:41:01
include
深入解析 RuntimeClass 及多容器运行时应用

本文旨在探讨RuntimeClass的起源、功能及其在多容器运行时环境中的实际应用。通过详细的案例分析，帮助读者理解如何在Kubernetes集群中高效管理不同类型的容器运行时。 ... [详细]

蜡笔小新 2024-11-25 15:13:46
schema
SpringBoot底层注解用法及原理

2.1、组件添加1、Configuration基本使用Full模式与Lite模式示例最佳实战配置类组件之间无依赖关系用Lite模式加速容器启动过程，减少判断配置类组 ... [详细]

蜡笔小新 2024-11-25 09:48:01
c语言
C语言快速入门指南

本文档旨在提供C语言的基础知识概述，涵盖常量、变量、数据类型、控制结构及函数定义等内容。特别强调了常量的不同类型及其在程序中的应用，以及如何正确声明和使用函数。 ... [详细]

蜡笔小新 2024-11-24 19:53:02
timestamp
确定合适的序列化版本ID的方法

本文探讨了如何选择一个合适的序列化版本ID（serialVersionUID），包括使用生成器还是简单的整数，以及在不同情况下应如何处理序列化版本ID。 ... [详细]

蜡笔小新 2024-11-24 03:51:53
schema
如何使用Maven将依赖插件一并打包进JAR文件

本文详细介绍了在使用Maven构建项目时，如何将所需的依赖插件一同打包进最终的JAR文件中，以避免手动部署依赖库的麻烦。 ... [详细]

蜡笔小新 2024-11-23 22:51:34
go
Hadoop MapReduce 实战案例：手机流量使用统计分析

本文通过一个具体的Hadoop MapReduce案例，详细介绍了如何利用MapReduce框架来统计和分析手机用户的流量使用情况，包括上行和下行流量的计算以及总流量的汇总。 ... [详细]

蜡笔小新 2024-11-23 20:11:23
bit
使用 Android 的 Movie 类展示并适配 GIF 动画

本文探讨了如何利用 Android 的 Movie 类来展示 GIF 动画，并详细介绍了调整 GIF 尺寸以适应不同布局的方法。同时，提供了相关的代码示例和注意事项。 ... [详细]

蜡笔小新 2024-11-23 17:23:35
go
Gradle 配置详解与实践

Gradle 是 Android Studio 中默认的构建工具，了解其基本配置对于开发效率的提升至关重要。本文将详细介绍如何在 Gradle 中定义和使用共享变量，以确保项目的一致性和可维护性。 ... [详细]

蜡笔小新 2024-11-23 15:07:47
install
华为云openEuler环境下的Web应用部署实践

本文详细记录了在华为云openEuler系统上进行Web应用部署的具体步骤，包括配置yum源、安装Apache、MariaDB、PHP及其相关组件，并完成WordPress的安装与配置过程。 ... [详细]

蜡笔小新 2024-11-25 12:39:31

Tags | 热门标签

RankList | 热门文章