推荐收藏，我最常用的三种Python传参方法

作者： | 来源：互联网 | 2023-09-24 23:45

今天我们分享的主要目的就是通过在Python中使用命令行和配置文件来提高代码的效率。我们以机器学习当中的调参过程来进行实践，有三种方式可供选择。第一个选项是使用ar

今天我们分享的主要目的就是通过在 Python 中使用命令行和配置文件来提高代码的效率。

我们以机器学习当中的调参过程来进行实践&＃xff0c;有三种方式可供选择。第一个选项是使用 argparse&＃xff0c;它是一个流行的 Python 模块&＃xff0c;专门用于命令行解析&＃xff1b;另一种方法是读取 JSON 文件&＃xff0c;我们可以在其中放置所有超参数&＃xff1b;第三种也是鲜为人知的方法是使用 YAML 文件&＃xff01;

好奇吗&＃xff0c;让我们开始吧&＃xff01;喜欢记得收藏、关注、点赞。

文末技术交流&＃xff0c;完整代码。

先决条件

在下面的代码中&＃xff0c;我将使用 Visual Studio Code&＃xff0c;这是一个非常高效的集成 Python 开发环境。这个工具的美妙之处在于它通过安装扩展支持每种编程语言&＃xff0c;集成终端并允许同时处理大量 Python 脚本和 Jupyter 笔记本

使用 argparse

就像上图所示&＃xff0c;我们有一个标准的结构来组织我们的小项目&＃xff1a;

包含我们数据集的名为 data 的文件夹
train.py 文件
用于指定超参数的 options.py 文件

首先&＃xff0c;我们可以创建一个文件 train.py&＃xff0c;在其中我们有导入数据、在训练数据上训练模型并在测试集上对其进行评估的基本程序&＃xff1a;

import pandas as pd import numpy as np from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import mean_squared_error, mean_absolute_errorfrom options import train_optionsdf &＃61; pd.read_csv(&＃39;data\hour.csv&＃39;) print(df.head()) opt &＃61; train_options()X&＃61;df.drop([&＃39;instant&＃39;,&＃39;dteday&＃39;,&＃39;atemp&＃39;,&＃39;casual&＃39;,&＃39;registered&＃39;,&＃39;cnt&＃39;],axis&＃61;1).values y &＃61;df[&＃39;cnt&＃39;].values X_train, X_test, y_train, y_test &＃61; train_test_split(X, y, test_size&＃61;0.2)if opt.normalize &＃61;&＃61; True:scaler &＃61; StandardScaler()X &＃61; scaler.fit_transform(X)rf &＃61; RandomForestRegressor(n_estimators&＃61;opt.n_estimators,max_features&＃61;opt.max_features,max_depth&＃61;opt.max_depth) model &＃61; rf.fit(X_train,y_train) y_pred &＃61; model.predict(X_test) rmse &＃61; np.sqrt(mean_squared_error(y_pred, y_test)) mae &＃61; mean_absolute_error(y_pred, y_test) print("rmse: ",rmse) print("mae: ",mae)

在代码中&＃xff0c;我们还导入了包含在 options.py 文件中的 train_options 函数。后一个文件是一个 Python 文件&＃xff0c;我们可以从中更改 train.py 中考虑的超参数&＃xff1a;

import argparsedef train_options():parser &＃61; argparse.ArgumentParser()parser.add_argument("--normalize", default&＃61;True, type&＃61;bool, help&＃61;&＃39;maximum depth&＃39;)parser.add_argument("--n_estimators", default&＃61;100, type&＃61;int, help&＃61;&＃39;number of estimators&＃39;)parser.add_argument("--max_features", default&＃61;6, type&＃61;int, help&＃61;&＃39;maximum of features&＃39;,)parser.add_argument("--max_depth", default&＃61;5, type&＃61;int,help&＃61;&＃39;maximum depth&＃39;)opt &＃61; parser.parse_args()return opt

在这个例子中&＃xff0c;我们使用了 argparse 库&＃xff0c;它在解析命令行参数时非常流行。首先&＃xff0c;我们初始化解析器&＃xff0c;然后&＃xff0c;我们可以添加我们想要访问的参数。

这是运行代码的示例&＃xff1a;

python train.py

要更改超参数的默认值&＃xff0c;有两种方法。第一个选项是在 options.py 文件中设置不同的默认值。另一种选择是从命令行传递超参数值&＃xff1a;

python train.py --n_estimators 200

我们需要指定要更改的超参数的名称和相应的值。

python train.py --n_estimators 200 --max_depth 7

使用 JSON 文件

和前面一样&＃xff0c;我们可以保持类似的文件结构。在这种情况下&＃xff0c;我们将 options.py 文件替换为 JSON 文件。换句话说&＃xff0c;我们想在 JSON 文件中指定超参数的值并将它们传递给 train.py 文件。与 argparse 库相比&＃xff0c;JSON 文件可以是一种快速且直观的替代方案&＃xff0c;它利用键值对来存储数据。下面我们创建一个 options.json 文件&＃xff0c;其中包含我们稍后需要传递给其他代码的数据。

{ "normalize":true, "n_estimators":100, "max_features":6, "max_depth":5 }

如上所见&＃xff0c;它与 Python 字典非常相似。但是与字典不同的是&＃xff0c;它包含文本/字符串格式的数据。此外&＃xff0c;还有一些语法略有不同的常见数据类型。例如&＃xff0c;布尔值是 false/true&＃xff0c;而 Python 识别 False/True。JSON 中其他可能的值是数组&＃xff0c;它们用方括号表示为 Python 列表。

在 Python 中使用 JSON 数据的美妙之处在于&＃xff0c;它可以通过 load 方法转换成 Python 字典&＃xff1a;

f &＃61; open("options.json", "rb") parameters &＃61; json.load(f)

要访问特定项目&＃xff0c;我们只需要在方括号内引用它的键名&＃xff1a;

if parameters["normalize"] &＃61;&＃61; True:scaler &＃61; StandardScaler()X &＃61; scaler.fit_transform(X) rf&＃61;RandomForestRegressor(n_estimators&＃61;parameters["n_estimators"],max_features&＃61;parameters["max_features"],max_depth&＃61;parameters["max_depth"],random_state&＃61;42) model &＃61; rf.fit(X_train,y_train) y_pred &＃61; model.predict(X_test)

使用 YAML 文件

最后一种选择是利用 YAML 的潜力。与 JSON 文件一样&＃xff0c;我们将 Python 代码中的 YAML 文件作为字典读取&＃xff0c;以访问超参数的值。YAML 是一种人类可读的数据表示语言&＃xff0c;其中层次结构使用双空格字符表示&＃xff0c;而不是像 JSON 文件中的括号。下面我们展示 options.yaml 文件将包含的内容&＃xff1a;

normalize: True n_estimators: 100 max_features: 6 max_depth: 5

在 train.py 中&＃xff0c;我们打开 options.yaml 文件&＃xff0c;该文件将始终使用 load 方法转换为 Python 字典&＃xff0c;这一次是从 yaml 库中导入的&＃xff1a;

import yaml f &＃61; open(&＃39;options.yaml&＃39;,&＃39;rb&＃39;) parameters &＃61; yaml.load(f, Loader&＃61;yaml.FullLoader)

和前面一样&＃xff0c;我们可以使用字典所需的语法访问超参数的值。

最后的想法

配置文件的编译速度非常快&＃xff0c;而 argparse 则需要为我们要添加的每个参数编写一行代码。

所以我们应该根据自己的不同情况来选择最为合适的方式

例如&＃xff0c;如果我们需要为参数添加注释&＃xff0c;JSON 是不合适的&＃xff0c;因为它不允许注释&＃xff0c;而 YAML 和 argparse 可能非常适合。

好了&＃xff0c;这就是今天分享的全部内容&＃xff0c;喜欢就点个赞吧~

联系方式

目前开通了技术交流群&＃xff0c;群友已超过3000人&＃xff0c;添加时最好的备注方式为&＃xff1a;来源&＃43;兴趣方向&＃xff0c;方便找到志同道合的朋友&＃xff0c;资料获取也可以加入

方式1、添加微信号&＃xff1a;dkl88191&＃xff0c;备注&＃xff1a;来自CSDN
方式2、微信搜索公众号&＃xff1a;Python学习与数据挖掘&＃xff0c;后台回复&＃xff1a;加群
在这里插入图片描述

推荐阅读

window
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
ip
NPM 脚本 'start' 退出，未显示 create-react-app 服务器正在监听请求

遇到 NPM 脚本 'start' 退出且未显示 create-react-app 服务器正在监听请求的问题，请求帮助。 ... [详细]

蜡笔小新 2024-11-17 10:35:15
default
vue引入echarts地图的四种方式

一、vue中引入echart1、安装echarts:npminstallecharts--save2、在main.js文件中引入echarts实例: Vue.prototype.$echartsecharts3、在需要用到echart图形的vue文件中引入: importechartsfrom&quot;echarts&quot;;4、如果用到map（地图），还 ... [详细]

蜡笔小新 2024-11-15 13:07:46
bit
Oracle 11g 创建表空间与基础配置

本文详细介绍了Oracle 11g中的创建表空间的方法，以及如何设置客户端和服务端的基本配置，包括用户管理、环境变量配置等。 ... [详细]

蜡笔小新 2024-11-21 18:54:39
request
Python 开发环境最佳实践：Anaconda + Jupyter Notebook 快速上手指南

对于初学者而言，搭建一个高效稳定的 Python 开发环境是入门的关键一步。本文将详细介绍如何利用 Anaconda 和 Jupyter Notebook 来构建一个既易于管理又功能强大的开发环境。 ... [详细]

蜡笔小新 2024-11-21 18:30:23
request
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
request
Struts2 + json+ jquery 实现三级联动action和jsp代码竟然有小红叉，提示缺双引号，检查了转义符号也没缺啊，求解

publicclassBindActionextendsActionSupport{privateStringproString;privateStringcitString; ... [详细]

蜡笔小新 2024-11-21 16:25:41
split
机器学习实践：逻辑回归与过拟合控制

本文深入探讨了逻辑回归在机器学习中的应用，并详细解释了如何通过正则化等方法来有效避免模型的过拟合问题。 ... [详细]

蜡笔小新 2024-11-21 15:22:20
format
OBS Studio自动化实践：利用脚本批量生成录制场景

本文探讨了如何利用OBS Studio进行高效录屏，并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]

蜡笔小新 2024-11-21 10:44:53
request
深入解析 Bootstrap Table 的使用技巧

本文详细介绍了如何利用 Bootstrap Table 实现数据展示与操作，包括数据加载、表格配置及前后端交互等关键步骤。 ... [详细]

蜡笔小新 2024-11-20 17:21:26
ip
微信小程序开发指南：创建动态电影选座界面

本文详细介绍如何在微信小程序中实现一个动态且可视化的电影选座组件，提高用户体验。通过合理的布局和交互设计，使用户能够轻松选择心仪的座位。 ... [详细]

蜡笔小新 2024-11-19 15:36:11
bit
mysql数据库json类型数据,sql server json数据类型

mysql数据库json类型数据,sql server json数据类型 ... [详细]

蜡笔小新 2024-11-19 11:05:28
default
提升Android应用性能：利用Kotlin协程

协程作为一种并发设计模式，能有效简化Android平台上的异步代码处理。自Kotlin 1.3版本引入协程以来，这一特性基于其他语言的成熟理念，为开发者提供了新的工具，以增强应用的响应性和效率。 ... [详细]

蜡笔小新 2024-11-19 10:13:02
ip
Spring Boot使用AJAX从数据库读取数据异步刷新前端表格

　　近期项目需要是实现一个通过筛选选取所需数据刷新表格的功能，因为表格只占页面的一小部分，不希望整个也页面都随之刷新，所以首先想到了使用AJAX来实现。　　以下介绍解决方法（请忽视 ... [详细]

蜡笔小新 2024-11-19 10:11:02
request
解决UIScrollView上Webview点击图片后无法立即滑动的问题

本文探讨了在UIScrollView上嵌入Webview时遇到的一个常见问题：点击图片放大并返回后，Webview无法立即滑动。我们将分析问题原因，并提供有效的解决方案。 ... [详细]

蜡笔小新 2024-11-18 21:13:13

Tags | 热门标签

RankList | 热门文章