当前位置: 开发笔记 > 编程语言 > 正文

TensorFlow与PyTorch之争

作者：许雅惠嘉文意芝 | 来源：互联网 | 2023-09-09 22:42

点击我爱计算机视觉标星，更快获取CVML新技术本文经机器之心（微信公众号：almosthuman2014）授权转载ÿ

点击我爱计算机视觉标星&＃xff0c;更快获取CVML新技术

本文经机器之心&＃xff08;微信公众号&＃xff1a;almosthuman2014&＃xff09;授权转载&＃xff0c;禁止二次转载。

选自builtin

作者&＃xff1a;Vihar Kurama

机器之心编译

参与&＃xff1a;吴攀、杜伟

谷歌的 Tensorflow 与 Facebook 的 PyTorch 一直是颇受社区欢迎的两种深度学习框架。那么究竟哪种框架最适宜自己手边的深度学习项目呢&＃xff1f;本文作者从这两种框架各自的功能效果、优缺点以及安装、版本更新等诸多方面给出了自己的建议。

如果你在读这篇文章&＃xff0c;那么你可能已经开始了自己的深度学习之旅。如果你对这一领域还不是很熟悉&＃xff0c;那么简单来说&＃xff0c;深度学习使用了「人工神经网络」&＃xff0c;这是一种类似大脑的特殊架构&＃xff0c;这个领域的发展目标是开发出能解决真实世界问题的类人计算机。为了帮助开发这些架构&＃xff0c;谷歌、Facebook 和 Uber 等科技巨头已经为 Python 深度学习环境发布了多款框架&＃xff0c;这让人们可以更轻松地学习、构建和训练不同类型的神经网络。本文将详细介绍和比较两种流行的框架&＃xff1a; TensorFlow 与 PyTorch。

谷歌的 TensorFlow
Facebook 的 PyTorch
我们可以用 TensorFlow 和 PyTorch 构建什么&＃xff1f;
PyTorch 和 TensorFlow 对比
PyTorch 和 TensorFlow 的优点和缺点
PyTorch 和 TensorFlow 安装、版本、更新
TensorFlow 还是 PyTorch&＃xff1f;我的建议

谷歌的 TensorFlow

TensorFlow 是谷歌的开发者创造的一款开源的深度学习框架&＃xff0c;于 2015 年发布。官方研究发布于论文《TensorFlow&＃xff1a;异构分布式系统上的大规模机器学习》。

论文地址&＃xff1a;http://download.tensorflow.org/paper/whitepaper2015.pdf

TensorFlow 现已被公司、企业与创业公司广泛用于自动化工作任务和开发新系统&＃xff0c;其在分布式训练支持、可扩展的生产和部署选项、多种设备&＃xff08;比如安卓&＃xff09;支持方面备受好评。

Facebook 的 PyTorch

PyTorch 是最新的深度学习框架之一&＃xff0c;由 Facebook 的团队开发&＃xff0c;并于 2017 年在 GitHub 上开源。有关其开发的更多信息请参阅论文《PyTorch 中的自动微分》。

论文地址&＃xff1a;https://openreview.net/pdf?id&＃61;BJJsrmfCZ

PyTorch 很简洁、易于使用、支持动态计算图而且内存使用很高效&＃xff0c;因此越来越受欢迎。接下来还会更详细地介绍。

我们可以用 TensorFlow 和 PyTorch 构建什么&＃xff1f;

神经网络起初是被用于解决手写数字识别或用相机识别汽车注册车牌等简单的分类问题。但随着近来框架的发展以及英伟达高计算性能图形处理单元&＃xff08;GPU&＃xff09;的进步&＃xff0c;我们可以在 TB 级的数据上训练神经网络并求解远远更加复杂的问题。一个值得提及的成就是在 TensorFlow 和 PyTorch 中实现的卷积神经网络在 ImageNet 上都达到了当前最佳的表现。训练后的模型可以用在不同的应用中&＃xff0c;比如目标检测、图像语义分割等等。

尽管神经网络架构可以基于任何框架实现&＃xff0c;但结果却并不一样。训练过程有大量参数都与框架息息相关。举个例子&＃xff0c;如果你在 PyTorch 上训练一个数据集&＃xff0c;那么你可以使用 GPU 来增强其训练过程&＃xff0c;因为它们运行在 CUDA&＃xff08;一种 C&＃43;&＃43; 后端&＃xff09;上。TensorFlow 也能使用 GPU&＃xff0c;但它使用的是自己内置的 GPU 加速。因此&＃xff0c;根据你所选框架的不同&＃xff0c;训练模型的时间也总是各不相同。

TensorFlow 顶级项目

Magenta&＃xff1a;一个探索将机器学习用作创造过程的工具的开源研究项目

https://magenta.tensorflow.org/

Sonnet&＃xff1a;这是一个基于 TensorFlow 的软件库&＃xff0c;可用于构建复杂的神经网络

https://sonnet.dev/

Ludwig&＃xff1a;这是一个无需写代码就能训练和测试深度学习模型的工具箱

https://uber.github.io/ludwig/

PyTorch 顶级项目

CheXNet&＃xff1a;使用深度学习来分析胸部 X 光照片&＃xff0c;能实现放射科医生水平的肺炎监测

https://stanfordmlgroup.github.io/projects/chexnet/

PYRO&＃xff1a;这是一种用 Python 编写的通用概率编程语言&＃xff08;PPL&＃xff09;&＃xff0c;后端由 PyTorch 支持

https://pyro.ai (https://pyro.ai/)

Horizon&＃xff1a;一个用于应用强化学习&＃xff08;Applied RL&＃xff09;的平台&＃xff1a;

https://horizonrl.com (https://horizonrl.com/)

这些只是基于 TensorFlow 和 PyTorch 构建的少量框架和项目。你能在 TensorFlow 和 PyTorch 的 GitHub 和官网上找到更多。

PyTorch 和 TensorFlow 对比

PyTorch 和 TensorFlow 的关键差异是它们执行代码的方式。这两个框架都基于基础数据类型张量&＃xff08;tensor&＃xff09;而工作。你可以将张量看作是下图所示的多维数组。

机制&＃xff1a;动态图定义与静态图定义

TensorFlow 框架由两个核心构建模块组成&＃xff1a;

一个用于定义计算图以及在各种不同硬件上执行这些图的运行时间的软件库。
一个具有许多优点的计算图&＃xff08;后面很快就会介绍这些优点&＃xff09;。

计算图是一种将计算描述成有向图的抽象方式。图是一种由节点&＃xff08;顶点&＃xff09;和边构成的数据结构&＃xff0c;是由有向的边成对连接的顶点的集合。

当你在 TensorFlow 中运行代码时&＃xff0c;计算图是以静态方式定义的。与外部世界的所有通信都是通过 tf.Sessionobject 和 tf.Placeholder 执行&＃xff0c;它们是在运行时会被外部数据替换的张量。例如&＃xff0c;看看以下代码段&＃xff1a;

下图是 TensorFlow 中运行代码之前以静态方式生成计算图的方式。计算图的核心优势是能实现并行化或依赖驱动式调度&＃xff08;dependency driving scheduling&＃xff09;&＃xff0c;这能让训练速度更快&＃xff0c;更有效率。

类似于 TensorFlow&＃xff0c;PyTorch 也有两个核心模块&＃xff1a;

计算图的按需和动态构建
Autograd&＃xff1a;执行动态图的自动微分

可以在下图中看到&＃xff0c;图会随着执行过程而改变和执行节点&＃xff0c;没有特殊的会话接口或占位符。整体而言&＃xff0c;这个框架与 Python 语言的整合更紧密&＃xff0c;大多数时候感觉更本地化。因此&＃xff0c;PyTorch 是更 Python 化的框架&＃xff0c;而 TensorFlow 则感觉完全是一种新语言。

根据你所用的框架&＃xff0c;在软件领域有很大的不同。TensorFlow 提供了使用 TensorFlow Fold 库实现动态图的方式&＃xff0c;而 PyTorch 的动态图是内置的。

分布式训练

PyTorch 和 TensorFlow 的一个主要差异特点是数据并行化。PyTorch 优化性能的方式是利用 Python 对异步执行的本地支持。而用 TensorFlow 时&＃xff0c;你必须手动编写代码&＃xff0c;并微调要在特定设备上运行的每个操作&＃xff0c;以实现分布式训练。但是&＃xff0c;你可以将 PyTorch 中的所有功能都复现到 TensorFlow 中&＃xff0c;但这需要做很多工作。下面的代码片段展示了用 PyTorch 为模型实现分布式训练的简单示例&＃xff1a;

可视化

在训练过程的可视化方面&＃xff0c;TensorFlow 更有优势。可视化能帮助开发者跟踪训练过程以及实现更方便的调试。TensorFlow 的可视化库名为 TensorBoard。PyTorch 开发者则使用 Visdom&＃xff0c;但是 Visdom 提供的功能很简单且有限&＃xff0c;所以 TensorBoard 在训练过程可视化方面更好。

TensorBoard 的特性&＃xff1a;

跟踪和可视化损失和准确度等指标
可视化计算图&＃xff08;操作和层&＃xff09;
查看权重、偏差或其它张量随时间变化的直方图
展示图像、文本和音频数据
分析 TensorFlow 程序

在 TensorBoard 中可视化训练

Visdom 的特性

处理回调
绘制图表和细节
管理环境

在 Visdom 中可视化训练

生产部署

在将训练好的模型部署到生产方面&＃xff0c;TensorFlow 显然是赢家。我们可以直接使用 TensorFlow serving 在 TensorFlow 中部署模型&＃xff0c;这是一种使用了 REST Client API 的框架。

使用 PyTorch 时&＃xff0c;在最新的 1.0 稳定版中&＃xff0c;生产部署要容易一些&＃xff0c;但它没有提供任何用于在网络上直接部署模型的框架。你必须使用 Flask 或 Django 作为后端服务器。所以&＃xff0c;如果要考虑性能&＃xff0c;TensorFlow serving 可能是更好的选择。

用 PyTorch 和 TensorFlow 定义一个简单的神经网络

我们比较一下如何在 PyTorch 和 TensorFlow 中声明神经网络。

在 PyTorch 中&＃xff0c;神经网络是一个类&＃xff0c;我们可以使用 torch.nn 软件包导入构建架构所必需的层。所有的层都首先在 __init__() 方法中声明&＃xff0c;然后在 forward() 方法中定义输入 x 在网络所有层中的遍历方式。最后&＃xff0c;我们声明一个变量模型并将其分配给定义的架构&＃xff08;model &＃61; NeuralNet()&＃xff09;。

近期 Keras 被合并到了 TensorFlow 库中&＃xff0c;这是一个使用 TensorFlow 作为后端的神经网络框架。从那时起&＃xff0c;在 TensorFlow 中声明层的句法就与 Keras 的句法类似了。首先&＃xff0c;我们声明变量并将其分配给我们将要声明的架构类型&＃xff0c;这里的例子是一个 Sequential() 架构。

接下来&＃xff0c;我们使用 model.add() 方法以序列方式直接添加层。层的类型可以从 tf.layers 导入&＃xff0c;如下代码片段所示&＃xff1a;

TensorFlow 和 PyTorch 的优缺点

TensorFlow和PyTorch各有其优缺点。

TensorFlow 的优点&＃xff1a;

简单的内置高级 API
使用 TensorBoard 可视化训练
通过 TensorFlow serving 容易实现生产部署
很容易的移动平台支持
开源
良好的文档和社区支持

TensorFlow 的缺点&＃xff1a;

静态图
调试方法
难以快速修改

PyTorch 的优点

类 Python 的代码
动态图
轻松快速的编辑
良好的文档和社区支持
开源
很多项目都使用 PyTorch

PyTorch 的缺点&＃xff1a;

可视化需要第三方
生产部署需要 API 服务器

PyTorch 和 TensorFlow 安装、版本、更新

PyTorch 和 TensorFlow 近期都发布了新版本&＃xff1a;PyTorch 1.0&＃xff08;首个稳定版&＃xff09;和 TensorFlow 2.0&＃xff08;beta 测试版&＃xff09;。这两个版本都有重大的更新和新功能&＃xff0c;让训练过程更高效、流畅和强大。

如果你要在自己的机器上安装这些框架的最新版&＃xff0c;你可以用源代码 build 或通过 pip 安装。

PyTorch 安装

macOS 和 Linux

pip3 install torch torchvision

Windows

pip3 install https://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-win_amd64.whl pip3 install https://download.pytorch.org/whl/cu90/torchvision-0.3.0-cp36-cp36m-win_amd64.whl

TensorFlow 安装

macOS、Linux 和 Windows

# Current stable release for CPU-only pip install tensorflow # Install TensorFlow 2.0 Beta pip install tensorflow&＃61;&＃61;2.0.0-beta1

要检查安装是否成功&＃xff0c;可使用命令提示符或终端按以下步骤操作。

TensorFlow 还是 PyTorch&＃xff1f;我的建议

TensorFlow 是一种非常强大和成熟的深度学习库&＃xff0c;具有很强的可视化功能和多个用于高级模型开发的选项。它有面向生产部署的选项&＃xff0c;并且支持移动平台。另一方面&＃xff0c;PyTorch 框架还很年轻&＃xff0c;拥有更强的社区动员&＃xff0c;而且它对 Python 友好。

我的建议是如果你想更快速地开发和构建 AI 相关产品&＃xff0c;TensorFlow 是很好的选择。建议研究型开发者使用 PyTorch&＃xff0c;因为它支持快速和动态的训练。

原文链接&＃xff1a;https://builtin.com/data-science/pytorch-vs-tensorflow

TF & PyTorch学习群

学习交流TensorFlow、PyTorch深度学习框架的使用&＃xff0c;欢迎加入52CV-TF & PyTorch群&＃xff0c;扫码添加CV君拉你入群&＃xff0c;如已为CV君其他账号好友请直接私信&＃xff0c;

&＃xff08;请务必注明:框架&＃xff09;&＃xff1a;

喜欢在QQ交流的童鞋可以加52CV官方QQ群&＃xff1a;805388940。

&＃xff08;不会时时在线&＃xff0c;如果没能及时通过还请见谅&＃xff09;

长按关注我爱计算机视觉

推荐阅读

开发者
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
开发者
计算机视觉初学者指南：如何顺利入门

本文旨在为计算机视觉领域的初学者提供一套全面的入门指南，涵盖基础知识、技术工具、学习资源等方面，帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]

蜡笔小新 2024-11-27 13:38:50
int
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
client
Google Colab 免费 GPU 使用指南（第一部分）

本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境，支持多种深度学习框架，并且提供免费的 GPU 计算资源。 ... [详细]

蜡笔小新 2024-11-14 13:42:03
int
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
int
基于Keras和TensorFlow在Windows上实现YOLOv3目标检测

本文详细介绍了如何在Windows环境下配置GPU支持，并使用Keras和TensorFlow实现YOLOv3模型进行图像目标检测。对于环境搭建的具体步骤，可参考外部链接提供的指南。 ... [详细]

蜡笔小新 2024-12-12 17:28:25
int
在Ubuntu 16.04中使用Anaconda安装TensorFlow

本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先，需要下载并安装Anaconda，然后配置环境变量以确保系统能够识别Anaconda命令。接着，创建一个特定的Python环境用于安装TensorFlow，并通过指定的镜像源加速安装过程。最后，通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]

蜡笔小新 2024-12-11 19:07:39
int
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
int
TensorFlow 入门：MNIST 数据集实战

本文详细介绍了 TensorFlow 的入门实践，特别是使用 MNIST 数据集进行数字识别的项目。文章首先解析了项目文件结构，并解释了各部分的作用，随后逐步讲解了如何通过 TensorFlow 实现基本的神经网络模型。 ... [详细]

蜡笔小新 2024-12-05 13:06:15
int
基于Keras实现的卷积神经网络（CNN）示例

本文介绍了一个使用Keras框架构建的卷积神经网络（CNN）实例，主要利用了Keras提供的MNIST数据集以及相关的层，如Dense、Dropout、Activation等，构建了一个具有两层卷积和两层全连接层的CNN模型。 ... [详细]

蜡笔小新 2024-12-03 19:35:35
int
Python中实现长数据完全显示的方法

本文探讨了如何在Python中处理长数据的完全显示问题，包括numpy数组、pandas DataFrame以及tensor类型的完整输出设置。 ... [详细]

蜡笔小新 2024-12-02 11:17:26
int
吴裕雄探讨混合神经网络模型在深度学习中的应用：结合RNN与CNN优化网络性能

本文由吴裕雄撰写，深入探讨了如何利用Python、Keras及TensorFlow构建混合神经网络模型，特别是通过结合递归神经网络（RNN）和卷积神经网络（CNN），实现对网络运行效率的有效提升。 ... [详细]

蜡笔小新 2024-12-02 10:55:32
int
《计算机视觉：算法与应用》第二版初稿上线，全面更新迎接未来

经典计算机视觉教材《计算机视觉：算法与应用》迎来了其第二版，现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写，自2010年首版以来，一直是该领域的标准参考书。 ... [详细]

蜡笔小新 2024-11-30 20:56:47
int
如何在Python中调用C++代码

本文介绍了一种方法，通过使用Python的ctypes库来调用C++代码。具体实例为实现一个简单的加法器，并详细说明了从编写C++代码到编译及最终在Python中调用的全过程。 ... [详细]

蜡笔小新 2024-11-20 16:35:59
int
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38

许雅惠嘉文意芝

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章