深度学习框架zf_深度学习十大框架比较

作者：潇潇小姐姐cherryhv_309 | 来源：互联网 | 2023-09-07 18:29

框架比较(转)：1TensorFlow对于那些听说过深度学习但还没有太过专门深入的人来说，TensorFlow是他们最喜欢的深度学习框架，

框架比较(转)&＃xff1a;

1 TensorFlow

对于那些听说过深度学习但还没有太过专门深入的人来说&＃xff0c;TensorFlow 是他们最喜欢的深度学习框架&＃xff0c;但在这里我要澄清一些事实。在 TensorFlow 的官网上&＃xff0c;它被定义为「一个用于机器智能的开源软件库」&＃xff0c;但我觉得应该这么定义&＃xff1a;TensorFlow 是一个使用数据流图(data flow graphs)进行数值计算的开源软件库。在这里&＃xff0c;他们没有将 TensorFlow 包含在「深度学习框架」范围内&＃xff0c;而是和 Theano 一起被包含在「图编译器(graph compilers)」类别中。在结束了 Udacity 的 Deep Learning 课程(https://www.udacity.com/course/deep-learning–ud730)之后&＃xff0c;我的感觉是 TensorFlow 是一个非常好的框架&＃xff0c;但是却非常低层。使用 TensorFlow 需要编写大量的代码&＃xff0c;你必须一遍又一遍地重新发明轮子。而且我并不是唯一一个这么想的人。Andrej Karpathy 在 Twitter 上就多次吐过槽&＃xff1a; 推文&＃xff1a;我希望 TensorFlow 能标准化我们的代码&＃xff0c;但它是低层面的&＃xff0c;所以我们在其上面的层上分道扬镳了&＃xff1a;Slim、PrettyTensor、Keras、TFLearn … 比如&＃xff1a;我们在 OpenAI 使用 TensorFlow&＃xff0c;但我们似乎都更喜欢其它框架&＃xff0c;我们有些人还写自定义代码。叹几个月前&＃xff0c;我去参加了「Google Experts Summit: TensorFlow, Machine Learning for everyone, with Sergio Guadarrama」。Sergio 是开发 TensorFlow 的一位工程师&＃xff0c;但他在会上没有展示 TensorFlow&＃xff0c;而是展示了一个在 TensorFlow 上工作的更高层的库 tf.contrib&＃xff1a;https://www.tensorflow.org/tutorials/tflearn/。我的看法是&＃xff1a;他们内部已经意识到如果要让更多人使用 TensorFlow&＃xff0c;他们就需要以更高的抽象水平在其上创建一些层&＃xff0c;从而简化 TensorFlow 的使用。 TensorFlow 支持 Python 和 C&＃43;&＃43;&＃xff0c;也允许在 CPU 和 GPU 上的计算分布&＃xff0c;甚至支持使用 gRPC 进行水平扩展。总结&＃xff1a;TensorFlow 非常好&＃xff0c;但你必须了解它好在哪里。如果你不想什么事都自己手动去做和重新发明轮子&＃xff0c;你可以使用更简单的库(安利一下 Keras)。

2 Theano

Theano 是最老牌和最稳定的库之一。据我所知&＃xff0c;深度学习库的开端不是 Caffe 就是 Theano。和 TensorFlow 类似&＃xff0c;Theano 是一个比较低层的库。也因此它并不适合深度学习&＃xff0c;而更适合数值计算优化。它支持自动的函数梯度计算&＃xff0c;带有 Python 接口并集成了 Numpy&＃xff0c;这使得它从一开始就成为了通用深度学习领域最常使用的库之一。今天&＃xff0c;Theano 依然效果良好&＃xff0c;但由于它不支持多 GPU 和水平扩展&＃xff0c;在 TensorFlow 的热潮下(它们针对同一个领域)&＃xff0c;Theano 已然开始被遗忘了。

3 Keras

「You have just found Keras.」

上面这句话是你打开文档页面时看到的第一句话。 Keras它的句法是相当明晰的&＃xff0c;文档也非常好(尽管相对较新)&＃xff0c;而且它支持我已经掌握的语言 Python。它的使用非常简单轻松;我们也能很直观地了解它的指令、函数和每个模块之间的链接方式。 Keras 是一个非常高层的库&＃xff0c;可以工作在 Theano 和 TensorFlow(可以配置)之上。另外&＃xff0c;Keras强调极简主义——你只需几行代码就能构建一个神经网络。在这里你可以比较一下 Keras 和 TensorFlow 实现相同功能时所需的代码。

4 Lasagne

Lasagne 是一个工作在 Theano 之上的库。它的使命是简化一点深度学习算法之下的复杂计算&＃xff0c;同时也提供了一个更加友好的接口(也是 Python 的)。这是一个老牌的库&＃xff0c;并且很长时间以来它都是一个扩展能力很强的工具;但在我看来&＃xff0c;它的发展速度赶不上 Keras。它们的适用领域都差不多&＃xff0c;但Keras 有更好的文档、也更完整。

5 Caffe

Caffe 不只是最老牌的框架之一&＃xff0c;而是老牌中的老牌。在我看来&＃xff0c;Caffe 有非常好的特性&＃xff0c;但也有一些小缺点。起初的时候它并不是一个通用框架&＃xff0c;而仅仅关注计算机视觉&＃xff0c;但它具有非常好的通用性。在我们实验室的实验中&＃xff0c;CaffeNet 架构的训练时间在 Caffe 中比在 Keras 中(使用了 Theano 后端)少 5 倍。Caffe 的缺点是它不够灵活。如果你想给它来一点新改变&＃xff0c;那你就需要使用 C&＃43;&＃43; 和 CUDA 编程&＃xff0c;不过你也可以使用 Python 或 Matlab 接口进行一些小改变。 Caffe 的文档非常贫乏。你需要花大量时间检查代码才能理解它(Xavier 初始化有什么用?Glorot 是什么?) Caffe 的最大缺点之一是它的安装。它需要解决大量的依赖包……我曾经安装过 Caffe 两次&＃xff0c;真正痛苦至极。但要清楚&＃xff0c;Caffe 并不是一无是处。在投入了生产的计算机视觉系统的工具上&＃xff0c;Caffe 是无可争议的领导者。它非常稳健非常快速。我的建议是&＃xff1a;用 Keras 进行实验和测试&＃xff0c;然后迁移到 Caffe 中进行生产。

6 DSSTNE

DSSTNE 的发音同 Destiny&＃xff0c;是一个酷劲十足的框架却总是被忽略。为什么?除去其他的因素不谈&＃xff0c;原因在于这个框架不具有普适性&＃xff0c;不是为一般常见任务所设计的。DSSTNE 框架只做一件事——推荐系统&＃xff0c;但把这件事做到了极致。既不是为研究而设计&＃xff0c;也不是为测试 idea 而设计(来源其官方网站的宣传语)&＃xff0c;DSSTNE 框架是为量产而设计。我们已在 BEEVA 上做一些实验测试了&＃xff0c;目前我已经感觉到这是一个运行非常快的工具并且能够得到非常好的运行结果(平均准确率均值——mAP 很高)。为了达到这一速度&＃xff0c;DSSTNE 框架用 GPU 运行&＃xff0c;这也是它的弊端之一&＃xff1a;不同于篇中分析的其他框架或者库&＃xff0c;这个框架不支持使用者随意在 CPU 和 GPU 中切换&＃xff0c;而这可能会对有些尝试有用&＃xff0c;但我们在 DSSTNE 里做这样的尝试时是不被框架所允许的。其他的感受就是迄今为止 DSSTNE 还不是一个足够成熟的项目&＃xff0c;而且它封装的太严密了(「black box」)。如果我们想深入了解这个框架的运行机制是什么&＃xff0c;我们必须且只能去看它的源码&＃xff0c;并且你需要完成很多必须完成的设置(「TODO」)才可以看到。同时&＃xff0c;关于这个框架的在线教程不多&＃xff0c;而能让开发者进行操作尝试的指导就更少了。我的意见是再等 4 个月看看 DSSTNE 的最新版本。不能不说 DSSTEN 的确是一个很有意思的项目但还需要一点成长空间。还想说明一点&＃xff0c;这个框架对编程能力没有要求。DSSTNE 框架通过其终端的命令行来执行相关操作。到目前为止&＃xff0c;很多我知道也很流行的框架和库我还没有用过&＃xff0c;我不能给出更多具体的细节。

7 Torch

在这个世界上每天仍有很多战争&＃xff0c;但是一个优秀的「勇士」(西班牙语「Guerrero」)必须熟知哪些战争是需要去参加作战的&＃xff0c;哪些是可以选择不参与的。 Torch 是一个很著名的框架&＃xff0c;因巨头 Facebook 的人工智能研究所用的框架是 Torch&＃xff0c;并且在被谷歌收购之前 DeepMind 也是用的 Torch(收购之后 DeepMind 转向了 TensorFlow)。Torch 的编程语言是 Lua&＃xff0c;这就是我刚才所谈的「战争」的具体所指。在目前深度学习编程语言绝大部分以 Python 实现为主的大趋势下&＃xff0c;一个以 Lua 为编程语言的框架的最大劣势莫过于此。我从未用使用过这个语言&＃xff0c;如果我想使用 Torch 这个工具&＃xff0c;毫无疑问我需要先学习 Lua 语言然后才能使用 Torch。这固然是一个合理的过程&＃xff0c;但就我个人情况来说&＃xff0c;我偏向于用 Python、Matlab 或者 C&＃43;&＃43;的实现。

8 MXNet

mxnet 是一个支持大多数编程语言的框架之一&＃xff0c;包括 Python&＃xff0c;R&＃xff0c;C&＃43;&＃43;&＃xff0c;Julia 等。但我觉得使用R 语言的开发者会特别偏爱 mxnet&＃xff0c;因为至今为止还是 Python 以不可置疑的态势称霸深度学习语言的(Python 与 R 的对决&＃xff0c;猜猜我会站哪边?:-p) 老实说&＃xff0c;在此之前我并没有很关注 mxnet。但是当亚马逊 AWS 宣布选择 mxnet 作为其深度学习 AMI 的库时触发我开始关注 mxnet。我必须去了解一下。后来我获知亚马逊把 mxnet 列为其深度学习的参考库并宣称其巨大的横向扩展能力。我感觉到这里面有一些新的改变发生而且我必须深入了解。这也是为什么我们 2017 的 BEEVA 的技术测试名单里有 mnxet 的原因。我对多 GPU 的扩展能力有点疑虑并且我很原意去了解这样实验的更多细节&＃xff0c;但目前我还是对 mxnet 持怀疑态度。

9 DL4J

我接触这一库&＃xff0c;是因为它的documentation。当时我正在寻找受限玻尔兹曼机、自编码器&＃xff0c;在 DL4J 中找到了这两个 documentation。里面的文件很清楚&＃xff0c;有理论&＃xff0c;有代码案例。我必须得说 DL4J 的 documentation 简直是艺术品&＃xff0c;其他库在记录代码的时候需要向它学习。 DL4J 背后的公司 Skymind 意识到&＃xff0c;虽然在深度学习圈内 Python 是老大&＃xff0c;但大部分程序员起自 Java&＃xff0c;所以需要找到一个解决方案。DL4J 兼容 JVM&＃xff0c;也适用 Java、Clojure 和 Scala&＃xff0c;随着 Scala 的起起落落&＃xff0c;它也被很多有潜力的创业公司使用&＃xff0c;所以我还会继续紧追这个库。此外&＃xff0c;Skymind 的 twitter 账户非常活跃&＃xff0c;不断公开最新的科学论文、案例和教程&＃xff0c;及其推荐大家关注。

10 Cognitive Toolkit

认知工具包(Cognitive Toolkit)之前被大家所知的缩略是 CNTK&＃xff0c;但是最近又重命名回归到 Cognitive Toolkit&＃xff0c;很可能是想沾最近微软认知服务(Microsoft Cognitive services)的光。在公开的基准测试上的表现来看&＃xff0c;这个工具似乎很强劲&＃xff0c;支持纵向和横向的推移。目前为止&＃xff0c;Cognitive Toolkit 似乎不是很流行。我并没有读到很多关于使用这个库的博客、在线实验案例或者在 Kaggle 里的相关评论。但是对我来说&＃xff0c;一个背靠微软研究的框架特别强调自己的推移能力让我觉得有些奇怪&＃xff0c;毕竟微软研究团队可是在语音识别上打破世界纪录并逼近人类水准。我在查看他们项目百科的一个范例的时候了解到 Cognitive Toolkit 在 Python 上的语法和 Keras 是非常相类似的(Cognitive Toolkit 也支持 C&＃43;&＃43;)&＃xff0c;这不禁让我在想(并不是确认)Keras 才是正确的方式。

推荐阅读

python
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
rsa
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
select
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
select
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
select
DLP数据泄露检测原理浅析

最近团队在部署DLP，作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么，他们都以商业秘密为由避而不谈，不得已只能自己查资料学习，于是有了下面的浅见。身为甲方，虽然不需要开发DLP产品，但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器，只有在懂这个工具的原理之后才能更加灵活地使用这个工具，即使出现意外情况也能快速排错，越接近底层，越接近真相。根据DLP的实际用途，本文将DLP检测分为2部分，泄露关键字检测和近似重复文档检测。 ... [详细]

蜡笔小新 2024-12-25 18:19:32
input
CUGB图论专题：排水系统中的最大流问题 - EK与Dinic算法解析

本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率，使用经典的EK（Edmonds-Karp）和Dinic算法进行求解。 ... [详细]

蜡笔小新 2024-12-25 17:47:23
select
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
select
Python 编程进阶：循环结构、函数与面向对象编程

本文深入探讨了 Python 中的循环结构（包括 for 循环和 while 循环）、函数定义与调用，以及面向对象编程的基础概念。通过详细解释和代码示例，帮助读者更好地理解和应用这些核心编程元素。 ... [详细]

蜡笔小新 2024-12-25 15:48:05
select
非公版RTX 3080显卡的革新与亮点

本文深入探讨了图形显卡的进化历程，重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]

蜡笔小新 2024-12-28 13:07:40
future
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
select
Go+ 中的上下文处理指南

本文详细介绍 Go+ 编程语言中的上下文处理机制，涵盖其基本概念、关键方法及应用场景。Go+ 是一门结合了 Go 的高效工程开发特性和 Python 数据科学功能的编程语言。 ... [详细]

蜡笔小新 2024-12-28 11:05:31
ip
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
select
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
main
使用动态规划算法求解0-1背包问题

本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现，详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]

蜡笔小新 2024-12-27 19:17:15
main
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10

潇潇小姐姐cherryhv_309

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章