首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 编程语言 > 正文

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j|分享总结

作者：天生骄傲 | 来源：互联网 | 2023-09-09 17:04

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j|分享总结本文作

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

本文作者：杨文 2018-01-02 11:03

导语：一文读懂深度学习框架Deeplearning4j 的构成与应用

雷锋网AI研习社按：深度学习是人工智能发展最为迅速的领域之一，Google、Facebook、Microsoft等巨头都围绕深度学习重点投资了一系列新兴项目，他们也一直在支持一些开源深度学习框架。目前研究人员使用的深度学习框架有 TensorFlow、Torch 、Caffe、Theano、Deeplearning4j等，而Deeplearning4j是为数不多以Java/JVM为基础，能与Apache Spark无缝结合，支持CPU/GPU集群分布式计算的开源框架。本文就来为大家详细介绍一下深度学习框架Deeplearning4j的重要组件，不同环境下的操作用法及实例分享。

在近期雷锋网(公众号：雷锋网)AI研习社的线上分享会，来自苏宁易购搜索技术研发部的资深算法工程师万宫玺为大家介绍了Deeplearning4框架的构成、主要功能模块并结合实例讲述具体的使用方法。

视频回放链接：http://www.mooc.ai/open/course/333

万宫玺，苏州大学硕士，现就职于苏宁易购搜索技术研发部，从事自然语言处理、机器视觉等领域的应用开发工作。熟悉诸如Deeplearning4j、Keras等开源深度学习框架。

以下为主要分享内容：

分享主题为：基于Java的开源深度学习框架-Deeplearning4j的介绍与实例分享。(

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

分享内容可概括以下四方面：

Deeplearning4j生态圈主要功能模块的介绍

Deeplearning4j单机/并行/分布式建模过程介绍

Deeplearning4j对迁移学习、强化学习的支持

基于Fashion Mnist数据集的图像分类应用的开发、部署、上线实例

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

第一部分内容具体为DL4j的开源库背景，目前的项目进展情况和背后的支撑团队。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

第二部分为DL4j的生态圈，主要介绍生态圈中最重要的三个模块：DL4j本身，它所依赖的张量预算库ND4j、DL4j当中做数据ETL的库DataVec。

DL4j本身，它定义并且实现了比较经典的神经网络结构，比如图片中比较常用的卷积神经网络。机器学习都需要依赖一个张量运算框架，对于DL4j，他依赖的是ND4j这样一个框架，libnd4j是ND4j调用的一个库。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

Model Zoo 是官方给出的经典神经网络结构的实现。包括AlexNet，GoogLenet ，DeepFace，YOLO等。Modle Zoo在0.9.0版本之前是作为一个独立的工程存在的，0.9.0之后的版本作为DL4j本身的一个模块，已经嵌入进去。

DL4j所依赖的张量运算库ND4J，ND4j可当作JAVA 版的Numpy。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

ND4j内存管理情况：

ND4j利用了堆外内存和堆上内存两个部分的内存做相应的计算。当用ND4j去声明一个具体的张量时候，是在堆外内存存储张量对象，堆上内存只存储张量对象的引用。设计的原因主要是我们所依赖张量运算库，大部分的运算空间都是在堆外内存上，把数据放到堆外内存可提高运行效率。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

需要注意的是，用ND4j做神经网络的训练时，堆外内存一定要调的非常大，因为大量的工作都是在堆外内存做相应的张量运算。堆外内存要远远大于堆上内存。

ND4j具体例子，第一个是如何去创建一个张量，并且把这个张量在底层存储的顺序打印出来。

第二个是hadmard乘积实现。用直白的话解释就是，两个张量相应的位置去做乘积，把这个结果形成新的向量，作为下一部分利用的结果，这个操作在包括卷积上面都是比较常用的。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

数据ETL库，称之为DataVec, 它的主要功能就是把语音信号，图片文件，文本文档转化为张量形式，做数据ETL.

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

总结DataVec库的作用：它可以将非结构化数据经过处理转化变成张量型数据，也支持结构化数据的读取。

第三个部分怎么建模。分三个场景，第一个是本地单机建模；第二个是有多个CPU或多个GPU卡情况下怎么做并行建模；第三个是怎么和Spark结合做分布式的DL4j模型的建模。

建模的四个步骤并不是固定的，可以根据实际情况做灵活的处理。大致思路首先是生成这样一个训练，测试，验证数据集。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

本地单机建模，首先是加载数据（包括本地数据和测试数据），其次是配置模型结构以及超参数，并初始化模型参数。最后，训练神经网络模型，并利用测试数据集进行评估。

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

数据并行化：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

并行建模如图所示：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

怎么和Spark结合做一个分布式的Dp4j模型的建模：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

想要在Spark上面开发的同学，需要注意Spark的版本，因为DL4j支持1.5、1.6 还有2.0之后的版本。框架接近1.0版本的发布，真正原生态支持Spark 并不多，DL4j和Spark的结合是它的一大亮点。

第四部分是强化学习模块，称之为RL4j ，也是生态系统当中的一个组件。

迁移学习和强化学习在DL4j的支持情况：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

具体应用实例分享：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

关于Deeplearning4j 的总结：

资深算法工程师万宫玺：Java工程师转型AI的秘密法宝——深度学习框架Deeplearning4j | 分享总结

个人在做AI方面的心得体会：

机器学习是AI的主要解决方案，但不是唯一方案。

深度学习并不是万能的，对于非结构化数据：图像、文本、语音会有出色的效果，但传统机器学习模型同样很重要。

数据的质和量在实际的应用中共同决定了模型的泛化能力。

转型AI同样可以从Hello World 入手。

提升AI内功必须精通原理，而不仅仅跑出Demo。

不要局限于某一特定工具框架，可以取长补短。

迁移学习和强化学习可能代表AI的未来。

如果想详细了解深度学习的应用，如何做开发，怎么去训练他的模型，怎么去调优，怎么去部署上线点击下面的视频可回顾本期内容。

雷锋网AI慕课学院视频回放链接：http://www.mooc.ai/open/course/333

推荐阅读

int
javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例

javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 15:24:50
php
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
text
解决 Ubuntu 下 Samba 重新安装时配置文件未重新生成的问题

在 Ubuntu 中遇到 Samba 服务器故障时，尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]

蜡笔小新 2024-11-12 13:02:23
php
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
php
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
php
XAMPP 遇到 404 错误：无法找到请求的对象

在使用 XAMPP 时遇到 404 错误，表示请求的对象未找到。通过详细分析发现，该问题可能由以下原因引起：1. `httpd-vhosts.conf` 文件中的配置路径错误；2. `public` 目录下缺少 `.htaccess` 文件。建议检查并修正这些配置，以确保服务器能够正确识别和访问所需的文件路径。 ... [详细]

蜡笔小新 2024-11-11 18:20:00
text
在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解

在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解 ... [详细]

蜡笔小新 2024-11-11 17:28:29
int
OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战

OpenAI首席执行官Sam Altman展望：人工智能的未来发展方向与挑战 ... [详细]

蜡笔小新 2024-11-11 09:47:50
int
利用ZFS和Gluster实现分布式存储系统的高效迁移与应用

本文探讨了在Ubuntu 18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例，展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势，为分布式存储系统的部署和管理提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-08 17:18:57
php
阿里云AI ET担任CEO，与蜻蜓FM猫局长展开深度对话

阿里云AI ET担任CEO，与蜻蜓FM猫局长展开深度对话 ... [详细]

蜡笔小新 2024-11-07 10:35:07
php
当前物联网领域十大核心技术解析：涵盖哪些关键技术？

经过近十年的技术革新，物联网已悄然渗透到日常生活中，对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术，包括但不限于：1. 军事物联网技术，该技术通过先进的感知设备实现战场环境的实时监测与数据传输，提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等，这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]

蜡笔小新 2024-11-05 19:25:03
int
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
bit
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
php
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
php
Twitter架构深度解析与学习心得

作为140字符的开创者，Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播，甚至在多次全球性事件中超越传统媒体的速度。然而，为了支持2亿用户的高效使用，其背后的技术架构和系统设计则极为复杂，涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]

蜡笔小新 2024-10-31 17:58:20

天生骄傲

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有