DBN【深度置信网络】【受限玻尔兹曼机深层】详解

作者： | 来源：互联网 | 2023-08-11 11:37

深度神经网路已经在语音识别，图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。简要描述深度神经网

深度神经网路已经在语音识别&＃xff0c;图像识别等领域取得前所未有的成功。本人在多年之前也曾接触过神经网络。本系列文章主要记录自己对深度神经网络的一些学习心得。

简要描述深度神经网络模型。

1. 自联想神经网络与深度网络

自联想神经网络是很古老的神经网络模型&＃xff0c;简单的说&＃xff0c;它就是三层BP网络&＃xff0c;只不过它的输出等于输入。很多时候我们并不要求输出精确的等于输入&＃xff0c;而是允许一定的误差存在。所以&＃xff0c;我们说&＃xff0c;输出是对输入的一种重构。其网络结构可以很简单的表示如下&＃xff1a;

如果我们在上述网络中不使用sigmoid函数&＃xff0c;而使用线性函数&＃xff0c;这就是PCA模型。中间网络节点个数就是PCA模型中的主分量个数。不用担心学习算法会收敛到局部最优&＃xff0c;因为线性BP网络有唯一的极小值。

在深度学习的术语中&＃xff0c;上述结构被称作自编码神经网络。从历史的角度看&＃xff0c;自编码神经网络是几十年前的事情&＃xff0c;没有什么新奇的地方。

既然自联想神经网络能够实现对输入数据的重构&＃xff0c;如果这个网络结构已经训练好了&＃xff0c;那么其中间层&＃xff0c;就可以看过是对原始输入数据的某种特征表示。如果我们把它的第三层去掉&＃xff0c;这样就是一个两层的网络。如果&＃xff0c;我们把这个学习到特征再用同样的方法创建一个自联想的三层BP网络&＃xff0c;如上图所示。换言之&＃xff0c;第二次创建的三层自联想网络的输入是上一个网络的中间层的输出。用同样的训练算法&＃xff0c;对第二个自联想网络进行学习。那么&＃xff0c;第二个自联想网络的中间层是对其输入的某种特征表示。如果我们按照这种方法&＃xff0c;依次创建很多这样的由自联想网络组成的网络结构&＃xff0c;这就是深度神经网络&＃xff0c;如下图所示&＃xff1a;

注意&＃xff0c;上图中组成深度网络的最后一层是级联了一个softmax分类器。

深度神经网络在每一层是对最原始输入数据在不同概念的粒度表示&＃xff0c;也就是不同级别的特征描述。

这种层叠多个自联想网络的方法&＃xff0c;最早被Hinton想到了。

从上面的描述中&＃xff0c;可以看出&＃xff0c;深度网络是分层训练的&＃xff0c;包括最后一层的分类器也是单独训练的&＃xff0c;最后一层分类器可以换成任何一种分类器&＃xff0c;例如SVM&＃xff0c;HMM等。上面的每一层单独训练使用的都是BP算法。相信这一思路&＃xff0c;Hinton早就实验过了。

2. DBN神经网络模型

使用BP算法单独训练每一层的时候&＃xff0c;我们发现&＃xff0c;必须丢掉网络的第三层&＃xff0c;才能级联自联想神经网络。然而&＃xff0c;有一种更好的神经网络模型&＃xff0c;这就是受限玻尔兹曼机。使用层叠波尔兹曼机组成深度神经网络的方法&＃xff0c;在深度学习里被称作深度信念网络DBN&＃xff0c;这是目前非常流行的方法。下面的术语&＃xff0c;将把自联想网络称作自编码网络autoencoder.。通过层叠自编码网络的深度网络在深度学习里另外一个属于叫栈式自编码网络。

经典的DBN网络结构是由若干层 RBM 和一层 BP 组成的一种深层神经网络, 结构如下图所示.

DBN 在训练模型的过程中主要分为两步:
第 1 步&＃xff1a;分别单独无监督地训练每一层 RBM 网络,确保特征向量映射到不同特征空间时,都尽可能多地保留特征信息;
第 2 步&＃xff1a;在 DBN 的最后一层设置 BP 网络,接收 RBM 的输出特征向量作为它的输入特征向量,有监督地训练实体关系分类器.而且每一层 RBM 网络只能确保自身层内的权值对该层特征向量映射达到最优,并不是对整个 DBN 的特征向量映射达到最优,所以反向传播网络还将错误信息自顶向下传播至每一层 RBM,微调整个 DBN 网络.RBM 网络训练模型的过程可以看作对一个深层 BP 网络权值参数的初始化,使DBN 克服了 BP 网络因随机初始化权值参数而容易陷入局部最优和训练时间长的缺点.

上述训练模型中第一步在深度学习的术语叫做预训练&＃xff0c;第二步叫做微调。最上面有监督学习的那一层&＃xff0c;根据具体的应用领域可以换成任何分类器模型&＃xff0c;而不必是BP网络。

3. 深度信念网络的应用

由于自编码网络可以对原始数据在不同概念的粒度上进行抽象&＃xff0c;深度网络一种自然的应用是对数据进行压缩或者叫降维。

胡邵华等&＃xff0c;他们用一种自编码网络实现了对经典的"瑞士卷"数据的重构:

" 瑞士卷"数据是经典的机器学习中难于分类的数据之一&＃xff0c;其隐含的数据内在模式难以在二维数据中描述。然而&＃xff0c; 胡邵华等&＃xff0c;采用深度信念网络实现了对三维瑞士卷数据的2维表示&＃xff0c;其自编码网络节点大小依次为3-100-50-25-10-2. 具体的实现细节请参考文献&＃xff1a;胡邵华、宋耀良&＃xff1a;基于autoencoder网络的数据降维与重构。

深度神经网络的另一个常见的应用是特征提取。

文献&＃xff1a;Philippe Hamel and Douglas Eck, LEARNING FEATURES FROM MUSIC AUDIO WITH DEEP BELIEF NETWORKS.

通过训练一个5层的深度网络提取音乐的特征&＃xff0c;用于音乐风格的分类&＃xff0c;其分类精度比基于梅尔倒谱系数特征分类的方法提到了14个百分点。

他们的实现思路非常简单&＃xff0c;用上述层叠的多个RBM网络组成深度网络结构来提取音乐的特征。输入的原始数据是经过分帧&＃xff0c;加窗之后的信号的频谱。分类器采用的是支撑矢量机SVM。对比的方法则是提取MFCC特征系数&＃xff0c;分类器同样采用SVM。更多的细节和实验结果可以参考上面提到的文献。

深度网络是一种良好的无监督学习方法&＃xff0c;其特征提取功能能够针对不同概念的粒度大小&＃xff0c;能够在很多领域得到广泛的应用。通常&＃xff0c;DBN主要用于对一维数据的建模比较有效&＃xff0c;例如语音。而通过级联多层卷积网络组成深度网络的模型主要用于二维数据&＃xff0c;例如图像等。

通过下面的图以及上面的内容&＃xff0c;可以更加深入的理解DBN&＃xff1a;深度信念网络算法。

参考文献&＃xff1a;
[1]Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, vol. 313, pp. 504-507, 2006.
[2]Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets. Neural computation, vol. 18, pp. 1527-1554, 2006.
[3]Xie, Jipeng, et al. "Learning features from High Speed Train vibration signals with Deep Belief Networks." Neural Networks (IJCNN), 2014 International Joint Conference on. IEEE, 2014.
[4]Bengio Y, Lamblin P, Popovici D, et al. Greedy layer-wise training of deep networks. Advances in neural information processing systems, vol. 19, pp. 153-160, 2007.
[5]Salakhutdinov R. Learning deep generative models. Diss. University of Toronto, 2009.
[6]Hinton G. A practical guide to training restricted Boltzmann machines. Neural Networks: Tricks of the Trade, pp. 599-619, 2012.
[7]Bengio Y. Learning deep architectures for AI. Foundations and trends® in Machine Learning, vol. 2, pp. 1-127, 2009.

[8]http://blog.csdn.net/celerychen2009/article/details/9079715

推荐阅读

js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
js
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
js
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
js
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
php
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
php
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
timestamp
【机器学习手册】日期和时区操作的重要性及应用

本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景，描述了学童们面对老先生的教导时的反应，以及上官如在这个过程中的表现。同时，文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后，文章强调了日期和时区操作在机器学习中的重要性，并指出了其在实际应用中的作用和意义。 ... [详细]

蜡笔小新 2023-12-12 17:40:14
web
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
web
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
object
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
js
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
object
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
web
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
post
FormData上传文件同时附带其他参数的方法

本文介绍了使用FormData对象上传文件同时附带其他参数的方法。通过创建一个表单，将文件和参数添加到FormData对象中，然后使用ajax发送POST请求进行文件上传。在发送请求时，需要设置processData为false，告诉jquery不要处理发送的数据；同时设置contentType为false，告诉jquery不要设置content-Type请求头。 ... [详细]

蜡笔小新 2023-12-09 19:51:18
post
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14

Tags | 热门标签

RankList | 热门文章