当前位置: 开发笔记 > 编程语言 > 正文

深度学习：前馈网络FeedforwardNetworks

作者：亘古轻柔 | 来源：互联网 | 2023-10-11 10:20

深度学习深度学习是机器学习的分支，也就是神经网络，为什么称之为”深度“？因为有很多连接在一起的神经层！前馈网络FeedforwardNetworks也叫MultilayerPerc

深度学习

深度学习是机器学习的分支，也就是神经网络，为什么称之为”深度“？因为有很多连接在一起的神经层！

前馈网络

Feedforward Networks 也叫Multilayer Perceptrons（多层感知机），大致的结构如下图所示

技术图片

其中，每一个节点都可以看做是一个函数，将上一层传过来的输入信息做线性变换，再经过一个激活函数输出给下一层，如下图所示

\[h_i = tanh(\sum_jw_{ij}x_j + b_i)\ \ w_{ij}表示权重weight，b_i表示偏差bias，tanh是一种激活函数
\]

技术图片

对于最后的输出层，我们可以根据任务的种类来选择激活函数，如二分类任务中我们使用sigmoid函数（也就是logistic函数），多分类任务中使用softmax函数（得到的值都在0-1之间，看做概率）。

Word Embedding

在NLP的深度学习中，现在最流行的表示词的方法就是Word Embedding，它将词map成（一般较低纬度的）向量的形式，而这些向量的背后也是具有含义的，比如猫和狗的向量表示会比猫和石头来的接近（cosine距离）。那么要怎么得到词的Word Embedding呢？也是可以用神经网络来训练得到（其实就是神经层的weights）。在后面的例子中可以看到具体是怎么实现的。

训练

模型的输入可以是one-hot，也可以是词袋，词向量，或者TF-IDF之类的表示，训练过程其实就是参数的学习过程，通过最大化概率\(L = \prod_{i=0}^mP(y_i|x_i)\)，或者最小化\(-logL\)来训练，这里就需要用到梯度下降的方法，具体不再展开，实际中都是学习框架完成的，如TensorFlow，pytorch等。

有兴趣的可以在我的github上查看简单的示例。

优缺点
优点：
? Robust to word variation, typos, etc
? Excellent generalization
? Flexible — customised architecture for different tasks
缺点：
? Much slower than classical ML models... but GPU acceleration
? Lots of parameters due to vocabulary size
? Data hungry, not so good on tiny data sets
? Pre-training on big corpora helps
深度学习：前馈网络 Feedforward Networks

推荐阅读

编程
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
io
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
io
我的读书清单（持续更新）

我的读书清单（持续更新）201705311.《一千零一夜》2006（四五年级）2.《中华上下五千年》2008（初一）3.《鲁滨孙漂流记》2008（初二）4.《钢铁是怎样炼成的》20 ... [详细]

蜡笔小新 2024-11-21 13:01:23
io
利用无代码平台实现高效业务应用开发

随着市场环境的变化加速，全球企业都在探索更为敏捷的应用开发模式，以便快速响应新兴的商业机遇。然而，传统的软件开发方式不仅成本高昂，而且耗时较长，这往往导致IT与业务部门之间的合作障碍，进而影响项目的成功。本文将探讨如何通过无代码开发平台解决这些问题。 ... [详细]

蜡笔小新 2024-11-22 11:09:21
io
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
io
程序员的精神世界与职业追求

本文探讨了程序员这一职业的本质，认为他们是专注于问题解决的专业人士。文章深入分析了他们的日常工作状态、个人品质以及面对挑战时的态度，强调了编程不仅是一项技术活动，更是个人成长和精神修炼的过程。 ... [详细]

蜡笔小新 2024-11-21 18:56:08
io
支付宝免费提现攻略详解

在日常生活中，支付宝已成为不可或缺的支付工具之一。本文将详细介绍如何通过支付宝实现免费提现，帮助用户更好地管理个人财务，避免不必要的手续费支出。 ... [详细]

蜡笔小新 2024-11-21 16:47:52
char
java语言基础数据类型：详解

数据类型--char一、char1.1char占用2个字节char取值范围：【0~65535】char采用unicode编码方式char类型的字面量用单引号括起来char可以存储一 ... [详细]

蜡笔小新 2024-11-21 08:47:17
io
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
io
Python 领跑！2019年2月编程语言排名更新

根据最新的编程语言流行指数（PYPL）排行榜，Python 在2019年2月的份额达到了26.42%，稳坐榜首位置。 ... [详细]

蜡笔小新 2024-11-21 09:18:39
io
解决Visual Studio Code中PHP Intelephense误报问题

PHP作为一种高度灵活的编程语言，其代码结构可能导致Intelephense插件在某些情况下报告不必要的错误或警告。自1.3.3版本起，Intelephense引入了多个配置选项，允许用户根据具体的工作环境和编程风格调整这些诊断信息的显示。 ... [详细]

蜡笔小新 2024-11-20 16:47:16
io
计算机学报精选论文概览（2020-2022）

本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文，旨在为即将投稿的研究者提供参考。 ... [详细]

蜡笔小新 2024-11-20 11:08:21
install
【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库

【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库 ... [详细]

蜡笔小新 2024-11-19 19:30:06
io
机器学习（ML）三之多层感知机

深度学习主要关注多层模型，现在以多层感知机（multilayerperceptron，MLP）为例，介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]

蜡笔小新 2024-11-19 19:02:28
io
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50

亘古轻柔

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章