当前位置: 开发笔记 > 编程语言 > 正文

深度学习（20）神经网络与全连接层三:全连接层

作者：mobiledu2502936307 | 来源：互联网 | 2023-09-16 13:19

深度学习（20）神经网络与全连接层三:全连接层1.单层2.三层3.多层4.HerecomesDeepLearning!5.WhyDeepLearning

深度学习（20）神经网络与全连接层三: 全连接层

1. 单层
2. 三层
3. 多层
4. Here comes Deep Learning!
5. Why Deep Learning?
6. Heroes
7. Fully connected layer（全连接层）
8. net.build()
9. 网络中的维度设置出错会导致报错
10. Multi-Layers——keras.Sequential()
11. 全连接层实战
12. Next

Outline

Matmul
Neural Network
Deep Learning
Multi-Layer

Recap

$o u t = f (X @ W + b)$
$→\to$
$o u t = r e l u (X @ W + b)$

1. 单层

$X @ W + b$
- $h = r e l u (X @ W + b)$
- $[h00h10h01h11]=relu([x00x10x20x10x11x12]@[w00w01w10w11w20w21]+[b0b1])\begin{bmatrix}h_0^0&h_1^0\\h_0^1&h_1^1\end{bmatrix}=relu(\begin{bmatrix}x_0^0&x_1^0&x_2^0\\x_1^0&x_1^1&x_1^2\end{bmatrix}@\begin{bmatrix}w_{00}&w_{01}\\w_{10}&w_{11}\\w_{20}&w_{21}\end{bmatrix}+\begin{bmatrix}b_0&b_1\end{bmatrix})$

2. 三层

$h_0=relu(X@W_1+b_1)$
$h_1=relu(h_0@W_2+b_2)$
$out=relu(h_1@W_3+b_3)$

3. 多层

Input
Hidden
Output

4. Here comes Deep Learning!

(1) Neural Network in the 1980s

$3∼5layers3\sim5\ layers$

(2) Deep Learning now

$n≈1200layersn≈1200\ layers$

5. Why Deep Learning?

- 486 PC with DSP32C
  - 20Mflops, 4MB RAM
- Telsa V100
  - 32GB HBM2, 100Tflops

6. Heroes

BigDATA
ReLU
Dropout
BatchNorm
ResNet
Xavier Initialization
Caffe/TensorFlow/PyTorch
…

7. Fully connected layer（全连接层）

在这里插入图片描述

(1) x = tf.random.normal([4, 784]): 创建一个维度为[4, 784]的Tensor;
(2) net = tf.keras.layers.Dense(512): 创建一层神经网络，其输出维度为512;
(3) tf.keras.layers.Dense()在运行时会自动根据输入的shape来生成权值，即w和b;
(4) out.shape: 输出out的维度为[4, 512];
(5) net.kernal.shape: 为自动生成的权值w，其shape为[784, 512];
(6) net.bias.shape: 为自动生成的权值（偏置项）b，其shape为[512];

8. net.build()

在这里插入图片描述
(1) net.build(input_shape=(None, 4)): 可以通过调用net.build()函数创建权重 $w$ 和 $b$ ，其中4为下一层的维度;
(2) net.build(input_shape=(None, 20)): 这里可以看出可以通过多次调用net.build()函数来计算权重 $w$ 和 $b$ 的值;
注: 在第一次创建神经网络的时候，没有 $w$ 和 $b$ ，这时系统就会自动调用net.build()函数来创建权重 $w$ 和 $b$ ;

9. 网络中的维度设置出错会导致报错

在这里插入图片描述

(1) 如上图所示，net.build(input_shape=(None, 20))表示建立的网络的维度为20; out=net(tf.random.randn((4, 12)))表示输入到这层神经网络中的数据的维度是12; 那么计算时就会报错;
(2) out=net(tf.random.randn((4, 20))): 将输入到这层神经网络中的数据的维度改为20，最终out.shape=[4, 10];

10. Multi-Layers——keras.Sequential()

多层神经网络，只需要调用容器——keras.Sequential()即可。

- keras.Sequential([layer1, layer2, layer3])
- Sequential

(1) x = random.normal([2, 3]): 创建一个维度为[2, 3]的Tensor;
(2) model = keras.Sequential([keras.layers.Dense(2, activation=‘relu’), keras.layers.Dense(2, activation=‘relu’), keras.layers.Dense(2)]): 共设置3层全连接层:
$[3] \to [2] \to [2] \to [2]$
(3) model.build(input_shape=[None, 3]): 给定一个维度为3的输入;
(4) model.summary(): 相当于print(model)，方便查看网络结构的函数;
(5) for p in model.trainable_variables: 所有权重参数都被称为“可训练的变量”，即trainable_variables，在这个网络结构中，就是 $w_1,b_1,w_2,b_2,w_3,b_3]$ ;
(6) print(p.name, p.shape): 打印这些参数的名字和其维度;

11. 全连接层实战

import tensorflow as tf from tensorflow import kerasx = tf.random.normal([2, 3])model = keras.Sequential([keras.layers.Dense(2, activation=&＃39;relu&＃39;),keras.layers.Dense(2, activation=&＃39;relu&＃39;),keras.layers.Dense(2) ]) model.build(input_shape=[None, 4]) model.summary()for p in model.trainable_variables:print(p.name, p.shape)

运行结果如下:
在这里插入图片描述

(1) Param为参数量，第一层有 $2 \times 3 + 2 = 8$ 个; 第二层有 $2 \times 2 + 2 = 6$ 个; 第三层有 $2 \times 2 + 2 = 6$ 个;
(2) dense_n/kernel: 第n层的 $w$ 的值;
dense_n/bias: 第n层的 $b$ 的值;

12. Next

神经网络层与训练方法
图片识别
文本理解
艺术创作
自动决策
…

参考文献:
[1] 龙良曲:《深度学习与TensorFlow2入门实战》
[2] https://www.youtube.com/watch?v=FwFduRA_L6Q
[3] https://capacitybc.com/mini-series-part-3-the-hero1
[4] https://www.facebook.com/deepdreamgenerator/photos/a.892441237472223/1449674838415524/?type=1&theater
[5] https://study.163.com/provider/480000001847407/index.htm?share=2&shareld=480000001847407

推荐阅读

get
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
get
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
get
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
text
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
get
深入解析 Spring Security 用户认证机制

本文将详细介绍 Spring Security 中用户登录认证的核心流程，重点分析 AbstractAuthenticationProcessingFilter 和 AuthenticationManager 的工作原理。通过理解这些组件的实现，读者可以更好地掌握 Spring Security 的认证机制。 ... [详细]

蜡笔小新 2024-12-25 16:00:21
function
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
text
Canvas漫游：碰撞检测与动画模拟

探索Canvas在Web开发中的应用，通过碰撞检测与动画模拟提升交互体验。 ... [详细]

蜡笔小新 2024-12-16 13:18:51
jsp
游戏开发中的人工智能复习指南

本文档旨在帮助开发者回顾游戏开发中的人工智能技术，涵盖移动算法、群聚行为、路径规划、脚本AI、有限状态机、模糊逻辑、规则式AI、概率论与贝叶斯技术、神经网络及遗传算法等内容。 ... [详细]

蜡笔小新 2024-12-16 10:01:32
go
亚马逊Go：无人零售的创新与挑战

本文探讨了亚马逊Go如何通过技术创新推动零售业的发展，以及面临的市场和隐私挑战。同时，介绍了亚马逊最新的‘刷手支付’技术及其潜在影响。 ... [详细]

蜡笔小新 2024-12-13 11:39:37
go
洛谷 P4116 树上操作：颜色变换与路径查询

本题涉及一棵由N个节点组成的树（共有N-1条边），初始时所有节点均为白色。题目要求处理两种操作：一是改变某个节点的颜色（从白变黑或从黑变白）；二是查询从根节点到指定节点路径上的第一个黑色节点，若无则输出-1。 ... [详细]

蜡笔小新 2024-12-26 10:22:20
get
使用JPA Criteria API构建动态查询条件

本文介绍如何使用JPA Criteria API创建带有多个可选参数的动态查询方法。当某些参数为空时，这些参数不会影响最终查询结果。 ... [详细]

蜡笔小新 2024-12-26 09:26:16
get
POJ 1691 矩形涂色问题 (DFS/状态压缩DP)

本题通过将每个矩形视为一个节点，根据其相对位置构建拓扑图，并利用深度优先搜索（DFS）或状态压缩动态规划（DP）求解最小涂色次数。本文详细解析了该问题的建模思路与算法实现。 ... [详细]

蜡笔小新 2024-12-25 18:27:21
triggers
提升 Android Studio 和 Gradle 构建性能的技巧

本文介绍了如何通过配置 Android Studio 和 Gradle 来显著提高构建性能，涵盖内存分配优化、并行构建和性能分析等实用技巧。 ... [详细]

蜡笔小新 2024-12-25 17:17:22
get
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
get
TensorFlow 2.0 实战：多层感知机（MLP）网络入门

本教程详细介绍了如何使用 TensorFlow 2.0 构建和训练多层感知机（MLP）网络，涵盖回归和分类任务。通过具体示例和代码实现，帮助初学者快速掌握 TensorFlow 的核心概念和操作。 ... [详细]

蜡笔小新 2024-12-22 19:56:15

mobiledu2502936307

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章