使用多个隐藏层时神经网络的准确性非常差

作者：5jkd_330 | 来源：互联网 | 2023-10-12 05:01

我创建了以下神经网络：definit_weights(m,n=1):initializeamatrix/vector

我创建了以下神经网络：

def init_weights(m, n=1): """ initialize a matrix/vector of weights with xavier initialization :param m: out dim :param n: in dim :return: matrix/vector of random weights """ limit = (6 / (n * m)) ** 0.5 weights = np.random.uniform(-limit, limit, size=(m, n)) if n == 1: weights = weights.reshape((-1,)) return weights def softmax(v): exp = np.exp(v) return exp / np.tile(exp.sum(1), (v.shape[1], 1)).T def relu(x): return np.maximum(x, 0) def sign(x): return (x > 0).astype(int) class Model: """ A class for neural network model """ def __init__(self, sizes, lr): self.lr = lr self.weights = [] self.biases = [] self.memory = [] for i in range(len(sizes) - 1): self.weights.append(init_weights(sizes[i + 1], sizes[i])) self.biases.append(init_weights(sizes[i + 1])) def forward(self, X): self.memory = [X] X = np.dot(self.weights[0], X.T).T + self.biases[0] for W, b in zip(self.weights[1:], self.biases[1:]): X = relu(X) self.memory.append(X) X = np.dot(W, X.T).T + b return softmax(X) def backward(self, y, y_pred): # calculate the errors for each layer y = np.eye(y_pred.shape[1])[y] errors = [y_pred - y] for i in range(len(self.weights) - 1, 0, -1): new_err = sign(self.memory[i]) * np.dot(errors[0], self.weights[i]) errors.insert(0, new_err) # update weights for i in range(len(self.weights)): self.weights[i] -= self.lr * np.dot(self.memory[i].T, errors[i]).T self.biases[i] -= self.lr * errors[i].sum(0)

数据有10个类。当使用单个隐藏层时，准确率几乎为 40%。当使用 2 或 3 个隐藏层时，准确率大约是第一个 epoch 的 9-10%，并且仍然如此。训练集上的准确率也在这个范围内。我的实现是否存在可能导致这种情况的问题？

推荐阅读

datetime
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
const
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
python
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
default
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
python
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
python
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
python
长春大学软件工程：二叉排序树实验报告

本实验主要探讨了二叉排序树（BST）的基本操作，包括创建、查找和删除节点。通过具体实例和代码实现，详细介绍了如何使用递归和非递归方法进行关键字查找，并展示了删除特定节点后的树结构变化。 ... [详细]

蜡笔小新 2024-12-26 15:32:56
python
python3小游戏源代码_python 点球小游戏代码

#点球小游戏fromrandomimportchoiceimporttimescore[0,0]direction[left,center,right]defkick() ... [详细]

蜡笔小新 2024-12-23 19:17:34
eval
TensorFlow 2.0 实战：多层感知机（MLP）网络入门

本教程详细介绍了如何使用 TensorFlow 2.0 构建和训练多层感知机（MLP）网络，涵盖回归和分类任务。通过具体示例和代码实现，帮助初学者快速掌握 TensorFlow 的核心概念和操作。 ... [详细]

蜡笔小新 2024-12-22 19:56:15
python
社交网络中的级联行为

社交网络中的级联行为 ... [详细]

蜡笔小新 2024-12-22 16:47:55
default
Java 中的不可变集合与同步集合详解

本文将详细探讨 Java 中提供的不可变集合（如 `Collections.unmodifiableXXX`）和同步集合（如 `Collections.synchronizedXXX`）的实现原理及使用方法，帮助开发者更好地理解和应用这些工具。 ... [详细]

蜡笔小新 2024-12-20 15:34:31
default
使用TensorFlow实现非线性回归模型

本文介绍了如何利用TensorFlow框架构建一个简单的非线性回归模型。通过生成200个随机数据点进行训练，模型能够学习并预测这些数据点的非线性关系。 ... [详细]

蜡笔小新 2024-12-20 11:54:20
string
Java中XYSeries.setLineColor()方法详解与应用实例

本文详细介绍了Java库XChart中的XYSeries类下的setLineColor()方法，并提供了多个实际应用场景的代码示例。 ... [详细]

蜡笔小新 2024-12-20 08:27:06
command
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
const
Canvas漫游：碰撞检测与动画模拟

探索Canvas在Web开发中的应用，通过碰撞检测与动画模拟提升交互体验。 ... [详细]

蜡笔小新 2024-12-16 13:18:51

5jkd_330

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章