LogisticRegression实现与解析

作者：mobiledu2502926273 | 来源：互联网 | 2024-12-12 14:21

本文详细介绍了使用NumPy和TensorFlow实现的逻辑回归算法。通过具体代码示例，解释了数据加载、模型训练及分类预测的过程。

NumPy 实现逻辑回归

# -*- coding: utf-8 -*- """ 创建时间：2014年12月09日 21:54:00 作者：wepon 功能描述： - loadData 函数从指定目录加载所有文件，将32x32图像转换为1x1024的一维向量，返回m个样本的1024维矩阵及对应标签。 - sigmoid 函数实现Sigmoid激活函数。 - gradAscent 函数使用梯度下降法求解回归系数。 - classfy 函数基于回归系数对新样本进行分类。 """ #!/usr/bin/python import numpy as np from os import listdir def loadData(directory): fileList = listdir(directory) # 获取目录下的所有文件名 numFiles = len(fileList) # 文件数量 dataMatrix = np.zeros((numFiles, 1024)) # 初始化数据矩阵 labels = np.zeros((numFiles, 1)) # 初始化标签数组 for index in range(numFiles): featureVector = np.zeros((1, 1024)) # 单个文件的特征向量 fileName = fileList[index] with open(f'{directory}/{fileName}') as file: for row in range(32): line = file.readline().strip() for col in range(32): featureVector[0, 32*row + col] = int(line[col]) # 将32x32的数字矩阵转换为1x1024的向量 dataMatrix[index, :] = featureVector # 存储特征向量 label = int(fileName.split('_')[0]) # 解析文件名获取标签 labels[index] = label # 存储标签 return dataMatrix, labels def sigmoid(inputX): return 1.0 / (1 + np.exp(-inputX)) # Sigmoid函数实现 def gradientAscent(dataMatrix, labels, alpha=0.01, maxCycles=500): dataMatrix = np.mat(dataMatrix) labelMatrix = np.mat(labels).transpose() m, n = np.shape(dataMatrix) weights = np.ones((n, 1)) for cycle in range(maxCycles): h = sigmoid(dataMatrix * weights) error = labelMatrix - h weights += alpha * dataMatrix.transpose() * error # 更新权重 return weights def classify(testDirectory, weights): testData, testLabels = loadData(testDirectory) testDataMatrix = np.mat(testData) testLabelMatrix = np.mat(testLabels).transpose() predictiOns= sigmoid(testDataMatrix * weights) m = len(predictions) errorCount = 0 for i in range(m): if predictions[i] > 0.5: print(f'预测结果: 1, 实际标签: {testLabelMatrix[i][0]}') if testLabelMatrix[i][0] != 1: errorCount += 1 else: print(f'预测结果: 0, 实际标签: {testLabelMatrix[i][0]}') if testLabelMatrix[i][0] != 0: errorCount += 1 print(f'错误率: {errorCount / m:.4f}') def digitRecognition(trainingDirectory, testingDirectory, alpha=0.01, maxCycles=500): trainingData, trainingLabels = loadData(trainingDirectory) weights = gradientAscent(trainingData, trainingLabels, alpha, maxCycles) classify(testingDirectory, weights) # 示例调用 trainingPath = 'path_to_training_data' testingPath = 'path_to_testing_data' digitRecognition(trainingPath, testingPath, alpha=0.01, maxCycles=500)

TensorFlow 实现逻辑回归

import tensorflow as tf # 导入MNIST数据 from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # 参数设置 learningRate = 0.01 epochs = 25 batchSize = 100 displayStep = 1 # 输入占位符 x = tf.placeholder(tf.float32, [None, 784]) # MNIST图像数据，形状为28*28=784 y = tf.placeholder(tf.float32, [None, 10]) # 0-9数字识别，共10类 # 定义模型参数 weights = tf.Variable(tf.zeros([784, 10])) bias = tf.Variable(tf.zeros([10])) # 构建模型 predictiOns= tf.nn.softmax(tf.matmul(x, weights) + bias) # 使用Softmax函数作为激活函数 # 定义损失函数和优化器 loss = tf.reduce_mean(-tf.reduce_sum(y * tf.log(predictions), reduction_indices=[1])) # 交叉熵损失 optimizer = tf.train.GradientDescentOptimizer(learningRate).minimize(loss) # 梯度下降优化器 # 初始化变量 init = tf.global_variables_initializer() # 开始训练 with tf.Session() as session: session.run(init) for epoch in range(epochs): avgLoss = 0. totalBatches = int(mnist.train.num_examples / batchSize) for batchIndex in range(totalBatches): batchX, batchY = mnist.train.next_batch(batchSize) _, currentLoss = session.run([optimizer, loss], feed_dict={x: batchX, y: batchY}) avgLoss += currentLoss / totalBatches if (epoch + 1) % displayStep == 0: print(f'Epoch: {epoch + 1}, Loss: {avgLoss:.9f}') print('优化完成！') # 测试模型准确性 correctPredictiOns= tf.equal(tf.argmax(predictions, 1), tf.argmax(y, 1)) accuracy = tf.reduce_mean(tf.cast(correctPredictions, tf.float32)) print(f'准确率: {accuracy.eval({x: mnist.test.images[:3000], y: mnist.test.labels[:3000]})}')

推荐阅读

int
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
select
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
select
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
int
LeetCode 991：故障计算器的最优解法

探讨一个显示数字的故障计算器，它支持两种操作：将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]

蜡笔小新 2024-12-27 14:34:44
yaml
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
yaml
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
int
python的交互模式怎么输出名文汉字[python常见问题]

在命令行模式下敲命令python，就看到类似如下的一堆文本输出，然后就进入到Python交互模式，它的提示符是>>>，此时我们可以使用print() ... [详细]

蜡笔小新 2024-12-27 21:32:05
web
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
web
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
web
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
java
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
list
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
list
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
express
Python - 检查列表中是否存在交替峰值

本文介绍如何使用 Python 编写程序，检查给定列表中的元素是否形成交替峰值模式。我们将探讨两种不同的方法来实现这一目标，并提供详细的代码示例。 ... [详细]

蜡笔小新 2024-12-27 15:40:11
list
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20

mobiledu2502926273

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章