手写数字识别——数据降维(PCA)技术在图像识别中的应用

作者：xljlg | 来源：互联网 | 2023-10-09 19:37

1.导入模块importnumpyasnpimportpandasaspdfrompandasimportSeries,DataFrameimportmatplo

1.导入模块

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
%matplotlib inline

#向量机
from sklearn.svm import SVC

#主成分分析(principal components analysis),主要用于数据降维的
from sklearn.decomposition import PCA

#用于切割训练数据和样本数据
from sklearn.model_selection import train_test_split

2.生成训练数据和测试数据

#本地数据
data = pd.read_csv('../data/digits.csv')

train = data.iloc[:,1:]
target = data['label']

#训练数据和样本数据切割
X_train,x_test,y_train,y_true = train_test_split(train,target,test_size=0.2)

这里写图片描述

3.对数据进行降维处理

PCA 用于数据降维，减少运算时间，避免过拟合
n_components参数设置需要保留特征的数量，如果是小数，则表示保留特征的比例

# 3.1.创建pca对象
pca = PCA(n_compOnents=150,whiten=True)

#3.2.使用pca训练数据
pca.fit(X_train,y_train)

#3.3.对数据进行降维处理
X_train_pca = pca.transform(X_train)
x_test_pca = pca.transform(x_test)

结果将由原来的784个特征变为了150个特征

4.创建学习模型

svc = SVC(kernel = 'rbf')

5.使用降维后的数据进行模型训练

svc.fit(X_train_pca,y_train)

6.预测结果

y_pre_svc = svc.predict(x_test_pca)

7.展示结果

#展示前100的测试样本数据
samples = x_test.iloc[:100]
y_pre = y_pre_svc[:100]

plt.figure(figsize=(12,18))
for i in range(100):
    plt.subplot(10,10,i+1)
    plt.imshow(samples.iloc[i].reshape(28,28),cmap='gray')
    title = 'True:'+str(y_true.iloc[i])+'\nSVC:'+str(y_pre[i])
    plt.title(title)
    plt.axis('off')

这里写图片描述

8.模型执行降维后数据的评分

svc.score(x_test_pca[:100],y_true[:100])

推荐阅读

python
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
python
Python——对象自省

对象自省自省在计算机编程领域里，是指在运行时判断一个对象的类型和能力。dir能够返回一个列表，列举了一个对象所拥有的属性和方法。my_list[ ... [详细]

蜡笔小新 2024-12-23 12:55:35
copy
ML学习笔记20210824分类算法模型选择与调优

3.模型选择和调优3.1交叉验证定义目的为了让模型得精度更加可信3.2超参数搜索GridSearch对K值进行选择。k[1,2,3,4,5,6]循环遍历搜索。API参数1& ... [详细]

蜡笔小新 2024-12-19 09:10:33
get
Java中字符计数与增补字符处理

本文探讨了Java中char数据类型的特点，包括其表示范围以及如何处理超出16位字符限制的情况。通过引入代码点和代码单元的概念，详细解释了Java处理增补字符的方法。 ... [详细]

蜡笔小新 2024-12-15 20:26:33
get
开发笔记:Bash：从一个引用字符串块中的每个带引号的字符串中创建一个变量

开发笔记:Bash：从一个引用字符串块中的每个带引号的字符串中创建一个变量 ... [详细]

蜡笔小新 2024-12-09 15:10:08
python
Python实现电影类型统计与可视化

本文通过Python编程语言，利用Pandas和Matplotlib库，对电影数据集中的类型字段进行处理，实现电影类型的统计分析及可视化展示。 ... [详细]

蜡笔小新 2024-12-09 14:17:20
get
KKCMS代码审计初探

本文主要介绍了KKCMS的安装过程及其基本功能，重点分析了该系统中存在的验证码重用、SQL注入及XSS等安全问题。适合初学者作为入门指南。 ... [详细]

蜡笔小新 2024-12-04 09:30:07
get
纵坐标|据点_菜菜的sklearn课堂笔记支持向量机线性SVM决策过程的可视化

纵坐标|据点_菜菜的sklearn课堂笔记支持向量机线性SVM决策过程的可视化 ... [详细]

蜡笔小新 2024-11-27 12:58:16
python
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
get
2016年10月25日数学考试：斐波那契数列与矩阵快速幂的应用

本次考试于2016年10月25日上午7:50至11:15举行，主要涉及数学专题，特别是斐波那契数列的性质及其在编程中的应用。本文将详细解析考试中的题目，并提供解题思路和代码实现。 ... [详细]

蜡笔小新 2024-12-25 13:08:21
get
Java中使用PDFBox和XPDF提取PDF文档内容

本文介绍了在Java环境中使用PDFBox和XPDF工具从PDF文件中提取文本内容的方法。重点讨论了处理中文字符集及解决相关错误的技术细节，特别是针对某些特定格式的PDF文件（如网上填写的报名表和下载的论文）遇到的问题及解决方案。 ... [详细]

蜡笔小新 2024-12-22 15:08:22
get
在Fedora 31上部署PostgreSQL 12

本文详细介绍如何在Fedora 31操作系统上安装和配置PostgreSQL 12数据库。包括环境准备、安装步骤、配置优化以及安全设置，确保数据库能够稳定运行并提供高效的性能。 ... [详细]

蜡笔小新 2024-12-21 15:37:13
input
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
python
Python 中使用 PyPDF2 在内存里高效合并 PDF 文件

本文探讨了如何利用 Python 的 PyPDF2 库在内存中高效地合并多个 PDF 文件，并讨论了相关的内存管理问题及优化策略。 ... [详细]

蜡笔小新 2024-12-17 18:39:12
get
深入理解Play Framework 1.2.7中的缓存机制

本文探讨了Play Framework 1.2.7版本中提供的缓存解决方案，包括Ehcache和Memcached的集成与使用。文章详细介绍了缓存相关的类及其功能，以及如何通过配置选择合适的缓存实现。 ... [详细]

蜡笔小新 2024-12-01 16:36:27

xljlg

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章