图像识别讲解以一个简单的图像识别任务为例

作者：凡秘能 | 来源：互联网 | 2023-10-11 15:52

图像识别概念图像识别是识别图像中物体的类别(属于哪一个类)的任务。图像识别通常被称为ImageClassification、Categorization、Clustering。卷积

图像识别概念

图像识别是识别图像中物体的类别(属于哪一个类)的任务。图像识别通常被称为Image Classification、Categorization、Clustering。
卷积神经网络&＃xff08;CNN&＃xff09;出现之前&＃xff0c;一般用HOG、SIFT、SURF等方法先从图像中提取特征&＃xff0c;然后通过特征确定物体的类别。

利用图像直方图实现简单的图像识别任务

算法流程&＃xff1a;

将训练集中的图像进行减色处理&＃xff08;图像色彩量化&＃xff1a;图像色彩量化详解&＃xff09;。RGB每个分量都只取4个值。
创建训练集减色图像的直方图。RGB图像的直方图中&＃xff0c;B&＃61;[1,4]&＃xff0c;G&＃61;[5,8]、R&＃61;[9,12]&＃xff0c;此时bin&＃61;12&＃xff0c;但是我还需要保留每张训练图所属的类别&＃xff0c;所以&＃xff0c;bin&＃61;13。数据这样存储&＃xff1a;database &＃61; np.zeros( (训练数据数,13),dtype&＃61;np.int )。所有训练数据的柱状图如下&＃xff1a;

database具有如下的形状和内容(每一行最后一列是图像所属的类别)&＃xff1a;
将测试集图像进行色彩量化&＃xff0c;计算测试集图像的直方图与训练集中每个直方图的差&＃xff0c;将差称作特征向量。
直方图差异总和最小的训练集中图像的类别就是我们预测的待测图像的类别。换句话说&＃xff0c;待测图像的类别与近色图像一致。

实验代码&＃xff1a;

import cv2 import numpy as np import matplotlib.pyplot as plt from glob import glob# 色彩量化 def dic_color(img):img //&＃61; 63img &＃61; img * 64 &＃43; 32return img# 创建 Database(db) def get_DB():# get training image pathtrain &＃61; glob("../dataset/train/*")train.sort()# prepare databasedb &＃61; np.zeros((len(train), 13), dtype&＃61;np.int32)# prepare path databasepdb &＃61; []# each imagefor i, path in enumerate(train):# read imageimg &＃61; dic_color(cv2.imread(path))#get histogramfor j in range(4):db[i, j] &＃61; len(np.where(img[..., 0] &＃61;&＃61; (64 * j &＃43; 32))[0])db[i, j&＃43;4] &＃61; len(np.where(img[..., 1] &＃61;&＃61; (64 * j &＃43; 32))[0])db[i, j&＃43;8] &＃61; len(np.where(img[..., 2] &＃61;&＃61; (64 * j &＃43; 32))[0])# get classif &＃39;akahara&＃39; in path:cls &＃61; 0elif &＃39;madara&＃39; in path:cls &＃61; 1# store class labeldb[i, -1] &＃61; cls# store image pathpdb.append(path)return db, pdb# 判断测试集中图像类别 def test_DB(db, pdb):# get test image pathtest &＃61; glob("../dataset/test/*")test.sort()accurate_N &＃61; 0.# each imagefor path in test:# read imageimg &＃61; dic_color(cv2.imread(path))# get histogramhist &＃61; np.zeros(12, dtype&＃61;np.int32)for j in range(4):hist[j] &＃61; len(np.where(img[..., 0] &＃61;&＃61; (64 * j &＃43; 32))[0])hist[j&＃43;4] &＃61; len(np.where(img[..., 1] &＃61;&＃61; (64 * j &＃43; 32))[0])hist[j&＃43;8] &＃61; len(np.where(img[..., 2] &＃61;&＃61; (64 * j &＃43; 32))[0])# get histogram differencedifs &＃61; np.abs(db[:, :12] - hist)# axis&＃61;1表示以行为单位&＃xff0c;求每一行的和difs &＃61; np.sum(difs, axis&＃61;1)# get argmin of differencepred_i &＃61; np.argmin(difs)# get prediction labelpred &＃61; db[pred_i, -1]if pred &＃61;&＃61; 0:pred_label &＃61; "akahara"elif pred &＃61;&＃61; 1:pred_label &＃61; "madara"gt &＃61; "akahara" if "akahara" in path else "madara"if gt &＃61;&＃61; pred_label:accurate_N &＃43;&＃61; 1print(path, "is similar >>", pdb[pred_i], " Pred >>", pred_label)accuracy &＃61; accurate_N / len(test)print("Accuracy >>", accuracy, "({}/{})".format(int(accurate_N), len(test)))if __name__ &＃61;&＃61; &＃39;__main__&＃39;:db, pdb &＃61; get_DB()test_DB(db, pdb)

实验输出&＃xff08;包含识别出的图像的类别和识别准确率&＃xff09;&＃xff1a;

图像识别结果及识别准确率

推荐阅读

import
Java程序设计复习题

1、编写一个Java程序在屏幕上输出“你好！”。programmenameHelloworld.javapublicclassHelloworld{publicst ... [详细]

蜡笔小新 2024-11-22 20:05:03
import
Go从入门到精通系列视频之go编程语言密码学哈希算法（二）

Go从入门到精通系列视频之go编程语言密码学哈希算法（二） ... [详细]

蜡笔小新 2024-11-21 10:55:36
join
设计无SQL死锁的编码模式 - Achieving SQL Deadlock-Free Design

在运行于MS SQL Server 2005的.NET 2.0 Web应用中，我偶尔会遇到令人头疼的SQL死锁问题。过去，我们主要通过调整查询来解决这些问题，但这既耗时又不可靠。我希望能找到一种确定性的查询模式，确保从设计上彻底避免SQL死锁。 ... [详细]

蜡笔小新 2024-11-16 13:09:51
import
Android 中的布局方式之线性布局

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-22 11:20:34
ip
Zabbix自定义监控与邮件告警配置实践

本文详细介绍了如何在Zabbix中添加自定义监控项目，配置邮件告警功能，并解决测试告警时遇到的邮件不发送问题。 ... [详细]

蜡笔小新 2024-11-22 08:33:19
sum
Python算法实践：多维缩放技术的应用

本文介绍了多维缩放（MDS）技术，这是一种将高维数据映射到低维空间的方法，通过保持原始数据间的关系，以便于可视化和分析。文章详细描述了MDS的原理和实现过程，并提供了Python代码示例。 ... [详细]

蜡笔小新 2024-11-21 20:04:27
import
使用TabActivity实现Android顶部选项卡功能

本文介绍如何通过继承TabActivity来创建Android应用中的顶部选项卡。通过简单的步骤，您可以轻松地添加多个选项卡，并实现基本的界面切换功能。 ... [详细]

蜡笔小新 2024-11-21 17:47:42
import
Java 中的十进制样式 getZeroDigit()方法，示例

Java 中的十进制样式 getZeroDigit()方法，示例 ... [详细]

蜡笔小新 2024-11-21 16:53:03
uml
Singleton单例模式和DoubleChecked Locking双重检查锁定模式

问题描述现在，不管开发一个多大的系统（至少我现在的部门是这样的），都会带一个日志功能；在实际开发过程中 ... [详细]

蜡笔小新 2024-11-21 15:14:45
import
Java 实现生成指定数量的不重复随机数

本文将详细介绍如何使用Java编程语言生成指定数量的不重复随机数，包括具体的实现方法和代码示例。适合初学者和有一定基础的开发者参考。 ... [详细]

蜡笔小新 2024-11-21 12:08:06
ip
Ubuntu 16.04 上 PostgreSQL 的高效安装与配置指南

本文详细介绍了在 Ubuntu 16.04 系统上安装和配置 PostgreSQL 数据库的方法，包括如何设置监听地址、启用密码加密、更改默认用户密码以及调整客户端访问控制。 ... [详细]

蜡笔小新 2024-11-20 22:17:50
join
Django与Python及其他Web框架的对比

本文详细介绍了Django与其他Python Web框架（如Flask和Tornado）的区别，并探讨了Django的基本使用方法及与其他语言（如PHP）的比较。 ... [详细]

蜡笔小新 2024-11-18 09:13:53
config
2023年最新指南：如何在PHP中屏蔽警告和错误

本文详细介绍了如何在PHP中屏蔽警告和错误，包括多种方法和最佳实践，帮助开发者提升代码质量和安全性。 ... [详细]

蜡笔小新 2024-11-16 02:00:40
sum
利用MATLAB实现“逢七必过”游戏规则与数字图像处理技术的应用——第4章深入解析

在《数字图像处理及应用（MATLAB）第4章》中，详细探讨了“逢七必过”游戏规则的实现方法，并结合数字图像处理技术进行了深入分析。本章通过丰富的实例和代码示例，展示了如何利用MATLAB实现这一游戏规则，并介绍了数字图像处理的基本原理和技术应用。内容涵盖了图像增强、滤波、边缘检测等多个方面，为读者提供了全面的技术支持和实践指导。 ... [详细]

蜡笔小新 2024-11-11 11:46:42
import
如何在Ember.js中使用HBS模板

本文介绍了.hbs文件作为Ember.js项目中的视图层，类似于HTML文件的功能，并详细讲解了如何在Ember.js应用中集成Bootstrap框架及其相关组件的方法。 ... [详细]

蜡笔小新 2024-11-21 18:50:46

凡秘能

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章