当前位置: 开发笔记 > 编程语言 > 正文

读手语图像识别论文笔记2

作者：斌冷无情_869 | 来源：互联网 | 2023-10-17 20:45

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x

文章目录

一、前言
二、笔记
- 1.名词解释
- 2.流程分析

上一篇快速门:读手语图像识别论文笔记1&＃xff08;手语识别背景和方法&＃xff09;

一、前言

一句&＃xff1a;“做完了&＃xff0c;被推翻了&＃xff0c;算法不过关。” 的叹息&＃xff0c;表达出 “毕设狗” 的内心活动。

故事背景&＃xff1a; 我的毕设题目是《基于机器视觉对手语进行识别》方面。

Two days ago&＃xff1a;我毕设快要完成&＃xff0c;效果不理想&＃xff0c;寻找解决方法。
在这里插入图片描述
再怎么讨论都不如读paper寻找思路强&＃xff01;读他&＃xff01;

二、笔记

1.名词解释

连续中国手语图像

图像分为连续图像和离散图像两类&＃xff0c;

连续图像是指在二维坐标系中具有连续变化的空间位置和灰度的图像。连续图像的典型代表是由光学透镜系统所获得的图像&＃xff0c;如彩色照片、航空摄像片等&＃xff0c;用眼睛观测连续图像时感觉自然。

&＃xff08;易误区&＃xff1a;并不是只有视频才是连续图像&＃xff0c;图片也是连续图像。&＃xff09;

离散图像则以一定网挣为周期&＃xff0c;把×、Y坐标轴划分为棋盘式的网格&＃xff0c;仅取离散的各个交点位置上的灰度值&＃xff0c;构成的图像称为离散图像&＃xff0c;也称采样图像。印刷图像其实就是离散图像&＃xff0c;电脑图像和扫描图像也是离散图像。
快速鲁棒性特征
SURF&＃xff08;Speeded Up Robust Features&＃xff0c;加速鲁棒性特征&＃xff09;是对SIFT特征的进一步优化&＃xff0c;Sift采用的是DOG图像&＃xff0c;而surf采用的是Hessian矩阵行列式近似值图像&＃xff0c;也写作DOH算子。

SIFT&＃xff08;ScaleInvariant Feature Transform&＃xff0c;尺度不变特征转换&＃xff09;根据图像尺度不变性、旋转不变性 得到特征点&＃xff0c;匹配&＃xff1a;

可参考&＃xff1a;Python&＃43;Opencv2&＃xff08;三&＃xff09;图像特征匹配
隐马尔可夫模型
HMM&＃xff08;Hidden Markov Model&＃xff09;是统计模型&＃xff0c;它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析&＃xff0c;例如模式识别。

简单来说就是&＃xff1a;已知状态–预测–>未知状态

原理参考&＃xff1a;【HMM】入门天气数据集实验–理解隐马尔可夫模型
实例参考&＃xff1a;1 | 2

HMM如今被大量使用在音频处理上&＃xff0c;手语视频和自然语言相似&＃xff0c;都具有连续的特点。

理论推导 部分我太菜了&＃xff0c;可面向Google 和百度理解学习&＃xff0c;我怕我自己都说不明白。

2.流程分析

词袋的提出
BOF( Bag Of Features)即词袋图,是一种用于图像或视频检索的技术,把每幅图像描述为一个局部区域/关键点特征的无序集合。

左图为词根示例&＃xff0c;右图为 “学校” 手语演示&＃xff08;由“读书”、“房子”两个手势表达而成&＃xff09;

两篇论文都提到从中国手语辞典里整理出 “词袋” &＃xff0c;再用HMM创建模型进行识别。
词袋的制作
&＃xff08;1&＃xff09;特征点的提取&＃xff1a;
- 《面向大词汇量的连续中国手语识别系统的研究与实现_王春立》这篇论文中采用的是通过两只CyberGlove数据手套和带有三个接收器的跟踪设备进行采集特征集合。
- 《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》这篇论文采用的是surf提取手势特征点。
可见特征点提取的方法不唯一&＃xff0c;最终得到的都是每种手势的特征集合。

&＃xff08;2&＃xff09;词袋BOF的制作&＃xff1a;
通过聚类法&＃xff08;k-means&＃xff09;&＃xff0c;将以上提取的特征进行分类。《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》这篇文章中采取的做法是&＃xff1a;

左图为鸢尾花数据集k-means分类&＃xff0c;右图是我对6种手势特征分类效果&＃xff0c;根据不同的分类获得词袋关键词特征。

当然分类方法也不唯一&＃xff0c;权重和参数的设置也很重要&＃xff0c;划分特征点集合&＃xff0c;让他们具有代表性和可识别性。
手势分类和识别
根据编码辞典建立搜索网络&＃xff0c;均采用的是HMM法。
引用《基于神经网络的中小词汇量中国手语识别研究_李晓旭》这篇文章的测试结果&＃xff0c;HMM的识别率可达90%。

当然另外还测试了LSTM法进行测试&＃xff0c;LSTM性能会优于HMM。&＃xff08;其中SHS和HOG是特征提取法的两种&＃xff0c;SHS特征比HOG特征更适合于中国手语的表达。&＃xff09;

读了这么些文章多少有点思路&＃xff0c;可以开始编码了&＃x1f600;。

参考资料&＃xff1a;
《面向大词汇量的连续中国手语识别系统的研究与实现_王春立》
《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》
《基于神经网络的中小词汇量中国手语识别研究_李晓旭》

推荐阅读

神经网络
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
function
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
function
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
input
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
netty
PHP Eloquent ORM 中的关联查询扩展

本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询，并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率，还简化了代码逻辑。 ... [详细]

蜡笔小新 2024-12-25 18:14:14
rsa
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
rsa
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
heap
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
input
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
input
如何在PHPcms网站中添加广告

本文详细介绍了在PHPcms网站后台添加广告的方法，涵盖多种常见的广告形式，如百度广告和Google广告，并提供了相关设置的步骤。同时，文章还探讨了优化网站流量的SEO策略。 ... [详细]

蜡笔小新 2024-12-27 17:13:07
input
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
input
吴恩达推出TensorFlow实践课程，Python基础即可入门，四个月掌握核心技能

量子位报道，deeplearning.ai最新发布了TensorFlow实践课程，适合希望使用TensorFlow开发AI应用的学习者。该课程涵盖机器学习模型构建、图像识别、自然语言处理及时间序列预测等多个方面。 ... [详细]

蜡笔小新 2024-12-08 17:26:10
less
cs231n笔记（1）——KNN算法

图像分类：KNN算法（K—最近邻算法）一.定义定义：KNN是通过测量不同特征值之间的距离进行分类。它的的思路是ÿ ... [详细]

蜡笔小新 2024-10-25 13:32:41
less
全连接神经网络应用于手写图像识别实践

2019独角兽企业重金招聘Python工程师标准转载于:https:my.oschina.netliyangkeb ... [详细]

蜡笔小新 2024-10-23 18:06:55
input
MATLAB人体行为检测与识别

人体行为检测与识别摘要人体行为检测与识别是当前研究的重点，具有很高的研究价值和广阔的应用前景。主要应用在型人机交互、运动分析、智能监控和虚拟现实也称灵境技术ÿ ... [详细]

蜡笔小新 2024-10-20 19:34:31

斌冷无情_869

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章