热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x

文章目录

  • 一、前言
  • 二、笔记
    • 1.名词解释
    • 2.流程分析


上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)


一、前言

一句:“做完了,被推翻了,算法不过关。” 的叹息,表达出 “毕设狗” 的内心活动。

故事背景: 我的毕设题目是《基于机器视觉对手语进行识别》方面。

Two days ago:我毕设快要完成,效果不理想,寻找解决方法。
在这里插入图片描述
再怎么讨论都不如读paper寻找思路强!读他!

二、笔记

1.名词解释


  1. 连续中国手语图像

    图像分为连续图像和离散图像两类,

    连续图像是指在二维坐标系中具有连续变化的空间位置和灰度的图像。连续图像的典型代表是由光学透镜系统所获得的图像,如彩色照片、航空摄像片等,用眼睛观测连续图像时感觉自然。
    在这里插入图片描述 在这里插入图片描述
    (易误区:并不是只有视频才是连续图像,图片也是连续图像。)

    离散图像则以一定网挣为周期,把×、Y坐标轴划分为棋盘式的网格,仅取离散的各个交点位置上的灰度值,构成的图像称为离散图像,也称采样图像。印刷图像其实就是离散图像,电脑图像和扫描图像也是离散图像。

  2. 快速鲁棒性特征
    SURF(Speeded Up Robust Features,加速鲁棒性特征)是对SIFT特征的进一步优化,Sift采用的是DOG图像,而surf采用的是Hessian矩阵行列式近似值图像,也写作DOH算子。
    在这里插入图片描述

    SIFT(ScaleInvariant Feature Transform,尺度不变特征转换)根据图像尺度不变性、旋转不变性 得到特征点,匹配:
    在这里插入图片描述

    可参考:Python+Opencv2(三)图像特征匹配

  3. 隐马尔可夫模型
    HMM(Hidden Markov Model)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

    简单来说就是:已知状态–预测–>未知状态

    原理参考:【HMM】入门天气数据集实验–理解隐马尔可夫模型
    实例参考:1 | 2

    HMM如今被大量使用在音频处理上,手语视频和自然语言相似,都具有连续的特点。
    在这里插入图片描述


理论推导 部分 我太菜了,可面向Google 和百度理解学习,我怕我自己都说不明白。


2.流程分析


  1. 词袋的提出
    BOF( Bag Of Features)即词袋图,是一种用于图像或视频检索的技术,把每幅图像描述为一个局部区域/关键点特征的无序集合。

    左图为 词根 示例,右图为 “学校” 手语演示(由“读书”、“房子”两个手势表达而成)
    在这里插入图片描述 在这里插入图片描述
    两篇论文都提到从中国手语辞典里整理出 “词袋” ,再用HMM创建模型进行识别。

  2. 词袋的制作
    (1)特征点的提取:

    • 《面向大词汇量的连续中国手语识别系统的研究与实现_王春立》这篇论文中采用的是通过两只CyberGlove数据手套和带有三个接收器的跟踪设备进行采集特征集合。
    • 《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》这篇论文采用的是surf提取手势特征点。

    可见特征点提取的方法不唯一,最终得到的都是每种手势的特征集合。

    (2)词袋BOF的制作:
    通过聚类法(k-means),将以上提取的特征进行分类。《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》这篇文章中采取的做法是:
    在这里插入图片描述
    左图为鸢尾花数据集k-means分类,右图是我对6种手势特征分类效果,根据不同的分类获得词袋关键词特征。
    在这里插入图片描述在这里插入图片描述
    当然分类方法也不唯一,权重和参数的设置也很重要,划分特征点集合,让他们具有代表性和可识别性。

  3. 手势分类和识别
    根据编码辞典建立搜索网络,均采用的是HMM法。
    引用《基于神经网络的中小词汇量中国手语识别研究_李晓旭》这篇文章的测试结果,HMM的识别率可达90%。
    在这里插入图片描述
    当然另外还测试了LSTM法进行测试,LSTM性能会优于HMM。(其中SHS和HOG是特征提取法的两种,SHS特征比HOG特征更适合于中国手语的表达。)

读了这么些文章多少有点思路,可以开始编码了😀。


参考资料:
《面向大词汇量的连续中国手语识别系统的研究与实现_王春立》
《基于快速鲁棒性特征和隐马尔可夫模型的手语识别_陈梯》
《基于神经网络的中小词汇量中国手语识别研究_李晓旭》


推荐阅读
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 如何在PHPcms网站中添加广告
    本文详细介绍了在PHPcms网站后台添加广告的方法,涵盖多种常见的广告形式,如百度广告和Google广告,并提供了相关设置的步骤。同时,文章还探讨了优化网站流量的SEO策略。 ... [详细]
  • 在哈佛大学商学院举行的Cyberposium大会上,专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出,开源软件不仅为企业提供了新的增长机会,还促进了软件质量的提升和创新。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 百度服务再次遭遇技术问题,疑似DNS解析故障
    近日晚间,百度多项在线服务出现加载异常,包括移动端搜索在内的多个功能受到影响。初步迹象表明,问题可能与DNS服务器解析有关。 ... [详细]
  • 本文介绍如何使用Python进行文本处理,包括分词和生成词云图。通过整合多个文本文件、去除停用词并生成词云图,展示文本数据的可视化分析方法。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • 深入理解Java中的volatile、内存屏障与CPU指令
    本文详细探讨了Java中volatile关键字的作用机制,以及其与内存屏障和CPU指令之间的关系。通过具体示例和专业解析,帮助读者更好地理解多线程编程中的同步问题。 ... [详细]
author-avatar
斌冷无情_869
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有