当前位置: 开发笔记 > 编程语言 > 正文

coco关键点标注json_OpenCV图像处理基于OpenPose的关键点检测

作者：棉花小姐啦啦啦取_649 | 来源：互联网 | 2023-06-14 16:05

OpenCV基于OpenPose的手部关键点检测概述✔️手部关键点检测，旨在找出给定图片中手指上的关节点及指尖关节点,其中手部关键点检测的应用场景主要包括࿱

OpenCV基于OpenPose的手部关键点检测

概述

✔️ 手部关键点检测&＃xff0c;旨在找出给定图片中手指上的关节点及指尖关节点, 其中手部关键点检测的应用场景主要包括&＃xff1a;

手势识别
手语识别与理解
手部的行为识别

✔️ Opencv的DNN手部识别主要基于 CMU Perceptual Computing Lab 开源的手部关键点检测模型OpenPose。

手部关键点检测器的实现主要是基于论文&＃xff1a;Hand Keypoint Detection in Single Images using Multiview Bootstrapping - CVPR2017

其中&＃xff0c;如下&＃xff1a;

✏️ 论文中&＃xff0c;首先采用少量标注的人手部关键点图像数据集&＃xff0c;训练类似于人体姿态关键点所使用的CPM - Convolutional Pose Machines 网络&＃xff0c;以得到手部关键点的粗略估计. 采用了 31个 HD 高清摄像头从不同的视角对人手部进行拍摄。然后&＃xff0c;将拍摄图像送入手部关键点检测器&＃xff0c;以初步得到许多粗略的关键点检测结果。一旦有了同一手部的不同视角的关键点&＃xff0c;则构建关键点测量(Keypoint triangulation)&＃xff0c;以得到关键点的3D位置。关键点的3D位置被从3D重新投影到每一幅不同视角的 2D 图片&＃xff0c;并采用2D图像和关键点&＃xff0c;进一步训练网络&＃xff0c;以鲁棒的预测手部关键点位置&＃xff0c;这对于关键点难以预测的图片而言是尤其重要的。采用这种方式&＃xff0c;通过少量几次迭代&＃xff0c;即可得到较为准确的手部关键点检测器.

⛳ 总之&＃xff0c;关键点检测器和多视角图像(multi-view images) 一起构建了较为准确的手部关键点检测模型. 采用的检测网络类似于人体关键点中所用的网络结构. 进度提升的主要因素是采用了多视角图片标注图片数据集.

✔️ 手部关键点检测模型共输出 22 个关键点&＃xff0c;其中包括手部的 21 个点&＃xff0c;第 22 个点表示背景. 如图&＃xff1a;

手部关键点

代码示例

☑️️ ️模型文件准备&＃xff1a;

[1] - hand/pose_deploy.prototxt

[2] - hand/pose_iter_102000.caffemodel

☑️️ python代码&＃xff1a;

import os import cv2 import time import numpy as np import matplotlib.pyplot as pltclass general_pose_model(object):def __init__(self, modelpath):self.num_points &＃61; 22self.point_pairs &＃61; [[0,1],[1,2],[2,3],[3,4],[0,5],[5,6],[6,7],[7,8],[0,9],[9,10],[10,11],[11,12],[0,13],[13,14],[14,15],[15,16],[0,17],[17,18],[18,19],[19,20]]self.inHeight &＃61; 368self.threshold &＃61; 0.1self.hand_net &＃61; self.get_hand_model(modelpath)# 模型加载def get_hand_model(self, modelpath):prototxt &＃61; os.path.join(modelpath, "pose_deploy.prototxt")caffemodel &＃61; os.path.join(modelpath, "../pose_iter_102000.caffemodel")hand_model &＃61; cv2.dnn.readNetFromCaffe(prototxt, caffemodel)return hand_model# 预测def predict(self, imgfile):img_cv2 &＃61; cv2.imread(imgfile)img_height, img_width, _ &＃61; img_cv2.shapeaspect_ratio &＃61; img_width / img_heightinWidth &＃61; int(((aspect_ratio * self.inHeight) * 8) // 8)inpBlob &＃61; cv2.dnn.blobFromImage(img_cv2, 1.0 / 255, (inWidth, self.inHeight), (0, 0, 0), swapRB&＃61;False, crop&＃61;False)self.hand_net.setInput(inpBlob)output &＃61; self.hand_net.forward()# vis heatmapsself.vis_heatmaps(imgfile, output)points &＃61; []for idx in range(self.num_points):probMap &＃61; output[0, idx, :, :] # confidence map.probMap &＃61; cv2.resize(probMap, (img_width, img_height))# Find global maxima of the probMap.minVal, prob, minLoc, point &＃61; cv2.minMaxLoc(probMap)if prob > self.threshold:points.append((int(point[0]), int(point[1])))else:points.append(None)return points# heatmap可视化def vis_heatmaps(self, imgfile, net_outputs):img_cv2 &＃61; cv2.imread(imgfile)plt.figure(figsize&＃61;[10, 10])for pdx in range(self.num_points):probMap &＃61; net_outputs[0, pdx, :, :]probMap &＃61; cv2.resize(probMap, (img_cv2.shape[1], img_cv2.shape[0]))plt.subplot(5, 5, pdx&＃43;1)plt.imshow(cv2.cvtColor(img_cv2, cv2.COLOR_BGR2RGB))plt.imshow(probMap, alpha&＃61;0.6)plt.colorbar()plt.axis("off")plt.show()# 手部关键点可视化def vis_pose(self, imgfile, points):img_cv2 &＃61; cv2.imread(imgfile)img_cv2_copy &＃61; np.copy(img_cv2)for idx in range(len(points)):if points[idx]:cv2.circle(img_cv2_copy, points[idx], 8, (0, 255, 255), thickness&＃61;-1,lineType&＃61;cv2.FILLED)cv2.putText(img_cv2_copy, "{}".format(idx), points[idx], cv2.FONT_HERSHEY_SIMPLEX,1, (0, 0, 0), 2, lineType&＃61;cv2.LINE_AA)# 绘制连接点for pair in self.point_pairs:partA &＃61; pair[0]partB &＃61; pair[1]if points[partA] and points[partB]:cv2.line(img_cv2, points[partA], points[partB], (0, 255, 255), 3)cv2.circle(img_cv2, points[partA], 8, (0, 0, 255), thickness&＃61;-1, lineType&＃61;cv2.FILLED)plt.figure(figsize&＃61;[10, 10])plt.subplot(1, 2, 1)plt.imshow(cv2.cvtColor(img_cv2, cv2.COLOR_BGR2RGB))plt.axis("off")plt.subplot(1, 2, 2)plt.imshow(cv2.cvtColor(img_cv2_copy, cv2.COLOR_BGR2RGB))plt.axis("off")plt.show()if __name__ &＃61;&＃61; &＃39;__main__&＃39;:print("[INFO]Pose estimation.")os.listdir(imgs_path)]img_files &＃61; [&＃39;hand.jpg&＃39;]start &＃61; time.time()modelpath &＃61; ""pose_model &＃61; general_pose_model(modelpath)print("[INFO]Model loads time: ", time.time() - start)for img_file in img_files:start &＃61; time.time()res_points &＃61; pose_model.predict(img_file)print("[INFO]Model predicts time: ", time.time() - start)pose_model.vis_pose(img_file, res_points)print("[INFO]Done.")

[1] - 输出heatmap&＃xff1a;

[2] - 输出关键点&＃xff1a;

OpenCV于OpenPose的人体姿态估计

✔️ 同样&＃xff0c;Opencv也可以结合OpenPose进行人体姿态估计&＃xff0c;具体实现和手部关键点检测类似&＃xff0c;只是调用的模型函数有所区别&＃xff0c;具体代码实现可以参考下文。

☑️ 模型文件下载&＃xff1a;

OpenPose 人体姿态模型下载路径&＃xff1a;

BODY25: http://posefs1.perception.cs.cmu.edu/OpenPose/models/pose/body_25/pose_iter_584000.caffemodel COCO: http://posefs1.perception.cs.cmu.edu/OpenPose/models/pose/coco/pose_iter_440000.caffemodel MPI: http://posefs1.perception.cs.cmu.edu/OpenPose/models/pose/mpi/pose_iter_160000.caffemodelCOCO prototxt&＃xff1a;https://github.com/CMU-Perceptual-Computing-Lab/openpose/blob/master/models/pose/coco/pose_deploy_linevec.prototxt

☑️ 代码实现&＃xff1a;

import cv2 import time import numpy as np import matplotlib.pyplot as plt import osclass general_pose_model(object):def __init__(self, modelpath, mode&＃61;"BODY25"):# 指定采用的模型# Body25: 25 points# COCO: 18 points# MPI: 15 pointsself.inWidth &＃61; 368self.inHeight &＃61; 368self.threshold &＃61; 0.1if mode &＃61;&＃61; "BODY25":self.pose_net &＃61; self.general_body25_model(modelpath)elif mode &＃61;&＃61; "COCO":self.pose_net &＃61; self.general_coco_model(modelpath)elif mode &＃61;&＃61; "MPI":self.pose_net &＃61; self.get_mpi_model(modelpath)def get_mpi_model(self, modelpath):self.points_name &＃61; { "Head": 0, "Neck": 1, "RShoulder": 2, "RElbow": 3, "RWrist": 4,"LShoulder": 5, "LElbow": 6, "LWrist": 7, "RHip": 8, "RKnee": 9, "RAnkle": 10, "LHip": 11, "LKnee": 12, "LAnkle": 13, "Chest": 14, "Background": 15 }self.num_points &＃61; 15self.point_pairs &＃61; [[0, 1], [1, 2], [2, 3], [3, 4], [1, 5], [5, 6], [6, 7], [1, 14],[14, 8], [8, 9], [9, 10], [14, 11], [11, 12], [12, 13]]prototxt &＃61; os.path.join(modelpath,"pose/mpi/pose_deploy_linevec_faster_4_stages.prototxt")caffemodel &＃61; os.path.join(modelpath, "pose/mpi/pose_iter_160000.caffemodel")mpi_model &＃61; cv2.dnn.readNetFromCaffe(prototxt, caffemodel)return mpi_modeldef general_coco_model(self, modelpath):self.points_name &＃61; {"Nose": 0, "Neck": 1, "RShoulder": 2, "RElbow": 3, "RWrist": 4,"LShoulder": 5, "LElbow": 6, "LWrist": 7, "RHip": 8, "RKnee": 9, "RAnkle": 10, "LHip": 11, "LKnee": 12, "LAnkle": 13, "REye": 14, "LEye": 15, "REar": 16, "LEar": 17, "Background": 18}self.num_points &＃61; 18self.point_pairs &＃61; [[1, 0], [1, 2], [1, 5], [2, 3], [3, 4], [5, 6], [6, 7], [1, 8], [8, 9],[9, 10], [1, 11], [11, 12], [12, 13], [0, 14], [0, 15], [14, 16], [15, 17]]prototxt &＃61; os.path.join(modelpath, "openpose_pose_coco.prototxt")caffemodel &＃61; os.path.join(modelpath, "../pose_iter_440000.caffemodel")print(prototxt, caffemodel)coco_model &＃61; cv2.dnn.readNetFromCaffe(prototxt, caffemodel)return coco_modeldef general_body25_model(self, modelpath):self.num_points &＃61; 25self.point_pairs &＃61; [[1, 0], [1, 2], [1, 5], [2, 3], [3, 4], [5, 6], [6, 7], [0, 15], [15, 17], [0, 16], [16, 18], [1, 8],[8, 9], [9, 10], [10, 11], [11, 22], [22, 23], [11, 24],[8, 12], [12, 13], [13, 14], [14, 19], [19, 20], [14, 21]]prototxt &＃61; os.path.join(modelpath, "pose/body_25/pose_deploy.prototxt")caffemodel &＃61; os.path.join(modelpath, "pose/body_25/pose_iter_584000.caffemodel")coco_model &＃61; cv2.dnn.readNetFromCaffe(prototxt, caffemodel)return coco_modeldef predict(self, imgfile):img_cv2 &＃61; cv2.imread(imgfile)img_height, img_width, _ &＃61; img_cv2.shapeinpBlob &＃61; cv2.dnn.blobFromImage(img_cv2, 1.0 / 255, (self.inWidth, self.inHeight),(0, 0, 0), swapRB&＃61;False, crop&＃61;False)self.pose_net.setInput(inpBlob)self.pose_net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)self.pose_net.setPreferableTarget(cv2.dnn.DNN_TARGET_OPENCL)output &＃61; self.pose_net.forward()H &＃61; output.shape[2]W &＃61; output.shape[3]print(output.shape)# vis heatmapsself.vis_heatmaps(img_file, output)#points &＃61; []for idx in range(self.num_points):probMap &＃61; output[0, idx, :, :] # confidence map.# Find global maxima of the probMap.minVal, prob, minLoc, point &＃61; cv2.minMaxLoc(probMap)# Scale the point to fit on the original imagex &＃61; (img_width * point[0]) / Wy &＃61; (img_height * point[1]) / Hif prob > self.threshold:points.append((int(x), int(y)))else:points.append(None)return pointsdef vis_heatmaps(self, imgfile, net_outputs):img_cv2 &＃61; cv2.imread(imgfile)plt.figure(figsize&＃61;[10, 10])for pdx in range(self.num_points):probMap &＃61; net_outputs[0, pdx, :, :]probMap &＃61; cv2.resize(probMap, (img_cv2.shape[1], img_cv2.shape[0]))plt.subplot(5, 5, pdx&＃43;1)plt.imshow(cv2.cvtColor(img_cv2, cv2.COLOR_BGR2RGB))plt.imshow(probMap, alpha&＃61;0.6)plt.colorbar()plt.axis("off")plt.show()def vis_pose(self, imgfile, points):img_cv2 &＃61; cv2.imread(imgfile)img_cv2_copy &＃61; np.copy(img_cv2)for idx in range(len(points)):if points[idx]:cv2.circle(img_cv2_copy, points[idx], 3, (0, 0, 255), thickness&＃61;-1,lineType&＃61;cv2.FILLED)cv2.putText(img_cv2_copy, "{}".format(idx), points[idx], cv2.FONT_HERSHEY_SIMPLEX,.6, (0, 255, 255), 1, lineType&＃61;cv2.LINE_AA)# Draw Skeletonfor pair in self.point_pairs:partA &＃61; pair[0]partB &＃61; pair[1]if points[partA] and points[partB]:cv2.line(img_cv2, points[partA], points[partB], (0, 255, 0), 3)cv2.circle(img_cv2, points[partA], 3, (0, 0, 255), thickness&＃61;-1, lineType&＃61;cv2.FILLED)

[1] - 输出heatmap&＃xff1a;

[2] - 输出姿态&＃xff1a;

------------------------------------------可爱の分割线------------------------------------------

更多Opencv教程可以 Follow github的opencv教程&＃xff0c;中文&English 欢迎Star❤️❤️❤️

JimmyHHua/opencv_tutorialsgithub.com

推荐阅读

input
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
join
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
copy
Python自动化处理：从Word文档提取内容并生成带水印的PDF

本文介绍如何利用Python实现从特定网站下载Word文档，去除水印并添加自定义水印，最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]

蜡笔小新 2024-12-27 13:10:20
ip
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
join
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
join
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
match
[论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)

Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]

蜡笔小新 2024-12-28 13:39:05
match
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
ip
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
copy
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
join
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
ip
解决Uploadify在IE浏览器中的兼容性问题

本文详细介绍了如何解决Uploadify插件在Internet Explorer（IE）9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码，确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]

蜡笔小新 2024-12-27 22:07:40
input
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
timezone
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
timezone
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49

棉花小姐啦啦啦取_649

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章