实时检测17个人体关键点，谷歌SOTA姿态检测模型，手机端也能运行

作者：江魂2010_717 | 来源：互联网 | 2023-07-20 04:15

编辑丨机器之心近日，来自谷歌的研究者更新了用于实时姿态检测的项目，该项目包含3种SOTA模型，其中MoveNet模型可检测人体17个关键点

编辑丨机器之心

近日，来自谷歌的研究者更新了用于实时姿态检测的项目，该项目包含 3 种 SOTA 模型，其中 MoveNet 模型可检测人体 17 个关键点、并以 50+ fps 在电脑和手机端运行；BlazePose 可检测人体 33 个关键点；PoseNet 可以检测人体多个姿态，每个姿态包含 17 个关键点。

不久之前谷歌研究院推出了最新的姿态检测模型 MoveNet，并在 TensorFlow.js 中推出了新的姿态检测 API，该模型可以非常快速、准确地检测人体的 17 个关键节点。这一开源项目对于姿态检测以及机器学习领域来说，是一件非常有意义的事。

最近，来自谷歌的研究者又更新了一个新的项目，该项目提供了包括 MoveNet 在内的多个可用于实时姿态检测的 SOTA 模型，目前该项目已有 3 种可选模型：

MoveNet：是一种速度快、准确率高的姿态检测模型，可检测人体的 17 个关键点，能够以 50+ fps 的速度在笔记本电脑和手机上运行。
BlazePose：MediaPipe BlazePose 可以检测人体 33 个关键点，除了 17 个 COCO 关键点之外，它还为脸部、手和脚提供了额外的关键点检测。
PoseNet：可以检测多个姿态，每个姿态包含 17 个关键点。

项目地址：https://github.com/tensorflow/tfjs-models/tree/master/pose-detection

其中 MoveNet 模型效果是这样的：下图中MoveNet 在跟踪人锻炼过程中的运动，可以实时、准确的检测人体关键点。值得注意的是，此时 MoveNet 一次只针对一个人进行了优化。

MoveNet 在移动应用程序中示例：

在上述示例中，MoveNet 用到了 FormFit，FormFit 是一款数字健身教练项目，基于 MoveNet，可以实时分析人体姿态，评估运动时的姿势和范围。此外，MoveNet 的研究结果还可用于健康应用程序，甚至运动训练应用程序。

关于 MoveNet、BlazePose、PoseNet 更多的演示，请参考项目，都有对应的 Demo 示例。

人体关键点

COCO 17 个关键点所对应的人体部位包括：0: 鼻子、1: 左眼、2: 右眼、3: 左耳、4: 右耳、5: 左肩、6: 右肩、7: 左肘、8: 右肘、9: 左腕、10: 右腕、11: 左胯、12: 右胯、13: 左膝、14: 右膝、15: 左踝、16: 右踝。

COCO 关键点：用于 MoveNet 和 PoseNet。

BlazePose 关键点：用于 MediaPipe BlazePose检测器，示例如下：

MoveNet 介绍

目前，MoveNet 有两个版本以提供性能的权衡。Lightning 版本时效性更快，但是产生的结果可能准确率不高；Thunder 版本时效性稍微慢一点，但准确率更高；因此，我们可以看到 Thunder 模型的关键点得分通常会比 Lightning 略高。

MoveNet 可以做什么？首先，它是一个高速位置跟踪器。

由于 MoveNet 是一个预训练模型，所以设置好以后即可使用。MoveNet 能够跟踪人体的 17 个关节点（如脚踝、膝盖、肩膀、手肘、手腕、耳朵、眼睛和鼻子等）。这些关键点与 (x, y)坐标系相关联，并且在每次调用「detector.estimatePoses(*some video element*)」时更新。

当在程序循环中反复调用该函数时，我们可以实时获得所有关键点的 (x, y) 坐标。返回的每个 (x, y) 关键点坐标都与一个分数相关联，该分数代表 MoveNet 对读数准确率的置信度。分数介于 0-1 之间，其中 0 和 1 这两个极端几乎是无法实现的，但这也意味着分数越接近 1，模型的置信度越好，越能说明读出的关键点位置越接近真实的人体关键点。

传统方案（上）与 MoveNet（下）在高难度姿态检测上的对比结果，传统方案会跟丢关键点，而 MoveNet 不会。

如何使用？

总体来说，使用该项目分为两步：

首先需要从 SupportedModels 中选择一个模型来创建检测器，模型包括 MoveNet、BlazePose、PoseNet。如下代码是创建 MoveNet 检测器：

const model = poseDetection.SupportedModels.MoveNet; const detector = await poseDetection.createDetector(model);

然后使用所创建检测器来检测姿态。

const poses = await detector.estimatePoses(image);

这样将会返回姿态列表，该列表包含检测到的图像中每个个体的姿态。对于单人模型，列表中只有一个元素。目前，只有 PoseNet 支持多姿态估计。如果模型不能检测到任何姿态，列表将为空。

每个姿态包含一个置信度得分和一组关键点。PoseNet 和 MoveNet 都返回 17 个关键点，Mediapipe BlazePose 返回 33 个关键点。每个关键点包含 x, y，得分和名字。

示例输出如下所示：

[{score: 0.8,keypoints: [{x: 230, y: 220, score: 0.9, name: "nose"},{x: 212, y: 190, score: 0.8, name: "left_eye"},... ]} ]

x，y 代表图像中实际关键点位置，如果你想标准化关键点位置，你可以使用

「poseDetection.calculator.keypointsToNormalizedKeypoints(keypoints, imageSize)」方法将 x，y 转换到 [0, 1] 范围。得分范围是 0 到 1，它表示模型对关键点的置信度。通常情况下，不应该使用置信度低的关键点。每个应用程序可能需要自定义置信度阈值。

对于要求高精度的应用程序，这里建议使用较大的置信度；相反，需要高召回率的应用程序可能会选择降低阈值。模型之间的置信度没有校准，因此设置一个合适的置信度阈值可能需要一些实验。

参考链接：

https://medium.com/@samhannan47/tensorflows-new-model-movenet-explained-3bef80a8f073

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「计算机视觉工坊」公众号后台回复：深度学习，即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。

下载2

在「计算机视觉工坊」公众号后台回复：计算机视觉，即可下载计算机视觉相关17本pdf书籍，包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。

下载3

在「计算机视觉工坊」公众号后台回复：SLAM，即可下载独家SLAM相关视频课程，包含视觉SLAM、激光SLAM精品课程。

重磅！计算机视觉工坊-学习交流群已成立
扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群，目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近2000星球成员为创造更好的AI世界共同进步，知识星球入口：
学习3D视觉核心技术，扫描查看介绍，3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~

推荐阅读

port
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
instance
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
future
面试题总结_2019年全网最热门的123个Java并发面试题总结

面试题总结_2019年全网最热门的123个Java并发面试题总结 ... [详细]

蜡笔小新 2024-11-15 11:58:13
python
Python 数据类型入门指南

本文介绍了 Python 中的基本数据类型，包括不可变数据类型（数字、字符串、元组）和可变数据类型（列表、字典、集合），并详细解释了每种数据类型的使用方法和常见操作。 ... [详细]

蜡笔小新 2024-11-15 09:59:00
java
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
char
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
instance
Java 中 com.apollographql.apollo.api.internal.Optional.orNull() 方法详解与示例

本文详细介绍了 com.apollographql.apollo.api.internal.Optional 类中的 orNull() 方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-11-14 15:03:23
scala
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
scala
高端存储技术演进与趋势

本文探讨了高端存储技术的发展趋势，包括松耦合架构、虚拟化、高性能、高安全性和智能化等方面。同时，分析了全闪存阵列和中端存储集群对高端存储市场的冲击，以及高端存储在不同应用场景中的发展趋势。 ... [详细]

蜡笔小新 2024-11-14 11:58:22
python
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
java
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
post
AngularJS 在 IE6 和 IE7 中实现历史记录支持

我在使用 AngularJS 的路由功能开发单页应用 (SPA)，但需要支持 IE7（包括 IE8 的 IE7 兼容模式）。我希望浏览器的历史记录功能能够正常工作，即使需要使用 jQuery 插件。 ... [详细]

蜡笔小新 2024-11-13 20:42:56
char
三角测量计算三维坐标的代码_双目三维重建——层次化重建思考

双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记，本文从宏观的角度阐 ... [详细]

蜡笔小新 2024-11-13 19:31:37
char
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
python
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37

江魂2010_717

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

实时检测17个人体关键点，谷歌SOTA姿态检测模型，手机端也能运行

圈里有高质量教程资料、答疑解惑、助你高效解决问题觉得有用，麻烦给个赞和在看~

圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~