10分钟搭建商品结算平台！商品、车辆识别一网打尽

作者：诡道89_431 | 来源：互联网 | 2023-08-18 03:44

关注公众号，发现CV技术之美商品识别、人脸识别、以图搜图有什么难？这个在Github上狂圈Star3100的项目就能轻松帮你实现࿰

关注公众号&＃xff0c;发现CV技术之美

"商品识别"、"人脸识别"、"以图搜图"有什么难&＃xff1f;这个在Github上狂圈Star 3100&＃43;的项目就能轻松帮你实现&＃xff01;

它就是全开源、轻量级的图像识别系统PP-ShiTu。它不仅带有十万类物品的特征信息&＃xff0c;可以实时、准确地识别出目标的品类、规格、商标、颜色等属性信息&＃xff0c;而且单张图片用CPU处理仅需0.2s&＃xff01;在出现新品类的时候&＃xff0c;不需要重新训练系统&＃xff0c;补充检索库即可快速扩充识别范围&＃xff0c;高效易用&＃xff0c;全民友好&＃xff01;

话不多说&＃xff01;直接传送门&＃xff1a;

https://github.com/PaddlePaddle/PaddleClas

记得Star收藏支持开源项目&＃xff0c;也防止走丢哦&＃xff01;

不过说来容易&＃xff0c;现实中的图像识别任务真有这么简单么&＃xff1f;当然不是&＃xff0c;一个优秀的图像识别系统往往在处理实际场景问题过程中需要面临各种挑战&＃xff1a;

1.商品类别数以万计&＃xff1a;根本没法事先把所有类别都放入训练集&＃xff1b;

2.不同商品相似度极高&＃xff1a;比如同一种饮料的不同口味&＃xff0c;就很可能拥有非常类似的包装。而且即便对于同一件商品&＃xff0c;在不同情况下所获得的商品图像都往往存在相当大的差异&＃xff1b;

3.品类更新极快&＃xff1a;像新零售这种行业&＃xff0c;新品几乎都是按小时级别在更新&＃xff0c;每增加新的产品都要辛辛苦苦重新训练模型&＃xff0c;仅靠单一模型想要跟上步伐&＃xff0c;着实望尘莫及。

当然这些产业难点也从另一个角度说明了PP-ShiTu图像识别系统的能力&＃xff0c;它不仅有高水平的特征学习能力&＃xff0c;对新出现的产品也可以在不用重新训练算法的情况下&＃xff0c;直接通过配置检索库的方式实现识别。

这样的特殊能力&＃xff0c;得益于PP-ShiTu对度量学习、图像检索等能力的引入&＃xff0c;构建成了统一、通用的图像识别系统&＃xff1a;

这个通用图像识别系统中有3个核心模块&＃xff1a;

主体检测&＃xff1a;不同于一般的目标检测&＃xff0c;主体检测是将目标物体和背景区分开来&＃xff0c;能够有效减少干扰特征。PP-ShiTu中所采用的是目标检测模型PP-PicoDet&＃xff0c;不仅预测速度超快&＃xff0c;精度上也达到了SOTA&＃xff0c;为后续的准确识别打下坚实基础&＃xff1b;
特征提取&＃xff1a;作为图像识别系统的重点工作&＃xff0c;PP-ShiTu是采用CPU级轻量化骨干网络PP-LCNet&＃xff0c;并结合度量学习arcmargin算法&＃xff0c;对高相似物体的区分效果远超单一模型&＃xff0c;不仅准确率超越大模型ResNet50&＃xff0c;预测速度还能快3倍&＃xff01;再加上经过18w类数据集打磨的预训练权重&＃xff0c;不用再费心选择&＃xff0c;一个模型就可以实现多场景覆盖&＃xff01;
向量检索&＃xff1a;不同于单一模型直接输出类别信息&＃xff0c;对于未知类别只有模型重训一个选择&＃xff0c;耗时又耗力。PP-ShiTu引入向量检索&＃xff0c;通过计算目标物体和检索库中图像的相似度来输出类别信息&＃xff0c;一次训练长期使用&＃xff0c;高效又便捷。

目前整套系统已经在GitHub上开源发布&＃xff0c;并且引起开发者的广泛关注与应用。

华东理工大学的高材生颜鑫&＃xff0c;也是飞桨领航团的团长&＃xff0c;带领团队基于PP-ShiTu开发的这套智能购物平台系统&＃xff1a;通过图像即可精准识别顾客购买的商品&＃xff0c;并返回完整的购物清单及应付价格&＃xff0c;为智能货柜提供了非常好的视觉化解决方案&＃xff0c;同时对于商品识别中品类众多、外观相似和更新频繁的痛难点也提供了可参考的示范。

链接指路&＃xff1a;

https://github.com/thomas-yanxin/Smart_container

&＃xff08;欢迎⭐Star⭐收藏&＃xff0c;不易走丢哦&＃xff09;

不仅如此&＃xff0c;当系统有新商品增加时&＃xff0c;仅需打开手机小程序&＃xff0c;拍照更新检索库即可&＃xff0c;无需重新训练模型&＃xff0c;甚至一张图片就可以实现对新类别的识别&＃xff0c;还能随时随地对检索库中的类别进行管理。再也不用担心促销季、购物节跟不上脚步了&＃xff01;

其实商品识别的能力远不仅如此&＃xff0c;商超能够通过这项技术进行资产保护&＃xff0c;降低运营成本&＃xff1b;时尚行业能够通过这项技术&＃xff0c;完成对秀场服装的大数据分析&＃xff0c;把握时尚潮流&＃xff1b;服装行业可以通过商品识别快速匹配产品材质和生产工艺等相关信息&＃xff0c;大幅提升生产效率。

知“人”善用&＃xff0c;是提高战斗力的一大法宝&＃xff1b;同样&＃xff0c;将最先进的 AI 商品识别技术应用落地各行各业&＃xff0c;也能够带来很多赋能革新&＃xff0c;充分帮助 B 端客户提高效率、降低成本的同时&＃xff0c;也能优化 C 端客户的直接体验。未来&＃xff0c;从设计到生产、从物流到销售&＃xff0c;AI 商品识别&＃xff0c;大有可为&＃xff01;

如果您想详细了解更多飞桨的相关内容&＃xff0c;请参阅以下文档。

官网地址&＃xff1a;

https://www.paddlepaddle.org.cn

【PaddleClas】项目地址&＃xff1a;

GitHub:

https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee:

https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目&＃xff0c;还不赶紧给各位开发者一个Star&＃x1f31f;的鼓励&＃xff01;

附赠一个小彩蛋~

推荐阅读

小程序
【深度解析】当前人工智能企业的发展阶段与前景分析

近期，为编制《2018中国人工智能应用与生态研究报告》，中国软件网对国内人工智能产业的应用现状、平台建设和生态系统进行了深入调研。本报告详细分析了当前人工智能企业的发展阶段，并对其未来前景进行了全面评估。研究发现，人工智能技术在多个领域取得了显著进展，但同时也面临诸多挑战，如数据安全、技术成熟度和人才短缺等。报告还探讨了政策支持、行业合作和技术突破对推动人工智能产业发展的关键作用。 ... [详细]

蜡笔小新 2024-10-26 15:46:57
char
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
char
One Stage目标检测

在计算机视觉中，目标检测是一个难题。在大型项目中，首先需要先进行目标检测，得到对应类别和坐标后，才进行之后的各种分析。如人脸识别，通常是首先人脸检测，得到人脸的目标框，再对此目标框 ... [详细]

蜡笔小新 2024-09-25 10:55:17
char
微信小程序直播点赞功能及其工作原理分析

本文深入探讨了微信小程序直播中点赞动画的实现方法，特别是如何利用三阶贝塞尔曲线使点赞图标沿预设路径移动，以及相关的数学计算与代码实现。 ... [详细]

蜡笔小新 2024-11-24 11:47:54
jar
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
jar
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
jar
cs231n笔记（1）——KNN算法

图像分类：KNN算法（K—最近邻算法）一.定义定义：KNN是通过测量不同特征值之间的距离进行分类。它的的思路是ÿ ... [详细]

蜡笔小新 2024-10-25 13:32:41
jar
全连接神经网络应用于手写图像识别实践

2019独角兽企业重金招聘Python工程师标准转载于:https:my.oschina.netliyangkeb ... [详细]

蜡笔小新 2024-10-23 18:06:55
jar
【API 进阶之路】做 OCR 文字识别，谁说必须要有 AI 工程师？

摘要：有些功能还真不能光凭自己的直觉和认识，来自一线的声音才是最真实的用户需求。比方说名片录 ... [详细]

蜡笔小新 2024-10-11 19:18:19
jar
“编程能力差！90%输在了这点上！”谷歌开发：其实你们都是瞎努力

这是一个很难让人心平气和的年代。通过CSDN的帖子发现，很多人都想学人工智能，但总担心自己编程能力差，学不会，学不懂 ... [详细]

蜡笔小新 2024-10-09 15:28:17
char
[编程题] LeetCode上的Dynamic Programming(动态规划)类型的题目

继上次把backTracking的题目做了一下之后：backTracking，我把LeetCode的动态规划的题目又做了一下，还有几道比较难的Medium的题和Hard的题没做出来，后面会继续 ... [详细]

蜡笔小新 2024-11-26 14:31:10
char
Backup Exec 11d 初学者使用心得与技巧

随着企业应用程序的不断扩展，数据备份的需求日益增加。本文通过介绍Symantec Backup Exec 11d的实际应用体验，旨在为初学者提供一些实用的操作指南和建议。 ... [详细]

蜡笔小新 2024-11-26 10:48:27
char
LeetCode刷题指南：使用数组高效拼写单词

本文介绍了一道来自LeetCode的编程题——拼写单词。题目要求从给定的词汇表中找出可以由指定字母表中的字母拼写出的单词，并计算这些单词的总长度。文章将展示如何通过使用数组替代哈希表来提高算法的执行效率。 ... [详细]

蜡笔小新 2024-11-25 17:16:05
char
Git 使用技巧与常见问题解决方案

本文总结了在多人协作开发环境中使用 Git 时常见的问题及其解决方案，包括错误合并分支的处理、使用 SourceTree 查找问题提交、Git 自动生成的提交信息解释、删除远程仓库文件夹而不删除本地文件的方法、合并冲突时的注意事项以及如何将多个提交合并为一个。 ... [详细]

蜡笔小新 2024-11-24 17:16:37
web
MATLAB人体行为检测与识别

人体行为检测与识别摘要人体行为检测与识别是当前研究的重点，具有很高的研究价值和广阔的应用前景。主要应用在型人机交互、运动分析、智能监控和虚拟现实也称灵境技术ÿ ... [详细]

蜡笔小新 2024-10-20 19:34:31

诡道89_431

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章