关注公众号,发现CV技术之美
"商品识别"、"人脸识别"、"以图搜图"有什么难?这个在Github上狂圈Star 3100+的项目就能轻松帮你实现!
它就是全开源、轻量级的图像识别系统PP-ShiTu。它不仅带有十万类物品的特征信息,可以实时、准确地识别出目标的品类、规格、商标、颜色等属性信息,而且单张图片用CPU处理仅需0.2s!在出现新品类的时候,不需要重新训练系统,补充检索库即可快速扩充识别范围,高效易用,全民友好!
话不多说!直接传送门:
https://github.com/PaddlePaddle/PaddleClas
记得Star收藏支持开源项目,也防止走丢哦!
不过说来容易,现实中的图像识别任务真有这么简单么?当然不是,一个优秀的图像识别系统往往在处理实际场景问题过程中需要面临各种挑战:
1.商品类别数以万计:根本没法事先把所有类别都放入训练集;
2.不同商品相似度极高:比如同一种饮料的不同口味,就很可能拥有非常类似的包装。而且即便对于同一件商品,在不同情况下所获得的商品图像都往往存在相当大的差异;
3.品类更新极快:像新零售这种行业,新品几乎都是按小时级别在更新,每增加新的产品都要辛辛苦苦重新训练模型,仅靠单一模型想要跟上步伐,着实望尘莫及。
当然这些产业难点也从另一个角度说明了PP-ShiTu图像识别系统的能力,它不仅有高水平的特征学习能力,对新出现的产品也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。
这样的特殊能力,得益于PP-ShiTu对度量学习、图像检索等能力的引入,构建成了统一、通用的图像识别系统:
这个通用图像识别系统中有3个核心模块:
主体检测:不同于一般的目标检测,主体检测是将目标物体和背景区分开来,能够有效减少干扰特征。PP-ShiTu中所采用的是目标检测模型PP-PicoDet,不仅预测速度超快,精度上也达到了SOTA,为后续的准确识别打下坚实基础;
特征提取:作为图像识别系统的重点工作,PP-ShiTu是采用CPU级轻量化骨干网络PP-LCNet,并结合度量学习arcmargin算法,对高相似物体的区分效果远超单一模型,不仅准确率超越大模型ResNet50,预测速度还能快3倍!再加上经过18w类数据集打磨的预训练权重,不用再费心选择,一个模型就可以实现多场景覆盖!
向量检索:不同于单一模型直接输出类别信息,对于未知类别只有模型重训一个选择,耗时又耗力。PP-ShiTu引入向量检索,通过计算目标物体和检索库中图像的相似度来输出类别信息,一次训练长期使用,高效又便捷。
目前整套系统已经在GitHub上开源发布,并且引起开发者的广泛关注与应用。
华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于PP-ShiTu开发的这套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案,同时对于商品识别中品类众多、外观相似和更新频繁的痛难点也提供了可参考的示范。
链接指路:
https://github.com/thomas-yanxin/Smart_container
(欢迎⭐Star⭐收藏,不易走丢哦)
不仅如此,当系统有新商品增加时,仅需打开手机小程序,拍照更新检索库即可,无需重新训练模型,甚至一张图片就可以实现对新类别的识别,还能随时随地对检索库中的类别进行管理。再也不用担心促销季、购物节跟不上脚步了!
其实商品识别的能力远不仅如此,商超能够通过这项技术进行资产保护,降低运营成本;时尚行业能够通过这项技术,完成对秀场服装的大数据分析,把握时尚潮流;服装行业可以通过商品识别快速匹配产品材质和生产工艺等相关信息,大幅提升生产效率。
知“人”善用,是提高战斗力的一大法宝;同样,将最先进的 AI 商品识别技术应用落地各行各业,也能够带来很多赋能革新,充分帮助 B 端客户提高效率、降低成本的同时,也能优化 C 端客户的直接体验。未来,从设计到生产、从物流到销售,AI 商品识别,大有可为!
如果您想详细了解更多飞桨的相关内容,请参阅以下文档。
官网地址:
https://www.paddlepaddle.org.cn
【PaddleClas】项目地址:
GitHub:
https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3
Gitee:
https://gitee.com/paddlepaddle/PaddleClas
这么强大、用心的项目,还不赶紧给各位开发者一个Star🌟的鼓励!
附赠一个小彩蛋~