热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

10分钟搭建商品结算平台!商品、车辆识别一网打尽

关注公众号,发现CV技术之美商品识别、人脸识别、以图搜图有什么难?这个在Github上狂圈Star3100的项目就能轻松帮你实现࿰

关注公众号,发现CV技术之美

"商品识别"、"人脸识别"、"以图搜图"有什么难?这个在Github上狂圈Star 3100+的项目就能轻松帮你实现!

它就是全开源、轻量级的图像识别系统PP-ShiTu。它不仅带有十万类物品的特征信息,可以实时准确地识别出目标的品类规格商标颜色等属性信息,而且单张图片用CPU处理仅需0.2s!在出现新品类的时候,不需要重新训练系统,补充检索库即可快速扩充识别范围,高效易用,全民友好!

话不多说!直接传送门:

https://github.com/PaddlePaddle/PaddleClas

记得Star收藏支持开源项目,也防止走丢哦!

00e6cdf8c351c64e9ecf44c5f2989060.gif

不过说来容易,现实中的图像识别任务真有这么简单么?当然不是,一个优秀的图像识别系统往往在处理实际场景问题过程中需要面临各种挑战:

1.商品类别数以万计:根本没法事先把所有类别都放入训练集;

2.不同商品相似度极高:比如同一种饮料的不同口味,就很可能拥有非常类似的包装。而且即便对于同一件商品,在不同情况下所获得的商品图像都往往存在相当大的差异;

3.品类更新极快:像新零售这种行业,新品几乎都是按小时级别在更新,每增加新的产品都要辛辛苦苦重新训练模型,仅靠单一模型想要跟上步伐,着实望尘莫及。

254d592c29a28d9b85efe9012f15ce58.png

当然这些产业难点也从另一个角度说明了PP-ShiTu图像识别系统的能力,它不仅有高水平的特征学习能力,对新出现的产品也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。

f103f33d4082b0a7822a983e8244d7ee.gif

这样的特殊能力,得益于PP-ShiTu对度量学习、图像检索等能力的引入,构建成了统一、通用的图像识别系统:

335d9c59f298b93cdd4b97cd6bd05995.png

这个通用图像识别系统中有3个核心模块:

  • 主体检测:不同于一般的目标检测,主体检测是将目标物体和背景区分开来,能够有效减少干扰特征。PP-ShiTu中所采用的是目标检测模型PP-PicoDet,不仅预测速度超快,精度上也达到了SOTA,为后续的准确识别打下坚实基础;

  • 特征提取:作为图像识别系统的重点工作,PP-ShiTu是采用CPU级轻量化骨干网络PP-LCNet,并结合度量学习arcmargin算法,对高相似物体的区分效果远超单一模型,不仅准确率超越大模型ResNet50,预测速度还能快3倍!再加上经过18w类数据集打磨的预训练权重,不用再费心选择,一个模型就可以实现多场景覆盖!

  • 向量检索:不同于单一模型直接输出类别信息,对于未知类别只有模型重训一个选择,耗时又耗力。PP-ShiTu引入向量检索,通过计算目标物体和检索库中图像的相似度来输出类别信息,一次训练长期使用,高效又便捷。

827e8a0a517f09c085fd5712e0692811.png

目前整套系统已经在GitHub上开源发布,并且引起开发者的广泛关注与应用。

华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于PP-ShiTu开发的这套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案,同时对于商品识别中品类众多、外观相似和更新频繁的痛难点也提供了可参考的示范。

d435239d3242140a886fe35f4d17fe69.png

链接指路:

https://github.com/thomas-yanxin/Smart_container

(欢迎⭐Star⭐收藏,不易走丢哦)

不仅如此,当系统有新商品增加时,仅需打开手机小程序,拍照更新检索库即可,无需重新训练模型,甚至一张图片就可以实现对新类别的识别,还能随时随地对检索库中的类别进行管理。再也不用担心促销季、购物节跟不上脚步了!

441980641de1111afc6eee5165a513b8.png

其实商品识别的能力远不仅如此,商超能够通过这项技术进行资产保护,降低运营成本;时尚行业能够通过这项技术,完成对秀场服装的大数据分析,把握时尚潮流;服装行业可以通过商品识别快速匹配产品材质和生产工艺等相关信息,大幅提升生产效率。

知“人”善用,是提高战斗力的一大法宝;同样,将最先进的 AI 商品识别技术应用落地各行各业,也能够带来很多赋能革新,充分帮助 B 端客户提高效率、降低成本的同时,也能优化 C 端客户的直接体验。未来,从设计到生产、从物流到销售,AI 商品识别,大有可为!

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

官网地址:

https://www.paddlepaddle.org.cn

【PaddleClas】项目地址:

GitHub: 

https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee: 

https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目,还不赶紧给各位开发者一个Star🌟的鼓励!

附赠一个小彩蛋~f93bf3cf87324d055773d254faf8aa65.png



推荐阅读
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 校园表白墙微信小程序,校园小情书、告白墙、论坛,大学表白墙搭建教程
    小程序的名字必须和你微信注册的名称一模一样在后台注册好小程序。mp.wx-union.cn后台域名https。mp.wx-union.cn ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • Google Play推出全新的应用内评价API,帮助开发者获取更多优质用户反馈。用户每天在Google Play上发表数百万条评论,这有助于开发者了解用户喜好和改进需求。开发者可以选择在适当的时间请求用户撰写评论,以获得全面而有用的反馈。全新应用内评价功能让用户无需返回应用详情页面即可发表评论,提升用户体验。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • EzPP 0.2发布,新增YAML布局渲染功能
    EzPP发布了0.2.1版本,新增了YAML布局渲染功能,可以将YAML文件渲染为图片,并且可以复用YAML作为模版,通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片,让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子,介绍了使用ezpp的基本渲染方法,以及如何使用canvas、text类元素、自定义字体等。 ... [详细]
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • Android源码中的Builder模式及其作用
    本文主要解释了什么是Builder模式以及其作用,并结合Android源码来分析Builder模式的实现。Builder模式是将产品的设计、表示和构建进行分离,通过引入建造者角色,简化了构建复杂产品的流程,并且使得产品的构建可以灵活适应变化。使用Builder模式可以解决开发者需要关注产品表示和构建步骤的问题,并且当构建流程发生变化时,无需修改代码即可适配新的构建流程。 ... [详细]
  • 本文介绍了JavaScript进化到TypeScript的历史和背景,解释了TypeScript相对于JavaScript的优势和特点。作者分享了自己对TypeScript的观察和认识,并提到了在项目开发中使用TypeScript的好处。最后,作者表示对TypeScript进行尝试和探索的态度。 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 今天凌晨开始苹果正式开始了iOS10的推送工作,使用iPhone和iPad的用户可 ... [详细]
  • 基于深度学习的遥感应用
    文章目录深度学习的发展过程深度学习在遥感中的应用基于深度学习的遥感样例库建设基于深度学习的遥感影像目标及场景检索基于深度学习的建筑物提取基于深度学习的密集建筑物自动检测基于深度学习 ... [详细]
author-avatar
诡道89_431
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有