热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Informatica神秘讲师首秀:AI驱动的产品数据黑科技

新冠肺炎疫情依旧严峻,在这场生死时速的战“疫”中,人工智能成为一股不可或缺的力量。近日,在武汉市的各家医院里陆续出现了一批特殊的“工作人员”——机器人,它们灵活地穿梭在医院的隔离区

新冠肺炎疫情依旧严峻,在这场生死时速的战“疫”中,人工智能成为一股不可或缺的力量。近日,在武汉市的各家医院里陆续出现了一批特殊的“工作人员”——机器人,它们灵活地穿梭在医院的隔离区,担负起为医护人员与患者送餐、送药的职责。不仅降低了医护人员被感染的风险,同时也提高了配送效率,节约了一次性防护用品。

 

在我们身边,人工智能也无处不在。“拿了就走”的Amazon Go、迎宾和导购机器人、智能穿衣镜、货架监测和管理机器人、送Pizza的无人车……在炫酷黑科技的背后,是数字化时代中从生产制造到物流配送、从仓储分拨到终端零售等各环节向着全渠道营销和提升客户体验的不断迈进。

 

传统的信息化系统大都是基于单一目的而建立,例如之前建立的供应链管理、企业资源管理、生产计划管理、客户关系管理等难以满足数字化时代对数据丰富度的要求,形成巨大的数据鸿沟,选择通过人工智能技术驱动的产品信息管理,才能帮助企业更好地采集数据、实现数据标准化、增强数据丰富程度、对产品数据进行分类发布,最终真正实现全渠道管理。

 

Informatica数据管理专家——数博士硬核登场,与你相约【Informatica云课堂】,带来首秀——《AI驱动的下一代智能产品信息管理》。

 

 

以下是云课堂内容的精彩回顾

▼▼▼

01

机器学习:我读故我在

 

人工智能的读和思是指对自然语言的处理和机器学习。其中自然语言处理,包括文本生成、内容抽取、话题分类和机器翻译。而机器学习则可以分为监督学习、无监督学习和深度学习。

 

机器学习不同于人。人类通常从他人或自身经验里学习,获得知识;而机器却机械遵循发给它们的指令。他们需要通过编程、训练才能完成工作。而机器学习则把两样东西紧密的结合在一起,它通过数据来学习。准确可信的数据是机器学习成功的关键。

 

对于有监督学习,你必须把一些特性和属性结合起来——应用这些数据建模并不断采用分类和回归的方法来训练这个模型;而对于无监督学习,你需要借助降维和聚类的方法,找到数据中存在的某些相似性。

 

人工智能在自然语言中的处理是我们非常常见的。不论是亚马逊的Echo智能音箱,或者小度智能音箱,或是苹果的SIRI语音助手,它们都运用了自然语言处理技术。例如你可以直接用日常交流所用的语言提问:最大的动物是什么?

 

这时候那些自然语言处理程序就会研究拆解刚才说的句子,试图从中获得元信息。例如“最大的动物是什么”这个问题。首先句子里有一个特定的维度:最大的;还有一个名词:动物。收集到这些信息后,他们会连入Google或百度,搜索相应的答案,再把答案返回给你。

 

 

不同于机器学习,自然语言处理主要不是训练数据,而是直接对语言进行解析,这要复杂的多。当你将所有的短语从句子中抽取出来,进行自然语言处理时,解析树就形成了。机器学习通过解析树来提取出元信息,进而理解句子的真正含义。

 

02

AI驱动的产品信息管理

 

机器学习与自然语言处理在产品信息管理中有许多应用,常见的包括:分类、属性提取、属性创建以及图像分类:

 

▼ 

产品分类

机器学习可以帮助一家拥有海量SKU的零售商进行产品分类,例如将一台拥有复杂配置信息的笔记本电脑分类到各类目录中去。

 

不过,为了能够使用机器学习来帮助分类,我们需要准备和创建大量的训练数据,即标签的数据。在准备每个类别的训练数据后,就可以使用朴素贝叶斯算法将这个特定的产品进行分类,归到多个层次结构中的某个特定的类别里。其背后的逻辑在于对大量的文本进行分类、匹配、比较:统计出不同的单词在文本中出现的频次,进而得到数据字典。通过机器学习,系统会发现某段文本和“笔记本电脑”这个类别100%匹配,和“配件”这个类别是30%的匹配度。通过这样的训练数据,以后就可以基于类似的文本数据,自动实现产品的分类。

 

在实际应用场景中,有些客户每天会收到一万多种产品,并且品种会不断的变化。通过采用包含AI技术的Informatica PIM解决方案,他们的效率提升了80%到90%。这就是AI在产品分类中的价值。

 

▼ 

属性提取

机器学习可以采用自然语言处理算法来解析文本,识别文本中包含的产品特征,比如这里的型号、CPU、内存等特征,然后将这些特征与库里的“笔记本电脑”这个产品类别进行匹配,自动获得这些信息。

 

对零售商来说这尤其有用,许多零售商内部系统有很好的产品数据,需要手工从其中提取所有不同的特性,进行简单的复制粘贴操作。

 

自然语言处理算法可以解析文本,识别文本中包含的产品特征,比如这里的型号、CPU、内存等特征,然后将这些特征与库里的“笔记本电脑”这个产品类别进行匹配,自动获得信息。此外,还可以通过标准化,对提取的特征值进行规范和补充,确保内部数据的一致性。

 

▼ 

属性创建

基于属性提取我们已经将一台笔记本分门别类,并获得了型号、CPU、内存、硬盘等各种信息。此外还能做什么呢?如何在现有的信息基础上进一步丰富产品信息?这时候K-Nearest Neighbor(kNN)算法就可以大显身手了。

 

仍以笔记本电脑为例。在“笔记本电脑”这个类别里,还可以从其它类似的产品中得到一些附加属性,比如电池待机时长、保修期,或者电商分类。然后根据这些不同属性和属性值进行统计。在这里例子里,可以看到几个频数较高的属性:比如83.3%的产品电池待机时长是六个小时;83.3%的产品提供两年的保修期;100%的电商分类是“笔记本电脑”。

 

这些从类似产品上获得的额外信息,可以成为非常有用的采购决策判断。

 

▼ 

图像分类

机器学习可以帮助一家拥有海量SKU的零售商进

通过从供应商那里获得一张笔记本电脑图片,借助现有的工具,我们可以对许多标签进行分类统计,比如有96%的匹配度是笔记本电脑,90%的匹配是科技,90%的匹配是黑色的。这些标签都是基于机器学习算法自动创建的。在PIM中,可以利用这些技术处理来自不同供应商的不同产品。

 

除此之外,自然语言处理与机器学习还能用于采用自然语言生成(NPG)生成文本、使用聚类法查找产品中的差异、寻找交叉销售和增值销售机会,以及基于内容或销售数据自动生成SEO关键字等领域。

 

03

Informatica PIM提升全渠道体验

 

基于Informatica的AI引擎Claire,构建在智能数据平台之上,Informatica的下一代PIM解决方案将化解诸多产品信息管理过程中所面临的挑战:

● 产品数据的多样性和不均衡性,以及参差不齐的数据质量。

● 每位客户都有独特的品类结构和特征集。

● 自然语言的描述中,产品描述遵循不同的语法规则。

● 产品数据或许要有多个不同的语言版本。

● ……

AI驱动的下一代智能产品信息管理

 

产品数据通过供应商、业务用户等多项来源,形成产品数据的中央仓库,为企业内外需要运用产品数据的部门提供了一个智能平台,包括电子商务、数字化营销、产品管理、类别管理、采购等各个部门,以及外部的供应商和合作伙伴。

 

通过PIM解决方案,各部门与内外部合作伙伴可以更方便的协作,丰富产品的信息,为电商网站、第三方平台、产品目录、社交媒体、线下零售等前端各种销售和市场渠道提供更好的支持。

 

帮助业务用户以可信、丰富和相关的产品数据做好产品信息管理,实现和内外部伙伴的高效协作,Informatica PIM将致力于提升全渠道的产品体验。

 

 

 

Informatica是PIM解决方案的行业领导者

 

 

 

《2020 年 Gartner 主数据管理解决方案魔力象限报告》是 Gartner 第四次发布该报告,也是Informatica 第四次在前瞻性和执行力方面均位居首位。

 

而在IDC MarketScape报告中,Informatica同样收获肯定,报告中所提及的Informatica优势如下:

 

● 技术集成:当被问及与外部系统(如ERP、CRM和数字商务)建立技术集成有多容易时,受访客户对Informatica的评价均高于平均水平。

 

● 数据管理专业知识:Informatica在数据管理领域有很强的影响力,这是其PIM方法的支柱。

 

● 人工智能战略:受访客户认为Informatica的人工智能/自动化战略远远高于市场平均水平。该公司的CLAIRE人工智能产品旨在实现PIM特定用例的自动化。

 

该报告还向客户指出:“当您寻找在市场上具有长期业绩的企业级PIM产品、智能数据平台、混合业务模式、广泛的全球PIM/MDM生态系统和本地支持时,推荐考虑Informatica。”

 

Informatica PIM解决方案已在全球 2,000 多家企业成功实施,使许多大型企业及著名品牌能够进行更为智能高效的产品信息管理。在未来,Informatica还将继续基于数据治理,在AI持续发力,助力更多企业迈向数字化转型的成功。

想了解更多相信信息,请关注Informatica数据管理(微信号:InformaticaChina)


推荐阅读
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 杭州PHP大厂有哪些(2023年最新分享)
    导读:今天编程笔记来给各位分享关于杭州PHP大厂有哪些的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 解决Cydia数据库错误:could not open file /var/lib/dpkg/status 的方法
    本文介绍了解决iOS系统中Cydia数据库错误的方法。通过使用苹果电脑上的Impactor工具和NewTerm软件,以及ifunbox工具和终端命令,可以解决该问题。具体步骤包括下载所需工具、连接手机到电脑、安装NewTerm、下载ifunbox并注册Dropbox账号、下载并解压lib.zip文件、将lib文件夹拖入Books文件夹中,并将lib文件夹拷贝到/var/目录下。以上方法适用于已经越狱且出现Cydia数据库错误的iPhone手机。 ... [详细]
  • Go语言实现堆排序的详细教程
    本文主要介绍了Go语言实现堆排序的详细教程,包括大根堆的定义和完全二叉树的概念。通过图解和算法描述,详细介绍了堆排序的实现过程。堆排序是一种效率很高的排序算法,时间复杂度为O(nlgn)。阅读本文大约需要15分钟。 ... [详细]
  • 本文介绍了前端人员必须知道的三个问题,即前端都做哪些事、前端都需要哪些技术,以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外,还介绍了一些后端服务,如Node.js。 ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
  • mui框架offcanvas侧滑超出部分隐藏无法滚动如何解决
    web前端|js教程off-canvas,部分,超出web前端-js教程mui框架中off-canvas侧滑的一个缺点就是无法出现滚动条,因为它主要用途是设置类似于qq界面的那种格 ... [详细]
  • 求职屡屡碰壁,埋头苦学5个月斩获16000元offer,终于懂了没有人能随随便便成功
    求职屡屡碰壁,埋头苦学5个月斩获16000元offer,终于懂了没有人能随随便便成功-我以前一直认为,只要有耐心,有决心,有信心,就可以在社会上立足,干出一番事业。但是经历了社会的 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
author-avatar
xaony23625
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有