热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

将AI融入大数据服务,「00后」企业百分点正在让机器进行智能决策

撰文|藤子「未来人类所有的决策都会不可避免地依赖机器。」百分点董事长兼CEO苏萌说。以汽车召回为例。中国是汽车拥有量最多的国家,国家质检总局缺陷产品管理中心会决定哪款

撰文 | 藤子


「未来人类所有的决策都会不可避免地依赖机器。」百分点董事长兼 CEO 苏萌说。


以汽车召回为例。中国是汽车拥有量最多的国家,国家质检总局缺陷产品管理中心会决定哪款汽车应该销毁。


然而,做汽车召回的决定并不容易。汽车召回对汽车厂家来说是致命性打击,需要慎之又慎。按照传统召回方法,每个季度,缺陷产品管理中心都需要通过会商制度召集专家,花费 2-3 天评比所有信息。比如,汽车的问题具体是什么,严重程度如何,故障率相比市场如何,是否有人恶意投诉等等。汽车拥有量大,信息太多,完全依靠人力,工作繁重且效率低下。


两年前,百分点开始为国家质检总局提供智能决策产品。按照传统方法,需要 15 人工作 200 小时,现在做出召回决策只需 1 人,花费 2 小时。苏萌介绍,两年以来,百分点智能决策产品处理了 1000 多起汽车召回案例,协助完成 5000 多万辆汽车召回。


百分点成立于 2009 年,是一家大数据技术与应用服务商,产品线涵盖大数据技术层的操作系统、管理层的用户画像标签管理系统和应用层的推荐引擎、分析引擎和营销引擎,创建了行业应用模型库和行业知识图谱库,客户涵盖金融、公共事务、智能制造等领域,如光大银行、新华社、华为等 2000 家企业。


以动态知识图谱技术为核心,百分点在 12 月 14 日发布行业 AI 决策系统 Deepmatrix,聚焦零售、制造、媒体、公安、政府决策等领域,为它们提供智能、快速、精确的AI决策。


知识图谱之上,智能决策还需要一系列工具


「要使 AI 能够进行决策,核心在于研究人如何做出决策。」百分点技术副总裁及首席架构师刘译璟说。在他看来,人做决策时,通常有三个步骤。首先是感知,比如感知环境,如宏大的宇宙,具象的美食,抑或是经济、人际关系、理论知识等。其次是认知,将感知综合成认识或知识。在这之上,再进行判断。


「基于数据,再加上 BI 和 AI 技术,希望我们的系统也能实现这样的功能。」刘译璟说。


具体来说,在认知环节,刘译璟认为,先要打造知识体系。而要打造知识体系,就要抛弃技术化的数据,比如数据库的表、字段、数据的类型、结构、编码等,因为业务人员很难理解,也不需要关心,他们只需要关心指标和维度即可。


但刘译璟认为,人的知识是模糊的,比如某一个人好像喜欢某样东西,好像这一词就表明了模糊性。因此需要将模糊的概念加上概率值,反映到知识体系中,使整个知识体系与现实世界更加接近。由此,细致地描绘现实中的业务知识,使业务人员能够直接查看业务中的关键要素,在这些业务知识上讨论自己的业务问题。


光有知识还不够,刘译璟认为还需要动态的知识图谱。「我们希望在一个数据化的知识图谱里把现实中的行动、相互的关系都能够表现出来。」刘译璟举例,比如线上的交易行为、移动支付的行为、社交关系等,如何表现出来?这就需要动态知识图谱技术。


「知识图谱是数据体系,动态知识图谱是我们自己的技术。无论是现实世界的数据,比如人的行为,还是机器产生的数据,我们都会统一通过数据融合,使它们成为同一种数据结构,同一种语义的数据。再输入动态知识图谱,通过整体映射,将现实世界转化成数据化的知识。」刘译璟介绍具体的做法。


此外,百分点在所有知识里都加入时间、空间维度,借此从多个角度、维度观察现实世界,由于内置了时间和空间知识,因此也能进行时间序列分析和地理位置分析,挖掘事物相互的关系,以及潜在的业务含义,进行推断,并作出预测。刘译璟介绍,这些基于动态知识图谱的技术同样会应用于 DeepMatrix。


应用动态知识图谱有着明显的好处。想要形成新的知识,并不需要从最底层开始,进行数据处理和融合,只需修改本体映射即可。「每一个关系、标签、属性,都有一个概率值,所以我们能做动态推论,哪怕有一些关系或者属性在最初阶段没有设计到这个系统,通过动态推断,也能了解到这些实体之间应该有什么样的关系,具备什么样的属性。」刘译璟说,「由于内置了时间和空间,也可以动态地看待每个实体、每个概念。」


如果只有知识并不足以支撑整个智能决策。在知识图谱之上,还需要系列决策工具,比如通过搜索,直接搜索现实世界,对现实世界中的关系网络、实体快速进行统计分析。


DeepMatrix 作为一个行业决策系统,如何将技术应用于行业,刘译璟表示,他们会将行业领域业务专家的知识输入业务模型,再整体输入DeepMatrix。刘译璟认为,这些都是 DeepMatrix 拥有智能决策能力的基础。


安全分析、政府决策、全媒体服务、智能营销、智能制造,DeepMatrix 具有五大应用场景


沿袭百分点以往将产品做成整体解决方案的思路,DeepMatrix 同样是一个整体解决方案,在架构上分为三层,最底层是大数据操作系统,负责所有数据的接入、处理等。中间是百分点自主研发的智能认知引擎,应用了智能交互、自然语言处理、智能标签、动态知识图谱等技术。最上层是各个子系统,比如安全分析、政府决策、全媒体服务、智能营销、智能制造。


百分点智能安全分析系统 Deep Finder,将客户的所有数据接入大数据平台,通过动态知识图谱的技术构建出知识,在知识之上构建客户能使用的前端系统,比如搜索、分析、风险识别等。此外,还构建内容、模型管理等后台管理系统,用于公共安全领域,比如反恐、安防等。


举个例子,如果搜索「今天十二点在安贞桥通过的白色别克车」,系统会通过自然语言理解翻译成直接的语句,分析这个时间、这个地点交通卡口的车牌号以及车牌号对应的属性。搜索结果的呈现方式也与普通 2C 搜索引擎不同,如果搜索一辆车,呈现方式就是一辆车,如果搜索一个人,呈现方式也是一个人。


然而,现实世界错综复杂,任何物体在现实世界中都相互联系,为了应对这种情况,Deep Finder 会把个体置于整个关系网络分析,相比简单分析亲属关系,Deep Finder 更关注「两个人通电话」或者「发生了资金转账」,通过这种隐秘的数据将两人进行联系。同时,也会将个体和关系置于历史和空间中进行分析,清晰地知道何时、何地,何人做了何事,他与何人有何种关系,那人又会做何事。通过交互式的分析,以此还原现实世界,让分析人员快速了解现实世界。


百分点集团研发总监黄伟认为,通过搜索入口和分析工具,虽然能够进行事后分析,快速抓取线索。但是,与其事后抓到线索,不如去预防。这就需要所有的数据,机器智能就派上了用场。


黄伟介绍,使用规则引擎,他们将客户、分析人员的宝贵经验输入系统,让系统处理重复性工作,提高效率。再通过推理引擎实现基于知识图谱之上的推理。比如,查找「爷爷」,系统就会了解查找的是「爸爸的爸爸」。此外,还能基于现实世界,进行物理性的推理,比如某个物体在某个时间点只能出现在一个地方,不然这个人就不是同一个人。


「我们还能通过机器学习引擎,使用业务累计的标注数据,搭建预测模型,让机器根据这些数据,分辨出什么样的人具有什么样的高危概率,从而进行预防。」黄伟说。


百分点智能政府决策系统 Deep Governor 的架构同样有三个层次。底层是统一的数据管理平台,中间层是使用大数据和动态知识图谱、自然语言处理、商业建模等人工智能技术构建的支撑服务层。最上层是系统应用层,涵盖包括模型管理、指标管理、报表管理的基础应用,在基础应用上则是涵盖人口规划、国家宏观发展规划、区域发展规划等决策应用。


而支撑这些应用的是大量行业专家的决策知识和 6 大类 50 余种社会经济发展的综合决策模型,前者涵盖人口学、经济学、社会学等多个学科,后者包括系统动力学模型、微观仿真模型、资源供需分析模型、GIS 多重置叠模型等。


最终,这些宏观的数据以及关系到决策的重要因素,用可视化、实时交互的方式展现在技术图层上,进行政府决策模拟并比对调整后的效果。


百分点智能全媒体服务系统 Deep Editor 包括内容生产、内容传播和用户经营三个部分。最底层是全媒体的资产服务管理,支撑全媒体全流程的媒体资源的自动化管理和使用。中间层则是基于当前阶段不同时段媒体的影响力,让机器去决策、规划出适合当前的传播策略。然后是全生命周期的用户画像和经营系统,基于多渠道的信息聚合形成全面的用户画像。


百分点智能营销系统 Deep Creator 同样具有三大特征。


如今,消费者的行为非常碎片化,它既可能出现在线下门店,也可能出现在电商平台、微信端的语音电话,如何打通多渠道的多元异构的数据,形成实时的、动态的消费者标签,深刻理解消费者的行为和偏好,Deep Creator 则能通过深度自学习对消费者进行准确认知。


「我们基于 GPU 的高性能的算法,自动提取消费者的超高维的行为特征,同时将业务的规则和经验作为 AI 学习的边界,减少 AI 学习的负担,提升 AI 学习的效率。所以,建立动态的消费者知识图谱是一件 BEYOND AI 的事情。」百分点首席数据科学家杜晓梦说。


杜晓梦介绍,未来营销人主要的工作在于构建各种不同的营销场景,例如获客场景、客户活跃的场景、客户流失的场景、转化的场景和传播的场景,Deep Creator 则用 BI 构建场景,AI 自主学习进行决策判断。


同时,基于捕捉的消费者实时行为,系统会进行场景化判断,决定在什么样的场景下,用人工智能进行主动互动,什么样的场景通过短信,什么样的场景通过邮件触发,什么样的场景需要人来实时和消费者进行互动。此外,系统还会把所有的营销流量进行随机分流,从而测试不同的营销互动的策略的有效性。「这些都是 Deep Creator 自主决策的结果。」杜晓梦说。


智能制造大数据系统 Deep Sensor 则是针对制造行业,对各种设备进行全生命周期实时管理,利用数据分析实现实时设备健康预警等智能化远程运维。





推荐阅读
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • 数字账号安全与数据资产问题的研究及解决方案
    本文研究了数字账号安全与数据资产问题,并提出了解决方案。近期,大量QQ账号被盗事件引起了广泛关注。欺诈者对数字账号的价值认识超过了账号主人,因此他们不断攻击和盗用账号。然而,平台和账号主人对账号安全问题的态度不正确,只有用户自身意识到问题的严重性并采取行动,才能推动平台优先解决这些问题。本文旨在提醒用户关注账号安全,并呼吁平台承担起更多的责任。令牌云团队对此进行了长期深入的研究,并提出了相应的解决方案。 ... [详细]
  • GAMETECH腾讯云游戏行业技术沙龙成都站圆满落幕
    11月13日,由腾讯云主办、游戏茶馆协办的2020年首场GAME-TECH腾讯云游戏行业技术沙龙在成都圆满落幕。本次沙龙邀请了腾讯云游戏行业解决方案总监宋永周、腾讯云游戏行业高级解决方案架构师曾梓恩、腾讯云游戏行业高级产品架构师郑晓曦、腾讯云游戏行业高级解决方案架构师温球良和天美L1(王者荣耀)服务器技术副总监杨光,为参会同行们带来了干货满满的技术建议。本文介绍了腾讯云游戏云的优势和为不同游戏研运场景提供的服务。腾讯云在中国游戏云服务市场领跑,成为众多游戏开发者的合作伙伴。 ... [详细]
  • 本文介绍了iOS开发中检测和解决内存泄漏的方法,包括静态分析、使用instruments检查内存泄漏以及代码测试等。同时还介绍了最能挣钱的行业,包括互联网行业、娱乐行业、教育行业、智能行业和老年服务行业,并提供了选行业的技巧。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 从Oracle安全移植到国产达梦数据库的DBA实践与攻略
    随着我国对信息安全和自主可控技术的重视,国产数据库在党政机关、军队和大型央企等行业中得到了快速应用。本文介绍了如何降低从Oracle到国产达梦数据库的技术门槛,保障用户现有业务系统投资。具体包括分析待移植系统、确定移植对象、数据迁移、PL/SQL移植、校验移植结果以及应用系统的测试和优化等步骤。同时提供了移植攻略,包括待移植系统分析和准备移植环境的方法。通过本文的实践与攻略,DBA可以更好地完成Oracle安全移植到国产达梦数据库的工作。 ... [详细]
  • 云原生应用最佳开发实践之十二原则(12factor)
    目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]
  • 杭州PHP大厂有哪些(2023年最新分享)
    导读:今天编程笔记来给各位分享关于杭州PHP大厂有哪些的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: ... [详细]
  • AI行业的下一个风口是医疗?创业者们这样说
    ▼点击上方蓝字关注网易智能为你解读AI领域大公司大事件,新观点新应用编者按:4月10日,鲸准AI产业价值峰会在北京举行。本次大会除了邀请A ... [详细]
author-avatar
你问什么只为她停留_538
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有