在很多学者的自传中,他们都会将科学描述成一座“迷宫”,而自己则是在迷宫中寻路的孩童。实际上迷宫不仅仅存在于科研之中,产业、文化、艺术的发展也是一样。寻路者们总是在无数限制与困局中,找到抵达目的地的出路。人类这一物种对于发展与探索的天然向往,驱使着我们不断向前行走。
正如同今天的AI,同样也像是一座迷宫,我们在技术的起点,渴望走出迷宫到达产业升级的出口。在过去几年中,我们见证了无数人踏上了迷宫寻路之旅。其中提出了“全栈全场景”的华为云,就是一个典型的“寻路者”。
在过去一年中,华为云用昇腾系列处理器搭建的底盘,融汇输出的AI、计算、存储能力,以及针对开发者打造的一站式AI开发与管理平台ModeArts和AI开发应用平台HiLens。似乎正在从混乱的迷墙与拐角中寻找到一条通向产业未来的通路。如今在华为开发者大会2020(Cloud)即将召开之际,我们可以再次审视华为云在这座巨大迷宫中画出的线路,以及产业参与者如何在其中找到出口。
入口背后的岔口:产业AI迷宫拔地而起
一座迷宫是如何建成的?
那些供人欣赏玩乐的迷宫,是被规划、被设计、被建造而成。但阻挡在我们与产业升级之前的“产业迷宫”,确实经由无数现实因素累积而成。想要真正实现产业AI化,首先要弄清楚的问题的是,究竟是什么困住了我们?
AI技术的诞生,存在于一个个被规划好的数据集中。可我们最终的目的,是让AI在工厂、机场、火车站、教室等等现实场景中发挥作用,真实地改变人类生活的轨迹。说起AI应用的条件,相信很多朋友都能像背课文一样说出那“老三样”:算力、大数据、算法。可真正着手对产业进行改造时,却发现口号式的解决逻辑并没有带来切实的解决方案。实验室外的真实世界,往往能在每一条应用基础上分化出无数岔路,这些岔路又彼此交集,最终构成了一座迷宫。
整理过往的产业AI化案例,我们可以看到这座迷宫中各种曲折的路线。比如有团队想制作一款识别航空器的AI产品,用来防止飞机跑道被入侵,却发现面对这一小众化的需求,必须从头开始在开源社区里寻找技术、搭建环境、调优算法。又比如一家AI教育企业,累积了大量语音素材想要训练口语识别模型,却发现想要进一步提升模型的准确度,还需要应用上更困难的,结合了语音和视觉的多模态识别能力。
当AI越深入产业,我们就越会发现,看似老三样解决一切的背后,是场景的个性化与琐碎化,技术成长与企业人才成长的断层,以及常常出现的反复调试和重复开发。这些问题不被解决,产业AI就会一直在迷宫深处兜兜转转——对于产业端口来说,如果有什么比没有应用AI更可怕,相信一定是低估了部署AI的难度,耗费大量技术升级成本却没有得到想要的结果。
但在上述那些案例的背后,这些深入AI迷宫的人全都找到了出口,拥抱了产业AI的未来。聆听他们与寻路者之间的故事,或许能够帮助我们找到产业AI迷宫的破局之道。
破壁、清障、助跑:
华为云画下一条直线
作为迷宫寻路者的科技企业们,其实已经在迷宫里挂满了“路标”。他们向产业开放了算力与计算平台,也在把自己的技术能力打造成易用的API接口,试图覆盖的产业的需求。能够指明方向、写下标识,可以说是成为寻路者基础条件。但仅仅满足基础条件,是远远不足够带产业走到出口的。
在面对真实应用场景时,我们需要意识到两点。
第一, 产业参与者分配给迷宫的时间是有限的。作为总是与科技迷宫打交道的科技企业们,可以花大把的时间与金钱成本在迷宫探索之中,但作为想要利用AI技术产业,他们的核心目标永远是降本增效,用最短路线抵达出口而非浏览迷宫中的景色。
产业参与者在迷宫中行进的效率是不确定的。AI能与各行各业结合的B面,本应是各行各业都可以应用AI。但对于一些小微企业或传统企业来说,他们在开发能力上的零储备和成本上的限制,必然会让他们处处碰壁。或许还没走到路标指向的下一个路口,就已经筋疲力尽。
如果大家在小时候也曾用铅笔在报纸上的迷宫图勾勾画画寻找路线,相信有不少人都有同样的经历,在耗费时间画了几笔之后,总会不耐烦的一笔画到终点。面对想要也必须以最短路线抵达出口的参与者,以及必然复杂的迷宫。寻路者或许也需要“think out of the maze”,把寻路的方式改变成拆除迷宫本身。
在华为云的AI寻路逻辑中,我们就可以看到这样拆除迷宫的思路。接下来我们可以通过几个现实案例,看看华为云构建的产品是如何“拆除迷宫”的。
1、 打通开发壁垒的ModelArts。
当我们的经历飞机延误时,一定听过“航空管制”这个词。实际上每一架飞机何时起飞、何时降落,都需要航空管制员在塔台上,通过肉眼观察监视器凭借经验来判断。当恶劣天气发生以及来往航班密度增加时,航空管制员的工作难度和工作压力都会大大增加。上海麦图信息科技推出的“跑道侵入防护系统”,就是通过AI改造了这一现状。在麦图的解决方案中,监控视频中的飞机图像可以被及时捕捉,确定位置与速度,计算两个飞机之间的运动轨迹,再根据其他的关联数据进行认证,确保飞机之间不会发生碰撞,即使有发生碰撞的风险,也可以提前预知。
从监控视频中识别对象然后加以计算推理出结果,这听上去是再典型不过的AI产业应用了。可真到了开发部署时,开发者就会发现,跑道防侵入这一需求非常小众,很少能找到可参考的解决方案。这意味着从标定工具的开发,到算法设计以及后续的设备性能调优都需要从头做起。从商业角度来说,这一过程带来的成本是致命的。复杂繁重的开发过程成了一道藩篱,明明知道出口就在前方,却又被死死困住。
这也是ModelArts作为一站式AI开发与管理平台,在寻路过程中发挥的最大价值。在去年发布的2.0版本中,ModelArts增加了大量诸如智能数据筛选、智能数据标注、智能数据分析、多元模型自动搜索、图神经网络、强化学习、模型评估、模型诊断、模型压缩等自动化甚至智能化的辅助开发工具,可以在数据清洗标注到模型部署调优的全链条上,对AI开发进行优化。
用在麦图科技的案例上,就是不论在视频中标注航天器这样最基础的工作,还是提升推理精准度不断调节参数,这些工作都可以在ModelArts的帮助下高效进行。麦图信息科技仅仅用了三天,就完成了第一版模型的数据标注、训练甚至客户演示。在以往可能光是采购服务器,就要花费同样的时间。
原本阻拦在迷宫出口前的壁垒,就这样被轻易打破。
2、 清除端与云障碍的HiLens。
如果关注荣耀手机生态链的朋友,一定会记得去年的荣耀亲选推出了一款名为BYBLUE的智能云台摄像头。这款摄像头具有AI人形监测、手势识别能力,能够帮助用户监控家中状况也能“读懂”用户的手势,同时还能分辨出婴儿的哭声,承担婴儿房监听器的作用。更重要的是,这款摄像头的价格仅仅不足200元。
一般来说,通过视频实现多模态识别、人形识别或手势识别并不困难,在ModelArts的帮助下就更加简单。但想要将这些能力集成在一款200元左右的硬件中,就并不那么容易。端侧算力的成本限制和软件开发者对底层算力的不理解,都会让开发者明明掌握了极具价值的算法能力和适用的商业场景,却施展不开拳脚。无异于行进半路,却被障碍阻挡了步伐。
如果说ModelArts解决的AI软件层面的问题,那么HiLens作为与之配合的端云协同AI开发应用平台,解决的就是算力部署的问题。这一平台可以将端侧的计算能力与云端的计算能力结合在一起,为不同的算法找到应有的部署位置。降低了端侧需要的计算性能,自然也降低了硬件成本的要求。同时HiLens开放了“技能市场模式”,号召开发者在平台上推出即拿即用的视觉、多模态算法,并推出了一体化开发套件HiLens Kit。不论是挖掘出商业场景,想从头部署一体化智能视觉硬件的企业,还是渴望智能升级的传统视觉硬件厂商,甚至干脆是只有算法能力的,对硬件部署一无所知的技术企业,都能通过HiLens扫清障碍,获取到终端或云端的能力,让视觉AI拥抱现实。
扫清了路上的障碍,走出迷宫的速度就会被极大的加快。
3、 为世界助跑的澎湃AI算力。
在拆除迷宫的最后一步上,我们要提出很多“终极之问”。比如宇宙中有多少星球未被我们发现,基因中的未解之谜如何能够被勘破,我们能否在有生之年勘探到更多石油资源留给下一代……
这些看似庞大却实则与人类文明发展休戚相关的问题,同样也能够被深度学习、强化学习等等AI技术逐步破解。只不过和所有AI技术一样,这些问题的探索需要强大计算来支持。
除了开发端和部署端的赋能之外,另一让华为投入了大量资源的,就是一切开发者都需要的算力底盘。突破算力峰值的AI集群Atlas 900、融入了一系列硬件能力的AI昇腾集群服务加上全场景AI计算框架MindSpore。华为云正在将海量算力释放出来,或许不是每个产业都需要突破峰值的暴力计算,但在这个算力决定实力的时代,几乎每个产业能够享受到算力提升的红利。华为云此举无疑是给每个进入迷宫的人都拍了个“Buff”,用强大的算力基础,让他们完成助跑,在迷宫中飞奔起来。
推倒迷宫,建桥梁
通壁、清障、助跑。经过去年一年的累积筹备,华为云已经为产业迷宫找了一种全新的可能。
科技企业或许可以走遍迷宫的每一个角落,为每个进入迷宫的人提供一幅地图。但真正值得思考的是,在AI的技术起点与产业终点之间,一定要有九曲十八弯吗?或许有一些产业兜兜转转,最终走到了迷宫的尽头。但在这一过程中,他们付出了大量“绕路”成本:用高价获取算力,争抢此前从未接触过的技术人才,与黑箱调参玄学反复斗争……那些本应用在开拓更多AI落地场景上的时间与精力,就在绕路中消耗掉了。更何况还有那些根本支付不起绕路成本的人——想要用AI分拣水果的果农、想用AI改善经营的小微企业以及那些充满着无尽新奇创意的普通开发者。
一项能够改变世界的技术升级,一定要以最直接的方式深入每一片产业热土,彻底改变那些沉淀已久的顽疴;而不是在无数蜿蜒岔路中,甩下那些无力追随到底的人。
华为云一直在强调的普惠AI就是如此。不论是通过昇腾的开放去提升算力的平均水平,还是用ModelArts和HiLens这样的工具降低AI开发和部署的门槛。华为云所做的一切与其说是在迷宫中寻路,不如说是否定迷宫存在。
真正的迷宫是被规划、被设计、被建造而成,供人们在其中游乐。而产业AI的迷宫却由现实的限制构成,是一盘整个世界都要面对的困局。
华为云这位寻路者,一边着手拆掉壁垒、抹平坎坷,一边向整个世界高呼:不要适应迷宫,要战胜迷宫。
在过去的一年中,华为云的工作已经完成了不少。我们看到AI在保护远方的雨林,看到成为了普通人手中的工具。而在2月28日即将启动的华为开发者大会2020(Cloud)DevRun Live技术沙龙直播首秀中,我们还将看到基于华为云AI平台开发口罩智能识别方案。面对突如其来的新冠肺炎疫情,科学和智能化的防控成为重中之重。如:口罩佩戴识别是疫情期间各园区和公共场合非常重要的管理工作,但是靠人力去24小时监督管理不仅费时费力且效率低下。本次直播将介绍如何基于华为云AI平台ModelArts+HiLens开发口罩智能识别方案,从数据准备、模型训练开发到应用部署等端到端的介绍整个方案的AI开发过程。
现在,已经有越来越多的人,艰难的走出了一条直线。当一切壁垒都被拆除,每个人都可以在AI起点走过一条直线,到达产业落地的终点。曾经的迷宫,也就变成了桥梁。
华为开发者大会2020(Cloud)将于2020年3月27日-28日通过华为云以网上直播的方式呈现,这是华为面向ICT(信息与通信)领域全球开发者的年度顶级旗舰活动。大会旨在搭建一个全球性的交流和实践平台,开放华为30年积累的ICT技术和能力,以“鲲鹏+昇腾”硬核双引擎,为开发者提供澎湃动力,改变世界,变不可能为可能。我们期待与你在一起,梦飞扬!