还记得不久前,微软宣布计划将其在中国的数据中心扩容3倍。一方面,这意味着,微软的公有云Azure将在中国全面发力;另一方面,也引发了业界的猜测,微软到底会如何发力?
就在前几天,微软在北京举行2018微软人工智能大会,基本揭晓了谜底。不错,微软Azure的发力点仍然在人工智能上。
问题在于,微软智能云的概念提出来也不是一天两天了,是什么让微软Azure今天更加有信心在中国取得快速的发展?
我想,这是我的疑问,也是很多业界同仁的疑问。本文试图抓住本次大会的几个关键,分享出来,回答这个问题。
中国认知市场巨大
微软公司资深副总裁,大中华区董事长兼首席执行官柯睿杰开场就说,“我们认为,中国是美国之外最大的认知服务市场。”
柯睿杰口中的认知服务,实际上就是人工智能。众所周知,人工智能的基础是大数据,而大数据的基础则是移动互联网应用,以及正在兴起的IoT应用。不论是移动互联网应用,还是IoT物联网,中国都是全球应用最为领先的国家之一。
“20多年前我是学AI的,那个时候AI是冬天。今天的AI是一个春天,可能会持续很长时间。”小米人工智能与云平台副总裁崔宝秋博士认为,“2010年开始中国在移动互联网并线超车到现在领跑,在AI并线超车领跑的力度比移动时代更加大。”
在崔宝秋博士看来,应用层创新是中国的优势,比如小米投资的生态企业有一百多家,围绕手机、围绕IoT创新出各式各样有着智能化应用场景的创新产品。而这样的创新是系统级的创新,因为小米有端,这样在上面做智能助理、语音交互、视觉、感知、认知,形成系统级的创新机会。
大疆创新首席科学家吴迪
中国市场人工智能的机遇不仅仅出现在智能手机端,同样也在物联网领域。大疆创新首席科学家吴迪说,2005年,大疆创新在全球首先推出集成了双目视觉和目标跟踪等功能的第一代消费类无人机G04,而今,石油管道的巡检也是通过无人机将捕获到的影像上传到微软智能云,在智能云上通过深度学习模型对管道沿线的图像进行识别,快速诊断出管道沿线存在的问题,以便及时采取防治手段。
应用场景突破
如果说在小米米家App上出现的各种智能硬件终端,它们的应用场景还处在大众认知范围之内的话,那么吴迪所说的大疆创新通过无人机沿着石油管道拍摄影像为石油行业用户提供巡检服务,基本上已经超出了我们的想象空间。
实际上,今天基于人工智能图像识别技术的突破,应用在行业领域的创新应用还有很多。如果我们把温度、湿度以及光照等各种传感器加载到无人机上,甚至能通过实时捕获的热力图,分析植物生长缓慢或病虫害存在的各种问题,形成面向智能农业的解决方案。
这里面的关键之一,是要把现场采集包括温度、湿度以及光照在内的各种信息,上传到Azure IoT Edge云上,通过大疆和微软合作推出的集成了大疆PC地面站专业软件和成图算法的FarmBeats平台,最终以图形的方式把数据展现给用户,帮助他们进行快速决策。
另一个令笔者震撼的应用场景,是全球首创的微软AI人工智能会议系统,支持对会议系统中多个发言者的声纹识别,不仅能生成实时的会议记录,甚至还可以理解语意,形成待办事项的整理。
大家知道,任何公司最重要的决策都是在会议上做出来的。通常我们需要在会议上安排一个会议记录员,整理待办事项,还要对会议进行录音。而今,微软AI人工智能会议系统很明显借助于微软Office365的优势,从预约会议到会议记录一气呵成,降本增效。
AI技术保障
实际上,微软在人工智能领域的研发实力一直是非常雄厚的。笔者记得国外有过一个统计,把当今人工智能领域的专家和就职公司分了个类,发现微软是拥有人工智能专家最多的公司。
而今,微软研究院已经基本实现了当初的愿景——让计算机也能眼观六路,耳听八方。
比如微软亚洲研究院开发的OCR (光学字符识别)技术,为各种人工智能应用增加图形文字识别功能——目前手写识别OCR引擎V3.0版本的精度达到了70.5%,已经部署于微软认知服务,不仅支持从Office到Skype、Bing、HoloLens的微软应用,还可供开发者用于自己开发的智能应用。目前支持从Office到Skype、Bing、HoloLens的微软应用,能识别打印字体、美术字、手写字体,可以满足从智能云到边缘计算的各种场景。
而国内用户熟知的微软小冰则是面向情商(EQ)维度发展的人工智能系统。日前微软向合作伙伴和开发者开放的“全双工语音技术(Full Duplex)”,将“人机交互”进化为能像人类一样自然的“人机交流”,其中的语音合成技术已经融入了人类自然呼吸的因素,惟妙惟肖。
如今微软小冰采用专门训练的深度学习模型,能够从故事文本阶段即进行定制化生成,并自动分配声音角色和背景音乐,在短短20秒内即可完成一集约10分钟左右的有声童话故事,语音讲述的质量能达到主流专业人类播音员的水准。
也就是说,微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等,开发者可以使用这项技术打造自己的对话应用。今年四月,微软正式在美国和中国同步宣布了Full Duplex感官,并已完成产品化落地。自2016年8月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,在明确告知用户小冰并非人类的前提下,已让小冰与人类用户完成了累计超过60万通电话交流——最长的一次“人机交流”竟然长达6小时!
构建智能生态
在笔者看来,微软最强的还不仅仅是人工智能技术的研发,而是将其商业化的能力。
在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。
微软的逻辑是,让每个开发者都有机会打造属于自己的人工智能应用,而微软提供最好的平台——微软智能云Azure和人工智能服务,普及人工智能全民化。如今,微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务,目前已经有超过100万开发者使用认知服务。
前文说过,借助微软的开发平台,普通人在短短20秒内即可完成一集约10分钟左右的有声童话故事。事实上,微软小冰团队有声读物已顺利投放到占中国市场90%的儿童早教机、故事机和在线播客平台,播放总时长超过400万小时。
而ISV借助微软新推出的Bot Framework和Azure Bot Service,可以从规划、开发、测试,发布,连接以及评估这六大步骤的开发流程入手,继续往复进行完善和优化,开发一个面向行业场景应用的对话机器人。比如借助微软认知服务中的微软翻译引擎,小米生态链企业香蕉出行推出了魔芋AI翻译机,能够提供覆盖全球170多个国家和地区的14种语言的实时语音翻译。
不仅如此,无论是大疆创新还是小米,已经不止是微软和微软智能云Azure的客户,同时也是密切合作伙伴。据吴迪介绍,大疆和微软携手推出了面向Windows的SDK开发包,开放给行业用户,利用这个开发包就能很便捷、快速的开发出面向不同行业应用场景的无人机飞行方案;而小米打造的小米生态云,在PaaS平台和应用引擎方面跟微软也有很多合作,共同服务五十多家生态链企业。
据悉,微软计划将提供100项微软人工智能服务与开发工具,携手来自100家具有影响力的企业的开发者和数据科学家,共同创造出100个针对关键行业的人工智能解决方案和落地场景。
“除了微软的‘3个100’计划,微软还将在中国推出人工智能在线学院,免费提供总共250个课时12门的AI人工智能的学分课程,覆盖10项的人工智能技术,为中国培养更多的AI人才。”在微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士表示。
显然,云计算与人工智能正在给整个世界带来巨大改变,而中国则是全球最具创新活力的市场。微软希望通过与中国产、学、研各界的全面合作,为微软在中国的40多万开发者持续赋能,拓展中国市场的商机,助力释放中国智慧。
文/余文
《科技看门道》坚持深度报道,希望能通过资深媒体人对IT产业热点新闻的深入思考,挖掘其背后的商业逻辑和创新模式——不仅看热闹,更要看门道!
《科技看门道》主笔在行业渠道媒体拥有超过15年的从业经历,不仅对IT消费类和企业级软件、硬件、云计算、大数据、人工智能、区块链均有较深入的理解,同时见证了中国IT产业链上下游合作生态圈包括分销、零售、SI、ISV和CSV的进化历程,见证了金融、能源、制造、医疗、教育、政府、零售、高科技等行业的信息化之路。
《科技看门道》相信,IT产业在供给侧的改革——包括云计算、大数据、移动互联、人工智能、区块链等,将会成为推动各行各业发展进步的核心力量。