电脑商情报
聚集渠道进化,关注方案集成
5月21日,微软在中国举办的首届人工智能大会(AI Innovate),毫无疑问给我留下了极为深刻的印象。
当天,我在微信朋友圈写下了这样的评论:“这是微软人工智能首次在中国“大阅兵”,有三个感受:微软AI未来覆盖的场景越来越多;微软在认知服务以及对话式人工智能领域的进化能力越来越强;与过往一样,微软的人工智能依旧强调开放与赋能,这也正是其强大来源之所在。”
在我看来,微软在人工智能领域的一系列探索与创新,为人们带来了前所未有的美好生活新体验,也打造了一个全新的人工智能新生态系统。从这个意义上来说,微软的人工智能之路,不仅在领跑当下,更是在创造未来。
微软人工智能“大阅兵”
实际上,微软人工智能在中国的首次“大阅兵”,不仅展示了人工智能最前沿的技术研究,同时不断演示的一系列人工智能“黑科技”,更引起了现场一阵阵的惊呼和掌声。
其实,今天微软在人工智能领域,尤其是认知服务和对话式人工智能方面所取得的成绩,已经远超外界的想象,具体来说:
第一,在认知服务领域,目前微软在全球推出包括语音、视觉、语言、机器翻译等功能的24项服务,超过100万开发者使用。
据微软全球资深技术院士黄学东博士介绍,在计算机视觉方面,2015年微软亚洲研究院发布的152层残差网络(ResNet)的图像识别准确率已经达到96%,胜过人类;2017年8月,微软在Switchboard语音识别基准测试中的错误率已经降低至5.1%,达到了媲美人类专业速记员的水平。
而在2018年1月,微软亚洲研究院自然语言计算组率先在斯坦福大学发起的SQuAD文本理解挑战赛上获得超越人类的分数;2018年3月,微软亚洲研究院与微软雷德蒙研究院宣布,其研发的机器翻译系统在通用新闻报道测试集newstest2017的中-英测试集上,第一个达到了可以与人工翻译媲美的水平。
可以说,智能语音第一次在翻译质量上超过专业水平,这对人类文明的进展是非常重要的。在黄学东看来:“真正的自然语言理解还需要更长的路要走,那才是人工智能真正的皇冠。”
但是,即便如此,微软智能语音已经能够在商业化领域带来了更多的创新和进步。在现场,基于微软即将发布的“全双工语音技术(Full Duplex)”的AI会议系统,不仅能识别不同人的声音,实时以文字记录下大家的发言内容,同时还能识别出涉及工作安排的内容生成代办事项。
第二,在对话式人工智能领域,微软已经布局了小娜和小冰两个对话式人工智能助手,小娜更倾向于发展智商,而小冰则是面向情商维度发展的人工智能系统。
以我们熟悉的微软小冰为例,过去一直以逗贫、插科打诨的聊天风格著称,但最近小冰却变得温柔和可爱了。
在现场演示中,微软展示了一段小冰在一次电话聊天结束后,由于判断出用户情绪低落,认为需要再一次电话沟通,于是又拨打了一通电话,去询问用户情绪是否变好、提醒用户早点休息、告知用户明天天气情况。
对此,微软 (亚洲) 互联网工程院副院长李笛补充说:“有时候用户冒犯了小冰,小冰也会打电话过去质问对方,有时也能把用户问蒙了。”显然,这个小故事背后,无疑体现了微软人工智能从语音识别到语义识别过程中的巨大进步。
目前,微软小冰团队已经进入内容创造领域并开始落地生产,内容涉及歌曲演唱、电台电视台节目、新闻评论、诗歌生成和有声读物等。在有声读物领域,微软已拥有接近4万集有声童话内容。更关键的是,这些有声读物全部由人工智能技术生成,数量足以陪伴一个孩子从2岁到9岁的全部时光。
同样,微软小娜也进步明显。例如,通过Azure Bot Services对话机器人服务,微软可以支持更多的开发者和企业根据自身业务需求进行定制,同时发布到微软小娜上,并能利用简单易用的开发工具为小娜赋予更多的业务技能等。
由此可见,无论是在认知服务领域,还是在对话式人工智能领域,微软均已经实现了领跑,但微软在人工智能这条道路上,其梦想和愿景却远不止于此。
开放的人工智能之路
正如微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋博士所言:“云计算与人工智能正在给整个世界带来巨大改变,我们希望微软领先业界的云计算和人工智能服务与工具能够予力全球每一人、每一组织,成就不凡。”
在他看来,微软智能云Azure汇聚了微软在人工智能领域的全部投入与技术积累,是开发、部署、运行人工智能的最佳云平台,同时也是将智能云与智能边缘融会贯通的关键环节。
在此基础上,微软更与时俱进地推出了开放人工智能平台(Open AI)战略及开发工具,积极参与和推动人工智能技术的创新与快速发展。
目前,在支持诸如TensorFlow、CNTK等业界主流的深度学习平台的同时,微软还发起了开放神经网络交换(ONNX)项目,旨在推动人工智能研究的互操作性,让任何深度学习框架在任何芯片与任何设备上都能运行。
与此同时,在Build 2018微软全球开发者大会上,微软宣布推出跨平台、开源机器学习框架ML.NET开放预览。ML.NET让任何 .NET开发者都能开发出自己的定制化机器学习模型,并将其融入到自己的应用中去——开发者完全无需具备开发和调试机器学习模型的经验。
如今,基于微软智能云和智能边缘带来的实时人工智能基础设施,以及众多的人工智能开放平台与工具,微软无疑给开发者和合作伙伴带来了巨大的机会。
据小米人工智能与云平台副总裁崔宝秋介绍,自今年2月签署战略合作备忘录以来,双方以周为单位、甚至以天为单位快速推进,推进速度非常快,如多种语言翻译、图片OCT识别、图片文字翻译翻译、TTS多语种语音合成等等。
当天,小米生态企业香蕉出行合伙人和首席技术官于亮就在现场展示了,基于微软认知服务中微软翻译引擎的“魔芋AI翻译器”,这款翻译器上市仅不到一个月时间,就已经覆盖了全国各个省的294个城市,被用户带到了全球34个国家。目前,魔芋AI翻译器能够提供覆盖全球170多个国家和地区的14种语言的实时语音翻译,成为人们出国中的“翻译利器”。
不仅如此,中国三大电商品牌之一的唯品会,正在积极构建布局全球市场。为此,微软合作伙伴才云科技利用Azure Batch AI服务为唯品会开发了容器化的人工智能解决方案,将其海外业务团队的效率提升了85%,对100万张图片进行分析标签化处理的时间缩短到之前的1%,只需要5分钟,算法模型在深度学习训练上所用的时间也从2个月缩短到了1周,让AI系统迭代的速度获得了极大的提升。
不难看出,智能云+智能边缘共同构成了微软为用户、合作伙伴、开发者服务和赋能的基础平台,再加上包括认知服务、对话式人工智能、开放平台与工具等在内的AI技术基础技术,则构筑起微软一套完整的人工智能战略和产品布局,而基于微软人工智能的坚实底座和平台,无疑将会各行各业都带来颠覆性的变化。
从这个角度来看,微软的人工智能之路,同时也是开放和赋能之路。
不仅在领跑,更是在创造
那么,拥有如此“实力雄厚”的人工智能平台和赋能工具,微软希望人工智能未来走向何方呢?
对此,沈向洋博士表示:“人工智能的发展让我们有机会,以前所未有的方式塑造我们的未来,我们必须以负责任的态度,确保打造一个所有人都能参与和分享的美好未来,让人工智能为全人类造福。”
从这句话中,我们不难看出微软希望赋能全人类和全社会的决心和信心。所以,我把微软的这个愿景归结为两个方面,一是为人类创造一个更美好的未来,二是为业界创造一个全新的人工智能生态系统。
在微软人工智能大会上,来自来自南京工业大学的硕士研究生宋昊旻与沈向洋进行了现场对话,1993年出生的昊旻,在一岁时由于医生用药不慎造成神经性听力损失,被诊断为终生听力严重损伤。
但如今,通过Microsoft Translator打造的微软语音服务,专门针对昊旻的声音特点定制了语音识别模型,能够以极高的准确度将他的语音实时转换成文字,还能同步翻译成英语或其它语言,从而真正实现了无障碍沟通。
其实,在刚刚结束的Build 2018微软全球开发者大会上,微软公布了“人工智能无障碍计划”,并计划在未来五年的时间内,投入2500万美元,予力全球开发者充分利用微软提供的人工智能技术和平台施展才华、发挥创意,为世界各地超过10亿残障人士,打造一个便利、平等、没有障碍的世界,这无疑是微软为人类创造一个更美好的未来的具体印证。
除此之外,微软还希望为业界创造一个全新的人工智能生态系统。当天,沈向洋还宣布,微软正与中国在AI领域展开全方位的合作,将推出“3个100”计划,并成立在线人工智能学院,为广大AI人才提供免费授课培训。
其中,“3个100”计划是指,将筛选Azure机器学习等100项微软人工智能开发工具,与100位企业开发者和科学家,共同创造出100个人工智能解决方案和落地场景。
实际上,未来技术竞争的维度正在悄然发生改变,人工智能正是“看不见的竞争力”。特别是人工智能技术应用范围的大小,将是未来中国企业决胜的关键因素。在这个过程中,需要微软这种有也决心,也有能力的科技公司的加入,才会让人工智能技术迅速形成新的生产力,成为中国产业升级和企业转型的新动能。
综上所述,“予力全球每一人、每一组织,成就不凡。”在人工智能领域,微软不仅是这么说的,也是这么做的,而这也正是微软的伟大之处,更是其令人尊敬之处。
游侠索罗:星球大战外传
主演:阿尔登·埃伦瑞奇 / 艾米莉亚·克拉克 / 唐纳德·格洛沃
《电脑商情报》创立于1992年3月,“聚焦渠道进化,关注方案集成”是我们的宗旨。旗下CBINews.com是中国最大的企业级IT渠道垂直网站。我们致力于为您提供国内企业级IT市场的渠道新闻资讯和原创深度报道。
受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。