来自:美团技术团队
2020年7月31日,由中国图象图形学学会主办、视觉大数据专委会承办,北京智源人工智能研究院和美团协办的ECCV 2020中国预会议成功举办。本次ECCV预会议秉承传统,组织了圆桌论坛,邀请来自工业界、学术界大咖,他们围绕“计算机视觉:学术界与工业界GAP有多大”这个主题谈及了各自的理解并分享了一些精彩观点。
圆桌论坛由中科院自动化所的董晶博士主持,Wormpex AI Research 副总裁兼首席科学家华刚博士、华为云首席科学家田奇博士、微软亚洲研究院资深研究员王井东博士、美团AI平台视觉中心负责人魏晓林博士以及上海交通大学的熊红凯教授同框在线进行话题讨论。
上图左列由上至下为董晶、田奇、魏晓林
右列由上至下为华刚、王井东、熊红凯
各位学者、大咖针对工业界与学术界在计算机视觉领域的研究生培养、人才吸引力法则与跨界合作研究的优劣势等热点话题展开激烈讨论,他们还对目前工业界与学术界对计算机视觉领域学术前沿探索与产品应用落地间存在的鸿沟,以及相互间人才流动的现实状况进行了深入的分析与交流,最后对未来计算机视觉的研究热点和热门行业也做出了积极的预测。
精选观点
-----
我们精选了圆桌论坛中10条专家观点,大家可以先睹为快:
在学术界的研究生需要有一种哲学的思辨能力。
对于做研究的人来讲,写作这个事情可能对你一生来讲都是非常有帮助的。
学生需要有“T型”的知识架构,不仅要在某个领域研究得深,而且还要有知识的广度。
那些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么。对待新的研究方向也有很好的敏感性。
工业界跟学术界往往是一个Mix,工业界和学术界的紧密结合是一个双赢的局面。
可能工业界像是“市场经济”,学术界可以说一定程度上是更偏向于“计划经济”。
学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,而工业界是从1到n。那么,怎么把“0到1”和“1到n”衔接到一起,就怎么缩短这样的“使用鸿沟”。
在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。
计算机视觉的发展趋势预测:深度学习与计算机视觉结合的可解释性、安全性、鲁棒性、透明性;小样本训练、自监督学习、知识图谱、模型压缩;数据高效、软硬结合。
计算机视觉应用的行业机会可能存在于以下几个领域:安防、无人驾驶、线下零售。
本次圆桌论坛完整视频观看入口:
https://www.bilibili.com/video/BV17a4y177Mf/
或点击文末“阅读原文”观看完整视频
文字实录
-----
以下系对Panel讨论环节的文字实录,希望能对大家有所帮助或者启发。
计算机视觉领域的应用型/学术型人才培养方面的现状和问题
董晶:大家都知道,本次ECCV预会议面向很多计算机视觉领域的研究生,包括硕士和博士,他们在面临就业的时候,在工业界和学术界的一些优劣势是什么?此外,从各位老师的角度来看,你们更看重这些毕业生的哪些能力?他们应该在读书深造期间具备什么样的能力?或者说对这些研究生应该往哪些方向进行发展和培养?
熊红凯:工业界的话,相信其他几位老师比我更有经验。我就谈谈我在学术界的一些体会。以前我对计算机视觉是有一定偏见的,因为计算机视觉当时的目标是让计算机像人一样具有视觉的观感。
小时候看书,说我们人类面临三个世界,一个是虚拟的意识世界,另一个是现实的物理世界,第三个是真理世界,也就是数学世界。过去我们做学术其实更多的是面向数学世界,去寻找和发现这个世界上所存在的真理和规律。后来计算机视觉打开了这个窗口,我感觉计算机视觉实际上是在把人的意识世界和现实物理世界做了某种关联。从这个角度来讲,我觉得学术研究现在存在一个分歧,是应该更多的去面对真理和规律,还是说只去做现实世界与虚拟世界的一种关联。
当然,我们可以比较客观地说,计算机视觉是让计算机去创造一种新的物种,像人一样具有可辨识、可观察的能力。但是,有一些理性的人也会认为,计算机视觉更多的还是一种麻痹人自身的娱乐方式。我原来对计算机视觉的偏见可能就是来自这方面。
但是今天,我们可以看到现代生活方式的变化已经不可逆转了。计算机视觉技术已经延伸到很多客观的方面,而并不仅仅在于娱乐或者是消费的方面。因此,我觉得学术界和工业界就会慢慢地有一些融合,因为工业界毕竟更多的重心还是在于应用和市场的开拓;而在学术界,现在慢慢从原来的真理探索开始向人类领域进行拓展,也在与工业界找到一些共通点。
我觉得计算机视觉方向的研究生,既然做研究,必然面临这些方面的思考,就是你做的东西到底有什么用?并不仅仅只是体现在经济效益上。所以我认为,在学术界的毕业生需要有一种哲学的思辨能力,而并不仅仅是做一种技术的应用,也并不仅仅是提高一些效率。我觉得学术型人才必须找到一些能够打动他自己的、确实存在的规律和真理,而不仅仅是把现实和虚拟做一些简单的融合。
董晶:我觉得熊老师现在对我们计算机视觉领域研究生提出了一个更高的要求,不仅要求他们的动手实践能力、编程能力要过关,还要在发现规律、总结规律这方面上升到一个哲学的高度。感谢熊老师的发言,那王老师对此怎么看呢?
王井东:我虽然是来自于工业界,其实更多的还是偏学术界一点。刚刚熊老师讲的高度非常高,我就讲一讲我在我们这边带实习生十几年的一些感受和心得。
微软亚洲研究院前院长沈向洋博士也是我当时在研究院实习时候的Mentor,曾经提到过“三好学生”,就是数学要好,编程要好,最后一个态度要好。首先想做学术研究,也包括做工业界的其他工作,态度是第一重要的。没有好的态度,光有好的基础,那是不够的。目前,特别是2012年以来,很多读硕士和博士的学生觉得数学不重要,只要会调参就可以了。但大家今后走向工作岗位,可能就会发现,光会调参是不够的,是没有优势的,因为调参每个人都会,所以数学还是很重要的。其次是编程,我们是做计算机科学方向的,编程自然非常重要。
除了上面这三个方面,从我过去的很多经历,包括跟学生的交流以及跟学生合作做研究的经历,我觉得还有一点非常重要,就是交流。Communication这个词其实很泛,不仅仅是说口头交流,对我们做研究的人来讲,还有写作,比如写论文,也是很重要的。
交流是除了上述三个方面以外最为关键的一点,因为我们做研究很难是一个人独立去做研究,往往需要跟很多人去合作。在合作的时候,比如说带实习生或学生合作的时候,往往会出现这样的问题,我们和学生讨论一些问题,那我们讨论的东西跟学生最终接受的东西,都是一样的吗?其实,不见得是一样的。那么,怎样保证你这些讨论能够达成一个共识,交流(写作)就会变得很重要。
从我的经验来讲,往往建议研究生多写作。写作不是就要写论文,其实平时的交流也要写出来。如果你写作很好,那么别人看你的东西就知道你是怎么想的,而不像口头交流会产生很多意思不到位的状况。
写作,对我们的帮助,不仅仅包括我们刚刚提到的idea层次上的,其实还包括对我们对自己的规划。不仅仅对做研究有帮助,对将来的工作也是非常重要的,比如说对很多学校的老师做Proposal也很重要。以前华刚老师在我们这边,我们也在一起讨论这个事情,我们在公司做研究,缺少一个写Proposal的过程,而这个事情我觉得现在越来越重要。这是从大的角度来讲,Proposal就是帮你规划将来的几年你打算怎么去做,对这个领域怎么去了解。
可能大家会想,这些事情我天天都在思考,那这个问题我还能不了解吗?但是当你真正把这些问题写出来的时候,你就会发现(写出来与想法)之间的差距还是非常大的,而你写出来之后带来的好处也非常多。所以说,对于这些研究生不仅仅是在读的,包括马上要工作的,不管是学术界的还是工业界的,我觉得写作这个事情可能对你一生来讲都是非常有帮助的。
董晶:井东老师对学生的笔杆子要求非常高,他们得把自己的想法写出来,这样才能被认可,才能被更多的人看到。
田奇:大家知道,我本身是在学术界待了很多年,其实现在跟学术界联系也非常紧密,我做了17年老师,这两年在公司也是从事一些研究到行业落地的工作。
从我的角度来回答这个问题,就是说看一看学术界和工业界需要什么样的人才。如果你具备这样的一些素质的话,那你就有一些优势,如果不足的话,可能就要弥补一下。
学术界大家讲的比较多了,讲的就是源头研究、基础研究,主要研究的就是技术创新等等。那么从工业界角度来讲的话,我以前也做过一些类似的报告,所以总结了几点:
第一点,从工业界来讲的话,我们可能需要这些学生专精一个领域,并且在这个领域中有一定深度的专业认识、专业技能和创造力。
第二点,其实井东老师也提到了,就是要有沟通合作的能力,同时要有多领域理解的能力,就是我们常说的具备“T型”的知识架构,不仅要在这个领域研究得深,而且还要有知识的广度。
第三点,从我们现在的一些行业应用来讲的话,要有一些真正能做产品的人才,能够从客户的角度,去发现社会和用户需要什么,能从应用场景去思考计算机视觉能够做什么,以此来激发一些更新的研究。
第四点,是希望学生能够对待新的研究方向有很好的敏感性,包括对研究方向的发展、新的场景以及应用。
最后还有一点,我们工业界也是需要一些有崇高理想境界的人才,毕竟AI还是以人为本,那么我们应该为人们的一些基础文化需求去服务,使AI能够更好地帮助这个社会,服务于更多的客户。
这就是现在我站在工业界角度分享的对学生需求的一些理解。
董晶:我觉得田老师其实还表达了一个观点是,我们的学生也是要因材施教、物尽其用,咱们有什么能力都可以发挥出来,其实在工业界、学术界都是能找到“闪光点”的。
如何看待产业界和学术界参加国际顶会发表科研成果的热度
董晶:今年ECCV 2020接收了1400篇文章,其中Oral(口头发表)只有104篇,而这些文章很多都是工业界和学术界联合发表的。那么,各位老师是怎么看待产业界和学术界联合参加国际顶会发表科研成果的热度的?今年ECCV来自工业界和学术界的大量联合投稿,是否也体现和反映计算机视觉领域在工业界和学术界越来越紧密的结合?工业界和学术界是否存在鸿沟?我们从有用的技术和有趣的研究两个角度出发,讨论怎样能够更好的帮助大家特别是年轻人发展。
华刚:热度的存在是一个客观现象,存在即合理,我们也希望这个趋势能够一直紧密的保持下去。
现在的热度,从方法论来讲的话,尽管有很多计算机视觉的研究员不愿意去承认这个事实,其实计算机视觉在被深度学习所主导,而深度学习的一个局限性就是需要大量的数据,这种数据学术界在实验室中是很难批量产生的。另外,计算机视觉从某种程度上来讲和应用结合的也比较紧密。
从数据的角度来讲,工业界和学术界结合,学术界的得益之处在于,可以通过学生到公司去实习,或者是说有一些联合的项目能够获取(工业界的)数据。那从这个角度来讲的话,二者结合能推动这个领域的前进。
从工业界的角度来看,过去PhD的培养本身是为学术界培养的,大部分博士毕业生都会去做教授。现在发展到今天,我们各个领域都有“通货膨胀”,其实高校的位置也就这么多,那就产生了一种职业,一批能做研究的博士也在工业界工作。
所以,我在这里要给大家讲一个观点,其实我一直在思考这个问题,对于一个在工业界工作的人,他的工作和他的Career是不是应该分开来看待。
井东老师刚才说他在工业界工作,其实是学术界的,我不认可这个观点。你就是工业界的人,只是说你作为一名研究员,你有一个学术界的属性,就是你在不同的时间戴了不同的“帽子”。从这个角度来讲的话,因为工业界有这么一群研究员,也是非常优秀的研究员,他的研究因为要平衡两个方面,一方面他要为公司的业务服务,就是为商业服务,往往他自己的精力就会更多的聚焦在短期要产出成果,但是他自己还能够通过跟高校合作来持续一些更长期、更加探索性的研究。这是非常有价值的。
我觉得这从两方面的意义来看,它是一个双赢的情况,所以我并不觉得工业界跟学术界有多大的鸿沟,包括从有用的技术和有趣的研究来讲,当计算机视觉这个领域发展到今天,其实很难去区分是不是学术界的人就是高校老师和学生在做有趣的研究,而工业界的研究员只是在做有用的技术,它往往是一个Mix。这是我的一个观点,我是希望这个热度能够一直保持下去,因为这会是一个双赢的局面。
魏晓林:我们现在是否有鸿沟,然后何去何从?我觉得计算机视觉这个方向总体上工业界跟学术界之间的GAP是变得越来越小了,这也是大家有目共睹的。GAP在逐渐变小,对工业界来说是有直接益处的,无论是研发人员的招聘还是技术的快速落地,越来越多的公司受益匪浅。
那为什么GAP会小?首先当然是因为深度学习发展的影响。目前,工业界在应用场景、大规模数据、计算算力上,对于深度学习的研发范式都提供了极大的支持,而这些场景和资源在学术界是比较难接触到的。比如,现在很多论文,特别是国外的Google、Facebook的论文动辄就是上亿体量的大规模的数据和上千张GPU联合训练,这在学术界是吃不消的。
另外一个原因是,越来越多计算机视觉的高层次研究员和教授加入到了工业界中,人的流动也缩小了学术界和工业界的GAP。还有一个现象是,工业界最近几年大量招收计算机视觉领域的实习生做项目和发论文,有的部门和公司的实习生比全职员工还多,这是一个“三赢”的局面,同时实习生也加速了工业界和学术界的紧密结合。
我觉得从现在来看,GAP小是非常好的,我们不希望工业界和学术界有明显断档的。但是从未来的角度来讲,我倒是觉得,可能有些时候我们的GAP还可以更大一点。
我觉得还是要回到这个事情的本质上来说,我们要看学术界和工业界最终的目的是什么?我们打个比方说的话,可能工业界它是个“市场经济”,更偏向于通过市场驱动、用户驱动来一步步反推,反推出我们需要做什么样的研究。学术界可以说一定程度上是更偏向于“计划经济”,由政府来分配顶层领域的资源,助力并规划长期的发展。
所以从这种角度来讲,我其实希望学术界投入到基础研究上的精力可以更多一点,可以想得和做得更远一点。这样的话,对于未来,比如再往后看5年10年20年,其实这种推动力可以更加好地持续下去。所以我感觉现在GAP小是好事,长期来看GAP大些也是好事。
工业界与学术界对顶刊顶会论文的重视程度
董晶:希望各位老师谈谈目前工业界与学术界对顶会顶刊论文的重视程度,是不是人才引进的判断标准?以及工业界和学术界对科研人才的吸引力法则,是什么原因让科研人才能够在学术界和工业界来去自如?
华刚:首先,我不愿意把工业界与学术界之间称为GAP。我希望大家理解一点,其实在研究跟开发以及技术应用到实际的场景中间,有一个大的循环。在一个初创性技术的开始,你希望自己的研究跟开发过程能有一个阶段性的分离,你希望把做这个基础研究的人保护起来,让他有一个干净的环境去做研究。
如果把研究跟论文发表联系起来就是说,研究做到一定程度,就一定要把它发表出来。如果说这个研究是自由形式的话,就可以发表到顶会顶刊上去。我要讲的学术界跟工业界的第一个区别就是,在学术界,你的论文发表了之后,研究就结束了。但在工业界是不一样的,论文发表可能意味这个工作才刚刚开始,后面还有很长的路要走,还要把技术经过一些改进,使它能够成熟到去支持业务的落地。
我把学术界定义成高校,其实学术共同体是一个很大的范畴,它并不只是包含高校的老师和学生,至于说科研人才在学术界和工业界来去自如,我觉得那是每个人自己职业上的选择,没有特别多可以评论的。很多人可能会有“水土不服”的现象,只是说你在哪个行当你要去做哪个行当的事情,我觉得大家都应该用心去做。
至于说工业界对学术领会期刊的重视程度,其实你为论文本身做了什么研究工作,可能在找工作的阶段并不是那么重要,它更多是一个记录,说明你的思维有逻辑性,你对自己的思维能够有一个组织性。
而我们在评判面试候选人的时候,如果你有这些论文可以加分,但可能只是在初始“敲门砖”的阶段,你可能更容易吸引到面试官的眼球。实际上,我的每个应聘者我都会自己去聊一下,看他究竟写了几篇论文,里面有多少思想是他自己的,他自己有没有形成一个成熟的逻辑体系。我觉得这是去看人才是不是优秀的几个标准之一。
刚才各位老师也提到很多,更看重人才的一些基本技能,我觉得这些都是我们会去考察的各个方面。但是我觉得最重要的是,在工业界需要的人才都要有一些能够解决问题的真正技能。因为在工业界有很多应用场景的问题,其实还是需要你追着问题然后去解决问题,在这个过程中建立你自己的技术(壁垒)。
田奇:我觉得工业界和学术界其实核心都是人才,我们都需要理论扎实,工作能力强,善于合作,善于创新的优秀的科研人才。同时也存在一些差异,之前也讨论过,学术界更希望是能够把实践升华到一种理论的人才。工业界来讲的话,其实是“不管黑猫白猫,抓到老鼠是好猫”,更看重解决问题的能力。
刚才提到对于顶会顶刊的重视程度,实际上我们现在研究院,还是会更偏重一些顶会,像CVPR、ECCV、ICCV等,这个跟学术界的重视程度都差不多。如果说对人才吸纳来讲的话,那么我们更可能关注以下几点:比如说作者是不是第一作者,是不是原创者,对开源有没有一些贡献;在一些AI的比赛中,是不是能展现很强的研究能力以及工程开发能力;是否参加非常丰富多彩的课外活动,能够对知识面的广度有一个提升。
还有一个就是学术界和工业界实际上是“复古”的,现在在华为经常说的有一句话“向上突破天”,其实就是谈你的创新能力要强,另外一句是“向下扎到根”,就是说我们要贴近行业。
从这种角度来讲的话,学术界和工业界之间的GAP就是从基础研究到落地,我们称为“使用鸿沟”。核心就是说,一般我们讲的学术界是从0到1,工业界是从1到n。怎么把“0到1”和“1到n”衔接到一起,就怎样缩短这些“使用鸿沟”,其实就是说研究到落地中间的一个沉淀过程。
最后说一下,学术界和工业界上是一个循环,就像华刚说的,其实学术界为工业界输送了不少人才,但是也有很多工业界的人才慢慢的回流到学术界了,这样就带来一些新的机会,这样的话就叫互补互益、齐头并进。
魏晓林:关于顶刊顶会,我觉得可以从两个方面来说,首先说顶刊顶会是到工业界入门的门槛。其实很有意思,大家多少年了一直在说,我们不应该过于重视论文数量这些事情,我们要去追求事情的本质,技术研发要在纯净的环境里做真正有意义的长期研究。
但是这个事情感觉现在来说还是个跳不出来的“死循环”,大家无论是在学术界还是在工业界,其实对待论文就变成了一个新的“高考”,它是一个“开卷考试”,刚才各位老师说的能力,其实在一定程度上都在开卷考试当中有一个很好的体现。
所以在入门的时候,我们确实看论文,看你的发表论文的数量、质量,包括到底是不是你自己的想法,这些东西我们都非常看重。但是,另一层面我们同时也会像一个“艺术考试”一样,既有这种试卷考试也有面试,面试在其中也起到非常重要的作用,去真正探究这个同学的素质和能力。
第二个方面是说,在公司内部我们是否重视顶刊顶会这个事情,实际上我们是反推的,就是我们还是要从市场来反推到底我们需要什么样的技术,技术在落地的时候可能就会有一些副产品,有一些产出,那我们就顺便就写成论文投稿,至少在美团是这样,因为我们的KPI确实不看顶会顶刊论文的数量。
另外,其实当我们在说工业界、学术界的时候,有一个很有意思的现象是“学术界”可能只有几个学术界,比如:国内的学术界和国外的学术界,而“工业界”其实是有n个工业界,每一个公司都是一个工业界,每一个公司它的市场所面对的用户都是不一样的,所以它的“工业界”所代表的背后的含义也是不一样的。
熊红凯:我觉得原来传统学术界,上个世纪五六十年代的时候,那个时候的其实并不注重顶会顶刊。我记得他们当时跟我讲说一个前辈哈佛大学毕业,其实没发表任何论文,最后就当上助理教授了。
今天我们总喜欢讲学顶会顶刊,我觉得这实际上是一个“偷懒”的想法,因为我们不愿意去评判一个人的学术能力,或者说我们无法快速地评判一个人的学术能力。就是像今天我们孩子的教育一样,就是希望通过一个证书来做评判,而不愿意从他的实质思想和内容上去做评判,或者说也不愿意花很多的时间去培养他、观察他。
我觉得其实不管是工业界还是学术界都面临这样一个问题,就是“快餐文化”,总是希望通过一些证书或者其他的证明来短平快地处理一些事情。现在我们带研究生包括招聘老师都是这样,我相信工业界招聘员工可能也会用这样的一种方式。
然后现在“推陈出新”了,根据顶会顶刊的论文接收率来确定它到底是怎样一个顶会,怎样一个顶刊,最后来做一个判断。其实这里面也良莠不齐,我觉得很难根据这个来真正客观地做出评判。这就跟高考一样,我们选拔出了一些优秀的人才,但同时也丧失了一些优秀的人才,所以这个很难讲。
其实在学术界,很多学者也还是希望能够用传统的方式,最好是能更多地从这个人的思想来做一个判断,是否愿意聘用他或者是给他这样一个发展的周期。
当然前面井东老师提到的写作能力、表达能力可能也是一个关键因素。这个方面我其实对工业界确实没有太大的发言权,但是在学术界如果真的希望做一些学术探索,或者是做一些精知识的总结、规律的发现的话,还是需要有更多的具有独立思想,并且愿意做探索的、不是过于快速的去做一些短平快的研究的人才。我觉得这样可能是更长远的一个培养方式。
王井东:刚才王亮老师(CSIG视觉大数据专委会主任)说我是学术界的,华刚老师好像不完全同意。其实这个事情是好事情,大家今天对学术界工业界区分的没有那么的清楚,比如说田奇老师从学校到公司,华刚老师也是从学校到公司,都是游刃有余。十年前我们做计算机视觉研究的人,其实很多研究生博士毕业以后发现工作了之后不做这个方向,或者说在这个方向很难找到理想的职位,今天来讲这个事情好像就不存在,这是非常好的一件事情。对于科研人员来讲,因为现在在工业界,其实很多需要研究的地方,不像以前一样毕业之后的情况,这是很好的一件事情,这也是为什么我们能够自由切换。
所以说我还是鼓励大家,咱们(工业界)在计算机视觉领域还是要去做研究的,特别是有了深度学习以后,咱们在工业界去做一些项目的时候,如果说你仅仅是说像以前把工业界学术界的定义分的那么清楚,工业界就简单的实现,今天可能抱着这样一个理念去做工业界的工作的时候,你可能也很难做得非常好。
计算机视觉的发展趋势及研究热点预测
董晶:最后一个话题,我们想请各位老师分别讲一下自己对计算机视觉领域发展方向的一些预测或者看法。
王井东:我就先讲一讲研究热点。尽管计算机视觉领域里很多研究人员不承认这件事情,现在深度学习还是成为了计算机视觉里面主导的方法。深度学习在计算机视觉里面有很多缺点,比如说不可解释性、安全性等等。所以说,深度学习在计算机视觉领域未来怎么跟推理结合起来,可能成为一个研究的热点,也是很多工业界落地需要去解决的问题,如安全性、透明性、可解释性等。
华刚:首先,我觉得计算机视觉最有可能在产业上繁荣的三个领域,第一个是安防大家已经看到了,包括城市互联网、城市大脑这些都可以归于安防的范畴,应用前景特别是在中国的市场也是显而易见的。第二个领域,我还是对计算机视觉在无人驾驶这个领域是相当看好的。第三个其实很多人还没有注意到的,我觉得线下零售会有一个突破,这个行业的突破可能会发生在行业内部,就是说要深入到行业中去。这个在目前的阶段来看还是比较困难的,主要是因为技术还没到那个程度,还需要很多投资去打破这个瓶颈。以上这三个行业我认为是比较有希望的。
下一个阶段计算机视觉的研究热点,我觉得有两个趋势,首先大家会越来越看到深度学习和计算机视觉领域一些知识结合得更好,结合起来之后就会产生更好、更可解释、更鲁棒的一些模型。
另外,大家如果注意到的,就是目前包括CVPR也好,ECCV也好,投稿论文的主题比例的话,就会发现大家其实也在注意到怎么利用小数据去训练模型,能够达到一个很好计算机视觉的模型,我觉得大家在这一块会持续投入一段时间。当然研究热点总是很难预测的,因为它总是一个量变到一定的阶段,才会有一个质变,就是说某个方法某一个点可能会突然热起来,这是不可预测的。
田奇:总的来讲,包括整个AI的发展趋势聊得比较多的就是一些自主自治、资源高效、安全可信。具体一点来说,我认为在计算机视觉领域所有的问题还是总结到数据、模型和知识的提取。
从数据层面来讲,我们会聚焦在数据高效,因为深度学习需要大量的数据标注,将来我们怎么把数据的利用率高效做得更好,把数据深层的质量做的更好。从模型来讲,除了性能,我们还要考虑到一些具体的限制和功耗时延,这是设计成本。
我们的一个发展趋势是把软硬件的结合,同时因为计算机视觉是一种使用技术,所以硬件厂商和AI算法厂商将来怎么样来进行协同。从单点的技术方向来讲的话,比如说针对这种数据高效的话,将来无监督学习、AutoML、边缘计算、知识蒸馏、模型迁移,这些都是比较好的研究热点。
魏晓林:从研究领域来说,很多老师刚才都提到了很多不同的领域。我们在思考未来发展趋势这个事情的时候,背后有个大逻辑,就是我们更加关注新的开发范式和研发范式的变化。
深度学习是一个新的、完全颠覆了原来软件系统研发流程的范式,在这个大的范畴下面,其实有一些新的子范式可能会很快出现。比如说,小样本模型虽然还没有应用的非常广,它起到的作用是加快迭代速度、降低计算成本;像自监督学习,减少了人力标注成本和时间,可以利用到更广泛的数据;AutoML可以减少人工研发的人工成本;像多模态学习、视觉跟知识图谱的结合等,长期甚至可能影响到AI部门的组织形式。另外,我们也十分关注更”便宜“的AI,比如说模型压缩、端侧推理带来成本上的节省。
从应用层面来讲的话,我们更加关注的就是刚才华老师讲的像新零售,也包括美团在做的无人配送,这些都是可以颠覆行业的落地场景。
熊红凯:现在大家经常说人工智能是不是可以完全从数据中来,那么这个也就是说大的范式是从“类脑科学”开始,大家都是从类脑当中去看人是怎么思想的,或者干脆就从研究者的本身看研究者的本身是什么思想。我看到现在“神经计算”开始比较热,这属于研究人的思想,我对这个其实是持保留意见的,因为这个可能会对人本身产生一种负面的效果。
此外,我觉得从人本身的才能上来讲,人更多的是一种把意识世界和现实物理世界进行融合的个体,但是计算机世界最后可能就“合二为一”了,也就是大家也不可能区分到底什么是虚拟,什么是真实的。就像美国影片《西部世界》一样,可能最后的一种需求就在于享受一种“虚拟”的生活,这种生活就是说我可以就把我的生活贯穿在这个世界中,最后就开始享受这种生活。
我觉得计算机视觉如果从商业最后的发展趋势,或者从资本的角度来讲,可能最后将变成这样,最后跟图形、游戏,跟所有的现实生活融二为一,这可能会是将来。但是,这肯定也存在“两面性”。
董晶:再次感谢各位老师的分享。如果对今天这个议题做一个小结的话,我们主要讨论了学术界跟工业界的GAP,其实是一枚硬币的两个方向,就像我们男人跟女人一样,大家各有所长,优势互补,而且还要不断的沟通,才能够将互补的优势发挥出来,这样才能够共造一个非常和谐、非常美好的未来。
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
专辑 | NLP论文解读
整理不易,还望给个在看!