来自美国桑迪亚国家实验室先进设备技术部的计算机工程师 Erik DeBenedictis 是 IEEE重启计算计划(Rebooting Computing initiative)与国际半导体技术蓝图 (ITRS) 的成员,致力于为计算和超级计算的未来铺就道路。
2015年11月15号到20号在德克萨斯州奥斯汀市举行的国际高性能计算、网络、存储及分析大会(SC15, International Conference for High Performance Computing, Networking, Storage and Analysis)上,在名为「超越摩尔定律」的分会上, DeBenedictis 提到了几个未来超算的可行方向:毫伏开关(the millivolt switch), 3D集成技术(3-D integration),专门化架构 (specialized architecture)。
下面是精简和编辑后的采访内容:
IEEE Spectrum: 「超越摩尔定律」会议讨论了三个可能用在10的18次方级的超算的技术领域,分别是毫伏开关、 3D集成技术和专门化架构 ,其中哪个技术与会者最感兴趣呢?
Erik DeBenedictis:我认为,与会者完全明白存在的问题是什么。他们意识到,如果这些领域都能实现的话,它们都会是理想的选择。特别要提的是,我们并不知道毫伏开关 什么时候能实现。有一小部分人认为:「我只对其中的某一个方向感兴趣。」而其他人很多都是超算的直接用户。他们都在找寻超算的未来。我认为我们至少已经说服他们充分关注所有的可能性。
在讨论过程中,我们统计了一下谁对哪些技术领域感兴趣。结果基本上平分秋色。但是,还是很多人对所有三个方向都感兴趣。
IEEE Spectrum: 在会上,你有没有听到什么对于超算未来的新想法?
Erik DeBenedictis: 我发现一件事,就是很多人在门外进不来。比如,我们有的房间只能容纳40人但是却有大约80人想进来听报告。我记得当时,房间已经坐满了人,其他的朋友只能在门外探个脑袋往里面伸。我想这些事实告诉我们,这个领域是很有意思的。我们今后应该扩大会议的规模。
IEEE Spectrum: 让人有点意外的是大会里没有太多其它分会是关于超算的未来。
Erik DeBenedictis: 穿过大厅,有一个小组讨论的是未来的超算技术。其中包括了量子计算和类脑计算(neuromorphic computing)。这个讨论会所在的房间也是只能站着的。估计参加他们这个讨论的人是我们的五倍。那个房间整个被他们填满了。
现在,让我感到有点意外的是那个小组讨论本质上很不一样。我们小组所讨论的东西所带来的超算,可以被他们实际用在目前得以应用中。然而,量子计算和类脑计算都不能取代当前的大多数超算应用。
IEEE Spectrum: 面对超算的未来,你下一步的计划是什么?
Erik DeBenedictis:超算业界的兴趣点是整个计算产业的子集。从某些方面来说,超算面临的压力会变得越来越大,因为近年来,他们将对逻辑部分(如浮点逻辑)的使用和需求拉得非常高了。在达到物理极限之前,能改进的空间很小。
政府部门(比如美国国家战略计算计划)正越来越关注利用类脑计算进行的数据分析和学习技术。由于这些领域在过去所受的关注较少,所以能比较轻松出成果;用较少的投入获得更多的技术。这就是IEEE重启计算计划的工作重点。但是,我们也会继续支持超算。因为需求总是存在的,但是它们的需求潜力目前比较小;需要较高成本才能获得新的成果。
IEEE Spectrum: 在广阔的计算工业领域,超算能够相对轻松地从技术发展中获益吗?
Erik DeBenedictis: 回答是不确定。工业界会投入数十亿资金研发手机芯片,却不会为超算投入那么多。但是同时许多的技术也随着发展。不过,这些技术只是部分开放的。
IEEE Spectrum: 是因为技术不能直接用于超算?
Erik DeBenedictis: 工业界不会专门为超级计算机的架构(例如浮点格式)进行研发,这就是留给我们的任务。
IEEE Spectrum: 超级计算机的用户需要更多地了解当前的技术趋势吗?
Erik DeBenedictis: 仅仅知道是不够的,应该未雨绸缪。一般来说,软件的生命周期比硬件要长很多。在桑迪亚国家实验室,一台超级计算机的寿命是3到4年,但之前还有3到4年的准备期,整个周期就是6到8年。另外,需要更长的时间来建立相应的软件系统。
只需区区几代的时间,我们就会到达将现有超算扩大化的尽头。如果你可以知道一台超级计算机在它的下半段生命周期会需要什么样的软件,那你为什么不写一个适用于硬件整个生命周期的软件,因为你已经能预测它了?至少,我们应该让软件工程师理解运行软件的机器在10~15年之后会是什么样。
IEEE Spectrum: 也就是说,到目前为止,软件和硬件的开发人员不能进行非常好的沟通?
Erik DeBenedictis: 给你举个例子。当多核处理器在大概2003年间问世的时候,它搅乱了当时所有的事情,因为大家当时都觉得我们可以做比以前更多的并行处理了。程序员们知道这个消息太迟了。没有任何提示的情况下,具有较低时钟频率的双核处理器一经问世,就让程序员们惊呆了。因为他们的程序不再适用于多核处理器。
类似的事情现在正在发生。我们看到,比如Intel的Xeon Phi处理器和GPU加速等,它们这些技术提供额外的线程比如GPU线程;它们速度虽然慢,但是数量大。目前,没人真正在思考怎样在这样的处理器上编写代码。有人在思考如何编程使超算的速度再提升10倍吗?目前来看,对这方面的关注还不够。
本文转自d1net(转载)