超级计算机26010,全球最强超级计算机搭载的SW26010处理器解析

作者：biosan | 来源：互联网 | 2023-10-17 12:50

全球最强超级计算机神威·太湖之光搭载的申威26010处理器每片处理器包含4个核心，片上的4个核心通过片上网络互联，并通过PCI-E3.0对外连接，每个核心拥有独立的128位DDR3

全球最强超级计算机神威·太湖之光搭载的申威26010处理器每片处理器包含4个核心，片上的4个核心通过片上网络互联，并通过PCI-E 3.0对外连接，每个核心拥有独立的128位DDR3控制器连接到8GB DDR3-2133内存，这样4个核心一共拥有32GB的DDR3内存。

《超级计算机 26010,全球最强超级计算机搭载的SW26010处理器解析》

从这里可以看出SW26010实际上类似于用胶水把4个独立的处理器粘在了一起，整合到了一个芯片里面，但是每个核心还是可以独立工作，而且拥有独立的128bit 8GB内存。这样单个核心的内存带宽达到了34GB/s，整个处理器达到了136GB/s，这样设计最大的好处就是每个核心的带宽是完全独享的，缺点是空闲核心的带宽无法共享给其他核心。

其中每个核心包含一个主处理器(MPE)和一个8*8的计算单元阵列(CPEs)，主处理器是一个64位的RISC架构核心，用来跑操作系统，并且支持264位的矢量指令集，拥有32KB的L1指令缓存和32KB的L1数据缓存(总共64KB L1 cache)，和256KB L2 Cache，应该说这样的缓存配置并不算大，应该是为了节约芯片面积考虑，4个核心的主处理器加起来一共有256KB L1 cache和1MB L2 cache。

计算单元阵列(CPEs)是一个由64个简化的62bit处理器(不是常见的64bit)组成，每个处理器只有16KB的L1指令缓存和64KB本地储存，没有L1数据缓存，并且和主处理器一样支持264位的矢量指令集，单片处理器拥有一共256个这样的计算单元。

于是加上4个主处理器，单片处理器一共拥有260个处理器核心。

《超级计算机 26010,全球最强超级计算机搭载的SW26010处理器解析》

神威·太湖之光的每个处理器卡有两片SW26010处理器，和一共64GB内存，长得像这样，每个处理器算一个计算节点，这样一块处理器卡和intel xeon phi协处理器卡类似，只是intel这样一块计算卡只有区区60个核心，而且不能独立工作，还需要另外购买一个独立的xeon主机作为管理处理器使用。而SW26010处理器集成了管理处理器，可以独立工作，并且单个处理器卡拥有高达520个处理器核心。

《超级计算机 26010,全球最强超级计算机搭载的SW26010处理器解析》

对比一下intel xeon phi计算系统的结构：

《超级计算机 26010,全球最强超级计算机搭载的SW26010处理器解析》

KNC Card就是一块intelXeon Phi协处理器卡，协处理器卡通过PCIE-X16和主处理器相连，其实看上去就像是一台PC上面插着好几块显卡。这样一台PC构成一个计算节点。

对比SW26010处理器的方案，单个节点来看，一块SW26010的核心数量和一台带有4块xeon phi计算卡的功能相当。Intel方案的麻烦在于，这样一个计算节点的功耗和体积远远大于SW26010，而且intel主处理器内存和协处理器卡的内存是分离的，需要先将要处理的数据通过PCI-E x16传输至计算卡内存，然后计算卡才能计算，最后将结果通过PCI-E x16读回主处理器，这样一来一回的性能损失很多时候远大于计算卡带来的好处。

SW26010的主处理器和协处理器的内存是共享的，这样无需来回从协处理器倒腾数据，而且可以实现类似AMD APU的统一内存寻址，大幅度提高了协处理器的使用效率，从这点来说SW26010的方案是优于intel方案的。

从单个核心对比来看，Intel的phi协处理器据说是基于最早的奔腾x86方案改进而成，多了一个512位的矢量处理器，而SW26010只有264位的矢量处理器，phi拥有32KB的L1指令缓存，32KB的L1数据缓存和512KB的L2 缓存，对比SW26010的协处理器只有16KB的L1指令缓存和64KB的本地存储，而且intel的phi核心可以支持4个物理线程，也就是超线程技术，单纯从技术来讲，intel的phi处理器拿出来单挑应该可以吊打单独的SW26010的计算核心。

理论性能可以看出，单个intel的phi处理器是高于SW26010的计算核心，得益于超宽的512位矢量处理器(VPU)，intel phi上的处理器每个时钟可以执行16个单精度运算或8个双精度计算，而SW26010上的计算核心只有一半的宽度，所以最多也就8个单精度和4个双精度，不过SW26010的核心频率是1.45GHz，要比intel phi的1.3GHz稍高，但是这样也很难追平intel的单个核心的理论性能优势。

但是光比理论峰值性能是没有什么意义的，SW26010的VPU虽然比intel phi的宽度小，但是264bit的宽度而不是256bit的宽度可以提供比intel的单双精度浮点更高的计算精度，单精度浮点可以比intel的高一倍，而双精度可以高4倍，这在科学计算中是能够获得更大的优势，而且intel的512bit宽度的矢量运算需要更多的数据来填饱它，加上需要用PCI-E传输数据的瓶颈，大部分时候也只能挨饿，而SW26010可以直接访问主存，因此在实际使用效率上不见得就会比intel phi低多少，并且某些应用场合甚至可能大幅度超过intel。

推荐阅读

int
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
int
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
int
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
int
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
int
使用动态规划算法求解0-1背包问题

本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现，详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]

蜡笔小新 2024-12-27 19:17:15
int
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
int
词根词缀解析：greg、hap、helio及其他词源故事

本文基于刘洪波老师的《英文词根词缀精讲》，深入探讨了多个重要词根词缀的起源及其相关词汇，帮助读者更好地理解和记忆英语单词。 ... [详细]

蜡笔小新 2024-12-27 18:59:50
install
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
int
深入理解Java中的volatile、内存屏障与CPU指令

本文详细探讨了Java中volatile关键字的作用机制，以及其与内存屏障和CPU指令之间的关系。通过具体示例和专业解析，帮助读者更好地理解多线程编程中的同步问题。 ... [详细]

蜡笔小新 2024-12-27 17:26:33
int
C语言实现小写金额转换为大写金额

在金融和会计领域，准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据，还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法，确保数据的标准化和规范化。 ... [详细]

蜡笔小新 2024-12-27 12:39:06
int
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
int
从 .NET 转 Java 的自学之路：IO 流基础篇

本文详细介绍了 Java 中的 IO 流，包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据，并结合编码机制确保字符数据的正确读写。同时，文中还涵盖了装饰设计模式的应用，以及多种常见的 IO 操作实例。 ... [详细]

蜡笔小新 2024-12-26 17:37:25
int
PHP 5.5.0rc1 发布：深入解析 Zend OPcache

2013年5月9日，PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版，这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]

蜡笔小新 2024-12-26 12:56:20
int
计算机图形学实训：OpenGL入门与直线光栅化算法

本教程涵盖OpenGL基础操作及直线光栅化技术，包括点的绘制、简单图形绘制、直线绘制以及DDA和中点画线算法。通过逐步实践，帮助读者掌握OpenGL的基本使用方法。 ... [详细]

蜡笔小新 2024-12-26 12:24:25
int
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39

biosan

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章