作者:ekuuu | 来源:互联网 | 2023-10-12 21:36
存储器是计算的重要组成部分,内存和硬盘都是存储设备,硬盘这种持久化存储设备也是一个IO设备。
软件开发中,当遇到服务端的请求响应时间长,吞吐率不够的情况下,在分析对应问题的时候,很多时候发现主要瓶颈不在CPU,而在IO。
理解存储器的层次结构
通常我们把信息和数据存储在书、文件这样的物理介质里面,有了计算机之后,通常把数据存储在计算机的存储器里面。
存储器系统是一个通过各种不同的方法和设备,一层一层集合起来的系统。
- CPU可以比喻为计算机的大脑,思考的东西好比CPU中的寄存器。寄存器是CPU本身的一部分,只能存放极其有限的信息,但是速度非常快,和CPU同步。
- 大脑中的记忆,好比CPU Cache(CPU 高速缓存)。CPU Cache用的是一种叫SRAM(Static Random-Access Memory 静态随机存取存储器)的芯片。
SRAM
之所以称为"静态"存储器,是因为只要处在通电状态,里面的数据就可以保持存在,一旦断电,里面的数据就丢失了。
在SRAM里,一个比特的数据,需要6-8个晶体管,所以SRAM存储密度不高,同样的物理空间下,能存储的数据有限,不过因为SRAM电路简单,所以访问速度非常快。
CPU里,通常会有L1、L2、L3这样的三层高速缓存。
- 每个CPU核心有一块属于自己的L1高速缓存,通常分为指令缓存和数据缓存,分别存放CPU使用的指令和数据。L1的cache往往就嵌入在CPU核心的内部。
- L2的Cache同样是每个CPU核心都有的,不过它往往不在CPU核心的内部,所以L2 Cache的访问速度会比L1稍微慢一些。
- L3 Cache,通常是多个CPU核心共用的,尺寸会更大一些,访问速度自然也就更慢一些。
可以做以下类比
- CPU中的L1 Cache是我们的短期记忆,L2/L3是长期记忆,内存是我们的书架。
- 当我们自己的记忆里没有资料的时候,可以从书架上拿书来看,这个过程相当于数据从内存中加载到CPU寄存器和Cache中,通过大脑,也就是CPU通过处理和运算。
DRAM
- 内存用的芯片和Cache不同,是一种叫DRAM(Dynamic Random Access Memory,动态随机存取存储器)的芯片,比起SRAM,它的密度更高,有更大的容量,比SRAM芯片便宜不少。
- DRAM被称为动态存储器,是因为DRAM需要靠不断的刷新,才能保持数据被存储起来。
- DRAM的一个比特,只需要一个晶体管和一个电容就能存储,所以DRAM再同样的物理空间下,能够存储更多的数据,存储密度更大。
- 因为数据是存储在电容里的,电容会不断漏电,所需需要定时刷新充电,才能保证数据不丢失。
- DRAM的数据访问电路和刷新电路都比SRAM复杂,所以延时也就更长。
存储器的层次结构
整个存储器的层次结构,其实都类似于SRAM和DRAM在性能和价格上的差异。
- SRAM更贵,速度更快。DRAM更便宜,容量更大。
- 大脑CPU中的记忆 L1 Cache,不仅受到成本的限制,还收到物理层面的限制。
- L1不仅昂贵,其访问速度和它到CPU的距离有关
- 芯片越大,总有部分离CPU会变远。
- 电信号传输速度受物理原理的限制,没法超过光速
- 内存的空间一般都是有限的,想扩大空间的话,成本就会很高,于是,想要放下更多的书,就要寻找更加廉价的解决方案。
- 通过公共图书馆来解决,对于内存来说,SSD(Solid-state drive 或 Solid-state disk,固态硬盘) ,HDD(Hard Disk Drive,硬盘),这些被称为硬盘的外部存储设备,就是公共图书馆。
CPU Cache是从内存里加载而来的,或者写回内存,不会直接写回数据到磁盘,也不会直接从硬盘加载数据到CPU Cache中,而是先加载到内存,再从内存加载到Cache中。
各个存储器只和相邻的一层存储器打交道,并且随着一层层向下,存储器的容量逐层增大,访问速度逐层变慢,而单位存储成本也逐层下降,这就构成了我们的存储器层次结构。
如何权衡存储器的价格和性能
存储器不同层级之间的性能差异和价格差异,都至少在一个数量级以上。
L1 Cache的访问延时是1纳秒,内存的访问是100纳秒。两者价格上差了400倍。
各个存储器成本对比表格