有兴趣的同学可以移步笔者的个人博客 更多博客
基本概念
在计算机中,二进制数据有三种形式:原码、反码和补码,要弄清楚补码的意义,首先让我们来了解三种形式的定义。
假设字长为4,其中最高位为符号位:正数为0,负数为1。剩下的3位表示该数的绝对值。
正数的原码反码补码都是一样的。
1.原码
+3的原码:0011
-3的原码:1011
2.反码
反码就是在原码的基础上,符号位不变其他位按位取反(就是0变1,1变0)就可以了。
+3的反码:0011
-3的反码:1100
3.补码
补码也非常的简单,就是在反码的基础上按照正常的加法运算加1。
+3的补码:0011
-3的补码:1101
从前面的三种数字编码类型的定义,我们可以看出数据的原码,使用符号位来区分了正负数,更加符合人脑直观识别并且用于计算的表达方式。但是在计算机中,是通过补码的形式保存数据,下面将解释为什么计算机系统要用补码存放数据。
周期系统
若一组事件或现象按同样的顺序重复出现,则把完成这一组事件或现象的时间或空间间隔,称为周期。
周期性原码累加系统
定义一个字长为4的二进制累加系统,该系统的规则就是从左到右依次累加0001;
0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 | 0000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 0 |
如果最高位是符号位时,图表第二行表示原码对应的10进制数,不难发现,如果在确定字长为4时,累加过程是符合周期性变化的,原因就是当1111+1时会出现字节溢出的情况,10000的最高位溢出失效,导致结果变为0000;
周期性时钟系统
在现实生活中,时钟显然是符合周期性的,12点过后是1点,人们早已习惯了这种思维方式,所以会忽略对时钟这种表示时间方式的思考。凌晨12点加1个小时,其实表式的时间是天数加1之后的1点,但是对于时钟系统而言,天数不是自己所能表示的,这就相当于上面图表中1111+1=0000(1|0000 1是溢出位,在字长为4的系统中是不能表示的)。
时钟系统和二进制数原码的累加系统都有周期性,具有周期性的原因是当前层次系统中有其不能表示或未能感知的其他层次系统。
计算机运算系统正是利用了周期性的这一特性。
周期系统中的加减转化
时钟系统加减法转化
假设时针向顺时针方向拨动为加,逆时针拨动为减。
7点顺时针拨动1格表示的是:7+1=8
7点逆时针拨动1格表示的是:7-1=6
7点顺时针拨动11格表示的是:7+11=6
所以很容易发现,在时钟中7-1=7+11,这就是周期系统中加减法发的转化方式,其实和简单,也很符合我们的直觉。
所以重新考虑原码的减法问题,n-m = n+(MAX-m),其中MAX就是该周期中所能表示的所有数的数量,放到上面原码的例子中就是16个,而放到时钟系统中就是12个。如:
周期性的时钟系统:
12 - 1 = 12 + (12 -1);
7 - 4 = 7 +(12-4);
累加系统加减法转化
在说原码累加系统加减法转化例子之前,我们再看下图表
A | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1000 | 1001 | 1010 | 1011 | 1100 | 1101 | 1110 | 1111 | 0000 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A1 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 0 |
A2 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | -0 | -1 | -2 | -3 | -4 | -5 | -6 | -7 | 0 |
B | 0000 | 0001 | 0010 | 0011 | 0100 | 0101 | 0110 | 0111 | 1111 | 1110 | 1101 | 1100 | 1011 | 1010 | 1001 | 1000 | 0000 |
B1 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | -7 | -6 | -5 | -4 | -3 | -2 | -1 | -0 | 0 |
B2 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 | 0 |
为了方便说明在每一行的开始定义了该行的名称分别为A、A1、A2、B、B1、B2.
累加系统不同于周期系统的一点是会有负数的概念出现,A2行就是最高位表示符号位时原码解码后表示的十进制数。在图表中发现,当有符号位时二进制原码的累加转换为十进制数时,出现了与我们现实生活数学公理相违背的现象,错误发生在最高位为1后,如1001+1=1010(-1+1=-2),原因是在定义这个累加系统在运算时就没有让系统知道高位0与1有不同之处,也就是累加的计算过程中无法感知符号。
解决问题的方式有两种
- 去重新完善这个累加系统,让他在最高位为1换一套计算方式,也就是说在运算过程中去感知最高位的意义。
- 转化出现问题的状态,使状态转移为当前系统能使用的,也就是在编码过程中去让无法感知符号的运算系统计算出正确的结果。
在计算机系统中,解决这个问题的方式显然是用第二种,cpu是无法感知符号位的,这样做可以减少cpu设计难度,极大地提高运行效率。
所以也就是说cpu运算时还是按照A行进行累加,但在解码运算结果时做一些处理,即将A转变为B,而B1是不考虑溢出和临界值时的十进制正确结果。A解码为B的算法就是当最高位为1时,符号位不变,其他位取反,不难发现这就是反码的定义。
当这样转化后会发现出现了0和-0两个0并且会出现0 - 1 = -0这种情况(将0向左移动)。所以还得做一个简单的处理,就是去加一个1,也就是B1转化为B2,而B2就是最终的正确十进制值。
其实按照直觉可以发现,当符号位转化时,其他位应该取反才能得到正确结果,正数越加越大,负数越加越小。
根据我们的努力将A通过反码的解码方式转变为B,而让B的解码结果加1(补码),得到了B2,从而使累加系统当出现负数时变得合理起来。在转变为B2之后,我们需要解决的是如何用累加系统去表示减法。本质上和前面的时钟系统转化是一样的。可以借助上面的时钟系统以及下面的例子去理解累加系统的减法运算。
在看例子之前,稍微介绍一下“模” 的概念:
模是指一个计量系统的计数范围,取模运算实质上是计量器产生“溢出”的量,前面的周期系统中n-m = n+(MAX-m)得出的加减转化其实就是用到了模的概念,MAX就是模。
计算 4 - 3
- 编码 0100 - 0011
//n-m = n+(MAX-m) ==》(10000-0011) 其结果就是0011的补码
转化为 0100 + (10000-0011) = 0100 + 1101
cpu调用加法器得出 10001
最高位溢出 0001
解码 1
重新计算 3 - 4
编码 0011 - 0100
转化为 0011 + (10000-0100) = 0011 + 1100
cpu调用加法器得出 1111
//参考A转变B2(也就是原码转补码)
- 解码-0001= -1
总结
在计算机系统中,计算整数加减法时,需要经过以下步骤:
-
转变为2进制数;
-
运算时原码解码为补码;n-m = n+(MAX-m),(MAX-m)也就是m的补码,理解时参考时钟系统。
-
cpu调用加法器;
-
解码;再进行一次补码解码,理解时参考A转化为B2。