作者:l季莫_339 | 来源:互联网 | 2024-10-25 23:33
在计算机科学中,存储一个汉字通常需要使用国际编码。以2007年3月24日为例,某个汉字的区位码为2534,其对应的国际码可能是以下选项之一:A.4563H、B.3942H、C.3345H或D.6566H。对于这一问题,希望能有专业人士提供详细的解释,以便更好地理解汉字编码的原理和应用。
2007-03-24
某汉字的区位码是2534,它的国际码是()
A.4563H
B.3942H
C.3345H
D.6566H
我在这方面是完全不懂的,希望高手们有多详细就说多详细,说明白了,50分全给。谢谢!
国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个适用于控制用的,这样每个字节只有127 – 33 = 94个编码用于汉字。 2个字节就有94×94=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码表中的行号,称为区号;低字节对应编码表中的列号,称为位号。
汉字国标码的范围用二进制表示是:00100001(33) 00100001(33)到01111110(126) 01111110(126) (括号中为十进制数), 7 位ASCII码是128个字符组成的字符集。 其中编码值 0到31(000000…全部
国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个适用于控制用的,这样每个字节只有127 – 33 = 94个编码用于汉字。
2个字节就有94×94=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码表中的行号,称为区号;低字节对应编码表中的列号,称为位号。
汉字国标码的范围用二进制表示是:00100001(33) 00100001(33)到01111110(126) 01111110(126) (括号中为十进制数), 7 位ASCII码是128个字符组成的字符集。
其中编码值 0到31(00000000到00011111)对应不可印刷字符,通常称作“控制符”,用于计算机通信中的通信控制或对计算机设备的功能控制。编码值32(00100000)是空格字符SP,编码值127(01111111)是删除字符DEL。
汉字国标码的起始二进制位置选择00100001(33)是为了跳过ASCII码中前32个控制字符和空格字符SP,终止二进制位置选择01111110(126)是为了跳过ASCII码中最后1个删除字符DEL。
因此,汉字国标码的高位和低位分别比对应的区位码大32(十进制数)或00100000(二进制数)或20H(十六进制数),即: 国标码高位 = 区码 + 20H(H表示十六进制),国标码低位 = 位码 + 20H。
区位码是2534(十进制数),区码=25(10)=19H(16),位码=34(10)=22H(16),
国标码高位=19H+20H=39H,低位=22H+20H=42H
区位码=2534,国标码=3942H
答案是B。
。收起