热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

计算机基础知识:存储一个汉字所需的国际编码是什么?

在计算机科学中,存储一个汉字通常需要使用国际编码。以2007年3月24日为例,某个汉字的区位码为2534,其对应的国际码可能是以下选项之一:A.4563H、B.3942H、C.3345H或D.6566H。对于这一问题,希望能有专业人士提供详细的解释,以便更好地理解汉字编码的原理和应用。

《在计算机中存储一个汉字需要的国际码是什么,计算机基础知识问题25》

2007-03-24

某汉字的区位码是2534,它的国际码是()

A.4563H

B.3942H

C.3345H

D.6566H

我在这方面是完全不懂的,希望高手们有多详细就说多详细,说明白了,50分全给。谢谢!

国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个适用于控制用的,这样每个字节只有127 – 33 = 94个编码用于汉字。 2个字节就有94×94=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码表中的行号,称为区号;低字节对应编码表中的列号,称为位号。

汉字国标码的范围用二进制表示是:00100001(33) 00100001(33)到01111110(126) 01111110(126) (括号中为十进制数), 7 位ASCII码是128个字符组成的字符集。 其中编码值 0到31(000000…全部

国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个适用于控制用的,这样每个字节只有127 – 33 = 94个编码用于汉字。

2个字节就有94×94=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码表中的行号,称为区号;低字节对应编码表中的列号,称为位号。

汉字国标码的范围用二进制表示是:00100001(33) 00100001(33)到01111110(126) 01111110(126) (括号中为十进制数), 7 位ASCII码是128个字符组成的字符集。

其中编码值 0到31(00000000到00011111)对应不可印刷字符,通常称作“控制符”,用于计算机通信中的通信控制或对计算机设备的功能控制。编码值32(00100000)是空格字符SP,编码值127(01111111)是删除字符DEL。

汉字国标码的起始二进制位置选择00100001(33)是为了跳过ASCII码中前32个控制字符和空格字符SP,终止二进制位置选择01111110(126)是为了跳过ASCII码中最后1个删除字符DEL。

因此,汉字国标码的高位和低位分别比对应的区位码大32(十进制数)或00100000(二进制数)或20H(十六进制数),即: 国标码高位 = 区码 + 20H(H表示十六进制),国标码低位 = 位码 + 20H。

区位码是2534(十进制数),区码=25(10)=19H(16),位码=34(10)=22H(16),

国标码高位=19H+20H=39H,低位=22H+20H=42H

区位码=2534,国标码=3942H

答案是B。

。收起


推荐阅读
author-avatar
l季莫_339
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有