当前位置: 开发笔记 > 编程语言 > 正文

ANSI

作者：Still丶某某_546 | 来源：互联网 | 2023-10-14 11:04

ANSI是什么编码？用Notepad创建一个文本文件text.txt，其默认编码格式为ANSI（乍看之下，还以为是ASCII

ANSI是什么编码&＃xff1f;

用Notepad&＃43;&＃43;创建一个文本文件text.txt&＃xff0c;其默认编码格式为ANSI&＃xff08;乍看之下&＃xff0c;还以为是ASCII呢&＃xff09;&＃xff0c;输入汉字居然不是乱码&＃xff1a;

保存为test.txt&＃xff0c;发送给你美国的同事Bob。他也用Notepad&＃43;&＃43;&＃xff0c;不幸的是&＃xff0c;却发现你的文件内容是这样的&＃xff1a;

也许你会认为&＃xff1a;你用的是中文系统&＃xff0c;能正常显示中文&＃xff1b;他用的是英文系统&＃xff0c;不能显示中文&＃xff01;

这么想&＃xff0c;好像很有道理呢&＃xff01;

但是再细想一下&＃xff1a;一个系统显示乱码&＃xff0c;说明它不支持这种编码格式&＃xff08;或者解码方式不对&＃xff09;。难道英文系统不支持ANSI&＃xff1f;难道ANSI是一种中文编码&＃xff1f;

如果你身边有一个韩文系统&＃xff0c;也装一个Notepad&＃43;&＃43;&＃xff0c;默认还是ANSI编码&＃xff0c;你可以输入“한국어”&＃xff0c;发现也能正常显示&＃xff1a;

但是你要输入“汉字”可能就会发现是乱码了...

通过这个反例&＃xff0c;就可以说明ANSI不是一种中文编码。那么&＃xff0c;ANSI到底是什么编码&＃xff1f;

用十六进制编辑器打开内容为“汉字”的test.txt文件&＃xff1a;

你会发现&＃xff1a;其中baba和d7d6正好是“汉”和“字”两个字的GBK编码值。

同样&＃xff0c;用十六进制编辑器打开内容为“한국어”的test.txt文件&＃xff1a;

你会发现&＃xff1a;其中c7d1、b1b9和beee正好是“한”、“국”和“어”三个字符的EUC-KR编码值。

由此可以看出&＃xff1a;其实ANSI并不是某一种特定的字符编码&＃xff0c;而是在不同的系统中&＃xff0c;ANSI表示不同的编码。你的美国同事Bob的系统中ANSI编码其实是ASCII编码&＃xff08;ASCII编码不能表示汉字&＃xff0c;所以汉字为乱码&＃xff09;&＃xff0c;而你的系统中&＃xff08;“汉字”正常显示&＃xff09;ANSI编码其实是GBK编码&＃xff0c;而韩文系统中&＃xff08;“한국어”正常显示&＃xff09;ANSI编码其实是EUC-KR编码。

话说计算机是由美国佬搞出来的嘛&＃xff0c;他们觉得一个字节&＃xff08;可以表示256个编码&＃xff09;表示英语世界里所有的字母、数字和常用特殊符号已经绰绰有余了&＃xff08;其实ASCII只用了前127个编码&＃xff09;。后来欧洲人不干了&＃xff0c;法国人说&＃xff1a;我需要在小写字母加上变音符号&＃xff08;如&＃xff1a;é&＃xff09;&＃xff0c;德国人说&＃xff1a;我也要加几个字母&＃xff08;Ä ä、Ö ö、Ü ü、ß&＃xff09;。于是&＃xff0c;欧洲人就将ASCII没用完的编码&＃xff08;128-255&＃xff09;为自己特有的符号编码&＃xff08;后来称之为“扩展字符集”&＃xff09;。等到我们中国人开始使用计算机的时候&＃xff0c;尼玛&＃xff0c;256个编码哪够&＃xff1f;我泱泱大中华&＃xff0c;汉字起码也得N多万吧&＃xff0c;就连小学生都得要求掌握两三千字。国标局最后拍板&＃xff1a;一个字节不够&＃xff0c;那我们就用多个字节来为汉字编码吧&＃xff0c;但是&＃xff0c;国情那么穷&＃xff0c;字节那么贵&＃xff0c;三个字节伤不起&＃xff0c;那就用俩字节吧&＃xff0c;先给常用的几千汉字编个码&＃xff0c;等以后国家强盛了人民富裕了&＃xff0c;咱再扩展呗---于是GB2312就产生了。台湾同胞一看&＃xff0c;尼玛&＃xff0c;全是简体字&＃xff0c;还让不让我们写繁体字的活了&＃xff0c;于是台湾同胞也自己弄了个繁体字编码---大五码&＃xff08;Big-5&＃xff09;。同时&＃xff0c;其它国家也在为自己的文字编码。最后&＃xff0c;微软苦逼了&＃xff1a;顾客就是上帝啊&＃xff0c;你们的编码我都得满足啊&＃xff0c;这样吧&＃xff0c;卖给美国国内的系统默认就用ASCII编码吧&＃xff0c;卖给中国人的系统默认就用GBK编码吧&＃xff0c;卖给韩国人的系统默认就用EUC-KR编码&＃xff0c;...但是为了避免你们误会我卖给你们的系统功能有差异&＃xff0c;我就统一把你们的默认编码都显示成ANSI吧。---本故事纯属虚构&＃xff0c;但“ANSI编码”确实只存在于Windows系统。

那么Windows系统是如何区分ANSI背后的真实编码的呢&＃xff1f;

微软用一个叫“Windows code pages”&＃xff08;在命令行下执行chcp命令可以查看当前code page的值&＃xff09;的值来判断系统默认编码&＃xff0c;比如&＃xff1a;简体中文的code page值为936&＃xff08;它表示GBK编码&＃xff0c;win95之前表示GB2312&＃xff0c;详见&＃xff1a;Microsoft Windows&＃39; Code Page 936&＃xff09;&＃xff0c;繁体中文的code page值为950&＃xff08;表示Big-5编码&＃xff09;。

我们能否通过修改Windows code pages的值来改变“ANSI编码”呢&＃xff1f;

命令提示符下&＃xff0c;我们可以通过chcp命令来修改当前终端的active code page&＃xff0c;例如&＃xff1a;
(1) 执行&＃xff1a;chcp 437&＃xff0c;code page改为437&＃xff0c;当前终端的默认编码就为ASCII编码了&＃xff08;汉字就成乱码了&＃xff09;&＃xff1b;
(2) 执行&＃xff1a;chcp 936&＃xff0c;code page改为936&＃xff0c;当前终端的默认编码就为GBK编码了&＃xff08;汉字又能正常显示了&＃xff09;。
上面的操作只在当前终端起作用&＃xff0c;并不会影响系统默认的“ANSI编码”。&＃xff08;更改命令行默认codepage参看&＃xff1a;设置cmd的codepage的方法&＃xff09;。

Windows下code page是根据当前系统区域&＃xff08;locale&＃xff09;来设置的&＃xff0c;要想修改系统默认的“ANSI编码”&＃xff0c;我们可以通过修改系统区域来实现&＃xff08;“控制面板” &＃61;>“时钟、语言和区域”&＃61;>“区域和语言”&＃61;>“管理”&＃61;>“更改系统区域设置...”&＃xff09;&＃xff1a;

图中的系统locale为简体中文&＃xff0c;意味着当前“ANSI编码”实际是GBK编码。当你把它改成Korean(Korea)时&＃xff0c;“ANSI编码”实际是EUC-KR编码&＃xff0c;“한국어”就能正常显示了&＃xff1b;当你把它改成English(US)时&＃xff0c;“ANSI编码”实际是ASCII编码&＃xff0c;“汉字”和“한국어”都成乱码了。&＃xff08;改了之后需要重启系统的。。。&＃xff09;

说明&＃xff1a;locale是国际化与本地化中重要的概念&＃xff0c;本文不深入讲解该内容。

你上面说的都是windows的情形吧&＃xff0c;Linux呢&＃xff1f;

将前述内容为“汉字”的文件test.txt拷贝至Linux下&＃xff0c;用Emacs打开&＃xff1a;

也是乱码&＃xff01;原因也是locale的问题&＃xff1a;

更改locale后再打开&＃xff1a;

正常显示了。。。

转载于:https://www.cnblogs.com/kakaisgood/p/11506794.html

推荐阅读

char
HTTP请求与响应机制详解

本文深入探讨了HTTP请求和响应对象的使用，详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外，还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]

蜡笔小新 2024-12-23 20:40:08
foreach
实用正则表达式有哪些

小编给大家分享一下实用正则表达式有哪些，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下 ... [详细]

蜡笔小新 2024-12-22 13:59:04
go
嵌入式开发环境搭建与文件传输指南

本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境，并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]

蜡笔小新 2024-12-22 13:38:48
ascii
CIW Dreamweaver MX2004 认证考试题库解析

本文提供了 CIW Dreamweaver MX2004 认证考试的详细试题解析，涵盖不同难度级别的选择题、多项选择题和判断题。通过这些题目，考生可以更好地理解考试内容并为实际考试做好准备。 ... [详细]

蜡笔小新 2024-12-21 19:00:53
ascii
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
go
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
char
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
get
android知识杂记（三）

andr ... [详细]

蜡笔小新 2024-12-26 13:29:32
get
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
char
PHP 过滤器详解

本文深入探讨了 PHP 中的过滤器机制，包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时，详细介绍了各种过滤器的用途和用法。 ... [详细]

蜡笔小新 2024-12-23 19:05:02
ip
ABBYY FineReader：高效PDF转换、精准OCR识别与文档对比工具

在处理PDF转换和OCR识别时，您是否遇到过格式混乱、识别率低或图表无法正常识别的问题？ABBYY FineReader以其强大的功能和高精度的识别技术，完美解决这些问题，帮助您轻松找到最终版文档。 ... [详细]

蜡笔小新 2024-12-21 23:24:02
ip
配置SecureCRT以显示Linux终端颜色

本文介绍如何配置SecureCRT以正确显示Linux终端的颜色，并解决中文显示问题。通过简单的步骤设置，可以显著提升使用体验。 ... [详细]

蜡笔小新 2024-12-19 18:30:14
ascii
Node.js 中可写流的默认编码设置方法

本文介绍了如何在 Node.js 中使用 `setDefaultEncoding` 方法为可写流设置默认编码，并提供了详细的语法说明和示例代码。 ... [详细]

蜡笔小新 2024-12-22 10:44:58
char
C语言数据类型详解

本文详细介绍了C语言中的基本数据类型，包括整型、浮点型、字符型及其各自的子类型，并探讨了这些类型在不同编译环境下的表现。 ... [详细]

蜡笔小新 2024-12-20 15:03:51
ascii
一个登陆界面

预览截图html部分123456789101112用户登入1314邮箱名称邮箱为空15密码密码为空16登 ... [详细]

蜡笔小新 2024-12-20 09:57:07

Still丶某某_546

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章