热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Mac系统下TXT文件无法打开——“简体中文(MacOS)”文本编码不兼容问题分析与解决

在苹果机上读取txt文件时,有的会打不开,出现提示:文本编码“简体中文(macos)”不适用。该文件可能已使用了不同的文本编码来存储,或者可能不是文本文件。这是由于文件不同编码造
在苹果机上读取txt文件时,有的会打不开,
出现提示: 文本编码“简体中文(mac os)”不适用。该文件可能已使用了不同的文本编码来存储,或者可能不是文本文件。这是由于文件不同编码造成的。
 
技术分享
 
在mac上面有2种中文编码:
一种是:和windows一样的中文(GB 18030)
一种是:简体中文(Mac OS)
两种编码不一样
 
解决办法:
打开文本编辑—偏好设置——打开和存储——纯文本文件编码——打开文件——选择“中文(GB 18030)” 
 
技术分享
 
 

附:

国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,是我国计算机系统必须遵循的基础性标准之一。

 GB18030主要有以下特点:

  • UTF-8相同,采用多字节编码,每个字可以由1个、2个或4个字节组成。
  • 编码空间庞大,最多可定义161万个字符。
  • 支持中国国内少数民族的文字,不需要动用造字区。
  • 汉字收录范围包含繁体汉字以及日韩汉字

目前,GB18030有两个版本:GB18030-2000和GB18030-2005。GB18030-2005是最新版本。

GB18030-2000是GBK的取代版本,它的主要特点是在GBK基础上增加了CJK统一汉字扩充A的汉字。

GB18030-2000编码标准是由信息产业部和国家质量技术监督局在2000年 3月17日联合发布的,并且将作为一项国家标准在2001年的1月正式强制执行。

GB18030-2005的主要特点是在GB18030-2000基础上增加了CJK统一汉字扩充B的汉字。

GB18030-2005《信息技术中文编码字符集》是我国自主研制的以汉字为主并包含多种我国少数民族文字(如藏、蒙古、傣、彝、朝鲜、维吾尔文等)的超大型中文编码字符集强制性标准,其中收入汉字70000余个。 

GB18030-2005与GB18030-2000的编码体系结构是完全相同的。

2000年发布的GB18030-2000,全名是《信息技术 汉字编码字符集 基本集的扩充》。GB18030-2000仅规定了常用非汉字符号和27533个汉字(包括部首、部件等)的编码。

GB18030-2000是全文强制性标准,市场上销售的产品必须符合。 

2005年发布的GB18030-2005在GB18030-2000的基础上增加了42711个汉字和多种我国少数民族文字的编码,增加的这些内容是推荐性的。

GB18030-2005为部分强制性标准,自发布之日起代替GB18030-2000。

GB18030,最新版本为GB18030-2005,其全称为中华人民共和国国家标准GB 18030-2005《信息技术 中文编码字符集》,是中华人民共和国现时最新的内码字集,是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》的修订版。与GB2312-1980完全兼容,与GBK基本兼容,支持GB 13000及Unicode的全部统一汉字,共收录汉字70244个。

GB18030标准的初版是GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》,它是由中华人民共和国信息产业部电子工业标准化研究所、北京大学计算机技术研究所、北大方正集团、北京方正新天地信息网络科技有限责任公司、四通集团公司、中科院软件所、长城软件公司、四通利方公司、中软总公司、金山软件公司、联想公司起草,由国家质量技术监督局于20003月17发布。

GB 18030标准从生效之日期起,同时代替原国家技术监督局标准化司和原电子工业部科技与质量监督司联合以技监标函1995229号文发布和实施的技术规范指导性文件《汉字内码扩展规范(GBK)》1.0版。

现行版本GB 18030-2005《信息技术 中文编码字符集》为GB 18030标准的第一次修订版,由国家质量监督检验总局和中国国家标准化管理委员会于200511月8发布,20065月1日实施。本标准的单字节编码部分、双字节编码部分和四字节编码部分的CJK统一汉字扩充A(即0x8139EE39--0x82358738)部分为强制性。本标准代替GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》。

GB 18030-2000,兼容 Unicode 3.0 中日韩统一表意文字,共收27533个汉字;2000年3月17日发布

GB 18030-2005,更新至 Unicode 4.1 中日韩统一表意文字及增加少数民族文字,共有70244个汉字;2005年11月8日发布、2006年5月1日实施

GB 18030与Unicode的关系

GB 18030是一种对字符集的多字节编码格式,相当于UTF-8(对Unicode码点(code point)的编码传输格式),而且都是向后兼容ASCII,并且能表示所有的Unicode码点。GB 18030的四字节编码共有1,587,600 (126×10×126×10), 足以覆盖Unicode的1,111,998 (17×65536 ? 2048 surrogates ? 66 noncharacters)码点。此外,GB18030还向后兼容了GB 2312与GBK编码。与Unicode码点的映射关系(mapping)一部分要查表,其它可以通过算法求出,这与UTF-8相比不够方便。

mac中txt文件打不开—— 文本编码“简体中文(mac os)”不适用 (转载)


推荐阅读
  • Java集合框架面试问题精编与解析
    简介java集合类是java.util包中的重要内容。java集合框架包含了大量集合接口以及这些接口的实现类和操作他们的算法。java集合框架图主要提供的数据结构+List又称有序 ... [详细]
  • 1变量1.1变量的分类系统变量:全局变量:会话变量:自定义变量:用户变量:局部变量:全局变量:会话变量:用户变量:局部变量:1.2系统变量1.2.1系统变量的基本介绍变量是由系统提 ... [详细]
  • Phoenix 使用体验分享与深度解析
    闲来无事看了下hbase方面的东西,发现还好理解不过不大习惯于是找到个phoenix感觉不错性能指标如下好像还不错了准备工作:启动hadoop集群启动zookkeeper启动hba ... [详细]
  • 在继承过程中遇到的困惑与挑战(依然感到迷茫)
    #includeusingnamespacestd;classFather{public:Father(){coutffcf;coutfc;coutcf;coutf; ... [详细]
  • ATL(ActiveTEmplateLibrary)活动模板库RPC(RemoteProcedureCallProtocol)远程过程调用协议DCE(DistributedComp ... [详细]
  • 之前一直想着建图。。。遍历可是推例子都不正确后来看数据好像看出了点规律就抱着试一试的心态水了一下就。。。。过了。。。。。后来想想我的思路还是对的先抽象当前仅仅有两个点相连想要拆分耗 ... [详细]
  • 关于Ajax异步请求(实时刷新)
    1.需求:想要做成动态实时刷新获取数据库的值2.例子3.代码逻辑:varSeconds10000;varurl' ... [详细]
  • 将自己学的知识整合了一下,弄了个小的图论系统。有关知识请看:http:blog.csdn.netcolumndetailstulun.html#include#i ... [详细]
  • CGPathAddArc & CGPathAddArcToPoint
    CGPathAddArc&CGPathAddArcToPoint参考:http:blog.csdn.netxcysuccess3articledetails24001571CGPa ... [详细]
  • List.toArray()用法:1)java中的强制类型转换只能转换单个对象,所以不能使用这样的代码将 toArray返回的数组强转为String[]String[]strs( ... [详细]
  • 昨晚八点玩着游戏,母亲来电,告知中秋买的眼睛镜框太重,她又一个人去换了一副新的,在她的要求下,眼睛店并没有额外收她的钱,而我也不知道是否新换的眼睛框是否价格上有差异。其实自己从大三 ... [详细]
  • 现在很多人有钱了,都会给自己的父母买套新房,以供他们颐养天年。现在老年人搬新家也成了常有的事。但是多数老年人迷信,都相信好的环境有利于老人的身体健康,可以使人长命百岁。那么一些传统 ... [详细]
  • Mantis Bug Tracker:高效缺陷管理与跟踪系统
    缺陷管理平台Mantis,也做MantisBT,全称MantisBugTracker。Mantis是一个基于PHP技术的轻量级的开源缺陷跟踪系统,以Web操作的形式提供项目管理及缺 ... [详细]
  • Python彻底搞懂中文乱码问题
    本文转自:https:blog.csdn.netjoyfixingarticledetails79971667感谢作者!前言曾几何时Python中文乱码的问题困扰了我很多很多年,每 ... [详细]
  • 1.前言最近因项目需求,需要把员工的工作组返回给前台,但是数据库是把员工的工作组Id,都存在一个字段内了(以“逗号”分隔),而这样不符合前台的需要,他们需要一行,一行的数据。如 ... [详细]
author-avatar
俊谚怡雯綺修
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有