热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

有关UNICODE、ANSI字符集和相关字符串操作的总结(一)

对论坛中有关UNICODE、ANSI字符集和相关字符串操作的总结!先声明不是我的杰作。我这里只是总结了一部分,如果有错误请指出,同时欢迎大


对论坛中有关UNICODE、ANSI字符集和相关字符串操作的总结!先声明不是我的杰作。我这里只是总结了一部分,如果有错误请指出,同时欢迎大家参与进来!  

   

   

  Q   UNICODE字符串如何显示  

  A  

  如果程序定义了_UNICODE宏直接用  

  WCHAR   *str=L"unicodestring";  

  TextOut(0,0,str);  

  否则就需要转换类型  

  #include    

  WCHAR   *str=L"unicodestring";  

  bstr_t   str1=str;  

  TextOut(0,0,(char*)str1);  

   

  Q   如何实现ANSI和UNICODE的相互转换  

  A  

  将ANSI转换到Unicode  

  (1)通过L这个宏来实现,例如:   CLSIDFromProgID(   L"MAPI.Folder",&clsid);  

  (2)通过MultiByteToWideChar函数实现转换,例如:  

  char   *szProgID   =   "MAPI.Folder";  

  WCHAR   szWideProgID[128];  

  CLSID   clsid;  

  long   lLen   =   MultiByteToWideChar(CP_ACP,0,szProgID,strlen(szProgID),szWideProgID,sizeof(szWideProgID));  

  szWideProgID[lLen]   =   '\0';    

  (3)通过A2W宏来实现,例如:    

  USES_CONVERSION;    

  CLSIDFromProgID(   A2W(szProgID),&clsid);    

   

  将Unicode转换到ANSI  

  (1)使用WideCharToMultiByte,例如:  

  //   假设已经有了一个Unicode   串   wszSomeString...    

  char   szANSIString   [MAX_PATH];    

  WideCharToMultiByte   (   CP_ACP,   WC_COMPOSITECHECK,   wszSomeString,   -1,   szANSIString,   sizeof(szANSIString),   NULL,   NULL   );    

  (2)使用W2A宏来实现,例如:  

  USES_CONVERSION;  

  pTemp=W2A(wszSomeString);    

   

  注意在转换时可能存在的问题:  

  因为ANSI转UNICODE,如果使用A2W或MultiByteToWideChar(第一个参数是CP_ACP)的话,是根据系统默认的转码表,把转入的ANSI字符串看作Multi-Bytes字符串处理的,如果是中文(中文windows默认就是中文),一个大于0x87的byte可能和下一byte一起被看作一个汉字,然后根据汉字的Unicode编码转换为相同的Unicode汉字,如果找不到相应的编码,一般就用一个默认的字符来取代它(一般是问号“?”),由此看,如果随便把一段数据给他转,转化很复杂而且极可能不可逆,而且你加密过的ANSI码是相当混乱的有很多〉0x87的byte,转换就变得不可逆了。  

  建议自己直接就这样写:  

  CHAR   lpANSI[COUNT];  

  WCHAR   lpUnicode[COUNT];  

  int   i   =   0;    

  while(lpANSI[i]   !=   '\0'   )   {  

          lpUnicode[i]   =   (WCHAR)lpANSI[i];  

  }  

  lpUnicode[i]   =   L'\0';  

  然后按相同的方法转回来,因为对于0~0x87的ANSI字符串,对应的Unicode码就是相同的16位值,至于其他的,你的字符串反正加了密,没必要转换成显示出来是一样的字符,就按同样的方法处理了,其实如果中间的字符串不用显示或别的,直接reutrn   (LPWSTR)lpANSI;过去也可以,   反正接受的时候自己清楚就可以了。  

   

  Q   如何让程序支持UNICODE    

  A    

  NT系统的内核是unicode代码,通常vc分创建的工程默认都是ansi代码(可以兼容win9x),在nt下ansi程式在调用windows   API的时系统实际又进行了一次ansi到unicode的代码转化,如MoveWindowA实际上又调用MoveWindowW.如果以我们的程序不考虑win9x(早晚是明日黄花)的话,直接用unicode编译,那么程式的代码执行效率一定能增色不少.具体:  

  (0).在vc编译选项上,在vc7.0以上在工程的属性页中的“字符集”选上"使用   Unicode   字符集"即可,在vc6.0下可能麻烦一点,得先把vc运行库的unicode版本复制到vc路径下,一般都是和xxx.lib的ansi对应xxxU.lib,默认装vc时是不会装的,将工程属性  

  (0).1.改语言定义:  

  在project   settings的"C++"页中的"preprocessor   definitions"中改_MBCS为_UNICODE  

  (0).2.改入口函数:  

  在"link"页中的"project   Options"加入/entry:"wWinMainCRTStartup"即可.  

   

  (1)在代码上,处理字符中的多用TCHAR.H中的宏,如strcpy用_tcscpy代替,用TCHAR代char,  

  用TCHAR   m_mystr[]=_T("xxxx")代替   char   m_mystr[]="xxxx";  

  (2)注意调试UNICODE程序时,需要在安装时VC选择所有选项,否则会缺少动态库和相应的.lib文件  

   

  Q   如何取得一个既包含单字节字符又包含双字节字符的字符串的字符个数?  

  A  

  可以调用Microsoft   Visual   C++的运行期库包含函数_mbslen来操作多字节(既包括单字节也包括双字节)字符串。  

  调用strlen函数,无法真正了解字符串中究竟有多少字符,它只能告诉你到达结尾的0之前有多少个字节。  

   

  Q   如何对DBCS(双字节字符集)字符串进行操作?  

  A  

  函数   描述  

  PTSTR   CharNext   (   LPCTSTR   );   返回字符串中下一个字符的地址  

  PTSTR   CharPrev   (   LPCTSTR,   LPCTSTR   );   返回字符串中上一个字符的地址  

  BOOL   IsDBCSLeadByte(   BYTE   );   如果该字节是DBCS字符的第一个字节,则返回非0值  

   

  Q   为什么要使用Unicode?  

  A  

  (1)   可以很容易地在不同语言之间进行数据交换。  

  (2)   使你能够分配支持所有语言的单个二进制.exe文件或DLL文件。  

  (3)   提高应用程序的运行效率。  

  Windows   2000是使用Unicode从头进行开发的,如果调用任何一个Windows函数并给它传递一个ANSI字符串,那么系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会首先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。通过从头开始用Unicode来开发应用程序,就能够使你的应用程序更加有效地运行。  

  Windows   CE   本身就是使用Unicode的一种操作系统,完全不支持ANSI   Windows函数  

  Windows   98   只支持ANSI,只能为ANSI开发应用程序。  

  Microsoft公司将COM从16位Windows转换成Win32时,公司决定需要字符串的所有COM接口方法都只能接受Unicode字符串。  

   

  Q   如何编写Unicode源代码?  

  A  

  Microsoft公司为Unicode设计了WindowsAPI,这样,可以尽量减少代码的影响。实际上,可以编写单个源代码文件,以便使用或者不使用Unicode来对它进行编译。只需要定义两个宏(UNICODE和_UNICODE),就可以修改然后重新编译该源文件。  

  _UNICODE宏用于C运行期头文件,而UNICODE宏则用于Windows头文件。当编译源代码模块时,通常必须同时定义这两个宏。  

   

  Q   Windows定义的Unicode数据类型有哪些?  

  A  

  数据类型   说明  

  WCHAR   Unicode字符  

  PWSTR   指向Unicode字符串的指针  

  PCWSTR   指向一个恒定的Unicode字符串的指针  

  对应的ANSI数据类型为CHAR,LPSTR和LPCSTR。  

  ANSI/Unicode通用数据类型为TCHAR,PTSTR,LPCTSTR。  

   

  Q   如何对Unicode进行操作?  

  A  

  字符集   特性   实例  

  ANSI   操作函数以str开头   strcpy  

  Unicode   操作函数以wcs开头   wcscpy  

  MBCS   操作函数以_mbs开头   _mbscpy  

  ANSI/Unicode   操作函数以_tcs开头   _tcscpy(C运行期库)  

  ANSI/Unicode   操作函数以lstr开头   lstrcpy(Windows函数)  

  所有新的和未过时的函数在Windows2000中都同时拥有ANSI和Unicode两个版本。ANSI版本函数结尾以A表示;Unicode版本函数结尾以W表示。Windows会如下定义:  

  #ifdef   UNICODE  

  #define   CreateWindowEx   CreateWindowExW  

  #else  

  #define   CreateWindowEx   CreateWindowExA  

  #endif   //   !UNICODE


推荐阅读
  • 本教程涵盖OpenGL基础操作及直线光栅化技术,包括点的绘制、简单图形绘制、直线绘制以及DDA和中点画线算法。通过逐步实践,帮助读者掌握OpenGL的基本使用方法。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑,可以有效解决数据不一致的问题。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • XNA 3.0 游戏编程:从 XML 文件加载数据
    本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件,并通过内容管道加载到游戏中。此外,还会涉及自定义类型读取器和写入器的实现。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 本文介绍了如何在C#中启动一个应用程序,并通过枚举窗口来获取其主窗口句柄。当使用Process类启动程序时,我们通常只能获得进程的句柄,而主窗口句柄可能为0。因此,我们需要使用API函数和回调机制来准确获取主窗口句柄。 ... [详细]
  • 本文探讨了 Objective-C 中的一些重要语法特性,包括 goto 语句、块(block)的使用、访问修饰符以及属性管理等。通过实例代码和详细解释,帮助开发者更好地理解和应用这些特性。 ... [详细]
  • 本文深入探讨了 Java 编程语言的基础,特别是其跨平台特性和 JVM 的工作原理。通过介绍 Java 的发展历史和生态系统,帮助初学者理解如何编写并运行第一个 Java 程序。 ... [详细]
  • PHP 5.5.0rc1 发布:深入解析 Zend OPcache
    2013年5月9日,PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版,这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]
  • 基因组浏览器中的Wig格式解析
    本文详细介绍了Wiggle(Wig)格式及其在基因组浏览器中的应用,涵盖variableStep和fixedStep两种主要格式的特点、适用场景及具体使用方法。同时,还提供了关于数据值和自定义参数的补充信息。 ... [详细]
  • 使用GDI的一些AIP函数我们可以轻易的绘制出简 ... [详细]
  • ###问题删除目录时遇到错误提示:rm:cannotremoveusrlocaltmp’:Directorynotempty即使用rm-rf,还是会出现 ... [详细]
  • 本文详细介绍了Linux系统中init进程的作用及其启动过程,解释了运行级别的概念,并提供了调整服务启动顺序的具体步骤和实例。通过了解这些内容,用户可以更好地管理系统的启动流程和服务配置。 ... [详细]
author-avatar
KL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有