热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

C++字符字符串处理及字符集编码方案

本文介绍了C++中字符字符串处理的问题,并详细解释了字符集编码方案,包括UNICODE、Windowsapps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSIC标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码,否则将使用windowscodepage编译。最后,给出了相关的头文件和数据类型定义。



cpp 调库总遇到字符处理的问题,开坑慢填。


  • 字符集


    • UNICOUDE
      Windows apps 采用 UTF-16 实现
      大多数字符 2-byte,补充集合用 a pair of 2-byte
    • Windows / OEM Code Page
      ASCII 基础上设计各国互不兼容的编码方案,ASCII只用了1个字节的前127个编码
      主要分为 SBCS 和 DBCS (中日韩)
      美国国家标准学会(American National Standards Institute) 收集整合,为每种方案设计 code page identifier。
  • ANSI C 标准 和 Windows 三套字符/字符串数据类型实现
    需要说明的是,ANSI C 标准并没有具体规定基本类型应占字节数,具体占位和平台 CPU + OS + Compiler 有关


    • generic
      编译时在 #include 前定义 UNICODE 宏,否则以windows code page编译
    • 仅用于 unicode
    • 仅用于 windows code pages

    // 头文件 Winnt.h
    // Generic types TCHAR LPTSTR LPTCH
    #ifdef UNICODE
    typedef wchar_t TCHAR; // char 是 ANSI C data type
    #else
    typedef unsigned char TCHAR;
    #endif
    typedef TCHAR *LPTSTR, *LPTCH;
    // 8-bit character specific 去掉表示类型的T
    typedef unsigned char CHAR; // char 是 ANSI C data type
    typedef CHAR *LPSTR, *LPCH;
    // Unicode specific (wide characters) 表示类型的T换成宽字符W
    typedef unsigned wchar_t WCHAR;
    typedef WCHAR *LPWSTR, *LPWCH;

  • Windows API 三套处理字符/字符串的函数
    generic versionwindow code page version 用 “A” 标识、Unicode version 用 “W” 标识
    主要看 Standard C runtime library 中的字符处理函数


    • wcs/_wcs
      Unicode版,处理 wchar_t 类型
    • str
      code page版,处理 char 类型
    • _mbs
      DBCS版,处理中日韩等字符
    • _tcs
      generic版,处理 TCHAR 类型

    // to use the generic functions and compile for Unicode.
    #define _UNICODE
    #include
    #include

    需要说明的是,带下划线的 _UNICODE 用于standard C library,而不带下划线 UNICODE 用于Microsoft windows runtimes

  • 相互转换
    本质只有两种字符类型转换 MultiByteToWideCharWideCharToMultiByte

  • 字符串处理 STL 中的
    指路 cppreference/string 支持三种 general types of strings


    • std::basic_string - a templated class designed to manipulate strings of any character type.
    • std::basic_string_view(C++17) - a lightweight non-owning read-only view into a subsequence of a string.
    • Null-terminated strings - arrays of characters terminated by a special null character.
      在这里插入图片描述
      basic_string 的衍生最常使用
      Null-terminate string 在字符串处理函数如 _tcstok 等经常使用,本质可以看作字符指针


推荐阅读
  • 本文深入探讨了HTTP请求和响应对象的使用,详细介绍了如何通过响应对象向客户端发送数据、处理中文乱码问题以及常见的HTTP状态码。此外,还涵盖了文件下载、请求重定向、请求转发等高级功能。 ... [详细]
  • 本教程涵盖OpenGL基础操作及直线光栅化技术,包括点的绘制、简单图形绘制、直线绘制以及DDA和中点画线算法。通过逐步实践,帮助读者掌握OpenGL的基本使用方法。 ... [详细]
  • 本文介绍如何从字符串中移除大写、小写、特殊、数字和非数字字符,并提供了多种编程语言的实现示例。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 深入理解Redis的数据结构与对象系统
    本文详细探讨了Redis中的数据结构和对象系统的实现,包括字符串、列表、集合、哈希表和有序集合等五种核心对象类型,以及它们所使用的底层数据结构。通过分析源码和相关文献,帮助读者更好地理解Redis的设计原理。 ... [详细]
  • 解析SQL查询结果的排序问题及其解决方案
    本文探讨了为什么某些SQL查询返回的数据集未能按预期顺序排列,并提供了详细的解决方案,帮助开发者理解并解决这一常见问题。 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 本文详细介绍了优化DB2数据库性能的多种方法,涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段,可以显著提升数据库的运行效率和响应速度。 ... [详细]
  • 本文详细介绍了C语言中的基本数据类型,包括整型、浮点型、字符型及其各自的子类型,并探讨了这些类型在不同编译环境下的表现。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法,通过多个实际代码示例展示了其在不同场景下的应用,帮助开发者更好地理解和使用该方法。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 一个登陆界面
    预览截图html部分123456789101112用户登入1314邮箱名称邮箱为空15密码密码为空16登 ... [详细]
  • 本文详细解析了Java中throw和throws的关键区别,同时涵盖了JDK的定义、Java虚拟机的关键约定、Java的跨平台性、自动垃圾回收机制、源文件结构、包的概念及作用等多个核心知识点,旨在帮助学生更好地准备Java期末考试。 ... [详细]
author-avatar
Angels萱萱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有