Java中Unicode编码的二进制转换详解与实现

作者：入骨红豆撕不撕 | 来源：互联网 | 2024-11-02 16:17

本文详细探讨了Java中Unicode编码的二进制转换方法及其具体实现。通过分析\u开头的字符串，解释了每组\uxxxx如何对应一个特定的Unicode字符，并提供了相关代码示例以加深理解。希望读者在实际开发中能有效应用这些知识。

内容为集体学习心得，不能对准确性做过多保障，谬误之处还望指导。

有时候咱们会遇到一些\u结尾的字符串，咱们晓得这些是Unicode码，一组\uxxxx字符串对应了一个Unicode字符。那这些编码字符的理论二进制存储格局是怎么呢？
咱们晓得Unicode编码能够出现世界上大部分的文字内容，而在其最通用的一种编码方式UTF-8
)下,单字符的存储长度为1-4字节（可变），这种设计的由来和长处就不多讲了，这里次要说说看到的\u编码串和二进制的换算形式。
在UTF-8编码格局的java代码下，对“测试”两个字打印其字节和字符后果如下：

System.out.println(Charset.defaultCharset());
        String s = "测试";
        System.out.println(s.chars().mapToObj(Integer::toHexString).collect(Collectors.joining("\t")));
        byte[] bs = s.getBytes();
        Sys来源gaodai.ma#com搞##代!^码网tem.out.println(Arrays.toString(bs));
        /*Result: 
        UTF-8
        6d4b    8bd5
        [-26, -75, -117, -24, -81, -107] */


  察看后果可知，“测试”两个字在UTF-8编码下占六个字节，将 【-26, -75, -117, -24, -81, -107】 6个数字转为二进制补码格局，即失去“测试”两字的二进制存储内容，为：
11100110  10110101  10001011  11101000  10101111  10010101
  而通过char.ToHexString失去的 6d4b    8bd5 是这两个字的Unicode编码
  这两者是怎么关联上的呢?
通过UTF-8的百科页面有如下介绍：

UTF-8编码字节含意

对于UTF-8编码中的任意字节B，如果B的第一位为0，则B独立的示意一个字符(ASCII码)；
如果B的第一位为1，第二位为0，则B为一个多字节字符中的一个字节(非ASCII字符)；
如果B的前两位为1，第三位为0，则B为两个字节示意的字符中的第一个字节；
如果B的前三位为1，第四位为0，则B为三个字节示意的字符中的第一个字节；
如果B的前四位为1，第五位为0，则B为四个字节示意的字符中的第一个字节；


  因而，对于下面失去的二进制串，每8位中的后面局部都是用来做标记的，1110结尾表明须要3个字节来形容以后字符，并且以后字节为3字节中的第一局部，前面的字节应用10结尾表明本人是以后字符编码串的前面局部。
  把前三字节这些标记为去掉再合并，失去 0110 110101 001011，而“测”字的16进制Unicode编码转为二进制，正是0110 1101 0100 1011。
  这样做的长处很显著，扩大不便（看起来能反对到8字节编码呢），编码构造去掉了二进制的标记位，减小体积更易于数据传输。1字节的UTF-8码还残缺兼容了ASCII码，所以UTF-8能够说应该是大部分场景下的最优抉择了。




    
        
                        java
                        编程
                        php
                        utf-8
                        int
                        char
                        default
                        string
                        join
                    
    



    
        写下你的评论吧 !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
                                    
                
            
        

        
    

    
        推荐阅读
        
            
                                
                    
                        cmd
                        golang常用库：配置文件解析库/管理工具viper使用
                    

                    
                                                
                            
                        
                                                
                        golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-28 13:47:52
                    

                

                
                                
                    
                        string
                        java编写的简易计算器
                    

                    
                                                
                        主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 18:18:10
                    

                

                                
                    
                    
                
                
                                
                    
                        string
                        Akka BackoffSupervisor的深入解析与实践
                    

                    
                                                
                        本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 15:04:09
                    

                

                
                                
                    
                        string
                        深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用
                    

                    
                                                
                        本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-28 10:51:55
                    

                

                
                                
                    
                        string
                        优化ListView性能
                    

                    
                                                
                            
                        
                                                
                        本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-28 10:36:30
                    

                

                
                                
                    
                        string
                        Handling Null Object Encoding in OAuth 1.0a API Implementation
                    

                    
                                                
                        Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-28 08:54:34
                    

                

                
                                
                    
                        string
                        Java 中 Writer flush()方法，示例
                    

                    
                                                
                        Java 中 Writer flush()方法，示例 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-28 06:41:52
                    

                

                
                                
                    
                        cmd
                        Dockerfile 编写与 Docker 网络配置详解
                    

                    
                                                
                        本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 17:31:41
                    

                

                
                                
                    
                        utf-8
                        分页插件3指定到某一页
                    

                    
                                                
                        前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 15:19:01
                    

                

                
                                
                    
                        string
                        Java面试题解析
                    

                    
                                                
                        本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 13:55:14
                    

                

                
                                
                    
                        default
                        Android 渐变圆环加载控件实现
                    

                    
                                                
                            
                        
                                                
                        本文介绍了如何在 Android 中创建一个自定义的渐变圆环加载控件，该控件已在多个知名应用中使用。我们将详细探讨其工作原理和实现方法。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 13:34:19
                    

                

                
                                
                    
                        string
                        将Web服务部署到Tomcat
                    

                    
                                                
                            
                        
                                                
                        本文介绍了如何在JDeveloper 12c中创建一个Java项目，并将其打包为Web服务，然后部署到Tomcat服务器。内容涵盖从项目创建、编写Web服务代码、配置相关XML文件到最终的本地部署和验证。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-27 11:48:15
                    

                

                
                                
                    
                        utf-8
                        深入解析 HTTP 500 内部服务器错误
                    

                    
                                                
                        本文详细探讨了HTTP 500内部服务器错误的成因、解决方案及其在Web开发中的影响。通过对具体案例的分析，帮助读者理解并解决此类问题。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-26 16:55:25
                    

                

                
                                
                    
                        utf-8
                        解析JSON格式文本并处理数据
                    

                    
                                                
                        本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本，并进行数据处理和保存。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-26 16:06:09
                    

                

                
                                
                    
                        utf-8
                        Python 爬虫基础教程及代码实例
                    

                    
                                                
                        根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ...
                        [详细]
                    
                    

                    
                        蜡笔小新   2024-12-26 10:42:40

















    

    
        
            
            
                
                
            

            
                入骨红豆撕不撕            

            
                这个家伙很懒，什么也没留下！            


        
    

    
    

    
    

    
        Tags | 热门标签
        
            
                                
                    dockerfile
                
                                
                    format
                
                                
                    future
                
                                
                    php7
                
                                
                    fetch
                
                                
                    list
                
                                
                    join
                
                                
                    default
                
                                
                    vbscript
                
                                
                    jsp
                
                                
                    char
                
                                
                    actionscrip
                
                                
                    replace
                
                                
                    web3
                
                                
                    config
                
                                
                    netty
                
                                
                    string
                
                                
                    express
                
                                
                    utf-8
                
                                
                    jar
                
                                
                    dagger
                
                                
                    httpclient
                
                                
                    cmd
                
                                
                    shell
                
                                
                    httprequest
                
                                
                    typescript
                
                                
                    datetime
                
                                
                    testing
                
                                
                    nodejs
                
                                
                    node.js
                
                                
            
        
    

    
    
        
            
            
        
        RankList | 热门文章
        
            
                                
                    11341: 自然对数表
                
                                
                    2jQuery 选择器与鼠标事件入门指南
                
                                
                    3从列表生成式到生成器：进阶使用与优化
                
                                
                    4五分之四的不同表达式_星耀测评：与从不同的“眼睛”功能——乐橙P6全拆机测评...
                
                                
                    5解决Python 3.x中argparse无法识别含&符号的输入参数问题
                
                                
                    6Ubuntu 环境下配置 LAMP 服务器
                
                                
                    7大华股份2013届校园招聘软件算法类试题D卷
                
                                
                    8通用代码  js获取URL参数
                
                                
                    9PHP - 如何定位函数的定义位置？
                
                                
                    10解决苹果手机触控ID设置问题
                
                                
                    11深入理解 C# 中的 yield return 和 yield break 关键字
                
                                
                    12张居正：名相还是权臣？历史给出了答案
                
                                
                    13NPM 脚本 'start' 退出，未显示 create-react-app 服务器正在监听请求
                
                                
                    14python3 基础回忆录
                
                                
                    15如何实现类似滴滴的实时位置推送