热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Java9及以上版本中String类为何使用byte[]而非char[]?

传统上,Java的String类一直使用char数组来存储字符数据。然而,在Java9及更高版本中,String类的内部实现改为使用byte数组。本文将探讨这一变化的原因及其带来的好处。

长期以来,Java 的 String 类一直使用 char 数组来存储字符数据。然而,最近我注意到在 Java 9 及更高版本中,String 类的内部实现已经改为使用 byte 数组。具体源码如下:

/**

* 用于字符存储的值。

*

* @implNote 该字段被虚拟机信任,并且如果是常量字符串实例,则会被常量折叠。构造后覆盖此字段将导致问题。

*

* 此外,它被标记为 {@link Stable} 以信任数组的内容。JDK 中目前没有其他功能提供此功能。

* {@link Stable} 在这里是安全的,因为 value 从不为 null。

*/

@Stable

private final byte[] value;

这显然使用的是 byte 数组,而不是 char 数组。那么,为什么会进行这样的改动呢?

主要原因是节省内存空间。在 JDK 9 之前的版本中,String 类的实现使用 char 数组来存储字符串,每个 char 占用 16 位(即 2 字节)。例如,存储字符 'A' 时,会占用 0x00 0x41,其中前一个字节是空闲的。这意味着对于 ISO-8859-1 编码范围内的字符,会有大量的内存浪费。而对于 ISO-8859-1 编码范围外的字符(如中文),则不会有浪费。

而在 JDK 9 及更高版本中,String 类的实现改为使用 byte 数组来存储字符串,每个 byte 占用 8 位(即 1 字节)。这样可以显著减少内存占用,特别是对于包含大量 ASCII 字符的字符串。

那么,当遇到 ISO-8859-1 编码范围外的字符(如中文)时,Java 是如何处理的呢?

Java 9 引入了一个新的属性 `coder`,用于表示字符串的编码格式:

private final byte coder;

static final boolean COMPACT_STRINGS;

static {

COMPACT_STRINGS = true;

}

byte coder() {

return COMPACT_STRINGS ? coder : UTF16;

}

{@Native static final byte LATIN1 = 0;}

{@Native static final byte UTF16 = 1;}

`coder` 属性用于标识字符串的编码格式,默认有两个值:0 表示 Latin-1(单字节编码),1 表示 UTF-16 编码。如果字符串只包含 Latin-1 字符,`coder` 属性值为 0;否则为 1。

在计算字符串长度或调用 `indexOf()` 等方法时,会根据 `coder` 属性来决定如何处理字符串。例如,如果 `coder` 为 0,表示字符串使用 Latin-1 编码,每个字符占用 1 字节;如果 `coder` 为 1,表示字符串使用 UTF-16 编码,每个字符占用 2 字节。

Java 9 默认启用紧凑字符串(COMPACT_STRINGS),但可以通过设置 VM 参数 `-XX:-CompactStrings` 来禁用这一特性。


推荐阅读
  • JavaScript 基础语法指南
    本文详细介绍了 JavaScript 的基础语法,包括变量、数据类型、运算符、语句和函数等内容,旨在为初学者提供全面的入门指导。 ... [详细]
  • 2017-2018年度《网络编程与安全》第五次实验报告
    本报告详细记录了2017-2018学年《网络编程与安全》课程第五次实验的具体内容、实验过程、遇到的问题及解决方案。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 实用正则表达式有哪些
    小编给大家分享一下实用正则表达式有哪些,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下 ... [详细]
  • 深入解析Java虚拟机(JVM)架构与原理
    本文旨在为读者提供对Java虚拟机(JVM)的全面理解,涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制,帮助开发者更好地掌握Java编程的核心技术。 ... [详细]
  • 本文详细探讨了Java中的ClassLoader类加载器的工作原理,包括其如何将class文件加载至JVM中,以及JVM启动时的动态加载策略。文章还介绍了JVM内置的三种类加载器及其工作方式,并解释了类加载器的继承关系和双亲委托机制。 ... [详细]
  • 本文将指导如何向ReactJS计算器应用添加必要的功能,使其能够响应用户操作并正确计算数学表达式。 ... [详细]
  • 在软件开发过程中,MD5加密是一种常见的数据保护手段。本文将详细介绍如何在C#中使用两种不同的方式来实现MD5加密:字符串加密和流加密。 ... [详细]
  • 本文探讨了在C++中如何有效地清空输入缓冲区,确保程序只处理最近的输入并丢弃多余的输入。我们将介绍一种不阻塞的方法,并提供一个具体的实现方案。 ... [详细]
  • 异常要理解Java异常处理是如何工作的,需要掌握一下三种异常类型:检查性异常:最具代表性的检查性异常是用户错误或问题引起的异常ÿ ... [详细]
  • 本文将探讨Java编程语言中对象和类的核心概念,帮助读者更好地理解和应用面向对象编程的思想。通过实际例子和代码演示,我们将揭示如何在Java中定义、创建和使用对象。 ... [详细]
  • 2018-2019学年第六周《Java数据结构与算法》学习总结
    本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容,重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]
  • 深入解析Spring启动过程
    本文详细介绍了Spring框架的启动流程,帮助开发者理解其内部机制。通过具体示例和代码片段,解释了Bean定义、工厂类、读取器以及条件评估等关键概念,使读者能够更全面地掌握Spring的初始化过程。 ... [详细]
  • 本文探讨了在 SQL Server 中使用 JDBC 插入数据时遇到的问题。通过详细分析代码和数据库配置,提供了解决方案并解释了潜在的原因。 ... [详细]
  • 本文探讨了如何在Java中使用JAXB解组两个具有相同名称但不同结构的对象。我们将介绍一个抽象类Bar及其具体实现,并展示如何正确地解析XML文档以获取正确的对象实例。 ... [详细]
author-avatar
手机用户2602883667
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有