Java序列化的机制和原理，以及自定义序列化问题

作者：吴钧隆362 | 来源：互联网 | 2023-09-25 20:02

一.Java序列化的机制和原理有关Java对象的序列化和反序列化也算是Java基础的一部分，下面对Java序列化的机制和原理进行一些介绍。Java序列化算法透析Ser

一. Java序列化的机制和原理

有关Java对象的序列化和反序列化也算是Java基础的一部分，下面对Java序列化的机制和原理进行一些介绍。

Java序列化算法透析

Serialization（序列化）是一种将对象以一连串的字节描述的过程；反序列化deserialization是一种将这些字节重建成一个对象的过程。Java序列化API提供一种处理对象序列化的标准机制。在这里你能学到如何序列化一个对象，什么时候需要序列化以及Java序列化的算法，我们用一个实例来示范序列化以后的字节是如何描述一个对象的信息的。

序列化的必要性

Java中，一切都是对象，在分布式环境中经常需要将Object从这一端网络或设备传递到另一端。这就需要有一种可以在两端传输数据的协议。Java序列化机制就是为了解决这个问题而产生。

如何序列化一个对象

一个对象能够序列化的前提是实现Serializable接口，Serializable接口没有方法，更像是个标记。有了这个标记的Class就能被序列化机制处理。

import java.io.Serializable;
class TestSerial implements Serializable {
public byte version = 100;
public byte count = 0;
}

然后我们写个程序将对象序列化并输出。ObjectOutputStream能把Object输出成Byte流。我们将Byte流暂时存储到temp.out文件里。

public static void main(String args[]) throws IOException {
FileOutputStream fos = new FileOutputStream("temp.out");
ObjectOutputStream oos = new ObjectOutputStream(fos);
TestSerial ts = new TestSerial();
oos.writeObject(ts);
oos.flush();
oos.close();
}

如果要从持久的文件中读取Bytes重建对象，我们可以使用ObjectInputStream。

public static void main(String args[]) throws IOException {
FileInputStream fis = new FileInputStream("temp.out");
ObjectInputStream oin = new ObjectInputStream(fis);
TestSerial ts = (TestSerial) oin.readObject();
System.out.println("version="+ts.version);
}

执行结果为

100.

对象的序列化格式

将一个对象序列化后是什么样子呢？打开刚才我们将对象序列化输出的temp.out文件，以16进制方式显示。内容应该如下：

AC ED 00 05 73 72 00 0A 53 65 72 69 61 6C 54 65

73 74 A0 0C 34 00 FE B1 DD F9 02 00 02 42 00 05

63 6F 75 6E 74 42 00 07 76 65 72 73 69 6F 6E 78

70 00 64

这一坨字节就是用来描述序列化以后的

TestSerial对象的，我们注意到TestSerial类中只有两个域：

public byte version = 100;

public byte count = 0;

且都是byte型，理论上存储这两个域只需要2个byte，但是实际上temp.out占据空间为51bytes，也就是说除了数据以外，还包括了对序列化对象的其他描述。

Java的序列化算法

序列化算法一般会按步骤做如下事情：

◆将对象实例相关的类元数据输出。

◆递归地输出类的超类描述直到不再有超类。

◆类元数据完了以后，开始从最顶层的超类开始输出对象实例的实际数据值。

◆从上至下递归输出实例的数据

我们用另一个更完整覆盖所有可能出现的情况的例子来说明：

class parent implements Serializable {
int parentVersion = 10;
}
class contain implements Serializable{
int containVersion = 11;
}
public class SerialTest extends parent implements Serializable {
int version = 66;
contain con = new contain();
public int getVersion() {
return version;
}
public static void main(String args[]) throws IOException {
FileOutputStream fos = new FileOutputStream("temp.out");
ObjectOutputStream oos = new ObjectOutputStream(fos);
SerialTest st = new SerialTest();
oos.writeObject(st);
oos.flush();
oos.close();
}
}

这个例子是相当的直白啦。SerialTest类实现了Parent超类，内部还持有一个Container对象。

序列化后的格式如下：

AC ED 00 05 73 72 00 0A 53 65 72 69 61 6C 54 65

73 74 05 52 81 5A AC 66 02 F6 02 00 02 49 00 07

76 65 72 73 69 6F 6E 4C 00 03 63 6F 6E 74 00 09

4C 63 6F 6E 74 61 69 6E 3B 78 72 00 06 70 61 72

65 6E 74 0E DB D2 BD 85 EE 63 7A 02 00 01 49 00

0D 70 61 72 65 6E 74 56 65 72 73 69 6F 6E 78 70

00 00 00 0A 00 00 00 42 73 72 00 07 63 6F 6E 74

61 69 6E FC BB E6 0E FB CB 60 C7 02 00 01 49 00

0E 63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E 78

70 00 00 00 0B

我们来仔细看看这些字节都代表了啥。开头部分，见颜色：

AC ED: STREAM_MAGIC. 声明使用了序列化协议 .
00 05: STREAM_VERSION. 序列化协议版本 .
0x73: TC_OBJECT. 声明这是一个新的对象 .

序列化算法的第一步就是输出对象相关类的描述。例子所示对象为SerialTest类实例，因此接下来输出SerialTest类的描述。见颜色：

0x72: TC_CLASSDESC. 声明这里开始一个新 Class 。
00 0A: Class 名字的长度 .
53 65 72 69 61 6c 54 65 73 74: SerialTest,Class 类名 .
05 52 81 5A AC 66 02 F6: SerialVersionUID, 序列化 ID ，如果没有指定，则会由算法随机生成一个 8byte 的 ID.
0x02: 标记号 . 该值声明该对象支持序列化。
00 02: 该类所包含的域个数。

接下来，算法输出其中的一个域，int version=66；见颜色：

0x49: 域类型 . 49 代表 "I", 也就是 Int.
00 07: 域名字的长度 .
76 65 72 73 69 6F 6E: version, 域名字描述 .

然后，算法输出下一个域，contain con = new contain();这个有点特殊，是个对象。描述对象类型引用时需要使用JVM的标准对象签名表示法，见颜色：

0x4C: 域的类型 .
00 03: 域名字长度 .
63 6F 6E: 域名字描述， con
0x74: TC_STRING. 代表一个 new String. 用 String 来引用对象。
00 09: 该 String 长度 .
4C 63 6F 6E 74 61 69 6E 3B: Lcontain;, JVM 的标准对象签名表示法 .
0x78: TC_ENDBLOCKDATA, 对象数据块结束的标志

.接下来算法就会输出超类也就是Parent类描述了，见颜色：

0x72: TC_CLASSDESC. 声明这个是个新类 .
00 06: 类名长度 .
70 61 72 65 6E 74: parent, 类名描述。
0E DB D2 BD 85 EE 63 7A: SerialVersionUID, 序列化 ID.
0x02: 标记号 . 该值声明该对象支持序列化 .
00 01: 类中域的个数 .

下一步，输出parent类的域描述，int parentVersion=100;同见颜色：

0x49: 域类型 . 49 代表 "I", 也就是 Int.
00 0D: 域名字长度 .
70 61 72 65 6E 74 56 65 72 73 69 6F 6E: parentVersion ，域名字描述。
0x78: TC_ENDBLOCKDATA, 对象块结束的标志。
0x70: TC_NULL, 说明没有其他超类的标志。 .

到此为止，算法已经对所有的类的描述都做了输出。下一步就是把实例对象的实际值输出了。这时候是从parent Class的域开始的，见颜色：

00 00 00 0A: 10, parentVersion 域的值 .

还有SerialTest类的域：

00 00 00 42: 66, version 域的值 .

再往后的bytes比较有意思，算法需要描述contain类的信息，要记住，现在还没有对contain类进行过描述，见颜色：

0x73: TC_OBJECT, 声明这是一个新的对象 .
0x72: TC_CLASSDESC 声明这里开始一个新 Class.
00 07: 类名的长度 .
63 6F 6E 74 61 69 6E: contain, 类名描述 .
FC BB E6 0E FB CB 60 C7: SerialVersionUID, 序列化 ID.
0x02: Various flags. 标记号 . 该值声明该对象支持序列化
00 01: 类内的域个数。

.输出contain的唯一的域描述，int containVersion=11；

0x49: 域类型 . 49 代表 "I", 也就是 Int..
00 0E: 域名字长度 .
63 6F 6E 74 61 69 6E 56 65 72 73 69 6F 6E: containVersion, 域名字描述 .
0x78: TC_ENDBLOCKDATA 对象块结束的标志 .

这时，序列化算法会检查contain是否有超类，如果有的话会接着输出。

0x70:TC_NULL ，没有超类了。

最后，将contain类实际域值输出。

00 00 00 0B: 11, containVersion 的值 .

二. Java自定义序列化反序列化问题

正常情况下，一个类实现java序列化很简单，只需要implements Serializable接口即可，之后该类在跨jvm的传输过程中会遵照默认java序列化规则序列化和反序列化;不同jvm版本之间序列化方式稍有不同，但基本上都是兼容的。

在某些特殊情况下，可能需要自定义序列化和反序列化的行为，看下面例子：

Java代码

class AbstractSerializeDemo {
private int x, y;
public void init(int x, int y) {
this.x = x;
this.y = y;
}
public int getX() {
return x;
}
public int getY() {
return y;
}
public void printXY() {
System.out.println("x:" + x + ";y:" + y);
}
}
public class SerializeDemo extends AbstractSerializeDemo implements Serializable {
private int z;
public SerializeDemo() {
super.init(10, 50);
z = 100;
}
public void printZ() {
super.printXY();
System.out.println("z:" + z);
}
public static void main(String[] args) throws IOException, ClassNotFoundException {
ByteArrayOutputStream bos = new ByteArrayOutputStream();
ObjectOutputStream out = new ObjectOutputStream(bos);
SerializeDemo sd = new SerializeDemo();
sd.printZ();
out.writeObject(sd);
ObjectInputStream in = new ObjectInputStream(new ByteArrayInputStream(bos.toByteArray()));
SerializeDemo sd2 = (SerializeDemo) in.readObject();
sd2.printZ();
}
}

这段程序表示了一个可序列化的类继承自一个非序列化的有状态超类，期望的结果是，子类序列化以后传输并反序列化回来，原先的值域包括超类的值域都保持不变。

但是输出是：

Java代码

x:10;y:50
z:100
x:0;y:0
z:100

结果和期望不符，子类的值域保留下来了，但是超类的值域丢失了，这对jvm来说是正常的，因为超类不可序列化;

为了解决这个问题，只能自定义序列化行为，具体做法是在SerializeDemo里加入以下代码：

Java代码

private void writeObject(ObjectOutputStream os) throws IOException {
os.defaultWriteObject();//java对象序列化默认操作
os.writeInt(getX());
os.writeInt(getY());
}
private void readObject(ObjectInputStream is) throws IOException, ClassNotFoundException {
is.defaultReadObject();//java对象反序列化默认操作
int x=is.readInt();
int y=is.readInt();
super.init(x,y);
}

writeObject和readObject方法为JVM会在序列化和反序列化java对象时会分别调用的两个方法，修饰符都是private，没错。

我们在序列化的默认动作之后将超类里的两个值域x和y也写入object流;与之对应在反序列化的默认操作之后读入x和y两个值，然后调用超类的初始化方法。

再次执行程序之后的输出为：

Java代码

x:10;y:50
z:100
x:10;y:50
z:100

另外还有两个自定义序列化方法writeReplace和readResolve，分别用来在序列化之前替换序列化对象和在反序列化之后的对返回对象的处理。一般可以用来避免singleTon对象跨jvm序列化和反序列化时产生多个对象实例，事实上singleTon的对象一旦可序列化，它就不能保证singleTon了。JVM的Enum实现里就是重写了readResolve方法，由JVM保证Enum的值都是singleTon的，所以建议多使用Enum代替使用writeReplace和readResolve方法。

Java代码

private Object readResolve()
{
return INSTANCE;
}
private Object writeReplace(){
return INSTANCE;
}

注：writeReplace调用在writeObject前;readResolve调用在readObject之后。

这篇是对7天Java学习的一个补充，主要是针对自定义序列化的学习，感谢CSDN会员wangtenndsc 让我又多学了一点关于序列化的知识。

序列化学习共有三个贴:

7天Java学习---Java的对象序列化以及文件IO处理

java serializable

推荐阅读

main
深入解析Properties属性类及其应用

属性类 `Properties` 是 `Hashtable` 类的子类，用于存储键值对形式的数据。该类在 Java 中广泛应用于配置文件的读取与写入，支持字符串类型的键和值。通过 `Properties` 类，开发者可以方便地进行配置信息的管理，确保应用程序的灵活性和可维护性。此外，`Properties` 类还提供了加载和保存属性文件的方法，使其在实际开发中具有较高的实用价值。 ... [详细]

蜡笔小新 2024-11-11 13:55:43
main
面试中如何回答“零拷贝”技术问题？

零拷贝技术是提高I/O性能的重要手段，常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]

蜡笔小新 2024-11-13 02:03:52
default
深入解析Android Audio系统中的mpAudioPolicy->get_input

在分析Android的Audio系统时，我们对mpAudioPolicy->get_input进行了详细探讨，发现其背后涉及的机制相当复杂。本文将详细介绍这一过程及其背后的实现细节。 ... [详细]

蜡笔小新 2024-11-12 18:52:04
main
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
main
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
main
IOS Run loop详解

为什么80%的码农都做不了架构师？转自http:blog.csdn.netztp800201articledetails9240913感谢作者分享Objecti ... [详细]

蜡笔小新 2024-11-13 12:14:35
list
oracle c3p0 dword 60,web_day10 dbcp c3p0 dbutils

createdatabasemydbcharactersetutf8;alertdatabasemydbcharactersetutf8;1.自定义连接池为了不去经常创建连接和释放 ... [详细]

蜡笔小新 2024-11-12 19:26:15
main
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
main
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
default
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
main
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
main
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
main
Spring Boot 入门指南：Hello World 示例

本教程详细介绍了如何使用 Spring Boot 创建一个简单的 Hello World 应用程序。适合初学者快速上手。 ... [详细]

蜡笔小新 2024-11-12 15:18:38
main
Java高并发与多线程（二）：线程的实现方式详解

本文将深入探讨Java中线程的三种主要实现方式，包括继承Thread类、实现Runnable接口和实现Callable接口，并分析它们之间的异同及其应用场景。 ... [详细]

蜡笔小新 2024-11-12 14:31:23
main
在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？

在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ... [详细]

蜡笔小新 2024-11-11 15:34:22

吴钧隆362

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章