一、简介
内存中的数据对象只有转换为二进制流才可以进行数据持久化和网络传输。
对象的序列化(Serialization):将数据对象转换为二进制流的过程称为对象的序列化
反序列化(Deserialization):将二进制流恢复为数据对象的过程
序列化常见的场景是 RPC 框架的数据传输。
常见的序列化方式:
- Java 原生序列化
- Hessian 序列化
- JSON 序列化
(1)Java 原生序列化
Java类通过实现Serializable
接口来实现该类对象的序列化。
Java序列化保留了对象类的元数据(如类、成员变量、继承类信息等),以及对象数据等,兼容性最好,但不支持跨语言,而且性能一般。
public class Employee implements java.io.Serializable {
private static final long serialVersionUID = -67710L;
}
实现 Serializable
接口的类建议设置 serialVersionUID
字段值。
如果不设置,那么每次运行时,编译器会根据类的内部实现,包括类名、接口名、方法和属性等来自动生成
serialVersionUID
- 如果是兼容升级,请不要修改
serialVersionUID
字段,避免反序列化失败 - 如果是不兼容升级,需要修改
serialVersionUID
字段,避免反序列化混乱
Java反序列化时不会调用类的无参构造方法,而是调用 native
方法将成员变量赋值为对应类型的初始值。
(2)Hessian 序列化
Hessian 序列化:是一种支持动态类型、跨语言、基于对象传输的网络协议。
特性:
- 自描述序列化类型
- 语言无关,极大缩短二进制流
- 协议简单,比 Java 原生序列化高效
Hessian 会把复杂对象所有属性存储在一个Map
中进行序列化
(3)JSON 序列化
JSON:是一种轻量级的数据交互格式。
JSON 序列化就是将数据对象转换为 JSON 字符串。在序列化过程中抛弃了类型信息。
序列化框架:
Apache Commons Collections
Jackson
fastjson
有些对象敏感属性不需要进行序列化传输,可以加 transient
关键字,避免把此属性信息转化为序列化的二进制流。
如果一定要传递对象的敏感属性,可以使用对称与非对称加密方式独立传输,再使用某个方法把属性还原到对象中。
二、资料
《码出高效》