再看Java单例
此前面试遇到了单例问题,本以为已经背的滚瓜烂熟,没想到被问单例如何避免被反射和序列化破坏,虽然后来还是等到了通知,但还是复习一下单例的实现方式,并学习防止反射和序列化破坏的手段。
基本实现方式
其他相关资料中,最多的能数出八种单例实现方式,而实际上其中有些实现并不具备实际意义,在文中出现也仅是为了指出存在的问题便于引出下文。本文仅介绍有实际意义的单例实现模式。为了缩减篇幅,先给出一个后续出现代码的模板的类图:
classDiagram
class Singleton {
-Logger log$
-Singleton instance$
+getInstance()$ Singleton
+loadClass()$ void
+function() void
-Singleton()
}
单例类 Singleton 模板:后文中介绍具体实现方式仅给出 Singleton#instance
引用和 Singleton#getInstance
方法的内容,其他内容无变化。
public class Singleton { |
调用单例类的 Main 类:
public class Main { |
饿汉式
饿汉式具有线程安全和非 Lazy 初始化的特点,实现难度最简单。由于 JVM 的类加载是单线程的,且已加载过的类不会重复加载,所以饿汉式天生具有线程安全的特点。
由于是类加载即初始化,单例引用可添加
final
修饰。public static final Singleton instance = new Singleton();
//下面写法效果相同
/*
public static final Singleton instance;
static {
instance = new Singleton();
}
*/获取单例函数:
public static Singleton getInstance() {
return instance;
}
执行结果:
13:19:32.565 - Singleton's instance instantiated |
从日志可以看出,单例类刚加载时就调用构造函数完成了单实例的初始化。
双锁检查式
双锁检查是经常出现于面试题中的实现方式,具有线程安全和 Lazy 初始化的特点。需要自行实现线程安全的单例初始化,且要避免指令重排序导致的安全问题,实现难度较高。
为了避免指令重排序导致的线程安全问题需要给单例引用添加
volatile
修饰:private volatile static Singleton instance;
双锁检查式最难的部分就是在获取单例的函数中进行两次非 null 判断和加锁后再初始化的过程:
public static Singleton getInstance() {
if (instance == null) {
synchronized (Singleton.class) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
执行结果:
13:30:07.524 - class cncsl.github.io.Singleton loaded |
从日志可以看出,类加载之后并没有立即初始化,实际需要调用到单例的功能函数前才进行了初始化。
volatile 关键字的作用
volatile
修饰的变量有可见性和禁止指令重排序优化两个特点:
- 可见性:一个线程修改了
volatile
变量,其他线程立即可知。 - 禁止指令重排序优化:处理器为了提高运算单元的利用率,会对指令进行乱序执行优化,处理器能够保证经过乱序的指令和原始顺序的指令执行结果一致。
在多线程环境中,指令重排序优化可能导致访问共享数据出错。这也是双锁检查式单例的单例变量用 volatile 修饰的原因。
Java 源码中 instance = new Singleton();
一句对应的字节码指令为:
NEW Singleton |
总共分为四个步骤:
NEW
指令创建对象(此时还没有执行构造函数,对象的所有成员变量都是默认的“零值”),将对象引用压入操作数栈。DUP
指令将当前操作数栈顶的值拷贝一份(此时操作数栈顶的两个元素是两个相同的、值为前一步创建的对象的引用)。INVOKESPECIAL
指令会调用当前操作数栈顶的对象的<init>
方法,该方法是根据空参的构造函数生成的。PUTSTATIC
指令将操作数栈顶的对象引用赋值给 Singleton 类的 instance 引用。
根据指令重排序的原则,三、四两步之间乱序执行不会影响结果,如果未加 volatile
修饰、发生了指令重排,且两个线程恰好按照如下步骤执行就会发生异常情况(字节码指令和处理器指令没有对应关系,所以这个例子并不是很严谨,但理解当前的上下文够用了):
sequenceDiagram
threadOne ->> threadOne : NEW Singleton
threadOne ->> threadOne : DUP
threadOne ->> Singleton.class : PUTSTATIC Singleton.instance : LSingleton;
threadTwo ->> Singleton.class : 调用 getInstance() 函数
Singleton.class ->> threadTwo : Singleton.instance 引用不为 null,返回引用值
threadTwo ->> threadTwo : 使用单例对象
Note over threadTwo : 此时单例对象还未完全初始化,发生异常
threadOne ->> threadOne : INVOKESPECIAL
而如果 instance
使用 volatile
修饰,在指令 INVOKESPECIAL
和 PUTSTATIC
之间就不会发生指令重排,确保了上述问题不会发生。另外请注意,Java 中双锁检查式方式实现的单例在 Java 5 之后才能完全保证可用,此前版本依然会出现问题。
静态内部类式
静态内部类式也用到了 JVM 类加载器的特性,既保证线程安全的情况下实现了 Lazy 加载。
添加一个静态内部类持有单例引用:
private static class InstanceHolder {
private static final Singleton INSTANCE = new Singleton();
}获取单例的函数调用时才会加载静态内部类,进而触发单实例的初始化:
public static Singleton getInstance() {
return InstanceHolder.INSTANCE;
}
执行效果与双锁检查式相同,不在赘述。
枚举式
枚举式的实现是将单例类写成一个枚举,枚举值仅包含一个单例引用,再加上与业务逻辑相关的功能函数即可。由于枚举的特点,这种实现方式具有线程安全、非 Lazy 加载和防止反射、序列化破坏单例等特点。
由于改动较大附上全部代码:
public enum Singleton { |
执行结果:
13:57:27.142 - Singleton's instance instantiated |
可以看出,枚举类加载之后立即初始化了单例对象,而三秒后执行了单例类的功能函数。
防反射和序列化破坏单例
在 Java 中,通过序列化也能创建新的对象实例,而反射能突破构造函数 private
的限制,下面介绍一下如何避免这些情况的发生。枚举式单例天生避免了这些问题,下方内容都是针对其他三种实现方式而言的。
另外,请明白一个前提,设计模式是一种设计的方式,既不是某种语言的语法约束,除了枚举方式以外、其他实现方式在有人恶意破坏的情况都无法完全确保单例。在这种情况下,需要考虑的不是如何改进现有的设计,而是找出企图通过这些手段破坏单例的人。所以下面的知识一般用于面试:当遇到如何确保单例的问题时,首先说枚举式设计方式、然后才是下面的内容。
反射手段
下方是通过反射方式破坏单例的过程:
public static void main(String[] args) { |
执行结果:
15:10:48.237 - Singleton's instance instantiated |
可以看出目前程序中以存在两个 Singleton 类的实例,单例已经被破坏。
解决方案为在单例类的构造函数中进行检查,如果单例引用不为 null 就抛出异常:
private Singleton() { |
再次执行结果:
15:17:36.834 - Singleton's instance instantiated |
当然,攻击者可以在外部先记录一份 instance
引用,通过反射修改 instance
引用后再创建对象,这样程序中会存在两个 Singleton
实例。
序列化手段
下方是通过序列化手段破坏单例的过程:
public static void main(String[] args) { |
执行结果如下:
21:15:36.605 - Singleton's instance instantiated |
可以看出,序列化读取到的对象已经是一个新的对象,单例已被破坏。
解决方案是为单例类添加如下函数:
private Object readResolve() { |
再次执行后可以发现已经反序列化时得到的仍然是原单例对象:
21:28:34.954 - Singleton's instance instantiated |
当前序列化有个前提是实现 Serializable
接口,私以为这种情况是一个错误的设计:单例类一般和业务逻辑相关、而序列化一般和封装数据用的实体对象有关,二者不应该出现在同一个类里。