JVM类加载

本章节讲解Class文件中的信息进入到虚拟机后发生什么变化

虚拟机把描述的类的数据从Class文件加载到内存,并对数据进行效验,转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是Java虚拟机的类加载机制。

1.类加载的时机

类加载的生命周期包括:加载,验证,准备,解析,初始化,使用,卸载7个阶段。其中验证,准备,解析3部分称为链接。加载,验证,准备,初始化,卸载这5个阶段的顺序是确定的,类的加载过程按照这种顺序按部就班的开始,而解析阶段不一定,注意的是,这些阶段通常都是相互交叉的混合式进行,通常会在一个阶段执行的过程中调用,激活另一个阶段。

对于加载阶段,Java虚拟机规范中并没有进行强制约束,可以交给虚拟机的具体实现来自由把握。但是对于初始化阶段,虚拟机规范则是严格规定了有且只有5种情况必须立即进行初始化。

(1)遇到new,getstatic,putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这4条指令的最常见的场景是:①使用new关键字实例化对象②③读取或者设置一个类的静态字段④调用一个类的静态方法的时候。

(2)使用java.lang.reflect包的方法对类进行反射调用的时候。

(3)初始化一个类的时候,发现其父类还没有初始化,则先触发其父类的初始化。

(4)当虚拟机启动时,用户需要指定一个要执行的主类,虚拟机会先初始化这个主类。

(5)如果一个java.lang.invoke.methodHandle实例最后的解析结果REF_getStatic,REF_putStatic,REF_invokeStatic的方法的句柄,并且 这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。

对于这5类会触发进行初始化的场景,并称之为对一个类进行的主动引用,除此之外,所有引用类的方式都不会触发初始化,称为被动引用。

2.类加载过程

(1)加载

在加载阶段,虚拟机需要完成以下3件事情,①通过一个类的全限定名来获取定义此类的二进制字节流②将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构③在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。

对于第一件事情,Java虚拟机实现的并不具体,灵活度相当大,他可以允许来自许多地方的二进制字节流,例如从ZIP包中读取,即JAR,EAR,WAR格式的基础;从网络中获取,即Applet;运行时计算生成,即动态代理计数;由其他文件生成,即JSP应用;从数据库中获取。

对于非数组类的加载阶段是开发人员可控制最强的,因为既可以使用系统提供的类加载器完成,也可以使用用户自定义的类加载器去完成。

对于数组类而言,数组类本身不通过类加载器创建,而是由Java虚拟机直接创建的。但是数组类与类加载器还是有密切的关系,因为数组类的元素类型,还是要靠类加载器去创建。

(2)验证

验证是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机的安全。因为字节码文件不仅仅只由Java代码编译生成,还可以使用其他的代码生成,由于其他的代码的不安全性,所以需要进行验证。

下来简单介绍书中提及的4个阶段的检验动作(这不是全部):

①文件格式验证:这一阶段的验证字节流是否符合Class文件格式的规范,并且被当前版本的虚拟机处理。包括是否已魔数0xCAFFBABE开头,主次版本号,常量池中是否有不被支持的常量类型。当验证点不止这些,还有很多,上面只是一部分而已。

②元数据验证:对字节码的语义分析,保证其描述的信息符合Java语言规范的要求。即此类是否有父类,是否合法继承等等。

③字节码验证:最复杂的一个,目的是通过数据流和控制流分析,确定程序语义是合法的,符合逻辑的。

④符号引用验证:对类自身以外的信息进行是否匹配性效验,即符号引用中通过字符串描述的全限定名是否能找到对应的类,符号引用中的类,字段,方法的访问性是否可被当前类访问。

(3)准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。注意,这个时候进行内存分配的仅包括类变量,而不包括实例变量,实例变量将会在对象实例化时随对象一起分配在Java堆中。

Public static int value = 123.

变量value在准备阶段过后的初始值是0,不是123,因为尚未执行任何Java方法,而把value赋值为123的putstatic指令是程序被编译后,存放于类构造器<clinit>()方法之中,所以把value赋值为123的动作将在初始化阶段才会执行。

(4)解析

虚拟机将常量池内的符号引用替换为直接引用的过程

符号引用:以一组符号来描述所引用的目标,符号可以是任意的字面量,只要使用时能够无歧义定位到目标即可。

直接引用:直接指向目标的指针,相对偏移量或是一个能间接定位到目标的句柄。

解析包括类或接口的解析,字段的解析,接口方法的解析。

(5)初始化

是类加载器过程的最后一步,在准备阶段,变量已经赋过一次系统要求的初始值,而在初始化阶段,则根据程序员通过程序制定的主观计划去初始化类变量和其他资源。

类加载器虽然只用于实现类的加载动作,但它在Java程序中起到的作用远不止这些。对于任意一个类,都需要有加载它的类加载器和这个类的本身一同确立其在Java虚拟机中的唯一性。每一个类加载器,都拥有一个独立的类名称空间。即比较两个类是否相等,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则即使这两个类来源于同一个Class文件,被同一个虚拟机加载,只要加载他们的类加载器不同,那这两个类必定不相等。这里的相等包括Class对象的equals()方法,isAssignableFrom()方法,isInstance()方法的返回结果。

3.双亲委派模型

从Java虚拟机的角度来讲,存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),使用C++语言实现,是虚拟机的一部分;另一种是所有其他的类加载器,由Java语言实现,独立与虚拟机外部,并且全部继承自抽象类java.lang.ClassLoader。

从Java开发人员的角度来看,大多数程序员都会使用以下3中系统提供的类加载器:

①启动类加载器(Bootstrap ClassLoader),这个加载器负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的类库加载到虚拟机内存中。

②扩展类加载器(Extension ClassLoader):负责<JAVA_HOME>\lib\ext目录中的,或者被java.ext.dirs系统变量所指定的路径中的所有类库进行加载,开发者可以直接使用。

③所有程序类加载器(Application ClassLoader):是ClassLoader中的getSystemClassLoader()方法的返回值,所以一般也称为系统类加载器。它负责加载用户类路径(ClassPath)上所指定的类库,开发者可以直接使用这个类加载器。

双亲委派模型要求除了顶层的父类加载器外,其余的类加载器都应当有自己的父类加载器,这里的父子关系一般不是继承,而是都使用组合关系来复用父类加载器的代码。

双亲委派模型的工作过程是:如果一个类加载器收到了类加载请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的父类加载器都是如此,只有当父类加载器返回自己无法完成这个加载请求时,子加载器才会尝试自己去在加载。

 

本章节介绍了虚拟机的类加载过程,其中的更具体的内容还请读者尽量看书,可以更进一步的理解。如有错误,敬请指出。