方法区概述
1 栈和堆和方法区间的交互关系
从运行时数据区结构来看,方法区是要讨论的另一个结构。
从线程共享与否的角度来看
栈、堆、方法区的交互关系
2 方法区的理解
摘自 Oracle 官网 JVM 规范 2.5.4. Method Area
The Java Virtual Machine has a method area that is shared among all Java Virtual Machine threads. The method area is analogous to the storage area for compiled code of a conventional language or analogous to the “text” segment in an operating system process. It stores per-class structures such as the run-time constant pool, field and method data, and the code for methods and constructors, including the special methods (§2.9) used in class and instance initialization and interface initialization.
The method area is created on virtual machine start-up. Although the method area is logically part of the heap, simple implementations may choose not to either garbage collect or compact it. This specification does not mandate the location of the method area or the policies used to manage compiled code. The method area may be of a fixed size or may be expanded as required by the computation and may be contracted if a larger method area becomes unnecessary. The memory for the method area does not need to be contiguous.
A Java Virtual Machine implementation may provide the programmer or the user control over the initial size of the method area, as well as, in the case of a varying-size method area, control over the maximum and minimum method area size.
The following exceptional condition is associated with the method area:
- If memory in the method area cannot be made available to satisfy an allocation request, the Java Virtual Machine throws an OutOfMemoryError.
方法区在哪里
《Java 虚拟机规范》中明确说明:“尽管所有的方法区在逻辑上是属于堆的一部分,但一些简单的实现可能不会选择去进行垃圾收集或者进行压缩。” 但对于 HotSpot JVM 而言,方法区还有一个别名叫做 Non-Heap(非堆),目的就是要和堆分开。
所以,方法区看作是一块独立于 Java 堆的内存空间。
- 方法区 (Method Area) 与 Java 堆一样,是各个线程共享的内存区域。
- 方法区在 JVM 启动的时候被创建,并且它的实际的物理内存空间中和 Java 堆区一样都可以是不连续的。
- 方法区的大小,跟堆空间一样,可以选择固定大小或者可扩展。
- 方法区的大小决定了系统可以保存多少个类,如果系统定义了太多的类,导致方法区溢出,虚拟机同样会抛出内存溢出错误:
java.lang.OutOfMemoryError: PermGen space
或者java.lang.OutOfMemoryError: Metaspace
- 加载大量第三方的 jar 包;Tomcat 部署的工程过多(30-50)个;大量动态的生产反射类
- 关闭 JVM 就会释放这个区域的内存。
1 | public class MethodAreaDemo { |
上面这段简单的代码,运行的时候会加载多少个类呢?
运行程序,使用 Visual VM 的 Sampler 查看发现如此简单的几句代码执行时竟然加载了一千五百多个类。
HotSpot中方法区的演进
- 在 jdk7 及以前,习惯上把方法区,称为永久代。jdk8 开始,使用元空间取代了永久代。
- 本质上,方法区和永久代并不等价。仅是对 Hotspot 而言的。《Java 虚拟机规范》对如何实现方法区,不做统一要求。例如: BEA JRockit / IBM J9 中不存在永久代的概念。
- ➢ 现在来看,当年使用永久代,不是好的 idea。导致 Java 程序更容易
OOM
(超过-XX:MaxPermSize
上限)
- ➢ 现在来看,当年使用永久代,不是好的 idea。导致 Java 程序更容易
而到了 JDK 8 ,终于完全废弃了永久代的概念,该用与 JRockit、J9 一样在本地内存中实现的元空间(Metaspace)来代替
元空间的本质和永久代类似,都是对 JVM 规范中的方法区的实现 。不过元空间与永久代最大的区别在于;元空间不在虚拟机设置的内存中,而是使用本地内存。
永久代、元空间二者并不只是名字变了,内部机构也调整了。
根据《Java 虚拟机规范》的规定,如果方法区无法满足新的内存分配需求时,将 抛出 OOM 异常。
3 设置方法区大小与OOM
方法区的大小不必是固定的,jvm 可以根据应用的需要动态调整。
- jdk7 及以前:
- ➢ 通过
-XX:PermSize
来设置永久代初始分配空间。默认值是 20.75M - ➢
-XX:MaxPermSize
来设定永久代最大可分配空间。32 位机器默认是 64M, 64 位机器模式是 82M - ➢ 当 JVM 加载的类信 息容量超过了这个值,会报异常
OutOfMemoryError : PermGen space
。
- ➢ 通过
1 | package com.atguigu.java; |
首先,在 Idea 中将环境调整为 JDK 7:
- 打开
Project Structure
-Modules
- 选中当前chapter09
, 将Sources
选项中的Language Level
调整为7
; - 打开
Run
-Edit Configurations
,将JRE
调整为JDK7
.
1 | yan ~/Documents/JVMDemo jps |
21757952 / 1024 / 1024 = 20.75 M
然后,将 Language Level
和 JRE
重新设置为 JDK 8,重新运行上面的程序和命令:
1 | yan ~/Documents/JVMDemo jps |
- jdk8 及以后:
- ➢ 元数据区大小可以使用参数
-XX:MetaspaceSize
和-XX:MaxMetaspaceSize
指定,替代上述原有的两个参数。 - ➢ 默认值依赖于平台。windows 下,
-XX:MetaspaceSize
是 21M,-XX:MaxMetaspaceSize
的值是 - 1,即没有限制。 - ➢ 与永久代不同,如果不指定大小,默认情况下,虚拟机会耗尽所有的可用系统内存。如果元数据区发生溢出,虚拟机一样会拋出异常
OutOfMemoryError: Metaspace
- ➢
-XX:MetaspaceSize
: 设置初始的元空间大小。 对于一个 64 位的服务器端 JVM 来说,其默认的-XX:MetaspaceSize
值为 21MB. 这就是初始的高水位线,一旦触及这个水位线,Full GC 将会被触发并卸载没用的类 (即这些类对应的类加载器不再存活),然后这个高水位线将会重置。新的高水位线的值取决于 GC 后释放了多少元空间。如果释放的空间不足,那么在不超过MaxMetaspaceSize
时,适当提高该值。如果释放空间过多,则适当降低该值。 - ➢ 如果初始化的高水位线设置过低, 上述高水位线调整情况会发生很多次。 通过垃圾回收器的日志可以观察到 Full GC 多次调用。为了避免频繁地 GC,建议将
XX:MetaspaceSize
设置为一个相对较高的值。
- ➢ 元数据区大小可以使用参数
OOMTest:
1 | package com.atguigu.java; |
如何解决这些OOM?(涉及调优,以后细说)
- 要解决 OOM 异常或 heap space 的异常,一般的手段是首先通过内存映像分析工具 (如 Eclipse Memory Analyzer) 对 dump 出来的堆转储快照进行分析,重点是确认内存中的对象是否是必要的,也就是要先分清楚到底是出现了内存泄漏 (Memory Leak) 还是内存溢出 (Memory overflow)。
- 如果是内存泄漏,可进一步通过工具查看泄漏对象到 GC Roots 的引用链。于是就能找到泄漏对象是通过怎样的路径与 GCRoots 相关联并导致垃圾收集器无法自动回收它们的。掌握了泄漏对象的类型信息,以及 GC Roots 引用链的信息,就可以比较准确地定位出泄漏代码的位置。
- 如果不存在内存泄漏,换句话说就是内存中的对象确实都还必须存活着,那就应当检查虚拟机的堆参数 (
-Xmx
与-Xms
) ,与机器物理内存对比看是否还可以调大,从代码上检查是否存在某些对象生命周期过长、持有状态时间过长的情况,尝试减少程序运行期的内存消耗。
4 方法区的内部结构
方法区 (Method Area) 存储什么
《深入理解 Java 虛拟机》书中对方法区 (Method Area) 存储内容描述如下:
它用于存储已被虚拟机加载的 类型信息、常量、静态变量、即时编译器编译后的代码缓存 等。
类型信息
对每个加载的类型 (类 class、接口 interface、枚举 enum、注解 annotation),JVM 必须在方法区中存储以下类型信息:
- ①这个类型的完整有效名称 (全名 = 包名。类名)
- ②这个类型直接父类的完整有效名 (对于 interface 或是 java. lang .object,都没有父类)
- ③这个类型的修饰符 (public, abstract, final 的某个子集)
- ④这个类型直接接口的一个有序列表
域 (Field) 信息
- JVM 必须在方法区中保存类型的所有域的相关信息以及域的声明顺序。
- 域的相关信息包括:域名称、域类型、域修饰符 (public, private,protected, static, final, volatile, transient 的某个子集)
方法 (Method) 信息
JVM 必须保存所有方法的以下信息,同域信息 - - 样包括声明顺序:
- 方法名称
- 方法的返回类型 (或 void)
- 方法参数的数量和类型 (按顺序)
- 方法的修饰符 (public, private, protected, static, final,synchronized, native, abstract 的一个子集)
- 方法的字节码 (bytecodes)、 操作数栈、局部变量表及大小 (abstract 和 native 方法除外)
- 异常表 (abstract 和 native 方法除外)
- ➢ 每个异常处理的开始位置、结束位置、代码处理在程序计数器中的偏移地址、被捕获的异常类的常量池索引
字节码角度举例查看
1 | package com.atguigu.java; |
javap
解析字节码文件:javap -v -p MethodInnerStrucTest.class > a2.txt
加 -p
参数的原因是显示使用 private
修饰符修饰的内容
1 | Classfile /Users/yan/Documents/JVMDemo/out/production/chapter09/com/atguigu/java/MethodInnerStrucTest.class |
non-final 的类变量
- 静态变量和类关联在一起,随着类的加载而加载,它们成为类数据在逻辑上的一部分。
- 类变量被类的所有实例共享,即使没有类的实例时也可以访问它。
比如下面的代码:
1 | package com.atguigu.java; |
在执行时是不会报空指针异常的。其编译后生成的字节码文件中实际上是直接调用的类的静态方法和静态变量。
1 | Classfile /Users/yan/Documents/JVMDemo/out/production/chapter09/com/atguigu/java/MethodAreaTest.class |
补充说明:全局常量:final static
被声明为 final
的类变量的处理方法则不同,每个全局常量在编译的时候就会被分配了。
1 | Classfile /Users/yan/Documents/JVMDemo/out/production/chapter09/com/atguigu/java/Order.class |
从
1 | public static int count; |
可以看出来 static final
的变量在编译时就已经确定好值了,再从
1 | static {}; |
可以看出来仅使用 static
修饰的类变量在类加载时才被初始化变量。实际上上面的代码对应的就是字节码中的 <clinit>()
方法,也就是类加载的初始化阶段。
class 文件中常量池的理解
运行时常量池 VS 常量池
- 方法区,内部包含了运行时常量池。
- 字节码文件中,内部包含了常量池。
- 要弄清楚方法区,需要理解清除 ClassFile ,因为加载类的信息都在方法区。
- 要弄清楚方法区的运行时常量池,需要理解清除 ClassFile 中的常量池。
一个有效的字节码文件中除了包含类的版本信息、字段、方法以及接口等描述信息外,还包含一项信息那就是常量池表 (Constant Pool Table) ,包括各种字面量和对类型、域和方法的符号引用。
为什么需要常量池
一个 java 源文件中的类、接口,编译后产生一个字节码文件。而 Java 中的字节码需要数据支持,通常这种数据会很大以至于不能直接存到字节码里,换另一种方式,可以存到常量池,这个字节码包含了指向常量池的引用。在动态链接的时候会用到运行时常量池,之前有介绍。
比如:如下的代码:
1 | public class SimpleClass { |
虽然 SimpleClass.java
只有 194 字节,但是里面却使用了 String
、System
、PrintStream
及 Object
等结构。这里代码量其实已经很小了。如果代码多,引用到的结构会更多!这里就需要常量池了!
常量池中有什么
几种在常量池内存储的数据类型包括:
- 数量值
- 字符串值
- 类引用
- 字段引用
- 方法引用
例如下面这段代码:
1 | public class MethodAreaTest2{ |
Object foo = new Object();
将会被编译成如下字节码:
1 | 0: new #2 // Class java/lang/Object |
小结
常量池,可以看做是一张表,虚拟机指令根据这张常量表找到要执行的类名、方法名、参数类型、字面量等类型。
运行时常量池的理解
运行时常量池
- 运行时常量池 (Runtime Constant Pool) 是方法区的一部分。
- 常量池表 ( Constant Pool Table) 是 Class 文件的一部分,用于存放编译期生成的各种字面量与符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。
- 运行时常量池,在加载类和接口到虛拟机后,就会创建对应的运行时常量池。
- JVM 为每个已加载的类型 ( 类或接口) 都维护一个常量池。池中的数据项像数组项一样,是通过索引访问的。
- 运行时常量池中包含多种不同的常量,包括编译期就已经明确的数值字面量,也包括到运行期解析后才能够获得的方法或者字段引用。此时不再是常量池中的符号地址了,这里换为真实地址。
- ➢ 运行时常量池,相对于 Class 文件常量池的另一重要特征是:具备动态性。
- 运行时常量池类似于传统编程语言中的符号表 (symboltable),但是它所包含的数据却比符号表要更加丰富一些。
- 当创建类或接口的运行时常量池时,如果构造运行时常量池所需的内存空间超过了方法区所能提供的最大值,则 JVM 会抛
OutOfMemoryError
异常。
5 方法区使用举例
图示举例方法区的使用
6 方法区的演进细节
首先明确:只有 HotSpot 才有永久代。
BEA JRockit、IBM J9等来说,是不存在永久代的概念的。原则上如何实现方法区属于虚拟机实现细节,不受《Java 虚拟机规范》管束,并不要求统一。
HotSpot 中方法区的变化:
0 1 jdk1.6 及之前 有永久代 (permanent generation) ,静态变量存放在永久代上 jdk1.7 有永久代,但已经逐步 “去永久代”,字符串常量池、静态变量移除,保存在堆中 jdk1.8 及之后 无永久代,类型信息、字段、方法、常量保存在本地内存的元空间,但字符串常量池、静态变量仍在堆
永久代为什么要被元空间替换
http://openjdk.java.net/jeps/122 中关于 Remove the Permanent Generation 的描述:
Summary
Remove the permanent generation from the Hotspot JVM and thus the need to tune the size of the permanent generation.
从 Hotspot JVM 中删除永久代,因此不需要调整永久代的大小。
Motivation
This is part of the JRockit and Hotspot convergence effort. JRockit customers do not need to configure the permanent generation (since JRockit does not have a permanent generation) and are accustomed to not configuring the permanent generation.
这是 JRockit 和 Hotspot 融合工作的一部分。 JRockit 客户不需要配置永久代(因为 JRockit 没有永久代),并且习惯于不配置永久代。
随着 Java8 的到来,HotSpot VM 中再也见不到永久代了。但是这并不意味着类的元数据信息也消失了。这些数据被移到了一个与堆不相连的本地内存区域,这个区域叫做**元空间( Metaspace )**。
由于类的元数据分配在本地内存中,元空间的最大可分配空间就是系统可用内存空间。
这项改动是很有必要的,原因有:
1) 为永久代设置空间大小是很难确定的。
在某些场景下,如果动态加载类过多,容易产生 Perm 区的 OOM。比如某个实际 Web 工程中,因为功能点比较多,在运行过程中,要不断动态加载很多类,经常出现致命错误。"Exception in thread 'dubbo client x.x connector' java.lang.OutOfMemoryError: PermGen space"
而元空间和永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。
因此,默认情况下,元空间的大小仅受本地内存限制。
2) 对永久代进行调优是很困难的。
StringTable为什么要调整位置
与 Jdk1.6 不同,jdk7 中将 StringTable 放到了堆空间中。因为永久代的回收效率很低,在 full gc 的时候才会触发。而 full gc 是老年代的空间不足、永久代不足时才会触发。
这就导致 StringTable 回收效率不高。而我们开发中会有大量的字符串被创建,回收效率低,导致永久代内存不足。放到堆里,能及时回收内存。
如何证明静态变量存在哪
参考《深入理解 Java 虚拟机》第三版:4.2.1 节
通过实验来回答一个简单问题:staticObj、instanceObj、localObj这三个变量本身(而不是它们所指向的对象)存放在哪里?
代码清单4-6 JHSDB测试代码
1 | /** |
1.答案读者当然都知道:staticObj随着Test的类型信息存放在方法区,instanceObj随着Test的对象实例存放在Java堆,localObject则是存放在foo()方法栈帧的局部变量表中。这个答案是通过前两章学习的理论知识得出的,现在要做的是通过JHSDB来实践验证这一点。
2.从《Java虚拟机规范》所定义的概念模型来看,所有Class相关的信息都应该存放在方法区之中, 但方法区该如何实现,《Java虚拟机规范》并未做出规定,这就成了一件允许不同虚拟机自己灵活把握的事情。JDK 7及其以后版本的HotSpot虚拟机选择把静态变量与类型在Java语言一端的映射Class对象存放在一起,存储于Java堆之中,从我们的实验中也明确验证了这一点。
3.在JDK 7以前,即还没有开始“去永久代”行动时,这些静态变量是存放在永久代上的,JDK 7起把 静态变量、字符常量这些从永久代移除出去。
7 方法区的垃圾回收
有些人认为方法区 (如 HotSpot 虚拟机中的元空间或者永久代) 是没有垃圾收集行为的,其实不然。《Java 虚拟机规范》对方法区的约束是非常宽松的,提到过可以不要求虚拟机在方法区中实现垃圾收集。事实上也确实有未实现或未能完整实现方法区类型卸载的收集器存在 (如 JDK11 时期的 ZGC 收集器就不支持类卸载)。
一般来说这个区域的回收效果比较难令人满意,尤其是类型的卸载,条件相当苛刻。但是这部分区域的回收有时又确实是必要的。以前 Sun 公司的 Bug 列表中,曾出现过的若干个严重的 Bug 就是由于低版本的 HotSpot 虚拟机对此区域未完全回收而导致内存泄漏。
方法区的垃圾收集主要回收两部分内容:常量池中废弃的常量和不再使用的类型。
● 先来说说方法区内常量池之中主要存放的两大类常量:字面量和符号引用。字面量比较接近 Java 语言层次的常量概念,如文本字符串、被声明为 final 的常量值等。而符号引用则属于编译原理方面的概念,包括下面三类常量:
- ➢ 1、类和接口的全限定名
- ➢ 2、字段的名称和描述符
- ➢ 3、方法的名称和描述符
● HotSpot 虚拟机对常量池的回收策略是很明确的,只要常量池中的常量没有被任何地方引用,就可以被回收。
● 回收废弃常量与回收 Java 堆中的对象非常类似。
● 判定一个常量是否 “废弃” 还是相对简单,而要判定一个类型是否属于 “不再被使用的类” 的条件就比较苛刻了。需要同时满足下面三个条件:
- ➢ 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类及其任何派生子类的实例。
- ➢ 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如 OSGi、JSP 的重加载等,否则通常是很难达成的。
- ➢ 该类对应的
java.lang.Class
对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
● Java 虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是 “被允许”,而并不是和对象一样,没有引用了就必然会回收。关于是否要对类型进行回收,HotSpot 虚拟机提供了 -Xnoclassgc
参数进行控制,还可以使用 -verbose:class
以及 -XX:+TraceClass-Loading
、-XX:+TraceClassUnLoading
查看类加载和卸载信息
● 在大量使用反射、动态代理、CGLib 等字节码框架,动态生成 JSP 以及 OSGi 这类频繁自定义类加载器的场景中,通常都需要 Java 虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力。
8 总结
常见面试题
百度:
- 三面:说一下 JVM 内存模型吧,有哪些区?分别干什么的?
蚂蚁金服:
- Java8 的内存分代改进
- JVM 内存分哪几个区,每个区的作用是什么?
- 一面: JVM 内存分布 / 内存结构?栈和堆的区别?堆的结构?为什么两个 survivor 区?
- 二面: Eden 和 Survior 的比例分配
小米:
- jvm 内存分区,为什么要有新生代和老年代
字节跳动:
- 二面: Java 的内存分区
- 二面:讲讲 jvm 运行时数据区
- 什么时候对象会进入老年代?
京东:
- JVM 的内存结构,Eden 和 Survivor 比例。
- JVM 内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为 Eden 和 Survivor。
天猫: .
- 一面: Jvm 内存模型以及分区,需要详细到每个区放什么。
- 一面: JVM 的内存模型,Java8 做了什么修改
拼多多:
- JVM 内存分哪几个区,每个区的作用是什么?
美团:
- java 内存分配
- jvm 的永久代中会发生垃圾回收吗?
- 一面: jvm 内存分区,为什么要有新生代和老年代?