简介
- 本文无特殊说明,默认基于JDK1.8
- Java Language Specification
- Java Virtual Machine Specification
- JVM底层原理总结
- Java执行
javac
x.java -> x.class- 将x.class加载到ClassLoader,并将一些java类库加载进来
- 再通过字节码解释器或JIT即时编译器(一些常用的代码会自动编译成本地代码)
- 调用执行引擎
- 只要是能编译成class文件的便可以在JVM上执行,如java、groovy、scale等100多种;而不同的操作系统Unix/Linux/Windows/Android会有不同的JVM实现
- JVM是一种规范,有不同的实现,如HostSpot(oracle官方)、OpenJDK(HostSpot的开源版本)、JcrocKit(被Oracle收购,合并到hostspot)、J9(IBM)、Microsoft VM、TaobaoVM、azul zing
javassist
:处理 Java 字节码的类库,它可以在一个已经编译好的类中添加新的方法,或者是修改已有的方法- JVM三种编译器
- 前端编译器: Javac、ECJ
- JIT编译器: HotSpot C1/C2
- AOT编译器: GCJ、JET,常用于云原生
Class File Format
- The class File Format
- class文件分析
- 通过文本文件打开则是0101
- 一般是通过16进制编辑器打开二进制文件进行观察,如使用notepad(HEX-Editor插件或Converter插件,选中文件ASCII->HEX)打开或idea安装BinEd插件查看16进制
- 查看ByteCode字节码
javap -v D:\smjava\jvm\classes\cn\aezo\jvm\c01_class\T1_HelloWorld.class
-v查看详细信息- 或使用idea字段功能 View - Show ByteCode(基于javap)
- 或使用idea插件jclasslib查看(选中java类,在View菜单下会显示此工具)
- 通过文本文件打开则是0101
ClassFile结构
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19// 1个16进制数(0x1或0xC)对应4位二进制数,1个字节是8位(二进制数),因此2个16进制数代表一个字节
ClassFile {
u4 magic; // 文件头信息 0xCAFEBABE,u4表示无符号的4个字节,下同
u2 minor_version; // 次版本号
u2 major_version; // 主版本号,JDK8为52
u2 constant_pool_count; // 常量池个数
cp_info constant_pool[constant_pool_count-1]; // 常量池
u2 access_flags; // 描述符,如ACC_PUBLIC(0x0001)、ACC_INTERFACE等
u2 this_class;
u2 super_class;
u2 interfaces_count;
u2 interfaces[interfaces_count];
u2 fields_count;
field_info fields[fields_count];
u2 methods_count;
method_info methods[methods_count];
u2 attributes_count;
attribute_info attributes[attributes_count];
}access_flags描述符
- ACC_PUBLIC(0x0001)、ACC_INTERFACE、ACC_SYNCHRONIZED、ACC_VOLATILE
- 字段描述符解释
Ljava.lang.String
引用、[
数组、[[
二维数组、J
Long、Z
boolean、B
byte,其他同B基本以首字母开头
- 常量池标识
- 1 CONSTANT_Utf8(1为Tag类型)
- 3 CONSTANT_Integer
- 7 CONSTANT_Class
- 8 CONSTANT_String
- …
- 语句/指令,如
aload, aload_<n>
invokespecial
调用实例方法,对父类实例化的特殊处理return
返回void
类加载过程
- 类加载过程
Loading
- 将class加载到内存(一方面创建一个内存区域保存字节码,另一方面会创建一个Class对象指向此区域,之后使用此类需要通过此Class对象进行访问)
- 双亲委派机制,见下文
- LazyLoading 五种情况
- new getstatic putstatic invokestatic指令会初始化;访问final变量除外,即不会初始化
- java.lang.reflect对类进行反射调用、使用 Class.forName 时会初始化
- 初始化子类的时候,父类首先初始化
- 虚拟机启动时,被执行的主类必须初始化
- 动态语言支持java.lang.invoke.MethodHandle解析的结果为REF_getstatic REF_putstatic REF_invokestatic的方法句柄时,该类必须初始化
- 混合执行(默认)、编译执行、解释执行
- 解释器(Bytecode Intepreter)、
JIT
(Just In-Time compiler) 编译执行 -Xmixed
设置混合模式,启动速度较快,对热点代码实行检测和编译。认为热点代码条件:-XX:CompileThreshold=10000
-Xint
使用解释执行模式,启动很快,执行相对慢-Xcomp
使用编译执行模式,启动相对较慢,执行快
- 解释器(Bytecode Intepreter)、
Linking
Verification
验证格式Preparation
依次给静态变量赋默认值(如0/false)- 类加载:赋默认值 -> 赋初始值. 示例
- new对象(类似类加载):申请内存 -> 赋默认值 -> 赋初始值
Resolution
解析(将符号引用转换为直接引用)- 将类、方法、属性等符号引用解析为直接引用,常量池中的各种符号引用解析为指针、偏移量等内存地址的直接引用
- 符号引用:通常是设计过的字符串,用文本形式来表示引用关系
- 直接引用:是JVM(或其它运行时环境)所能直接使用的形式,如直接指针
Initializing
给静态变量赋初始值
双亲委派机制(Loading时)
- 先从子到父查找缓存,再从父到子查找class文件并加载
- .class文件通过(自定义)ClassLoader#loadClass加载,先在(自定义)ClassLoader的缓存中查找是否有此类,有则返回结果,没有则让父加载器App进行缓存加载
- 以此类推到ExtClassLoader,最后到Bootstrap,如果Bootstrap在内存中找打了则返回,否则回过头让ExtClassLoader查找class文件并加载,找到则加载后返回结果,没找到则让下级Loader查找class文件并加载
- 直到最后的(自定义)ClassLoader,如果还找到不class文件则返回Class Not Found
- 加载过程(参考sun.misc.Launcher)
- Launcher:java程序入口,负责实例化相关class,ExtClassLoader和AppClassLoader都是其内部实现类
- Bootstrap classLoader:底层由C++编写,已嵌入到了JVM内核当中,当JVM启动后,Bootstrap ClassLoader也随着启动,负责加载完核心类库后,并构造Extension ClassLoader和App ClassLoader类加载器
- URLClassLoader:支持从jar文件和文件夹中获取class
- ExtClassLoader:扩展类加载器,继承自URLClassLoader,加载位于$JAVA_HOME/jre/lib/ext目录下的扩展jar,查看源代码可知System.getProperty(“java.ext.dirs”)
- AppClassLoader:应用类加载器,继承自URLClassLoader,也叫系统类加载器,ClassLoader.getSystemClassLoader()可得到它,它负载加载应用的classpath下的类,查找范围System.getProperty(“java.class.path”),通过-cp或-classpath指定的类都会被其加载
- 作用
- 防止重复加载同一个.class
- 保证核心.class不能被篡改,为了安全考虑。假设自己定义一个java.lang.String进行自定义加载,用了双亲委派,则自定义加载器没有还需要到上层加载器询问,此时官方有定义这个类,则上层加载器会加载,自定义的String类则无效
- 自定义ClassLoader:继承自ClassLoader,并重写findClass方法
- 打破双亲委派
- 重写loadClass()。JDK1.2之前,自定义ClassLoader都必须重写loadClass()
- 使用范畴
- 热启动,热部署
- osgi tomcat 都有自己的模块指定classloader(可以加载同一类库的不同版本)
ClassLoader相关代码:findInCache -> parent.loadClass -> findClass
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55// ClassLoader.java#loadClass
protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// First, check if the class has already been loaded
// 由于下面执行了parent.loadClass,所以是先从子->父执行findLoadedClass(判断是否已经加载了)
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
if (parent != null) {
c = parent.loadClass(name, false); // parent为final修饰的
} else {
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// ClassNotFoundException thrown if class not found
// from the non-null parent class loader
}
// 由于上面执行了parent.loadClass,所以是先从父->子执行findClass(查找class文件并加载)
if (c == null) {
// If still not found, then invoke findClass in order
// to find the class.
long t1 = System.nanoTime();
c = findClass(name); // ClasssLoader中直接throw Excption了,需要子类自己实现(在各自负责的目录进行查找)。使用了模板方法的设计模式
// this is the defining class loader; record the stats
sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
sun.misc.PerfCounter.getFindClasses().increment();
}
}
// Resolution阶段
if (resolve) {
resolveClass(c);
}
return c;
}
}
// URLClassLoader.java#findClass
String path = name.replace('.', '/').concat(".class");
Resource res = ucp.getResource(path, false);
if (res != null) {
try {
return defineClass(name, res); // 通过defineClass进行加载
} catch (IOException e) {
throw new ClassNotFoundException(name, e);
}
} else {
return null;
}
- 先从子到父查找缓存,再从父到子查找class文件并加载
JMM(Java内存模型)
- JMM(Java Memory Model)
- 对象在内存中的存储布局
- 对象头
面试题:关于对象
- 请解释一下对象的创建过程
- class加载
- class loading
- class linking(verification、preparation、resolution)
- class initialization
- 申请对象内存
- 成员变量赋默认值
- 调用构造方法(如果有继承则会先执行父类的构造方法)
- 成员变量依次赋初始值
- 执行构造方法语句
- class加载
- 对象在内存中的存储布局
- 普通对象
- 对象头
Mark Word
标记字段,占8个字节Klass Pointer
类型指针,用来指向对象对应的Class对象(其对应的元数据对象)的内存地址(也称ClassPointer)- 增加
-XX:+UseCompressedClassPointers
(开启ClassPointer指针压缩) 参数时为4字节,不开启(换成减号,-XX:-UseCompressedClassPointers)则为8字节。java -XX:+PrintCommandLineFlags -version
可查看JVM默认配置(64位开启了ClassPointer指针压缩) - Hotspot开启内存压缩的规则(64位机):4G以下直接砍掉高32位;4G-32G默认开启内存压缩(ClassPointers、Oops);32G以上压缩无效,使用64位,内存并不是越大越好
- 增加
- 实例数据
- 主要是成员变量:基础数据类型、引用类型
- 引用类型:开启
-XX:+UseCompressedOops
(开启普通对象指针压缩) 配置时为4字节,不开启(换成减号)则为8字节。Oops:Ordinary Object Pointers
- Padding对齐:对象总大小保证为8的倍数
- 对象头
- 数组对象(多了一个数组长度)
- 对象头
- Mark Word,同上
- Klass Pointer,同上
- 数组长度,占4字节
- 实例数据,同上
- Padding对齐,同上
- 对象头
- 普通对象
对象头具体包括什么
32位操作系统markword如下
- markword包含的内容和对象的状态有关
- 最后两位是锁标志位
- 无锁和偏向锁时,倒数第三位记录了偏向锁状态
- 分代年龄占4位(2^4=0->15),因此GC年龄最大为15
- 无锁状态时可能存储了hashCode,占25bit
- 只有未重写hashCode方法且调用了hashCode方法/System.identityHashCode时才会将hashCode存放在markword中(重写了hashCode方法的计算结果不会存放在此处)
- 未重写hashCode方法的,那么默认调用os::random产生hashcode,一旦生成便会记录在markword中,可以通过System.identityHashCode获取
- 当一个对象计算过identityHashCode之后,不能进入偏向锁状态(因为记录偏向锁线程的位置被hashCode占用了)
- markword包含的内容和对象的状态有关
64位操作系统markword如下
- 对象怎么定位
- 句柄池、直接指针
- 不同的JVM实现可能不同,HotSpot使用的直接指针(寻找对象快,GC相对慢)
- 对象怎么分配,见下文垃圾回收器
- Object o = new Object()在内存中占用多少字节(64位系统)
- 基于jvm agent完成:在将class加载到内存时,会先执行指定的agent,此时可拦截class进行操作(如获取大小)。参考ObjectSizeAgent.java.bak
- 开启ClassPointer压缩:8(markword) + 4(ClassPointer指针) + 0(无实例数据/属性) + 4(Padding对齐) = 16字节
- 未开ClassPointer压缩:8(markword) + 8(ClassPointer指针) + 0(无实例数据/属性) + 0(Padding对齐) = 16字节
- 比较两个对象是否相等,只有它们是由同一个类加载器加载时,才有意义。对于同一个类,如果由不同类加载器加载,则他们也必然不相等。(相等包括Class对象的equals方法、isAssignableFrom()方法、isInstance()方法返回的结果,也包括用instanceof关键词判断的情况)
Runtime Data Area运行时数据区
- java线程有各自的PC(Program Counter程序计数器,记录指令的执行位置)、VMS(Virtual Machine Stack)、NMS(Native Method Stack);但是他们共用Heap、Method Area ^1
- PC 程序计数器:存放指令位置
- JVM Stack
- 一个线程会有一个Stack,一个Stack有多个Frame栈帧组成,每个方法对应一个Frame栈帧
- Frame栈帧组成
- 局部变量表(
Local Variables
) - 操作数栈(
Opreand Stack
) 或表达式栈 - 动态链接 (
Dynamic Linking
) 或指向运行时常量池的方法引用- 在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(Symbolic Reference )保存在class文件的常量池里。比如,描述一个方法调用其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用
- 加载类的Resolution阶段就是将符号应用转换为直接引用
- 返回地址(Return Address) 或方法退出的引用的定义(a方法调用b方法,b方法返回的值保存的位置)
- 局部变量表(
- Native Method Stack
- Heap
- Method Area(逻辑概念)
- JVM规范中定义的一个概念,用于存储类信息、常量池(Runtime Constant Pool)、静态变量、JIT编译后的代码等数据
- 具体放在哪里,不同的实现可以放在不同的地方
- JDK<1.8时,实际指 Perm Space(在Hotspot中,方法区只是在逻辑上独立,物理上还是包含在堆区中,又称永久代)。此时FGC不会清理,大小在启动的时候指定,不能变
- JDK>=1.8时,实际指 Meta Space(并不在虚拟机中,而是使用本地内存)。会触发FGC清理,不设定的话,最大就是物理内存
Instruction Set常用指令
https://docs.oracle.com/javase/specs/jvms/se14/html/jvms-4.html#jvms-4.10.1.9
- 压栈和弹栈(此处栈均指Opreand Stack)
- 压栈:将值放到栈顶,如store类型指令
- 弹栈:将栈顶的值从栈中取出(包含从栈中移除)
- 根据命令特点确定是否需要弹栈和弹出几个操作值。如sub命令,是对两个数进行操作,因此是从栈顶中弹出两个值
- 常用指令
- load 从本地变量表中取值并放到栈顶(压栈)
iload_<n>
从第n个本地变量表中的int型值取出并放到栈顶。如果是short等则会转换为intlload_<n>
从第n个本地变量表中的long型值取出并放到栈顶fload_<n>
float型dload_<n>
double型aload_<n>
引用型
- const 将常量值放到栈顶(压栈)
iconst_<i>
将int型常量值i放到栈顶。其他数据类型同load
- store 存表
istore_<n>
将栈顶int型数值存入第n个本地变量。其他数据类型同load
new
创建一个对象,并将其引用值压入栈顶dup
复制栈顶数值并将复制值压入栈顶- invoke
invokestatic
调用静态方法invokevirtual
非private的成员方法(自带多态,此指令会根据实际对象的引用调用对应方法)invokeinterface
调用接口方法inovkespecial
可以直接定位,不需要多态的方法 private 方法、构造方法()。final修饰的方法是InvokeVirtual invokedynamic
如lambda表达式、反射、其他动态语言(scala kotlin等)、CGLib、ASM等动态产生的class,会用到此指令
pop
将栈顶数值弹出 (数值不能是long或double类型的)- pop2 将栈顶的一个(long或double类型的)或两个数值弹
- inc
iinc
如:iinc 0 by 1 表示将本地变量表的第0个位置(int型)值增加1(仅修改了本地变量表的值,并没有修改栈中的值)
- add 将栈顶两int型数值相加并将结果压入栈顶
- sub 相减
- mul 相乘
ifeq
当栈顶int型数值等于0时跳转,如:ifeq 7 (+5) 如果相等则跳到7号指令(当前指令号+5)if_icmpne
(if int compare not equel) 比较栈顶两int型数值大小,当结果不等于0时跳转
- load 从本地变量表中取值并放到栈顶(压栈)
- 案例一
1 | /** |
案例二
- main方法第0号指令:创建一个对象,并将其引用值压入栈顶(执行后栈为:对象引用h)
- main方法第3号指令:dup复制一个栈顶值(执行后栈为:对象引用h、对象引用h)
- main方法第4号指令:调用Hello_02的构造方法,此时会弹出一个栈顶值(因此需要先dup一次;执行后栈为:对象引用h)
- main方法第7号指令:将栈顶值赋值到本地变量表第1个位置(即赋值引用地址给h;执行后栈为:空)
分代模型
JVM内存(堆)分代模型
- 内存分代模型用于分代垃圾回收算法,部分垃圾回收器使用此模型
- G1之前(Serial、PS、CMS等)不仅逻辑分代,而且物理分代
- G1是逻辑分代,物理不分代(实际内存分不同的分代区)
- 到Epsilon、ZGC、Shenandoah不分代
堆内存逻辑分区(不适用不分代垃圾回收器)
- 堆内存分为两块:新生代new/年轻代young、老年代Old
- 新生代又分为三块:
Eden
、Survivor-S1
、Survivor-S2
(S1和S2一般一起聊,也有人把他俩叫做S0和S1,或者from和to,就是两块Survivor幸存区) - Survivor区
- Survivor的存在意义
- 就是减少被送到老年代的对象,进而减少Full GC的发生(Full GC耗时相对较长)
- 如果没有Survivor,Eden区每进行一次Minor GC,存活的对象就会被送到老年代,老年代很快被填满
- Survivor的预筛选保证,只有经历16次Minor GC(分代年龄为15, CMS为6)还能在新生代中存活的对象,才会被送到老年代。可通过
-XX:MaxTenuringThreshold
配置此处触发的次数 - 设置两个Survivor区最大的好处就是解决了碎片化
- GC过程
- 刚刚新建的对象在Eden中(可能也会在栈上分配)
- 当经历一次Minor GC,Eden中大多数的对象会被回收,Eden中的存活对象就会被移动到第一块survivor space S0。Eden被清空(每经历一次Minor GC,分代年龄+1)
- 等Eden区再满了,就再触发一次Minor GC,活着的对象eden + s0 -> s1(这个过程非常重要,因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间,避免了碎片化的发生)。S0和Eden被清空
- 然后下一轮S0与S1交换角色,再次Minor GC时,eden + s1 -> s0,如此循环往复。如果对象的分代年龄达到15(CMS为6),该对象就会被送到老年代中
- 如果在某次复制到Survivor区时,要复制的对象大小超过目标Survivor区的一半时,则将其中年龄最大的直接放到老年代中,剩下的保存在目标Survivor区
- 老年代满了触发Full GC
- 上述机制最大的好处就是,整个过程中,永远有一个survivor space是空的,另一个非空的survivor space无碎片
- Survivor分成2块以上,必定每一块的空间就会比较小,很容易导致Survivor区满(从而直接存放到老年代了)
- GC过程
- Survivor的存在意义
对象存放位置变化过程
- 对象存放位置变化过程
- 一个对象产生时,首先尝试在栈上分配,如果符合条件分配在栈了,当方法结束时,栈弹出,对象就终结了
- 如果没在栈上分配,就判断对象大小,如果特别大直接进入Old区,否则的话就分配至Eden区(TLAB也属于Eden区)
- 如果进入Eden区:经过一次YGC后,存活对象在S1和S2交替,每换个区对象的年龄+1
- 多次垃圾回收后,对象的年龄到了,就进入Old区(当然还有动态年龄、分配担保、大对象可进入Old区,见下文)
- 直接分配在Eden区的话,会存在多线程的竞争,效率较低。为了提高效率,减少多线程的竞争,会优先考虑分配在栈上和TLAB上
- 栈上分配
- 条件
- 线程私有小对象
- 没有逃逸(只在某个方法中使用)
- 支持标量替换(这个对象可以用几个简单的变量替换,如成员变量都是基础类型或String)
- 多线程没有竞争;方法结束,栈弹出,对象消失,不用GC回收
- 一般无需调整
- 条件
- 线程本地分配TLAB(Thread Local Allocation Buffer)
- 实际也是属于Eden,默认是Eden的1%
- 如果栈空间不够了,会优先分配在TLAB,主要针对小对象
- 多线程没有竞争,或者竞争很少
- 一般也无需调整
- 栈上分配
- 对象进入老年代的时机
- 分代年龄
- age超过
-XX:MaxTenuringThreshold
指定次数时进入老年代 - 对象头markword里面,GC age标识位占用4位,所以对象的年龄最大为15
- Parallel Scavenge 回收器阈值为 15
- CMS为6
- G1为15
- age超过
- 动态年龄
- 假如当前放对象的Survivor,一批对象(分代年龄从小到大排)的总大小大于这块Survivor(一个Survivor区)内存的50%(默认
-XX:TargetSurvivorRatio=50
),那么大于这批对象年龄的对象,就可以直接进入老年代了
- 假如当前放对象的Survivor,一批对象(分代年龄从小到大排)的总大小大于这块Survivor(一个Survivor区)内存的50%(默认
- 分配担保
- YGC期间Survivor区空间不够了,空间担保直接进入老年代(老年代不够会进行FGC)
- 大对象直接进入老年代(如G1垃圾回收器)
- 如果设置了
-XX:PretenureSizeThreshold
这个参数,那么如果你要创建的对象大于这个参数的值,比如分配一个超大的字节数组,此时就直接把这个大对象放入到老年代,不会经过新生代
- 如果设置了
- 分代年龄
垃圾回收器
GC
(Garbage Collector) 垃圾回收器Minor GC/Yong GC(MGC/YGC)
年轻代(Eden)空间耗尽时触发Major GC/Full GC
在老年代无法继续分配空间时触发,新生代老年代同时进行回收(比较慢、重量级)STW
(Stop The World) 所有的工作线程必须停下等垃圾回收完成Garbage
垃圾- 没有任何引用指向的一个对象或多个对象就是垃圾
- C内存操:malloc free;C++: new delete
- C/C++ 手动回收内存,Java自动回收
- 自动内存回收,编程上简单,系统不容易出错;手动释放内存,容易出两种类型的问题:忘记回收、多次回收
垃圾回收器相关概念
- 垃圾查找算法
reference count
引用计数,当计数为0时则认为是垃圾。不能解决循环引用root searching
根可达算法,从根对象开始找到都是有用的对象- 根对象:线程栈变量、静态变量、常量池、JNI指针
垃圾清除算法
Copying
拷贝(标记拷贝)- 适用于存活对象较少的情况
- 一遍扫描
- 移动复制对象,需要调整对象引用
- 不会产生碎片
- 产生内存减半,空间浪费
Mark-Sweep
标记-清除- 算法相对简单,存活对象比较多的情况下效率高
- 两遍扫描(标记+清除),效率较低。标记算法如:三色标记
- 容易产生碎片
Mark-Compact
标记-压缩- 扫描两次
- 移动复制对象,需要调整对象引用
- 不会产生碎片,方便对象分配
- 不会产生内存减半
标记步骤中的算法如:
三色标记
指将对象标记为不同的颜色(CMS和G1使用)- 白色(未被标记的对象)、灰色(自身被标记,成员变量未被标记)、黑色(自身和成员变量均被标记)
- 从根对象开始标记对象,标记了的则是存活的对象,没有标记的则是垃圾对象
- 存在问题
- 会产生浮动垃圾:黑色A断开了灰色B的引用,此时B对象的属性则可能是垃圾
- 漏标出现的情况(清除了正常的对象)
- 上图中黑色对象A指向了白色对象D,且原来灰色对象B指向D的引用消失(B不再指向D)
- 此时白色D只有一个黑色对象指向,因此会漏标(黑色不会再扫描属性)。而白色D此时是存活对象,漏标导致D被回收(假设A是垃圾对象)
- 解决漏标的算法
Incremental Update
:增量更新,关注引用的增加(即A指向D);把黑色重新标记为灰色,下次重新扫描属性SATB
(snapshot at the beginning) 关注引用的删除(B不再指向D),当引用消失时,把此引用推到GC的堆栈用于下次扫描
- 在引用增加和删除时,结合读写屏障(不同于内存屏障,可理解为AOP,在读写前增加一些额外操作),从而记录变化的引用
- 各垃圾回收器回收机制
- CMS算法:三色标记 + Incremental Update + 写屏障
- G1使用算法:三色标记 + SATB + 写屏障
- ZGC算法:颜色指针 + 读屏障
- 为什么G1使用SATB
- SATB结合
RSet
(参考下文)效率很高。SATB监控到的消失引用,会放到GC堆栈,下次扫描时根据此堆栈的对象引用,到RSet去查找 - 增量更新则需要重新把标记过的对象重新检查其属性
- SATB结合
颜色指针
(Color Pointer,ZGC使用)- 指在对象引用(指针)上会有一个color pointer标识此对象引用是否改变过,参考下文ZGC
Card Table
- 由于做YGC时,需要判断这个对象是否被其他对象引用,有可能引用的对象已经在old区了,但是扫描整个old区,效率非常低,所以JVM设计了CardTable
- 首先将old区分为多个CardTable,将对象放在CardTable中。当某个CardTable有对象指向Yong区,就将它设为Dirty状态,下次扫描时,只需要扫描Dirty CardTable的对象
- CardTable用BitMap(010101标识每个CardTable是否为Dirty)来实现
RSet
(RemembeeredSet) 记录了其他Region中的对象到本Region的引用,占用堆10%左右- 作用在于垃圾收集只需要扫码RSet便可得知哪些对象引用了当前分区(从而不需扫码整个堆)
- 由于RSet的存在,每次给对象赋引用的时候,就得做一些额外操作,GC中称为写屏障(参考上文三色标记)
CSet
(Collection Set) 一组可被回收的分区集合,占用堆空间的1%左右
常见的垃圾回收器
- 垃圾回收器历史
- JDK诞生,便有Serial垃圾回收器
- 为了提高效率,诞生了PS
- JDK1.4后期引入了CMS,为了配合CMS,诞生了PN
- JDK1.7引入了G1
- 之后出现了ZGC等
- JDK版本于垃圾回收器
- JDK6一般是PS+PO,也可使用CMS
- JDK7一般是PS+PO或CMS,出现了G1可能不太成熟
- JDK8默认PS+PO,可使用G1(特别是大内存)
- JDK9默认G1
常见的垃圾回收器
Serial
(读音:/ˈsɪriəl/) 针对年轻代垃圾回收,串行执行(单线程进行回收),会出现STW,使用Copying算法清理(年轻代常用,主要快速)SerialOld
针对老年代回收,串行执行(单线程),会出现STW。一般和Serial结合使用Parallel Scavenge
(PS) 年轻代,并发回收(多线程进行回收),会出现STW,使用Copying算法清理ParallelOld
老年代,并发回收(多线程),会出现STW,使用Mark-Compact算法。一般和PS结合使用ParNew
(PN) 年轻代,并发回收(多线程),会出现STW,使用Copying算法清理(PS的一个升级版本)。般配合CMS的并行回收CMS
(ConcurrentMarkSweep) 老年代,并发回收(多线程),且并行回收(垃圾回收和应用程序同时运行),使用Mark-Sweep算法- CMS使用算法:三色标记 + Incremental Update + 写屏障(相关概念见上文)
- 具体见下文
G1
(Garbadge First Collector),参考:https://www.oracle.com/cn/technical-resources/articles/java/g1gc.html- G1使用算法:三色标记 + SATB + 写屏障
- 具体见下文
ZGC
(zero paused GC)- 使用算法:颜色指针 + 着色指针 + 读屏障
- 具体见下文
Shenandoah
- 使用算法:颜色指针 + 写屏障
Eplison
- 垃圾回收器适用的内存大小
- Serial 几十兆
- PS 上百兆-几个G
- CMS 20G
- G1 上百G
- ZGC 4T-16T(JDK13)
- 常见垃圾回收器组合参数设定
-XX:+UseSerialGC
使用Serial New (DefNew) + Serial Old。适用于小型程序;默认情况下不会是这种选项,HotSpot会根据计算及配置和JDK版本自动选择收集器-XX:+UseParNewGC
使用ParNew + SerialOld。这个组合已经很少用,在某些版本中已经废弃-XX:+UseConcurrentMarkSweepGC
(有的是-XX:+UseConcMarkSweepGC) 使用ParNew + CMS + Serial Old-XX:+UseParallelGC
使用Parallel Scavenge + Parallel Old,1.8默认-XX:+UseParallelOldGC
使用Parallel Scavenge + Parallel Old-XX:+UseG1GC
使用G1,1.9默认java -XX:+PrintCommandLineFlags -version
查看默认配置,可发现1.8.0_131使用的是PS+PO(-XX:+UseParallelGC)
CMS
- CMS使用算法:三色标记 + Incremental Update + 写屏障(相关概念见上文)
- CMS是1.4版本后期引入,CMS是里程碑式的GC,它开启了并发回收的过程,但是CMS毛病较多,因此目前任何一个JDK版本默认是CMS,只能手工指定CMS
包含5步
- initial mark 初始标记,会产生STW;由于只标记根对象,因此STW时间很短
- concurrent mark 并发标记,不会产生STW;基于根对象查找,此段时间相对较长
- preclean 也称Card Marking,标记Card Table为Dirty
- remark 重新标记,会产生STW,占用时间不会太长;由于并发标记的同时,可能某些标记为垃圾的对象又被重新引用了,此时相当于去掉这些对象的标记(新产生的垃圾不会重新标记,从而会产生浮动垃圾)
- concurrent sweep 并发清理,不会产生STW;此阶段可能还会产生新的垃圾,即浮动垃圾,会在下一个循环回收
- CMS的缺点
- Memory Fragmentation(内存碎片化)
- 使用Mark-Sweep算法会产生很多碎片,这些碎片会占用且镂空老年代内存(可能存在有些未用的空间被碎片占位导致无法使用,见上文Mark-Sweep算法图),碎片到达一定程度,CMS的老年代分配对象分配不下的时候,此时会使用SerialOld进行老年代回收
- 如果内存较大(32G及以上不建议使用CMS),出现SerialOld单线程回收时,会很耗时,因此STW时间会很长(几十个G内存可能几个小时到几天)。因此可能出现硬件升级反而出现卡顿
- 可使用以下参数优化
-XX:+UseCMSCompactAtFullCollection
在FGC时进行压缩从而清理碎片-XX:CMSFullGCsBeforeCompaction
默认为0,指经过多少次FGC才进行压缩
- Floating Garbage(浮动垃圾,在concurrent sweep并发清理的同时产生的垃圾)
- -XX:CMSInitiatingOccupancyFraction 92%(JDK1.8默认,当老年代使用到达92%时触发FGC。可适当调小从而给浮动垃圾多留一点空间,下次并发回收便会清理)
- Memory Fragmentation(内存碎片化)
G1
- G1使用算法:三色标记 + SATB + 写屏障
- STW时间为10ms左右;响应时间比CMS高,但是吞吐量比CMS差15%左右
内存结构
- G1的内存结构和传统的内存空间划分有比较的不同。G1将内存划分成了多个大小相等的Region(默认是512K),Region逻辑上连续,物理内存地址不连续。同时每个Region被标记成E、S、O、H,分别表示Eden、Survivor、Old、Humongous(/hjuːˈmʌŋɡəs/,大对象)。其中E、S属于年轻代,O与H属于老年代
- G1新老年代比例5%-60%(CMS默认是1:2),一般不用手工指定,G1会动态变化。可设置一个停顿时间,G1会动态调整此比例以趋近设置的停顿时间
- 标记回收阶段
- Initial mark
- Root region scanning
- Concurrent marking
- Remark
- Cleanup
- G1包括YGC、MixedGC(相当于一个CMS)、FGC
- G1产生FGC时处理
- 扩内存、提高CPU性能
- 降低MixedGC触发的阈值,让MixedGC提早发生(默认是-XX:InitiatingHeapOccupacyPercent 45%)
- JDK10以前G1的FullGC是串行的,之后是并行的
ZGC
- ZGC(zero paused GC)使用算法:颜色指针 + 着色指针 + 读屏障
- STW时间为10ms以下,实测1ms左右
- GC 信息记录在指针上,不是记录在 Java 对象的头部。如果记录在头部要回收则需要修改头信息,而 ZGC 只需要修改指针信息。优点是 immediate memory use
在 64 位系统中,ZGC 利用了对象引用的 4bit,低 42 位为对象的实际地址(因此最大寻址空间为 2^42=4T),高 18 位为预留
- Marked0/marked1:判断对象是否已标记
- Remapped:判断引用是否已指向新的地址
- Finalizable:判断对象是否只能被 Finalizer 访问
- JDK13 最大寻址空间为 16T=2^44
- 理论上 64 位系统(指针地址大小为 64 位),去掉 4 位标记信息,剩下的为 2^60 寻址空间可用
- 但是由于主板制造商为了节约成本,地址总线并没有提供 64 根,而是 48 根,从而最大寻址空间为 2^(48-4)=2^44=16T
- ZGC 为 NUMA aware:分配内存会优先分配该线程所在 CPU 的最近内存。NUMA(非同一内存访问)
JVM调优
- 区分概念
- 内存泄漏memory leak:指有某块内存永远不会被回收,内存泄漏不一定会产生内存溢出(比如内存足够大)
- 内存溢出out of memory:内存不够了。报错如:
java.lang.OutOfMemoryError: GC overhead limit exceeded
简单测试及GC日志
- 测试Demo
1 | /** |
GC日志
1 | ## 使用PS+PO产生如下OOM日志 |
调优前的基础概念
- 吞吐量:用户代码时间 / (用户代码执行时间 + 垃圾回收时间)
- 响应时间:STW越短,响应时间越好
- 所谓调优,首先确定,追求啥?吞吐量优先;还是响应时间优先;还是在满足一定的响应时间的情况下,要求达到多大的吞吐量
- 科学计算、数据挖掘等:一般注重吞吐量,因此可使用PS+PO
- 网站、GUI、API等:一般注重响应时间,因此可使用G1等
- 什么是调优
- 根据需求进行JVM规划和预调优
- 优化运行JVM运行环境(慢,卡顿)
- 解决JVM运行过程中出现的各种问题(OOM)
调优实践
- 参考Java应用CPU和内存异常分析.md
- JVM规划和预调优
- 调优一般可先从业务场景开始
- 无监控(压力测试,能看到结果)不调优。估算一个事务会消耗多少内存,可用压测来确定,看能承受多少TPS
- 步骤:
- 熟悉业务场景
- 响应时间、停顿时间优先 => CMS、G1、ZGC
- 吞吐量优先 => PS+PO
- 选择回收器组合
- 计算内存需求
- 选定CPU(越高越好)
- 设定年代大小、升级年龄
- 设定日志参数
-Xloggc:/var/log/test-gc-%t.log -XX:+UseGCLogFileRotation -XX:NumberOfGCLogFiles=5 -XX:GCLogFileSize=20M -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCCause
使用循环日志,日志个数为5个,每个日志大小为20M
- 观察日志情况
- 熟悉业务场景
- 案例1:垂直电商(只卖一类产品),最高每日百万订单,处理订单系统需要什么样的服务器配置?
- 淘宝2019双11最大并发54W;12306春节最大并发100w以上。电商的并发一般值TPS(每秒能完成的事物数,即每秒成创建多少个订单),其他性能评判指标如QPS
- 这个问题比较业余,因为很多不同的服务器配置都能支撑(1.5G、16G)
- 分析:假设高峰为19-21点成交70w订单,约1小时产生36w,即100个订单/秒。那假设最高峰期为10倍,即1000订单/秒
- 实际需要按经验值估算需要占用的内存空间
- 大致估算:一个订单产生需要512K(多一点1-2M)内存 * 1000 = 500M内存
- 因此只需要保证新生代Eden区占用500M内存空间即可,如果CPU较快也可适当减少(因为回收垃圾很快)
- 专业一点儿问法:要求响应时间100ms
- 案例2:12306遭遇春节大规模抢票应该如何支撑?
- 12306应该是中国并发量最大的秒杀网站:号称并发量100W最高
- 猜测架构:CDN -> LVS -> NGINX -> 业务系统 -> 每台机器1W并发(C10K问题),使用100台机器
- 普通电商订单 -> 下单 -> 订单系统(IO)减库存 -> 等待用户付款
- 12306的一种可能的模型:下单 -> 减库存(redis,redis可支撑单机1W并发) 和 订单(kafka) 同时(多线程)异步进行 -> 等付款
- 如果把库存记录在一台机器上,则减库存最后还会把压力压到一台服务器。可以做分布式本地库存 + 单独服务器做库存均衡
- 大流量的处理方法:分而治之
- 优化环境
- 系统CPU经常100%,如何调优?(面试高频)
- CPU 100%那么一定有线程在占用系统资源,找出哪个进程cpu高 (top)
- 该进程中的哪个线程cpu高 (
top -Hp <pid>
参数Hp的顺序不能改变) - 导出该线程的堆栈 (jstack)
- 查找哪个方法(栈帧)消耗时间 (jstack)
- 工作线程占比高(while死循环)、垃圾回收线程占比高(内存不足)
- 系统内存飙高,如何查找问题?(面试高频)
- 导出堆内存 (jmap)
- 分析 (jhat、jvisualvm、mat、jprofiler … )
- 如何监控JVM
- jstat、jvisualvm、jprofiler、arthas、top…
- 系统CPU经常100%,如何调优?(面试高频)
解决JVM运行中的问题
arthas工具
- 官网/DOC
- arthas 阿里在线排查工具(阿尔萨斯)
- 为什么需要在线排查
- 在生产上我们经常会碰到一些不好排查的问题,例如线程安全问题,用最简单的threaddump或者heapdump不好查到问题原因
- 为了排查这些问题,有时我们会临时加一些日志,比如在一些关键的函数里打印出入参,然后重新打包发布,如果打了日志还是没找到问题,继续加日志,重新打包发布
- 对于上线流程复杂而且审核比较严的公司,从改代码到上线需要层层的流转,会大大影响问题排查的进度
- 安装与使用
1 | ## 下载 |
jstack等其他命令
java -Xms200M -Xmx200M -XX:+PrintGC HelloWorld
启动问题程序jps
定位具体java进程top
命令观察到问题:内存不断增长 CPU占用率居高不下,且某个进程占CPU较高top -Hp <pid>
观察进程中的线程,哪个线程CPU和内存占比高
jstack <pid>
定位线程状况,重点关注:WAITING
、BLOCKED
。举例waiting on <0x0000000088ca3310>
(a java.lang.Object) 假如有一个进程中100个线程,很多线程都在waiting on(等待0x0000000088ca3310这把锁/地址编号),一定要找到是哪个线程持有这把锁RUNNABLE
表示运行中(随时可能被CPU调度)- 怎么找?执行
jstack <pid> | grep 0x0000000088ca3310
看哪个线程持有这把锁(该线程可能处于RUNNABLE)- 如果是死锁的话,当前线程就会出现
locked <0x0000000088ca3310>
- 为什么阿里规范里规定,线程的名称(尤其是线程池)都要写有意义的名称,就是为了容易定位线程的功能
- 如果是死锁的话,当前线程就会出现
- 如果一个事物中,修改数据后,方法一直未执行完(如调用restTemplate卡住),可能会报
Lock wait timeout exceeded; try restarting transaction
jinfo <pid>
列举JVM的一些信息jstat -gc <pid>
动态观察gc情况/阅读GC日志,观察是否出现频繁GCarthas
/jvisualvm
/jconsole
/Jprofiler
(最好用,收费)- 如果面试官问你是怎么定位OOM问题的?如果你回答用图形界面(错误)
- 已经上线的系统不应该启用JMX进程影响生产环境,而应该使用cmd命令、arthas
- 图形界面主要用在测试的时候进行监控(压测观察)
- 如果面试官问你是怎么定位OOM问题的?如果你回答用图形界面(错误)
jstat -gc <pid> 500
:每个500个毫秒打印GC的情况
jmap -histo <pid> | head -20
查找有多少对象产生(线上执行影响相对较小)jmap -dump:format=b,file=/home/dump.hprof <pid>
导出堆转储文件- 线上系统,内存特别大,jmap执行期间会对进程产生很大影响,甚至卡顿(可在重启前下载dump文件)
- 很多服务器备份(高可用),停掉这台服务器对其他服务器不影响(此方案比较通用)
- 设定-XX:+HeapDumpOnOutOfMemoryError参数,当OOM的时候会自动产生堆转储文件(线上也不是很好的方案)
- 在线定位(一般小点儿公司用不到)
- 使用jhat/jvisualvm/MAT进行dump文件分析。jhat使用
jhat -J-mx512M /home/dump.hprof
使用512M内存进行dump文件分析,分析时间可能较长(占用CPU会较多)- 分析完后会在本地启动一个7000端口来展示结果信息,可以在线使用OQL语句进行查找特定对象
- 目录在主页的末尾: 有Show heap histogram查看堆栈对象、执行OQL语句、Show instance counts for all classes (excluding platform)会展示不包含平台的所有类的信息
- 无法看到出错的线程栈
jvisualvm
文件 - 装入dump文件,也可使用OQL语句进行查找- 可以看到出错的线程栈
- 线上系统,内存特别大,jmap执行期间会对进程产生很大影响,甚至卡顿(可在重启前下载dump文件)
- jvisualvm远程连接:https://www.cnblogs.com/liugh/p/7620336.html
- 线程 - 线程dump(查看所有线程快照,不影响线上运行)
- jconsole远程连接
java -Djava.rmi.server.hostname=192.168.6.134 -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=11111 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false HelloWorld
增加JMX相关参数- 如果遭遇 Local host name unknown:XXX的错误,修改/etc/hosts文件,把XXX加入进去
- 关闭linux防火墙(并且应该打开对应端口远程访问)
- windows上打开 jconsole远程连接 192.168.6.134:11111
- 找到代码的问题
一些案例
- 线程池不当运用产生OOM问题,见T03_FullGC_Problem01;或者使用 newFixedThreadPool 等线程池
- tomcat http-header-size过大问题。如:server.max-http-header-size=10000000
Http11OutputBuffer
对象占用太大内存
- 重写finalize引发频繁GC
- 小米云,HBase同步系统,系统通过nginx访问超时报警,最后排查,C++程序员重写finalize引发频繁GC问题
- 可能重写的finalize中有耗时比较长的逻辑
- Distuptor有个可以设置链的长度,如果过大,然后对象大,消费完不主动释放,会溢出
- 硬件升级系统反而卡顿的问题
- 当内存越大,每次FGC(产生STW)时间可能越长,如CMS可能会出现使用SerialOld进行FGC
- 栈溢出问题,如a方法中调用a方法。可通过
-Xss
设定大小 - 如果有一个系统,内存一直消耗不超过10%,但是观察GC日志,发现FGC总是频繁产生,会是什么引起的。可能手动调用了System.gc(会产生FGC)
- lambda表达式导致方法区溢出问题(MethodArea/Perm Metaspace)
-XX:MaxMetaspaceSize=10M -XX:+PrintGCDetails
设置方法区大小- 产生错误:java.lang.OutOfMemoryError: Compressed class spacce
- 直接内存溢出问题(少见)
- 《深入理解Java虚拟机》P59,使用Unsafe分配直接内存,或者使用NIO的问题
- mycat用崩过,1.6.5某个临时版本解析sql子查询算法有问题,9个exists的联合sql就导致生成几百万的对象
- new 大量线程,会产生 native thread OOM
- 应该用线程池,解决方案减少堆空间,预留更多内存产生native thread
- JVM内存占物理内存比例一般是50% - 80%
- 下面第一种方式更好
1 | Object o = null; |
遇到下面死锁情况,但是程序可以正常运行,原因未知
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34# 正常应该不会出现这种情况,实际遇到了这种情况,但是程序可以正常运行
# waiting和locked在同一个线程中
"Abandoned connection cleanup thread" daemon prio=10 tid=0x00007f504cca8800 nid=0x191a in Object.wait() [0x00007f504047a000]
java.lang.Thread.State: TIMED_WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0000000786c1f928> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:135)
- locked <0x0000000786c1f928> (a java.lang.ref.ReferenceQueue$Lock)
at com.mysql.jdbc.AbandonedConnectionCleanupThread.run(AbandonedConnectionCleanupThread.java:43)
"Tomcat JDBC Pool Cleaner[1863944551:1617781592472]" daemon prio=10 tid=0x00007f504ec31800 nid=0x1919 in Object.wait() [0x00007f504057b000]
java.lang.Thread.State: TIMED_WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x00000007868eec38> (a java.util.TaskQueue)
at java.util.TimerThread.mainLoop(Timer.java:552)
- locked <0x00000007868eec38> (a java.util.TaskQueue)
at java.util.TimerThread.run(Timer.java:505)
"Finalizer" daemon prio=10 tid=0x00007f504c136000 nid=0x1900 in Object.wait() [0x00007f5042ea2000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0000000785e470f8> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:135)
- locked <0x0000000785e470f8> (a java.lang.ref.ReferenceQueue$Lock)
at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:151)
at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:209)
"Reference Handler" daemon prio=10 tid=0x00007f504c134000 nid=0x18ff in Object.wait() [0x00007f5042fa3000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on <0x0000000785e42d08> (a java.lang.ref.Reference$Lock)
at java.lang.Object.wait(Object.java:503)
at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:133)
- locked <0x0000000785e42d08> (a java.lang.ref.Reference$Lock)
JVM常用配置
参数说明
- JVM的命令行参数参考:https://docs.oracle.com/javase/8/docs/technotes/tools/unix/java.html
java -XX:+PrintFlagsInitial
打印默认参数值java -XX:+PrintFlagsFinal
打印最终参数值java -XX:+PrintFlagsFinal | grep GC
找到GC相关参数
- HotSpot参数分类
- 标准:
-
开头,所有的HotSpot都支持 - 非标准:
-X
开头,特定版本HotSpot支持特定命令。java -X
查看支持的参数 - 不稳定:
-XX
开头,下个版本可能取消
- 标准:
GC常用参数
-Xmn -Xms -Xmx -Xss
年轻代 最小堆(如果资源充足也可把初始堆和最大堆设置成一致) 最大堆 栈空间- -Xms512m、-Xmx1g
- 每个线程堆栈大小为 1M,一般来说如果栈不是很深的话, 1M 是绝对够用了的
-XX:MetaspaceSize=128m
需JDK1.8+,元空间最大大小(类似-XX:MaxPermSize
)-XX:MaxPermSize=512m
需JDK1.7及以下,设置永久代/方法区最大值(默认64M),太小容易出现java.lang.OutOfMemoryError: PermGen space
-XX:+HeapDumpOnOutOfMemoryError
让虚拟机在发生内存溢出时 Dump 出当前的内存堆转储快照,以便分析用-XX:HeapDumpPath=/home/jvmlogs
生成堆文件的文件夹(需要先手动创建/home/jvmlogs文件夹)-XX:+CrashOnOutOfMemoryError
当jvm发生oom时自动退出程序 当SpringBoot应用遇到OOM异常时,由于默认异常处理,应用并不会自动退出。添加此参数后,内存溢出时JVM将强制退出,并生成包含详细错误信息的日志文件(hs_err_pid)-XX:ErrorFile
设置jvm致命错误日志文件生成位置(默认生成在工作目录下),如:-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
日志解析参考JVM致命错误日志-XX:+PrintGC
-XX:+PrintGCDetails
打印GC详细信息-XX:+PrintGCTimeStamps
或-XX:+PrintGCDateStamps
打印GC发生时的时间戳-XX:+PrintGCCause
打印GC产生原因-XX:+PrintHeapAtGC
每次GC打印堆信息-XX:+PrintFlagsFinal
和-XX:+PrintFlagsInitial
打印最终参数和初始参数-XX:+PrintVMOptions
-verbose:class
类加载详细过程-Xloggc:/opt/log/gc.log
具体参考上文循环记录日志-XX:NewRatio
老年代与新生代的比例,如 –XX:NewRatio=2,则新生代占整个堆空间的1/3,老年代占2/3-XX:MaxTenuringThreshold
升代年龄,最大值15-XX:TargetSurvivorRatio=50
动态年龄时的低年龄比例-XX:+PrintGCApplicationConcurrentTime
打印应用程序时间-XX:+PrintGCApplicationStoppedTime
打印暂停时长-XX:+PrintReferenceGC
记录回收了多少种不同引用类型的引用-XX:+DisableExplictGC
默认开启,忽略System.gc命令,此命令会产生FGC-XX:+UseTLAB
使用TLAB,默认打开-XX:+PrintTLAB
打印TLAB的使用情况-XX:TLABSize
设置TLAB大小-XX:+UseSpinning
开启自适应自旋,JDK1.6开始默认开启,并且引入了自适应自旋-XX:PreBlockSpin
锁自旋次数(JDK6之前,之后使用自适应自旋)-XX:CompileThreshold
热点代码检测参数,还有如逃逸分析、标量替换- 常见垃圾回收器组合参数设定见上文
Parallel常用参数
-XX:SurvivorRatio=8
设置Survivor比例(Eden、Survivor默认是8:1:1)-XX:PreTenureSizeThreshold
超过这个值的时候,对象直接在old区分配内存。默认值是0,意思是不管多大都是先在eden中分配内存-XX:MaxTenuringThreshold
控制新生代需要经历多少次GC晋升到老年代中的最大阈值。在JVM中用4个bit存储(放在对象头中),所以其最大值是15(CMS默认为6)-XX:+ParallelGCThreads
并行收集器的线程数,同样适用于CMS,一般设为和CPU核数相同-XX:+UseAdaptiveSizePolicy
自动选择各区大小比例
CMS常用参数
-XX:+UseConcMarkSweepGC
使用CMS垃圾回收器-XX:ParallelCMSThreads
CMS线程数量-XX:CMSInitiatingOccupancyFraction
使用多少比例的老年代后开始CMS收集,默认是68%(近似值)。如果频繁发生SerialOld卡顿,应该调小(频繁CMS回收)-XX:+UseCMSCompactAtFullCollection
在FGC时进行压缩-XX:CMSFullGCsBeforeCompaction
多少次FGC之后进行压缩-XX:+CMSClassUnloadingEnabled
垃圾回收会清理持久代,移除不再使用的classes;默认不开启-XX:CMSInitiatingPermOccupancyFraction
达到什么比例时进行Perm回收-XX:GCTimeRatio
设置吞吐量大小(GC时间占用程序运行时间的百分比),它的值是一个 0-100 之间的整数。假设 GCTimeRatio 的值为n,那么系统将花费不超过 1/(1+n) 的时间用于垃圾收集-XX:MaxGCPauseMillis
停顿时间,是一个建议时间,GC会尝试用各种手段达到这个时间,比如减小年轻代
G1常用参数
-XX:+UseG1GC
使用G1垃圾回收器-XX:MaxGCPauseMillis
建议值,G1会尝试调整Young区的块数来达到这个值-XX:GCPauseIntervalMillis
停顿间隔时间-XX:+G1HeapRegionSize
分区(Region)大小,取值范围从1M到32M,且是2的指数。如果不设定,那么G1会根据Heap大小自动决定。建议逐渐增大,因为随着size增加,垃圾的存活时间更长,GC间隔更长,但每次GC的时间也会更长(ZGC做了改进,动态区块大小)-XX:G1NewSizePercent
新生代最小比例,默认为5%-XX:G1MaxNewSizePercent
新生代最大比例,默认为60%-XX:GCTimeRatio
GC时间建议比例,G1会根据这个值调整堆空间-XX:ConcGCThreads
线程数量-XX:InitiatingHeapOccupancyPercent
启动G1的堆空间占用比例,默认45%
JVM参数使用
- jvm配置位置
java
:java -XX:PrintFlagsFinal -version
tomcat
:修改%TOMCAT_HOME%/bin/catalina.bat
或%TOMCAT_HOME%/bin/catalina.sh
中的JAVA_OPTS
,在echo "Using CATALINA_BASE: $CATALINA_BASE"
上面加入以下行:JAVA_OPTS="-server -Xms256m -Xmx512m
(启动时运行的startup.bat/startup.sh,其内部调用catalina.bat)weblogic
:修改bea/weblogic/common中CommEnv
中参数springboot
:可直接加在java命令后面,如java -Xms256 -jar xxx.jar
idea
:Run/Debug Configruations中修改VM Options(单独运行tomcat或者springboot项目都如此)eclipse
:修改eclipse中tomcat的配置
- 远程Debug
- 远程调试(Attach. 必须先启动应用,再启动idea debug)
- 应用端启动增加参数
-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=5005
- 应用端启动增加参数
- 远程调试(Listen. 必须先启动idea debug,再启动应用)
- 应用端启动增加参数
-Xdebug -Xrunjdwp:transport=dt_socket,server=n,suspend=n,address=5005
- 应用端启动增加参数
- 两种模式区别在与
server=y/n
- 远程调试(Attach. 必须先启动应用,再启动idea debug)
- 扩展classpath、自定义JVM参数:参考JAR/JVM
常用配置推荐
- 启动脚本
1 | ## 1.简单配置(如2G内存) |
参考文章