过去的几天里,我把JVM内部的垃圾回收算法和垃圾回收器。还剩下最后一个G1回收器没有说,我们今天数一下G1回收器和常见的参数配置。
G1回收器
G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器,以极高概率满足GC停顿时间要求的同时,还具备高吞吐量性能特征。我们会想一下我们上次课说的parNew+CMS回收器已经很厉害了,但是我们的服务器是那种超大内存的服务器呢?比如内存是32G的,可能最后我们的堆内存需要分配到十多个G,我们用parNew+CMS对于STW时间还是很长的,需要清理的越多,时间消耗越长啊,但是我们的G1垃圾回收器可以做到限制时间来收集,我们先看一下G1的模型图。
来解释一下这个图,G1垃圾回收器,会把你的堆内存分为大小相等的独立区域(Region),JVM最多可以分配2048个Region,一般Region大小等于堆大小除以2048,比如堆大小为4096M,则Region大小为2M,当然也可以 用参数"-XX:G1HeapRegionSize"手动指定Region大小,每个Region的状态不确定,可能是Eden区域,也可能是Old区域,不需要原有的联系设置,这里说一下以前没有提到的Humongous区域,他是用来存储大对象的,大对象的判定规则就是一个大对象超过了一个Region大小的50%,比如按 照上面算的,每个Region是2M,只要一个大对象超过了1M,就会被放入Humongous中视对象大小而定格子的连续数目。
默认年轻代对堆内存的占比是5%,如果堆大小为4096M,那么年轻代占据200MB左右的内存, 对应大概是100个Region,可以通过“-XX:G1NewSizePercent”设置新生代初始占比,在系统 运行中,JVM会不停的给年轻代增加更多的Region,但是最多新生代的占比不会超过60%,可以 通过“-XX:G1MaxNewSizePercent”调整。年轻代中的Eden和Survivor对应的region也跟之前 一样,默认8:1:1,假设年轻代现在有1000个region,eden区对应800个,s0对应100个,s1对应 100个。
G1收集器一次GC的运作过程大致分为以下几个步骤: 初始标记(initial mark,STW):暂停所有的其他线程,并记录下gc roots直接能引用的对象,速度很快 ;
并发标记(Concurrent Marking):同CMS的并发标记
最终标记(Remark,STW):同CMS的重新标记
筛选回收(Cleanup,STW):筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间(可以用JVM参数 -XX:MaxGCPauseMillis指定)来制定回收计划,就是说我们希望每次STW时间只是100ms,我们可以指定垃圾回收完成时间为100ms,但是100ms是不一定完全回收完成的,我们会按照每一个格子的回收消耗时间来排序,由小到大进行回收处理,直到时间为100ms为止。
这里的回收算法是复制算法,也就是我们把每一个小格子的对象进行处理,把有用的对象复制到空格子内,把原有格子清空,需要注意一点的是不需要再次整理内存碎片,举一个实例,Region1和Region2都需要回收,他们的大小都为2M,Region1有0.3M的对象是有用的,Region2的对象有0.6是有用,这时他们会共同放在一个空的小格子内占用0.9M的大小。 与我们以前熟悉的YoungGC和OldGC所不同的是G1的回收器有三种GC,分别为:
YoungGC:
YoungGC并不是说现有的Eden区放满了就会马上触发,G1会计算下现在Eden区回收大概要多久时间,如果回收时间远远小于参数 -XX:MaxGCPauseMills 设定的值,那么增加年轻代的region,继续给新对象存放,不会马上做YoungGC,直到下一次Eden区放满,G1计算回收时间接近参数 -XX:MaxGCPauseMills 设定的值,那么就会触发YoungGC
MixedGC:
不是FullGC,老年代的堆占有率达到参数(-XX:InitiatingHeapOccupancyPercen)设定的值则触发,回收所有的Young和部分Old(根据期望的GC停顿时间确定old区垃圾收集的优先顺序)以及大对象区,正常情况G1的垃圾收集是先做MixedGC,主要使用复制算法,需要把各个region中 存活的对象拷贝到别的region里去,拷贝过程中如果发现没有足够的空region能够承载拷贝对象 就会触发一次Full GC
Full GC:
停止系统程序,然后采用单线程进行标记、清理和压缩整理,好空闲出来一批Region来供下一次MixedGC使用,这个过程是非常耗时的。
JVM参数配置以及优化(JDK1.8)
栈相关
-Xss->设置单个线程栈大小,比如-Xss512K,数值越小,一个线程栈里能分配的栈帧就越少,说明可以开启的线程数越多
方法区(元空间)
-XX:MetaspaceSize->设置方法区的大小,也是触发GC的阈值,比如-XX:MetaspaceSize=256M
-XX:MaxMetaspaceSiz->设置方法区的最大值,比如-XX:MaxMetaspaceSize=256M
堆相关
-Xms->jvm启动时分配的内存,比如‐Xms200m
-Xmx->jvm运行过程中分配的最大内存,比如-Xmx500m
-Xmn->设置年轻代大小,比如-Xmn2g
-XX:NewSize->设置年轻代大小 比如-XX:NewSize=2g
-XX:PretenureSizeThreshold->可以设置大对象的大小,比如-XX:PretenureSizeThreshold=100000000 单位为btye。
-XX:MaxTenuringThreshold->设置分代年龄,比如-XX:MaxTenuringThreshold=10 默认为15。
-XX:-HandlePromotionFailure->老年代分配担保机制参数,1.8默认开启。
-XX:-UseAdaptiveSizePolicy->禁止JVM自动优化eden和Survivor默认比例8:1:1,反之JVM默认有这个参数-XX:+UseAdaptiveSizePolicy,会导致这个比例自动变化。
-XX:SurvivorRatio->设置Eden和Survivor大小比如 -XX:SurvivorRatio =8,注意Survivor区有两个。表示Eden:Survivor=8:2,一个Survivor区占整个年轻代的1/10。
-XX:NewRatio->设置老年代和年轻代的比值大小 比如-XX:NewRatio=4,表示年老代和年轻代比值为4:1。
回收器相关
Serial收集器
-XX:+UseSerialGC->指定年轻代为Serial收集器
-XX:+UseSerialOldGC->指定老年代为Serial收集器
ParNew收集器
-XX:+UseParNewG->指定年轻代为ParNew收集器
Parallel Scavenge收集器
-XX:+UseParallelGC->指定年轻代为Parallel收集器
-XX:+UseParallelOldGC->指定老年代为Parallel收集器
-XX:ParallelGCThreads->指定GC工作的线程数量
CMS收集器
-XX:+UseConcMarkSweepGC->指定指定老年代为CMS收集器
-XX:ConcGCThreads->并发的GC线程数
-XX:+UseCMSCompactAtFullCollection->FullGC之后是否做压缩整理(减少碎片)
-XX:CMSFullGCsBeforeCompaction->多少次FullGC之后压缩一次,默认是0,代表每次FullGC后都会压缩一次,比如-XX:CMSFullGCsBeforeCompaction=0
-XX:CMSInitiatingOccupancyFraction->当老年代使用达到该比例时会触发FullGC(默认是92,这是百分比),比如-XX:CMSInitiatingOccupancyFaction=92
-XX:+UseCMSInitiatingOccupancyOnly->只使用设定的回收阈值(-XX:CMSInitiatingOccupancyFraction设定的值),如果不指定,JVM仅在第一次使用设定值,后续则会自动调整
-XX:+CMSScavengeBeforeRemark->在CMSGC前启动一次minor gc,目的在于减少老年代对年轻代的引用,降低CMS GC的标记阶段时的开销,一般CMS的GC耗时80%都在 remark阶段
G1收集器
-XX:+UseG1GC->开启G1收集器
-XX:G1HeapRegionSize->指定分区大小(1MB~32MB,且必须是2的幂),默认将整堆划分为2048个分区
-XX:MaxGCPauseMillis->目标暂停时间(默认200ms)
-XX:G1NewSizePercent->新生代内存初始空间(默认整堆5%)
-XX:G1MaxNewSizePercent->新生代内存最大空间
-XX:TargetSurvivorRatio->Survivor区的填充容量(默认50%),Survivor区域里的一批对象(年龄1+年龄2+年龄n的多个年龄对象)总和超过了Survivor区域的50%,此时就会把年龄n(含)以上的对象都放入老年代
-XX:InitiatingHeapOccupancyPercent->老年代占用空间达到整堆内存阈值(默认45%),则执行 新生代和老年代的混合收集(MixedGC),比如我们之前说的堆默认有2048个region,如果有接近 1000个region都是老年代的region,则可能就要触发MixedGC了
-XX:G1HeapWastePercent->默认5%,gc过程中空出来的region是否充足阈值,在混合回收的时候,对Region回收都是基于复制算法进行的,都是把要回收的Region里的存活对象放入其他 Region,然后这个Region中的垃圾对象全部清理掉,这样的话在回收过程就会不断空出来新的 Region,一旦空闲出来的Region数量达到了堆内存的5%,此时就会立即停止混合回收,意味着 本次混合回收就结束了。
-XX:G1MixedGCLiveThresholdPercent->默认85%,region中的存活对象低于这个值时才会回收该region,如果超过这个值,存活对象过多,回收的的意义不大。
-XX:G1MixedGCCountTarget->在一次回收过程中指定做几次筛选回收(默认8次),在最后一个筛选回收阶段可以回收一会,然后暂停回收,恢复系统运行,一会再开始回收,这样可以让系统不至于单次停顿时间过长。
日志调优相关
-XX:+PrintGCDetails->打印GC日志
-XX:+PrintGCTimeStamps->打印GC时间
-XX:+PrintGCDateStamps->打印GC日期
-Xloggc->将GC日志保存为文件,比如-Xloggc:https://cloud.tencent.com/developer/article/gc.log
有兴趣的小伙伴可以自学一下jmap -heap PID,jstat -gc PID(个人认为这个超级重要),javap -c ***.class,Jstack等调优命令,线上尽力别用jvisualvm命令,消耗性能,很多公司禁用jvisualvm命令
我们来回顾一下我们JVM都说了什么知识点。
一,类加载过程:加载-验证-准备-解析-初始化-使用-卸载
二,双亲委派机制。
三,内存运行模型(堆和栈)
四,内存分区老年代和年轻代,年轻代包含Eden区和Survivor区。
五,GC回收minor和fullGC,什么时候会触发fullGC,重点是对象动态年龄判断和老年代担保分配机制。
六,垃圾回收的算法,三种,复制,标记清理,标记整理。
七,垃圾回收器五种,串行的Serial,并行的parNew,高CPU的Parallel,常用的CMS和大内存的G1。
八,常用命令。
很多都是孰能生巧的,细节的还有很多,JVM优化路我给你们指出了,剩下的还需要你们自己去探索,加油~!!!
再不会调优的可以来私信我,我可以尝试为你提出免费调试建议。
最近搞了一个个人公众号,会每天更新一篇原创博文,java,python,自然语言处理相关的知识有兴趣的小伙伴可以关注一下。