1、JVM初探使用堆外内存减少FullGCJVM初探- 使用堆外内存减少Full GC引入这个idea最初来源于TaobaoJVM对OpenJDK定制开发的GCIH部分(详见撒迦的分享-JVM定制改进淘宝), 其中GCIH就是将CMS Old Heap区的一部分划分出来, 这部分内存虽然还在堆内, 但已不被GC所管理.将长生命周期Java对象放在Java堆外, GC不能管理GCIH内Java对象(GC Invisible Heap):这样做有两方面的好处: 减少GC管理内存: 由于GCIH会从Old区“切出”一块, 因此导致GC管理区域变小, 可以明显降低GC工作量, 提高GC效率, 降低Full
2、 GC STW时间(且由于这部分内存仍属于堆, 因此其访问方式/速度不变- 不必付出序列化/反序列化的开销).GCIH内容进程间共享: 由于这部分区域不再是JVM运行时数据的一部分, 因此GCIH内的对象可供对个JVM实例所共享(如一台Server跑多个MR-Job可共享同一份Cache数据), 这样一台Server也就可以跑更多的VM实例.(实际测试数据/图示可下载撒迦分享PPT).但是大部分的互联公司不能像阿里这样可以有专门的工程师针对自己的业务特点定制JVM, 因此我们只能”眼馋”GCIH带来的性能提升却无法”享用”. 但通用的JVM开放了接口可直接向操作系统申请堆外内存(ByteBuf
3、fer or Unsafe), 而这部分内存也是GC所顾及不到的, 因此我们可用JVM堆外内存来模拟GCIH的功能(但相比GCIH不足的是需要付出serialize/deserialize的开销).JVM堆外内存在JVM初探 -JVM内存模型一文中介绍的Java运行时数据区域中是找不到堆外内存区域的:因为它并不是JVM运行时数据区的一部分, 也不是Java虚拟机规范中定义的内存区域, 这部分内存区域直接被操作系统管理. 在JDK 1.4以前, 对这部分内存访问没有光明正大的做法: 只能通过反射拿到Unsafe类, 然后调用allocateMemory()/freeMemory()来申请/释放这
4、块内存. 1.4开始新加入了NIO, 它引入了一种基于Channel与Buffer的I/O方式, 可以使用Native函数库直接分配堆外内存, 然后通过一个存储在Java堆里面的DirectByteBuffer对象作为这块内存的引用进行操作, ByteBuffer提供了如下常用方法来跟堆外内存打交道:下面我们就用通用的JDK API来使用堆外内存来实现一个local cache.示例1.: 使用JDK API实现堆外Cache注: 主要逻辑都集中在方法invoke()内, 而AbstractAppInvoker是一个自定义的性能测试框架, 在后面会有详细的介绍./* * author jifa
5、ng * since 2016/12/31 下午6:05. */public class DirectByteBufferApp extends AbstractAppInvoker Test Override public void invoke(Object. param) Map map = createInHeapMap(SIZE); / move in off-heap byte bytes = serializer.serialize(map); ByteBuffer buffer = ByteBuffer.allocateDirect(bytes.length); buffer.
6、put(bytes); buffer.flip(); / for gc map = null; bytes = null; System.out.println(write down); / move out from off-heap byte offHeapBytes = new bytebuffer.limit(); buffer.get(offHeapBytes); Map deserMap = serializer.deserialize(offHeapBytes); for (int i = 0; i SIZE; +i) String key = key- + i; FeedDO
7、feedDO = deserMap.get(key); checkValid(feedDO); if (i % 10000 = 0) System.out.println(read + i); free(buffer); private Map createInHeapMap(int size) long createTime = System.currentTimeMillis(); Map map = new ConcurrentHashMap(size); for (int i = 0; i size; +i) String key = key- + i; FeedDO value =
8、createFeed(i, key, createTime); map.put(key, value); return map; 由JDK提供的堆外内存访问API只能申请到一个类似一维数组的ByteBuffer, JDK并未提供基于堆外内存的实用数据结构实现(如堆外的Map、Set), 因此想要实现Cache的功能只能在write()时先将数据put()到一个堆内的HashMap, 然后再将整个Map序列化后MoveIn到DirectMemory, 取缓存则反之. 由于需要在堆内申请HashMap, 因此可能会导致多次Full GC. 这种方式虽然可以使用堆外内存, 但性能不高、无法发挥堆外内
9、存的优势. 幸运的是开源界的前辈开发了诸如Ehcache、MapDB、Chronicle Map等一系列优秀的堆外内存框架, 使我们可以在使用简洁API访问堆外内存的同时又不损耗额外的性能.其中又以Ehcache最为强大, 其提供了in-heap、off-heap、on-disk、cluster四级缓存, 且Ehcache企业级产品(BigMemory Max / BigMemory Go)实现的BigMemory也是Java堆外内存领域的先驱.示例2: MapDB API实现堆外Cachepublic class MapDBApp extends AbstractAppInvoker pri
10、vate static HTreeMap mapDBCache; static mapDBCache = DBMaker.hashMapSegmentedMemoryDirect() .expireMaxSize(SIZE) .make(); Test Override public void invoke(Object. param) for (int i = 0; i SIZE; +i) String key = key- + i; FeedDO feed = createFeed(i, key, System.currentTimeMillis(); mapDBCache.put(key
11、, feed); System.out.println(write down); for (int i = 0; i SIZE; +i) String key = key- + i; FeedDO feedDO = mapDBCache.get(key); checkValid(feedDO); if (i % 10000 = 0) System.out.println(read + i); 结果 & 分析DirectByteBufferApp S0 S1 E O P YGC YGCT FGC FGCT GCT0.00 0.00 5.22 78.57 59.85 19 2.902 13 7.2
12、51 10.153the last one jstat of MapDBApp S0 S1 E O P YGC YGCT FGC FGCT GCT0.00 0.03 8.02 0.38 44.46 171 0.238 0 0.000 0.238运行DirectByteBufferApp.invoke()会发现有看到很多Full GC的产生, 这是因为HashMap需要一个很大的连续数组, Old区很快就会被占满, 因此也就导致频繁Full GC的产生. 而运行MapDBApp.invoke()可以看到有一个DirectMemory持续增长的过程, 但FullGC却一次都没有了.实验: 使用堆外
13、内存减少Full GC实验环境java -versionjava version 1.7.0_79Java(TM) SE Runtime Environment (build 1.7.0_79-b15)Java HotSpot(TM) 64-Bit Server VM (build 24.79-b02, mixed mode)VM Options-Xmx512M-XX:MaxDirectMemorySize=512M-XX:+PrintGC-XX:+UseConcMarkSweepGC-XX:+CMSClassUnloadingEnabled-XX:CMSInitiatingOccupancy
14、Fraction=80-XX:+UseCMSInitiatingOccupancyOnly实验数据 170W条动态(FeedDO).实验代码第1组: in-heap、affect by GC、no serializeConcurrentHashMapApppublic class ConcurrentHashMapApp extends AbstractAppInvoker private static final Map cache = new ConcurrentHashMap(); Test Override public void invoke(Object. param) / wri
15、te for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); FeedDO feedDO = createFeed(i, key, System.currentTimeMillis(); cache.put(key, feedDO); System.out.println(write down); / read for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); FeedDO feedDO = cache.get(key); check
16、Valid(feedDO); if (i % 10000 = 0) System.out.println(read + i); GuavaCacheApp类似, 详细代码可参考完整项目.第2组: off-heap、not affect by GC、need serializeEhcacheApppublic class EhcacheApp extends AbstractAppInvoker private static Cache cache; static ResourcePools resourcePools = ResourcePoolsBuilder.newResourcePool
17、sBuilder() .heap(1000, EntryUnit.ENTRIES) .offheap(480, MemoryUnit.MB) .build(); CacheConfiguration configuration = CacheConfigurationBuilder .newCacheConfigurationBuilder(String.class, FeedDO.class, resourcePools) .build(); cache = CacheManagerBuilder.newCacheManagerBuilder() .withCache(cacher, con
18、figuration) .build(true) .getCache(cacher, String.class, FeedDO.class); Test Override public void invoke(Object. param) for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); FeedDO feedDO = createFeed(i, key, System.currentTimeMillis(); cache.put(key, feedDO); System.out.println(write d
19、own); / read for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); Object o = cache.get(key); checkValid(o); if (i % 10000 = 0) System.out.println(read + i); MapDBApp与前同.第3组: off-process、not affect by GC、serialize、affect by process communicationLocalRedisApppublic class LocalRedisApp ex
20、tends AbstractAppInvoker private static final Jedis cache = new Jedis(localhost, 6379); private static final IObjectSerializer serializer = new Hessian2Serializer(); Test Override public void invoke(Object. param) / write for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); FeedDO feed
21、DO = createFeed(i, key, System.currentTimeMillis(); byte value = serializer.serialize(feedDO); cache.set(key.getBytes(), value); if (i % 10000 = 0) System.out.println(write + i); System.out.println(write down); / read for (int i = 0; i SIZE; +i) String key = String.format(key_%s, i); byte value = ca
22、che.get(key.getBytes(); FeedDO feedDO = serializer.deserialize(value); checkValid(feedDO); if (i % 10000 = 0) System.out.println(read + i); 结果分析对比前面几组数据, 可以有如下总结:将长生命周期的大对象(如cache)移出heap可大幅度降低Full GC次数与耗时;使用off-heap存储对象需要付出serialize/deserialize成本;将cache放入分布式缓存需要付出进程间通信/网络通信的成本(UNIX Domain/TCP IP)附:
23、off-heap的Ehcache能够跑出比in-heap的HashMap/Guava更好的成绩确实是我始料未及的O(_)O, 但确实这些数据和堆内存的搭配导致in-heap的Full GC太多了, 当heap堆开大之后就肯定不是这个结果了. 因此在使用堆外内存降低Full GC前, 可以先考虑是否可以将heap开的更大.附: 性能测试框架在main函数启动时, 扫描com.vdian.se.apps包下的所有继承了AbstractAppInvoker的类, 然后使用Javassist为每个类生成一个代理对象: 当invoke()方法执行时首先检查他是否标注了Test注解(在此, 我们借用jun
24、it定义好了的注解), 并在执行的前后记录方法执行耗时, 并最终对比每个实现类耗时统计.依赖 mons commons-proxy $commons.proxy.version org.javassist javassist $javassist.version com.caucho hessian $hessian.version com.google.guava guava $guava.version junit junit $junit.version启动类: OffHeapStarter/* * author jifang * since 2017/1/1 上午10:47. */pu
25、blic class OffHeapStarter private static final Map STATISTICS_MAP = new HashMap(); public static void main(String args) throws IOException, IllegalAccessException, InstantiationException SetClass classes = PackageScanUtil.scanPackage(com.vdian.se.apps); for (Class clazz : classes) AbstractAppInvoker
26、 invoker = createProxyInvoker(clazz.newInstance(); invoker.invoke(); /System.gc(); System.out.println(* statistics *); for (Map.Entry entry : STATISTICS_MAP.entrySet() System.out.println(method + entry.getKey() + total cost + entry.getValue() + ms); private static AbstractAppInvoker createProxyInvok
27、er(Object invoker) ProxyFactory factory = w JavassistProxyFactory(); Class superclass = invoker.getClass().getSuperclass(); Object proxy = factory .createInterceptorProxy(invoker, new ProfileInterceptor(), new Classsuperclass); return (AbstractAppInvoker) proxy; private static class ProfileIntercept
28、or implements Interceptor Override public Object intercept(Invocation invocation) throws Throwable Class clazz = invocation.getProxy().getClass(); Method method = clazz.getMethod(invocation.getMethod().getName(), Object.class); Object result = null; if (method.isAnnotationPresent(Test.class) & method.getName().equals(invoke)
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1