百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

JVM中的本机内存跟踪详解

toyiye 2024-05-19 19:36 13 浏览 0 评论

1.概述

有没有想过为什么Java应用程序通过众所周知的-Xms和-Xmx调优标志消耗的内存比指定数量多得多?出于各种原因和可能的优化,JVM可以分配额外的本机内存。这些额外的分配最终会使消耗的内存超出-Xmx限制。

在本教程中,我们将列举JVM中的一些常见内存分配源,以及它们的大小调整标志,然后学习如何使用本机内存跟踪监视它们。

2.原生分配

堆通常是Java应用程序中最大的内存使用者,但还有其他人。除了堆之外,JVM还从本机内存中分配出一个相当大的块来维护类的元数据,应用程序代码,JIT生成的代码,内部数据结构等。在下面的部分中,我们将探讨其中的一些分配。

2.1. Metaspace(元空间)

为了维护有关已加载类的一些元数据,JVM使用名为Metaspace的专用非堆区域。在Java 8之前,被称为PermGen或Permanent Generation。 Metaspace或PermGen包含有关已加载类的元数据,而不是它们的实例,它们保存在堆中。

这里重要的是堆大小配置不会影响元空间大小,因为Metaspace是一个堆外数据区。为了限制Metaspace大小,我们使用其他调优标志:

  • -XX:MetaspaceSize和-XX:MaxMetaspaceSize设置最小和最大元空间大小
  • 在Java 8之前,-XX:PermSize和-XX:MaxPermSize设置最小和最大PermGen大小

2.2. Threads(线程)

JVM中最耗费内存的数据区之一是堆栈,与每个线程同时创建。堆栈存储局部变量和部分结果,在方法调用中起着重要作用。

默认的线程堆栈大小取决于平台,但在大多数现代64位操作系统中,它大约为1 MB。此大小可通过-Xss调整标志进行配置。

与其他数据区域相比,当对线程数没有限制时,分配给堆栈的总内存实际上是无限制的。值得一提的是,JVM本身需要一些线程来执行其内部操作,如GC或即时编译。

2.3. Code Cache(代码缓存)

为了在不同平台上运行JVM字节码,需要将其转换为机器指令。执行程序时,JIT编译器负责此编译。

当JVM将字节码编译为汇编指令时,它会将这些指令存储在称为代码缓存的特殊非堆数据区中。可以像管理JVM中的其他数据区一样管理代码缓存。 -XX:InitialCodeCacheSize和-XX:ReservedCodeCacheSize调整标志确定代码缓存的初始值和可能最大值。

2.4. Garbage Collection(垃圾回收)

JVM附带了一些GC算法,每个算法适用于不同的用例。所有这些GC算法都有一个共同的特点:他们需要使用一些堆外数据结构来执行他们的任务。这些内部数据结构消耗更多本机内存。

2.5. Symbols(符号)

让我们从 Strings 开始,这是应用程序和库代码中最常用的数据类型之一。由于它们无处不在,它们通常占据堆的很大一部分。如果大量的这些字符串包含相同的内容,那么堆的很大一部分将被浪费。

为了节省一些堆空间,我们可以存储每个 String 的一个版本,并让其他版本引用存储的版本。此过程称为 String Interning 。由于JVM只能内部编译时间字符串常量,我们可以手动调用字符串的intern方法来获取内部编译字符串。

JVM将实际存储的字符串存储在本机特殊固定大小并称为字符串表的哈希表中,也称为字符串池。我们可以通过-XX:StringTableSize调整标志配置表大小(即桶的数量)。

除了字符串表之外,还有另一个称为运行时常量池的本机数据区域。 JVM使用此池来存储常量,如编译时数字文字或必须在运行时解析的方法和字段引用。

2.6. Native Byte Buffers(本地字节缓冲区)

JVM通常有大量分配本机内存的嫌疑,但有时开发人员也可以直接分配本机内存。最常见的方法是被JNI调用的malloc和NIO中可直接调用的ByteBuffers。

2.7. Additional Tuning Flags(额外的调整标志)

在本节中,我们针对不同的优化方案使用了少量JVM调优标志。使用以下提示,我们几乎可以找到与特定概念相关的所有调优标志:

$ java -XX:+PrintFlagsFinal -version | grep <concept>

PrintFlagsFinal打印JVM中的所有-XX选项。例如,要查找所有与Metaspace相关的标志:

$ java -XX:+PrintFlagsFinal -version | grep Metaspace
 // truncated
 uintx MaxMetaspaceSize = 18446744073709547520 {product}
 uintx MetaspaceSize = 21807104 {pd product}
 // truncated

3. 本机内存跟踪 (NMT)

现在我们已经了解了JVM中本机内存分配的常见来源,现在是时候找出如何监视它们了。首先,我们应该使用另一个JVM调优标志启用本机内存跟踪:-XX:NativeMemoryTracking = off | sumary | detail。默认情况下,NMT处于关闭状态,但我们可以使其查看其观察的摘要或详细视图。

假设我们想要跟踪典型Spring Boot应用程序的本机分配:

$ java -XX:NativeMemoryTracking=summary -Xms300m -Xmx300m -XX:+UseG1GC -jar app.jar

在这里,我们在分配300 MB堆空间的同时启用NMT,G1作为我们的GC算法。

3.1. 实例快照

启用NMT后,我们可以使用jcmd命令随时获取本机内存信息:

$ jcmd <pid> VM.native_memory

为了找到JVM应用程序的PID,我们可以使用jps命令:

$ jps -l 
7858 app.jar // This is our app
7899 sun.tools.jps.Jps

现在,如果我们将jcmd与适当的pid一起使用,VM.native_memory会使JVM打印出有关本机分配的信息:

$ jcmd 7858 VM.native_memory

让我们逐节分析NMT输出。

3.2. 总分配

NMT报告全部保留和提交的内存如下:

Native Memory Tracking:
Total: reserved=1731124KB, committed=448152KB

保留内存表示我们的应用程序可能使用的内存总量。相反,提交的内存表示我们的应用程序现在使用的内存量。

尽管分配了300MB的堆,我们的应用程序的总预留内存几乎是1.7 GB,远远超过它。类似地,提交的内存大约为440 MB,这再次远远超过300 MB。

在整体了解之后,NMT报告每个分配源的内存分配。所以,让我们深入探讨每个来源。

3.3. Heap(堆)

NMT按我们的预期报告堆分配:

Java Heap (reserved=307200KB, committed=307200KB)
 (mmap: reserved=307200KB, committed=307200KB)

300 MB的保留和已提交内存,与我们的堆大小设置相匹配。

3.4. Metaspace(元空间)

这是NMT关于加载类的元数据的报告:

Class (reserved=1091407KB, committed=45815KB)
 (classes #6566)
 (malloc=10063KB #8519) 
 (mmap: reserved=1081344KB, committed=35752KB)

几乎保留了1 GB,45 MB保留加载6566个类。

3.5. Thread(线程)

这是关于线程分配的NMT报告:

Thread (reserved=37018KB, committed=37018KB)
 (thread #37)
 (stack: reserved=36864KB, committed=36864KB)
 (malloc=112KB #190) 
 (arena=42KB #72)

总共有36 MB的内存被分配给37个线程的堆栈 - 每个堆栈大约1 MB。 JVM在创建时将内存分配给线程,因此保留和提交的分配是相等的。

3.6. Code Cache(代码缓冲区)

让我们看看NMT对JIT生成和缓存的汇编指令的报告:

Code (reserved=251549KB, committed=14169KB)
 (malloc=1949KB #3424) 
 (mmap: reserved=249600KB, committed=12220KB)

目前,正在缓存大约13 MB的代码,这个数量可能会达到245 MB。

3.7. GC

以下是有关G1 GC内存使用情况的NMT报告:

GC (reserved=61771KB, committed=61771KB)
 (malloc=17603KB #4501) 
 (mmap: reserved=44168KB, committed=44168KB)

我们可以看到,保留和已提交都接近60 MB,致力于帮助G1。

让我们来看看更简单的GC的内存使用情况,比如Serial GC:

$ java -XX:NativeMemoryTracking=summary -Xms300m -Xmx300m -XX:+UseSerialGC -jar app.jar

Serial GC 几乎使用不到1 MB:

GC (reserved=1034KB, committed=1034KB)
 (malloc=26KB #158) 
 (mmap: reserved=1008KB, committed=1008KB)

显然,我们不能仅仅因为其内存使用而选择GC算法,因为串行GC的暂停回收本质可能会导致性能下降。但是,还有几个GC可供选择,它们各自平衡内存和性能。

3.8. Symbol(符号)

以下是有关符号分配的NMT报告,例如字符串表和常量池:

Symbol (reserved=10148KB, committed=10148KB)
 (malloc=7295KB #66194) 
 (arena=2853KB #1)

将近10 MB分配给符号。

3.9. 随着时间的推移的NMT

NMT允许我们跟踪内存分配如何随时间变化。首先,我们应该将应用程序的当前状态标记为基线:

$ jcmd <pid> VM.native_memory baseline
Baseline succeeded

然后,过了一会儿,我们可以将当前的内存使用情况与该基线(baseline)进行比较:

$ jcmd <pid> VM.native_memory summary.diff

NMT使用+和 - 符号将告诉我们在此期间内存使用情况如何变化:

Total: reserved=1771487KB +3373KB, committed=491491KB +6873KB
- Java Heap (reserved=307200KB, committed=307200KB)
 (mmap: reserved=307200KB, committed=307200KB)
- Class (reserved=1084300KB +2103KB, committed=39356KB +2871KB)
// Truncated

保留和提交的总内存分别增加了3 MB和6 MB。可以很容易地发现内存分配的其他波动。

3.10. 详细的NMT

NMT可以提供非常详细的有关整个存储空间映射的信息。要启用此详细报告,我们应使用 -XX:NativeMemoryTracking =detail 信息调整标志。

4. 结束语

在本文中,我们列举了JVM中本机内存分配的不同使用者。然后,我们学习了如何检查正在运行的应用程序以监视其本机分配。借助以上这些,我们可以更有效地调整应用程序以及运行时环境的大小。

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码