Java 内存管理(堆和栈)及 垃圾回收算法


一.Jvm虚拟机内存简介

1.1 Java运行时内存区

Java的运行时内存组成如下图所示:
在这里插入图片描述

1.2 线程私有的如下:

  • 程序计数器

    当前线程所执行的字节码的行号指示器

  • Java虚拟机栈

    Java方法执行的内存模型,每个方法被执行时都会创建一个栈帧,存储局部变量表、操作栈、动态链接、方法出口等信息。

    • 每个线程都有自己独立的栈空间
    • 线程栈只存基本类型和对象地址(重点)
    • 方法中局部变量在线程空间中(重点)
  • 本地方法栈

    Native方法服务。在HotSpot虚拟机中和Java虚拟机栈合二为一。

1.3 线程共享的如下:

  • Java堆

    存放对象实例,几乎所有的对象实例以及其属性都在这里分配内存。(重点)

  • 方法区

    存储已经被虚拟机加载的类信息、常量、静态变量、JIT编译后的代码等数据。

  • 运行时常量池

    方法区的一部分。用于存放编译期生成的各种字面量和符号引用。

在这里插入图片描述

  • 直接内存

    NIO、Native函数直接分配的堆外内存。DirectBuffer引用也会使用此部分内存。

二.Java 栈和堆

2.1 堆栈的概念和特点

Java把内存划分成两种:一种是栈内存,一种是堆内存。

栈内存中存储 基本类型的变量方法中的局部变量 以及 对象的引用变量

堆内存用来存放 由new创建的对象和数组

在这里插入图片描述
在栈内存中保存的是堆内存空间的访问地址,或者说栈中的变量指向堆内存中的变量(Java中的指针)

详细解释:
在堆中产生了一个数组或对象后,在栈中定义一个特殊的变量,让栈中这个变量的取值等于数组或对象在堆内存中的首地址,栈中的这个变量就成了数组或对象的引用变量。

引用变量就相当于是为数组或对象起的一个名称,以后就可以在程序中使用栈中的引用变量来访问堆中的数组或对象。

当在一段代码块定义一个变量时,Java就在栈中为这个变量分配内存空间,当超过变量的作用域后,Java会自动释放掉为该变量所分配的内存空间,该内存空间可以立即被另作他用。

在堆中分配的内存,由Java虚拟机的自动垃圾回收器来管理。


2.2 栈与堆的异同

栈与堆都是Java用来在Ram中存放数据的地方。与C++不同,Java自动管理栈和堆,程序员不能直接地设置栈或堆。

Java的堆是一个运行时数据区,类的(对象从中分配空间。这些对象通过new、newarray、anewarray和multianewarray等指令建立,它们不需要程序代码来显式的释放。堆是由垃圾回收来负责的,

堆的优势是可以动态地分配内存大小,生存期也不必事先告诉编译器,因为它是在运行时动态分配内存的,Java的垃圾收集器会自动收走这些不再使用的数据。但缺点是,由于要在运行时动态分配内存,存取速度较慢。

栈的优势是,存取速度比堆要快,仅次于寄存器,栈数据可以共享。但缺点是,存在栈中的数据大小与生存期必须是确定的,缺乏灵活性。栈中主要存放一些基本类型的变量(,int, short, long, byte, float, double, boolean, char)和对象句柄。

2.3 举个例子

栈有一个很重要的特殊性,就是存在栈中的数据可以共享。假设我们同时定义:

int a = 3;
int b = 3
  1. 编译器先处理int a = 3;首先它会在栈中创建一个变量为a的引用,然后查找栈中是否有3这个值,如果没找到,就将3存放进来,然后将a指向3。
  2. 接着处理int b = 3;在创建完b的引用变量后,因为在栈中已经有3这个值,便将b直接指向3。
  3. 这样,就出现了a与b同时均指向3的情况。
  4. 这时,如果再令a=4;那么编译器会重新搜索栈中是否有4值,如果没有,则将4存放进来,并令a指向4;如果已经有了,则直接将a指向这个地址。
  5. 因此a值的改变不会影响到b的值。

要注意这种数据的共享与两个对象的引用同时指向一个对象的这种共享是不同的,因为这种情况a的修改并不会影响到b, 它是由编译器完成的,它有利于节省空间。而一个对象引用变量修改了这个对象的内部状态,会影响到另一个对象引用变量

String是一个特殊的包装类数据。可以使用如下两种形式才创建,放在堆中或常量池(方法区)中:

String str = new String("abc");
String str = "abc";
  • 第一种是用new()来新建对象的,这种语法是在堆中创建对象,并将str指向它,然后去字符串常量池中看看,是否有与之相同的内容的对象,如果有,则将new出来的字符串对象与字符串常量池中的对象联系起来,如果没有,则在字符串常量池中再创建一个包含该内容的字符串对象,并将堆内存中的对象与字符串常量池中新建出来的对象联系起来。
    这就是字符串的一次投入,终生回报的内存机制,对字符串的比较带来好处。
  • 第二种是先在栈中创建一个对String类的对象引用变量str,然后查找常量池中有没有存放"abc",如果没有,则将"abc"存放进常量池,并令str指向”abc”,如果已经有”abc” 则直接令str指向“abc”。
  • 要注意: 我们在使用诸如String str = “abc”;的格式定义类时,可能并没有创建新的String类的对象str,可能只是指向一个先前已经创建的对象,使用方法一 new() 可以保证每一次都是一个新的对象。
  String str1 = "aaa";
 //解析:str1指向方法区;

  String str2 = "bbb";
 //解析: str2 指向方法区

  String str3 = "aaabbb";
  //解析:str3指向方法区

  String str4 = str1 + str2;
  //解析:此行代码执行的底层执行过程是 首先使用StringBuffer的append方法将"str1"和"str2"拼接在一块,然后调用toString方法new出“str4”;所以此时的str4是创建在堆区的

  String str5 = "aaa" + "bbb";
  //解析:该行代码重点说明一下,jvm对其有优化处理,也就是在编译阶段就会将这两个字符串常量进行拼接,也就是"aaabbb";所以他是在方法区中的;’

  System.out.println(str3 == str4); // false or true
 //解析:很明显 为false, 一个指向堆 一个指向方法区

  System.out.println(str3 == str4.intern()); // true or false
 //解析:jdk1.6中str4.intern会把“aaabbb”放在方法区,1.7后在堆区,所以在1.6中会是true 但是在1.7中是false

  System.out.println(str3 == str5);// true or false
  //解析:都指向字符串常量区,字符串长常量区在方法区,相同的字符串只存在一份,其实这个地方在扩展一下,
  //因为方法区的字符串常量是共享的,在两个线程同时共享这个字符串时,如果一个线程改变他会是怎么样的呢,
  //其实这种场景下是线程安全的,jvm会将改变后的字符串常量在
  // 字符串常量池中重新创建一个处理,可以保证线程安全

另注:

  • (1). 内存中有一个java基本类型封装类的常量池。这些类包括Byte, Short, Integer, Long, Character, Boolean。需要注意的是,Float和Double这两个类并没有对应的常量池。

  • (2).上面5种整型的包装类的对象是存在范围限定的;范围在-128~127存在在常量池,范围以外则在堆区进行分配。

  • (3). 在周志明的那本虚拟机中有这样一句话:包装类的“ = = ” 运行符在不遇到算术运算的情况下不会自动拆箱,以及他们的equals()方法不处理数据类型的关系,通俗的讲也就是 “ = = ”两边如果有算术运算, 那么自动拆箱和进行数据类型转换处理,比较的是数值等不等能。

  • (4).Long的equals方法会先判断是否是Long类型。

  • (5).无论是Integer还是Long,他们的equals方法比较的是数值。

    Integer a = 1;
    Integer b = 2;
    Integer c = 3;
    Integer d = 3;
    Integer e = 321;
    Integer f = 321;
    Long g = 3L;

    System.out.println(c == d); //  true
    //解析:由于常量池的作用,c与d指向的是同一个对象(注意此时的==比较的是对象,也就是地址,而不是数值)。
    
    System.out.Println(e == f); // false
    //由于321超过了127,因此常量池失去了作用,所以e和f数值虽然相同,但不是同一个对象。
    
    System.out.println(c == (a + b)); // true
    //此时==两边有算术运算,会进行拆箱,因此此时比较的是数值,而并非对象。
    
    System.out.println(c.equals(a+b)); // true
    //c与a+b的数值相等。
    
    System.out.println(g == (a + b)); // true。
    //由于==两边有算术运算,所以比较的是数值。
    
    System.out.println(g.equals(a + b)); // false
    //Long类型的equal在比较是时候,会先判断a+b是否为Long类型,显然a+b不是.

三.垃圾回收算法

3.1 GC机制

Java GC(Garbage Collection,垃圾收集,垃圾回收)机制,是Java与C++/C的主要区别之一,作为Java开发者,一般不需要专门编写内存回收和垃圾清理代码。这是因为在Java虚拟机中,存在自动内存管理和垃圾清扫机制。该机制对 JVM(Java Virtual Machine)中的内存进行标记,并确定哪些内存需要回收,根据一定的回收策略,自动的回收内存,永不停息(Nerver Stop)的保证JVM中的内存空间,防止出现内存泄露和溢出问题。

GC回收的是无用对象,而对象创建后在jvm堆中,所以先来看jvm堆

JVM堆(分代法)分为

  • (1) 新域:存储所有新成生的对象(使用 “停止-复制”算法 进行清理)
      新生代内存分为2部分:
       第一部分 Eden区,空间较大;
       第二部分部分Survivor区,空间比较小,并被划分为两个等量的部分。

  • (2) 旧域:新域中的对象,经过了一定次数的GC循环后,被移入旧域(算法是 标记-整理算法)

  • (3)永久域(方法区):存储类和方法对象,从配置的角度看,这个域是独立的,不包括在JVM堆内。默认为4M。

方法区(永久域)的回收有两种:

  • 常量池中的常量
  • 无用的类信息

常量的回收很简单,没有引用了就可以被回收。
对于无用的类进行回收,必须保证3点:

  • 类的所有实例都已经被回收
  • 加载类的ClassLoader已经被回收
  • 类对象的Class对象没有被引用(即没有通过反射引用该类的地方)

永久域的回收并不是必须的,可以通过参数来设置是否对类进行回收。

3.2 GC 流程

当eden满了,触发 young GC,young GC做2件事:

  • 一,去掉一部分没用的object;
  • 二,把老的还被引用的object发到survior里面,等下几次GC以后,survivor再放到old里面。

当old满了,触发 full GC。full GC很消耗内存,把old,young里面大部分垃圾回收掉。这个时候用户线程都会被block。

3.3 GC算法

(1) Mark-Sweep 标记—清除算法

遍历所有的GC Root,分别标记处可达的对象和不可达的对象,然后将不可达的对象回收。

优点是:内存消耗较复制法小
缺点是:效率低、回收得到的空间不连续

设立若干根对象(GC Root),每个对象都是一个子节点,当一个对象找不到根时,就认为该对象不可达。

在这里插入图片描述

没有一条从根到Object4 和 Object5的路径,说明这两个对象到根是不可达的,可以被回收

补充:java中,可以作为GC Roots的对象包括:

  • java虚拟机栈中引用的对象
  • 方法区中静态变量引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中引用的对象

(2) Copying Collector 复制算法

将内存分为两块,每次只使用一块。当这一块内存满了,就将还存活的对象复制到另一块上,并且严格按照内存地址排列,然后把已使用的那块内存统一回收。

优点是:能够得到连续的内存空间 效率高
缺点是:浪费了一半内存

(3) Mark-Sweep-Compact 标记—整理算法
对于对象的清除,会产生一些内存碎片,这时候就需要对这些内存进行压缩、整理。包括:relocate(将存货的对象移动到一起,从而释放出连续的可用内存)、remap(收集所有的对象引用指向新的对象地址)。效率和存活对象的数量是线性相关的。

3.4 常见小问题1: Java程序是否会出现内存泄露

参考答案:会出现内存泄漏。

一般来说内存泄漏有两种情况。一是在堆中分配的内存,在没有将其释放掉的时候,就将所有能访问这块内存的方式都删掉;另一种情况则是在内存对象明明已经不需要的时候,还仍然保留着这块内存和它的访问方式(引用)。第一种情况,在Java中已经由于垃圾回收机制的引入,得到了很好的解决。所以,Java中的内存泄漏,主要指的是第二种情况。

下面给出了一个简单的内存泄露的例子。在这个例子中,我们循环申请Object对象,并将所申请的对象放入一个List中,如果我们仅仅释放引用本身,那么List仍然引用该对象,所以这个对象对GC来说是不可回收的。代码如下所示:

    List list=new ArrayList(10);
    for (int i=1;i<100; i++)
    {
        Object o=new Object();
        list.add(o);
        o=null;    
    }

此时,所有的Object对象都没有被释放,因为变量list引用这些对象。

3.5 常见小问题2:JVM如何管理内存,分成几个部分?分别有什么用途?说出下面代码的内存实现原理:

Foo foo = new Foo();
foo.f();

参考答案

JVM内存分为“堆”、“栈”和“方法区”三个区域,分别用于存储不同的数据。
  堆内存用于存储使用new关键字所创建的对象;栈内存用于存储程序运行时在方法中声明的所有的局部变量,基本类型和对象地址;方法区用于存放类的信息,Java程序运行时,首先会通过类装载器载入类文件的字节码信息,经过解析后将其装入方法区。类的各种信息(包括方法)都在方法区存储。

以上代码的内存实现原理为:(重点)
  1.Foo类首先被装载到JVM的方法区,其中包括类的信息,包括方法和构造等。
  2.在栈内存中分配引用变量foo。
  3.在堆内存中按照Foo类型信息分配实例变量内存空间;然后,将栈中引用foo指向foo对象堆内存的首地址。
  4.使用引用foo调用方法,根据foo引用的类型Foo调用f方法。


文章参考以下博客:
https://blog.csdn.net/u010429424/article/details/77333311#commentBox
https://blog.csdn.net/wulianghuan/article/details/8599181
https://www.imooc.com/article/68981
https://www.cnblogs.com/lyf906522290/p/8350756.html

猜你喜欢

转载自blog.csdn.net/qunqunstyle99/article/details/94005430