值类型和引用类型在栈和堆中的分配

转载自 https://www.cnblogs.com/cjm123/p/8056239.html

类型基础及背后的工作原理   数据在内存中的分配与传递    值类型和引用类型它们在内存分配与传递上的区别

内存分配

    首先要了解一下内存中栈和堆的概念。

    栈(Stack)

     ##栈是一种先进后出的内存结构。

     方法的调用追踪就是在栈上完成的。比如我们有一个main方法(程序入口), 在main方法中会调用一个GetPoint的方法。在线程执行时,会将main方法压入栈底(包括编译好的方法指令,参数,和方法内部变量),然后再将GetPoint的方法压入栈底,GetPoint中没有调用其它方法,压栈完毕。出栈顺序是先进后出,也就是后进先出,栈顶的方法GetPoint先执行完毕,然后出栈,所占内存清空,接着main方法执行后出栈,所占内存清空。

//示意图:自己脑补吧...

  从上面方法的压栈出栈中可以看出:

     ##栈只能在一端对数据进行操作,也就是栈顶端进行操作。

     ##栈也是一种内存自我管理的结构,压栈自动分配内存,出栈自动清空所占内存。

  另外值得注意的两点:

     ##栈中的内存不能动态请求,只能为大小确定的数据分配内存,灵活性不高,但是栈的执行效率很高。

     ##栈的可用空间并不大,所以我们在操作分配到栈上的数据时要注意数据的大小带来的影响。

   堆(Heap)

     ##堆与栈有所区别,堆在C#中用于存储实实例对象,能存储大量数据,而且堆能够动态分配存储空间。

     ##相比栈只能在一端操作,堆中的数据可以随意存取。

     ##但堆的结构使得堆的执行效率不如栈高,而且不能自动回收使用过的对象。对于堆中的内存回收,C++程序员需要进行手动回收,这也是C++编程值得注意的一点,否则很容易造成内存溢出。而对于.NET程序员,平台提供了垃圾回收(GC)机制,可以自动回收堆中过期的对象(实现原理大概就是当发现没有“引用”指向此对象时,表明此对象可以回收,此文主要讨论值类型和引用类型,对于GC,感兴趣的可以搜索相关资料)。

    值类型和引用类型在栈和堆中的分配

    这儿有两个原则:

    1.创建引用类型时,runtime会为其分配两个空间,一块空间分配在堆上,存储引用类型本身的数据,另一个块空间分配在栈上,存储对堆上数据的引用,实际上存储的堆上的内存地址,也就是指针。

    2.创建值类型时, runtime会为其分配一个空间,这个空间分配在变量创建的地方,如:

       ##如果值类型是在方法内部创建,则跟随方法入栈,分配到栈上存储。

      ##如果值类型是引用类型的成员变量,则跟随引用类型,存储在堆上。(对象的成员变量)

   在此我们举例说明。

 定义一个Point类:  

 public class Point
   {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }

StartProgram类,有方法Start()和InitialPoint():

  class StartProgram
    {
        void Start()
        {
            double pointX = 100.1;
            InitialPoint(pointX);
        }
        void InitialPoint(double pointX)
        {
            var point = new Point();
            point.PointX = pointX;
        }
    }

示例分析:假设主线程从Start()进入执行,我们从分析一下方法中的变量在内存中的大致分配情况,不深究细节。

 首先将Start()方法指令压入栈底,然后压入局部变量pointX;紧接着将InitialPoint()方法压入栈底,形参pointX压入栈底,在堆上实例化Point对象(包括其成员变量PointX和PointY),并在栈上创建point变量指向堆上的Point对象,最后给成员变量PointX赋值,参考图如下:

    注:注意不要混淆code中的pointx,虽然变量名相同,但是它们是不同的变量。 

      

数据传递

   按值传递原则

   在C#中数据传递默认按值传递,先看一个示例。

 现在有一个结构体PointSturct, 一个类PointClass:

 public struct PointStruct
    {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }
  public class PointClass
    {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }

并在一个方法中执行执行以下代码:

1  void Excute()
2  {
3       var pointStruct1 = new PointStruct();
4       var pointClass1 = new PointClass();
5       var pointStruct2 = pointStruct1;
6       var pointClass2 = pointClass1;
7   }

示例分析:第3,4行代码分别创建了一个结构体pointStruct1和一个类实例pointClass1, 结合上面的内存分配规则,对于pointSturct1,会在栈上分配内存存储其数据本身,对于pointClass1,会在堆上分配内存存储实例,且在栈上存储指向堆上实例的指针,参考图如下:

     经过执行5,6行代码后,内存分配应该是怎样的呢? 对于值类型(pointStruct1),会在栈上开辟一块新的空间,将数据完全复制过去,因此pointStruct2和pointStruct1是互相独立的,对其中一个的修改不会影响到另一个;对于引用类型(pointClass1),也会在栈上开辟一个新的空间,将栈上的数据(指向堆上实例的指针)复制到新的空间, 但是注意,此处复制的是指针,也就是说栈上的两个变量pointClass1和pointClass2虽然是不同的空间,但是它们的存储内容---指针(内存地址), 都是指向堆上的同一实例,所以当通过pointClass2对实例的数据进行修改以后,通过pointClass1再访问实例的数据,将会是修改过的数据,反之亦然,参考图如下:

    参数传递

     当程序中进行参数传递的时候,也是默认按值传递,值类型复制数据本身,形成独立的数据块,引用类型复制引用,指向同一实例。简单一点就是传递时复制栈上的数据到新的栈上空间。

我们将之前的StartProgram类中的方法改成如下 :

class StartProgram
{
   void Start()
   {
      double pointX1 = 100.1;
      var point1 = new Point();
      point1.PointX = 200.1;
      InitialPoint(pointX1, point1);//值类型复制数据本身 对象传递 复制引用,指向同一实例
      Console.WriteLine(string.Format("pointX1:{0}", pointX1));
      Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX));
      Console.ReadKey();
    }
    void InitialPoint(double pointX2, Point point2)
    {
       pointX2 = 300.1;
       point2.PointX = pointX2;
    }
 }
/*Output:pointX1:100.1
         point1.PointX:300.1 
 */

示例分析:从输出结果可以看到,pointX1还是原来的值,没有受到pointX2影响,而point1.PointX的值是point2对PointX更改后的值。在内存中,将值类型pointX1传递给pointX2后,在栈上形成两个独立的内存块,因此对pointX2更改后,并不会影响到pointX1;而对于引用类型point1,传递给point2后,它们两块内存存储的指针指向同一实例,因此再InitialPoint()方法内对point2.PointX赋值为300.1后,再Start()方法里面取point1取PointX的值,也是300.1。

既然point1和point2指向同一实例,那么如果我们在InitialPoint()方法的最后将point2设置为null,会不会影响到Start()方法里的point1呢?用point.PointX取值的时候,会不会得到实例为null的异常呢?

void InitialPoint(double pointX2, Point point2)
 {
    pointX2 = 300.1;
    point2.PointX = pointX2;
    point2 = null;//
    //将point2设置为null,并不是将堆上的实例变为null,而是设置栈上的point2这块存储指针的内存为null
    //栈上point1和point2虽然指向同一实例,但是它们是两块不同的内存,所以将point2设置为null后,point1仍然指向堆上的实例

 }
 /*Output:pointX1:100.1
          point1.PointX:300.1 
 */

示例分析:还是会得到之前的结果,没有检测到null异常。这不难想象,因为我们将point2设置为null,并不是将堆上的实例变为null,而是设置栈上的point2这块存储指针的内存为null,而栈上point1和point2虽然指向同一实例,但是它们是两块不同的内存,所以将point2设置为null后,point1仍然指向堆上的实例,并且point2设置为null是在对堆上的实例进行更新以后,因此point1.PointX的到的值是更新后的值,参考图如下:

    按引用传递(Ref和Out关键字)

    注:Ref和Out的区别在于Ref在传递前需要初始化。

   我们知道C#中的Ref和Out关键字可以在值类型的传参上实现跟引用类型一样的效果,那么在引用类型参数上加入ref和out关键字跟默认的引用类型传参有什么区别呢?很多人觉得应该没有什么用,其实不然,我们继续将StartProgram类的方法改为按ref传递,看看会有什么不同。

class StartProgram
{void Start()
    {
        double pointX1 = 100.1;
        var point1 = new Point();
        point1.PointX = 200.1;
        InitialPoint(ref pointX1, ref point1);
        Console.WriteLine(string.Format("pointX1:{0}", pointX1));
        if (point1 != null) Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX));
        else Console.WriteLine(string.Format("point1 is null"));
        Console.ReadKey();
    }
    void InitialPoint(ref double pointX2, ref Point point2)
    {
        pointX2 = 300.1;
        point2.PointX = pointX2;
        point2 = null;
    }
    /*Output:
             pointX1:300.1
             point1 is null
    */
 }

示例分析:从运行结果可以看到,对于值类型, pointX2对值的更改影响到了pointX1;对于引用类型,将point2设置为null后,point1也变成了null,之前我们没有加ref参数的时候,point2设置为null,并不会影响到point1本身。我们可以看到,通过加入ref和out参数后,在内存中并不是像值传递一样将栈上的数据拷贝一份到新的空间。在这里,我并没有去研究C#对ref和out参数在内存上的实现原理,但是可以想到,要实现这种效果并不难,在按引用传递时我们将栈上的变量的地址(如存储pointX1,point1的内存地址)copy到新的栈内存空间中,这样就可以将新的变量和旧的变量关联起来,达到互相影响的效果。

Summary

   本文从内存中栈和堆的结构特点出发,分析了C#值类型和引用类型在栈和堆上的分配情况,接着分析了数据传递过程,包括按值传递(赋值,参数传递),按引用传递(ref,out关键字),仅供参考。

猜你喜欢

转载自blog.csdn.net/Marccco/article/details/85319559