值类型和引用类型在栈和堆中的分配

转载自 https://www.cnblogs.com/cjm123/p/8056239.html

类型基础及背后的工作原理数据在内存中的分配与传递值类型和引用类型它们在内存分配与传递上的区别

内存分配

首先要了解一下内存中栈和堆的概念。

栈（Stack）

##栈是一种先进后出的内存结构。

方法的调用追踪就是在栈上完成的。比如我们有一个main方法（程序入口），在main方法中会调用一个GetPoint的方法。在线程执行时，会将main方法压入栈底（包括编译好的方法指令，参数，和方法内部变量），然后再将GetPoint的方法压入栈底，GetPoint中没有调用其它方法，压栈完毕。出栈顺序是先进后出，也就是后进先出，栈顶的方法GetPoint先执行完毕，然后出栈，所占内存清空，接着main方法执行后出栈，所占内存清空。

//示意图：自己脑补吧...

从上面方法的压栈出栈中可以看出：

##栈只能在一端对数据进行操作，也就是栈顶端进行操作。

##栈也是一种内存自我管理的结构，压栈自动分配内存，出栈自动清空所占内存。

另外值得注意的两点：

##栈中的内存不能动态请求，只能为大小确定的数据分配内存，灵活性不高，但是栈的执行效率很高。

##栈的可用空间并不大，所以我们在操作分配到栈上的数据时要注意数据的大小带来的影响。

堆（Heap）

##堆与栈有所区别，堆在C#中用于存储实实例对象，能存储大量数据，而且堆能够动态分配存储空间。

##相比栈只能在一端操作，堆中的数据可以随意存取。

##但堆的结构使得堆的执行效率不如栈高，而且不能自动回收使用过的对象。对于堆中的内存回收，C++程序员需要进行手动回收，这也是C++编程值得注意的一点，否则很容易造成内存溢出。而对于.NET程序员，平台提供了垃圾回收(GC)机制，可以自动回收堆中过期的对象（实现原理大概就是当发现没有“引用”指向此对象时，表明此对象可以回收，此文主要讨论值类型和引用类型，对于GC，感兴趣的可以搜索相关资料）。

值类型和引用类型在栈和堆中的分配

这儿有两个原则：

1.创建引用类型时，runtime会为其分配两个空间，一块空间分配在堆上，存储引用类型本身的数据，另一个块空间分配在栈上，存储对堆上数据的引用，实际上存储的堆上的内存地址，也就是指针。

2.创建值类型时， runtime会为其分配一个空间，这个空间分配在变量创建的地方，如：

##如果值类型是在方法内部创建，则跟随方法入栈，分配到栈上存储。

##如果值类型是引用类型的成员变量，则跟随引用类型，存储在堆上。(对象的成员变量)

在此我们举例说明。

定义一个Point类：

 public class Point
   {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }

StartProgram类，有方法Start()和InitialPoint()：

  class StartProgram
    {
        void Start()
        {
            double pointX = 100.1;
            InitialPoint(pointX);
        }
        void InitialPoint(double pointX)
        {
            var point = new Point();
            point.PointX = pointX;
        }
    }

示例分析：假设主线程从Start()进入执行，我们从分析一下方法中的变量在内存中的大致分配情况，不深究细节。

首先将Start()方法指令压入栈底，然后压入局部变量pointX；紧接着将InitialPoint()方法压入栈底，形参pointX压入栈底，在堆上实例化Point对象(包括其成员变量PointX和PointY)，并在栈上创建point变量指向堆上的Point对象，最后给成员变量PointX赋值，参考图如下：

注：注意不要混淆code中的pointx，虽然变量名相同，但是它们是不同的变量。

数据传递

按值传递原则

在C#中数据传递默认按值传递，先看一个示例。

现在有一个结构体PointSturct，一个类PointClass：

 public struct PointStruct
    {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }
  public class PointClass
    {
        public double PointX { get; set; }
        public double PointY { get; set; }   
    }

并在一个方法中执行执行以下代码：

1  void Excute()
2  {
3       var pointStruct1 = new PointStruct();
4       var pointClass1 = new PointClass();
5       var pointStruct2 = pointStruct1;
6       var pointClass2 = pointClass1;
7   }

示例分析：第3，4行代码分别创建了一个结构体pointStruct1和一个类实例pointClass1, 结合上面的内存分配规则，对于pointSturct1，会在栈上分配内存存储其数据本身，对于pointClass1，会在堆上分配内存存储实例，且在栈上存储指向堆上实例的指针，参考图如下：

经过执行5，6行代码后，内存分配应该是怎样的呢？对于值类型（pointStruct1），会在栈上开辟一块新的空间，将数据完全复制过去，因此pointStruct2和pointStruct1是互相独立的，对其中一个的修改不会影响到另一个；对于引用类型（pointClass1），也会在栈上开辟一个新的空间，将栈上的数据（指向堆上实例的指针）复制到新的空间，但是注意，此处复制的是指针，也就是说栈上的两个变量pointClass1和pointClass2虽然是不同的空间，但是它们的存储内容---指针（内存地址），都是指向堆上的同一实例，所以当通过pointClass2对实例的数据进行修改以后，通过pointClass1再访问实例的数据，将会是修改过的数据，反之亦然，参考图如下：

参数传递

当程序中进行参数传递的时候，也是默认按值传递，值类型复制数据本身，形成独立的数据块，引用类型复制引用，指向同一实例。简单一点就是传递时复制栈上的数据到新的栈上空间。

我们将之前的StartProgram类中的方法改成如下：

class StartProgram
{
   void Start()
   {
      double pointX1 = 100.1;
      var point1 = new Point();
      point1.PointX = 200.1;
      InitialPoint(pointX1, point1);//值类型复制数据本身 对象传递 复制引用，指向同一实例
      Console.WriteLine(string.Format("pointX1:{0}", pointX1));
      Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX));
      Console.ReadKey();
    }
    void InitialPoint(double pointX2, Point point2)
    {
       pointX2 = 300.1;
       point2.PointX = pointX2;
    }
 }
/*Output:pointX1:100.1
         point1.PointX:300.1 
 */

示例分析：从输出结果可以看到，pointX1还是原来的值，没有受到pointX2影响，而point1.PointX的值是point2对PointX更改后的值。在内存中，将值类型pointX1传递给pointX2后，在栈上形成两个独立的内存块，因此对pointX2更改后，并不会影响到pointX1；而对于引用类型point1，传递给point2后，它们两块内存存储的指针指向同一实例，因此再InitialPoint()方法内对point2.PointX赋值为300.1后，再Start()方法里面取point1取PointX的值，也是300.1。

既然point1和point2指向同一实例，那么如果我们在InitialPoint()方法的最后将point2设置为null，会不会影响到Start()方法里的point1呢？用point.PointX取值的时候，会不会得到实例为null的异常呢？

void InitialPoint(double pointX2, Point point2)
 {
    pointX2 = 300.1;
    point2.PointX = pointX2;
    point2 = null;//
    //将point2设置为null，并不是将堆上的实例变为null，而是设置栈上的point2这块存储指针的内存为null
    //栈上point1和point2虽然指向同一实例，但是它们是两块不同的内存，所以将point2设置为null后，point1仍然指向堆上的实例

 }
 /*Output:pointX1:100.1
          point1.PointX:300.1 
 */

示例分析：还是会得到之前的结果，没有检测到null异常。这不难想象，因为我们将point2设置为null，并不是将堆上的实例变为null，而是设置栈上的point2这块存储指针的内存为null，而栈上point1和point2虽然指向同一实例，但是它们是两块不同的内存，所以将point2设置为null后，point1仍然指向堆上的实例，并且point2设置为null是在对堆上的实例进行更新以后，因此point1.PointX的到的值是更新后的值，参考图如下：

按引用传递（Ref和Out关键字）

注：Ref和Out的区别在于Ref在传递前需要初始化。

我们知道C#中的Ref和Out关键字可以在值类型的传参上实现跟引用类型一样的效果，那么在引用类型参数上加入ref和out关键字跟默认的引用类型传参有什么区别呢？很多人觉得应该没有什么用，其实不然，我们继续将StartProgram类的方法改为按ref传递，看看会有什么不同。

class StartProgram
{void Start()
    {
        double pointX1 = 100.1;
        var point1 = new Point();
        point1.PointX = 200.1;
        InitialPoint(ref pointX1, ref point1);
        Console.WriteLine(string.Format("pointX1:{0}", pointX1));
        if (point1 != null) Console.WriteLine(string.Format("point1.PointX:{0}", point1.PointX));
        else Console.WriteLine(string.Format("point1 is null"));
        Console.ReadKey();
    }
    void InitialPoint(ref double pointX2, ref Point point2)
    {
        pointX2 = 300.1;
        point2.PointX = pointX2;
        point2 = null;
    }
    /*Output:
             pointX1:300.1
             point1 is null
    */
 }

示例分析：从运行结果可以看到，对于值类型， pointX2对值的更改影响到了pointX1；对于引用类型，将point2设置为null后，point1也变成了null，之前我们没有加ref参数的时候，point2设置为null，并不会影响到point1本身。我们可以看到，通过加入ref和out参数后，在内存中并不是像值传递一样将栈上的数据拷贝一份到新的空间。在这里，我并没有去研究C#对ref和out参数在内存上的实现原理，但是可以想到，要实现这种效果并不难，在按引用传递时我们将栈上的变量的地址（如存储pointX1，point1的内存地址）copy到新的栈内存空间中，这样就可以将新的变量和旧的变量关联起来，达到互相影响的效果。

Summary

本文从内存中栈和堆的结构特点出发，分析了C#值类型和引用类型在栈和堆上的分配情况，接着分析了数据传递过程，包括按值传递（赋值，参数传递），按引用传递（ref，out关键字），仅供参考。

值类型和引用类型在栈和堆中的分配

猜你喜欢