【内存】内存对齐的原理

内存对齐的原因

内存对齐的原理

内存对齐的原因

1.平台原因(移植原因)：

不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2.性能原因：

内存对齐最最底层的原因是内存的IO是以64bit为单位进行的，因此内存对齐为了高效的内存IO，大部分都是更为高效的高速缓存IO。

数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。你int如果从0地址开始就一次读取就够了，如果你从1地址开始，那么要读2次。

内存对齐的原理

前面我们说过内存是由chip构成。每个chip内部，是由8个bank组成的。其构造如下图：

图2.内存颗粒物理结构

扫描二维码关注公众号，回复： 11518267 查看本文章

在每个bank内部，就是电容的行列矩阵结构了。（注意，二维矩阵中的一个元素一般存储着8个bit，也就是说包含了8个小电容）。

图3.bank物理结构

8个同位置的元素，一起组成在内存中连续的64个bit。如下图

图4.jpg

内存在进行IO的时候，一次操作取的就是64个bit。
所以，内存对齐最最底层的原因是内存的IO是以64bit为单位进行的。 对于64位数据宽度的内存，假如cpu也是64位的cpu（现在的计算机基本都是这样的），每次内存IO获取数据都是从同行同列的8个chip中各自读取一个字节拼起来的。从内存的0地址开始，0-63bit的数据可以一次IO读取出来，64-127bit的数据也可以一次读取出来。CPU和内存IO的硬件限制导致没办法一次跨在两个数据宽度中间进行IO。
假如对于一个c的程序员，如果把一个bigint（64位）地址写到的0x0001开始，而不是0x0000开始，那么数据并没有存在同一行列地址上。因此cpu必须得让内存工作两次才能取到完整的数据。效率自然就很低。这下你有没有彻底理解了内存对齐？

扩展1：如果不强制对地址进行操作，仅仅只是简单用c定义一个结构体，编译和链接器会自动替开发者对齐内存的。尽量帮你保证一个变量不跨列寻址。

扩展2：其实在内存硬件层上，还有操作系统层。操作系统还管理了CPU的一级、二级、三级缓存。实际中不一定每次IO都从内存出，如果你的数据局部性足够好，那么很有可能只需要少量的内存IO，大部分都是更为高效的高速缓存IO。但是高速缓存和内存一样，也是要考虑对齐的。

链接：https://www.jianshu.com/p/37409be16a37