PHP内存管理 垃圾回收

概述
1) 操作系统直接管理着内存,所以操作系统也需要进行内存管理,计算机中通常都有内存管理单元(MMU) 用于处理CPU对内存的访问。
2) 应用程序无法直接调用物理内存, 只能向系统申请内存。
向操作系统申请内存空间会引发系统调用。
系统调用会将CPU从用户态切换到内核。
为了减少系统调用开销。通常在用户态进行内存管理。 申请大块内存备用。使用完的内存不马上释放,将内存复用,避免多次内存申请和释放所带来性能消耗。
3) PHP不需要显示内存管理,由Zend引擎进行管理。
PHP内存限制
1)php.ini中的默认32MB
memory_limit = 32M
2)动态修改内存
ini_set ("memory_limit", "128M")

3)获取目前内存占用
memory_get_usage() : 获取PHP脚本所用的内存大小
memory_get_peak_usage() :返回当前脚本到目前位置所占用的内存峰值。

学习内存管理的目的
了解PHP如何占用内存,可以避免不必要的内存浪费。

PHP中的内存管理###

包含:
1)足够内存
2)可用内存获取部分内存
3)使用后的内存,是否销毁还是重新分配

PHP内存管理器

clipboard.png

接口层,是一些宏定义。
**堆层 heap **
_zend_mm_heap

初始化内存,调用 zend_mm_startup
PHP内存管理维护三个列表:
1)小块内存列表 free_buckets
2)大块内存列表 large_free_buckets
3)剩余内存列表 rest_buckets

两个HashTable 结构,难点是查找和计算内存地址
1)free_buckets
Hash函数为:

#define ZEND_MM_BUCKET_INDEX(true_size) ((true_size>>ZEND_MM_ALIGNMENT_LOG2)-(ZEND_MM_ALIGNED_MIN_HEADER_SIZE>>ZEND_MM_ALIGNMENT_LOG2))

2)large_free_buckets
Hash函数为:

#define ZEND_MM_LARGE_BUCKET_INDEX(S) zend_mm_high_bit(S)

    static inline unsigned int zend_mm_high_bit(size_t _size){
       ..//省略若干不同环境的实现
      unsignedint n =0;
      while(_size !=0) { 
        _size = _size >>1; n++;}
        return n-1;
    }

存储层 storage

  • 内存分配的方式对堆层透明化,实现存储层和heap层的分离。
  • 不同的内存分配方案, 有对应的处理函数。

内存的申请

PHP底层对内存的管理, 围绕着小块内存列表(free_buckets)、 大块内存列表(large_free_buckets)和 剩余内存列表(rest_buckets)三个列表来分层进行的

ZendMM向系统进行的内存申请,并不是有需要时向系统即时申请, 而是由ZendMM的最底层(heap层)先向系统申请一大块的内存,通过对上面三种列表的填充, 建立一个类似于内存池的管理机制。 在程序运行需要使用内存的时候,ZendMM会在内存池中分配相应的内存供使用。 这样做的好处是避免了PHP向系统频繁的内存申请操作

ZendMM对内存分配的处理步骤:

1)内存检查;
2)命中缓存,找到内存块,调至步骤5;
3)在ZendMM管理的heap层存储中搜索合适大小的内存块, 是在三种列表中小到大进行的,找到block后,调至步骤5;
4)步骤3未找到内存,则使用 ZEND_MM_STORAGE_ALLOC 申请新内存块 (至少为ZEND_MM_SEG_SIZE),进行步骤6

5)使用zend_mm_remove_from_free_list函数将已经使用block节点在zend_mm_free_block中移除;
6) 内存分配完毕,对zend_mm_heap结构中的各种标识型变量进行维护,包括large_free_buckets, peak,size等;
7) 返回分配的内存地址;

PHP内存管理器

内存的销毁

ZendMM在内存销毁的处理上采用与内存申请相同的策略,当程序unset一个变量或者是其他的释放行为时, ZendMM并不会直接立刻将内存交回给系统,而是只在自身维护的内存池中将其重新标识为可用, 按照内存的大小整理到上面所说的三种列表(small,large,free)之中,以备下次内存申请时使用。

ZendMM将内存块以整理收回到zend_mm_heap的方式,回收到内存池中。
程序使用的所有内存,将在进程结束时统一交还给系统。

垃圾回收

自动回收内存的过程叫垃圾收集。PHP提供了语言层的垃圾回收机制,让程序员不必过分关心程序内存分配。

PHP变量存储在一个zval容器里面的
1.变量类型 2. 变量值 3. is_ref 代表是否有地址引用 4. refcount 指向该值的变量数量

变量赋值的时候:is_ref为false, refcount为1

$a = 1;
xdebug_debug_zval('a');
echo PHP_EOL;//换行符,提高代码的源代码级可移植性

输出:

a:

(refcount=1, is_ref=0),

int

 1

将变量a的值赋给变量b,变量b不会立刻去在内存中存储值,而是先指向变量a的值,一直到变量a有任何操作的时候

$b = $a;
xdebug_debug_zval('a');
echo PHP_EOL;

输出:

a:

(refcount=2, is_ref=0),

int

 1
$c = &$a;
xdebug_debug_zval('a');
echo PHP_EOL;

xdebug_debug_zval('b');
echo PHP_EOL;

输出:

a:

(refcount=2, is_ref=1),

int

 1

b:

(refcount=1, is_ref=0),

int

 1

因为程序又操作了变量a,所以变量b会自己申请一块内存将值放进去。
所以变量a的zval容器中refcount会减1变为1,变量c指向a,所以refcount会加1变为2,is_ref变为true

垃圾回收
1.在5.2版本或之前版本,PHP会根据refcount值来判断是不是垃圾
如果refcount值为0,PHP会当做垃圾释放掉
这种回收机制有缺陷,对于环状引用的变量无法回收

PHP5.3之前
引用计数方式的内存动态管理。

PHP中所有的变量都是以zval变量的形式存在。

变量引用计数变为0时,PHP将在内存中销毁这个变量。只是这里的垃圾并不能称之为垃圾。并且PHP在一个生命周期结束后就会释放此进程/线程所占的内容,这种方式决定了PHP在前期不需要过多考虑内存的泄露问题。

PHP5.3的垃圾回收

引入垃圾收集机制的目的是为了打破引用计数中的循环引用,从而防止因为这个而产生的内存泄露。 垃圾收集机制基于PHP的动态内存管理而存在。PHP5.3为引入垃圾收集机制,在变量存储的基本结构上有一些变动.

struct _zval_struct {
  /* Variable information */ 
  zvalue_value value;/* value */ 
  zend_uint refcount__gc; 
  zend_uchar type;/* active type */ 
  zend_uchar is_ref__gc;
};

添加了 __gc 以用于新的垃圾回收机制。

PHP5.3中的垃圾回收算法——Concurrent Cycle Collection in Reference Counted Systems

PHP5.3的垃圾回收算法仍然以引用计数为基础,但是不再是使用简单计数作为回收准则,而是使用了一种同步回收算法,这个算法由IBM的工程师在论文Concurrent Cycle Collection in Reference Counted Systems中提出。
论文较复杂, 列出一些大体描述。
首先PHP会分配一个固定大小的“根缓冲区”,这个缓冲区用于存放固定数量的zval,这个数量默认是10,000,如果需要修改则需要修改源代码Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES然后重新编译。
由上文我们可以知道,一个zval如果有引用,要么被全局符号表中的符号引用,要么被其它表示复杂类型的zval中的符号引用。因此在zval中存在一些可能根(root)。这里我们暂且不讨论PHP是如何发现这些可能根的,这是个很复杂的问题,总之PHP有办法发现这些可能根zval并将它们投入根缓冲区。
当根缓冲区满额时,PHP就会执行垃圾回收,此回收算法如下:
1、对每个根缓冲区中的根zval按照深度优先遍历算法遍历所有能遍历到的zval,并将每个zval的refcount减1,同时为了避免对同一zval多次减1(因为可能不同的根能遍历到同一个zval),每次对某个zval减1后就对其标记为“已减”。
2、再次对每个缓冲区中的根zval深度优先遍历,如果某个zval的refcount不为0,则对其加1,否则保持其为0。
3、清空根缓冲区中的所有根(注意是把这些zval从缓冲区中清除而不是销毁它们),然后销毁所有refcount为0的zval,并收回其内存。
如果不能完全理解也没有关系,只需记住PHP5.3的垃圾回收算法有以下几点特性:
1、并不是每次refcount减少时都进入回收周期,只有根缓冲区满额后在开始垃圾回收。
2、可以解决循环引用问题。
3、可以总将内存泄露保持在一个阈值以下。
4、如果发现一个zval容器中的refcount在增加,说明不是垃圾
5、如果发现一个zval容器中的refcount在减少,如果减到了0,直接当做垃圾回收
6、如果发现一个zval容器中的refcount在减少,并没有减到0,PHP会把该值放到缓冲区,当做有可能是垃圾的怀疑对象
当缓冲区达到临界值,PHP会自动调用一个方法取遍历每一个值,如果发现是垃圾就清理

PHP5.2与PHP5.3垃圾回收算法的性能比较

PHP Manual中的相关章节:http://docs.php.net/manual/zh/features.gc.performance-considerations.php

首先是内存泄露试验,下面直接引用PHP Manual中的实验代码和试验结果图:


<?php

class Foo
{
   public $var = '3.1415962654';
}

$baseMemory = memory_get_usage();

for ( $i = 0; $i <= 100000; $i++ )
{
   $a = new Foo;
   $a->self = $a;
   if ( $i % 500 === 0 )
   {
       echo sprintf( '%8d: ', $i ), memory_get_usage() - $baseMemory, "\n";
   }
}

?>

gc-benchmark.png

可以看到在可能引发累积性内存泄露的场景下,PHP5.2发生持续累积性内存泄露,而PHP5.3则总能将内存泄露控制在一个阈值以下(与根缓冲区大小有关)。

与垃圾回收算法相关的PHP配置

1、可以通过修改php.ini中的zend.enable_gc来打开或关闭PHP的垃圾回收机制,也可以通过调用gc_enable()或gc_disable()打开或关闭PHP的垃圾回收机制。
2、在PHP5.3中即使关闭了垃圾回收机制,PHP仍然会记录可能根到根缓冲区,只是当根缓冲区满额时,PHP不会自动运行垃圾回收
3、当然,任何时候您都可以通过手工调用gc_collect_cycles()函数强制执行内存回收。

猜你喜欢

转载自blog.csdn.net/weixin_41380972/article/details/85694999