论文阅读五：基于软件定义网络的数据中心自适应多路径负载均衡算法

名词解释

Equal Cost Multi-Path, ECMP：等价多路径

Global First Fit, GFF：全局首次匹配

Dynamic Load Balancing, DLB：动态负载均衡

Flow Scheduling Cost based Congestion Control Routing Algorithm, FSC-CCRA：基于流调度代价的拥塞控制路由算法

Spider Monkey Optimization, SMO：蜘蛛猴优化算法

Load Balancing Algorithm based on SMO, SMO-LBA：基于蜘蛛猴优化的SDN自适应多路径负载均衡算法

Application Programming Interface, API：北向应用程序接口

Link Layer Discovery Protocol, LLDP：链路层发现协议

“摘要：针对传统多路径负载均衡算法无法有效地感知网络的运行状态、不能综合考虑链路的实时传输状态以及大多数算法缺少自适应性的问题，基于SDN的集中控制和全网管控思想，提出一种基于蜘蛛猴优化的SDN自适应多路径负载均衡算法（SMO-LBA）。首先，利用数据中心网络的感知能力来获取多路径的实时链路状态信息；然后，利用蜘蛛猴算法的全局探索和局部开采能力将链路空闲率作为每条路径的适应度值，并引入自适应权重对路径进行动态评估及更新；最后，寻找数据中心网络中链路占用率最小的路径，确定其为最优转发路径。选用胖树拓扑在Mininet平台上进行仿真实验，实验结果表明SMO-LBA可提高数据中心网络的吞吐量和平均链路利用率，实现网络自适应负载均衡。”

0 引言

传统的负载均衡采用等价多路径路由算法，将数据进行哈希计算，均衡在所有等价的路径上，把流量负载平均分配在每条链路，来实现网络数据转发，但算法缺少拥塞感知机制，为考虑网络实时状态。GFF算法获取网络中所有的链路信息，选取首次满足匹配条件的路径，实现简单但不能实现全局最优；模拟退火法用概率性搜索的方法，选择了全网最优的路径转发但放弃了网络收敛性。FSC-CCRA对数据流量区分大小流，根据定义流调度代价选取路径，但自适应动态选择路径的能力不足。

1 算法设计与实现

1.1 算法实现架构

信息收集模块主要用来收集数据中心网络中的实时状态信息，探测感知网络中各节点状态信息和各路径上的链路状态信息，获取数据中心完整网络拓扑结构，建立相关路径信息监测表；通过LLDP将相关信息封装在Packet_in/Packet_out消息中，在控制器和交换机之间通信。

网络管理模块周期性监测网内各参数信息，以实现自适应动态负载均衡；通过南向OpenFlow协议获取端口统计信息，周期性获得网络流量和各转发路径负载情况，不断更新管理路径信息监测表，包括流管理、节点管理和链路管理，计算各路径负载均衡度，一旦高于设定阈值，则调用自适应路由模块，根据实时参数对路径重新评估，选择合适路径转发来降低均衡度。

自适应路由模块综合来自信息收集模块和网络管理模块的信息，基于全网路径重新选路；采用SMO-LBA对多条路径进行评估，以链路利用率作为目标函数，从局部到全局的过程进行寻优，选取适应度值最高的路径作为目的转发路径，对负载均衡度不满足条件的路径重新择路。

流表下发模块根据自适应路由模块评估最佳目的转发路径，产生对应的路由转发策略，有Ryu控制器以流表的形式下发到各个交换机节点。

1.2 算法设计思想

SMO-LBA将各个网络节点作为蜘蛛猴种群寻优的食物源，将数据流通过链路到达各个节点的过程模拟成蜘蛛猴种群在寻找最优食物所经过的路径，获取每条链路负载信息和从每个网络节点出发所有链路的链路利用率，建立网内路径转发的路径信息监测表，进行周期性的维护更新。

根据建立的路径信息监测表，获取节点以及链路的信息，得到实时链路负载均衡度 $\small V$ :

$V=\frac{L_{p}/B_{m}}{C_{p}/B}$

其中 $\small L_{p}=Max\left \{ L_{ij} | \left ( i,j \right )\epsilon \ p\right \}$ ， $\small i$ 和 $\small j$ 用来表示路径上的节点位置， $\small p$ 是节点表示的路径集合， $\small L_{p}$ 表示当前转发路径的链路负载，把该路径上各节点间最大的负载作为链路负载； $\small B_{m}$ 是该条路径的实际带宽， $\small B_{m}=\sum_{i=1}^{n}B_{mi}$ ， $\small n$ 为当前转发路径的链路数目， $\small B_{mi}$ 表示每条转发路径的实时带宽情况； $\small C_{p}$ 是数据中心网络的所有数据流量，即所要处理的整体网络负载； $\small B$ 是建设时总的网络带宽，表示为 $\small B=N\times B_{MAX}$ ， $\small N$ 为总的传输链路条数， $\small B_{MAX}$ 为链路的最大传输带宽。文章假设满足触发条件的最大负载均衡阈值 $\small V_{th}$ 为75%。

SMO-LBA机制的原理：首先初始化网络中的数据流，将其分为多个小组来尽量减少竞争的压力，以提高寻优效率和寻找最佳转发路径；对于各小组，将寻优过程分为本地领导者阶段和全局领导者阶段，从局部到全局的顺序不断反馈更新器在组内的最优结果；最后全局领导者根据反馈结果更新至最优值，若结果未达到预先设定的阈值，则将组分为更小的组，重复执行上述步骤，直到找到最优的转发路径。

构造数量为 $\small N$ 的蜘蛛猴种群， $\small DF_{i}\left ( i=1,2,...,N \right )$ 是一个 $D$ 维变量，代表种群中的第 $\small i$ 只蜘蛛猴，即作为被优化问题的潜在解，对其进行初始化：

$DF_{ij}=DF_{min \_ j}+U\left ( 0,1 \right )\times \left (DF_{max \_ j}-DF_{min \_ j} \right )$

其中 $\small DF_{ij}$ 是第 $i$ 只蜘蛛猴的第 $j$ 维分量； $DF_{min \_ j}$ 和 $DF_{max \_ j}$ 是第 $j$ 维上的边界； $U\left ( 0,1 \right )$ 是 $\left [ 0,1 \right ]$ 上的随机数。

在本地领导者阶段，每个 $DF$ 根据本地领导者和小组信息更新在网络中的节点位置，计算新节点位置相应的适应度值 $Fit\left ( DF_{i} \right )$ ：

$Fit\left ( DF_{i} \right )=\frac{1}{1+f\left ( DF_{i} \right )};f\left ( DF_{i} \right )\geqslant 0$

其中 $\small f\left ( DF_{i} \right )$ 表示当前路径的链路利用率，值越小说明此路径的占用程度越小，更易被选择为解决负载问题需要的转发路径，计算出的适应度相应变高，在位置更新过程中，新位置的适应度值高于原位置，则更新位置。

引入基于目标函数的动态自适应惯性权重为 $\small w$ ，由 $\small w$ 表示在每次更新中，新位置对于原位置信息继承的程度，通常取0到1之间的常数。文章将链路利用率作为目标函数引入自适应惯性权重中，即把优化问题与蜘蛛猴个体的适应度建立映射关系，当随着各负载链路情况发生变化，其所对应的适应度也相应变化。首先计算 $\small \lambda \left ( k \right )$ ：

$\lambda \left ( k \right )=\frac{1}{N}\sum_{i=1}^{N}\left ( f\left ( DF_{i} \left ( k \right )\right ) -f\left ( DF_{best\left ( k \right )} \right )\right )^{2}$

$\left\{\begin{matrix} \begin{array}{lr} f \left ( DF_{i}\left ( k \right ) \right )=f\left ( df_{i,1} \left ( k \right ), df_{i,2} \left ( k \right ),...,df_{i,D} \left ( k \right ) \right ) \\ \\ f\left ( DF_{best}\left ( k \right )\right ) =minf\left ( DF_{i}\left ( k \right ) \right ) \end{array} \end{matrix}\right.$

其中 $\small k\left ( k=1,2,... \right )$ 为更新次数； $\small f\left ( DF_{i} \left ( k \right )\right )$ 为第 $\small i\left ( i=1,2,...,N \right )$ 只猴子第 $\small k$ 次更新相应位置的目标函数值； $\small f\left ( DF_{best} \left ( k \right )\right )$ 为第 $\small k$ 次更新的最优蜘蛛猴相应的目标函数值。根据 $\small \lambda \left ( k \right )$ 得到对应的 $\small w$ ：

$w=exp\left ( -\lambda \left ( k \right )/\lambda \left ( k-1 \right ) \right )$

此处当 $\small k=1$ 时，取 $\small \lambda \left ( 0 \right )=0.9$ ， $\small \lambda \left ( k \right )$ 用来衡量惯性权重 $\small w$ 变化的平滑程度。

本地领导者阶段的位置更新公式为：

$DF_{new \_ ij}=w *DF_{ij}+U\left ( 0,1 \right )\times \left ( LL_{lj}-DF_{ij} \right )+U\left ( -1,1 \right )\times \left ( DF_{rj}-DF_{ij} \right )$