【网络流量】

网络流量就是网络上传输的数据量。网络流量的大小对网络架构设计具有重要意义，就像要根据来往车辆的多少和流向来设计道路的宽度和连接方式类似，根据网络流量进行网络的设计是十分必要的。

UV(独立访客)：即Unique Visitor,访问网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。就像要根据来往车辆的多少和流向来设计道路的宽度和连接方式一样，根据网络流量设计校园网络是十分必要的。

“80 /20”规则

在传统网络中，一般将使用相同应用程序的用户放到同一工作组中，他们经常使用的服务器也放在一起。工作组位于同一物理网段或VLAN（虚拟局域网）中。这样做的目的是将网络上客户机与服务器之间产生的数据流量限制在同一网段中。在同一网段，可以使用带宽相对高的交换机连接客户机和服务器，而不必使用带宽相对较低的路由器。将大部分网络流量控制在本地的这种网络设计模式，被称为“80/20规则”，即80%的网络流量是本地流量（采用交换机交换数据），在同一网段中传输；只有20%的网络流量才需要通过网络主干（路由器或三层交换机）。

“80/20”规则中的“80”和“20”不能简单地理解为数字，应该理解为网络流量分布的方式，即大部分网络流量局限在本地工作组，小部分流量通过网络主干。因此在实际网络设计中，只要大部分网络流量在本地、小部分网络流量通过主干，就认为它符合了“80/20”规则，而不管实际的数字比例是多少。

评价指标

流量分类的一个关键度量标准是某个分类技术或分类模型对未知数据对象进行分类的准确率。通常用于衡量分类准确率的评估标准，主要包括以下四个方面：

真正（true positive，TP）：表示被分类模型正确预测的正样本数，即属于类别A并被预测为类别A的样本数。

假负（false negative，FN）：表示被分类模型错误预测为负类的正样本数，即属于类别A但被预测为不属于类别A的样本数。

假正（false positive，FP）：表示被分类模型错误预测为正类的负样本数，即不属于类别A但被预测为属于类别A的样本数。

真负（true negative，TN）：表示被分类模型正确预测的负样本数，即不属于类别A并被预测为不属于类别A的样本数。

此外，基于机器学习的分类方法通常采用另外两种度量标准对其分类结果进行评估，其定义如下：召回率（recall）：recall=TP/(TP+FN)，表示类别A中被正确预测的样本所占比例。

精度（precision）：precision=TP/(TP+FP)，表示在所有被预测为类别A的样本中，真正属于类别A的样本所占比例。很多流量分类研究都使用流准确率或字节准确率作为其实验结果的度量标准，流准确率表示被正确分类的流所占的比例，而字节准确率则更关注被正确分类的流所携带的字节数。其中，准确率的定义如下：

准确率（accuracy）：accuracy=(TP+TN)/(TP+TN+FP+FN)，表示被分类模型正确预测的样本数在总样本中所占比例。

网络中的流量控制

增加用户可用资源的办法：合理地选择路径，让轻负载时非最佳的路径，在重负载时有较多的分流；重负载时增加分层连接分流的连接数目；增大通道的贷款；增加信息速率；适当增加缓冲区等。减少用户对资源需求的办法：拒绝某些服务请求；要求用户减少负载量；合理配备用户对资源的使用，如使用预约、轮询、假如优先级等。减少用户对资源的需求的办法，其实质是降低服务水平和质量，或合理进行服务。

在很多计算机网络中，广泛采用的流控方法是以减少用户需求为出发点的，下面是集中流控方法：

1、等待传输法。也称抑制发送方式，当接收结点的缓冲区已被占用很多，使结点进入死锁的危险阶段时，就向发送结点发出暂停发送的信息，当危险阶段解除时，再通知暂停发送的结点，恢复数据传送。

2、预约缓冲区方式。源主机在开始数据传送之前，首先要了解目的主机可用缓冲区的情况，并预约缓冲区，然后根据目的主机分配的缓冲区，控制自己的数据发送。在缓冲区用完时，等待对方再次分配缓冲区后方可继续发送。

3、许可证方式。

4、数据单元丢弃法

猜你喜欢