A Blockchain-Driven IIoT Traffic Classification Service for Edge Computing 论文学习

A Blockchain-Driven IIoT Traffic Classification Service for Edge Computing

IEEE INTERNET OF THINGS JOURNAL,2021

Summary

为了实现边缘计算范式下的工业物联网流分类而提出了一个区块链驱动的服务框架。提出了一种用于高效和可扩展的流分类的扩展哈希方法。提出了一种基于投票的共识算法用于跨边缘节点进行基于扩展哈希的流分类所需的BCT集和哈希表的同步和更新。

Research Objective(s)

设计了一种更适用于边缘计算范例的轻量级IIoT流量分类服务。

Background / Problem Statement

如今,越来越多的传感器、设备和应用程序在工业物联网(IIoT)中相互连接,产生了大量的实时流,需要对这些流进行调度,以保证服务质量。要实现应用感知和自适应的流调度,首先必须解决流分类问题。将边缘计算范式引入工业物联网,可以将流分类业务部署在近端边缘节点上。目前,基于深度学习的工业物联网流分类方法表现出较好的性能,但深度学习模型的计算成本过高,无法部署在边缘节点上。此外,新设备和新兴工业app产生的未知流量越来越多,导致流量分类器频繁训练。将复杂的分类器训练过程从云服务器迁移到资源有限的边缘节点是很困难的。针对这些问题,我们利用区块链中哈希机制和共识机制的优点,设计了一种更适用于边缘计算范例的轻量级IIoT流分类服务。

在边缘节点上部署流分类服务,实现高效的流识别。工业物联网流量分类的研究成果表明,基于深度学习的分类方法具有较高的分类精度。但是,在现有的工作中忽略了以下两个问题:

  1. 虽然在边缘计算范式中可以使用一些深度学习模型,但基于深度学习的流分类的性能不可避免地会受到边缘节点有限资源(如CPU和内存)的约束。因此,我们需要一个低资源消耗、高效率和可扩展性的IIoT流分类解决方案,更多地应用于边缘计算。
  2. 越来越多的新兴智能设备和工业app产生了越来越多的未知流量,导致流量分类器频繁训练。大规模流样本的分类器训练通常消耗大量资源,耗时过长。在边缘节点上不可能完成训练过程。因此,我们需要一种训练成本最低的自适应流分类解决方案,它可以运行在边缘节点上。

为了解决以上两个问题,需要在边缘计算场景下设计一个轻量级的IIoT流分类服务。在本文中,我们借用区块链的思想来实现这一目标。区块链作为去中心化公共数字账本系统的底层技术,不仅局限于电子支付系统,而且广泛应用于众多分布式系统中。

Method(s)

首先,受区块链中的哈希机制和大数据哈希学习的启发,我们提出了一种新的学习哈希方法,称为扩展哈希。通过该方法,我们可以构建二进制编码树集(BCT集),然后生成哈希表,无需复杂的分类器训练,就可以实现更高效的基于k近邻的分类。
在扩展哈希方法中,首先需要构建二进制编码树集(BCT集),用于流特征编码。然后,我们可以构建由哈希码和标签组成的哈希表,用于基于knn的分类。在这里,哈希表不仅仅是区块链中的概念,它也受到了学习大数据哈希的启发。对比传统哈希:取消了降维操作;使用加权汉明距离防止knn中的排序混乱。
然后,我们设计了一种新的基于投票的共识算法 ,在边缘节点上同步BCT集和哈希表,从而提供流分类服务。最后,我们进行数据驱动的模拟来评估提议的服务。通过对比公共数据集上的流分类结果,我们可以看到所提出的服务以最小的时间开销和内存占用达到了最高的分类精度。
基于扩展哈希的流量分类过程可以分为两个阶段,即扩展哈希表的构建和使用扩展哈希码的KNN分类:基于所有流动样本的d维特征向量构建CT集;根据集合中的d个bct将每个特征向量编码为哈希码;得到一个由所有流样本的哈希码和标签组成的哈希表。之后,基于BCT集将未知流的特征向量编码为哈希码。

区块链驱动的实现跨边缘节点的工业物联网流分类的服务框架:
在这里插入图片描述

  1. 网关或SDN控制器在提取每个待分类流的特征时,在近端调用边缘服务器的流分类服务,从而对流进行区分,实现有效的应用感知调度或流量工程。
  2. 为了在边缘节点上实现基于扩展哈希的流分类服务,我们可以部署一个改进的区块链系统来跨分布式边缘节点管理BCT集和哈希表。
  3. 当流分类业务运行时,使用BCT集和哈希表分别进行编码和基于knn的分类。
  4. 假设每个边缘节点都是远程云服务验证过的对等点,从而构造受许可的区块链来管理哈希表和它们上的BCT集。

Evaluation

数据集:Andrew W. Moore的数据集(一个标记了互联网流量的公共数据集)
在仿真中,重点研究了流分类方法的精度、时间成本和内存成本。
由于工业物联网系统中的边缘节点通常是一个便携式服务器或资源有限的小型服务器,本文在一台通用的Mac mini PC上进行了模拟,该PC具有3 ghz的英特尔酷睿i7 CPU和16 gb的DDR3内存。

将基于扩展哈希的方法与其他三种代表性方法进行比较:
在这里插入图片描述
当特征向量编码为33-b哈希码(特征向量的每维对应3b)时,EHANN+FCBF的准确率最好(将学习哈希的思想引入到流分类中可行)。

k值对流分类性能的影响:
在这里插入图片描述
k值对流分类性能的影响很小。当使用比特数较多的哈希码时,可以提高流分类的准确率(扩展哈希合理)。但是随着哈希码长度的增加,准确性的增加不能持续。

不同流量分类方法的时间成本:
在这里插入图片描述
无论是否采用特征选择方法(FCBF), ITQ-ANN和EH-ANN的时间成本都明显小于NN。

Conclusion

为了实现边缘计算范式下的工业物联网流分类,本文提出了一个区块链驱动的服务框架。首先,受哈希机制的启发,我们借鉴了学习哈希的思想,提出了一种用于高效和可扩展的流分类的扩展哈希方法。然后,受共识机制的启发,我们提出了一种基于投票的共识算法,用于跨边缘节点进行基于扩展哈希的流分类所需的BCT集和哈希表的同步和更新。最后,大量的数据驱动仿真表明,我们可以充分利用扩展哈希,以最小的时间成本和内存使用实现最高的分类精度。因此,我们可以在边缘计算场景下实现一种适应性强、资源消耗低、效率高的轻量级工业物联网流分类业务。

Notes

References

猜你喜欢

转载自blog.csdn.net/Mr__666/article/details/127864251
今日推荐