MUNN:Mutation Analysis of neural networks论文阅读

时间:20180912

数据集:MNIST

首先,该文章针对的是神经网络的测试问题,其目的,我认为

一是得到覆盖率高的测试集,即(test adequacy)

二是,由于mutation analysis 的特性,能够帮助我们理解神经网络。

We believe that mutation analysis can not only be used to measure test adequacy, but also be used to understand neural network operation.
这是文章摘要的最后两句

其次,由题可知,其文章对象是mutation analysis和neural networks双方,至于两者的分别是如何的,我不做赘述,这里我仅分享mutation analysis的博客,点这里。其隶属于白盒测试中的一种,由于我本身对软件测试这块仍然一知半解,不在这里误人子弟,仅阐述对文章的理解。

第三,文章作者书写这篇文章的缘由是由于,我的观点是,神经网络在对待数据时,一部分数据留作train,另外一部分数据留作test,选择数据时,操作者具有较大的主观性,在周志华老师的机器学习(西瓜书中),其书写到,评估(test)方法,有留出法、交叉检验法、自助法等,其目的不外乎时希望测试集能够尽可能的覆盖测序的各个方面,然而这些方法,大多基于操作者本身的经验,亦或者是,单纯留出一部分数据来。当然也可以考虑使用统计学相关知识对预留数据进行筛选准备。这就是目的一的解释。

第四,文章在解决问题的过程中,其遇到了两个问题,

一、突变时如何影响神经网络的

二、神经网络的深度将对突变造成什么样的影响

针对第一个问题,由于,相对于传统的突变分析(mutation analysis),我认为文章将突变算子的概念扩充化,引申为影响目标结果变化的因素,在传统突变分析中,是代码片段,在神经网络中,其主要是 the input dimension(输入数据), the connection weight(权重), the bias(偏差), the activation function(激活函数), the structure of the neural network(网络结构,主要是层数),所以他对这五项进行了突变

对这五项分别针对两个模型(未实现,待定)

模型A:三层的全连接网络0.9803

模型B:三个卷积层和未知层数的全连接层,测试准确率为0.9877

操作一:MNIst数据集其输入为28*28的tensor,这边依次删除其数据,论文中说明删除一维数据对整体无大影响。接下来,作者讨论手写数字间的交叉问题,得出,神经网络的突变分析具有很强的区域性质,给出的建议,,是可以在今后的神经玩过学习中用来定位学习。

后图像五表明,仅删除5个及以下的输入,并不会带来较大影响

操作二: 改变激活函数。

relu函数转变成tanh比转变成sigmoid要小。其结果差距在原函数间的差别

后面不多讲

最后建议:设计依赖与领域的变异算子。神经网络的深度对变异分析的影响很大,设计依赖于,深度的突变算子。

猜你喜欢

转载自blog.csdn.net/weixin_40085833/article/details/82663405