GAN作用——在我做安全的看来，就是做数据拟合、数据增强

from：https://www.zhihu.com/question/56171002/answer/155777359

GAN的作用，也就是为什么GAN会火了（有部分原因可能是因为Lecun的赞赏）。如果GAN只是用来生成一些像真是数据一样的数据的话，那不会有像现在这么火。更多的，或者对于机器学习研究员来说，看待的最关键一点应该是GAN可以用来 拟合数据分布 。什么叫拟合数据分布，就是给你一个训练数据，你能通过GAN这个工具，产生和这个数据分布相似的一些数据。有了拟合数据分布的思想，并在这上面做文章，才是一个真正的机器学习研究人员的素质。比如WGAN，也就是考虑到了GAN是一种拟合数据分布的工具，那么它可能和一些拟合数据分布的函数比如KL散度等是等价的，那么作者朝这个方向进行探索，自然能得出相应的结论，并且提出改进办法，使其成为风靡一时的工作。其实，可以做的工作还有很多，比如，既然你有一个产生类似数据的工具，那么其实你就有了一个做数据增强的工具，也就是对于你的神经网络来说，你有更多的训练数据了。很多人可能会觉得这个想法很简单，其实并不然。因为GAN本身用神经网络训练，如果你能把它融入你的一个任务当中，只用加一些损失函数，其实就能提高你任务上的性能，而且很多人还会觉得你性能好是因为加了神奇的损失函数，其实不过是用GAN做了一些隐式的数据增强吧了。但是你可以随便吹自己的模型是多么厉害，损失函数设计得多么有意义，多绕几下，别人也就忘了不就是GAN增强了数据嘛。因为GAN给各个任务开了一条提高性能的大门，那每把GAN用在一个任务上，就得引用GAN这篇论文，引用量上去了自然就火了。而且原始GAN是难训练或者效果差的，那么这些嗷嗷待哺的任务和相关研究人员自然也会更多关注GAN的发展，以期望在自己的任务上用到最新，最好的技术。所以，最近做提高和改进GAN的工作也取得了极大的关注度。那么再解释一下这个工作变火的本质：以前的神经网络存在生成困难的问题，GAN提供了解决办法，该方法简单、强大、适用性广。

GAN作用——在我做安全的看来，就是做数据拟合、数据增强

猜你喜欢