人脸识别与Disentangled Representation

disentangled representation

disentangled representation相关的研究已经逐渐变得热门。那么对于disentangled representation,究竟怎么解释呢?

Bengio et al.说得是:

A disentangled representation should separate the distinct, informative factors of variations in the data.
Single latent units are sensitive to changes in single generative factors, while being relatively invariant to changes in other factors

有时候可能很难理解,但是我们结合人脸识别得例子来理解,就很简单很好理解了。人脸识别,最后我们都是拿到一串特征向量。我们也不知道向量里面得每一个元素究竟是管什么得,但是有了这个disentangled representation,我们就可以清晰得知道向量里面每一个元素控制得是什么属性,譬如说眼睛大小,性别,双眼皮还是单眼皮。

disentangled representation反映问题本身的一些内在结构,例如如果一个问题中我们认为应该有一个disentangled representation表示司机在时空位置上的价值(如未来一段时间的收入),那么这个disentangled representation的表示对于输入的时空位置应该是基本连续的。

所以,disentangled representation具有很好得可解释性。我们通过disentangled representation,可以修改某一个元

猜你喜欢

转载自blog.csdn.net/MrCharles/article/details/108192946