用有监督的学习方法来学习无监督学习模型

下面我们讨论一种将“概率密度函数估计问题”转化为“有监督的函数逼近”的技巧。

g(\vec{x})为未知的、需要估计的概率密度函数,g_0(\vec{x})为指定用来作为“参考”的、已知的概率密度函数。设\vec{x}_1,\vec{x}_2,...,\vec{x}_N为从g(\vec{x})抽取的一个独立同分布的随机样本。我们也可以使用蒙特卡洛的方法从g_0(\vec{x})抽取一个样本量为N_0的独立同分布样本。将质量w=N_0/(N+N_0)分配给从g(\vec{x})抽取的样本,将质量w_0=N/(N+N_0)分配给从g_0(\vec{x})抽取的样本。(我觉得上述分配质量的操作无异于令N_0=N)。将上述两个样本混合,得到一个从概率密度(g(\vec{x})+g_0(\vec{x}))/2抽取的随机样本。

如果我们将标签Y=1Y=0分别赋给从g(\vec{x})和从g_0(\vec{x})抽取的样本,那么,条件概率函数

                                           \mu (\vec{x})=E(Y|\vec{x})=p(Y=1|\vec{x})=\frac{p(\vec{x}, Y=1)}{p(\vec{x})}\\=\frac{p(Y=1)p(\vec{x},Y=1)}{p(Y=0)p(\vec{x}|Y=0)+p(Y=1)p(\vec{x}|Y=1)}\\=\frac{w\frac{N}{N+N_0}g(\vec{x})}{w_0\frac{N_0}{N+N_0}g_0(\vec{x})+w\frac{N}{N+N_0}g_0(\vec{x})}=\frac{g(\vec{x})}{g(\vec{x})+g_0(\vec{x})}=\frac{g(\vec{x})/g_0(\vec{x})}{1+g(\vec{x})/g_0(\vec{x})}

可以使用(y_1,\vec{x}_1)(y_1,\vec{x}_1),(y_2,\vec{x}_2),...,(y_{N+N_0},\vec{x}_{N+N_0})作为训练样本,通过有监督学习来估计。条件概率函数的估计\hat{\mu}(\vec{x})可以用来估计g(\vec{x}),

                                                                               \hat{g}(\vec{x})=g_0(\vec{x})\frac{\hat{\mu}(\vec{x})}{1-\hat{\mu}(\vec{x})}

 

 

猜你喜欢

转载自blog.csdn.net/sunjianqiang12345/article/details/83040351