半监督学习思路整理
一、半监督学习思路semi-supervised learning(SSL)
需要明确的知识点:
1、首先确定训练集中包含两种数据:labeled和unlabeled。
2、我们最终目的是得到一个分类器,即网络模型。
3、训练结束的条件可以是将无标签数据作为网络的输入,得到输出的预测标签,在一定置信度之内的数据可以划分到有标签数据中,直到训练集中的数据都有了标签,此时可以认为分类器就是最终分类器。
步骤:
- 通过初始有标签的数据训练网络得到一个初始网络模型f。
- 使用初始网络模型f对无标签数据x预测得到预测标签y,在一定置信度内认为该预测标签正确。
- 将认为正确的预测标签的数据(x,y)从训练集中的无标签数据中移除到有标签数据中。
- 使用新得到的数据集重新训练网络,直到满足条件为止。
最终得到的网络模型即为最终的网络模型。