【机器学习】什么是监督学习、半监督学习、无监督学习、自监督学习以及弱监督学习

  • 监督学习(Supervised Learning):利用大量的标注数据来训练模型,模型最终学习到输入与输出标签之间的相关性。
  • 半监督学习(Semi- supervised Learning):利用少量有标签数据和大量无标签数据来训练模型。常用做法是先用有标签数据(较小规模的)训练一个Teacher模型,再用这个模型对无标签数据(较大规模的)预测伪标签,作为Student模型的训练数据;
  • 无监督学习(Unsupervised Learning):不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,如聚类、降维。
  • 自监督学习(Self- supervised Learning):利用代理任务(pretext task)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征, 如对比学习。
  • 弱监督(Weakly Supervised Learning):可以分为不完全监督(Incomplete supervision),不确切监督(Inexact supervision),不精确监督(Inaccurate supervision)。不完全监督是指,训练数据中只有一部分数据被给了标签,有一些数据是没有标签的;不确切监督是指,训练数据只给出了粗粒度标签。我们可以把输入想象成一个包,这个包里面有一些示例,我们只知道这个包的标签,Y或N,但是我们不知道每个示例的标签;不精确监督是指,给出的标签不总是正确的,比如本来应该是Y的标签被错误标记成了N。

注:其实现在很多论文里对自监督和无监督已经不做区分。

猜你喜欢

转载自blog.csdn.net/Roaddd/article/details/129537278