从one-shot问题的解法发现新的deep learning应用思路

编程语言 2018-10-12 17:50:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/ybdesire/article/details/82974392

摘要

本文讲述了什么是one-shot问题，以及one-shot问题的解决方案。并从这种解决问题的思路中得到启发，得到了一种deep learning的新的应用思路。

one-shot问题

在我们训练有监督学习模型时，为了让模型“见多识广”，我们会在构建训练集时，注重每个类别样本数的平衡。

但大家有没有想过另一种情况，加入我们做你公司员工的人脸识别系统，每个员工只会给你一张图片吧，每个样本一张图片，通常是没法训练机器学习模型来解决分类问题的。还有你公司的员工经常变动，有新人加入或老员工离职，我们都要重新训练一次模型。

所谓的one-shot问题，就是指这种情况，对每一个类别，只提供一个或少量训练样本，且样本又有变动性。

怎么样才能做到对小样本也能适应，样本的训练集变化也不需要重新训练模型呢？

如何解决

传统的分类问题，Y值的label标注，都是用类别标号进行标注（或者one-hot编码）。这样我们学习得到的模型，就是分类模型，能直接通过softmax给出类别标号。

要解决one-shot问题，就不能让模型学习直接分类了，因为每一个类别只有一个样本，是无法通过学习得到好模型的。

让模型学习（得到）一个similarity函数，就是解决one-shot问题的方案。这样的模型，输出的值不是类别，而是给定（输入）两幅图像的相似度。

这样就能解决刚刚提高的人脸识别中的两个问题：

每个员工只给你一张图片，但你用两两配对作为模型输入时，每张图片都能被模型学习多次
有新员工入职或老员工离职，也不需要重新训练模型，因为模型是做相似度输出，并不涉及具体的label

新思路

解决分类问题，不让模型直接学习分类（直接输出类别标注），而是让模型学习相似度函数，就解决了deep learning量大难题：样本少；训练集样本变动（减少、增加某些新的label）导致模型必须重新训练。

参考

andrew ng “CNN deep learning” chapter-04

猜你喜欢

转载自blog.csdn.net/ybdesire/article/details/82974392

从one-shot问题的解法发现新的deep learning应用思路

Few-Shot/One-Shot Learning

one-shot系列：review of Matching Networks for One Shot Learning

什么是One-shot Learning 、Zero-shot Learning？

One-Shot Visual Imitation Learning via Meta-Learning

Zero-shot Learning / One-shot Learning / Few-shot Learning

One-shot Learing/Few-shot Learning、Zero Shot Learning详解

Zero-shot One-shot Few-shot learning 算法

Zero-Shot, One-Shot, and Few-Shot Learning概念介绍

Continuous Relaxation of Symbolic Planner for One-Shot Imitation Learning: 利用符号规划问题的单样本模仿学习

One-Shot Imitation from Observing Humans via Domain-Adaptive Meta-Learning

吴恩达deeplearning之CNN—人脸识别与风格化转换 one-shot learning

Omniglot data set for one-shot learning（单样本学习数据集）

Learning feed-forward one-shot learners 论文笔记

代码笔记《Variational Prototyping-Encoder: One-Shot Learning with Prototypical Images》

One-shot就能做事件抽取？ChatGPT在信息抽取上的强大应用

Deep Learning 应用

GAN one-shot

【One Shot】《Matching Networks for One Shot Learning》

[DeeplearningAI笔记]卷积神经网络4.1-4.5 人脸识别/one-shot learning/Siamase网络/Triplet损失/将面部识别转化为二分类问题

One Shot Learning with Siamese Networks

Matching Networks for One Shot Learning

论文阅读笔记（十二）【CVPR2018】：Exploit the Unknown Gradually: One-Shot Video-Based Person Re-Identiﬁcation by Stepwise Learning

Searching with Deep Learning 深度学习的搜索应用

深度学习的搜索应用Searching with Deep Learning

zero-shot, one-shot和few-shot

face recognition&&one-shot learning

【One Shot】《Siamese Neural Networks for One-shot Image Recognition》

(one-shot detection)Review: Comparison Network for one-shot Conditional object detection

（转）Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)