【学习】life long learning

企业开发 2023-07-12 06:33:23 阅读次数: 0

文章目录

life long learning
- LLL的难点
- 评估
二、LLL的三个解法

life long learning

在这里插入图片描述
希望机器能一直学习。
模型上线之后取得反馈，进而更新参数。

LLL的难点

在这里插入图片描述
先学任务1再学任务2，就会忘记1。如果是一起训练就会得到很好的结果。

QA：给定一份文件，根据文件回答问题。

依次一个一个任务学，学新的任务就会忘记旧的任务。
可以学多个任务，也有些得到很好的结果。
在这里插入图片描述
灾难性遗忘

如果想要机器记住所有的东西，那就要学习所有的数据，存储的资料和训练的时间就非常大。

多任务训练可以认为是LLL的上限。
我们希望机器在一个模型里面学会多个任务而不遗忘之前学习的任务。
在这里插入图片描述
LLL跟transfer learning很像，但是transfer learning关注的是新任务上的准确率，不关注旧任务。

在这里插入图片描述

评估

在这里插入图片描述

二、LLL的三个解法

1、Selective Synaptic Plasticity选择性突触可塑性

让神经元的某些连结具有可塑性，有些是要固化的。
在这里插入图片描述

为什么会有灾难性遗忘呢？

越蓝loss越低，越白loss越高。
下面的做法会遗忘任务1，那有没有可能让他限制θ往右移？
在这里插入图片描述
基本思想:模型中的一些参数对前面的任务很重要。只改变不重要的参数。θb是从前面的任务中学习到的模型。加入守卫bi，改写我们的loss方程。我们加入之前的参数和现在的参数的差值平方项求和，希望他们越接近越好，但是不是所有的参数维度都是越接近越好，所以引入bi。
在这里插入图片描述
bi=0,灾难性遗忘，相当于没有设置这一项。bi很大，相当于前后的参数很像，就没办法在后面的任务上学好。

怎么看那些参数更重要？

在这里插入图片描述

bi可以算

GEM

在这里插入图片描述

2、Additional Neural Resource Allocation额外的神经资源分配

额外训练别的模型，实验之前的模型的参数
在这里插入图片描述
并没有完全解决这个问题！

packNet&CPG

packNet使用比较大的网络，分别在不同的任务用不同的参数。
在这里插入图片描述

3、memory reply

使用先前任务的生成模型生成伪数据。
在这里插入图片描述
多任务分类器的类别数量不同：

Curriculum Learning

调换任务学习的顺序结果会不同。 Curriculum Learning是研究任务顺序的方法。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Raphael9900/article/details/128613724

【学习】life long learning

Life Long Learning

李宏毅机器学习之Life Long Learning

连续学习入门（一）：Continual Learning / Incremental Learning / Life Long Learning 问题背景及研究挑战

李宏毅ML+DL学习记录：life long learning

“Life Long Learning”（终身学习）和“灾难性遗忘”（catastrophic forgetting）

Life Long Learning论文初探————Online Fast Adaptation and Knowledge Accumulation（OSAKA）

No need to worry in the rest of long life

long long n（学习笔记）

【英语学习】【Daily English】U15 Culture L01 You'll be used to life here before long

论文《Learning regression and verification networks for long-term visual tracking》

C++学习——int、long、long long, double, long double等的占用空间及取值范围

Meaning of life :Do not wait too long and miss the opportunity

Long

long()

A Deep Learning-Based Remaining Useful Life Prediction Approach for Bearings 基于深度学习的轴承剩余寿命预测

什么是#define int long long 与signed main（）（学习笔记）。

C++ primer 学习之路（1） 3.13short,int,long,long long

long long

论文翻译：Unsupervised Representation Learning with Long-Term Dynamics for Skeleton Based Action Recognit

Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group Recommendation

【读论文】SwinFusion: Cross-domain Long-range Learning for General Image Fusion via Swin Transformer

ScalableMap：Scalable Map Learning for Online Long-Range Vectorized HD Map Construction

int /long / long long

【Machine learning】集成学习（ensemble learning）

Towards Life-Long Autonomy of Mobile Robots Through Feature-Based Change Detection

学习排序（Learning to Rank）

Metric Learning——度量学习

学习率Learning rate

集成学习（ensemble Learning）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)