一、对于LLM的两种期待

1. 成为专才，能够解决某一个特定任务。例如翻译，生成摘要

成为专才的好处: 专才在某一个任务上有机会赢过通才，例如目前chatGPT的文本翻译性能不如专门的谷歌或者腾讯的专门翻译模型

成为通才的好处：

只需要重新设计prompt就可以快速开发新功能，不用重新写程序

1.在模型基础上增加新的输出层(head)

2.然后采用参数微调Finetune方式进行训练, 需要标注好的数据

各种Adapter 在https:/adapterhub.ml/中可以查看。下图中为对Transformer中可以添加的几种Adapter示例

就是在推理时给模型一些示例作为输入，让大模型知道要完成的任务是什么样的

简单来说，就是模型在不更新自身参数的情况下，通过在模型输入中带入新任务的描述与少量的样本，就能让模型”学习”到新任务的特征，并且对新任务中的样本产生不错的预测效果。

注意：并不是在训练时候给出这样的示例，因为并没有根据这些示例对大模型参数进行更新（另一个角度理解没有对大模型参数进行更新：大模型预训练好之后参数不动了，但是要完成的任务很多，且任务是各式各样）

有一篇论文对in-context learning进行了研究

对输入示例语句其中的label（正面或者负面）进行了随机，表明输入时即使给的示例的label是错误的，模型的预测性能也没有降低太多。表明Label其实不重要？（但是另外一篇论文研究表明，示例label错误的比例越高，模型性能越低，并且模型参数量越大的话性能降低的越多，这样前面工作的结论可能是因为采用的模型比较小）
将输入示例语句其中第一个分隔符之前的语句替换为不同场景/任务的句子，模型性能降低很多，表明示例任务的相关性很重要
给出的示例的数量也不是越多越好，越多的话性能反而可能会降低。一般4个或者8个就够了。
推论：大模型本来就有做某种任务的能力（比如情感分析），只是需要被指出需要做的任务的种类（比如情感分析），而输入的示例语句就是起到这样的作用（唤起大模型的能力）。