在实际探索的过程中,实践者可能会苦于寻找适合自己应用的 AI 模型:是选择 LLM 还是微调模型?如果用 LLM,又该选择哪一种?
近日,来自亚马逊、德州农工大学、莱斯大学等机构的学者对 ChatGPT 等语言模型的发展历程进行了一番讨论,其文章也得到了 Yann LeCun 的转推。
论文:https://arxiv.org/abs/2304.13712
相关资源:https://github.com/Mooler0410/LLMsPracticalGuide
本文将从实际应用角度出发,探讨适用 LLM 的任务以及在选择模型时需要考虑的模型、数据和任务等方面实际问题。
1 引言
近年来,发展迅猛的大型语言模型(LLM)已然引发了自然语言处理(NLP)领域的革命。这些模型非常强大,有