大模型出现可能会给无人驾驶系统的架构带来哪些改变

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第16天,点击查看活动详情

大模型

最近一些大模型,想到大模型大家可能会想到基于 transformer 的 GPT-3 这个拥有百亿参数的大模型,而且这样大模型已经突破了 NPL 和 CV 之间界限,让基于 transformer 模型也和基于基于卷积的模型在 CV 领域并驾齐驱。从而也就是改变 CV 范式

大模型会无人驾驶这领域上掀起多少风浪,大模型会不会颠覆现有自动驾驶的框架,带来一个真正意义的 end-to-end 的网络呢? 从现在来看应该还不会。不过大模型现在 Swin MAE 这样模型,具有很好学习能力、不容易饱和,具有很强泛化能力。所以这样模型才能在 CV 也好、NLP 也好都能够学习到很好特征。

主要帮助可能对感知长尾会有,但是对于模型范式方面不太会什么改变,大模型,这里大可能是

特斯拉

特斯拉基于大 backbone 然后不同头用于不同任务,这样多任务、多模态的模型,不过这样多任务模型,并不利于同时开发,特斯拉是在每一头上进行单独训练,对于 share 的 backbone 进行固定

大模型在后端上发挥

对于感知领域,进行 well-define 是一个比较标准的领域,有点类似大家参加数学考试,大家给出答案通常是可以达成共识的,因为题目比较明确。也称和规划是比较发散有点像语文考试,这个答案是发散,很难大家达成共识的,可能大家更注重主观体验,当然文章是优劣,不过评估起来就不那么容易,有点仁者见仁智者见智的感觉。这是所谓大模型,会在预测和控制

面对场景不断,可能开始只需要车道保持、AEB,场景不断扩展、自车行为,自车和他车如何互动,也就是自动驾驶的后端,后端预测和规划,可以使用 transformer。

可以带来相对统一框架

在 CV 和 NLP 的统一,在感知、后端预测都可以利用一个统一框架进行处理,

回答问题是大模型会改变当前

  • 长尾
  • 预测和控制
  • 统一框架

向后问题

  • 如何部署
  • 考虑算力

今天聊到大模型

GPT-3参数规模首次突破百亿,数据集上将语料规模扩大到570GB的CC数据集。这样

猜你喜欢

转载自juejin.im/post/7087158128302620703