车载全息数字人:AI+Agent新场景,全息投影新方向

今天分享的AI系列深度研究报告:《车载全息数字人:AI+Agent新场景,全息投影新方向》。

(报告出品方:国盛证券)

报告共计:13页

AGI 的快速进步一直是市场关注的焦点,今年以来维持着较高的市场人气,从算力、游戏、营销到医疗、教育等,市场一直在期待新的应用突破点。我们观察到,随着造车新势力销量逐月走高;高通发布最新骁龙8 Gen 3、骁龙 X Elite,边缘侧算力再创新高、数字人+AI 优化成熟,车载 AI 全息数字人有望成为“人一车一家”三屏融合中的重要一环

1.车载全息数字人: AI Agent 新场景、人车交互新体验

栩栩如生的智能座舱数字人,有望为驾驶者带来“人人交互”的体验。早先在蔚来汽车上搭载的 NOMI 机器人一度成为蔚来品牌的当家卖点,NOMI 百变的表情和花样繁多的装饰周边让 NOMI 机器人成功“出圈”。我们认为,具有高度亲和力、智能水平足够高、能帮助驾驶者完成或简单(如接电话、播放音乐)或复杂(如导航、生活助理、汽车保养)的任务,是定义一个智能座舱数字人的核心要点。

未来的人机交互不会停留于冰冷的屏幕和音响。传统的人车交互使用中控屏幕作为介质,蔚来的 NOMI 将智能助手具象化成一个机器人像,若再进行更深的具象化展现,数字人无疑是最佳路线。以棱镜全息的数字人交互平台为例,其基于云端及本地动态行为数据库,根据不同场景驱动虚拟人形象,扩展虚拟人的使用场景及价值。同时提供基于数字资产的海量周边素材,支持数字虚拟人个性化形象选择、装扮搭配等,打造用户专属的智能虚拟伴侣。

当下,智能座舱数字人因何而被催化?我们认为,生成式 AI 的爆发给予智能座舱数字人“灵魂”,全息 HUD 和高算力智能模组给数字人添加“骨肉”,而座舱智能化时代,数字人被给子更多的施展能力的空间。

1.1 AIGC:数字人的“点睛之笔”

随着近两年 AIGC 生成算法和自然语言模型的发展,AIGC 已被广泛应用在文字、图像.音频、游戏和代码的生成当中,输出的内容完成度较高,已经能被广泛应用于商业化中。目前主流的 2D 仿真数字人主要通过图片或照片完成皮套后,叠加口型和少量动作后结合情感分析和决策机制来呈现,在这一过程中,AIGC 技术对于数字人的生成有以下的帮助:

⚫ 提高了内容创作的效率和便捷性,降低了成本和门槛。

⚫ 丰富了内容创作的多样性和个性化,满足了用户的不同需求和喜好。

目前,数字人的各种人设和行为皆是团队编辑好的剧本,用户在台前看到的数字人都只是背后运营团队的产出。例如哗哩哗哩上的许多数字人 UP 主,“皮套”的背后还是真人在进行配音和互动。去年双十一开始,我们也注意到了有很多淘宝品牌旗舰店用到了数字人主播来进行带货。虽然这些数字人带货主播是 AI 合成,在动作、嘴型上已无违和感,可以实现 7*24 小时直播并智能生成播报视频流内容,但互动体验仍较为初级。

2022年11月,ChatGPT 一上线就迅速成为了 AI 界的“当红炸子鸡”,2月内用户突破1 亿,成为历史上用户增长第二快的应用。这主要得益于其强大的语言生成能力和多样的应用场景。ChatGPT 不仅能回答各种问题,还能写剧本、写小说、写说明书,甚至给代码纠错,并且在这过程中,它表现出了非常高的“情商”,能进行多轮对话,回复丝滑流畅。

2023年3月2日,OpenAI 宣布开放 ChatGPT和 whisper 的 API接口。ChatGPT API是一个用于开发者的语言模型接口,它可以让开发者使用 GPT 3.5 Turbo 模型来生成自然的对话和文本,ChatGPT API 的优势是它有持续的模型改进,低廉的价格,和可选的专用容量。

Whisper API 是一个用于开发者的语音识别接口,它可以让用户将语音转换为文本。它使用了一个深度神经网络模型,训练在大量的语音数据上,以达到高准确度。Whisper API可以识别多种格式的音频文件,包括 mp3,mp4,mpeg,mpga,m4a,wav或 webm。Whisper API 的优势是它有极高的速度,方便的按需访问,和合理的价格。这一举措将使得数字人的交互体验向前推进一大步。

垂直领城大模型正在向汽车渗透。今年 7 月 31日,吉利汽车集团在内部经营工作大会上透露,吉利将于下半年发布“行业首个全栈自研的全场景 AI 大模型”,首款 AI 智能电混家轿“吉利银河 L6”也于9 月上市。银河 L6 所搭载的 AI车外语音交互技术,可支持车外距离 1.5 米内,通过语音指令控制车窗、空调、后备箱的开启和关闭,以及自定义趣味语音包和词库,构建车内外无障碍沟通的全新社交场景。新车还将首发吉利地图导航,支持红绿灯倒计时读秒,甚至车内的香氛系统,也可以根据不同场景智能识别释放我们认为,在愈发激烈的市场竞争中,AI将是车厂升级智能化、做出差异化的不二选择,2024 年汽车垂类 AI 应用有望爆发。

1.2 HUD 硬件、边缘计算硬件成熟,数字人拥有“骨肉”

汽车驾驶座舱硬件发展史,就是消费电子产品发展的缩影,从硬件驱动到应用驱动,从本地基础娱乐、导航,到人车物的智能互联,我们将汽车座舱分为 4个发展阶段。

1)按钮时代。1924 年,雪佛兰生产出第一辆配备收音机的汽车,1941 年,凯迪拉克推出配置电动车窗的 75系列,1960 年代,福特和摩托罗拉将磁带机“搬进”汽车;

2)屏幕时代。本世纪初,随着液晶屏募应用,可显示内容成为座舱发展的重要一步:随后软件应用开始蓬勃发展,支持凯立德导航的中控车机成为一时的热门改装方案;是否支持苹果 Carplay、百度 Carlife 是消费者选购车型时的重要考量因素;

3)屏幕互联时代。车机应用进一步发展,车联网(V2X) 概念兴起,自动驾驶与智能座舱开始祸合,依靠车载芯片算力的独立车机系统出现;

4)大屏多屏时代。生成式 AI 进一步赋能人车交互,点亮了车机的灵魂;屏幕更多、尺寸更大,人车交互密度进一步加大; L2、L3 高阶自动驾驶方案日趋成熟,自动驾驶与智能座舱进行深度祸合,“智驾”概念越来越近。

二维的触摸屏幕交互潜力正在被开发殆尽,产品设计者开始考虑三维层面的人车交互.这里必须提到两个重要部件:

1)抬头显示器(HeadUpDisplay,HUD)。HUD 原本用在战斗机上,以提升飞行员的驾驶效率,飞行员不必频繁低头看仪表就能获得飞行数据,也便于飞行员进行瞄准操作, 这一产品逻辑平移到汽车,便成为了替代传统仪表盘的一种新鲜工具,驾驶者不必低头, 从视野前方就可以查看车速及导航信息,极大提升驾驶体验。

全息空中显示(AerialHoloDisplay,AID)通过图像单元生成的信息(数字人、行车信息、 导航等)由离轴反射系统经过风挡(也可不经风挡)投射于驾驶员前方。AID 利用微结 构光场重构技术,把物体离散成高分辨率的空间光斑点阵,通过光的衍射传播、干涉叠加及光场的复振幅调控,将离散的光斑点阵无损地重构在空气中,无需任何介质的散射, 即可观测到高保真度的图像,从而实现无介质成像。AID 技术的成熟,更是为数字人三 维交互提供了优质条件。

2)边缘算力模组。AI 飞轮发展滚滚向前,从今年初 GPT-3.5 惊艳世界,到 5 月 14 日 OpenAI 正式开启插件功能,我们见证了云端大模型的快速迭代与演化。当前时点,AI 大模型已经站在了从“玩具”向“工具”快速演化的关键迭代期。如何让大模型渗透进 入各类垂直场景,如何更低成本的使用大模型,如何让更多场景与用户接触 AI,成为了 发展的下一个重点。在 AI 向实际场景落地时,边缘算力的重要性加速凸显,边缘算力在 成本、时延、隐私上具有天然优势,也可以作为桥梁,预处理海量复杂需求,并将其导 向大模型。边缘算力作为 AI 触及万千场景的血管地位加速明晰。之前,边缘侧设备以部 署通信能力为主,当下,在以高通为代表的边缘巨头推动下,算力、AI 能力等边缘基建 正在加速推动,同时三大运营商的算力网络与边缘资源池体系,也为我国算力梯度分布 奠定了雏形。展望未来,边缘算力将始于 AI 带来的需求提升,同时也将赋能应用,连接 更多用户,加速 AI 发展与迭代。

1.3 自动驾驶越高阶,人车交互越重要

自动驾驶等级划分,目前被国内外广为接受的是 SAE(国际汽车工程学会)分级,从 Level-0~Level-5 总计 6 个级别,Level-0 为最低级别,Level-5 为最高级别。如下图,从 无自动化,到“解放双脚”,“解放双手”,“解放双眼”,“解放大脑”,最终达到完全的“无驾驶员”化。

我们认为,越是高阶的自动驾驶,就越是需要频繁、稳定、高效的人车交互。在 LO-L2时代,由于自动驾驶只能完成一些基本的驾驶任务,如车道保持、自适应巡航,因此驾驶员需要时刻关注交通状况,并无太多精力关注人车交互,智能座舱只需为驾驶员提供基本的导航、车辆监控、娱乐交互即可。在高阶自动驾驶时代,驾驶员无需时刻将注意力放在驾驶本身,自动驾驶就可以完成大部分常规情景下的驾驶工作,而智能座舱此时需要担负一则重任一一与驾驶员保持密切联系,以便在自动驾驶无法完成驾驶工作时,驾驶员能够及时介入方向盘,避免发生意外,而拟人、立体、高度智能化的 HUD 甚至全息数字人,是这种场景下的有救交互方式。相对于屏幕上的人工智能,全息数字人更加亲切、灵动,支持自定义外观,可以吸引年轻用户:相对于从屏幕独立出来的蔚来 NOMI全息数字人更具科技感,有机会在年轻用户群体中打开全新市场空间。

2.AI Agent一一赋能下一个时代的人车交互

AIAgent(人工智能体)在大模型快速发展的驱动下进入加速成长期。诸如 GPT等 LLM应用在更新信息、处理多轮对话和面对复杂任务时依然存在局限,AI Agent 通过增加规划、记忆和工具使用三大能力克服了这些局限,极大扩展了大语言模型的应用范围,使其能够胜任更加复杂的任务,这为 AI Agent 扮演人类日常生活的“助理”提供了可能。

汽车是AI Agent 最具潜力的应用场景之一。车主在驾驶时,需要既快又准地对汽车进行操作,在座舱还未智能化的时代,这种操作依靠机械按钮、操作杆进行,而未来的人车交互愈发向中控屏幕集中,传统的操作习惯就需要改变。而 AI Agent 的能力则贴合了这种需求: 快速响应、准确理解命令和无手操作,而 AI 赋予的智能化可以将 Agent 的能力进一步外延,这些抽象的能力具象到应用场景中,可以将 AIAgent 的能力总结为 5个层次: 辅助操作、车身数据采集&可视化、汽车服务(导航、保养、保险等 )、生活助理、具身智能。

智能座舱和 HUD 渗透率快速提升,智能座舱数字人的市场前景乐观。蔚来 NOMI 人气 相当火热,据 2022 年至简车言统计的蔚来二手车数据,NOMI 选装比例达到 80%以上, 持平增强现实,仅次于 NIOPilot 自动驾驶功能包。我们一直强调,唯有应用-算力(也就 是收入-成本)的飞轮实现旋转,生成式 AI 才可以健康发展下去。而在汽车这一消费产品中,由于汽车本身价格相对高昂,这类智能助手几千元的选装边际成本相对较低,因此就可以吸引到更多用户选装。

近年兴起的车辆功能订阅制,为 AI 产品打开了全新盈利思路,例如华为 ADS 1.0 一次性 购买 32000 元,订阅包年 6400 元,订阅包月 640 元;ADS 2.0 一次性购买 36000 元, 订阅包年 7200 元,订阅包月 720 元。我们认为,车载功能订阅制有望是未来智能汽车 消费的重要商业模式,基于此种付费模式,同时考虑到智能座舱的渗透率,我们可以估 算出国内智能座舱数字人的市场空间。

⚫ 估算逻辑一:乘用车市场增量。据公安部数据,2023 年 9 月中国汽车保有量将超 过 3.3 亿辆,2025 年或突破 4 亿辆;根据观研报告网数据预测,2023-2025 年我国 乘用车销量为 2389/2437/2485 万辆。

⚫ 估算逻辑二:智能座舱渗透率。由于后装 HUD 比例很小,我们在此仅考虑前装市 场。根据 IHS Markit 数据,2022 年国内新车智能座舱渗透率 60%,此后随着新能 源汽车渗透率提升,带动燃油车向智能化迈进,2023-2025 年智能座舱渗透率有望 进一步提升至 66%/72%/76%。

⚫ 估算逻辑三:HUD 渗透率。根据 IHS Markit,HUD 渗透率 2022 年仅 10%,此前被 海外供应商垄断,今年来市场玩家涌现,叠加 CR5 下降,HUD 渗透率有望快速提 升。

⚫ 估算逻辑四:智能座舱数字人定价。考虑到智能座舱数字人并非驾驶刚需,而是驾 乘体验升级的可选消费,同时,考虑到智能座舱数字人背后的研发成本较高,我们 认为将月度订阅价定在 40-60 元/每月或 400-600 元/年比较合适。

⚫ 估算逻辑五:智能座舱数字人渗透率。我们可以按悲观/中性/乐观,分别给予 20%/50%/80%的渗透率计算。

报告共计:13页

猜你喜欢

转载自blog.csdn.net/GPT20236688/article/details/134895088