1、1/272024 年年 9 月月 6 日日行业行业|深度深度|研究报告研究报告行业研究报告慧博智能投研智能汽车系列一:智能汽车系列一:“端到端端到端”技术飞跃,引技术飞跃,引领新一轮智能驾驶产业革命领新一轮智能驾驶产业革命所谓“端到端”是指一端输入图像等环境数据信息,中间经历类似“黑箱”的多层神经网络模型,另一端直接输出转向、制动、加速等驾驶指令。与传统规则驱动的分模块架构相比,端到端的实现将带来一系列优势,因而被产业界视为有望成为未来高阶智能驾驶解决方案的一种技术方案。本篇智能汽车系列,我们就将聚焦“端到端”技术,来试图探究该方案在新一轮智能驾驶中的产业发展相关问题。当前“端到端”技术的市场
2、现状如何?该技术的存在对于产业界有怎样的价值?市场方面分别取得了哪些进展?以及当前驱动该技术发展的有利因素有哪些?“端到端”技术路线的突破,对于智能汽车产业有哪些产业机遇?相关企业发展情况如何?未来该技术路线的发展中,将可能面临怎样的市场挑战?基于以上问题,我们进行了相应梳理,以期帮助大家更深刻地了解智能汽车中的“端到端”技术。目录目录一、市场现状.1二、价值分析.5三、市场进展.8四、驱动因素.15五、产业机遇.20六、相关企业.20七、未来挑战.25八、参考研报.26一、一、市场现状市场现状1、目前的端到端自动驾驶包含狭义与广义两种定义目前的端到端自动驾驶包含狭义与广义两种定义目前端到端自
3、动驾驶的定义可以简单分为狭义端到端和广义端到端目前端到端自动驾驶的定义可以简单分为狭义端到端和广义端到端。狭义端到端狭义端到端:传感器数据进入神经网络处理后,直接输出方向盘、油门、刹车等执行器的控制信号,该模式通过单一神经网络模型实现,是严格意义上的端到端。2/272024 年年 9 月月 6 日日行业行业|深度深度|研究报告研究报告广义端到端广义端到端:广义上的端到端具有两个特点:信息无损传递;可以实现数据驱动的整体优化。从广义角度理解端到端,可以看到目前主流的方案仍有差异。主要方案包括通过神经网络模型实现感知与决策规划,不包括控制模块;感知和决策规划使用神经网络,模块之间仍有人工设计的数据
4、接口等方式。2、模仿学习与强化学习是端到端自动驾驶的主要训练方法模仿学习与强化学习是端到端自动驾驶的主要训练方法8X8XbZeU8XeZbZaYaQaO8OsQnNpNmQlOmMyReRnNzQaQoOzQNZqRqOvPsOvN3/272024 年年 9 月月 6 日日行业行业|深度深度|研究报告研究报告模仿学习(Imitation Learning)和强化学习(Reinforcement Learning)是当前用于训练端到端神经网络的两种主要方法。模仿学习通过逆最优控制(Inverse Optimal Control)和行为克隆(BehaviorCloning)来实现,其核心理念是让智
5、能体通过模仿专家的行为来学习最优策略。而强化学习则是一种通过试错来学习的领域,其中奖励函数的设计是一个关键挑战。3、端到端迭代有望实现从端到端迭代有望实现从“感知感知”到到“决策决策”到到“OneModel”平滑过渡平滑过渡从端到端的最终实现上,通过感知“端到端”,模块化“端到端”,再到 OneModel/单一模型“端到端”是一种相对平滑的过渡形式。而当前感知“端到端”已经是主流的感知模型,展望后续技术发展,自动驾驶算法向“端到端”收敛,有望成为行业的一大趋势。不同迭代阶段之间的区别不同迭代阶段之间的区别:感知感知“端到端端到端”:当前的主流感知算法路线大多数都是用神经网络模型,通过基于多传感
6、器融合的BEV(Bird Eye View,鸟瞰图视角)+Transformer 基本实现了感知模块的端到端,感知输出检测结果的精度及稳定性相对之前的感知方案都有比较大的提升,但在决策规划控制模块仍然以 rule-based 为主。模块化模块化“端到端端到端”:与感知“端到端”相比,感知端算法没有太大变化,决策规划控制模块有望通过深度学习实现,取代原有的 rule-based 方案,从这一阶段开始,端到端的雏形逐渐形成。并且感知与决策规划控制模块之间的数据传递有望由人为定义的结果抽象为特征向量,避免数据损耗与误差累计等问题,决策规划控制模块的综合模型基于特征向量输出运动规划的结果。OneOne