LMDrive:基于LLM的自动驾驶系统的训练与微调
自动驾驶技术一直是人工智能领域的研究热点之一。近年来,随着大规模预训练语言模型(LLM)的崛起,其在自动驾驶系统中的应用逐渐引起关注。本文介绍了一种名为LMDrive的自动驾驶系统,该系统利用LLM进行动作预测,并通过两个MLP适配器对未来路点进行预测。为了提高监督信号,训练过程中对历史帧进行预测。在推理时,系统仅执行最新帧的预测。最终的控制信号通过两个PID控制器实现横向和纵向控制,按照LBC的方法来跟踪预测航路点的航向和速度。本文将深入探讨LMDrive的训练目标和两个关键阶段:视觉编码器的预训练和指令微调。
LMDrive的动作预测与微调
LMDrive的核心在于利用LLM进行动作预测。在接收到指令和视觉tokens序列后,系统通过LLM预测动作tokens。为了提高监督信号,系统在训练期间对每个历史帧进行预测,而在推理时仅考虑最新帧。此外,为了更准确地预测未来路点,LMDrive使用两层MLP适配器。这个适配器不仅提高了对未来路点的准确性,还通过一个标志表明给定指令是否已完成。这一设计使得LMDrive能够更灵活地应对不同驾驶情境,从而提高系统的鲁棒性。
训练目标与损失项
在微调LLM及其相关组件时,LMDrive考虑两个关键的损失项。首先是L1航路点损失,这个损失项确保系统对预测航路点的准确性有着高度的敏感性。其次是分类损失(交叉熵),用于确定当前帧是否完成了给定的指令。通过这两个损失项的结合,LMDrive在训练过程中能够更好地理解并适应驾驶任务,从而提高系统的性能。
LMDrive的训练阶段
LMDrive的训练分为两个关键阶段。首先是视觉编码器的预训练阶段,该阶段旨在通过LLM对驾驶场景进行深度学习表示的学习。这一步为系统提供了对复杂环境的抽象理解。第二阶段是指令微调阶段,系统在这一阶段通过与控制信号的对齐来微调LLM,以更好地适应具体的驾驶指令。这两个阶段的有机结合使得LMDrive在不同环境和任务下都能够表现出色。
LMDrive作为基于LLM的自动驾驶系统,通过动作预测和微调两个关键步骤,取得了显著的性能提升。未来,我们期待在该领域看到更多基于大规模预训练语言模型的创新应用,为自动驾驶技术的发展带来更多的可能性。LMDrive的成功经验为未来自动驾驶系统的设计和优化提供了有益的启示。
编辑推荐
最新资讯
-
新能源汽车锂离子电池的热失控防护措施及材
2024-08-13 13:59
-
新能源汽车三电系统产品开发中的虚实结合试
2024-08-13 13:56
-
汽车底盘产品系统开发与验证的虚实结合试验
2024-08-13 13:54
-
汽车利用仿真技术辅助的多合一电驱系统的台
2024-08-13 13:50
-
汽车多合一电驱系统载荷的失效关联测试
2024-08-01 15:40