谷歌Waymo自动驾驶详解

2021-12-21 09:31:56· 来源：汽车ECU开发

2009年谷歌(Waymo)自动驾驶事业正式开始，但实际上谷歌的自动驾驶可以追溯到2005年第二届DARPA无人驾驶挑战赛，已有了十几年的历史，目前也是自动驾驶领域的标杆

2009年谷歌(Waymo)自动驾驶事业正式开始，但实际上谷歌的自动驾驶可以追溯到2005年第二届DARPA无人驾驶挑战赛，已有了十几年的历史，目前也是自动驾驶领域的标杆企业，不过Waymo也经历了各种坎坷，包括早期领导人职业操守严重不足，跟车企合作被鄙视，骨干员工加入竞争对手等。

Waymo在超过25个城市的公共道路上行驶了超过2000万英里。另外还在模拟环境中行驶了数百亿英里。此外，Waymo正在美国经营L4自动驾驶出租车服务，真正的在没有司机的情况下运送乘客。

下面来梳理一下Waymo的技术，以此来窥探一下头部企业背后的实际情况。

与其他公司的自动驾驶系统一样，Waymo自动驾驶技术主要包括：感知、定位、规划、控制。下面分别对其进行梳理，不过对于控制，由于其与车辆动力学模型是强相关的，就不对其进行介绍。

01.感知

感知模块是自动驾驶的基础也是核心，其主要实现对障碍物距离的估计，以及车辆的定位。Waymo的感知系统使用了摄像头、激光雷达和雷达的组合，如图1所示。感知模块的大部分工作是由4个LiDAR完成的，因此其技术路线刚好与特斯拉相反。图2为Waymo的感知系统处理后的视图与原图像。

图1 Waymo的感知系统

图2 Waymo感知视图

从图2中可以看出，Waymo的感知系统获取障碍物信息的能力非常高，包括：

1、可以识别常规汽车、警车、救护车、消防车和校车。如果遇到特种车辆，系统可以根据警报器和灯光做出判断；

2、每个检测到的障碍物都有一个状态：移动、停车等。

在Waymo开发感知系统的过程中，遇到过不少棘手的问题，比如在车辆反射问题，如图3所示，不过由于感知系统采用了激光雷达，这种发射问题不会出现在激光雷达的点云中。

图3 玻璃反射

另外还有一个极端问题：如果人们可能躺在卡车车顶，举着STOP标志。对于这样的问题，感知系统首先会检测STOP标志，然后将这些信息与地图进行匹配，检测地图上此处是否有STOP标志，是否有道路工程等，如果没有，该标志会被忽略。

02.架构

最近在讨论Tesla计算机视觉架构时，我探索了HydraNet 架构。它是一种旨在同时运行多个神经网络的架构。“Hydra”这个词意味着一个有多个头的系统。Waymo没有HydraNets。

Waymo的架构并不是固定的。

图4展示了一个神经网络架构搜索(NAS)单元，它是神经网络的构建块，类似于ResNet的大型神经网络中的构建块。这个想法已经被采纳并改编成一种叫做 AutoML 的东西。AutoML 的思想是神经网络架构必须由算法估计，如图5所示。

图4 NAS单元

图5 AutoML架构

这些架构是使用NAS单元构建的，最佳组合获胜。测试样本为10000个架构，预选100个模型，然后选出1个最终获胜者，获胜的标准是准确性和推理成本。

03.数据集和模型

关于数据集和模型，Waymo使用的是一种称为主动学习的过程。主动学习的思想如下：

1、对于未标记的数据，将其发送给模型进行预测。

2、如果模型对其预测非常确定，其将获得一个自动标签。

3、如果不确定，则将数据发送给人工标注员。这样，人工标注员只标注疑难数据，其余的都是自动标注。

Waymo使用主动学习来训练模型，利用TPU（Tensor Processing Units）和谷歌的深度学习框架TensorFlow。与特斯拉类似，这是一个闭环，循环迭代。

图6 Waymo主动学习步骤

图6中的描述已经比较清晰；从底部的Releases开始，然后沿着箭头一步一步执行。

1、当模型发布完成，开售数据收集。

2、一些数据被选中并由神经网络或人工标注员进行标注。

3、将标注的数据集发送到AutoML架构搜索，评估最佳模型。

4、最佳模型经过验证、测试并发Releases新版本。

04.定位

定位很显然就是获取车辆的实时位置，要求精度在1~3cm。一些公司使用了GPS，或是添加了摄像头和激光雷达信息。Waymo使用了地图、激光雷达和GPS来定位车辆，这方面采用了从Google地图积累的经验。

多年来，Google地图团队一直致力于使用激光雷达、摄像头和GPS进行高精地图绘制。这些传感器正好也是用于自动驾驶相吻合。

谷歌几乎已经绘制了整个世界的地图。如果从相对位置检测到您看到了2号街道，就可以准确地知道您在哪里。这就是他们过去二十年一直在努力的事情。

Waymo的定位模块由地图、摄像头、GPS和算法组成，可在全世界范围内准确定位车辆。另外Waymo还进行了大量冗余设计，使其更加健壮、可靠。

05.预测

行为预测

Waymo自动驾驶汽车最重要的特点是行为预测。在自动驾驶汽车中，最终想要的是了解人类行为并预测。这就是所谓的行为预测。

这些行为预测是使用循环神经网络进行的：它们使用过去的信息来预测未来的行为。因此，可以确切地知道要做什么，并且可以衡量预测的置信度。举两个行为预测简单的例子：

1、如果车辆观察到有行人注视着它，则发生事故的风险很低。如果观察到行人不注意就跑，风险会更高。

Waymo的系统是如何做到这一点的呢？其预测系统是一个混合体，结合了机器学习和人类知识。所谓的人类知识，就是人类对世界的了解，例如交通法规和不可能的事情——人类行走或者跑步的速度不可能达到50公里/小时）。

06.仿真

如文章开头所说，Waymo的自动驾驶在模拟器中运行了数百亿公里，该模拟器的输入为真实世界数据。

Waymo的仿真系统可以实时回放，可以模拟行为构建完整的场景，并查看算法是如何表现的。事实上，Waymo平均每天运行25,000辆虚拟汽车，并且在这些模拟中每天行驶1千万英里。

为了模拟更多场景，Waymo正在使用DeepMind和深度强化学习来创建代理和驾驶策略。

在强化学习中，策略是一种行为。其可以模拟一个愤怒的司机试图危险的切入。每次他们都会查看算法的行为和正确性。

一旦他们对驾驶员进行了准确且训练有素的预测，就可以生成要采取的轨迹。这也称为决策和轨迹生成。Waymo的驾驶模型称为ChauffeurNet，如图7所示。

图7 ChauffeurNet驾驶模型

07.规划

轨迹是一系列点坐标组成，其目标是综合来考虑安全性、速度和可行性，生成误差最合适的轨迹。Waymo的完整规划模块如图8所示。

图8 规划模型

Agent RNN是一个为自动驾驶车辆生成轨迹的网络。这些轨迹将考虑航向（可行性）、速度（交通规则）、航路点（长度）等。Agent RNN的目标是模拟一个可行的、现实的轨迹。

Road Mask Net用于确保生成的轨迹为动车道，防止生成的轨迹中含有非机动车道。

最后，轨迹还考虑了排斥器和吸引器。用于将车辆维持在车道中，避开路障。

生成轨迹的过程还使用了逆强化学习技术。在逆强化学习中，尝试着眼于真实的人类轨迹，并确定是什么使这条轨迹成为一个好的轨迹，这有利于改进了生成的轨迹并使其更接近人类行为。

总结

Waymo的自动驾驶技术积累了十几年，而且背靠Google，可以借鉴不少地图方面的经验，但是Waymo专注于L4以上的自动驾驶开发，这一点从目前来看，不是大多数，大部分公司先着眼于L2和L3的落地，并且逐步实现L4及以上。像百度之前也专注于L4及以上的开发，但是后来尝试L2和L3的落地。

分享到：

下一篇：华为智能汽车解决方案创新中心建成并投用；阳澄半岛测试场预计将于明年启用
上一篇：新能源汽车驱动电机发展现状及趋势

点赞 0 反对 0 举报 0 收藏 0 评论 0

汽车测试网V课堂
微信公众号
汽车测试网手机站

相关阅读

0 条相关评论

• 【焕新升级】山海智算模组V2——极致集成，跃迁新生	• 用于物理推理的去噪哈密顿网络
• 通用汽车新专利：座椅靠背口袋无线充电专利 + 车辆旋转座	• 用于虚拟里程测试的NPC 模型生成方法
• IT-N6300三通道直流电源--电源领域的测试多面手	• 自动化测试技术
• 从建模规范到安全合规：汽车电子工程师不可忽视的静态测试	• 传统整车厂扎堆搞软件公司，留下的却没几个
• 高压电缆与软铜排——电动汽车高压连接系统背后的“隐形功	• 自动驾驶汽车安全员的“操作能力”要求！

谷歌Waymo自动驾驶详解

微信公众号

行为预测

总结

编辑推荐

最新资讯

商用车及工程机械行业专场：NVH 及语音音频

理想i8和重卡对撞测试引争议，东风柳汽发声

‌艾德克斯IT-N2100 系列太阳能阵列模拟器

ITECH重磅发布IT2705直流电源分析仪，重构

现代汽车新一代混合动力系统：以技术革新引