一种聚类“车辆驾驶相遇”数据的深度无监督学习方法

2018-08-08 08:36:48· 来源：智车科技

从“驾驶相遇”中学习到的东西可以帮助自动驾驶汽车在复杂的环境中与附近的车辆一起行驶时做出适当的决策。本文通过将自动编码器与k均值聚类( AE - kMC )相结合，开发了一种无监督分类器，将自然“驾驶相遇”分成可区分的聚类。AE-kMC的有效性得到了验证，它使用了密歇根大学(University of Michigan)过去5年收集的1万次自然“驾驶相遇”的数据。我们将我们开发的方法与k-means聚类方法进行了比较，实验结果表明AE-kMC方法优于原始的k-means聚类方法。

摘要：从“驾驶相遇”中学习到的东西可以帮助自动驾驶汽车在复杂的环境中与附近的车辆一起行驶时做出适当的决策。本文通过将自动编码器与k均值聚类( AE - kMC )相结合，开发了一种无监督分类器，将自然“驾驶相遇”分成可区分的聚类。AE-kMC的有效性得到了验证，它使用了密歇根大学(University of Michigan)过去5年收集的1万次自然“驾驶相遇”的数据。我们将我们开发的方法与k-means聚类方法进行了比较，实验结果表明AE-kMC方法优于原始的k-means聚类方法。

作者：Sisi Li, Wenshuo Wang, Zhaobin Mo, and DingZhao

索引项：“驾驶相遇”分类、无监督学习、自动编码器

I.介绍

本论文中的“车辆驾驶相遇”指的是两辆或多辆车在驾驶时在空间上靠近并彼此相互作用的场景。近年来，自动驾驶已经成为工业界和学术界的热门话题，让汽车在复杂的交通场景中与人类驾驶员一样做出类似人的决定给自动驾驶车辆带来了巨大的挑战。

目前，处理复杂“驾驶相遇”的最流行的方法之一是，根据其具体应用，凭经验手动将其分为几个简单的驾驶场景。例如，基于人类驾驶员主动-被动决策行为[3]，将自动驾驶应用的变道行为分为不同类别[1]、[2]，然后引入机器学习技术，如马尔可夫决策过程（MDP）和部分可观察的MDP（POMDP）[4]，[5]，以学习具体的决策模型。

一个训练有素的模型通常需要足够数量的自然驾驶数据[ 6 ]。[7]的作者将强化学习与博弈论相结合，利用交通模拟器生成的车辆交互数据，为自动驾驶汽车开发决策控制器。但是，当在现实世界的交通环境中部署时，[7]中训练有素的控制器可能变得无效。此外，直接将训练数据输入模型而不进行任何分类无法充分利用基础数据资源，从而可能错过实际交通设置中的一些罕见但重要的驾驶场景。解决此问题的最大挑战之一是从自然交通设置中获取大量高质量的标记和分类交通数据，这对于学习决策模型的稳健性和准确性至关重要。

现代传感技术，如摄像机，激光雷达和雷达，可以收集多辆车遇到的大规模交通数据，具有很大的优势；例如，密歇根大学交通研究所（UMTRI）在安娜堡配备了带有GPS跟踪器的多辆公共汽车，以收集自动驾驶汽车研究的车辆交互数据以及[8][9]中列出的更多已发布的数据库，可以探索收集车辆的交互数据，用以开发自动驾驶车辆控制器并生成测试运动以评估自驱动算法[10] - [12]。

然而，如何有效地标记如此庞大的数据集并以合理的方式分组“驾驶相遇”仍然是挑战。手动标记大量数据是一项耗时的任务，这需要数据分析师具有丰富的先验知识，涵盖交通、智能车辆以及人为因素等领域。阿克曼声称，一小时标记良好的训练数据，大约需要800个人工小时。Ohn-Bar [13]花费了相当长的时间来手动注释录制的驾驶视频中的对象，以研究驾驶时有趣物体的重要性等级。

为了满足基于数据的学习方法，工业界和学术界都需要一种能够使标签过程自动化的工具，从而有效地消除标签成本[14]。近年来，除了对“驾驶相遇”进行分类之外，还已经对自动化数据标注过程进行了不少研究。例如，从使用监督学习方法[ 15 ]自动标注模糊推文到使用无监督学习方法(例如k - means ) [ 16 ]和半监督学习方法(例如，半监督支持向量机) [ 17 )对驾驶风格进行分类。

尽管上述无监督和半监督方法可以减少标记工作，但它们不适合处理大量高维时间序列数据。为了深入了解此类数据，深度学习方法越来越受欢迎。例如，自动编码器及其扩展已被用于分析驾驶风格[18]和驾驶员行为[19]，这从经验上证明了它的有效性。对于自动驾驶汽车，来自这些手动预定类别的学习模型可能会受到以下限制：

1）手动标记大量高维数据需要过多的时间和资源成本，并且由于数据分析师的各种先验知识而可能产生大的偏差。
2）用最适合人类理解的“驾驶相遇”分类来学习自动驾驶汽车的决策，可能不会产生最合适的结果。

本文提出了一个无监督的框架，即结合自动编码器和k - means聚类( AE - kMC )，以较少的主观干扰自动聚类“驾驶相遇”。自动编码器被用作在“驾驶相遇”分类器中提取隐藏特征的组件。这些数据是由M市历时五年时间收集的，该市有2800多辆汽车，包括商用卡车和过境车辆。这项工作的最初贡献是开发并实现了一个基于自动编码器的框架，根据识别出的特征自动标记“驾驶相遇”。据我们所知，这在其他地方还没有被提出过。最后，我们对实验结果进行了综合分析。源代码可以在这里找到：https://github.com/zhao-lab/li-18-deep-unsupervised-ivs.

论文的其余部分组织如下：第Ⅱ节详细介绍了开发的AE - kMC方法；第III节显示了“车辆相遇”数据收集和模型训练程序；第IV节展示了实验结果；第V节是结论和今后的工作。

Ⅱ.无监督学习方法

在本节中，我们将介绍两种不同的无监督方案，使用k - means聚类和AE - kMC自动聚类“车辆相遇”。接下来，我们将介绍传统自动编码器的理论基础、自动编码器神经网络的结构以及k - means聚类方法。

A.自动编码器框架

在这项工作中实现的自动编码器是一个典型的自动编码器，包含一个编码器和一个解码器，如图1所示。

图1：典型自动编码器的结构。

1 )编码器：在图1中用橙色框标记的编码器将输入数据X∈Rn映射成隐藏表示X∈Rm [ 20 ]：

其中W∈Rm*n权重矩阵，b∈Rm是偏差项。

图2 :本文使用的自动编码器的结构。

与只有一个输入层和一个输出层的普通编码器不同，我们使用的编码器是四层神经网络，包含一个输入层( L1 )、两个隐藏层( L2和L3 )和一个输出层( L4 )，如图2所示。添加了两个隐藏层，因为根据通用逼近器定理[21]，这两个额外层中的每一个都代表任何函数的近似值。改进的编码器有利于新的深度，因为可以降低训练成本（计算成本和训练数据大小）[21]。

其中Xi是层Li的输入数据表示，而Wi,i+1和bi,i+1是权重向量和偏向量，分别能够将Xi映射到Xi+1。请注意，第4层的

数据表示是输入数据的代码或隐藏特征。

2）解码器：编码数据或来自编码器的隐藏表示

将通过层L5和L7映射回

，层L5和L7是原始输入数据X的重建表示。注意，这项工作中使用的解码器是一个深层神经网络，它包含一个输入层( L4 )、两个隐藏层( L5和L6 )和一个输出层。

B.优化

为了从隐藏特征重构输入数据，重构的表示和原始输入之间的误差应该被最小化。因此，成本函数可以定义为：

其中Ω是包含权重向量和每层偏置向量的参数集

，gΩ是将隐藏表示x映射到

的映射。然后，优化问题被定义为：

C.k-Means聚类

k - means聚类是一种流行的无监督机器学习分类技术。将训练好的自动编码器应用于原始“车辆相遇”数据，可以提取隐藏特征，然后将其输入k - means聚类。给定n个观测值并定义k类，k-means聚类方法通过求解优化问题将观测值聚类成k组。

其中|xi-vj|是质心和观测之间的欧几里德距离[22]。目标函数尝试选择能够最小化到属于其各自聚类的所有点距离的质心，从而使这些质心代表周围的数据点聚类。

III.数据收集和实验

A.数据收集

图3：“驾驶相遇”的示例。暗点是起点，光点是终点

我们使用的是安全试验模型部署（SPMD）数据库，该数据库提供了足够的自然数据[6]。该数据库由密歇根大学交通研究所( UMTRI )负责，提供了过去五年在安娜堡地区记录的驾驶数据。它包括大约3,500辆装备的车辆和总共600万次旅程。由机载GPS采集用于聚类的纬度和高度信息。对于每辆配备的车辆，数据收集过程从点火开始，以10hz的采样频率收集。

我们使用了100,000次旅程的数据集，从1900辆车中收集了12天的运行数据。我们提取的轨迹信息包括车辆的纬度，经度，速度和航向角。选择范围限制在市区，纬度和经度范围分别为（-83.82，-83.64）和（42.22,42.34）。“车辆相遇”被定义为车辆距离小于100米的情况，如图3所示。点表示每个采样时间的车辆位置。在从SPMD数据库查询后，我们遇到了49,998次“车辆相遇”。

这些遭遇的分布如图4所示。可以包含轨迹的最小矩形的中心点用于在一幅图像中包含大量轨迹。注意，为了减少计算负荷，随机选择10,000次相遇来测试无监督的聚类方法。

图4：“驾驶相遇”的分布。

B.模型训练过程

图5:模型训练过程中的成本。

一次“车辆相遇”的GPS数据被用作自动编码器的输入。在此之前，数据被标准化因而可以将所有训练数据放在相同的范围内。在均匀分布之后，使用1和-1之间的随机数初始化每个层的权重。更具体地说，我们设定了

、

。采用经典的随机梯度下降法进行学习，训练过程中的成本函数值如图5所示，训练误差收敛到0.041，这表明训练有素的自动编码器可以重建隐藏特征的输入数据。图6示出了自动编码器的原始输入的示例，即原始车辆GPS轨迹。

图6：原始车辆交互轨迹。水平轴和垂直轴分别是车辆的经度和纬度。

IV.结果分析与讨论

在这一部分，我们将展示和比较两种无监督学习方法获得的聚类结果。在真实的交通环境中，典型的“驾驶相遇”主要包括四种情况：

1）A类：两辆车在交叉路口相遇。
2）B类：两辆车在道路的相反方向相遇。
3）C类：一辆车绕过另一辆车;
4）D类：两辆车在同一条道路上相互作用（有或没有车道变换）。

图7显示了一个聚类结果的例子，其中包含交叉路口的交互行为。开发的AE-kMC成功地将车辆相互作用分为上述四类。

图7：在交叉点遇到的两辆车的集群。圆圈表示起始位置，十字表示终点位置。

图8显示了两辆车从相反方向在同一道路上相遇的情景；图9显示了两辆车在同一条道路上的相互作用。请注意，车道更改操作包含在此群集中，但很难从结果中识别。

图8 :两组车辆在同一条道路上相遇，方向相反。

图9 :在同一条道路上遇到的两辆车的集群。

一辆车经过另一辆车的交通场景如图10所示。注意，在这种情况下，一辆车是静止的(图10a、图10b、图10c和图10d )，或者是移动的，但是距离另一辆车较远(图10e和图10f )。

图10 :一辆车经过另一辆车的集群。

为了评估准确性，我们随机混洗并重新采样了从提议的方法中获得的每个聚类的100个样本，然后我们手动识别那些不符合聚类中大多数样本显示模式的样本。因此，每个群集的性能通过以下方式计算

其中nabnormal是异常数据的数量，Nsample= 100。我们提出的方法可以对具有相似地理特征的“车辆相遇”进行聚类，但是每个聚类仍然包含异常“驾驶相遇”。表一显示了集群的性能。还评估了仅使用k - means聚类的方法，结果表明，与使用AE - kMC的方法相比，该方法还可以将上述具有较低性能的车辆交互类别进行聚类。

表一：聚类性能分析

V.结论和今后的工作

在本文中，我们提出了一种无监督学习方法来聚类“车辆相遇”数据。更具体地说，引入自动编码器来提取“驾驶相遇”的隐藏特征，然后使用k - means聚类方法对提取的特征进行分组。所提出的AE - kMC方法最终获得了五种主要的典型车辆相遇类型，包括：1）两辆车相互交叉; 2）两辆车合并; 3）两辆车在一条道路的相反方向相遇; 4）一辆车绕过另一辆车; 5）两辆车在同一条道路上相互作用（有或没有车道变换）。我们还比较了改进的AE - kMC方法和k - means聚类方法，结果表明我们改进的AE - kMC方法优于k - means聚类方法。

在未来的工作中，我们将专注于提高无监督聚类方法的准确性，包括评估不同类型的自动编码器和聚类方法。此外，将研究目标“车辆相遇”提取，例如，环形交通环境中的车辆交互。

致谢

感谢丰田研究院（“TRI”）提供资金协助作者进行研究，但本文仅反映其作者的意见和结论，而非代表TRI或任何其他丰田实体。

REFERENCES

[1] J. Nilsson, J. Silvlin, M. Brannstrom,E. Coelingh, and J. Fredriksson,“If, when, and how to perform lane change maneuvers on highways,”IEEEIntelligent Transportation Systems Magazine, vol. 8, no. 4, pp.68–78, 2016.
[2] J. Nilsson, M. Br¨annstr¨om, E. Coelingh,and J. Fredriksson, “Lane change maneuvers for automated vehicles,” IEEETransactions on Intelligent Transportation Systems, vol. 18, no. 5, pp.1087–1096,2017.
[3] Q. H. Do, H. Tehrani, S. Mita, M.Egawa, K. Muto, and K. Yoneda,“Human drivers based active-passive model for automated lane change,”IEEE Intelligent Transportation Systems Magazine, vol. 9, no. 1, pp. 42–56,2017.
[4] C. Hubmann, M. Becker, D. Althoff, D. Lenz,and C. Stiller, “Decision making for autonomous driving considering interactionand uncertain prediction of surrounding vehicles,” in Intelligent VehiclesSymposium (IV), 2017 IEEE. IEEE, 2017, pp. 1671–1678.
[5] M. Kuderer, S. Gulati, and W. Burgard,“Learning driving styles for autonomous vehicles from demonstration,” inRobotics and Automation (ICRA), 2015 IEEE International Conference on. IEEE,2015, pp. 2641–2646.
[6] W. Wang, C. Liu, and D. Zhao, “How muchdata are enough? A statistical approach with case study on longitudinal drivingbehavior,” IEEE Transactions on Intelligent Vehicles, vol. 2, no. 2, pp. 85–98,2017.
[7] N. Li, D. W. Oyler, M. Zhang, Y. Yildiz,I. Kolmanovsky, and A. R. Girard, “Game theoretic modeling of driver andvehicle interactions for verification and validation of autonomous vehiclecontrol systems,” IEEE Transactions on Control Systems Technology, vol. PP, no.99, pp. 1–16, 2017.
[8] W. Wang and D. Zhao, “Extractingtraffic primitives directly from naturalistically logged data for self-drivingapplications,” IEEE Robotics and Automation Letters, 2018, DOI: 10.1109/LRA.2018.2794604.
[9] D. Zhao, Y. Guo, and Y. J. Jia,“Trafficnet: An open naturalistic driving scenario library,” arXiv preprintarXiv:1708.01872, 2017.
[10] D. Zhao, H. Lam, H. Peng, S. Bao, D.J. LeBlanc, K. Nobukawa, and C. S. Pan, “Accelerated evaluation of automatedvehicles safety in lane-change scenarios based on importance sampling techniques,”IEEE transactions on intelligent transportation systems, vol. 18, no. 3, pp.595–607, 2017.
[11] D. Zhao, X. Huang, H. Peng, H. Lam, andD. J. LeBlanc, “Accelerated evaluation of automated vehicles in car-followingmaneuvers,” IEEE Transactions on Intelligent Transportation Systems, 2017.
[12] Z. Huang, H. Lam, D. J. LeBlanc, and D.Zhao, “Accelerated evaluation of automated vehicles using piecewise mixturemodels,” IEEE Transactions on Intelligent Transportation Systems, 2017.
[13] E. Ohn-Bar and M. M. Trivedi, “Are allobjects equal? deep spatiotemporal importance prediction in driving videos,”Pattern Recognition, vol. 64, pp. 425–436, 2017.
[14] T. Appenzeller, “The scientists’apprentice,” Science, vol. 357, no. 6346, pp. 16–17, 2017.
[15] M. Erdmann, E. Ward, K. Ikeda, G. Hattori,C. Ono, and Y. Takishima,“Automatic labeling of training data for collecting tweets for ambiguoustv program titles,” in 2013 International Conference on Social Computing, Sept2013, pp. 796–802.
[16] C. M. Martinez, M. Heucke, F.-Y. Wang,B. Gao, and D. Cao, “Driving style recognition for intelligent vehicle controland advanced driver assistance: A survey,” IEEE Transactions on IntelligentTransportation Systems, 2017, DOI: 10.1109/TITS.2017.2706978.
[17] W. Wang, J. Xi, A. Chong, and L. Li,“Driving style classification using a semisupervised support vector machine,”IEEE Transactions on Human-Machine Systems, vol. 47, no. 5, pp. 650–660, 2017.
[18] W. Dong, T. Yuan, K. Yang, C. Li, andS. Zhang, “Autoencoder regularized network for driving style representationlearning,” arXiv preprint arXiv:1701.01272, 2017.
[19] H. Liu, T. Taniguchi, Y. Tanaka, K.Takenaka, and T. Bando, “Visualization of driving behavior based on hiddenfeature extraction by using deep learning,” IEEE Transactions on IntelligentTransportation Systems, vol. 18, no. 9, pp. 2477–2489, 2017.
[20] P. Vincent, H. Larochelle, I. Lajoie,Y. Bengio, and P.-A. Manzagol,“Stacked denoising autoencoders: Learning useful representations in adeep network with a local denoising criterion,” Journal of Machine LearningResearch, vol. 11, no. Dec, pp. 3371–3408, 2010.
[21] I. Goodfellow, Y. Bengio, A. Courville,and Y. Bengio, Deep learning. MIT press Cambridge, 2016, vol. 1.
[22] A. K. Jain, “Data clustering: 50 yearsbeyond k-means,” Pattern recognition letters, vol. 31, no. 8, pp. 651–666,2010.
[23] X. Huang, D. Zhao, and H. Peng, “Empiricalstudy of dsrc performance based on safety pilot model deployment data,” IEEETransactions on Intelligent Transportation Systems, 2017.

作者情况：

S. Li is with the Robotics Institute, University of Michigan, Ann Arbor,
MI, 48109.

W. Wang is with the Department of Mechanical Engineering, University
of Michigan, Ann Arbor, 48109 wenshuow@umich.edu.

Z. Mo is with the Automotive Engineering at the Tsinghua University,
Beijing, China, 100084.

D. Zhao is with the Department of Mechanical Engineering, University
of Michigan, Ann Arbor, 48109 zhaoding@umich.edu.

This work was funded by the Toyota Research Institute with grant No.
N021936.

分享到：