基于场景动力学和强化学习的自动驾驶边缘测试场景生成方法

李江坤 ,邓伟文,任秉韬 ,王文奇 ,丁 娟
195

作者单位:北京航空航天大学交通科学与工程学院;浙江天行健智能科技有限公司


发表期刊:《汽车工程》,2022 年(第 44 卷)第7期


摘要:为解决小概率高风险边缘测试场景的问题,本文提出一种基于场景动力学和强化学习的边缘场景生成方法,实现边缘场景的自动生成,能模拟真实世界中车辆间的对抗与博弈行为的特征。首先将随时间动态变化的场景模型由一组微分方程描述为场景动力学系统;然后利用神经网络作为通用函数逼近器来构造场景黑盒控制器,并基于强化学习实现边缘场景控制器的优化求解;最后以超车切入场景为例,在 Matlab/Simulink 软件进行仿真验证,结果表明,边缘场景强化生成模型在场景交互博弈、覆盖率和可重复测试等方面具有良好的性能。


关键词:智能驾驶测试;边缘场景;场景动力学;场景控制器;强化学习