Preceding vehicle following algorithm with human driving characteristics

作者单位:College of Information Science & Technology, Beijing University of Chemical Technology;Beijing Key Laboratory of Information Service Engineering, Beijing Union University


发表期刊:Automobile Engineering 2021, Vol. 235(7)


摘要:This paper proposes a new approach of using reinforcement learning (RL) to train an agent to perform the task of vehicle following with human driving characteristics. We refer to the ideal of inverse reinforcement learning to design thereward function of the RL model. The factors that need to be weighed in vehicle following were vectorized into reward vectors, and the reward function was defined as the inner product of the reward vector and weights. Driving data of human drivers was collected and analyzed to obtain the true reward function. The RL model was trained with the deterministic policy gradient algorithm because the state and action spaces are continuous. We adjusted the weight vector of the reward function so that the value vector of the RL model could continuously approach that of a human driver. After dozens of rounds of training, we selected the policy with the nearest value vector to that of a human driver and tested it in the PanoSim simulation environment. The results showed the desired performance for the task of an agent following the preceding vehicle safely and smoothly.


关键词:Inverse reinforcement learning, reinforcement learning, human driver, vehicle, reward vector


PanoCar试用(学校申请)

  • 姓名*

  • 手机号*

  • 微信号*

  • 邮箱

  • 所在学校*

  • 所在学院*

  • 导师姓名*

  • 导师电话

  • 导师邮箱

  • 试用PanoCar目的*

    • 产品选型
    • 项目招标
    • 毕业设计
    • 学术研究
    • 参加比赛
    • 学习了解
    • 其他
  • 您认为软件使用过程中哪些方面比较重要*

    • 技术支持
    • 产品功能
    • 性价比
    • 国产化替代
    • 需求定制能力
    • 仿真精度
    • 模型计算效率
    • 模型计算稳定性
    • 模型参数配置易用性
    • 模型参数库丰富程度
    • 其他
  • 您关注PanoCar哪些模块或功能*

    • 模块:车辆底盘模型
    • 模块:动力传动系统模型
    • 模块:空气动力学模型
    • 模块:转向系统模型
    • 模块:悬架系统模型
    • 模块:制动系统模型
    • 模块:轮胎模型
    • 模块:3D道路模型
    • 模块:驾驶员模型
    • 模块:驾驶操纵模型
    • 模块:I/O接口
    • 功能:Matlab/Simulink联合仿真
    • 功能:PanoCar实时平台应用
    • 功能:PanoCar本地仿真测试
    • 功能:数据后处理功能
    • 功能:动画引擎
  • 您是通过哪种途径了解到PanoCar的*

    • 官网
    • 微信公众号
    • 论文专著
    • 学术会议
    • 知乎B站等其他新媒体平台
    • 行业网站
    • 搜索引擎
    • 同行推荐
    • 他人介绍
    • 其他
  • 验证码

PanoCar试用(企业申请)

  • 姓名*

  • 手机号*

  • 所在单位*

  • 所在部门*

  • 微信号*

  • 邮箱

  • 您试用PanoCar软件的目的*

    • 产品选型
    • 项目招标
    • 学习了解
    • 其他
  • 您认为软件使用过程中哪些方面比较重要*

    • 技术支持
    • 产品功能
    • 性价比
    • 国产化替代
    • 需求定制能力
    • 仿真精度
    • 模型计算效率
    • 模型计算稳定性
    • 模型参数配置易用性
    • 模型参数库丰富程度
    • 其他
  • 您关注PanoCar哪些模块或功能*

    • 模块:车辆底盘模型
    • 模块:动力传动系统模型
    • 模块:空气动力学模型
    • 模块:转向系统模型
    • 模块:悬架系统模型
    • 模块:制动系统模型
    • 模块:轮胎模型
    • 模块:3D道路模型
    • 模块:驾驶员模型
    • 模块:驾驶操纵模型
    • 模块:I/O接口
    • 功能:Matlab/Simulink联合仿真
    • 功能:PanoCar实时平台应用
    • 功能:PanoCar本地仿真测试
    • 功能:数据后处理功能
    • 功能:动画引擎
  • 您是通过哪种途径了解到PanoCar的*

    • 官网
    • 微信公众号
    • 论文专著
    • 学术会议
    • 知乎B站等其他新媒体平台
    • 行业网站
    • 搜索引擎
    • 同行推荐
    • 他人介绍
    • 其他
  • 验证码