仅展示成果:基于TORCS和Torch7实现端到端自动驾驶A3C模型的训练

仅展示成果:基于TORCS和Torch7实现端到端自动驾驶A3C模型的训练

博主基于TORCS和Torch7开发了基于连续动作深度强化学习模型的自动驾驶端到端仿真系统,是一个多线程异步训练方法,每个线程更新的梯度汇总到总模型进行参数更新,接着总模型把更新后的参数分发给子线程,子线程继续在此基础上更新,其实就是A3C。模型输入的是车辆前视角的图像,也就是这个主视角的仿真界面截屏,输出是转角值的正态概率分布。

博主是基于别人已有项目改的,已有项目做的是离散动作,我这里改成了连续动作,同时修复了些隐藏的bug。而且博主用这个只是作为验证自己所提出的预训练算法的仿真平台用的,博主自己还用ROS实现了一套基于三辆真车的分布式实车训练系统。

因为牵扯到自己的研究,保密需要,所以也就不公开前人的研究了。

在这里插入图片描述

发布了17 篇原创文章 · 获赞 114 · 访问量 7万+

猜你喜欢

转载自blog.csdn.net/xiaoxiao123jun/article/details/103104889