留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于深度强化学习的水下机器人最优轨迹控制

马琼雄 余润笙 石振宇 黄晁星 李腾龙

马琼雄, 余润笙, 石振宇, 黄晁星, 李腾龙. 基于深度强化学习的水下机器人最优轨迹控制[J]. 华南师范大学学报(自然科学版), 2018, 50(1): 118-123.
引用本文: 马琼雄, 余润笙, 石振宇, 黄晁星, 李腾龙. 基于深度强化学习的水下机器人最优轨迹控制[J]. 华南师范大学学报(自然科学版), 2018, 50(1): 118-123.
Autonomous Underwater Vehicles Optimal Trajectory Control Base on Deep Reinforcement Learning[J]. Journal of South China normal University (Natural Science Edition), 2018, 50(1): 118-123.
Citation: Autonomous Underwater Vehicles Optimal Trajectory Control Base on Deep Reinforcement Learning[J]. Journal of South China normal University (Natural Science Edition), 2018, 50(1): 118-123.

基于深度强化学习的水下机器人最优轨迹控制

基金项目: 

广东省科技计划项目;国家级大学生创新创业训练计划项目;华南师范大学青年教师科研培育基金项目

详细信息
    通讯作者:

    马琼雄

Autonomous Underwater Vehicles Optimal Trajectory Control Base on Deep Reinforcement Learning

  • 摘要: 为了实现水下机器人在跟踪复杂轨迹时具有出较高的精度和稳定性,提出了利用深度强化学习实现水下机器人最优轨迹控制的方法:首先,建立基于2个深度神经网络(Actor网络和Critic网络)的水下机器人控制模型,其中Actor网络用来选择动作,Critic网络用来评估Actor网络的训练结果;其次,构造合适的奖励信号使得深度强化学习算法适用于水下机器人的动力学模型;最后,提出了基于奖励信号标准差的网络训练成功评判条件,使得水下机器人在确保精度的同时保证稳定性. 仿真实验结果表明:在解决一定精度内的水下机器人复杂轨迹跟踪问题时,该算法与传统PID控制算法相比具有更优的性能.
  • 加载中
计量
  • 文章访问数:  977
  • HTML全文浏览量:  270
  • PDF下载量:  238
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-04-05
  • 修回日期:  2017-07-31
  • 刊出日期:  2018-02-25

目录

    /

    返回文章
    返回