Skip to content

archcra/DDPG

 
 

Repository files navigation

DDPG

DDPG in Pytorch

仿真环境

gym中的LunarLanderContinuous-v2

环境依赖

  • gym
  • numpy
  • matplotlib
  • python3.6
  • pytorch1.6

文件描述

  • train.py为训练脚本,配置好环境后直接运行即可,不过需要在当前目录下创建output_images文件夹,用于放置生成的仿真结果;
  • network.py为网络脚本,包括演员网络和评论家网络;
  • buffer.py为经验回放池脚本;
  • DDPG.py为DDPG算法的实现脚本;
  • utils.py为工具箱脚本,里面主要放置一些通过函数;
  • test.py为测试脚本,通过加载训练好的权重在环境中进行测试,测试训练效果。

仿真结果

详见output_images文件夹

About

DDPG in Pytorch

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%