当前位置:首页> 机器学习 >重要性加权演员 - 学习者架构:DMLab-30中的可扩展分布式DeepRL

重要性加权演员 - 学习者架构:DMLab-30中的可扩展分布式DeepRL

  深度强化学习(DeepRL)在一系列任务中取得了显着成功,从机器人技术的持续控制问题到Go和Atari等游戏。迄今为止,这些领域的改进仅限于个别任务,其中为每项任务调整和培训了单独的代理。  在我们最近的工作中,我们探讨了在单个代理上完成许多任务的挑战。  今天,我们正在发布DMLab-30,这是一套新任务,在具有共同行动空间的视觉统一环境中应对各种各样的挑战。培训 [详情阅读] 重要性加权演员 - 学习者架构:DMLab-30中的可扩展分布式DeepRL

相关推荐