当前位置:首页> 机器学习 >在强化学习中发现特征选择的新算法

在强化学习中发现特征选择的新算法

  顺序决策通常涉及规划,行动和学习在不同时间尺度上的时间延长的行动过程。在强化学习(RL)框架中,“选项”(表示预先计划的原始动作序列)可以加速学习和计划。但是,自主识别好的选择或“选项发现”仍然是一个悬而未决的问题。 “Eigenoptions”(基于环境中的扩散信息流的表示)可以用于促进RL问题域中的探索。我们的ICLR 2018论文,通过Deep Successor Representatio [详情阅读] 在强化学习中发现特征选择的新算法

相关推荐