优先经验重播 Prioritized Experience Replay

Prioritized Experience Replay (PER) 即根据样本的权重来进行采样,样本的权重越大,采样率就越高。

在遗传算法中,也有类似的轮赌盘方法,参考:https://www.cnblogs.com/adelaide/articles/5679475.html

不同在于,轮赌盘使用概率累积,而 PER 可构建“和树”。

... ...
评论:
  • [#{{item.num}}] {{item.post.nickname}}

    {{item.post.textarea}}

图文信息
发布者 inksci
更新时间 2020-01-10 15:12:05
访问数 12
全部 全部文章

墨之科技,版权所有 © Copyright 2017-2027

湘ICP备14012786号     邮箱:ai@inksci.com