Prioritized Experience Replay (PER) 即根据样本的权重来进行采样,样本的权重越大,采样率就越高。
在遗传算法中,也有类似的轮赌盘方法,参考:https://www.cnblogs.com/adelaide/articles/5679475.html
不同在于,轮赌盘使用概率累积,而 PER 可构建“和树”。
... ...{{item.post.textarea}}
墨之科技,版权所有 © Copyright 2017-2027
湘ICP备14012786号 邮箱:ai@inksci.com