高斯分布的信息熵、交叉熵和相对熵(KL散度)公式推导


rllab 项目中求 KL 散度对应的代码

使用时可去掉参数 self,当成独立的函数。注意代码中使用了 theano 库,使用 tensorflow 和 numpy 时相应替换即可。

def kl_sym(self, old_dist_info_vars, new_dist_info_vars):
    old_means = old_dist_info_vars["mean"]
    old_log_stds = old_dist_info_vars["log_std"]
    new_means = new_dist_info_vars["mean"]
    new_log_stds = new_dis ... ... 
评论:
  • [#{{item.num}}] {{item.post.nickname}}

    {{item.post.textarea}}

图文信息
发布者 inksci
更新时间 2019-12-07 22:32:17
访问数 14
全部 全部文章

墨之科技,版权所有 © Copyright 2017-2027

湘ICP备14012786号     邮箱:ai@inksci.com