keras 的 naf 算法:reshape 的魔力
  1. 为什么对于 keras 的 naf 算法实现,有的能够实现二(多)自由度控制的策略优化,而有的只能应对一自由度的控制?
reshape 的魔力
#     a, mu, P = x
#     a_mu = a-mu
#     a_mu = tf.expand_dims(a_mu,1)
#     return -0.5*tf.matmul( tf.matmul( a_mu, P ), tf.transpose(a_mu,[0,2,1]) )

    u, mu, p = x
    u_mu = tf.expand_dims(u - mu, -1)
    advan = -tf.matmul(tf.transpose(u_mu, [0, 2, 1]), tf.matmul(p, u_mu))*0.5
    advan = tf.reshape(advan, [-1, 1])
    return advan

深度学习推荐
深度学习推荐

墨之科技,版权所有 © Copyright 2017-2027

湘ICP备14012786号     邮箱:ai@inksci.com