Guided Policy Search 引导策略搜索




Improved Regularization








Code

Qtt 表示 Q 的二次微分,具体是 Qxx、Qxu 或 Quu,则根据相应元素来得到。

forward 函数是为了计算 kl_div 的,当判断 kl_div 满足收敛要求时,循环退出。




(1) dynamics


iLQR

Iterative Linear Quadratic Regulator Design for Nonlinear Biological Movement Systems


iLQG

... ...
评论:
  • [#{{item.num}}] {{item.post.nickname}}

    {{item.post.textarea}}

图文信息
发布者 inksci
更新时间 2020-02-25 21:01:34
访问数 18
全部 全部文章

墨之科技,版权所有 © Copyright 2017-2027

湘ICP备14012786号     邮箱:ai@inksci.com