规划是基于模型的搜索,学习是基于数据的总结,二者结合,1+1>2
2020-08-17
强化学习笔记8:整合学习和规划
hexo 进阶设置指南(持续更新)
强化学习笔记7:策略梯度 Policy Gradient
从0 -> 1,拥有你的免费个人博客之“打个前站”
ios黄页:可算让iPhone好用了点儿
为什么数值仿真里要用RK4(龙格库塔法)
强化学习笔记6:值函数估计Value function Approximation
深度学习22张精炼图笔记总结
Keras & Tensorflow 笔记
强化学习笔记5:无模型控制 Model-free control
深度学习-Coursera笔记
控制理论笔记-2