bars
Reinforcement learning-note
search
circle-xmark
⌘
Ctrl
k
copy
Copy
chevron-down
深入浅出强化学习——原理入门
推荐序
chevron-right
第一章:绪论
chevron-right
第二章:马尔科夫决策过程
chevron-right
第三章:基于模型的动态规划方法
chevron-right
第四章:基于蒙特卡洛的强化学习方法
chevron-right
第五章:基于时间差分的强化学习方法
chevron-right
Previous
Introduction
chevron-left
Next
推荐序
chevron-right
Last updated
5 years ago