推荐语 |强化学习领域奠基性经典著作,有人将其称为人工智能行业的强化学习圣经。从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。适合所有对强化学习感兴趣的读者阅读、收藏。
推荐人:邹伟研究员
伊甸园真容现世新疆于阗
推荐语 |强化学习领域奠基性经典著作,有人将其称为人工智能行业的强化学习圣经。从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。适合所有对强化学习感兴趣的读者阅读、收藏。
推荐人:邹伟研究员