| ISBN/价格: | 978-7-302-58794-1:CNY69.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习/.袁莎,白朔天,唐杰著 |
| 出版发行项: | 北京:,清华大学出版社:,2021.10 |
| 载体形态项: | 20,276页:;+图:;+26cm |
| 一般附注: | 面向新工科专业建设计算机系列教材 人工智能 |
| 提要文摘: | 本书为读者构建了一个完整的强化学习入门路径,深入浅出地介绍了强化学习算法的基本原理和实现方法。在正文开始前,本书带着初学者回顾了相关预备知识,包括数学基础和机器学习基础。在正文部分,本书首先介绍了强化学习的基本概念,给出了强化学习的数学框架(马尔科夫决策过程),随后介绍了强化学习的求解算法,包括表格求解法(动态规划法、蒙特卡洛法和时序差分法),以及近似求解法(值函数近似法、策略梯度法和深度强化学习)。本书最后一部分为实践与前沿,实践部分基于一个相同的例子实现了强化学习领域的主流基础算法,前沿部分介绍了强化学习领域的最新研究进展。本书配有相当数量的习题可供练习,配套代码基于Python实现,源代码均已开源,可开放获取。 |
| 题名主题: | 机器学习 教材 |
| 中图分类: | TP181 |
| 个人名称等同: | 袁莎 著 |
| 个人名称等同: | 白朔天 著 |
| 个人名称等同: | 唐杰 著 |
| 记录来源: | CN 人天书店 20211103 |