| ISBN/价格: | 978-7-5198-6961-8:CNY128.00 |
|---|---|
| 作品语种: | chi eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习/.(英)菲尔·温德尔(Phil Winder)著/.邹伟,康俊鹏,王伟译 |
| 出版发行项: | 北京:,中国电力出版社:,2023 |
| 载体形态项: | 20,427页:;+图:;+24cm |
| 提要文摘: | 本书共11章,内容包括:强化学习概述、马尔可夫决策过程,动态规划,蒙特卡洛方法、时序差分学习,Q学习和n步算法、深度Q网络、梯度策略等。 |
| 并列题名: | Reinforcement learning eng |
| 题名主题: | 机器学习 |
| 中图分类: | TP181 |
| 个人名称等同: | 温德尔 (英) (Winder, Phil) 著 |
| 个人名称次要: | 邹伟 译 |
| 个人名称次要: | 康俊鹏 译 |
| 个人名称次要: | 王伟 译 |
| 记录来源: | CN LLBF 20230420 |
| 记录来源: | CN TSG 20230710 |