| ISBN/价格: | 978-7-302-59938-8:CNY139.00 |
| 作品语种: | eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | 策略前展、策略迭代与分布式强化学习/.(美)德梅萃·P.博赛卡斯(Dimitri P. Bertsekas)著 |
| 版本项: | 影印版 |
| 出版发行项: | 北京:,清华大学出版社:,2022.04 |
| 载体形态项: | 12,483页:;+图:;+24cm |
| 一般附注: | 国际知名大学原版教材——信息技术学科与电气工程学科系列 |
| 提要文摘: | 强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为Rollout(策略前展)。大量经验表明,Rollout是当前用得最广、最为可靠的强化学习方法之一。主要内容包括:第一章、动态规划原理;第二章、Rollout与策略改进;第三章、专用Rollout算法;第四章、值和策略的学习;第五章、无限时间分布式和多智能体算法。 |
| 并列题名: | Rollout, policy iteration, and distriibuted reinforcement learning eng |
| 题名主题: | 机器学习 高等学校 教材 英文 |
| 中图分类: | TP181 |
| 个人名称等同: | 博赛卡斯 德梅萃·P. (美) 著 |
| 记录来源: | CN 人天书店 20220428 |