简单检索 多字段检索 组合检索 书目详细信息

ISBN/价格：	978-7-302-59938-8:CNY139.00
作品语种：	eng
出版国别：	CN 110000
题名责任者项：	策略前展、策略迭代与分布式强化学习/.(美)德梅萃·P.博赛卡斯(Dimitri P. Bertsekas)著
版本项：	影印版
出版发行项：	北京:,清华大学出版社:,2022.04
载体形态项：	12,483页:;+图:;+24cm
一般附注：	国际知名大学原版教材——信息技术学科与电气工程学科系列
提要文摘：	强化学习，也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发，不断产生改进策略的过程。如果仅仅生成一步改进策略，就称为Rollout(策略前展)。大量经验表明，Rollout是当前用得最广、最为可靠的强化学习方法之一。主要内容包括：第一章、动态规划原理；第二章、Rollout与策略改进；第三章、专用Rollout算法；第四章、值和策略的学习；第五章、无限时间分布式和多智能体算法。
并列题名：	Rollout, policy iteration, and distriibuted reinforcement learning eng
题名主题：	机器学习高等学校教材英文
中图分类：	TP181
个人名称等同：	博赛卡斯德梅萃·P. (美) 著
记录来源：	CN 人天书店 20220428

总体评分：（共0人）

我的评分：

简单检索多字段检索组合检索书目详细信息