| ISBN/价格: | 978-7-302-69714-5:CNY256.00 |
|---|---|
| 作品语种: | chi eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | 强化学习与随机优化/.(美)沃伦·B.鲍威尔(Warren B. Powell)著/.郭涛译 |
| 出版发行项: | 北京:,清华大学出版社:,2025.09 |
| 载体形态项: | 20,780页:;+图:;+24cm |
| 提要文摘: | 本书提供了一个可以借助5个核心组件(状态变量、决策变量、外部信息变量、转移函数和目标函数)对任何序贯决策问题进行建模的通用框架;强调了可能影响任何模型的12种不确定性,并将做决策的各种方法(称为策略)归纳为4个基本类别,涵盖学术文献中提出的或实践中使用的所有方法。 |
| 并列题名: | Reinforcement learning and stochastic optimization eng |
| 题名主题: | 机器学习 最优化算法 |
| 中图分类: | TP181 |
| 个人名称等同: | 鲍威尔 沃伦·B (美) 著 |
| 个人名称次要: | 郭涛 译 |
| 记录来源: | CN LCTBU 20260227 |