ISBN/价格: | 978-7-118-13179-6:CNY89.00 |
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 深度强化学习/.(印度)莫希特·塞瓦克(Mohit Sewak)著/.尹大伟,吴敏杰译 |
出版发行项: | 北京:,国防工业出版社:,2024.06 |
载体形态项: | 165页:;+图:;+25cm |
一般附注: | 装备科技译著出版基金 |
提要文摘: | 本书主要内容包括:介绍了强化学习的基本概念,如智能体、环境、状态、奖励、动作等;介绍了强化学习的数学和算法原理,如马尔可夫决策过程和贝尔曼方程,并在此基础上讨论了动态规划、值迭代和策略迭代方法;介绍了强化学习的估计与控制问题,并通过实例展示了Q学习的编程;深入探讨了深度学习的概念、架构机制,通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念,为后续章节与强化学习算法相结合作铺垫。 |
并列题名: | Deep reinforcement learning eng |
题名主题: | 机器学习 |
中图分类: | TP181 |
个人名称等同: | 塞瓦克 莫希特 (印) 著 |
个人名称次要: | 尹大伟 译 |
---|
个人名称次要: | 吴敏杰 译 |
记录来源: | CN LCTBU 20250417 |