书目检索

简单检索 多字段检索 组合检索 书目详细信息

用户登录

书目信息 机读格式(MARC)

《深入浅出强化学习,编程实战》

深入浅出强化学习,编程实战

ISBN/价格:978-7-121-36746-5:CNY89.00
作品语种:chi
出版国别:CN 110000
题名责任者项:深入浅出强化学习/.郭宪,宋俊潇,方勇纯著
出版发行项:北京:,电子工业出版社:,2020.3
载体形态项:264页:;+图:;+24cm
提要文摘:本书分3篇介绍了目前强化学习算法中最基本的算法。第1篇讲解基于值函数的强化学习算法,介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法,以及如何将函数逼近的方法引入强化学习算法中。第2篇讲解直接策略搜索方法,介绍了基本的策略梯度方法、AC方法、PPO方法和DDPG算法。第3篇讲解基于模型的强化学习方法,介绍了基于MPC的方法、AlphaZero算法基本原理及在五子棋上的具体实现细节。
题名主题:人工智能
题名主题:人工智能 程序设计
中图分类:TP18
个人名称等同:郭宪 著
个人名称等同:宋俊潇 著
个人名称等同:方勇纯 著
记录来源:CN 浙江省新华书店集团公司 20200325
总体评分: (共0人)
我的评分:
共12人预约本书
收藏

馆藏 附件 评论 相关借阅 借阅趋势

评论共 条 ,请登录后发表评论

用户评论