书目检索

简单检索 多字段检索 组合检索 书目详细信息

用户登录

书目信息 机读格式(MARC)

《深度剖析DeepSeek大模型:原理、开发与优化部署》

深度剖析DeepSeek大模型:原理、开发与优化部署

ISBN/价格:978-7-111-77922-3:CNY119.00
作品语种:chi
出版国别:CN 110000
题名责任者项:深度剖析DeepSeek大模型/.丁小晶,崔远编著
出版发行项:北京:,机械工业出版社:,2025.06
载体形态项:12,312页:;+24cm
丛编项:AIGC与大模型技术丛书
提要文摘:本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的剖析。其次解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、多轮对话管理、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。
题名主题:人工智能
中图分类:TP18
个人名称等同:丁小晶 编著
个人名称等同:崔远 编著
记录来源:CN LCTBU 20251009
总体评分: (共0人)
我的评分:
共12人预约本书
收藏

馆藏 附件 评论 相关借阅 借阅趋势

评论共 条 ,请登录后发表评论

用户评论