| ISBN/价格: | 978-7-111-79228-4:CNY99.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | DeepSeek硬核技术解读/.刘丹, 尹俊希, 杨院伶著 |
| 出版发行项: | 北京:,机械工业出版社:,2025.11 |
| 载体形态项: | X, 242页:;+图:;+24cm |
| 丛编项: | 智能系统与技术丛书 |
| 一般附注: | CMP BOOKS |
| 提要文摘: | 本书全面解析了DeepSeek的核心原理与技术实现,旨在帮助读者深入理解其架构设计、训练方法、优化策略和应用场景。全书分为两大部分,第一部分介绍DeepSeek学习的前置知识,包括Transformer架构、强化学习基础、大语言模型量化、大语言模型分布式训练等内容,帮助读者建立扎实的理论基础。第二部分聚焦DeepSeek核心技术,主要介绍MoE架构负载均衡、基础设施层的优化、数据处理、训练逻辑、推理优化等内容。 |
| 题名主题: | 人工智能 |
| 中图分类: | TP18 |
| 个人名称等同: | 刘丹 著 |
| 个人名称等同: | 尹俊希 著 |
| 个人名称等同: | 杨院伶 著 |
| 记录来源: | CN 百万庄 20251104 |