书目检索

简单检索 多字段检索 组合检索 书目详细信息

用户登录

书目信息 机读格式(MARC)

《大模型轻量化:模型压缩与训练加速》

大模型轻量化:模型压缩与训练加速

ISBN/价格:978-7-302-68600-2:CNY129.00
作品语种:chi
出版国别:CN 110000
题名责任者项:大模型轻量化/.梁志远著
出版发行项:北京:,清华大学出版社:,2025.4
载体形态项:384页:;+图:;+24cm
相关题名附注:英文并列题名取自封面
提要文摘:本书分为3部分, 共10章。第1部分 (第1-5章), 介绍大模型的背景与面临的问题, 以及Transformer和MoE架构的基本原理; 重点讲解模型压缩、训练加速和推理优化等核心技术, 包括量化、蒸馏和剪枝等, 并通过实际案例验证其效果。第2部分 (第6、7章), 重点介绍端侧学习与计算引擎优化策略, 尤其是动态Batch和异构执行的工程实现。第3部分 (第8-10章), 针对高性能算子库与手工算子开发, 分别以cuDNN、NEON、CUDA等为代表, 揭示算子优化的细节, 最后, 以国产开源模型DeepSeek-V3为例, 展现从训练到推理的综合优化方案。
并列题名:Lightweighting of large language models eng
题名主题:人工智能
中图分类:TP18
个人名称等同:梁志远 著
记录来源:CN LCTBU 20251126
总体评分: (共0人)
我的评分:
共12人预约本书
收藏

馆藏 附件 评论 相关借阅 借阅趋势

评论共 条 ,请登录后发表评论

用户评论