ISBN/价格: | 978-7-115-65983-5:CNY69.80 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 大模型技术30讲/.(美) 塞巴斯蒂安·拉施卡著/.Sebastian Raschka/.叶文滔译 |
出版发行项: | 北京:,人民邮电出版社:,2025.04 |
载体形态项: | 182页:;+图:;+24cm |
丛编项: | 图灵程序设计丛书 |
提要文摘: | 本书中,我们将学习各种新概念,如深度神经网络架构、计算机视觉、自然语言处理、产品化与部署和模型评估,内容涉及:如何利用修改后的数据集或模型来降低过拟合;如何处理深度神经网络训练中的常见随机性来源;如何在不改变模型架构或降低精度的情况下,通过优化加快模型推断速度;如何在实践中应用彩票机制假设和分布假设;如何使用和微调预训练的大规模语言模型;如何选择正确的时间设置K折交叉验证;以及区分自注意力与普通注意力,常见文本数据的数据增强技术,各种自监督学习技术,多GPU训练范式和各种生成式AI等技术。 |
题名主题: | 人工智能 |
中图分类: | TP18 |
个人名称等同: | 拉施卡 塞巴斯蒂安 著 |
个人名称次要: | 叶文滔 译 |
记录来源: | CN LCTBU 20250417 |