| ISBN/价格: | 978-7-300-29059-1:CNY49.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 数据科学并行计算/.白琰冰编著 |
| 出版发行项: | 北京:,中国人民大学出版社:,2021.05 |
| 载体形态项: | 275页:;+图:;+26cm |
| 丛编项: | 数据科学与大数据技术丛书 |
| 提要文摘: | 本书通俗地讲解数据科学与并行计算的基本概念、方法和原理,系统地介绍基于典型大数据场景的并行计算解决思路,同时涵盖常用的数据并行计算工具的操作实践,使读者知其然更知其所以然。本书的特色在于:注重对大数据科学方法核心应用的讲解,突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集,循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系,领会数据并行计算方法的精髓,掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点,能够利用并行计算工具解决实际的数据分析问题。 |
| 并列题名: | Parallel computing in data science eng |
| 题名主题: | 数据处理 研究 |
| 中图分类: | TP274 |
| 个人名称等同: | 白琰冰 编著 |
| 记录来源: | CN 人天书店 20210628 |