| ISBN/价格: | 978-7-302-68743-6:CNY59.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 大数据技术与应用/.周显春,肖衡主编 |
| 出版发行项: | 北京:,清华大学出版社:,2025.05 |
| 载体形态项: | 287页:;+26cm |
| 丛编项: | 大数据与人工智能技术丛书 |
| 提要文摘: | 本书以Python为基础,讲解HDFS分布式文件系统和PySpark3编程。全书共9章,内容包括Docker环境下Hadoop与Spark的配置、HDFS操作技巧、RDD编程方法、Spark SQL应用、Spark架构及运行机制、Pandas on Spark使用及Spark ML编程实践。 |
| 题名主题: | 数据处理 高等学校 教材 |
| 非控主题词: | HadoopPySpark |
| 中图分类: | TP274 |
| 个人名称等同: | 周显春 主编 |
| 个人名称等同: | 肖衡 (女, 主编 |
| 记录来源: | CN LCTBU 20251009 |