| ISBN/价格: | 978-7-302-60884-4:CNY69.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | Hadoop+Spark大数据分析实战/.迟殿委编著 |
| 出版发行项: | 北京:,清华大学出版社:,2022.07 |
| 载体形态项: | 290页:;+图:;+26cm |
| 丛编项: | 大数据技术丛书 |
| 提要文摘: | 本书是Hadoop+Spark大数据分析技术入门书,基于Hadoop和Spark两大框架体系的3.2版本,以通俗易懂的方式系统介绍Hadoop+Spark原生态组件的原理、集群搭建、实战操作,以及整个Hadoop生态系统主流的大数据分析技术。本书共分14章。第1章讲解Hadoop框架及新版本特性,并详细讲解大数据分析环境的搭建工作,包括Linux操作系统的安装、SSH工具使用和配置等。第2章讲解了Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFs和MapReduce。第3-12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadcop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume,以及Spark框架数据处理、机器学习等实战技术,并通过实际案例加深对各个框架的理解与应用。第13-14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。 |
| 题名主题: | 数据处理软件 |
| 非控主题词: | HadoopSpark |
| 中图分类: | TP274 |
| 个人名称等同: | 迟殿委 编著 |
| 记录来源: | CN 人天书店 20220720 |