ISBN/价格: | 978-7-302-47967-3:CNY69.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | Hadoop + Spark生态系统操作与实战指南/.余辉著 |
出版发行项: | 北京:,清华大学出版社:,2017.9 |
载体形态项: | 337页:;+图:;+26cm |
丛编项: | 两大生态系统操作快速入门 |
提要文摘: | 全书共12章,大致分为3个部分,第1部分(第1~7章)讲解Hadoop的原生态组件,包括Hadoop、ZooKeeper、HBase、Hive环境搭建与安装,以及介绍MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本环境下实战操作。第2部分(第8~11章)讲解Spark的原生态组件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介绍Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本环境下实战操作,其中Flume和Kafka属于Apache开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目,包络网页日志离线项目和实时项目,在CDH版本环境下通过这两个项目将Hadoop和Spark原生态组件进行整合,一步步带领读者学习和实战操作。 |
题名主题: | 数据处理软件 指南 |
中图分类: | TP274 |
个人名称等同: | 余辉 著 |
记录来源: | CN shxhcmtsbmb 20170927 |