| 提要文摘: | 本章共9章,第1章为Spark基础,主要包括Spark基础知识、Spark应用场景以及Spark生态系统等内容;第2章为Scala语言基础和面向对象编程,包括Scala编程基础、Scala数组和集合以及映射、Scala对象和多继承等内容;第3章为Spark设计与运行原理,包括Spark架构、Spark Core组成、Spark编程模型和计算模型等内容,第4章为Spark环境搭建和使用,包括Spark系列软件环境配置(JDK、Hadoop、MySQL-Server、Hive、ZooKeeper、Scala、Kafka、Spark)和Spark- shell交互式命令工具使用等内容;第5章为Spark RDD弹性分布式数据集,包括RDD创建方式、RDD.转换算子和行动算子操作方法等内容;第6章为Spark SQL结构化数据处理引擎,包括DataFrame和DataSet的创建和操作以及利用Spark SQL操作MySQL数据源等内容,第7章为Spark Streaming实时流处理引擎,包括Spark Streaming程序开发、DStream高级数据源使用和数据转换操作等内容;第8章为Spark M1ib机器学习,包括机器学习基础、SparkILlib机器学习库和常用算法等内容;第9章为订单交易监控系统,主要完成订单交易实时监控平台的搭建。 |