通过阅读第一二章的内容,对于什么是spark,以及spark的扩展,包括Spark SQL和DataFrame、Spark Streaming、MLlib和ML、GraphX、SparkR,最主要的学会对spark集群的搭建,整个过程比较复杂,尤其对于新手来说。由于本人是第一次接触spark,之前也没有学过hadoop等,所以对于一些概念不是很清楚,正在学习hadoop加强对Hadoop的学习,便于后面的学习。