MrFmy
MrFmy
全部文章
读书笔记
java学习笔记(1)
题解(5)
归档
标签
去牛客网
登录
/
注册
MrFmy的博客
全部文章
/ 读书笔记
(共2篇)
《Spark核心技术与高级应用》读书笔记
RDD是Spark提供的核心抽象,全称为Resillient Distributed Dataset,即弹性分布式数据集。RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,分为多个分区,每个分区分布在集群中的不同节点上,从而让RDD中的数据可以被并行操作。(分布式数据集)RDD通常通过Ha...
2019-11-21
0
0
《Spark核心技术与高级应用》读书笔记
通过阅读第一二章的内容,对于什么是spark,以及spark的扩展,包括Spark SQL和DataFrame、Spark Streaming、MLlib和ML、GraphX、SparkR,最主要的学会对spark集群的搭建,整个过程比较复杂,尤其对于新手来说。由于本人是第一次接触spark,之前也...
2019-08-28
0
0