窄依赖:一个父RDD的partition的RDD只能被子RDD的partition最多使用一次 宽依赖:一个父RDD的partition的RDD会被子RDD的partition使用多次
coalesce vs repartition coalesce:用来减少分组 repartition:提高并行度
计数器 用来计数的