失散
失散
全部文章
Hadoop
# ...(2)
# bulabula(14)
# C语言基础(3)
# 动态规划(5)
# 数据结构(4)
# 贪心(8)
Hive(10)
java(2)
Linux(2)
未归档(17)
杂七杂八(5)
经验分享(4)
归档
标签
去牛客网
登录
/
注册
白展堂点你哟
一山一水皆故人
全部文章
/ Hadoop
(共1篇)
mapreduce之map端的join
map-side join: 核心思想:将小表进行分布式缓存,在map-task阶段读取缓存文件数据存储到内存数据结构中,以供reduce阶段连接查找。 适用场景:有一个或者多个小表(文件) 优点:将小表缓存,可以高效查询;由于在map阶段进行连接,所以将会大大减小map到reduce端的数据...
mapreduce
2019-09-05
1
491