Kudu项目的初衷是在Hive的批量处理和HBase的随机读写之间找一个平衡点
kudu的批量处理性能优于hbase,随机读写优于hive。
hive的一般用于构建数据仓库,kudu一般用于做近实时的查询分析。
hive一般要配合impala或者presto或者kylin等做交互式查询
kudu一般配合impala做交互式查询,也可以配合其他的做数据查询。
hbase一般可以配合apache Phoenix提供查询功能。
使用hive、kudu、hbase还要看需求:如果是建立数据仓库,做T+1天的BI系统,还是要选择Hive。
如果希望数据是分钟级别的延时,希望尽量快的看到结果,而且是结构数据,选kudu是没错的。
如果需求是大量快速的写,经常单条的读,那必须是hbase,kudu和hive都不行。
作者:老冯
链接:https://www.zhihu.com/question/431957266/answer/1595808341
来源:知乎