一上来就开始介绍最熟悉的项目,然后面试管问项目细节。后面问了几个基础的问题如下:
HBase的使用场景(强调,rowkey查询快)
HBase的组件
Kafka的partition和顺序消费,怎么读取历史数据
Spark和hadoop区别,spark常用算子,spark做数据处理,整个流程,用了哪些api
整个集群搭建怎么分布的
比较关注的是数据最终以什么形式展现
(楼主只说了提供了查询借接口,没有展现出来)