京东二面没有问什么技术算法,就是聊项目,聊用过的东西,而且没有深入的聊,记录几个问到的不知道的点
1.hive
- 2、是基于 Hadoop 的一个数据仓库工具
- 3、可以将结构化的数据映射为一张数据库表
- 4、并提供 HQL(Hive SQL)查询功能
- 5、底层数据是存储在 HDFS 上
- 6、Hive的本质是将 SQL 语句转换为 MapReduce 任务运行
- 7、使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的批量数据计算。
hive不支持事物,查询时间长,Hive 只适合用来做海量离线数 据统计分析,也就是数据仓库
2.kafka
3.linux 底层