京东二面没有问什么技术算法,就是聊项目,聊用过的东西,而且没有深入的聊,记录几个问到的不知道的点

1.hive

  • 2、是基于 Hadoop 的一个数据仓库工具
  • 3、可以将结构化的数据映射为一张数据库表
  • 4、并提供 HQL(Hive SQL)查询功能
  • 5、底层数据是存储在 HDFS 上
  • 6、Hive的本质是将 SQL 语句转换为 MapReduce 任务运行
  • 7、使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的批量数据计算。

hive不支持事物,查询时间长,Hive 只适合用来做海量离线数 据统计分析,也就是数据仓库

2.kafka

3.linux 底层