10.20一面40min。(发的邮件岗位是产品运营,以为是调剂的,还搜了一些运营问题,结果进去后面试官说邮件发的有问题,招的还是数据分析。)

  1. 自我介绍。
  2. mysql去重的方法(distinct、group by);有什么差别。
  3. MapReduce原理。
  4. 数据倾斜原理和解决方案。
  5. hive了解吗(不了解)。
  6. 机器学习算法有哪些,举例。
  7. 逻辑回归原理;逻辑函数是怎样的,优化目标是什么。
  8. 链表结构是怎样的;怎么进行链表排序;适合做什么操作。
  9. 散列表是什么。
  10. sql中有几种连接方式,有什么区别。