今天在现场面了有赞的大数据开发岗 可能是我太菜了 然后给我加了一轮技术面 总共四面
个人学习笔记: https://zhuanlan.zhihu.com/go-for-it
一面:
聊实习
介绍项目
hashmap concurrenthashmap
jvm内存模型
java内存模型
聊聊java并发
hadoop mr的shuffle
spark shuffle
数据库的acid 四个事务隔离级别
每层隔离级别是怎么解决上一层的问题
spark sql的执行原理 从anltr4 到catalyst里面的逻辑优化 一直到物理计划的生成
此外还问了一个问题:spark 物理优化做了啥, 答啥都没做 spark2.3版本源码里 我只看到了对每个具体的逻辑算子生成物理执行计划的规则 缺没有类似关系型数据库中 基于代价计算来选取 多个物理执行计划中最优的策略, spark sql默认就是选第一个 而不是多个选最优的
你才实习了两个月 你咋做了这么多?
然后就是第二面

二面:
自我介绍
聊实习
聊项目
yarn出现的背景
yarn源码看过吧 说下你的理解,我从rpc 事件库 状态机库 还有宏观的rm nm appmaster container聊了下
spark比较熟悉是吧 找一个最熟的聊一聊
spark sql原理详细说一下
sql逻辑优化做了啥
sql逻辑优化 谓词下推的意义是啥
spark job提交时 和yarn交互的细节说一下, 这个打不出来 我只简单说了 起appmaster的过程 ,面试官问的是提交到yarn的taskscheduler backend的细节。。。这谁记得
被面试官嫌弃 你咋哪里都是蜻蜓点水
hadoop其他组件熟悉吗 哪个最熟 我来问问。。。
我也不知道哪个最熟 hive算不熟的吧 毕竟实习也不是做数仓的
要不zookeeper hbase hive kafka随便问吧 hive我最不熟
。。。面试官无语=_= 时间不够啊 你说一个最熟的 我来问
。。。。。。 要不你就问hive吧 这个我最不熟
聊天鬼才 。。。。。。。。。
hive是啥
有哪些数据倾斜问题
hive如何解决数据倾斜问题

你实习才一个月咋做了这么多事?
好了 去等hr面吧

我在等hr的时候 面试官。。。把他老大拉来了(我还以为是hr) 说来这边继续面 我越想越不对。。。hr不都是小姐姐 我们hrbp咋是威严大叔
三面:
聊人生 自我介绍
感觉没有具体的技术问题
都是比较宽和大的东西
技术观和心得体会啥的
我越面越感觉不对劲 这肯定不是hr 我估计被加面了
然后主动问下面试官:咱这面应该不是hr面吧
大叔答:不是 有时候情况特殊 会给同学加面
我答:这样啊 那很荣幸
你实习才一个月咋做了这么多事? 3

四面:hr小姐姐聊人生
也没问目标薪资 和我同去的一个小伙伴 没被加面 都问了。。。。。。

整体流程很快 全程两个半小时吧 口干舌燥的。 技术问的挺全面和细致的 感觉很愉快
希望能offer
个人学习笔记: https://zhuanlan.zhihu.com/go-for-it