现场面试1小时多
从bert lstm xgboost问到hadoop问到c语言问到操作系统和计网问到问到mongdb sql数据指标问到业务问到爬虫
真真实实的劝退面

1 机器学习
kmeans 怎么确定k
文本聚类怎么做
文本聚类指标
短文本聚类怎么处理

xgboost是什么
然后顺便讲了相关的boost怎么做bagging gblt一堆东西是什么

各种指标常见的指标。。roc auc
2 深度学习
Lstm transformer bert 以上是讲结构以及手推部分
Bert缺点 效果为什么不好
wor2vec讲求解优化怎么做
新出的xlnet什么东西的知道结构吗?

3 爬虫怎么做的
Js加载怎么弄
反爬虫策略
这一部分我讲的超多,然后被打住了。。看样子面试官不是很懂。。

4 数据库
分布式数据库怎么扩容
Redis持久化
常见大数据操作
Sql优化
一个一个亿的表怎么加快查询
用过hadoop吗 答 用过一点 讲了点原理
5 算法
Topk问题
稳定排序举例子 以及为什么稳定
自己嘴贱说了堆排序 然后手搓建最小堆 和堆排序 差点卡住了
一个dp问题

其他的
1 C***
模板怎么用
虚函数
2 前端技术懂吗
撤了一点vue
3 内存
分页怎么分
内存对齐
3 网络
Tcp udp应用场景
4 业务
数据怎么驱动业务?。。忘记了