一面挂:
简单介绍项目
1.什么是过拟合,为什么会过拟合,如何解决;
2.生成模型和判别模型区别,举例;
3.贝叶斯公式有什么作用,有哪些局限性,什么是先验概率和后验概率,什么是朴素贝叶斯分类,知道贝叶斯网络吗,和朴素贝叶斯有什么区别
4.逻辑回归怎么估计参数,什么是最大似然
5.什么是决策树,决策树有什么用,决策树生成方法都有哪些都有什么特点,决策树可以从哪些方面进行改进;
6.什么是随机森林,基本思路,为什么降低了方差,效果一定比简单决策树效果好吗,什么情况下会比简单决策树效果差;
7.boosting基本思路介绍,Xgboost什么原理,比GBDT有什么改进,
8.神经网络是怎么学习的,描述一下RNN,描述一下LSTM结构,为什么可以解决梯度消失和爆炸问题,LSTM可以怎么改进
9.知道哪些抽样方法,举了某个场景,说用哪种抽样方法
10.如何实时进行时间序列异常点检测,有什么思路
11.用户画像,有很多特征你觉得首先怎么处理,聚类和分类有什么区别,聚类都有哪些方法,介绍一下k-means算法过程,有什么改进的思路
12.什么是图,最短路径算法的思想,如何检测有向图有没有环
13.一个由m种字符组成的长为n的字符串,求出现频率最高的前k种字符(1<=k<=m)