感觉自己有些没有回答全面,欢迎大神们赐教,感谢。
- FM 和 LR 最大的差异是什么?
- DeepFM 相比 FM 做了什么样的提升?
- DeepFM 相比 FM 是学到了一些高阶的特征组合,那用LR能不能实现相似的提升?
- 为什么CTR预估不直接用 LR 做?
- LR 相比 GBDT XGBoost 有哪些不足?
- 如何解决欠拟合?
- 假设一定要用LR 做 CTR预估,怎样做才能实现比较好的效果?
(答:人工特征工程,做交叉特征。) - 为什么要做交叉特征呢?特征组合的好处是什么?
- 数值编码、特征离散化的作用?
- 特征离散化的方法。
- 离群点对于LR的影响。
- 训练样本分布和测试样本分布不一致,应该怎样处理?
- 假设训练样本分布和测试样本分布不一致,测试样本有一些扰动,会遇到怎样的问题?
- 如何结果过拟合?
- L1正则和L2正则的差异
- DeepWalk的原理。
- DeepWalk 重新生成向量的目的是什么?
- CBOW与skip-gram区别?
- skip-gram 使用 softmax会遇到哪些问题?
- 神经网络中的Dropout与机器学习的哪种方法类似?
- 为什么神经网络会有梯度消失和梯度爆炸的问题,怎样解决?
- 机器学习 与 神经网络的优化算法?
- SGD的优缺点。
- 介绍 Adam 优化算法