感觉自己有些没有回答全面,欢迎大神们赐教,感谢。

  1. FM 和 LR 最大的差异是什么?
  2. DeepFM 相比 FM 做了什么样的提升?
  3. DeepFM 相比 FM 是学到了一些高阶的特征组合,那用LR能不能实现相似的提升?
  4. 为什么CTR预估不直接用 LR 做?
  5. LR 相比 GBDT XGBoost 有哪些不足?
  6. 如何解决欠拟合?
  7. 假设一定要用LR 做 CTR预估,怎样做才能实现比较好的效果?
    (答:人工特征工程,做交叉特征。)
  8. 为什么要做交叉特征呢?特征组合的好处是什么?
  9. 数值编码、特征离散化的作用?
  10. 特征离散化的方法。
  11. 离群点对于LR的影响。
  12. 训练样本分布和测试样本分布不一致,应该怎样处理?
  13. 假设训练样本分布和测试样本分布不一致,测试样本有一些扰动,会遇到怎样的问题?
  14. 如何结果过拟合?
  15. L1正则和L2正则的差异
  16. DeepWalk的原理。
  17. DeepWalk 重新生成向量的目的是什么?
  18. CBOW与skip-gram区别?
  19. skip-gram 使用 softmax会遇到哪些问题?
  20. 神经网络中的Dropout与机器学习的哪种方法类似?
  21. 为什么神经网络会有梯度消失和梯度爆炸的问题,怎样解决?
  22. 机器学习 与 神经网络的优化算法?
  23. SGD的优缺点。
  24. 介绍 Adam 优化算法