5. word2vec:skip gram 损失函数

6. LR, SVM

5. word2vec:训练目标是什么,skip-gram ,cbow, 层次softmax, 高频词和低频词训练出的表示有什么特点, 怎么解决 。

1. 介绍项目,注意不要刻意夸大自己在项目中的作用,实话实说就行,项目中分析整个问题、选择算法、建模调参的过程想清楚,特别是为什么选这个参数不选那个参数要想清楚。虽然炼丹炼^_^多了、黑盒子也很多,讲不出也可以理解,但是如果从逻辑上或者直观上能分析清楚这个参数比另一个参数好的原因,应该是加分项,而且面官会问的很细。

实习经历揉的很碎,这个肯定要准备的,碎到具体的业务指标,为什么选择这样的指标,为什么重要?

剩下的就是 你最好了解一下hive,map reduce,用户模型之类,BI
tool,指标体系搭建(好像也是他们平时要实践的)等吧

阿里的感觉是比较重视工程的能力,你是不是可以应对量级较大的数据,很多模型的存在很依赖于要达到什么样的目的,数据的关注的重点:数据质量,数据你怎么处理,怎么使用,比模型调参更体现了你的能力。

1. 数据库一些建立的模型应用场景
2. ETL 数据仓库技术
3. 聊了一下我做过的反欺诈机器学习整个流程细节,楼主说了好久,就很细就对了
4. 接3,既然做了欺诈,就要了解有不同的欺诈模型
bb们最好做的时候,都要知道你为什么要用这个方法,用什么去量化结果,有的时候图可能没有数字方法准确。
4. 各种机器学习评估指标 什么 那些matrix得吃透昂
5. 归因分析是啥?应用场景(具体一些)
6. r 语言的使用
7. python 的使用
8. 主成分分析和因子分析 (用r咋用的,楼主说的是SAS)
9. 跟我聊了很多数据开发做什么事情的。很nice