接上节课没讲完的word2vec
word2vec(续)
训练策略:
SGD
<center> </center>Word2vec使用SGD训练存在的问题:
每次只有窗口内的词会参与训练,梯度矩阵太稀疏,训练效率低。
<center> </center>优化方法:
1.negative sampling
转化为二分类问题
2.hierarchical softmax
Glove
<center> </center>公式推导参考这里
词向量评估
<center> </center>词向量存在的问题
多义词
<center> </center>