隐语义模型
- 从数据出发,进行个性化推荐
- 用户和物品之间有着隐含的关系
- 隐含因子让计算机理解就好
- 将用户和物品通过中介隐含因子联系起来
求解
- 梯度下降方向
- 迭代求解
隐语义模型样本选择
- 对每个用户,要保证正负样本的平衡(数目相似)
- 选取那些很热门,而用户却没有行为的物品
- 对于用户-物品集K{(u,i)}其中如果(u,i)是正样本,则有R ui=1,负样本则R ui=0
参数选择
- 隐特征的个数F,通常F=100
- 学习速率alpha,别太大
- 正则化参数lambda,别太大
- 负样本/正样本比例ratio
协同过滤VS隐语义
- 原理:协同过滤基于统计,隐语义基于建模
- 空间复杂度:隐语义模型较小
- 实时推荐依旧难,目前离线计算多