隐语义模型

  • 从数据出发,进行个性化推荐
  • 用户和物品之间有着隐含的关系
  • 隐含因子让计算机理解就好
  • 将用户和物品通过中介隐含因子联系起来
求解
  • 梯度下降方向
  • 迭代求解
隐语义模型样本选择
  • 对每个用户,要保证正负样本的平衡(数目相似)
  • 选取那些很热门,而用户却没有行为的物品
  • 对于用户-物品集K{(u,i)}其中如果(u,i)是正样本,则有R ui=1,负样本则R ui=0
参数选择
  • 隐特征的个数F,通常F=100
  • 学习速率alpha,别太大
  • 正则化参数lambda,别太大
  • 负样本/正样本比例ratio

协同过滤VS隐语义

  • 原理:协同过滤基于统计,隐语义基于建模
  • 空间复杂度:隐语义模型较小
  • 实时推荐依旧难,目前离线计算多