HMM: Hidden Markov Model

  • 用于标注学习
  • 由隐藏的马尔科夫链随机生成观测序列的过程
  • 生成模型

基本概念

定义

  • 由隐藏的马尔科夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程
  • 状态序列(state sequence):隐藏的马尔科夫链随机生成的状态序列
  • 观测序列(observation sequence):每个状态生成的观测产生的随机序列
  • :所有可能的状态集合,:所有可能的观测集合
  • :长度为的状态序列,O是对应的观测序列
  • : 状态转移概率矩阵 , 指的是在时刻处于状态转移到的概率
  • :观测概率矩阵 , 在t时刻处于状态的条件下生成观测的概率
  • 是初始状态概率向量,时刻处于的概率
  • 确定了隐藏的马尔科夫链,生成不可观测的状态序列
  • 确定了如何从状态序列生成观测序列
  • 两个基本假设
    • 齐次马尔可夫性:隐藏马尔科夫链在任意时刻的状态只依赖于前一时刻状态,且与t无关
    • 观测独立性假设:任意时刻的观测只依赖于该时刻的隐马尔可夫链状态

观测序列的生成过程

  1. 按照初始状态分布产生状态
  2. 按照状态的观测概率分布生成
  3. 按照状态的状态转移概率分布产生状态
  4. ,如果,转3;否则终止。

3个基本问题

  1. 概率计算:给定模型,观测序列,计算出现概率
  2. 学习问题:已知观测序列,估计模型参数,使观测序列概率最大
  3. 预测问题(解码):已知模型和观测序列,对给定观测序列求条件概率P(I|O)最大的状态序列

概率计算法

直接计算法

  • 计算所有可能长度为的状态序列,求各个观测序列的联合概率,然后对所有可能的状态序列求和,得到。复杂度,计算量大。

前向算法

  • 前向概率:给定隐马尔科夫模型,定义到时刻部分观测序列,其状态的概率,
  • 观测序列概率的前向算法
  1. 初值:
  2. 递推: 对
  3. 终止:

计算量:

后向算法

  • 后向概率:给定HMM模型,定义在时刻状态为的条件下,从的部分观测序列为的概率为后向概率,
  • 算法:观测序列概率的后向算法
  1. ,