swust赵兴达

读书笔记《统计学习方法》读书笔记（9）EM算法及其推广

读书笔记

ACM-ICPC-小知识(5) BFS(1) KMP(3) Linux(1) Python-数据分析(2) string(1) two points(1) 二分(2) 分治(1) 博弈论-SG函数(4) 图论-环与根(2) 基础DP(2) 多项式(3) 字典树(1) 并查集(3) 心得体会(1) 思维(1) 数位DP(1) 数学-概率期望(1) 数学建模(1) 数据结构-RMQ(2) 数据结构-分块(1) 数据结构-并查集(2) 数据结构-莫队算法(1) 数论(6) 最短路(1) 未归档(99) 树形DP(2) 树状数组(1) 线段树(4) 网络流(1) 莫比乌斯函数(1) 莫比乌斯反演(1) 计算机基本原理(2) 计算机等级考试(1) 输入输出外挂(1) 题解(6)

/ 注册

《统计学习方法》读书笔记（9）EM算法及其推广

1834 浏览 0 回复 2019-11-01

swust赵兴达

+关注

统计学习方法

作者：李航

EM算法是一种非监督模型，是含有缺失数据的概率模型参数的极大似然估计法。
##
算法每次迭代分两步：
E：求期望
M：求极大
##

EM算法是含有隐变量的变量的概率模型极大似然估计或极大后验概率估计的迭代算法，含有隐变量的概率模型的数据表示为 $P(Y,Z|θ)$ .这里，Y是观测变量的数据，Z是隐变量的数据，θ是模型参数。EM算法通过迭代求解观测数据的对数似然函数 $L(θ)=logP(Y|θ)$ 的极大化，实现极大似然估计。每次迭代包括两步：

E步，求期望，即求 $logP(Y|θ)$ 关于 $P(Y|θ(i))$ 的期望：

$Q(θ,θ(i))=∑_ZlogP(Y,Z|θ)P(Z|Y,θ(i))$

称为Q函数，这里θ(i)是参数的现现估计值；

M步，求极大，即极大化Q函数得到参数的新估计值：

$θ(i+1)=arg maxθQ(θ,θ(i))$

在构建具体的EM算法时，重要的是定义Q函数，每次迭代中，EM算法通过极大化Q函数来增大对数似然函数L(θ).

EM算法在每次迭代后均提高观测数据的似然函数值，即： $P(Y|θ(i+1))≥P(Y|θ(i))$

在一般情况下EM算法是收敛的，但是不能保证收敛到全局最优。

EM算法应用及其广泛，主要应用于含有隐变量的概率模型的学习，高斯混合模型的参数估计是EM算法的一个重要的应用，下一章节主要介绍隐马尔可夫模型的非监督学习也是EM散发的一个重要的应用。

EM算法还可以解释为F函数的极大-极大算法，EM算法有许多的变形，如GEM算法，GEM算法的特点是每次迭代增加F函数值，从而增加似然函数值。
图片说明

图片说明

举报

收藏

赞

评论加载中...