梯度下降法_牛客博客

梯度下降法

704 浏览 0 回复 2018-11-20

我不是匠人

+关注

简介

梯度下降法不是一个机器学习算法
是一种基于搜索的最优化方法
作用：最小化一个损失函数
梯度上升法：最大化一个效用函数

在直线方程中，导数代表斜率
在曲线方程中，导数代表切线斜率
导数可以代表方向，对应 $J$ 增大的方向
$- η \frac{d J}{d θ}$
$η$ 称为学习率(learning rate)
$η$ 的取值影响获得最优解的速度
$η$ 取值不合适，甚至得不到最优解
$η$ 是梯度下降的一个超参数
并不是所有函数都有唯一的极值点
解决方案：
多次运行，所及初始点
梯度下降法的初始点也是一个超参数

线性回归中使用梯度下降法

目标: 使 $\sum_{i = 1}^{m} (y^{(i)} - {<mover accent="true">}^{y^</mover> (i)})^{2}$ 尽可能小
线性回归法的损失函数具有唯一的最优解

梯度下降法

简介

线性回归中使用梯度下降法

模拟梯度下降法