跳转至

梯度有界性

非凸函数

表示一个具有多个局部最小值和鞍点的函数

鞍点:函数 𝑓(𝑥) 的鞍点是指在某一点 𝑥∗,函数值 𝑓(𝑥∗) 在不同方向上表现出相反的极值趋势:
在某些方向上,𝑓(𝑥∗)是局部最大值。
在其他方向上,𝑓(𝑥∗)f 是局部最小值。换句话说,鞍点是一个混合极值点。

梯度有界性在SGD非凸优化中的作用

梯度有界性数学表示为

\[||\nabla f(x)|| \leq B\]

B为一个正常数,称为梯度的上界。

SGD更新规则为

\[x_{t+1}=x_t-\eta \nabla f(x_t)\]

由于梯度有界性,可以确保每一步更新都不会过大