什么是梯度下降2、梯度下降：下山的隱喻3、梯度下降有什么用

發布時間：2023-07-02 21:30:36 作者：網友整理

梯度下降是機器學習的動力之源。

經過前面兩節內容的鋪墊，我們可以開始講一講機器學習的動力之源：梯度下降。

梯度下降并不是一個很復雜的數學工具，其歷史已經有200多年了，但是人們可能不曾料到，這樣一個相對簡單的數學工具會成為諸多機器學習算法的基礎，而且還配合著神經網絡點燃了深度學習革命。

1、什么是梯度

對多元函數的各參數求偏導數，然后把所求得的各個參數的偏導數以向量的形式寫出來，就是梯度。

具體來說，兩個自變量的函數f（x1，x2），對應著機器學習數據集中的兩個特征，如果分別對x1，x2求偏導數，那么求得的梯度向量就是（∂f/∂x1，∂f/∂x2）T，在數學上可以表示成Δf（x1，x2）。那么計算梯度向量的意義何在呢？其幾何意義，就是函數變化的方向，而且是變化最快的方向。對于函數f（x），在點（x0，y0），梯度向量的方向也就是y值增加最快的方向。也就是說，沿著梯度向量的方向Δf（x0），能找到函數的最大值。反過來說，沿著梯度向量相反的方向，也就是 -Δf（x0）的方向，梯度減少最快，能找到函數的最小值。如果某一個點的梯度向量的值為0，那么也就是來到了導數為0的函數最低點（或局部最低點）了。

2、梯度下降：下山的隱喻

在機器學習中用下山來比喻梯度下降是很常見的。想象你們站在一座大山上某個地方，看著遠處的地形，一望無際，只知道遠處的位置比此處低很多。你們想知道如何下山，但是只能一步一步往下走，那也就是在每走到一個位置的時候，求解當前位置的梯度。然后，沿著梯度的負方向，也就是往最陡峭的地方向下走一步，繼續求解新位置的梯度，并在新位置繼續沿著最陡峭的地方向下走一步。就這樣一步步地走，直到山腳，如下圖所示。