![Python深度学习与项目实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/647/36160647/b_36160647.jpg)
上QQ阅读APP看书,第一时间看更新
1.3 求损失函数的最小值
掌握了梯度下降算法以后,接下来就可以应用梯度下降算法找到使得损失函数取最小值的线性回归模型中的参数值,模型的参数就是损失函数的自变量。与1.1.3节中的损失函数一样,线性回归模型的损失函数如下所示。
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/37.gif?sign=1739141368-OCQPjDtNDe539w2AqletAdFLuPpZmC5t-0-2e4f9ccc9fceb6b384851dd2c270cc22)
根据梯度下降算法的工作原理,首先对参数值进行初始化,,
的初始值为
0。然后对损失函数求梯度
。计算出梯度值以后,就可以应用梯度下降算法逐步找到使得损失函数取最小值的参数值。损失函数的梯度使用
来表示,如下所示。
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/41.gif?sign=1739141368-MgRRYwosNjF2nS6NH0Xdu6njpoW00koS-0-d4b6ccd621df7d2671f7cd1bf6829f42)
其中各项的值分别如下。
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/42.gif?sign=1739141368-7BaXY1Vd9J6AQ9FMHTcWb9apj95DYcGF-0-59273cf2e76a5938fc0d7de03f11491c)
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/43.gif?sign=1739141368-qQL2ZJI6e9AnPoQ84dbYpnfKcxtQ2PWc-0-d7f759fb2f679a781d05addaa5acec34)
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/44.gif?sign=1739141368-6NIZq3FNskziNuVDwPyyO0cUyi2SvBIv-0-8801c73ad2ff02947bd7a29caa010d0d)
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/45.gif?sign=1739141368-EY6kqDGgMnHKX2LPpAcdxMuJVLOxf467-0-498e6c4feff277df21383d467e24a966)
模型中对权重逐个求偏导数的过程可以使用向量的形式进行表示,如下所示。
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/47.gif?sign=1739141368-W8AvUhqMr7LAl0mBZxI8hgMNoGDy4oLA-0-7e7e24f5762ee4cc3db82554e4e8a402)
通过以上的方式就能够分别计算出损失函数对于参数值与
的梯度值。计算出梯度值以后,就可以应用梯度下降算法对模型中的所有参数按照指定的学习率lr进行逐次迭代更新。将模型参数初始化为
与
后,使用梯度下降算法进行一次更新以后的参数使用
与
来表示,如下所示。
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/52.gif?sign=1739141368-Mu3aepnIKMy0dCwncpzXLmuJihWC5Xvo-0-829053a8b96e7d9b9576144c9117dec3)
![](https://epubservercos.yuewen.com/C81C9A/19245841301484006/epubprivate/OEBPS/Images/53.gif?sign=1739141368-jkL2vmowqbv55zTpnSjzq20jmLTejd6h-0-51e34babe6849db05a2f93b6414c9759)
同理,按照同样的方式可以继续对参数进行多次迭代更新,最后得到参数值、
,使损失函数取最小值。
、
的值就是这个线性回归模型的最优参数值。