步子太快容易犧牲精度，梯度下降複雜度獲嚴格數學證明

阿新 • • 發佈：2021-08-24

梯度下降是機器學習中求最小值最常用的一種演算法。儘管這種演算法應用廣泛，但是人們關於它計算複雜度的理論研究卻寥寥無幾。

在今年 ACM 舉辦的計算機理論頂會 STOC 上，牛津大學和利物浦大學的學者們，給我們證明了這個理論問題的答案。

他們得到了梯度下降演算法的計算複雜度，等於兩類計算機問題的交集。

這篇文章也成為了 STOC 2021 的最佳論文。

梯度下降的複雜度

四位作者研究人員將目光放在了 TFNP 中兩個子集問題的交集。

第一個子集稱為 PLS（多項式區域性搜尋）。

這是一系列問題，涉及在特定區域中尋找函式的最小值或最大值。

屬於 PLS 的一個典型例子是規劃一條路線的任務，以最短的路線經過一些城市，且只能通過切換城市的順序來改變行程。

通過調整順序可以很容易看出哪些路線縮短了行程，最終你會找到某一條路線，無法進一步縮短路程，這條路線 x 就是你要找到的最小值。

用數學公式來表示就是：（p 是求路線總長度的函式，g (x) 表示改變 x 得到的新路線）

TFNP 問題的第二個子集是 PPAD（有向圖上的多項式奇偶校驗引數）。

這個問題的解來自更復雜的過程，比如 Brouwer 不動點定理，即對於滿足一定條件的連續函式，存在一個點保持不變。

例如，如果你攪動一杯水，Brouwer 不動點定理保證絕對會有一個水分子會回到它最初的位置。

用數學公式來表示就是：

實際應用中，我們不可能要求找到以上兩個問題絕對精確的解，只要誤差小於規定的值 ε 即可，也就是：

PLS 和 PPAD 這兩類問題的交集本身形成了一類稱為 PLS∩PPAD 的問題。

然而，直到現在，研究人員都無法找到 PLS∩PPAD 完全問題的一個天然的例子。所謂的完全問題，就是某類問題中最典型、最難的問題。

現在，來自牛津大學和利物浦大學的學者們終於找到了，梯度下降問題（GD）就是，它等價於 PLS 與 PPAD 的交集。

PPAD∩PLS 是可以通過在有界域上執行梯度下降來解決的所有問題的類別。

而 PLS 與 PPAD 的交集，被他們證明等價於 CLS（連續局域搜尋問題）

PLS 與 PPAD 的任意解（either-solution）就是 PLS∩PPAD 完全問題的解。

到了這裡，梯度下降演算法與這兩個問題有什麼聯絡呢？

請看梯度下降演算法的迭代公式：

在求解實際問題，我們也是在尋找區域性最小值的近似解。我們可以設定兩種計算終止條件：

1、如果 x’與 x 這兩個點的損失函式小於精度 ε：

那麼計算終止，這與前面 PLS 中的 Real-Local-Opt 問題類似。

2、如果 x’與 x 這兩個點的空間距離小於精度 ε：

那麼計算終止，這與前面 PPAD 中的 Brouwer 不動點問題類似。

第一種相當於是 PLS，第二種相當於是 PPAD。

該結果意味著，梯度下降演算法精度和速度之間存在基本聯絡，為獲得更高精度，計算時間將會不成比例地迅速增長。

精度與時間的平衡點

實際上，吳恩達在自己的機器學習課程中已經指出，梯度下降演算法的運算複雜度和步數 n 的平方成正比。

若對精度要求高，需要將學習率 η 設定得更小。

如果機器學習研究者可能希望將實驗的精度提高到 2 倍，那麼可能不得不將梯度下降演算法的執行時間增加到 4 倍。

這表明，梯度下降在實踐中必須做出某種妥協。要麼接受不太高的精度，要麼花費更長的執行時間來換取。

例如，一些對 SGD 進行加速的優化演算法，雖然收斂速度更快，但很有可能陷入區域性最小值。要想獲得精度更高的結果，往往必須迴歸到 SGD。

對於某些精度很重要的問題，執行時長會讓梯度下降演算法變得不可行。

但這並不是說梯度下降的快速演算法不存在，但如果存在著這樣的演算法，將意味著 PLS∩PPAD 也存在快速演算法，但尋找後者的快速演算法要比前者難得多。

最後，這一問題的計算機自動證明程式碼已經開源，有興趣的朋友可以前去觀摩嘗試。

參考連結：

https://www.quantamagazine.org/how-big-data-carried-graph-theory-into-new-dimensions-20210819/
https://www.youtube.com/watch?v=as720_SRpY0&ab_channel=SIGACTEC
https://arxiv.org/abs/2011.01929
https://github.com/jfearnley/PPADPLS/

步子太快容易犧牲精度，梯度下降複雜度獲嚴格數學證明

梯度下降是機器學習中求最小值最常用的一種演算法。儘管這種演算法應用廣泛，但是人們關於它計算複雜度的理論研究卻寥寥無幾。

學習機器學習-二分類問題分類器，梯度下降法，程式碼展示。

要求：自己生成一個樣本總數為20的兩類資料集，每類分別為10個樣本。實現線性分類器。

解惑3：時間頻度，演算法時間複雜度

一、概述先放百科上的說法：演算法的時間複雜度（Time complexity）是一個函式，它定性描述該演算法的執行時間。這是一個代表演算法輸入值的字串的長度的函式。

6.4: 一個數組中有一種數出現K次，其它數都出現了M次，M>1, K<M,找到出現K次的數，要求，額外空間複雜度O(1),時間複雜度O(N)

6.4: 一個數組中有一種數出現K次，其它數都出現了M次，M > 1, K < M,找到出現K次的數，要求，額外空間複雜度O(1),時間複雜度O(N)

犧牲速度來節省記憶體，Redis是覺得自己太快了嗎

技術標籤：Redisredisziplist壓縮列表ziplist連鎖更新時間換空間犧牲速度來節省記憶體，Redis是覺得自己太快了嗎

千萬別錯過：微信這幾步走的太快了，節奏槓槓滴

loonggg 讀完需要 4分鐘速讀僅需 2 分鐘對於短視訊來講，對於視訊號來講，我已經在之前的文章中說過很多遍了，在一個新功能出現的時候，一定要抓住這個機會，學著成為第一批吃紅利的人，成為第一批吃螃蟹

Chrome 瀏覽器更新太快，谷歌 Chrome OS 將跳過 95 版本加緊追趕

6 月 13 日消息穀歌在 3 月份宣佈，將從 2021 年第三季度的 Chrome 94 開始，里程碑更新的頻率由六週改為四周，同時每兩週釋出一次針對安全性的較小更新。

4G 資費下降太快，中國臺灣地區 5G 商用一週年使用者普及率低

據中國臺灣地區媒體報道，中國臺灣地區通訊主管機構 NCC 正式公佈了臺灣 5G 使用者資料：276 萬戶，普及率 11.8%。

面試官：Mysql 中主庫跑太快，從庫追不上怎麼整？

作者|萊烏寫這篇文章是因為之前有一次刪庫操作，需要進行批量刪除資料，當時沒有控制好刪除速度，導致產生了主從延遲，出現了一點小事故。

3種Python惡搞指令碼，醫院的WiFi實在太快了

Python 無限惡搞朋友電腦，別提有多爽了，哈哈，打造自己的桌布修改器，電腦無限鎖屏，無線彈窗，都在這裡！！

索尼 PS5 內建 SSD 太快，遊戲開發者表示玩家都沒時間閱讀遊戲提示

2 月 18 日訊息，《地平線: 西之絕境》開發商 Guerilla Games 透露，由於 PS5 內建 SSD 的載入速度太快，他們不得不為此新增額外的功能，以增加載入畫面這一過程的時間，讓玩家有充足的時間閱讀遊戲提示等內容。Gue

英雄死得太快了，《英雄聯盟》12.10 版本將整體降低英雄傷害

5 月 8 日訊息，據《英雄聯盟》官方訊息，遊戲將在 12.10 版本中增加現存所有英雄的耐久度，降低《英雄聯盟》整體的傷害量。英雄聯盟官方表示，目前《英雄聯盟》中的傷害實在太高了。雖然高傷害很好玩並且很刺激，但

解決Android Studio日誌太長或滾動太快問題

前言安卓開發經常遇到那種日誌太長或滾動得太快，我們直接的解決辦法就是進行日誌輸出長度增大和新增日誌過濾器，個人推薦用adb logcat處理更加方便靈活。

opencv 形態學變換(開運算，閉運算，梯度運算)

形態學裡把腐蝕和膨脹單獨拿了出來，其他操作（保括膨脹和腐蝕的組合操作）都叫形態學變換。

快來聽書吧，喜馬拉雅VIP會員12月103元

快來聽書吧，喜馬拉雅VIP會員12月報價218元，限時限量115元券，實付103元包郵，領券併購買。

排序演算法相關的時間複雜度和程序穩定性，快排的原理

排序圖表:有序的變化是向量變化(向量變化存在正負)：（內部有序的部分+某個增量元素(同趨勢)）整體為具有同樣有序趨勢的新的有序部分。一、插入排序(逐個插入)(基底空容器) 每次將某個待排序的資料，跟前面

以太坊2.0後，Filecoin異軍突起！

以太坊升級在即存隱憂近期幣圈出現一條爆炸性新聞，那就是：以太坊開發者、Prysmatic Labs聯合創始人Raul Jordan表示，其團隊將在10月15日前完成所有功能開發。

小米小愛音箱開發版測試招募：叫“小愛同學”更不容易誤應答，回答更靈敏

10月12日訊息小米社群已經發布小愛音箱開發版內測招募活動，小米表示，參與使用者可以提前體驗最新的喚醒優化效果；提前體驗更多更好用、更好玩的功能；與產品經理、研發工程師們更近距離的溝通體驗問題等。

以太坊2.0上線，手機也能挖礦｜以太坊系列

當以太坊挖礦升級到以太坊2.0時，將解決當前面臨的問題. 但是，從當前的以太坊1.0切換到以太坊2.0是一個巨大的專案，其共識機制將從POW轉變為POS.隨著共識機制的轉變，以太坊的挖礦方式也將發生巨大變化.

彤欣言幣：10.22比特幣以太坊投資實戰技巧，MACD指標定律

彤欣言幣：10.22比特幣以太坊投資實戰技巧，MACD指標定律在市場操作過程中，除了基本面的分析外，技術分析是判斷價格走勢更實際的方式，技術分析中指標的運用是新手必須要學習的，MACD指標在市場交易歷史

步子太快容易犧牲精度，梯度下降複雜度獲嚴格數學證明

梯度下降的複雜度

精度與時間的平衡點

相關推薦