Tensorflow2.0學習筆記-複雜度、學習率

阿新 • • 發佈：2020-12-24

技術標籤：筆記

一、神經網路的複雜度

神經網路複雜度分為空間複雜度和時間複雜度
在這裡插入圖片描述

空間複雜度：

空間複雜度由層數，和待優化引數的個數進行表示。
層數 = 隱藏層的層數 + 1個輸出層
總引數 = 總w + 總b
上圖中引數：3x4+4 + 4x2+2 = 26

時間複雜度

時間複雜度使用神經網路的運算次數進行表示。

上圖中3x4 + 4x2 =20

二、學習率

在使用中，我們可以使用指數衰減學習率來合理的設定學習率。我們可以先使用較大的學習率，快速得到最優解，然後使用指數衰減，逐漸減小學習率，使模型在訓練後期穩定。
指數衰減學習率 = 初始學習率 * 學習衰減率 **（當前輪數/多少輪衰減一次）

w = tf.Variable(tf.constant(5, dtype=tf.float32))
epoch = 40
LR_BASE = 0.2  # 最初學習率
LR_DECAY = 0.99  # 學習率衰減率
LR_STEP = 2  # 喂入2輪後，更新一次學習率

for epoch in range(epoch):  # for epoch 定義頂層迴圈，表示對資料集迴圈epoch次，此例資料集資料僅有1個w,初始化時候constant賦值為5，迴圈100次迭代。
    lr = LR_BASE * LR_DECAY ** (int(epoch / LR_STEP))
    with tf.GradientTape() as tape:  # with結構到grads框起了梯度的計算過程。
        loss = tf.square(w + 1.)
    grads = tape.gradient(loss, w)  # .gradient函式告知誰對誰求導

    w.assign_sub(lr * grads)  # .assign_sub 對變數做自減 即：w -= lr*grads 即 w = w - lr*grads
    print("After %s epoch,w is %f,loss is %f,lr is %f" % (epoch, w.numpy(), loss, lr))

#輸出結果（可以觀測到每兩輪，學習率會衰減一次）
After 0 epoch,w is 2.600000,loss is 36.000000,lr is 0.200000
After 1 epoch,w is 1.160000,loss is 12.959999,lr is 0.200000
After 2 epoch,w is 0.304640,loss is 4.665599,lr is 0.198000
After 3 epoch,w is -0.211997,loss is 1.702086,lr is 0.198000
After 4 epoch,w is -0.520926,loss is 0.620948,lr is 0.196020
After 5 epoch,w is -0.708742,loss is 0.229512,lr is 0.196020
After 6 epoch,w is -0.821785,loss is 0.084831,lr is 0.194060    
.......

Tensorflow2.0學習筆記-複雜度、學習率

技術標籤：筆記一、神經網路的複雜度神經網路複雜度分為空間複雜度和時間複雜度

TensorFlow2.0學習筆記-----索引與切片

1. 索引 a = tf.ones([1,5,5,3]) 建立一個shape為[1,5,5,3]的全1張量，可以理解為一張圖片，大小5x5，有三個通道

TensorFlow2.0學習筆記---broadcasting

之前遇到過一個問題，[email protected] +b 時， [email protected] = [b,10] b.shape = [10] ,兩個shape不一樣的矩陣在數學上是不能相加的，但是為什麼在TensorFlow這裡可以相加呢，?broadcasti

TensorFlow2.0學習筆記---early stopping和dropout

early stopping：跟驗證集validation有關，利用驗證集來做測試，在做交叉驗證的時候會有一個val的loss和acc曲線，根據這個曲線會自動earlystop

Tensorflow2.0學習筆記-資料增強，斷點續訓

技術標籤：筆記資料增強在小資料模型中，資料增強可以起到明顯的效果，本次使用的是mnist資料集單靠準確率去證明資料增強的效果是不可行的，需要自己在實際運用中體會。

《演算法筆記一》複雜度、排序、二分、異或

目錄時間複雜度、空間複雜度、排序、異或運算時間複雜度排序操作選擇排序氣泡排序插入排序空間複雜度常數項時間複雜度演算法最優解常見時間複雜度演算法和資料結構脈絡認識對數器認識二分法認識異或運算

【Kafka學習筆記】二、Kafka叢集搭建（基於kafka_2.11-1.0.0）

技術標籤：springbootkafkaJavajavakafka PS：歡迎轉載，但請註明出處，謝謝配合。 Kafka叢集搭建（基於kafka_2.11-1.0.0）

左神演算法筆記: 1. 認識複雜度、對數器、二分法與異或運算

技術標籤：視訊筆記演算法 #algorithem/左神演算法/基礎 #sorting #XOR 評估演算法優劣的核心標準

【Kafka學習筆記】一、Kafka單機搭建（基於kafka_2.11-1.0.0）

技術標籤：Javaspringbootkafkajavakafka PS：歡迎轉載，但請註明出處，謝謝配合。 Kafka單機搭建（基於kafka_2.11-1.0.0）

mongodb資料庫入門學習筆記之下載、安裝、啟動、連線操作解析

本文例項講述了mongodb資料庫下載、安裝、啟動、連線操作。分享給大家供大家參考，具體如下：

ES6學習筆記之字串、陣列、物件、函式新增知識點例項分析

本文例項講述了ES6學習筆記之字串、陣列、物件、函式新增知識點。分享給大家供大家參考，具體如下：

JAVA學習筆記：註釋、變數的宣告和定義操作例項分析

本文例項講述了JAVA學習筆記：註釋、變數的宣告和定義操作。分享給大家供大家參考，具體如下：

玩轉django2.0學習筆記——編寫URL規則

URL (Uniform Resource Locator ，統一資源定位符〉是對可以從網際網路上得到的資源位置和訪問方法的一種簡潔的表示，是網際網路上標準資源的地址。網際網路上的每個檔案都有一個唯一的URL ，用於指出檔案的路徑

cocos2dx(4.0)學習筆記-2：紋理快取，精靈幀快取，動畫快取以及幀動畫

1.紋理快取的使用(TextureCache) 　　紋理快取時cocos2dx中較為底層且常用的快取，通過提前將紋理圖片等等資源載入進記憶體方便之後呼叫。比如有些遊戲在不同場景的切換過程中可能會有一個讀條的場景，這個場景中通常

.NetCore學習筆記：六、Swagger API介面文件工具

Swagger一個優秀的Api介面文件生成工具。Swagger可以可以動態生成Api介面文件，有效的降低前後端人員關於Api介面的溝通成本，促進專案高效開發。

JavaSE學習筆記 - 數字類、隨機數

BigInteger import java.math.BigInteger; public class Main { public static void main(String[] args) { //加

JavaSE學習筆記 - Object類、日期類

Object Object 類是 Java 中所有類的超類，Java 中每個類都是由 Object 這個類拓展而來的。可以使用 Object 型別的變數引用任何型別的物件。

ThinkPHP5.0學習筆記（一）ThinkPHP的安裝

前言 ThinkPHP是一個免費開源的，快速、簡單的面向物件的輕量級PHP開發框架，是為了敏捷WEB應用開發和簡化企業應用開發而誕生的。

JVM學習筆記（五、執行時資料區）

目錄：簡介堆方法區（元空間）棧簡介執行時資料區分為兩類，一類是執行緒間共享的方法區和堆，另一類是執行緒私有的虛擬機器棧、本地方法棧以及程式計數器。

JVM學習筆記（七、GC1-基礎知識點）

目錄：我的疑問什麼是GC，為什麼要有GC 四種引用物件我的疑問：什麼是垃圾回收。

Tensorflow2.0學習筆記-複雜度、學習率

一、神經網路的複雜度

空間複雜度：

時間複雜度

二、學習率

相關推薦