『cs231n』作業2選講_通過代碼理解優化器

阿新 • • 發佈：2017-07-25

cit err red numpy 優化器包含 iteration mom 效果

1)、Adagrad
一種自適應學習率算法，實現代碼如下：

cache += dx**2
x += - learning_rate * dx / (np.sqrt(cache) + eps)

這種方法的好處是，對於高梯度的權重，它們的有效學習率被降低了；而小梯度的權重叠代過程中學習率提升了。要註意的是，這裏開根號很重要。平滑參數eps是為了避免除以0的情況，eps一般取值1e-4 到1e-8。

2)、RMSprop
RMSProp方法對Adagrad算法做了一個簡單的優化，以減緩它的叠代強度：

cache = decay_rate * cache + (1 - decay_rate) * dx**2
x += - learning_rate * dx / (np.sqrt(cache) + eps)

其中，decay_rate是一個超參數，其值可以在 [0.9, 0.99, 0.999]中選擇。

3)、Adam
Adam有點像RMSProp+momentum，效果比RMSProp稍好，其簡化版的代碼如下：

m = beta1*m + (1-beta1)*dx
v = beta2*v + (1-beta2)*(dx**2)
x += - learning_rate * m / (np.sqrt(v) + eps)

論文中推薦eps = 1e-8，beta1 = 0.9，beta2 = 0.999。

import numpy as np

"""

輸入:
  - w: 
  - dw: 
  - config: 包含各種超參數
返回:
  - next_w: 
  - config: 

"""


def sgd(w, dw, config=None):

  if config is None: config = {}
  config.setdefault(‘learning_rate‘, 1e-2)

  w -= config[‘learning_rate‘] * dw
  return w, config


def sgd_momentum(w, dw, config=None):
  """
 結合動量的SGD（最常用）
 
  - learning_rate: 
  - momentum: 動量值
  - velocity: A numpy array of the same shape as w and dw used to store a moving
    average of the gradients.
  """
  if config is None: config = {}
  config.setdefault(‘learning_rate‘, 1e-2)
  config.setdefault(‘momentum‘, 0.9)
  v = config.get(‘velocity‘, np.zeros_like(w))
  
  next_w = None
 
  next_w = w
  v = config[‘momentum‘]* v - config[‘learning_rate‘]*dw
  next_w +=v
 
  config[‘velocity‘] = v

  return next_w, config



def rmsprop(x, dx, config=None):
  """
 
  - learning_rate: 
  - decay_rate: 
  - epsilon: 小數值 避免分母為零
  - cache: 
  """
  if config is None: config = {}
  config.setdefault(‘learning_rate‘, 1e-2)
  config.setdefault(‘decay_rate‘, 0.99)
  config.setdefault(‘epsilon‘, 1e-8)
  config.setdefault(‘cache‘, np.zeros_like(x))

  next_x = None
 
  next_x = x
  config[‘cache‘] = config[‘decay_rate‘]*config[‘cache‘]+(1-config[‘decay_rate‘])*(dx*dx)
  x += -config[‘learning_rate‘]* dx / (np.sqrt(config[‘cache‘])+config[‘epsilon‘])
 

  return next_x, config


def adam(x, dx, config=None):
  """
 
  - learning_rate
  - beta1: m的衰減率
  - beta2: v的衰減率
  - epsilon
  - m: Moving average of gradient.
  - v: Moving average of squared gradient.
  - t: Iteration number.
  """
  if config is None: config = {}
  config.setdefault(‘learning_rate‘, 1e-3)
  config.setdefault(‘beta1‘, 0.9)
  config.setdefault(‘beta2‘, 0.999)
  config.setdefault(‘epsilon‘, 1e-8)
  config.setdefault(‘m‘, np.zeros_like(x))
  config.setdefault(‘v‘, np.zeros_like(x))
  config.setdefault(‘t‘, 0)
  
  next_x = None
 
 
  config[‘t‘]+=1 
  config[‘m‘] = config[‘beta1‘]*config[‘m‘] + (1- config[‘beta1‘])*dx
  config[‘v‘] = config[‘beta2‘]*config[‘v‘] + (1- config[‘beta2‘])*(dx**2)   
  mb = config[‘m‘]/(1-config[‘beta1‘]**config[‘t‘])
  vb = config[‘v‘]/(1-config[‘beta2‘]**config[‘t‘])
  next_x = x -config[‘learning_rate‘]* mb / (np.sqrt(vb) + config[‘epsilon‘])
      

  return next_x, config

『cs231n』作業2選講_通過代碼理解優化器

cit err red numpy 優化器包含 iteration mom 效果 1)、Adagrad一種自適應學習率算法，實現代碼如下： cache += dx**2 x += - learning_rate * dx / (np.sqrt(cache) + eps

『Python』MachineLearning機器學習入門_效率對比

cnblogs 新的 arange 學習 nump 部分運行 orm blog 效率對比：老生常談了，不過這次用了個新的模塊，運行時間測試模塊timeti： 1 import timeit 2 3 normal = timeit.timeit(‘sum(x*

『Python』MachineLearning機器學習入門_極小的機器學習應用

highlight 保存數值 out 有意思 port del ear 解方程一個小知識：有意思的是，scipy囊括了numpy的命名空間，也就是說所有np.func都可以通過sp.func等價調用。簡介：本部分對一個互聯網公司的流量進行擬合處理，學習最基本的機器

『TensorFlow』函數查詢列表_數值計算

code -1 .com term tran als pos ble sparse 基本算術運算操作描述 tf.add(x, y, name=None) 求和 tf.sub(x, y, name=None) 減法 tf.mul(x, y, name=

『cs231n』限制性分類器損失函數和最優化

def vector print sha python width 技術分享 port 計算代碼部分 SVM損失函數 & SoftMax損失函數：註意一下softmax損失的用法： SVM損失函數： import numpy as np def L_i

『cs231n』卷積神經網絡的可視化與進一步理解

都是 lan 精度輸出上采樣一行 ear 模型運算 cs231n的第18課理解起來很吃力，聽後又查了一些資料才算是勉強弄懂，所以這裏貼一篇博文（根據自己理解有所修改）和原論文的翻譯加深加深理解。可視化理解卷積神經網絡原文地址一、相關理論本篇博文主要講解201

『cs231n』RNN之理解LSTM網絡

tail 理解操作通過依賴 ont 進行 ati 增長概述 LSTM是RNN的增強版，1.RNN能完成的工作LSTM也都能勝任且有更好的效果；2.LSTM解決了RNN梯度消失或爆炸的問題，進而可以具有比RNN更為長時的記憶能力。LSTM網絡比較復雜，而恰好找到一

『cs231n』視頻數據處理

return 分辨 learning 組成 tput sin con 自己時間信息視頻信息和我之前的臆想不同，視頻數據不僅僅是一幀一幀的圖片本身，還包含個幀之間的聯系，也就是還有一個時序的信息維度，包含人的動作判斷之類的任務都是要依賴動作的時序信息的視頻數據處理的兩

『cs231n』Faster_RCNN（待續）

3*3 pytho images 分網 col spa ... 出圖 test 前言研究了好一陣子深度學習在計算機視覺方面的實際應用意義不大的奇技淫巧，感覺基本對研究生生涯的工作沒啥直接的借鑒意義，硬說收獲的話倒是加深了對tensorflow的理解，是時候回歸最初的興趣點

『TensorFlow』分布式訓練_其二_多GPU並行demo分析（待續）

print all set represent proto copyright keys 20M runners 建議比對『MXNet』第七彈_多GPU並行程序設計 models/tutorials/image/cifar10/cifer10_multi_gpu-trai

『算法設計_偽代碼』快速排序

image png 分享快速排序 inf info 算法設計 eight wid 快速排序隨機快排『算法設計_偽代碼』快速排序

『算法設計_偽代碼』線性時間排序及排序算法對比

width 方法分享基數算法設計 9.png inf 不同桶排序一、計數排序二、基數排序三、桶排序四、對比不同排序方法『算法設計_偽代碼』線性時間排序及排序算法對比

代理小程序_就選飛躍小程序_無需代碼_對接代理小程序_免費試用

代理下載包含展示能夠食品 jpg 登錄廣告最近對於炒的火熱的微信小程序，很多人很疑惑，很徘徊，很遲疑，什麽是小程序，為什麽要做小程序？小程序值得做嗎？小程序會成為趨勢嗎？小程序真的能夠為企業謀利嗎？小程序真的有那麽神奇嗎？對於小程序的困惑，小編剛開始也是這樣覺

癌癥檢測算法頭名_ 附代碼

ml最近，近一萬名數據科學家在數據科學方面參與開發機器學習算法，可以更精確地通過CT掃描檢測癌變病變數據科學家正在使用機器學習來解決肺癌的檢測。從1月份開始，世界各地近1萬名數據科學家在Kaggle上競爭開發最有效的算法，幫助醫療專業人員更早地準確地檢測肺癌。2010年，國家肺癌篩查試驗顯示，使用低劑量計算機

第8章2節《MonkeyRunner源代碼剖析》MonkeyRunner啟動執行過程-解析處理命令行參數

path 轉載 iss 命令 code rst pri bsp ack MonkeyRunnerStarter是MonkeyRunner啟動時的入口類，由於它裏面包括了main方法.它的整個啟動過程主要做了以下幾件事情:解析用戶啟動MonkeyRunner時從命令行傳輸

Android 仿窗簾效果和登錄界面拖動效果（Scroller類的應用）附 2個DEMO及源代碼

@override 宋體 off down != 過程事件學習 border 在android學習中，動作交互是軟件中重要的一部分。當中的Scroller就是提供了拖動效果的類，在網上。比方說一些Launcher實現滑屏都能夠通過這個類去實現。以下要說的

php擴展開發筆記（2）多個源代碼文件的配置和編譯

nes repr 過程 http fadein ews add ng- star 我們在開發過程中，為了代碼得可讀性和易維護性，肯定是須要多個代碼文件的，而不不過通過 ext_skel 生成得骨架文件。這篇文章主要介紹下。多個代碼文件的時候。我們須要註意

REST-assured 2發送消息代碼重構

message private query tag .text hash weixin gid val 將獲取token的方法封裝到公共類 #java package date811; import io.restassured.response.Response; im

Algs4-1.2.5以下這段代碼會打印出什麽？

stdout 方法字符串方法 hello 1.2 改變打印 int ase 1.2.5以下這段代碼會打印出什麽？String s="Hello World";s.toUpperCase();s.subString(6,11);StdOut.println(s);答："H

Dev_GridView獲取所選行的控制代碼

這是官方幫助文件上的一句話：此示例演示如何獲取所選行，然後更改其欄位值。 GetSelectedRows方法檢索所選行的控制代碼。由於行控制代碼反映了在View中顯示行的順序，因此修改單行可能會影響其他行的控制代碼（例如，如果對資料進行排序和/或過濾）。為了防止可能的

『cs231n』作業2選講_通過代碼理解優化器

相關推薦