caffe原始碼解析：insertSplits對 top輸出到多個 Layer的情況進行分割

阿新 • • 發佈：2018-12-14

作用：對 top輸出到多個 Layer的情況進行分割，建立完整的網路結構

重要的引數說明舉例：

layer_idx_to_layer_name[i] 記錄各層的名稱，如 [0x00000000] "input"
blob_name_to_last_top_idx[“conv1”]=(1,0) 這個例子相當於說”conv1” 這層是第1層的第0個top，
bottom_idx_to_source_top_idx[bottom_idx=(2,0)] = (1,0); 相當於說：第2層，第0個bottom，對應著第1層，第0個top 即： [(0x00000001, 0x00000000)] (0x00000000, 0x00000000)
top_idx_to_bottom_count[(1,0)]=2 表示第1個layer的第0個top有2

個top(blob?)，要分叉，程式會對此建立新的分叉層

理解：整個函式分為兩個部分

1. 遍歷整個網路，記錄每一個Layer的top的使用情況，記錄結構放在 top_idx_to_bottom_count中。

2. 遍歷整個網路，對 top_idx_to_bottom_count > 1 的情況進行處理: 分兩步走

第一步. 首先是對有多個top層的Layer進行分割，主要的做法是在該層的後面新建一個Layer ，這個新的Layer的會按照 top_idx_to_bottom_count 的個數和約定的分割名稱（SplitBlobName）去新建top，參考void ConfigureSplitLayer…

第二步，是對使用同一個top的後續層的bottom的blob進行改名（使用與上一步相同的命名規則）。

下面是原始碼

void InsertSplits(const NetParameter& param, NetParameter* param_split) {
  // Initialize by copying from the input NetParameter.
  param_split->CopyFrom(param);
  param_split->clear_layer();
  map<string, pair<int, int> > blob_name_to_last_top_idx;
  map<pair<int, int>, pair<int, int> > bottom_idx_to_source_top_idx;
  map<pair<int, int>, int> top_idx_to_bottom_count;
  map<pair<int, int>, float> top_idx_to_loss_weight;
  map<pair<int, int>, int> top_idx_to_bottom_split_idx;
  map<int, string> layer_idx_to_layer_name; // 每層網路的名稱
  for (int i = 0; i < param.layer_size(); ++i) {
    const LayerParameter& layer_param = param.layer(i);
    layer_idx_to_layer_name[i] = layer_param.name();
    for (int j = 0; j < layer_param.bottom_size(); ++j) {
      const string& blob_name = layer_param.bottom(j);
      if (blob_name_to_last_top_idx.find(blob_name) ==
          blob_name_to_last_top_idx.end()) {
        LOG(FATAL) << "Unknown bottom blob '" << blob_name << "' (layer '"
                   << layer_param.name() << "', bottom index " << j << ")";
      }
      const pair<int, int>& bottom_idx = make_pair(i, j);
      const pair<int, int>& top_idx = blob_name_to_last_top_idx[blob_name];
      bottom_idx_to_source_top_idx[bottom_idx] = top_idx;
      ++top_idx_to_bottom_count[top_idx];
    }
    for (int j = 0; j < layer_param.top_size(); ++j) {
      const string& blob_name = layer_param.top(j);
      blob_name_to_last_top_idx[blob_name] = make_pair(i, j);
    }
    // A use of a top blob as a loss should be handled similarly to the use of
    // a top blob as a bottom blob to another layer.
    const int last_loss =
        std::min(layer_param.loss_weight_size(), layer_param.top_size());
    for (int j = 0; j < last_loss; ++j) {
      const string& blob_name = layer_param.top(j);
      const pair<int, int>& top_idx = blob_name_to_last_top_idx[blob_name];
      top_idx_to_loss_weight[top_idx] = layer_param.loss_weight(j);
      if (top_idx_to_loss_weight[top_idx]) {
        ++top_idx_to_bottom_count[top_idx];
      }
    }
  }
  for (int i = 0; i < param.layer_size(); ++i) {
    LayerParameter* layer_param = param_split->add_layer();
    layer_param->CopyFrom(param.layer(i));
    // Replace any shared bottom blobs with split layer outputs.
    for (int j = 0; j < layer_param->bottom_size(); ++j) {
      const pair<int, int>& top_idx =
          bottom_idx_to_source_top_idx[make_pair(i, j)];
      //表示第i層的第j個bottom, 是第top_idx0層的第top_idx1個top, 
      //   有split_count個bottom
      const int split_count = top_idx_to_bottom_count[top_idx];
      if (split_count > 1) {
        const string& layer_name = layer_idx_to_layer_name[top_idx.first];
        const string& blob_name = layer_param→bottom(j);
        // 只是改個名稱,這個名稱由 SplitBlobName建立
        layer_param->set_bottom(j, SplitBlobName(layer_name,
            blob_name, top_idx.second, top_idx_to_bottom_split_idx[top_idx]++));
      }
    }
    // Create split layer for any top blobs used by other layer as bottom
    // blobs more than once.
    for (int j = 0; j < layer_param->top_size(); ++j) {
      const pair<int, int>& top_idx = make_pair(i, j);
      //表示第i層的第j個top有split_count個blob
      const int split_count = top_idx_to_bottom_count[top_idx];
      if (split_count > 1) {
         // 如果要分叉（對應多個top）
        const string& layer_name = layer_idx_to_layer_name[i]; //第i層的名稱
        const string& blob_name = layer_param->top(j);  // 第j個top的blob名稱
        LayerParameter* split_layer_param = param_split->add_layer(); // 新建一層
        const float loss_weight = top_idx_to_loss_weight[top_idx];
        // 第i層的第j個top有的loss_weight
        ConfigureSplitLayer(layer_name, blob_name, j, split_count,
            loss_weight, split_layer_param);
        if (loss_weight) {
          layer_param->clear_loss_weight();
          top_idx_to_bottom_split_idx[top_idx]++;
        }
      }
    }
  }
}

caffe原始碼解析：insertSplits對 top輸出到多個 Layer的情況進行分割

作用：對 top輸出到多個 Layer的情況進行分割，建立完整的網路結構重要的引數說明舉例： layer_idx_to_layer_name[i] 記錄各層的名稱，如 [0x00000000] "input" blob_name_to_last_top_idx[“c

caffe原始碼解析：層（layer）的註冊與管理

caffe中所有的layer都是類的結構，它們的構造相關的函式都註冊在一個全域性變數g_registry_ 中。首先這個變數的型別 CreatorRegistry是一個map定義， public: typedef shared_ptr<Layer<Dt

Caffe原始碼解析4： Data_layer

data_layer應該是網路的最底層，主要是將資料送給blob進入到net中，在data_layer中存在多個跟data_layer相關的類 BaseDataLayer BasePrefetchingDataLayer DataLayer DummyDataLayer HDF5DataLayer HDF

Caffe原始碼解析5：Conv_Layer

Vision_layer裡面主要是包括了一些關於一些視覺上的操作，比如卷積、反捲積、池化等等。這裡的類跟data layer一樣好很多種繼承關係。主要包括了這幾個類，其中CuDNN分別是CUDA版本，這裡先不討論，在這裡先討論ConvolutionLayer BaseConvolutionLayer Co

Caffe原始碼解析7：Pooling_Layer

Pooling 層一般在網路中是跟在Conv卷積層之後，做取樣操作，其實是為了進一步縮小feature map，同時也能增大神經元的視野。在Caffe中，pooling層屬於vision_layer的一部分，其相關的定義也在vision_layer.hpp的標頭檔案中。Pooling層的相關操作比較少，在C

Caffe原始碼解析6：Neuron_Layer

NeuronLayer，顧名思義這裡就是神經元，啟用函式的相應層。我們知道在blob進入啟用函式之前和之後他的size是不會變的，而且啟用值也就是輸出 $y$ 只依賴於相應的輸入 $x$。在Caffe裡面所有的layer的實現都放在src資料夾下的layer資料夾中，基本上很多文章裡應用到的laye

Caffe原始碼解析2：SycedMem

看到SyncedMem就知道，這是在做記憶體同步的操作。這類個類的程式碼比較少，但是作用是非常明顯的。檔案對應著syncedmem.hpp,著syncedmem.cpp 首先是兩個全域性的行內函數。如果機器是支援GPU的並且安裝了cuda，通過cudaMallocHost分配的host memory將會被p

Caffe原始碼解析3：Layer

layer這個類可以說是裡面最終的一個基本類了，深度網路呢就是一層一層的layer，相互之間通過blob傳輸資料連線起來。首先layer必須要實現一個forward function，前遞函式當然功能可以自己定義啦，在forward中呢他會從input也就是Layer的bottom，對了caffe裡面網路的

Redis原始碼解析：15Resis主從複製之從節點流程

Redis原始碼解析：15Resis主從複製之從節點流程版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/gqtcgq/article/details/51172085

Java虛擬機器（JVM原始碼）：JDK10對Java虛擬機器執行時資料區的劃分（詳細圖解）

Java虛擬機器執行時資料區為什麼要研究這個，因為JDK都已經發布到10了，必須要更新自己對Java虛擬機器新的認識。一、執行時資料區的劃分 1.1 官方劃分關於JDK10對執行時資料區的劃分，在官方文件說的非常清楚。學習技術，一定要學會看第一手資料。 Ja

Java集合類原始碼解析：AbstractMap

目錄引言原始碼解析抽象函式entrySet() 兩個集合檢視操作方法兩個子類參考：引言今天學習一個Java集合的一個抽象類 AbstractMap ，AbstractMap 是Map介面的實現類之一，也是HashMap、T

Java集合類原始碼解析：HashMap (基於JDK1.8)

目錄前言 HashMap的資料結構深入原始碼兩個引數成員變數四個構造方法插入資料的方法：put() 雜湊函式：hash() 動態擴容：resize() 節點樹化、紅黑樹的拆分節點樹化

Java集合類原始碼解析：Vector

引言之前的文章我們學習了一個集合類 ArrayList，今天講它的一個兄弟 Vector。為什麼說是它兄弟呢？因為從容器的構造來說，Vector 簡直就是 ArrayList 的翻版，也是基於陣列的資料結構，不同的是，Vector的每個方法都加了 synchronized 修飾符，是執行緒安全的。類

jQuery原始碼解析：變數與函式

//原始碼剖析都基於jQuery-2.0.3版本，主要考慮到相容IE 2行：jQuery javaScript Library v2.0.3——jQuery版本 3行：http://jQuery.com——官網 5~6行：Includes Sizzle.js;http://sizzlejs.

Spark2.2.2原始碼解析： 3.啟動worker節點啟動流程分析

本文啟動worker節點啟動流程分析啟動命令： ${SPARK_HOME}/sbin/start-slave.sh spark://sysadmindeMacBook-Pro.local:7077 檢視start-slave.sh

Spark2.2.2原始碼解析： 2.啟動master節點流程分析

本文主要說明在啟動master節點的時候，程式碼的流程走向。授予檔案執行許可權 chmod755 兩個目錄裡的檔案： /workspace/spark-2.2.2/bin --所有檔案 /workspace/spark-2.2.2/sb

Spring4原始碼解析：BeanDefinition架構及實現

一、架構圖首先共同看下總體的 Java Class Diagrams 圖：二、具體類實現 2.1 AttributeAccessor 介面定義了一個通用的可對任意物件獲取、修改等操作元資料的附加契約。主要方法如下： public interface AttributeAcce

Tomcat原始碼解析：Container中的Pipeline和Valve

前言：我們在上一篇部落格中分析了關於tomcat處理請求的全過程，在最後的時候交給了當前Engine的pipeline去處理。 Engine.pipeline獲取了first_valve，然後執行其invoke方法，即完成了請求

Tomcat原始碼解析：Jsp檔案的編譯、實現

1.Jsp簡介 jsp（java server page），其根本是一個簡化的Servlet技術，是一種動態網頁技術標準。它是在傳統的網頁HTML頁面中插入java程式碼段，從而形成jsp檔案，字尾為.jsp。

Tomcat原始碼解析：Web請求處理過程

前言： Catalina是Tomcat提供的Servlet容器實現，它負責處理來自客戶端的請求並處理響應。但是僅有Servlet容器伺服器是無法對外提供服務的，還需要由聯結器接收來自客戶端的請求，並按照既定協議進行解析，然後交由S

caffe原始碼解析：insertSplits對 top輸出到多個 Layer的情況進行分割

相關推薦