Linux系統下網絡數據包的處理流程

阿新 • • 發佈：2018-07-20

clean ××× 函數實現 vector important datasheet 內容 six 信號

本文主要探討linux環境下，數據包從網卡接收到協議棧處理的處理流程和對應的代碼邏輯。

分析的內核代碼版本為4.17.6，涉及到的網卡硬件功能特性和邏輯均以intel的82599以太網控制器為例，驅動為ixgbe。本文僅討論physical function的驅動代碼邏輯。

數據包從網卡接收開始，其總體處理流程如下：

網卡接收光/電信號，將其轉換為數據幀內容，如果幀符合以太網地址等過濾條件，則保存到FIFO緩存中。82599控制器中共有8個FIFO緩存隊列。
網卡解析FIFO中數據幀的2/3/4層信息，進行流過濾、流定向、RSS隊列分流，計算出幀對應的分流隊列號。82599控制器支持最多16個RSS分流隊列。
網卡將數據幀內容通過DMA方式寫入驅動程序指定的內存空間，並將幀的基本信息寫入報文描述信息隊列的寄存器（descriptor ring）中。
網卡發起硬件中斷，系統響應硬件中斷，進入驅動中的頂半部處理流程。
頂半部處理流程通過NAPI調度接口（napi_schedule）發起軟件中斷後就結束了，幀的具體處理邏輯在響應軟中斷的底半部流程中完成。
底半部流程中，驅動從DMA內存空間和網卡寄存器中獲取幀信息和內容。之後重新分配新的DMA內存空間並更新網卡寄存器，使網卡能夠繼續處理並寫入數據幀。
對於每個數據幀，驅動根據報文類型調用協議棧註冊的處理接口函數進行協議棧解析處理。

下面具體介紹一下每一步的具體代碼邏輯。

網卡接收光/電信號，將其轉換為數據幀內容，如果幀符合以太網地址等過濾條件，則保存到FIFO緩存中。82599控制器中共有8個FIFO緩存隊列。
這一步是完全由網卡硬件完成的。但是L2的報文過濾可以通過驅動修改過濾地址的方式加以控制。一般情況下，只有以太網地址符合本地網卡以太網地址時幀才能通過過濾，82599控制器支持最多設置128個以太網地址。此外，可以設置打開網卡的混雜模式(promisc mode)來接收所有MAC地址幀，這個操作可以通過ixgbe_set_rx_mode函數實現，該函數修改了IXGBE_FCTRL_UPE 和 IXGBE_FCTRL_MPE寄存器來跳過L2報文過濾。
網卡解析F

IFO中數據幀的2/3/4層信息，進行流過濾、流定向、RSS隊列分流，計算出幀對應的分流隊列號。82599控制器支持最多16個RSS分流隊列。
這一步也是由網卡硬件實現的，驅動可以設置流過濾、流定向的規則，具體的方式可參見82599 datasheet第7.1.2節。RSS隊列分流的具體邏輯參見82599 datasheet的7.1.2.8節，驅動在啟動網卡時，需要修改MRQC、R×××K、RETA等寄存器來打開RSS分流功能、設置分流算法、哈希種子、分流映射表等。相關的代碼可在ixgbe_setup_mrqc中找到。
PS：由於第1步和第2步完全由硬件實現，無從驗證，其功能步驟執行的具體順序不一定完全與本文相符。
網卡將數據幀內容通過DMA方式寫入驅動程序指定的內存空間，並將幀的基本信息寫入接收報文描述信息隊列（receive descriptor ring）中。
這一步同樣由網卡硬件實現。但網卡寄存器的初始化，以及可DMA訪問的內存緩存空間申請是由網卡驅動在啟動網卡時完成的。每個隊列的具體初始化代碼在ixgbe_configure_rx_ring中。該函數首先初始化IXGBE_RDH、IXGBE_RDT等緩存隊列寄存器，然後調用ixgbe_alloc_rx_buffers分配緩存隊列的內存空間，並進行DMA映射。接收報文描述信息隊列（descriptor ring）同樣是一系列DMA映射的內存空間，每個隊列的ring空間是連續的，這個空間地址在ixgbe_setup_rx_resources函數中分配，在ixgbe_configure_rx_ring的起始部分寫入到IXGBE_RDBA寄存器中。
receive descriptor有兩種格式，Legacy Receive Descriptor和Advanced Receive Descriptor，一般使用後者。數據結構的定義在ixgbe_type.h的ixgbe_adv_rx_desc函數中，字段解釋可以參見datasheet的7.1.6節。需要註意的是這個數據結構是網卡和驅動公用的接口數據結構，因此其結構定義是不能在驅動中修改的。這個結構分成兩個部分：read部分由驅動負責寫入，網卡負責讀取，用於向網卡傳遞每個報文的DMA緩存空間地址；wb(write-back）部分由網卡寫入，驅動讀取，用於網卡寫入與報文相關的信息，例如報文長度等。
網卡發起硬件中斷，系統響應硬件中斷，進入驅動中的頂半部處理流程。
在驅動打開網卡的函數ixgbe_open過程中，會在ixgbe_request_msix_irqs函數中調用request_irq(entry->vector, &ixgbe_msix_clean_rings, 0,
q_vector->name, q_vector)函數註冊硬件中斷號和中斷處理函數ixgbe_msix_clean_rings。這裏的中斷號在ixgbe_acquire_msix_vectors函數中使用pci_enable_msix_range函數分配。
網卡發起硬件中斷後，系統調用中斷處理函數ixgbe_msix_clean_rings進行處理。
頂半部處理流程通過NAPI調度接口（napi_schedule）發起軟件中斷後就結束了，幀的具體處理邏輯在響應軟中斷的底半部流程中完成。
ixgbe_msix_clean_rings函數的流程非常簡單，函數判斷一下這個中斷是否有對應的rx或tx隊列，如果有則調用napi_schedule_irqoff發起napi調度，將具體的處理工作交給napi的底半部處理函數。
底半部流程中，驅動從DMA內存空間和網卡寄存器中獲取幀信息和內容。之後重新分配新的DMA內存空間並更新網卡寄存器，使網卡能夠繼續處理並寫入數據幀。
napi的底半部處理函數為ixgbe_poll，在ixgbe_alloc_q_vector函數中使用netif_napi_add接口註冊。ixgbe_poll主要調用ixgbe_clean_rx_irq和ixgbe_clean_tx_irq來處理網卡收到和發送的報文。這裏主要分析ixgbe_clean_rx_irq。clean_rx_irq函數會從緩存隊列中獲取若幹個報文信息，並調用ixgbe_alloc_rx_buffers向隊列補充緩存空間資源，最後調用ixgbe_rx_skb函數，這個函數直接調用napi_gro_receive函數，之後的流程就與網卡和網卡驅動無關了。
對於每個數據幀，驅動根據報文類型調用協議棧註冊的處理接口函數進行協議棧解析處理。
napi_gro_receive函數的邏輯較復雜，一般最終會調用__netif_receive_skb_core函數。該函數調用deliver_skb，最終調用註冊的packet_type->func函數對skb數據進行解析處理。例如IPv4協議的packet_type中的func函數就是ip_rcv。

由於內核代碼結構復雜，上述流程中仍有一些不明或不確之處，歡迎指正。

Linux系統下網絡數據包的處理流程

clean ××× 函數實現 vector important datasheet 內容 six 信號本文主要探討linux環境下，數據包從網卡接收到協議棧處理的處理流程和對應的代碼邏輯。分析的內核代碼版本為4.17.6，涉及到的網卡硬件功能特性和邏輯均以intel的82

Linux內核中網絡數據包的接收-第二部分 select/poll/epoll

() 帶來 back 都是 tips ole sni 得到一次和前面文章的第一部分一樣，這些文字是為了幫別人或者自己理清思路的。而不是所謂的源代碼分析。想分析源代碼的，還是直接debug源代碼最好，看不論什麽文檔以及書都是下策。因此這類幫人理清思路的文章盡可能的記成

Linux內核中網絡數據包的接收-第一部分概念和框架

csdn 請求版本號 post sched nec alloc nts 多核cpu 與網絡數據包的發送不同，網絡收包是異步的的。由於你不確定誰會在什麽時候突然發一個網絡包給你。因此這個網絡收包邏輯事實上包括兩件事：1.數據包到來後的通知2.收到通知並從數據包中獲取數據

Linux使用tcpdump抓取網絡數據包示例

icm pac icmp協議語句 web開發需求都是 linu -i tcpdump是linux命令行下常用的的一個抓包工具，記錄一下平時常用的方式，測試機器系統是ubuntu 12.04。 tcpdump的命令格式 tcpdump的參數眾多，通過man tcpdum

網絡數據包分析網卡Offload

限制 list 同時 ims lar udp協議問題 medium 優化 http://blog.nsfocus.net/network-packets-analysis-nic-offload/ 對於網絡安全來說，網絡傳輸數據包的捕獲和分析是個基礎工作，綠

C++版的網絡數據包解析策略(升級版)

bfd sum between protocol log class pro cli 分享初版：http://www.cnblogs.com/wjshan0808/p/6580638.html 說明：在實現了對應的接口後該策略可以適合絕大多數的網絡數據包結構首先，是

出了網關，網絡數據包的經歷

轉發規則自己的計算消息相關重要狀態發出保存出了網關，網絡包的經歷數據包經過路由從局域網出去後，就變得復雜起來。數據包的傳遞會面臨各種選擇，比如最重要的路徑選擇。路徑選擇就是選擇最短路徑，也即最優路徑來傳遞網絡包到目的地。在現在網絡世界，個人發出的各種

linux系統下操作mysql數據庫常見命令

foreign root ati alt webp home alter 查看表否則一. 備份數據庫(如: test): ①可直接進入後臺即可.(MySQL的默認目錄:/var/lib/mysql ) ②輸入命令: [root@obj mysql]# mysqldump

linux系統下安裝mysql數據庫（mysql-5.7）

自己 client 登錄密碼 linux服務器習慣 exp ner ict amp 前言：　　　本文主要介紹如何在linux系統下安裝mysql數據庫及安裝時遇到各種問題該如何解決；　　本次安裝使用的linux系統是centos，數據庫版本是mysql-5.7

ArcGIS 網絡分析[4] 網絡數據集深入淺出之連通性、網絡數據集的屬性及轉彎要素

我只三方功能如何使用網絡數據 block 性問題網絡屬性前面介紹完了如何創建網絡數據集、如何使用網絡分析功能，當然還有的讀者會迷惑於一些更深層次的問題，比如網絡數據集的連通性問題等。因為不可能面面俱到，我只能挑重點來闡述，我覺得網絡數據集的連通性、屬性和轉

linux 環境下備份oracle 數據庫

備份命令目錄 lin 安裝目錄 su - linux 輸出所有者登陸linux後，進入oracle的安裝目錄下，找到bin那個目錄，進入bin目錄ls -l 看這些命令的所有者： su - oracle這時會進入這個用戶的主目錄/home/oracle，此時，可以用

《Python網絡數據采集》筆記之BeautifulSoup

text 便簽 pip 使用 dal findall con content attribute 一初見網絡爬蟲都是使用的python3。一個簡單的例子： from urllib.request import urlopen html = urlopen("ht

Linux系統中安裝MySQL數據庫操作手冊

linux mysql數據庫 Linux系統中MySQL數據庫安裝手冊一、安裝概述：在Linux操作系統中安裝MySQL數據庫是一個我們必須要掌握的一門技術，也決定了你以後找工作的薪資待遇，所以你知道它的厲害了吧！學會安裝只是第一步，你還得學好數據庫的基本操作，以及搭建一個數據庫的主從配置等等

Linux系統基於網絡的自動化安裝

conf 接收不到 net 普通一行 web nes 傳輸再次　　　　安裝一個操作系統對一個普通人來說是一件非常麻煩的事了。而對於一個專業人士來說，應該是一個非常輕松的事。但是這樣的情況也僅限於有限的幾臺需要安裝。在實際工作的中，我們經常會遇到這樣的情況：有大批量的計

Linux環境下啟動MySQL數據庫出現找不到mysqld.sock的解決辦法！

備註 sta 就會超級默認目錄 sql數據庫 su - 用戶 lib 問題：　　在普通用戶權限下運行：mysql -u root -p，回車之後如果會出現如下錯誤：ERROR 2002 (HY000): Can‘t connect to local MySQL ser

Python網絡數據采集

html now() 數據采集 ont 網絡數據函數網絡 mytag dal 一、正則表達式 * 表匹配0次或者多次 a*b* + 表至少一次 [ ] 匹配任意一個 ( ) 辨識一個編組 {m，n} m或者n 次 [^] 匹配任意不在中括號裏的

網絡數據傳送原理與機制

輪詢找到 tcp http byte 發出通過註冊編程初識網絡數據傳送原理與機制，做了點小小筆記，記錄每一天！ ------------------------------------------- 網卡: 　　每一個網卡都有一個最大的傳輸速率　　

SylixOS網絡數據異步處理原理

sylixos 網絡異步一. 網絡數據異步處理簡介SylixOS中為了解決網絡數據擁堵的問題，采取數據異步處理的方式，提供了網絡工作隊列。采用網絡工作隊列，可以使得網卡驅動程序無需阻塞等待處理完成。SylixOS內核網絡netdev封裝了函數netdev_notify，提供了使用網絡工作隊列處理網卡數據的功

基於Linux系統安裝IQ庫數據庫

iq數據庫數據庫 hi，好久沒分享過技術啦，現在來跟大家分享一下最近操作過一項頗值得學習操作的技術，那就是IQ數據庫的安裝啦，(*^__^*) 嘻嘻……事不宜遲，現在就直奔主題吧。以下是用root用戶操作的哦，記得刪除文件的千萬不要用rm -rf *,否則，恭喜你中頭獎了，O(∩_∩)O哈哈哈~把I

Linux系統管理-網絡基礎集錦及Linux網絡配置、高級使用

獨立特點 rgb vpd 成本高 family hub 要求系統管 1、網絡通信術語1.1、三種通信模式單播；多播；廣播；1.2、LAN 組成 Computers PCs Servers

Linux系統下網絡數據包的處理流程

相關推薦