Linux下TIME_WAIT狀態TCP連線優化引數tcp_tw_reuse與tcp_tw_recycle區別與聯絡淺析

阿新 • • 發佈：2021-10-07

概述

最近學習網路相關知識點，很多文章提到針對TCP time wait(後續簡稱TW)狀態連線進行優化的引數tcp_tw_reuse和tcp_tw_recycle，並且不少文章提到了啟用tcp_tw_recycle會導致的問題，不建議開啟該選項，但是並沒有找到一篇能完全解答自己所有疑惑的文章，如：

Linux會丟棄所有來自遠端的timestramp時間戳小於上次記錄的時間戳(由同一個遠端傳送的)的任何資料包。也就是說要使用該選項，則必須保證資料包的時間戳是單調遞增的，這裡的遠端定義的是ip還是ip+port? 是一定時間內丟棄時間戳過期packet還是tcp_tw_recycle啟用後一直丟棄？

很多文章都會提到tcp_tw_reuse 僅作用於客戶端連線，tcp_tw_recycle則同時作用於客戶端與服務端連線，這裡客戶端、服務端連線具體指的是什麼?與TCP三次握手的客戶端、服務端概念上有什麼區別？

通過學習網上大家的總結+閱讀了部分4.9核心原始碼，這裡整理總結一下從各處學習到的知識點及自己的理解。

過多time wait會導致的問題

客戶端主動發起的連線總數受 max open file數限制，過多連線導致達到max open file限制將無法建立新的連線。
客戶端主動發起的連線總數也受可用埠號限制，一般使用埠號為1024~65000，如果過多TW連線將埠號耗盡同樣無法再建立新的連線。

每個TW連線都會佔用一定的系統資源-如記憶體--實際耗費記憶體很小，這點一般可忽略

tcp_tw_reuse與tcp_tw_recycle相同點

兩者目的均是為了解決系統中過多TW狀態 TCP連線的問題。
兩者都需要和tcp_timestamps 同時開啟方能生效。
根據RFC定義，主動關閉連線方其TW狀態需維持2MSL時間才正式關閉連線，Linux上MSL預設定義為30s，即TW狀態預設需要維持1分鐘方能正式關閉，tcp_tw_reuse與tcp_tw_recycle均為通過縮短TW狀態時間進行復用來進行優化。
兩個引數預設均為關閉狀態

tcp_tw_reuse原理

僅作用於客戶端方主動發起連線，即出向連線。

連線進入TW狀態>1s，且新連線的timestamp大於舊連線記錄的timestamp時方能複用連線。
client提前中止TW狀態進行復用，發起新連線，server依然處於last ack狀態時，互動流程如下:
1. client傳送新SYN => server
2. client <= server由於處於LAST ACK，不理會SYN，重發 FIN+ACK
3. client收到FIN+ACK，發現timestamp已過期，傳送RST => server, server收到後重置關閉舊連線
4. client初始傳送的SYN包等待ACK超時1s後，重發SYN => server
5. client <= server 會發 SYN+ACK 進入正常三次握手連線過程...
6. 新連線建立完成後，client/server若收到舊連線的歷史報文，通過timestamp可判斷出為舊報文直接丟棄
  整個過程中可以看到，client端可以正常複用發起新的連線，在server端依然處於LAST ACK狀態時也只是需要稍微延遲一小段時間而已。

tcp_tw_recycle原理

同時作用於client/server發起連線，即出、入向連線
TW狀態維持3.5RTO(the retransmission timeout (RTO) interval which is computed from the RTT and its variance)之後就直接可以被過期回收，具體RTO取值是基於網路RTT及其他相關因子綜合計算。
TW狀態後2MSL會丟棄所有來自遠端相同四元組的timestamp小於上次記錄timestamp的任何資料包，因而需要保證資料包timestamp是單調遞增的
1. NAT情況下，不同client從同一NAT ip請求，由於NAT不會更改包中的timestamp，而不同機器的時間不可能完全同步，因而不同機器從同一個NAT IP+port發出的包會存在timestamp非單調遞增的情況，問題場景舉例：
  1. 機器A時間比機器B快1s，機器A先通過NAT機器 ip1:port1 對伺服器S ip2: port2 發起tcp連線socket1--使用conn_old(ip1, port1, ip2, port2)四元組表示
  2. 後S主動斷開連線進入TW狀態，由於開啟tcp_tw_recycle，經過一個RTO後S即可複用conn_old這個連線
  3. NAT機器對應連線在進入LAST ACK並收到S回覆的ACK之後關閉了conn_old
  4. 而後機器B通過NAT機器發起conn_new(ip1, port1, ip2, port2)
  5. 此時S收到SYN包發現timestamp 小於conn_old中記錄的最終timestamp，於是丟棄conn_new的SYN包
  6. 機器B超時未收到回覆，重發SYN包，機器S收到後比較timestamp後繼續丟棄....如此往復，最終導致通過NAT機器發起的conn_new(ip1, port1, ip2, port2)在TW狀態終止的2MSl內都無法建立新的連線，對於機器B的使用者表現就是連線遲遲無法建立成功。
2. 高版本核心由於新的時間戳生成演算法tcp: randomize tcp timestamp offsets for each connection 即便未使用NAT也會導致同一臺機器不同socket之間timestamp非單調遞增
Linux從4.12版本核心開始已經移除了tcp_tw_recycle支援

文章開始時兩個問題的答案

遠端定義為ip+port，無論tcp_tw_reuse還是tcp_tw_recycle，針對回收TW連線對新連線的影響，都是指同一四元組代表的連線(src_ip, src_port, dst_ip, dst_port)，任何時候收到過期timestamp包都會直接丟棄，而不止是TW的2MSL時間內
客戶端是指主動發起連線的一方，即TCP三次握手中發出首個SYN包的一方。

轉載請註明出處，原文地址:https://www.cnblogs.com/AcAc-t/p/tcp_tw_reuse_and_tcp_tw_recycle_introduction.html

參考：

簽名：擁抱開源，擁抱自由

Linux下TIME_WAIT狀態TCP連線優化引數tcp_tw_reuse與tcp_tw_recycle區別與聯絡淺析

概述最近學習網路相關知識點，很多文章提到針對TCP time wait(後續簡稱TW)狀態連線進行優化的引數tcp_tw_reuse和tcp_tw_recycle，並且不少文章提到了啟用tcp_tw_recycle會導致的問題，不建議開啟該選項，但是並沒有

大量 TIME_WAIT 狀態 TCP 連線，對業務有什麼影響？怎麼處理

批量的TIME_WAIT的 TCP 連線此時有兩種情況 1、短時間後，所有的TIME_WAIT全都消失，被回收，埠包括服務，均正常。

面試官：大量 TIME_WAIT 狀態 TCP 連線，對業務有什麼影響？怎麼處理？

來源：http://ningg.top/computer-basic-theory-tcp-time-wait/ 幾個方面：問題描述：什麼現象？什麼影響？

Linux下Redis允許遠端連線的實現方法

Linux安裝好Redis之後，使用Java進行連線，Java程式碼如下 package com.wzj.demo.test; import redis.clients.jedis.Jedis;

Linux下ls命令和du命令檢視檔案大小的區別

ll -h即為ls -lh是檔案的實際大小； du -sh 顯示檔案所佔用的 block 大小； du -ach *#這個能看到當前目錄下的所有檔案佔用磁碟大小和總大小

Windows作業系統TIME_WAIT狀態的TCP連線快速回收時間（效能測試時埠不夠用）

大規模Windows環境下，採用Nginx反向代理服務後，作業系統會產生較多TIME_WAIT的TCP（Transmission Control Protocol）連線，作業系統預設TIME_WAIT的TCP連接回收時間是4分鐘，TCP預設動態埠範圍為開始埠49152，結束

TCP連線狀態詳解及TIME_WAIT過多的解決方法

上圖對排除和定位網路或系統故障時大有幫助，但是怎樣牢牢地將這張圖刻在腦中呢？那麼你就一定要對這張圖的每一個狀態，及轉換的過程有深刻地認識，不能只停留在一知半解之中。下面對這張圖的11種狀態詳細解釋一下

TCP連線的TIME_WAIT和CLOSE_WAIT 狀態解說

轉載：https://www.cnblogs.com/kevingrace/p/9988354.html 相信很多運維工程師遇到過這樣一個情形: 使用者反饋網站訪問巨慢, 網路延遲等問題, 然後就迫切地登入伺服器,終端輸入命令\"netstat -anp | grep TIME_WAIT

Linux下TCP連線斷開後不釋放的解決辦法

技術標籤：Linux 問題：在開發測試時發現斷開與伺服器埠後再次連線時拒絕連線。

linux下修改核心引數進行Tcp效能調優 — 高併發

目錄(?)[+] 前言： Tcp/ip協議對網路程式設計的重要性，進行過網路開發的人員都知道，我們所編寫的網路程式除了硬體，結構等限制，通過修改Tcp/ip核心引數也能得到很大的效能提升，

Linux 檢視TCP連線狀態

檢視TCP連線狀態#netstat -n | awk \'/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}\' CLOSED 沒有使用這個套接字[netstat 無法顯示closed狀態]LISTEN套接字正在監聽連線[呼叫listen後]SYN_SENT套接字正在試

解決windows平臺TCP連線的TIME_WAIT狀態

原文地址：https://www.sysnet.pe.kr/2/0/11996 C# - Socket의 TIME_WAIT 상태를 없애는 방법

TCP 連線狀態及相關命令學習

在平時的開發工作中，我們都使用被封裝完好的 TCP/HTTP 庫去完成需求開發，很少關心底層 TCP 的連線狀態，但是一旦遇到較難定位的線上事故，往往都是因為 TCP 連線引數或者使用姿勢不對導致的，本文對 TCP 連線狀態以

Linux下二進位制方式安裝mysql5.7版本和系統優化的步驟

本文主要介紹MySQL二進位制軟體包的安裝/啟動/關閉過程。也許有人要問為什麼要選擇二進位制的安裝方式呢？

Linux下配置frp實現Windows遠端桌面連線

需要準備一臺公網IP的Linux伺服器安裝 sudo apt-get update sudo apt-get upgrade 依次執行以下四條命令

zabbix--監控 TCP 連線狀態

命令測試 Tcp的連線狀態對於我們web伺服器來說是至關重要的，從TCP的連線狀態中可以看出網路的連線情況，伺服器的壓力情況，對伺服器的併發有很好的直觀反映；尤其是併發量ESTAB；或者是syn_recv值，假如這個值比較

Linux下設定mysql允許遠端連線

最近在Linux上安裝了Mysql，然後在Windows環境下通過Navicat來連線時，出現報錯：1045 Access denied for user \'root\'@\'XXX\' (using password: YES)，如下：

linux下啟用組播轉發的方法與一些常用狀態檢查命令

總所周知,Linux 伺服器是可以作為一臺路由器使用,不僅僅是可以轉發單播資料包,同事也可以轉發組播資料包.但是多數同學卻不知道如何配置.本文將介紹將Linux配置成組播轉發路由器的方法做一個分享.

TCP連線狀態

　　socket大概包含10個連線狀態。我們平常工作中遇到的，除了針對SYN的拒絕服務攻擊，如果有異常，大概率是TIME_WAIT和CLOSE_WAIT的問題。

記錄一次：TIME_WAIT狀態連線過多的分析與解決

原理說明一個連線的建立與斷開，正常過程至少需要來回7個包才能完成。 Each socket in TIME_WAIT consumes some memory in the kernel, usually somewhat less than an ESTABLISHED socket yet still significant

Linux下TIME_WAIT狀態TCP連線優化引數tcp_tw_reuse與tcp_tw_recycle區別與聯絡淺析

概述

過多time wait會導致的問題

tcp_tw_reuse與tcp_tw_recycle相同點

tcp_tw_reuse原理

tcp_tw_recycle原理

文章開始時兩個問題的答案

參考：

相關推薦