1. 程式人生 > 實用技巧 >第十四講:Prometheus 企業級實際使⽤二

第十四講:Prometheus 企業級實際使⽤二

  本講內容

  Prometheus+grafana TCP等待連結監控 企 業實際使⽤

  

  使⽤公式

count_netstat_wait_connections

  ⼀個key⾜夠了 gauge

  資料來源:pushgateway + 指令碼

  其實 node_exporter 也有對應的 tcp wait

  不過 ⾥⾯提供的 各種 tcp 狀態的資料種類 實在太多 太細了 (我有點懶得去 ⼀個⼀個TCP狀態 加起來出監控 , 不過感 興趣的同學 可以⾃⼰嘗試) 索性 我這⾥就⽤指令碼⾃⼰寫⼀個了

  處於各種 wait狀態的 TCP連結 是作為運維 平⽇排查(⽹絡負 載,伺服器的負載,DB)的⼀個重要指標

  Close_wait , time_wait 等等。。(TCP連結的⽅向 ) TCP協議

  ⼀般當 wait型別的TCP 過⼤時

  ⼀定說明 系統⽹絡負載(流量負載) 出現問題了

  ⽐如這種狀況

  導致這種 狀況的原因 很多 並⾮只會因為 ⽹絡不給⼒

  還跟 訪問請求量 攻擊流量 資料庫 CPU 等等 都有可能引起

  Prometheus+grafana ⽂件描述符監控 企業 實際使⽤

  Linux系統 我們之前在 系列課程上篇時 提到過 本⾝就是⼀個 基於⽂件表達的作業系統

  任何資源的使⽤ 都可以對映成⼀個⽂件

  ⽂件 和 ⽂件控制代碼(Linux中 叫做⽂件描述符更準確 不過習慣 叫控制代碼 不好改⼜了) 雖然並⽆直接聯絡 但是 有間接的連帶 關係

  如下是⼀段 ⽹上對⽂件描述符的解釋 我們來看下

  ⽂檔案描述符是linux/unix作業系統中特有的概念。其相當於 windows系統中的句句柄。習慣性的,我們也把linux⽂檔案描述 符稱之句句柄。 Linux系統中, 每當程序開啟⼀一個⽂檔案時,系統就為其分配 ⼀一個唯⼀一的整型⽂檔案描述符,⽤用來標識這個⽂檔案。標準C中每 個程序預設開啟的有三個⽂檔案,標準輸⼊入,標準輸出,標準 錯誤,分別⽤用⼀一個FILE結構的指標來表示,即stdin,stout, sterr,這三個結構分別對應著三個⽂檔案描述符0,1,2。 ⽂檔案描述符是⼀一個簡單的整數,⽤用以標明每⼀一個被程序所打 開的⽂檔案和socket。第⼀一個開啟的⽂檔案是0,第⼆二個是1, PID->⽂檔案的句句柄 依此類推。 linux 作業系統通常對每個程序l能開啟的⽂檔案數量量有⼀一個限 制。 linux系統預設的最⼤大⽂檔案描述符限制是1024

  檔案描述符使用率公式

(node_filefd_allocated / node_filefd_maximum)*100

  Prometheus+grafana ⽹絡丟包率監控 企業 實際使⽤