1. 程式人生 > 其它 >01 . Varnish簡介,原理,配置快取

01 . Varnish簡介,原理,配置快取

簡介

Varnish是高效能開源的反向代理伺服器和HTTP快取伺服器,其功能與Squid伺服器相似,都可以用來做HTTP快取。可以安裝 varnish 在任何web前端,同時配置它快取內容。與傳統的 squid 相比,varnish 具有效能更高、速度更快、管理更加方便等諸多優點。有一部分企業已經在生產環境中使用其作為舊版本的 squid的替代方案,以在相同的伺服器成本下提供更好的快取效果,Varnish 更是作為 CDN 快取伺服器的可選服務之一。

Varnish 的作者Poul-Henning Kamp是FreeBSD的核心開發者之一,他認為現在的計算機比起1975年已經複雜許多。在1975年時,儲存媒介只有兩種:記憶體與硬碟。但現在計算機系統的記憶體除了主存外,還包括了CPU內的L1、L2,甚至有L3快取。硬碟上也有自己的快取裝置,因此Squid Cache自行處理物件替換的架構不可能得知這些情況而做到最佳化,但作業系統可以得知這些情況,所以這部份的工作應該交給作業系統處理,這就是 Varnish cache設計架構。

varnish專案是2006年釋出的第一個版本0.9.距今已經十多年多了,此文件之前也提過varnish還不穩定,那是2007年時候編寫的,經過varnish開發團隊和網友們的辛苦耕耘,現在的varnish已經很健壯。很多入口網站已經部署了varnish,並且反應都很好,甚至反應比squid還穩定,且效率更高,資源佔用更少。相信在反向代理,web加速方面,varnish已經有足夠能力代替squid。

varnish的官網為https://www.varnish-cache.org,rpm,rpm包的下載位置為:http://repo.varnish-cache.org

特性

  • 快取位置:可以使用記憶體也可以使用磁碟。如果要使用磁碟的話推薦 SSD 做 RAID1;
  • 日誌儲存:日誌也儲存在記憶體中。儲存策略:固定大小,迴圈使用;
  • 支援虛擬記憶體的使用;
  • 有精確的時間管理機制,即快取的時間屬性控制;
  • 狀態引擎架構:在不同的引擎上完成對不同的快取和代理資料進行處理。可以通過特定的配置語言設計不同的控制語句,以決定資料在不同位置以不同方式快取,在特定的地方對經過的報文進行特定規則的處理;
  • 快取管理:以二叉堆格式管理快取資料,做到資料的及時清理。

Varnish與Squid對比

相同點

  • 都是一個反向代理伺服器。
  • 都是開源軟體。

Varnish的優勢

  • Varnish 的穩定性很高。兩者在完成相同負荷的工作時,Squid伺服器發生故障的機率要高於Varnish,因為使用Squid要經常重啟;

  • Varnish 訪問速度更快。因為採用了“Visual Page Cache”技術,所有快取資料都直接從記憶體讀取,而squid是從硬碟讀取,因而Varnish在訪問速度方面會更快;

  • Varnish 可以支援更多的併發連線。因為Varnish的TCP連線釋放要比Squid快,因而在高併發連線情況下可以支援更多TCP連線;

  • Varnish 可以通過管理埠,使用正則表示式批量的清除部分快取,而Squid是做不到的;

  • Squid屬於是單程序使用單核CPU,但Varnish是通過fork形式開啟多程序來做處理,所以可以合理的使用所有核來處理相應的請求;

varnish與squid相比,都是一個反向代理快取伺服器,並且都是開源的,varnish的穩定性很高,並且訪問速度很快,因為Squid是從硬碟讀取快取的資料,而Varnish把資料存放在記憶體中,直接從讀取記憶體,避免了頻繁在記憶體、磁碟中交換檔案,所以Varnish要相對更高效,varnish可以支援更多的併發連線,因為varnish的TCP連線釋放要比squid快;varnish也可以通過管理埠,使用正則表示式批量的清除部分快取,而squid是做不到的;squid 屬於是單程序使用單核 CPU,但 Varnish 是通過 fork 形式開啟多程序來做處理,所以可以合理的使用所有核來處理相應的請求。

Varnish的劣勢

  • Varnish程序一旦Hang、Crash或者重啟,快取資料都會從記憶體中完全釋放,此時所有請求都會發送到後端伺服器,在高併發情況下,會給後端伺服器造成很大壓力。
  • 在Varnish使用中如果單個url的請求通過HA/F5等負載均衡,則每次請求落在不同的varnish伺服器中,造成請求都會被穿透到後端;而且同樣的請求在多臺伺服器上快取,也會造成varnish的快取的資源浪費,造成效能下降。

劣勢解決方案

  • 針對劣勢一:在訪問量很大的情況下推薦使用varnish的記憶體快取方式啟動,而且後面需要跟多臺squid伺服器。主要為了防止前面的varnish服 務、伺服器被重啟的情況下,大量請求穿透varnish,這樣squid可以就擔當第二層CACHE,而且也彌補了varnish快取在記憶體中重啟都會釋放的問題;

  • 針對劣勢二:可以在負載均衡上做url雜湊,讓單個url請求固定請求到一臺varnish伺服器上;

原理

系統架構

1.png

varnish主要執行兩個程序:Management程序和Child程序(也叫Cache程序)。

Management程序主要實現應用新的配置、編譯VCL、監控varnish、初始化varnish以及提供一個命令列介面等。Management程序會每隔一段時間探測一下Child程序以判斷其是否正常執行,如果在指定的時長內未得到Child程序的迴應,Mangagement將會重啟此Child程序;

Child程序包含多種型別的執行緒,常見的如:

Acceptor程序:接受新的連線請求並響應

worker程序:child程序會為每個使用者啟動一個worker程序,因此,在高併發的場景中可能會出現數百個worker程序甚至更多;

Expiry程序:從快取中清理過期內容

Varnish依賴“工作區(workspace)”以降低執行緒在申請或修改記憶體時出現競爭的可能性。在varnish內部有多種不同的工作區,其中最關鍵的當屬用於管理會話資料的session工作區;

如何工作

Varnish 的master程序負責啟動工作,master程序讀取配置檔案,根據指定的空間大小(例如管理員分配了2G記憶體)來建立儲存空間,建立並管理child程序; 然後child程序來處理後續任務,它會分配一些執行緒來執行不同的工作,例如:接受http請求、為快取物件分配儲存空間、清除過期快取物件、釋放空間、碎片整理等。

http請求處理過程如下:
1、有一個專門負責接收http請求的執行緒,一直監聽請求埠,當有請求過來時,負責喚起一個工作執行緒來處理請求,工作執行緒會分析http請求的uri,知道了這個請求想要什麼,就到快取中查詢是否有這個物件,如果有,就把快取物件直接返回給使用者,如果沒有,會把請求轉給後端伺服器處理,並等待結果,工作執行緒從後端得到結果內容後,先把內容作為一個快取物件儲存到快取空間(以備下次請求這個物件時快速響應),然後再把內容返回給使用者

分配快取過程如下:
有一個物件需要快取時,根據這個物件的大小,到空閒快取區中查詢大小最適合的空閒塊,找到後就把這個物件放進去,如果這個物件沒有填滿這個空閒塊,就把剩餘的空間做為一個新的空閒塊,如果空閒快取區中沒地方了,就要先刪除一部分快取來騰出地方,刪除是根據最近最少使用原則。

釋放快取過程如下:
有一個執行緒來負責快取的釋放工作,他定期檢查快取中所有物件的生存週期,如果某個物件在指定的時間段內沒有被訪問,就把這個物件刪除,釋放其佔用的快取空間,釋放空間後,檢查一下臨近的記憶體空間是否是空閒的,如果是,就整合為一個更大的空閒塊,實現空間碎片的整理。

安裝

安裝配置varnish

[root@varnish ~]# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo  
#下載阿里映象站的repo檔案
[root@varnish ~]# yum -y install libedit-devel pcre-devel python-docutils    #安裝依賴包
[root@varnish ~]# cd /usr/src        #切換至指定目錄
[root@varnish src]# rz      #上傳我提供的varnish原始碼包
[root@varnish src]# tar zxf varnish-4.0.3.tar.gz         #解包
[root@varnish src]# cd varnish-4.0.3/           #進入解壓後的目錄
[root@varnish varnish-4.0.3]# ./configure && make && make install        #編譯安裝
[root@varnish varnish-4.0.3]# cp etc/example.vcl /usr/local/var/varnish/     #複製模板到指定路徑
[root@varnish varnish-4.0.3]# cd !$        #切換到varnish安裝目錄下
[root@varnish varnish]# vim example.vcl          #編輯其模板配置檔案,根據自己所需功能,編寫以下內容:
vcl 4.0;
import directors;
import std;
# Default backend definition. Set this to point to your content server.
probe backend_healthcheck {
.url="/"; #訪問後端伺服器根路徑
.interval = 5s;   #請求時間間隔
.timeout = 1s;   #請求超時時間
.window = 5;    #指定輪詢次數5次
.threshold = 3;   #如果出現3次失敗則表示後端伺服器宕機
}
backend web1 {    #定義後端伺服器
.host = "192.168.171.134";  #要轉向主機(即後端主機)的 IP 或域名
.port = "80";  #指定後端伺服器的埠號
.probe = backend_healthcheck;  #健康檢查呼叫backend_healthcheck定義的內容
}
backend web2 {
.host = "192.168.171.132";     
.port = "80";
.probe = backend_healthcheck;
}
acl purgers { #定義訪問控制列表
        "127.0.0.1";
        "localhost";
        "192.168.171.0/24";
        !"192.168.171.132";
}
sub vcl_init  {     #呼叫 vcl_init 初始化子程式建立後端主機組,即 directors
        new  web_cluster=directors.round_robin(); #使用 new 關鍵字建立 drector 物件,使用 round_robin(輪詢) 演算法
        web_cluster.add_backend(web1);   #新增後端伺服器節點
        web_cluster.add_backend(web2);
}
sub vcl_recv {
        set req.backend_hint = web_cluster.backend(); #指定請求的後端節點web_cluster定義的後端節點
        if (req.method == "PURGE") {   #判斷客戶端的請求頭部是否是PURGE
                if (!client.ip ~ purgers) {   #如果是,再判斷客戶端的IP地址是不是在ACL訪問控制列表中.
                        return (synth(405, "Not Allowed."));  #如果不是,返回給客戶端405狀態碼並且返回定義的頁面.
        }
        return (purge);   #如果是ACL定義的,則交給purge處理.
}
if (req.method != "GET" &&
        req.method != "HEAD" &&
        req.method != "PUT" &&
        req.method != "POST" &&
        req.method != "TRACE" &&
        req.method != "OPTIONS" &&
        req.method != "PATCH" &&
        req.method != "DELETE") {      #判斷客戶端的請求型別
                return (pipe);
        }
if (req.method != "GET" && req.method != "HEAD") {
        return (pass);      #如果不是GET及HEAD則交給pass.
}
if (req.url ~ "\.(php|asp|aspx|jsp|do|ashx|shtml)($|\?)") {
        return (pass);   #當客戶端訪問的是.php等結尾的交給pass處理.
}
if (req.http.Authorization) {
        return (pass);    #當客戶端請求的頁面型別是需要認證的,交給pass處理
}
if (req.http.Accept-Encoding) {
        if  (req.url  ~ "\.(bmp|png|gif|jpg|jpeg|ico|gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)$") {
        unset req.http.Accept-Encoding;   #取消客戶端接收的壓縮型別
        } elseif (req.http.Accept-Encoding ~ "gzip") {
                set req.http.Accept-Encoding = "gzip";  #如果有gzip型別,標記gzip型別.
        } elseif (req.http.Accept-Encoding ~ "deflate") {
                set req.http.Accept-Encoding = "deflate";
        } else {
        unset req.http.Accept-Encoding;  #其他未定義的頁面也取消客戶但接收的壓縮型別.
        }
     }
if  (req.url  ~ "\.(css|js|html|htm|bmp|png|gif|jpg|jpeg|ico|gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)($|\?)") {
        unset req.http.cookie;  #取消客戶端的cookie值.
        return (hash);    #將請求轉發給hash子程式,也就是檢視本地快取.
}
if (req.restarts == 0) {  #判斷客戶端是不是第一次請求
        if (req.http.X-Forwarded-For) {     #如果是第一次請求,設定獲取客戶端的IP地址.
                set req.http.X-Forwarded-For = req.http.X-Forwarded-For + ", " + client.ip;
        } else {
       set req.http.X-Forwarded-For = client.ip;
        }
}
return (hash);
}
sub vcl_hash {
        hash_data(req.url);   #檢視客戶端請求的頁面,並且進行hash
        if (req.http.host) {
                hash_data(req.http.host);  #設定客戶端的主機
        } else {
                hash_data(server.ip);    #設定伺服器的IP
        }
        return (lookup);
}
sub vcl_hit {
        if (req.method == "PURGE") {   #如果是HIT並且當客戶端請求的型別是PURGE返回的200的狀態碼,並返回相應頁面.
                return (synth(200, "Purged."));
        }
        return (deliver);
}

sub vcl_miss {
    if (req.method == "PURGE") {
                return (synth(404, "Purged."));   #如果是miss返回404
        }
        return (fetch);
}
sub vcl_deliver {
        if (obj.hits > 0) {
                set resp.http.CXK = "HIT-from-varnish"; #設定http頭部X-Cache =hit
                set resp.http.X-Cache-Hits = obj.hits;  #返回命令的次數
        } else {
        set resp.http.X-Cache = "MISS";
        }
        unset resp.http.X-Powered-By;  #取消顯示web版本
        unset resp.http.Server;    #取消顯示varnish服務
        unset resp.http.X-Drupal-Cache;   #取消顯示快取的框架
        unset resp.http.Via;    #取消顯示檔案內容來源
        unset resp.http.Link;  #取消顯示HTML的超連結地址
        unset resp.http.X-Varnish;  #取消顯示varnish的id
        set resp.http.xx_restarts_count = req.restarts;   #設定客戶端請求的次數
        set resp.http.xx_Age = resp.http.Age;   #顯示快取檔案的時長
        #set resp.http.hit_count = obj.hits;   #顯示快取命中的次數
        #unset resp.http.Age;
        return (deliver);
}
sub vcl_pass {
        return (fetch);   #將後端伺服器返回的資料快取到本地
}
sub vcl_backend_response {
        set beresp.grace = 5m;   #快取額外寬限時間
        if (beresp.status == 499 || beresp.status == 404 || beresp.status == 502) {
                set beresp.uncacheable = true;   #當後端伺服器相應狀態碼是449等,不快取
        }
        if (bereq.url ~ "\.(php|jsp)(\?|$)") {
                set beresp.uncacheable = true;  #當是PHP的頁面不快取
        } else {
                if (bereq.url ~ "\.(css|js|html|htm|bmp|png|gif|jpg|jpeg|ico)($|\?)") {
                set beresp.ttl = 15m;  #當是上面結尾的,快取15分鐘
                unset beresp.http.Set-Cookie;
                } elseif (bereq.url ~ "\.(gz|tgz|bz2|tbz|zip|rar|mp3|mp4|ogg|swf|flv)($|\?)") {
                        set beresp.ttl = 30m; #快取30分鐘
                        unset beresp.http.Set-Cookie;
                } else {
                        set beresp.ttl = 10m;  #生存時間10分鐘
                        unset beresp.http.Set-Cookie;
                }
        }
        return (deliver);
}
sub vcl_purge {
        return (synth(200,"success"));
}
sub vcl_backend_error {
        if (beresp.status == 500 ||
                beresp.status == 501 ||
                beresp.status == 502 ||
                beresp.status == 503 ||
                beresp.status == 504) {
                return (retry);  #如果狀態碼是上述其中之一,則重新請求
        }
}
sub vcl_fini {
        return (ok);
}
                                                                    

#編輯完成後,儲存退出後即可。
[root@varnish varnish]# varnishd -f /usr/local/var/varnish/example.vcl -s malloc,200M -a 0.0.0.0:80
#啟動varnish服務,監聽本機所有IP的80埠,-f為指定vcl檔案,-s是指定用來存放快取的容量
[root@varnish ~]# varnishlog   #varnish啟動後,可以執行此命令檢視其日誌。

訪問,清空快取硬性載入網頁;
2.png

驗證ACL清除快取配置

# 在varnish允許的IP上進行清除快取操作
curl -X "PURGE"  42.193.126.123

<!DOCTYPE html>
<html>
  <head>
    <title>200 success</title>
  </head>
  <body>
    <h1>Error 200 success</h1>
    <p>success</p>
    <h3>Guru Meditation:</h3>
    <p>XID: 65543</p>
    <hr>
    <p>Varnish cache server</p>
  </body>
</html>

若想實現varnish的快取功能,通過以下基本的定義即可實現(example.vcl檔案中有以下內容即可)

vcl 4.0;
import directors;
probe backend_healthcheck {
        .url = "/";
        .timeout = 1s;
        .interval = 5s;
        .window = 5;
        .threshold = 3;
}
backend web1 {
        .host = "192.168.171.134";
        .port = "80";
        .probe = backend_healthcheck;
}
backend web2 {
        .host = "192.168.171.132";
        .port = "80";
        .probe = backend_healthcheck;
}
sub vcl_init {
        new web_cluster = directors.round_robin();
        web_cluster.add_backend(web1);
        web_cluster.add_backend(web2);
}
sub vcl_recv {
        set req.backend_hint = web_cluster.backend();
}