概念
實現這個
反向代理能力並不能算是一個特別複雜的任務,但是在
負載均衡中要求特別高的效率,這樣實現起來就不是十分簡單的了。每針對一次代理,
代理伺服器就 必須打開兩個連線,一個為對外的連線,一個為對內的連線,因此對於連線請求數量非常大的時候,代理伺服器的負載也就非常之大了,在最後反向代理伺服器會成 為服務的瓶頸。例如,使用Apache的mod_rproxy模組來實現負載均衡功能時,提供的
並發連線數量受Apache本身的並發連線數量的限制。一般來講,可以使用它來對連線數量不是特別大,但每次連線都需要消耗大量處理資源的站點進行負載均衡,例如搜尋。
使用反向代理的好處是,可以將負載均衡和
代理伺服器的高速快取技術結合在一起,提供有益的性能,具備額外的安全性,外部客戶不能直接訪問真實的伺服器。並 且實現起來可以實現較好的負載均衡策略,將負載可以非常均衡的分給內部伺服器,不會出現負載集中到某個伺服器的偶然現象。
nginx 實現反向代理負載均衡
1)環境:
a. 本地使用Windows系統,然後使用VirutalBox安裝一個虛擬的Linux系統。 在本地的Windows系統上分別安裝nginx(偵聽8080連線埠)和apache(偵聽80連線埠)。在虛擬的Linux系統上安裝apache(偵聽80連線埠)。這樣相當於擁有了1台nginx在前端作為反向代理伺服器;後面有2台apache作為應用程式伺服器(可以看作是小型的server cluster。;-));
b. nginx用來作為反向代理伺服器,放置到兩台apache之前,作為用戶訪問的入口。 nginx僅僅處理靜態頁面,動態的頁面(php請求)統統都交付給後台的兩台apache來處理。也就是說,可以把網站的靜態頁面或者檔案放置到nginx的目錄下;動態的頁面和資料庫訪問都保留到後台的apache伺服器上。
c. 如下兩種方法實現server cluster的負載均衡。
假設前端nginx(為127.0.0.1:8080)僅僅包含一個
靜態頁面index.html;後 台的兩個apache伺服器(分別為localhost:80和158.37.70.143:80),一台根目錄放置phpMyAdmin資料夾和 test.php(裡面測試代碼為print "server1";),另一台根目錄僅僅放置一個test.php(裡面測試代碼為print "server2";)。
2)針對不同請求的負載均衡:
a. 在最簡單地構建反向代理的時候(nginx僅僅處理靜態不處理動態內容,動態內容交給後台的apache server來處理),具體的設定為:在nginx.conf中修改:
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
>;這樣當客戶端訪問localhost:8080/index.html的時候,前端的nginx會自動進行回響;
>;當用戶訪問localhost:8080/test.php的時候(這個時候nginx目錄下根本就沒有該檔案),但是通過上面的設定location ~ \.php$(表示
正則表達式匹配以.php結尾的檔案,詳情參看location是如何定義和匹配的),nginx伺服器會自動pass給158.37.70.143的apache伺服器了。該伺服器下的test.php就會被自動解析,然後將html的 結果頁面返回給nginx,然後nginx進行顯示(如果nginx使用memcached模組或者squid還可以支持
快取),輸出結果為列印 server2。
如上是最為簡單的使用nginx做為反向代理伺服器的例子。
b. 我們現在對如上例子進行擴展,使其支持如上的兩台伺服器。
設定nginx.conf的server模組部分,將對應部分修改為:
location ^~ /phpMyAdmin/ {
proxy_pass 127.0.0.1:80;
}
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
上面第一個部分location ^~ /phpMyAdmin/,表示不
使用正則表達式匹配(^~),而是直接匹配,也就是如果客戶端訪問的URL是以http://localhost:8080/phpMyAdmin/開頭的話(本地的nginx目錄下根本沒有phpMyAdmin目錄),nginx會自動pass到127.0.0.1:80的Apache伺服器,該伺服器對phpMyAdmin目錄下的頁面進行解析,然後將結果傳送給nginx,後者顯示;
如果客戶端訪問URL是http://localhost/test.php的話,則會被pass到158.37.70.143:80的apache進行處理。
因此綜上,實現了針對不同請求的負載均衡。
>;如果用戶訪問
靜態頁面index.html,最前端的nginx直接進行回響;
>;如果用戶訪問test.php頁面的話,158.37.70.143:80的Apache進行回響;
>;如果用戶訪問目錄phpMyAdmin下的頁面的話,127.0.0.1:80的Apache進行回響。
3)訪問同一頁面的負載均衡:
即用戶訪問http://localhost:8080/test.php這個同一頁面的時候,實現了兩台伺服器的負載均衡(實際情況中,這兩個伺服器上的數據要求同步一致,這裡我們分別定義了列印server1和server2是為了進行辨認區別)。
a. 現在的情況是在windows下nginx是localhost偵聽8080連線埠;
兩台apache,一台是127.0.0.1:80(包含test.php頁面但是列印server1),另一台是虛擬機的158.37.70.143:80(包含test.php頁面但是列印server2)。
b. 因此重新配置nginx.conf為:
>;首先
在nginx的配置檔案nginx.conf的http模組中添加,伺服器集群server cluster(我們這裡是兩台)的定義:upstream myCluster {
server 127.0.0.1:80;
server 158.37.70.143:80;
}
表示這個server cluster包含2台伺服器
>;然後在server模組中定義,負載均衡:
location ~ \.php$ {
proxy_passhttp://myCluster; #這裡的名字和上面的cluster的名字相同
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For$proxy_add_x_forwarded_for;
}
這樣的話,如果訪問http://localhost:8080/test.php頁面的話,nginx目錄下根本沒有該檔案,但是它會自動將其pass到myCluster定義的服務區
機群中,分別由127.0.0.1:80;或者158.37.70.143:80;來做處理。上面在定義upstream的時候每個server之後沒有定義權重,表示兩者均衡;如果希望某個更多回響的話例如:
upstream myCluster {
server 127.0.0.1:80weight=5;
server 158.37.70.143:80;
}
這樣表示5/6的幾率訪問第一個server,1/6訪問第二個。另外還可以定義max_fails和fail_timeout等參數。
====================
綜上,通過使用nginx的反向代理伺服器reverse proxy server的功能,將其布置到多台apache server的前端。nginx僅僅用來處理靜態頁面回響和動態請求的代理pass,後台的apache server作為app server來對前台pass過來的
動態頁面進行處理並返回給nginx。
通過以上的架構,我們可以實現nginx和多台apache構成的機群cluster的負載均衡。
兩種均衡:
1)可以在nginx中定義訪問不同的內容,代理到不同的後台server;如上例子中的訪問phpMyAdmin目錄代理到第一台server上;訪問test.php代理到第二台server上;
2)可以在nginx中定義訪問同一頁面,均衡(當然如果伺服器性能不同可以定義權重來均衡)地代理到不同的後台server上。如上的例子訪問test.php頁面,會均衡地代理到server1或者server2上。
實際套用中,server1和server2上分別保留相同的app程式和數據,需要考慮兩者的數據同步。