簡介
CGI(Common Gateway Interface)公共網關接口,是外部擴展應用程式與 Web 伺服器互動的一個標準接口。伺服器端與
客戶端進行互動的常見方式多,CGI 技術就是其中之一。根據CGI標準,編寫外部擴展應用程式,可以對客戶端瀏覽器輸入的數據進行處理,完成客戶端與伺服器的互動操作。CGI規範定義了Web伺服器如何向擴展應用程式傳送訊息,在收到擴展應用程式的信息後又如何進行處理等內容。對於許多靜態的HTML網頁無法實現的功能,通過 CGI可以實現,比如表單的處理、對資料庫的訪問、搜尋引擎、基於Web的資料庫訪問等等。使用CGI實現客戶端與伺服器的互動有以下幾個標準步驟,具體步驟如下:
(1)Web 客戶端的瀏覽器將URL的第一部分解碼與Web伺服器相連。
(2)Web 瀏覽器將URL的其餘部分提供給伺服器。
(3)Web 伺服器將URL轉換成路徑和檔案名稱。
(4)Web 伺服器傳送 HTML 和別的組成請求頁面的檔案給客戶。一旦頁面內容傳送完,
這個連線自動斷開。
(5)在客戶端,HTML腳本提示用戶做動作或輸入。當用戶回響後,客戶請求Web伺服器建立一個新的連線。
(6)Web 伺服器把這些信息和別的進程變數傳送給由HTML以URL的形式指定CGI程式。
(7)CGI 根據輸入作出回響,把回響結果傳送給 Web 伺服器。
(8)Web 伺服器把回響的數據傳給客戶,完成後關閉連線。
伺服器端 CGI 程式接收信息有三種途徑:環境變數、命令行和標準輸入。其中環境變數是指 CGI 定義一組環境變數,通過環境變數可傳遞數據。伺服器收到來自瀏覽器的數據,調用 CGI 腳本,CGI 腳本將收到的數據轉換成環境變數並從中取出所需要的內容。<form>標籤的 METHOD 屬性來決定具體使用哪一種方法。在“METHOD=GET”時,向 CGI 傳遞表單編碼信息的是通過命令來進行的。表單編碼信息大多數是通過環境變數 QUERY_STRING 來傳遞的。若“METHOD=POST”,表單信息通過標準輸入來讀取。還有一種不使用表單就可以向 CGI 傳送信息的方法,那就是把信息直接附在 URL 地址後面,信息和URL 之間用問號(?)來進行分隔。GET 方法是對數據的一個請求,被用於獲得靜態文檔。GET 方法通過將傳送請求信息附加在 URL 後面的參數。當 GET 方法被使用時,CGI 程式將會從環境變數 QUERY_STRING獲取數據。為了正確的回響客戶端發來的請求,CGI 必須對 QUERY_STRING 中的字元串進行分析。當用戶需要從伺服器獲取數據,但伺服器上的數據不得改變時,應該用 GET 方法;但是如果請求中的字元串超過了一定長度,通常是 1024 位元組,那么這時,只能用 POST 方法。POST 方法:瀏覽器將通過填寫表單將數據傳給伺服器時一般採用POST 方法。在傳送的數據超過 1024 位元組時必須採用 POST 方法。當 POST 方法被使用時,Web 伺服器向CGI 程式的標準輸入 STDIN 傳送數據。環境變數 CONTENT_LENGTH 存放著傳送的數據長度。CGI 程式必須檢查環境變數 REQUEST_METHOD 以確定有沒有採用了 POST 方法,並決定是否要讀取標準輸入STDIN。
編寫語言
CGI可以用任何一種語言編寫,只要這種語言具有標準輸入、輸出和
環境變數。對初學者來說,最好選用易於歸檔和能有效表示大量數據結構的語言,例如UNIX環境中:
· Perl (Practical Extraction and Report Language)
· Bourne Shell或者Tcl (Tool Command Language)
· PHP(Hypertext Preprocessor))
由於C語言有較強的平台無關性,所以也是編寫CGI程式的首選。
Windows環境中:
· C和C++
由於Internet上大部分
伺服器使用的是UNIX作業系統,且幾乎任一UNIX作業系統中都有Bourne Shell,因而大部分實現腳本都是用
Bourne Shell編寫的。
最終Perl由於其跨作業系統、易於修改的特性成為了CGI的主流編寫語言,以至於一般的“cgi程式”就是Perl程式。
特點
公共網關接口 CGI 程式是存放在 HTTP 伺服器上,為用戶和HTTP伺服器之外的其他應用程式提供互相“交談”手段的軟體,其特點是:
公共(Common)。無須考慮客戶機和伺服器所運行的作業系統平台,只要二者的網關程式遵循同一數據傳輸協定,即可進行數據互動。
網關(Gateway)。CGI 可被用來作為 HTTP 伺服器與其他第三方應用程式之間的“連線件”或“中件(Middle Ware) "。
接口(Interface)。CGI 使用標準通訊機制,為其它應用程式與 HTTP 伺服器提供數據傳輸接口。用 CGI 可以實現處理表格,資料庫查詢,傳送電子郵件或控制伺服器端硬體等許多操作。
CGI 進程是根據 WWW 服務設定的環境變數和傳入參數採取動作並生成相應的回響結果。它返回給 WWW 伺服器的信息則採用協定規定的格式(一般為MIME 規定的格式)。絕大多數 Web 伺服器支持 CGI。
按照數據通信方式的不同,CGI 可分為標準 CGI 和緩衝 CGI。幾乎所有的 Web伺服器都支持標準 CGI。按標準 CGI 規範編制的外部程式並依賴於特定的 Web 伺服器平台,而按緩衝CGI 規範編制的外部程式則依賴於特定的 Web 伺服器平台。
伺服器配置
CGI程式不是放在
伺服器上就能順利運行,如果要想使其在伺服器上順利的運行並準確的處理用戶的請求,則須對所使用的伺服器進行必要的設定。
配置:根據所使用的
伺服器類型以及它的設定把CGI程式放在某一特定的目錄中或使其帶有特定的擴展名。
⑴CERN格式伺服器的配置:
編輯CERN格式伺服器(起初其被命名為“CERN httpd”, 也被稱為“W3C httpd”)的配置檔案(通常為/etc/httpd.conf)在檔案中加入:Exec cgi-bin/*/home/www/cgi-bin/*.exec。命令中出現的第一個參數cgi-bin/*指出了在URL中出現的目錄名字,並表示它出現在
系統主機後的第一個目錄中,如:http://edgar.stern.nyn.***/cgi-bin/。命令中的第二個參數表示CGI程式目錄放在系統中的真實路徑。
CGI目錄除了可以跟網路檔案放在同一目錄中,也可以放在系統的其它目錄中,但必須保證在你的系統中也具有同樣的目錄。在對
伺服器完成設定後,須重新啟動伺服器(除非HTTP伺服器是用inetd啟動的)。
⑵NCSA格式伺服器的配置
在NCSA格式伺服器上有兩種方法進行設定:
①在srm.conf檔案(通常在conf目錄下)中加入:Script Alias/cgi-bin/cgi-bin/。Script Alias命令指出某一目錄下的檔案是可執行程式,且這個命令是用來執行這些程式的;此命令的兩個參數與CERN格式
伺服器中的Exec命令的參數的含意一樣。
②在srm.conf檔案加入:Add type application/x-httpd-cgi.cgi。此命令表示在伺服器上增加了一種新的
檔案類型,其後第一個參數為CGI程式的MIME類型,第二個參數是檔案的擴展名,表示以這一擴展名為擴展名的檔案是CGI程式。
在用上述方法之一設定伺服器後,都得重新啟動伺服器(除非HTTP伺服器是用inetd啟動的)。
環境變數列表
SERVER_NAME:運行CGI序為機器名或IP位址。
SERVER_INTERFACE:WWW
伺服器的類型,如:CERN型或NCSA型。
SERVER_PROTOCOL:通信協定,應當是HTTP/1.0。
SERVER_PORT:TCP連線埠,一般說來web連線埠是80。
HTTP_ACCEPT:HTTP定義的瀏覽器能夠接受的數據類型。
HTTP_USER-AGENT:傳送表單的
瀏覽的有關信息。
GETWAY_INTERFACE:CGI程式的版本,在UNIX下為 CGI/1.1。
PATH_TRANSLATED:PATH_INFO中包含的實際路徑名。
PATH_INFO:瀏覽器用GET方式傳送數據時的附加路徑。
SCRIPT_NAME:CGI程式的路徑名。
QUERY_STRING:
表單輸入的數據,URL中問號後的內容。
REMOTE_HOST:傳送程式的
主機名,不能確定該值。
REMOTE_ADDR:傳送程式的機器的IP位址。
REMOTE_USER:傳送程式的人名。
CONTENT_TYPE:POST傳送,一般為application/xwww-form-urlencoded。
CONTENT_LENGTH:POST方法輸入的數據的位元組數。
優點
CGI可以為我們提供許多HTML無法做到的功能。比如 a.一個記數器 b.顧客信息表格的提交以及統計 c.搜尋程式 d.WEB資料庫,用Html是沒有辦法記住客戶的任何信息的,就算用戶願意讓你知道。用Html也是無法把信息記錄到某一個特定檔案里的。要把客戶端的信息記錄在
伺服器的硬碟上,就要用到CGI。這是CGI最重要的作用,它補充了Html的不足。是的,僅僅是補充,不是替代。
使在
網路伺服器下運行外部分應用程式(或
網關)成為可能。CGI-BIN 目錄是存放CGI腳本的地方。這些腳本使Web伺服器和瀏覽器能運行外部程式,而無需啟動另一個程式。
它是運行在Web
伺服器上的一個程式,並由來自於瀏覽者的輸入觸發。CGI是在HTTP伺服器下運行外部程式(或網關)的一個接口,它能讓網路用戶訪問遠程系統上的使用類型程式,就好像他們在實際使用那些遠程計算機一樣。
CGI能夠讓瀏覽者與伺服器進行互動,如果你曾經遇到過在網路上填表或者進行搜尋,就很有可能就是用的CGI。
儘管CGI易於使用,但是當大批人同時使用一個CGI應用程式是會反應較慢,
網路伺服器 速度也會受到很大 影響。CGI應用程式的優點是可以獨立運行。
CGI應用程式可以由大多數的程式語言編寫,如Perl(Practical Extraction and Report Language)、C\C++、Java 和Visual Basic等。不過對於那些沒有太多編程經驗的網頁製作人來說,實在是一個不小的難題。
注意的問題
CGI應用程式運行在瀏覽器可以請求的
伺服器系統上,執行時需要使用
伺服器CPU時間和記憶體。如果有成千上萬的這種程式會同時運行,那會對伺服器系統提出極高的要求。你要慎重考慮這個問題,以防止伺服器
系統崩潰。
不完善的CGI應用程式可能成為別人非法進人伺服器系統的通道,有可能導致重要的資料被刪除或外泄。CGI應用程式主要的用途有以下幾種:
創建可單擊的圖像縮小圖;
創建一個瀏覽者可以搜尋內容的資料庫;
提供
伺服器與資料庫的接口,並把結果轉換成HTML文檔;
製作動態HTML文擋。
如果一個CGI腳本可以在每台計算機上做同樣的事情;編寫腳本就會變的很容易。不幸的是,CGI腳本依賴於伺服器的作業系統,因此,對於非UNIX伺服器來說,Prl(UNIX下編寫腳本的一個常用工具)腳本毫無用處。所以,你必須定製安裝你的CGI腳本。
大多數伺服器都提供
CGI-BIN目錄,但是這還不夠。因為你應該擁有自己的CGI-BIN。這樣,你就能運行自己的腳本(而不是讓自己的系統去適應已存在於系統上的腳本)。因此,你的提供商應安裝CGI-BIN,且能夠幫助你編寫腳本
ASP
ASP(Active Server Pages):
活動伺服器頁面,就是一個
編程環境,在其中,可以混合使用HTML、
腳本語言以及組件來創建伺服器端功能強大的Internet應用程式。如果你以前創建過一個站點,其中混合了HTML、腳本語言以及組件,你就可以在其中加入ASP程式代碼。通過在HTML頁面中加入腳本命令,你可以創建一個HTML用戶界面,並且,還可以通過使用組件包含一些
商業邏輯規則。組件可以被
腳本程式調用,也可以由其他的組件調用。
ASP的工作原理:
當在Web站點中融入ASP功能後,將發生以下事情:
1、用戶調出站點內容,默認頁面的擴展名是.asp。
3、伺服器端腳本開始運行ASP。
4、ASP檔案按照從上到下的順序開始處理,執行腳本命令,執行HTML頁面內容。
5、頁面信息傳送到瀏覽器。
因為腳本是在伺服器端運行的,所以Web伺服器完成所有處理後,將標準的HTML頁面送往瀏覽器。這意味著,ASP只能在可以支持的伺服器上運行。讓腳本駐留在伺服器端的另外一個益處是:用戶不可能看到原始
腳本程式的代碼,用戶看到的,僅僅是最終產生的HTML內容。
PHP:Hypertext Preprocessor
PHP 是一種
伺服器端的,嵌入HTML的
腳本語言。PHP區別其他像客戶端Javascript的地方是它的代碼在伺服器端執行.PHP能做什麼?
最低水平,PHP可以做任何其他CGI程式所能做的事,例如收集表格數據,生成
動態頁面內容,或者收發cookies.可能最強大,最有意義的特性是PHP支持大範圍的資料庫。書寫一個
支持資料庫的Web 頁面是難以置信的簡單。
下面是當前支持的資料庫:
Adabas D InterBase Solid
dBase mSQL Sybase
Empress MySQL Velocis
FilePro Oracle Unix dbm
Informix PostgreSQL
PHP通過協定也支持與其他服務的"交談",像IMAP、SNMP、NNTP、POP3,甚至是 HTTP。你也可以打開晦澀的 網路接口和其他協定互動。
PHP的簡要歷史
1994年秋季,Rasmus Lerdorf 開始構思 PHP。早期的非發行版本被用在他的主頁上,以追蹤誰在看他的線上簡歷。1995年年初第一版本出台,當時PHP只被認為是個人主頁開發工具。它由一個非常單純的只能理解很少數特殊宏的分析引擎和 一些用在主頁後端通用的工具組成,如留言簿,計數器和其他一些東西。這個分析器在1995年年中被重寫並被命名為 PHP/FI 第二版。FI來自 Rasmus 寫的另外一個包,用於解釋 html 形式的數據.他結合了個人主頁工具腳本和形式解析器,並加 上mSQL支持.這樣就產生 PHP/FI 了. PHP/FI以令人驚奇的步調成長,人們開始把自己的代碼貢獻給它。
很難給出它的硬統計表,但可以估計在1996年末,整個世界至少有15,000個網站在用PHP/FI。到1997年年中,這個數字已經超過50,000了,而在此時PHP的發展也發生了變化。由Rasmus自己偏愛的和幾個人開發的項目變成一個更有組織的團 體成就。Zeev Suraski和Andi Gutmans重寫了解析器。這個新的解析器成為PHP版本3的基礎。許多有用的代碼從PHP/FI 繼承到PHP3,並且很多是完全重寫的。
不管是PHP/FI或PHP3與很多商業產品捆綁在一塊,例如C2級強度的Web
伺服器和
紅帽子Linux。根據NetCraft提供的數據推斷,保守估計全世界套用PHP的網站已超過150,000個。由此看來,它比在網際網路上運行Netscape 的旗艦企業伺服器的站點還多。