簡介
URL以字元串的抽象形式來描述一個資源在
全球資訊網上的地址。一個URL唯一標識一個
Web資源,通過與之對應的URL即可獲得該資源。URL一般形式如下:
<scheme>:<scheme-specificpart>
其中<scheme>表示URL採用的方案,方案之後是一個冒號(:),之後的方案描述部分(<scheme-specificpart>)則依賴之前所採用的方案。方案名可以由一系列字元組成,字元可以是小寫字母“a"-“z"、數字以及字元加號(“+")、句點(“.")和連字元(“-*)為了便於使用,程式在解釋URL時視大小寫字元是等價的(如http等價於HTTP)。
具體來說,常用的URL格式如下:
協定類型://伺服器地址[:連線埠號]/路徑/檔案名稱[參數=值]
上述結構中[]部分是可選的。如果連線埠號與相關協定默認值不同,則需包含連線埠號。其中協定類型包括
HTTP,
MAILTO,
FILE,
FTP等。利用HTTP協定訪問全球資訊網上的一個資源的URL形如:
http://website.com/goods/search.phpterm-apple
其中website.com伺服器,search.php是伺服器端的一個腳本檔案,之後緊跟腳本執行所需要的參數term,而apple為用戶輸入的對應term的參數值。
除上述的絕對形式外,還可以相對某一特殊主機或主機上的一個特殊路徑指定URL,如:
/goods/search.phpterm-apple
/search.phpterm-apple
Web頁面常常用上述相對形式描述Web站點或者應用程式中的導航。
特點
常見的url表現形式有靜態、動態、偽靜態三種。
靜態頁面
優點:相比其他兩種頁面,速度最快。不僅載入速度最快,而且不需要從
資料庫裡面提取數據,速度快的同時,也不會對
伺服器產生壓力。
缺點:由於數據都是儲存在
HTML裡面,所以導致檔案非常大。並且最嚴重的問題是,更改原始碼必須全部更改,而就算只改一個地方,全站靜態頁面就自動更改了。如果是大型網站有比較多的數據,那會占用大量的伺服器空間,每次添加內容都會產生新的頁面。
動態頁面
優點:空間使用量非常小,一般幾萬條數據的網站,使用網動態頁面,可能只有幾兆的檔案大小,而使用靜態頁面少則十幾兆,多則幾十兆。因為數據是從資料庫裡面調用而來,如果要更改某些數值,直接更改資料庫,那么所有的動態頁面,就會自動更新了。這一點相比靜態頁面好處就大很多了。
缺點:用戶訪問速度較慢,為什麼會訪問動態頁面較慢呢。這個問題我們就必須從動態頁面的訪問機制說起了,其實我們的伺服器上面有一個解釋引擎,當用戶訪問的時候,這個解釋引擎就會把動態頁面翻譯為靜態頁面,這樣大家就能夠在瀏覽器裡面查看源碼了。而這個源碼就是解釋引擎翻譯以後的源碼。除訪問速度較慢以外,動態頁面的數據是從資料庫裡面調用過來的,如果訪問人數非常多,資料庫的壓力就會非常大的,不過現在動態程式都是使用了快取技術。但是總體來講,動態頁面對於伺服器的壓力比較大一點。同時動態頁面的網站一般對伺服器高求要比較高一些,同時訪問的人越多對伺服器造成的壓力越大。
偽靜態
優點:大家都知道靜態頁面對seo有很大益處,而且對伺服器的負載很小,但靜態頁面的缺點是不能隨時更新。對於偽靜態的優點,這個並不好講,偽相比動態網頁而言,並沒有速度上面的提升,相比較而言,因為是“假”靜態頁面,其實還是一個動態頁面,也是同樣需要翻譯為靜態頁面的。最大的好處就是讓搜尋
引擎把自己的網頁當做靜態頁面來處理。
缺點:從名稱上面就能夠看出來缺點,“偽靜態”其實就是“假靜態”,搜尋引擎會不會把他當做是靜態頁面來處理,這只是我們靠經驗靠邏輯去分析的,並不一定準確。或許搜尋引擎直接把他認為是動態頁面,我們做那么多努力,其實什麼也沒有換來。
組成部分介紹
基本URL包含模式(或稱協定)、伺服器名稱(或IP位址)、路徑和檔案名稱,如“協定://授權/
路徑查詢”。完整的、帶有授權部分的普通統一
資源標誌符語法看上去如下:協定://用戶名:密碼@子域名.域名.頂級域名:
連線埠號/目錄/檔案名稱.檔案後綴參數=值#標誌。
第一部分
模式/協定(scheme):它告訴瀏覽器如何處理將要打開的檔案。最常用的模式是超文本傳輸協定(Hypertext Transfer Protocol,縮寫為HTTP),這個協定可以用來訪問網路。
其他協定:
http——超文本傳輸協定資源
file——當地電腦或網上分享的檔案
gopher——Gopher協定
第二部分
第二部分是 Internet 主機名。我們希望訪問的 WWW 頁 面就存放在該計算機上。有了這台計算機的名 字,Internet 通過
DNS( 域名伺服器) 找到與這台計算機的英文名相對應的數字地址,也叫做 IP 地址,就能夠在全世界範圍內找到這台計算機,不管它是在哪個國家或哪個地區。檔案所在的伺服器的名稱或
IP位址,後面是到達這個檔案的路徑和檔案本身的名稱。伺服器的名稱或IP位址後面有時還跟一個冒號和一個
連線埠號。它也可以包含接觸伺服器必須的用戶名稱和密碼。
第三部分
url的第三項為路徑。它定義信息保存在 這台計算機上的什麼地方,即哪個子目錄中。 每個子目錄的前面有 一條斜槓 。
路徑部分包含等級結構的路徑定義,一般來說不同部分之間以斜線(/)分隔。詢問部分一般用來傳送對伺服器上的資料庫進行動態詢問時所需要的參數。
第四部分
url的第四項是檔案名稱或主頁名。也就是我們想要訪問的某個具體信息的檔案名稱或主頁名。在 http://home.nets cape.com/pub/ma in/index.html 中 index.html 為主頁名。當然,檔案名稱也是可以省略的,如果省略,你所連線的計算機將自動決定使用哪一個檔案。常見的 檔案類型有:正式的 Web 頁( .html) 、純文本檔案( .txt 或.text) 、圖片檔案( .gif 或.jpeg) 、聲音檔案( .wav 或.au) 、電 影檔案( .avi 或.mpeg) 等。
分類
絕對
絕對URL(absolute URL)顯示檔案的完整路徑,這意味著絕對URL本身所在的位置與被引用的實際檔案的位置無關。
相對
相對URL是不完整的,要從相對URL中獲取訪問資源所需的全部信息,就必須相對另一個被稱為基礎的URL進行解析。相對URL(relative URL)以包含URL本身的資料夾的位置為參考點,描述目標資料夾的位置。如果目標檔案與當前頁面(也就是包含URL的頁面)在同一個目錄,那么這個檔案的相對URL僅僅是檔案名稱和擴展名,如果目標檔案在當前目錄的子目錄中,那么它的相對URL是子目錄名,後面是斜槓,然後是目標檔案的檔案名稱和擴展名。
一般來說,對於同一伺服器上的檔案,應該總是使用相對URL,它們更容易輸入,而且在將頁面從本地系統轉移到伺服器上時更方便,只要每個檔案的相對位置保持不變,連結就仍然是有效地。
相對URL為了保持一組資源(HTML頁面)的便捷性提供了一種便捷方式,如果使用相對URL,可以在搬移一組文檔時,仍保持連結的有效性;因為相對URL是相對於新基礎進行解釋的,類似於在其他伺服器提供鏡像內容等功能。
大小寫問題
統一
資源定位符一般是分大小寫的,不過伺服器
管理員可以確定在回復詢問時大小寫是否被區分。有些伺服器在收到不同大小寫的詢問時的回覆是相同的。地址結尾的"."號在網際網路的發展初期,訪問一個網站不是單純的輸入這樣DNS伺服器才能夠識別。後來,
微軟公司在WindowsNT3.51中對其進行了修改,可以自動在DNS查詢時自動增加一個.號,隨後UNIX,NetWare也隨之而跟進,讓伺服器可以識別結尾沒有"."的域名。但是,符號"."在現在的網址中仍然可以使用,統一
資源定位符的日常使用
超文本傳輸協定統一
資源定位符將從網際網路獲取信息的四個基本元素包括在一個簡單的地址中。