簡介
柵格數據就是將空間分割成有規律的格線,每一個格線稱為一個單元,並在各單元上賦予相應的屬性值來表示實體的一種數據形式。
空間資料庫是對地理柵格數據進行有效管理的一個極為重要的手段。
柵格結構
點實體由一個
柵格像元來表示;線實體由一定方向上連線成串的相鄰柵格像元表示;
面實體(區域)由具有相同屬性的相鄰柵格像元的塊集合來表示。
柵格結構的特點
數據直接記錄屬性的指針或屬性本身,而其所在位置則根據行列號轉換成相應的坐標給出。也就是說,定位是根據數據在數據集合中的位置得到的。
如圖3.1(a)所示,數據1表示屬性或編號位的一個點,其位置由所在的第3行、第5列得到。因為
柵格結構是按一定的規則排列的,因此所表示的實體位置很容易隱含在格線檔案的存儲結構中。在格線檔案中每個代碼本身明確地代表了實體的屬性或
屬性編碼,如果為屬性編碼,則該編碼可作為指向
實體屬性表的指針。圖3.1 (a)中表示了代碼分別為1,3,6的實體,圖3.1 (b)表示了一條代碼為8的線實體,圖3.1 (c)表示了3個代碼分別為4,7,9的面實體。
(a) 點 (b) 線 (c) 區域
0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 4 4 4 4 7 7 7 7
0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 4 4 4 4 4 7 7 7
0 0 0 0 1 0 0 0 0 0 0 0 8 0 0 0 4 4 4 4 9 9 7 7
0 0 0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 4 9 9 9 7 7
0 0 0 3 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 9 9 9 7 7
0 0 0 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 9 9 9 9 9
0 0 0 0 0 6 0 0 0 0 0 8 8 0 0 0 0 0 0 0 9 9 9 9
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 9 9 9
組織方法
柵格結構是用有限的格線逼近某個圖形,因此用柵格數據表示的地表是不連續的,是近似離散的數據。柵格單元的大小決定了在一個象元所覆蓋的面積範圍內
地理數據的精度 ,格線單元越細柵格數據越精確,但如果太細則數據量太大。尤其按某種規則在象元內提取的值,如對長度、面積等的度量,主成分值、均值的求算等,其精度由象元的大小直接決定。由於柵格結構中每個代碼明確地代表了實體的屬性或
屬性值,點實體在柵格結構中表示為一個象元,線實體表示為具有方向性的若干連續相鄰象元的集合,面實體由聚集在一起的相鄰象元表示,這就決定了格線行列陣列易為計算機存儲、操作、顯示與維護,因此,這種結構易於實現,算法簡單,易於擴充、修改,直觀性強,特別是容易與
遙感影像的聯合處理。
獲取途徑
(一)柵格數據的獲取途徑
柵格數據的獲取主要由以下幾個途徑:
⑴ 柵格法:在待輸入的圖形上均勻劃分柵格單元,逐個柵格地決定其屬性代碼,最後形成柵格
數字地圖檔案。這是人工編碼,當數據量太大時,該法費工費時,工作量相當大。
⑶
掃描數位化:逐點掃描待輸入的專題地圖,對掃描數據重新採樣與再編碼,從而得到柵格數據檔案。
⑷ 分類影像輸入:將經過分類解譯的
遙感影像數據直接或重新採樣後輸入系統,這是高效獲取數據的方法。
(二)柵格像元代碼的確定原則
當依據一定的要求給定單位格線後,而格線中有多種地物類型(或說屬性)時,則根據需要採取如下方案之一決定柵格單元的代碼。
⑴ 中心點法:即用處於柵格中心處的地物類型(屬性或
量值或屬性記錄指針)或現象特徵決定該柵格單元的代碼。對於具有連續分布特徵的
地理要素,如降水分布、人口密度等問題,中心法是被首要選用的。
⑵ 面積占優法:以占矩形面積最大的地物或現象特性的重要性決定柵格單元的代碼,此法常見於分類較細,地物類別斑塊較小的情況。
⑶ 長度占優法:當覆蓋的柵格過中心位置時,橫線占據該格中的大部分長度的屬性值定為該柵格單元的代碼。
⑷ 重要性法:根據柵格內不同地物的重要性,選取最重要的地物類型決定相應的柵格單元代碼。此法常見於具有特殊意義而面積較小且不在柵格中心的地理要素。尤其是點、線狀地理要素,
如城鎮、交通樞紐、交通線、河流水系等。
以上4點正確使用,則能較好地保持地表的真實性,儘可能地保持原圖或原始數據的精度問題。當然,縮小單個柵格單元面積,使每個柵格單元代表更為精細的地面矩形單元,減少混合單元、混合類型與混合面積,可大大提高量算精度,保持真實形態及更細小的地物類型。但增加柵格個數會使數據多,冗餘嚴重。為解決此問題,產生了一系列各具特色的柵格數據壓縮編碼方法。
編碼方法
編碼方法
在柵格檔案中,每個柵格只能賦予一個唯一的
屬性值,所以屬性個數的總數是柵格檔案的行數乘以列數的積,而為了保證精度,柵格單元分得一般都很小,這樣需要存儲的數據量就相當大了。通常一個柵格檔案的柵格單元數以萬計。但許多柵格單元與相鄰的柵格單元都具有相同的值,因此使用了各式各樣的數據編碼技術與壓縮編碼技術。主要的編碼技術簡介如下:
(一)直接柵格編碼
直接柵格編碼是將柵格數據看作一個數據矩陣,逐行或逐列逐個記錄代碼。可每行從左到右逐個記錄,也可奇數行從左到右,
偶數行從右到左記錄,為特定目的也可採用其它特殊順序。通常稱這種編碼的圖像檔案為柵格檔案,這種格線檔案直觀性強,但無法採用任何種壓縮編碼方法。圖2.1 (c)的柵格編碼為:4,4,4,4,7,7,7,7;4,4,4,4,4,7,7,7;4,4,4,4,9,9,7,7;0,0,4,9,9,9,7,7;0,0,0,9,9,9,7,7;0,0,0,9,9,9,9,9;0,0,0,0,9,9,9,9;0,0,0,0,0,9,9,9。可用程式設計語言按
順序檔案或隨機檔案記錄這些數據。
(二)鏈式編碼
鏈式編碼又稱
弗里曼鏈碼或世界鏈碼。它由某一原始點和一系列在基本方向上數字確定的單位矢量鏈。基本方向有東、東南、南、西南、西、西北、北、東北等8個,每個後繼點位於其前繼點可能的8個基本方位之一。8個基本方向的代碼可分別用0,1,2,3,4,5,6,7表示,既可按順時針也可按逆時針表示。柵格結構按逆時針編碼上圖(2)可記錄為:1,3,7,7,7,6,6,5,4。其中前兩個數字1與3表示線狀物起點的坐標,即在第一行第三列,從第三個數字起表示單位矢量的前進方向。
鏈式編碼有效地壓縮了柵格數據,尤其對多邊形的表示最為顯著,鏈式編碼還有一定的運算能力,對計算長度、面積或轉折方向的凸凹度更為方便。比較適於存儲
圖形數據。但對邊界做合併和插入等修改編輯工作很難實施,而且對局部修改要改變整體結構,效率較低。
(三)遊程編碼
遊程編碼是柵格數據壓縮的重要且比較簡單的編碼方法。它的基本思路是:對於一幅柵格圖像,常有行或列方向相鄰的若干點具有相同的屬性代碼,因而可採用某種方法壓縮重複的記錄內容。方法之一是在柵格數據陣列的各行或列象元的特徵數據的代碼發生變化時,逐個記錄該代碼及相同代碼重複的個數,從而可在二維平面內實現數據的大量壓縮。另一種編碼方案是在逐行逐列記錄屬性代碼時,僅記錄下發生變化的位置和相應的代碼。圖2.1 (c)
柵格結構按遊程編碼方法可記錄為:
第一行4,47,4
第二行4,57,3
第三行4,49,27,2
第四行0,24,19,37,2
第五行0,39,37,2
第六行0,39,5
第七行0,49,4
第八行0,59,3
在這個例子中,原本64個柵格數據,只用了40數值就完整地表示了出來,可見用遊程編碼方法壓縮數據是十分有效的。
遊程編碼的編碼和解碼的算法都比較簡單,占用的計算機資源少,遊程編碼還易於檢索、疊加、合併等操作,在柵格單元分得更細時,數據的相關性越強,壓縮效率更高,數據量並沒有明顯增加。因此,該編碼適合微型計算機等中央處理器處理速度慢,存儲容量小的設備進行
圖像處理。
(四)塊式編碼
塊式編碼是遊程編碼擴展到
二維空間的情況,遊程編碼是在一維狀態記錄柵格單元的位置和屬性,如果採用正方形區域作為記錄單元,每個記錄單元包括相鄰的若干柵格,數據結構由記錄單元中左上角的柵格單元的行、列號(初始位置)和記錄單元的邊長(半徑)與記錄單元的屬性代碼三部分組成,這便是塊式編碼。因此可以說,遊程編碼是塊式編碼的特殊情況,塊式編碼是遊程編碼的一般形式。圖2.1 (c)表示的
柵格結構按塊式編碼方法可記錄為:
(1,1,3,4),(1,4,1,4),(1,5,1,7),(1,6,2,7),(1,8,1,7);
(2,4,1,4),(2,5,1,4),(2,8,1,7);
(3,4,1,4),(3,5,2,9),(3,7,2,7);
(4,1,2,0),(4,3,1,4),(4,4,1,9);
(5,3,1,0),(5,4,2,9),(5,6,1,9),(5,7,1,7),(5,8,1,7);
(6,1,3,0),(6,6,3,9);
(7,4,1,0),(7,5,1,9),
(8,4,1,0),(8,5,1,0)。
從以上論述的塊式編碼的編碼原理可知,一個記錄單元所表示的地理數據相關性越強,也即記錄單元包含的正方形邊長越長,壓縮效率越高。而地理數據相關性差時,也即多邊形邊界碎雜時,塊式編碼的效果較差。
塊式編碼的運算能力弱,必要時其編碼的柵格數據須通過解碼轉換成柵格
矩陣編碼的數據形式才能順利進行。塊式編碼在圖像合併、插入、面積計算等功能方面較強。
(五)四叉樹數據結構
四叉樹編碼又名
四元樹編碼,可以通俗理解為一個具有四分枝結構的樹,它具有柵格數據二維空間分布的特徵,這是一種更為有效的編碼方法。四叉樹編碼將整個圖形區域按照四個
象限遞歸分割成2n×2n象元陣列,形成過程是:將一個2×2圖像分解成大小相等的四部分,每一部分又分解成大小相等的四部分,就這樣一直分解下去,一直分解到正方形的大小正好與象元的大小相等為止,即逐步分解為包含單一類型的方形區域(
均值塊),最小的方形區域為一個柵格單元。這個倒向樹狀的圖中“○”表示可繼續分割的方形區域;“□”表示具有同類屬性的方形區域;“■”表示不能再分的單個(最小)象元柵格,即所謂的樹葉,樹葉表示的是具有單一類型的地物或是符合既定要求的少數幾種地物,可以在任意層上。
⑴ 存儲空間小:因為記錄的基本單位是塊,不是象素點,因此大大地節省了存儲空間。
⑵ 運算速度快:因為四叉樹結構的圖形操作是在數上進行的,比直接在圖上運算要快得多。
⑶ 柵格陣列各部分的解析度可變:不需要表示許多細節的地方,分級較少,因而解析度低;邊界複雜的地方分級較多,解析度高,因而在減少數據量的基礎上滿足了
數據精度。
⑷ 容易有效地計算多邊形的數量特徵。
⑹ 四叉樹編碼表示多邊形中嵌套其它屬性的多邊形時比較方便:它允許多邊形嵌套多邊形的結構,是非常實用的、重要的特點,這點深深得到
地理信息系統數據編碼設計者的青睞。
⑺ 四叉樹編碼的不足之處是:轉換具有不確定性,對大小相等
形狀相同的多邊形,不同人可能分解為不同的四叉樹結構,因而不利於
形狀分析和模式識別。四叉樹編碼處理結構單調的圖形區域比較適合,壓縮效果好,但對具有複雜結構的圖形區域,壓縮效率會受到很大影響。
(六)八叉樹與十六叉樹結構
前面的數據結構都是基於
二維的,在相當多的情況下,如地下資源埋藏、地下溶洞的
空間分布,二維的坐標體系根本無法表達。因此需要有三維數據結構,如果考慮空間目標隨時間變化,那還需要4維數據結構。較好的表達三維與
四維結構是在四叉樹基礎上發展起來的八叉樹(三維)和十六叉樹(四維)。
(七)各種編碼的比較分析
比較以上各種編碼,可得出如下主要結論:
⑴ 直接柵格編碼直觀簡單,但數據出現大量冗餘;
⑵ 鏈式編碼對邊界的運算方便,壓縮效果好,但區域運算較困難;
⑶ 遊程編碼即較大幅度地保留了原始
柵格結構,又有較高的壓縮效率,而且編碼解碼也較容易,但僅局限在
一維空間上處理數據;
⑷ 塊式編碼在圖像合併、插入、面積計算等功能方面較強,當所表示的地理數據相關性強時,壓縮效率相當高;但地理數據相關性差時,塊式編碼的效果較差,而且塊式編碼的運算能力較弱;
⑸ 四叉樹編碼運算速度快,存儲空間小,解析度可變,壓縮效率高,但其轉換具有不確定性,難以形成統一算法。
柵格數據優勢
數據結構更加簡單,即由像元組成矩陣結構,其中的像元值表示坐標,有時與屬性表相關聯
格式更加強大,高級的空間和統計分析較容易實現
可以表示連續表面以及執行表面分析
點、線、面和表面都可同樣存儲
有利於遙感數據的匹配套用和分析
要將數據存儲為柵格還需要考慮其他因素,有時選擇基於矢量的存儲方法反而會更合適。例如:
由於柵格數據集的像元尺寸具有局限性,所以可能會帶來空間誤差。
柵格數據集可能會非常大,冗餘度較高,需要壓縮處理。雖然解析度會隨著柵格像元大小的減小而提高,但這會占用更多的磁碟空間,而且會拖慢處理速度。對於給定區域,將
柵格像元大小更改為現有大小的一半時,所需的存儲空間會增大為原來的四倍,具體情況取決於所使用的數據類型和存儲技術。
將數據重建到固定間距的柵格像元邊界時也會損失一定的精度。
定位精度比矢量低,拓撲關係難以表達。
模型要素
格網由行、列和格網單元組成,行、列由格網左上角起始,行方向作為y坐標,列方向作為x坐標格網單元由其行列位置定義。柵格數據用單個格網單元代表點,用一系列相鄰格網單元代表線,鄰接格網的集合代表面,每個格網單元有一個值,整型(表示類別數據,如土地利用類型)或浮點型(表示連續數據,如降水量)。格網中的每一個單元值代表了由此行此列決定的該位置上空間現象的特徵,柵格數據模型不把空間數據與屬性數據明確分開,資料庫管理用處不大。格網單元大小決定了柵格數據模型的解析度;大尺寸格線單元無法表示空間要素的精確位置,較小的格線單元則增大數據量和數據處理時間。
數據類型
衛星影像
遙感衛星影像是用柵格格式記錄,從1972年以來產生全球影像
美國陸地衛星1、2、3號:通過多光譜掃瞄器(MSS)獲取影像,空間解析度約為79m
陸地衛星4號:發射與1982年,用專題製圖儀(TM)掃瞄器,空間解析度為30m
1984年第二個TM式陸地衛星5在國外發射,1993年發射陸地衛星6未進入軌道
1999年發射陸地衛星7號(ETM1),設計用來季節性監控全球範圍內小尺度變化過程,空間解析度為30m
法國地球觀測衛星(SPOT)系列始於1986年,每個SPOT衛星帶有兩個感測器:全感應感測器獲取10m空間解析度的單波段影像,多光譜感測器獲取三個波段20m解析度影像,為GIS項目的良好空間數據源
印度、日本衛星計畫
1985年美國陸地衛星私有化,私人公司可收集與銷售遙感數據
SpaceImaging:Ikonos衛星用來獲取1m解析度的全色影像和4m解析度的多光譜影像
衛星影像像元值代表從地球表面反射或發射的光能,光能的測量基於來自連續波長的光譜波段,即電磁光譜
全色影像包含一個波段,而多光譜影像包含了一系列波段,例如TM影像有7個波段:藍、綠、紅、近紅外、中紅外I、熱紅外、中紅外II
數字高程模型
數字高程模型(DEM)由等間隔海拔數據排列組成;DEM以點為基礎,但也容易通過將海拔高度點置於格網單元中心的方法轉換成柵格數據
(1)美國地質調查局(USGS)的DEM:7.5秒DEM(1:24000),30秒DEM(1:100000)、1分DEM(1:250000)、阿拉斯加DEM
(2)非USGS數字高程模型
基本方法:採用立體測圖儀和具有重疊區的航片,產出比USGS精度更高的DEM數據,但費用太高。
其他方法:用衛星影像生成DEM模型,如SPOT數據
(3)全球數字高程模型
GTOPO30、ETOPO
數字正射影像
數字正射影像圖(DOQ)是一種由航片或其他遙感數據製備而得到的數位化影像,其中由照相機鏡頭傾斜和地形
起伏引起的位移已被消除;數字正射影像是地理坐標參考的,並可與地形圖和其他地圖配準
二進制掃描檔案
含有數值1或數值0,用於跟蹤矢量化
數字柵格圖形
是USGS地形圖的掃描圖像
圖形檔案
TIFF、GIF、JPEG
特定GIS軟體的柵格數據
總結
不論任何形式的壓縮數據編碼,都是以增加了運算時間換取了存儲空間,這就要考慮主要矛盾的主要方面,當我們想減少數據的冗餘,有效地利用空間資源時,就不得不進行數據壓縮編碼,而讓計算機多進行一些解碼和處理複雜圖形的運算。因此,一個優秀的壓縮數據編碼方案是:在最大限度減少計算機運算時間的基點上進行最大幅度的壓縮。