集群檔案系統

集群檔案系統、並行檔案系統、已分享檔案系統

基本介紹

  • 中文名:冬瓜頭
集群檔案系統是指運行在多台計算機之上,之間通過某種方式相互通信從而將集群內所有存儲空間資源整合、虛擬化並對外提供檔案訪問服務的檔案系統。其與NTFS、EXT等本地檔案系統的目的不同,前者是為了擴展性,後者運行在單機環境,純粹管理塊和檔案之間的映射以及檔案屬性。
集群檔案系統分為多類,按照對存儲空間的訪問方式,可分為共享存儲型集群檔案系統和分散式集群檔案系統,前者是多台計算機識別到同樣的存儲空間,並相互協調共同管理其上的檔案,又被稱為已分享檔案系統;後者則是每台計算機各自提供自己的存儲空間,並各自協調管理所有計算機節點中的檔案。Veritas的CFS,昆騰Stornext,中科藍鯨BWFS,EMC的MPFS,屬於共享存儲型集群檔案系統。而HDFS、Gluster、Ceph、Swift等網際網路常用的大規模集群檔案系統無一例外都屬於分散式集群檔案系統。分散式集群檔案系統可擴展性更強,目前已知最大可擴展至10K節點。
按照元數據的管理方式,可分為對稱式集群檔案系統和非對稱式集群檔案系統。前者每個節點的角色均等,共同管理檔案元數據,節點間通過高速網路進行信息同步和互斥鎖等操作,典型代表是Veritas的CFS。而非對稱式集群檔案系統中,有專門的一個或者多個節點負責管理元數據,其他節點需要頻繁與元數據節點通信以獲取最新的元數據比如目錄列表檔案屬性等等,後者典型代表比如HDFS、GFS、BWFS、Stornext等。對於集群檔案系統,其可以是分散式+對稱式、分散式+非對稱式、共享式+對稱式、共享式+非對稱式,兩兩任意組合。
按照檔案訪問方式來分類,集群檔案系統可分為串列訪問式和並行訪問式,後者又被俗稱為並行檔案系統。串列訪問是指客戶端只能從集群中的某個節點來訪問集群內的檔案資源,而並行訪問則是指客戶端可以直接從集群中任意一個或者多個節點同時收發數據,做到並行數據存取,加快速度。HDFS、GFS、pNFS等集群檔案系統,都支持並行訪問,需要安裝專用客戶端,傳統的NFS/CIFS客戶端不支持並行訪問。
對於分散式集群,其對檔案元數據的管理方式又可以分為single path image和single filesystem image兩種方式,具體可以參考《大話存儲 終極版》中對集群檔案系統的描述。以上總結於《大話存儲 終極版》

相關詞條

熱門詞條

聯絡我們