數據存儲

數據存儲

數據存儲對象包括數據流在加工過程中產生的臨時檔案或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特徵的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特徵;數據存儲反映系統中靜止的數據,表現出靜態數據的特徵。

基本介紹

  • 中文名:數據存儲
  • 外文名:Data storage
  • 作用:反映系統中靜止的數據
  • 領域:信息科學
存儲介質,三類存儲方式,DAS,NAS,SAN,三種存儲方式比較,存儲價格陷阱,存儲價格變化萬千,隱藏成本,殺死數據中心數據存儲容量的真兇,數據存儲管理,快閃記憶體數據存儲救場,數據存儲系統融合,

存儲介質

磁碟和磁帶都是常用的存儲介質。數據存儲組織方式因存儲介質而異。在磁帶上數據僅按順序檔案方式存取;在磁碟上則可按使用要求採用順序存取或直接存取方式。數據存儲方式與數據檔案組織密切相關,其關鍵在於建立記錄的邏輯與物理順序間對應關係,確定存儲地址,以提高數據存取速度。

三類存儲方式

DAS

DAS(Direct Attached Storage)直接附加存儲方式與我們普通的PC存儲架構一樣,外部存儲設備都是直接掛接在伺服器內部匯流排上,數據存儲設備是整個伺服器結構的一部分。
DAS存儲方式主要適用以下環境:
1)小型網路
因為網路規模較小,數據存儲量小,且也不是很複雜,採用這種存儲方式對伺服器的影響不會很大。並且這種存儲方式也十分經濟,適合擁有小型網路的企業用戶。
2)地理位置分散的網路
雖然企業總體網路規模較大,但在地理分布上很分散,通過SAN或NAS在它們之間進行互聯非常困難,此時各分支機構的伺服器也可採用DAS存儲方式,這樣可以降低成本。
3)特殊套用伺服器
在一些特殊套用伺服器上,如微軟的集群伺服器或某些資料庫使用的原始分區,均要求存儲設備直接連線到套用伺服器。
4)提高DAS存儲性能
在伺服器與存儲的各種連線方式中,DAS曾被認為是一種低效率的結構,而且也不方便進行數據保護。直連存儲無法共享,因此經常出現的情況是某台伺服器的存儲空間不足,而其他一些伺服器卻有大量的存儲空間處於閒置狀態卻無法利用。如果存儲不能共享,也就談不上容量分配與使用需求之間的平衡。
DAS結構下的數據保護流程相對複雜,如果做網路備份,那么每台伺服器都必須單獨進行備份,而且所有的數據流都要通過網路傳輸。如果不做網路備份,那么就要為每台伺服器都配一套備份軟體和磁帶設備,所以說備份流程的複雜度會大大增加。
想要擁有高可用性的DAS存儲,就要首先能夠降低解決方案的成本,例如:LSI的12Gb/s SAS,在它有DAS直聯存儲,通過DAS能夠很好的為大型數據中心提供支持。對於大型的數據中心、雲計算、存儲和大數據,所有這一切都對DAS存儲性能提出了更高的要求,雲和企業數據中心數據的爆炸性增長也推動了市場對於可支持更高速數據訪問的高性能存儲接口的需求,因而LSI 12Gb/s SAS正好是能夠滿足這種性能增長的要求,它可以提供更高的IOPS和更高的吞吐能力,12Gb/s SAS提高了更高的寫入的性能,並且提高了RAID的整個綜合性能。
與直連存儲架構相比,共享式的存儲架構,比如SAN(storage-area network)或者NAS(network-attached storage)都可以較好的解決以上問題。於是乎我們看到DAS被淘汰的進程越來越快了。可是到2012年為止,DAS仍然是伺服器與存儲連線的一種常用的模式。事實上,DAS不但沒有被淘汰,近年來似乎還有回潮的趨勢。

NAS

NAS(Network Attached Storage)數據存儲方式全面改進了以前低效的DAS存儲方式。它採用獨立於伺服器,單獨為網路數據存儲而開發的一種檔案伺服器來連線所存儲設備,自形成一個網路。這樣數據存儲就不再是伺服器的附屬,而是作為獨立網路節點而存在於網路之中,可由所有的網路用戶共享。
NAS的優點:
1)真正的即插即用
NAS是獨立的存儲節點存在於網路之中,與用戶的作業系統平台無關,真正的即插即用。
2)存儲部署簡單
NAS不依賴通用的作業系統,而是採用一個面向用戶設計的,專門用於數據存儲的簡化作業系統,內置了與網路連線所需要的協定,因此使整個系統的管理和設定較為簡單。
3)存儲設備位置非常靈活
4)管理容易且成本低
NAS數據存儲方式是基於現有的企業Ethernet而設計的,按照TCP/IP協定進行通信,以檔案的I/O方式進行數據傳輸。
NAS的缺點:
(1)存儲性能較低 (2)可靠度不高

SAN

1991年,IBM公司在S/390伺服器中推出了ESCON(Enterprise System Connection)技術。它是基於光纖介質,最大傳輸速率達17MB/s的伺服器訪問存儲器的一種連線方式。在此基礎上,進一步推出了功能更強的ESCON Director(FC SWitch),構建了一套最原始的SAN系統。
SAN(Storage Area Network)存儲方式創造了存儲的網路化。存儲網路化順應了計算機伺服器體系結構網路化的趨勢。SAN的支撐技術是光纖通道(FC Fiber Channel)技術。它是ANSI為網路和通道I/O接口建立的一個標準集成。FC技術支持HIPPI、IPI、SCSI、IP、ATM等多種高級協定,其最大特性是將網路和設備的通信協定與傳輸物理介質隔離開,這樣多種協定可在同一個物理連線上同時傳送。
SAN的硬體基礎設施是光纖通道,用光纖通道構建的SAN由以下三個部分組成:
1)存儲和備份設備:包括磁帶、磁碟和光碟庫等。
2)光纖通道網路連線部件:包括主機匯流排適配卡驅動程式、光纜、集線器交換機、光纖通道和SCSI間的橋接器
3)套用和管理軟體:包括備份軟體、存儲資源管理軟體和存儲設備管理軟體。
SAN的優勢:
1)網路部署容易;
2)高速存儲性能。因為SAN採用了光纖通道技術,所以它具有更高的存儲頻寬,存儲性能明顯提高。SAn的光纖通道使用全雙工串列通信原理傳輸數據,傳輸速率高達1062.5Mb/s。
3)良好的擴展能力。由於SAN採用了網路結構,擴展能力更強。光纖接口提供了10公里的連線距離,這使得實現物理上分離,不在本地機房的存儲變得非常容易。

三種存儲方式比較

存儲套用最大的特點是沒有標準的體系結構,這三種存儲方式共存,互相補充,已經很好滿足企業信息化套用。
從連線方式上對比,DAS採用了存儲設備直接連線套用伺服器,具有一定的靈活性和限制性;NAS通過網路(TCP/IP,ATM,FDDI)技術連線存儲設備和套用伺服器,存儲設備位置靈活,隨著萬兆網的出現,傳輸速率有了很大的提高;SAN則是通過光纖通道(Fibre Channel)技術連線存儲設備和套用伺服器,具有很好的傳輸速率和擴展性能。三種存儲方式各有優勢,相互共存,占到了磁碟存儲市場的70%以上。SAN和NAS產品的價格仍然遠遠高於DAS.許多用戶出於價格因素考慮選擇了低效率的直連存儲而不是高效率的共享存儲。
客觀的說,SAN和NAS系統已經可以利用類似自動精簡配置(thin provisioning)這樣的技術來彌補早期存儲分配不靈活的短板。然而,之前它們消耗了太多的時間來解決存儲分配的問題,以至於給DAS留有足夠的時間在數據中心領域站穩腳跟。此外,SAN和NAS依然問題多多,無法解決。

存儲價格陷阱

有時候需要對系統進行叉車式升級,但在採購過程中稍加推敲,可以避開存儲採購中可能遇到的價格陷阱。

存儲價格變化萬千

存儲設備是由技術變革而造成浪費性支出的典型,但也存在其必然性和必要性。在2005年,集成驅動電子設備(IDE)主要被用作低端數據存儲,而小型計算機系統接口(SCSI)硬碟主要用於高端伺服器。IDE非常慢,直到其發展為增強型IDE,之後就是SATA技術登場。SATA III2015年以及可以與高端存儲選項——串列連結SCSI(SAS)媲美——而且成本更低。
所有這些存儲設備都使用旋轉硬碟,這樣的硬碟無法與2015年的快閃記憶體抗衡。快閃記憶體一開始是作為攝像機存儲介質,脆弱而小眾,但2015年已經成為大多數數據中心設備廠商首選的存儲介質。

隱藏成本

即使硬體相對便宜,管理和大部分相關工具都會增加存儲的成本。
只能識別物理陣列的工具已經被虛擬化拋棄。那些能夠處理虛擬化世界存儲的軟體,發現虛擬存儲依舊依賴於底層的物理驅動器平台支持。
需要有一個戰術策略,需要在下一次技術叉車升級之前,最大化現有技術的利用。但戰術決策並不是戰略,將兩者混為一談會導致IT機構走向錯誤的技術方向。
如果當前存儲供應商一直灌輸——你快閃記憶體存儲十分脆弱,並且可用性未經證實,那么很可能你已經買了大型SAS陣列,作為一項戰略投資。它曾經是最好的存儲,而且你希望其能夠在很長一段時間內充分發揮性能而不至於貶值的太厲害,可是2015年該戰略已經遇到問題。
以SAS驅動器故障為例,這將導致RAID6重建而嚴重影響性能。如果遇到需要的尺寸已經停產,尋找替代故障驅動器的備件會變得困難,陣列無法接受不同類型的驅動器。用戶會抱怨所有的套用非常緩慢。你想著要添加快閃記憶體存儲層來提升性能,卻發現陣列沒有接口支持固態硬碟驅動器。
選擇是購買一台新存儲,將所有數據都搬走,然後丟掉舊系統——根本無須更換驅動器,它甚至不值得去賣掉以回收資金。
在考慮更新IT平台之前,超前思考——看起來正確的決定,在未來就不那么確定了。了解戰術/戰略對立和,如果需要長期的解決方案,就必須有標準與商業化。
問問供應商,現有的產品如何與舊版本協同工作。如果廠商2015年銷售的產品與舊系列不那么兼容,那么很有可能——無論銷售代表如何承諾——這預示著下一個叉車升級時刻。
諮詢供應商需要堅持一些標準:是否有堅持及時了解市場變化,產品是否完全支持行業標準?超出這些標準是否會與其他廠商的產品出現互操作性方面的問題?
其他廠商是否能夠為你正在採購的產品提供互補以提高附加價值?與這些合作夥伴與第三方交流,諮詢他們在供應商產品變化時,應對和變更是否容易。

殺死數據中心數據存儲容量的真兇

數據中心數據存儲架構和控制器的異質性,是標準化基礎設施實現支撐不同工作負載目的的一大障礙。
針對所有的意願和目標,數據存儲系統核心是產品化,然而在實現不同廠商數據存儲陣列互操作的這場戰鬥上,依舊存在著不同級別上的差異。
分散式計算意味著數據中心數據存儲必須和來自不同廠商的伺服器互操作,這增加了數據存儲架構標準化的要求,雲計算促使標準化有更大的進步。

數據存儲管理

數據中心存儲容量管理一直都依賴於某個相對不變的數據存儲基本技術:傳統機械硬碟。機械硬碟只有少數幾個製造商——西部數據與希捷,還有日立和東芝——硬碟本質上是一種商品。
問題需要通過實現不同品牌的陣列和控制器協同工作來解決。有些公司購買了高端、昂貴的存儲,如EMC的Symmetrix VMAX,希望通過單一的工具集來管理整個數據存儲。然而,磁碟陣列的運行是通過陣列控制器中的專用軟體和數據存儲來控制,這對創建完整功能的數據存儲管理工具來說是存在問題的。
數據存儲供應商——IBM有SAN Volume Controller,EMC則使用VPLEX,還有日立的Hitachi Data Systems,HP以及NetApp,都在吹捧各自專有的數據存儲管理工具,宣稱其能實現虛擬化存儲架構的融合。然而這些工具基本只支持自己廠商的數據存儲系統,而且在大多數情況下,還只針對部分產品。最終用戶在尋找真正的數據存儲,高功能異構數據存儲管理工具的道路上無果而終。
雲計算正在改變我們對數據存儲的看法。工作負載變得越來越混合,數據存儲需要根據不同的I/O需求管理對象,檔案和塊模式。儘管如此,要支持雲架構,數據存儲基礎設施必須被作為單一的資源池來看待,組織需要能夠自動化適應工作負載的變更。只有通過提供高度標準化的數據存儲工具才可能實現這樣的功能。這一舉措已經開始,但仍然有很長的路要走。

快閃記憶體數據存儲救場

標準化數據中心數據存儲容量很難只通過磁碟存儲來單獨創建。介質依賴於磁碟碟片之間的互相作用,讀/寫刺頭需要智慧型磁碟控制器進行調解以管理不同工作負載的需求。
快閃記憶體數據存儲的數據管理方法不同於硬碟。快閃記憶體數據存儲是直接訪問存儲架構;不需要通過磁頭尋找正確的磁碟區域來檢索數據,所以沒有延時。數據存儲管理速度的優勢意味著快閃記憶體可以套用在相同陣列的不同工作負載類型上。它也更統一跨越不同供應商的數據存儲產品實現虛擬化。
最後,標準化數據存儲可能是個真正的承諾額,而不僅僅是個談論的焦點——但還很遙遠。
數據存儲銷售商仍舊有許多不同的方式來推銷部署快閃記憶體。許多老牌數據存儲廠商通過一種混合的方式兜售:在磁碟陣列前增加獨立的快閃記憶體層。工作負載需要的數據存儲不在這個快閃記憶體層時可能會出現問題,因為控制器需要從硬碟拉取這些數據存儲。這使得某些數據存儲操作可能比純硬碟陣列還要慢。
最大化現有數據中心數據存儲容量投資的一個必要步驟是層疊純快閃記憶體和磁碟陣列系統。儘管如此,這些現有的傳統陣列會成為建造單一管理層時候的麻煩製造者。EMC ViPR數據存儲虛擬化產品已經展示了自己的承諾,為混合數據存儲架構提供了更大的控制許可權。
全快閃記憶體陣列被一起捆綁在混合數據存儲的激烈競爭中。快閃記憶體數據存儲如Pure Storage、Violin Memory和Nimble Storage,提供了智慧型軟體可以最小化數據存儲卷,並且提供先進的數據存儲管理系統管理整個虛擬化環境。

數據存儲系統融合

融合基礎設施(CI)系統遇到雲數據存儲管理時,有點攪混水的勢頭。
Nutanix——一家以數據存儲空間起家的供應商,提供超級CI平台服務,其中包括先進的數據存儲管理軟體。IBM的PureFlex系統和PureData系統,Dell的PowerEdge FX2系統,HP的Converged Infrastructure,以及其他數據存儲產品也提供了各種方法來實現直連數據存儲與CI系統整合,不僅是現有的陣列還是新型陣列都在加緊擴張與CI的融合。
還有一招可以提高伺服器端數據存儲連線的速度,如PCIe接口的快閃記憶體數據存儲器。IBM已經開發了用於自己系統內部連線的方式,可以進一步加快數據存儲速度。這個CAPI連線器再次帶來了專屬問題——這將取決於IBM是否會讓連線器能與其他廠商數據存儲系統保持高水平的統一協作。融合系統仍然必須集中資源來分享利用。這將需要比我們能看到的還要先進的數據存儲工具來支持。

相關詞條

熱門詞條

聯絡我們