RAID-M: 高性能磁碟矩陣式海量存儲器,RAIN-M是由一名博士生髮明的高性能網路連線磁碟矩陣存儲器的名稱。
RAIN-M釋義,RAIN-M,簡介,
RAIN-M釋義
RAID-M: 高性能磁碟矩陣式海量存儲器
RAIN-M
RAIN-M是由一名博士生髮明的高性能網路連線磁碟矩陣存儲器的名稱。設備針對日益嚴重的I/O瓶頸問題, 基於多通道I/O和並行訪問的思想, 提出構造高性能磁碟矩陣式海量存儲器RAID-M的方法. 理論分析表明, 不同級別RAID-M在性能、空間利用率和可靠性方面各有優點, 可以滿足各種套用目標. RAID-M樣機的順序讀數據性能和順序寫數據性能均突破了PCI匯流排瓶頸的限制。此設備在賣出時價格高達800萬元。
簡介
網路頻寬與處理器性能基本上保持了同步增長, 但磁碟I/O性能的增長卻是嚴重滯後的. 在過去10年, 區域網路的頻寬平均每16個月就增長一倍;而在1984年到1999 年這 15 年間, 磁碟的容量雖然增長了 1000 倍, 但傳輸速率僅增長了40 倍, 亦即每年僅增長 20%多.未來每 10 年, 磁碟的容量將增長 100 倍,而傳輸速率僅會增長 10倍.目前, 硬碟典型容量為 160 GB, 典型I/O性能為 30 MB/s,將整個硬碟的數據讀出需要1.5 h. 到2020年, 單條網路連結的頻寬可以達到400 Tbps, 單個硬碟的容量可達到 1PB, 而那時磁碟的I/O性能只能達到 2.5 Gbps,將整個硬碟數據讀出居然需要 932 h!磁碟I/O性能的滯後會成為計算機系統乃至網路傳輸整體性能提升的瓶頸.為了克服I/O瓶頸問題, 美國加州大學Berkeley分校提出了廉價冗餘磁碟陣列RAID (redundant array of inexpensive disks)的概念, 目前已成為數據存儲的主流技術. RAID使用一組磁碟同時進行I/O操作而獲得更大的I/O吞吐量, 並依靠存儲冗餘信息來保障數據的安全性. 早期的RAID大多作為伺服器的附屬存貯設備而存在, 以伺服器為中介提供數據存貯和訪問服務. 近年來, RAID已經從網路伺服器中逐步分離出來, 以網路連線存儲系統的方式提供服務, 這方面研究的代表是TickerTAIP, RAID-II, 網 絡連 接安全 磁碟NASD (network-attached secure disks), 活動磁碟等.
另外一個研究高性能I/O的熱點, 是集合計算機集群中各個結點的存貯能力和並行處理能力, 形成一個單一編址的海量存儲器. 例如, 黃鍇等人於 2000 年提出的RAID-x, 就是通過中間件軟體將各個結點的磁碟和RAID虛擬成一個大的RAID, 利用結點之間的相互映象或校驗實現RAID 1 或RAID 5 等機制. 類似的系統還有分散式磁碟冗餘陣列RADD (redundant arrays of distributed disks)、Petal、Swarm、MAID (massive arrays of idle disks)等. 當然, 這類系統雖然有較高的並行吞吐能力, 也是要付出代價的: 集群結點會因為分擔I/O任務而增加額外的負擔, 另外還會增加管理上的開銷.最近幾年, 高性能計算機匯流排和 I/O 控制技術得到了普及, 包括: 主機板集成RAID 控制器技術、多 PCI 匯流排技術、PCI-X、串列 ATA 磁碟數據接口(SATA), 等等. 不久的將來, PCI-X 2.0, PCI Express, Infiniband 等新一代 I/O 技術將把 I/O 頻寬從 MB/s 量級時代帶到 GBps 量級時代. 本文就是在新的背景下, 基於多通道I/O 和並行訪問思想提出構造磁碟矩陣, 達到大幅度提高存儲器 I/O 性能和容量的目標.