基本介紹
- 中文名:NetWare三級容錯機制
- 性質:機制
- 屬性:三級容錯
- 超過: 500個故障檢測點
容錯伺服器優勢
在一台容錯伺服器內部有超過 500個故障檢測點,隨時都有可能發出錯誤報警和通知。這些故障中,有處理器、晶片組、記憶體定址、位元組和電源錯誤,也有內部匯流排協定、CRC、ECC、系 統時鐘、系統服務和散熱系統錯誤等,對於標準工業伺服器而言,任何錯誤都可能導致系統癱瘓,更為可怕的是這些錯誤是隨機的,很多屬於臨時性錯誤。如果把系統重新啟動,有些故障就會消失。與故障相比,有些錯誤不容易被察覺,導致錯誤的計算結果,其危害更大。
工業標準伺服器所以有如此的問題 主要與設計思想有關,運行時間不是其主要設計目標,它只具有有限冗餘特徵,如電源,需要通過集群來提高可靠性。與之相比,小型機具有更高的可靠性設計,用於保障系統的可靠運行。小型機在故障點檢測上有很多的保障機制。通常小型機的價格比較高。隨著處理器技術的發展,特別是Intel Xeon 7500系列處理器的推出,IA處理器在可靠性性能設計上與小型機所採用的RISC處理器大幅度接近,但在系統上,標準工業伺服器還是有些差距。
工業標準伺服器的優勢在於價格,小型機的競爭力在於高可靠性,有沒有辦法魚和熊掌兼得呢?就只有在系統結構上想辦法,雙機、集群和容錯都是不錯的方法。
雙機和集群是通過軟體的方法,通過故障機切換來提升可靠性。與之相比,容錯是採用硬體的方法,以及特有故障處理和保障機制提高系統的可靠性。容錯較之單機具有更高的可靠性,其中,容錯還具有糾正臨時性錯誤的能力,可以確保計算的正確性。
小型機也通過雙機和容錯來進一步提升可靠性,但成本代價更高。隨著IA處理器可靠性性能的改善,採用容錯伺服器提高系統可靠性成為了很多明智用戶的選 擇。與雙機相比,容錯伺服器硬體成本高於雙機方案,但考慮軟體因素,容錯伺服器具有相當競爭力。