持久故障

持久故障

在通信中,故障是是指產品或產品的一部分不能或將不能完成預定功能的事件或狀態。對某些產品(例如: 電子元器件、……)可稱失效。它不包括產品在預防性維修中不能完成預定功能的情況。也不包括由於缺乏外部資源或其他計畫好的措施而導致的不能完成預定功能的情況。持久故障是指在完成修復性維護活動之前,產品(裝備)一直持續存在的一種故障。

中文名稱持久故障
英文名稱persistent fault
定  義在完成修復性維護活動之前,產品(裝備)一直持續存在的一種故障。
套用學科通信科技(一級學科),運行、維護與管理(二級學科)

基本介紹

  • 中文名:持久故障
  • 外文名:Persistent Fault
  • 學科:通信科技、計算機科學
  • 特徵:需要修復,才能工作
  • 套用:通信設備、通信網路
  • 有關術語:臨時性故障
簡介,故障的分類及特徵,分類,特徵,SAP DB的持久性故障,定義持久性故障的標準,閾值和重試間隔與其它特性的相關性,用來設定閾值和重試間隔的系統特性,重試間隔的其它影響,

簡介

故障是系統不能執行規定功能的狀態。通常而言,故障是指系統中部分元器件功能失效而導致整個系統功能惡化的事件。持久故障是指在完成修復性維護活動之前,產品(裝備)一直持續存在的一種故障。與之相對應的臨時性故障是指產品(裝備)在很短時間內發生的喪失某些局部功能的故障。這種故障發生後不需要修復或更換零部件,只需對故障部位進行調整即可恢復器喪失的功能。

故障的分類及特徵

分類

1.按故障的持續時間分類
按故障的持續時問可將故障分為永久故障、瞬時故障和間歇故障。永久故障由元器件的不可逆變化所引發,其永久地改變元器件的原有邏輯。直到採取措施消除故障為止;瞬時故障的持續時間不超過一個指定的值。並只引起元器件當前參數值的變化,而不會導致不可逆的變化;間歇故障是可重複出現的故障,主要由元件參數的變化、不正確的設計和工藝方面的原因所引發。
2.按故障的發生和發展進程分類
按故障的發生和發展過程可將故障分為突發性故障和漸發性故障。突發性故障出現前無明顯的徵兆,很難通過早期試驗或測試來預測;漸發性故障是由於元器件老化等其他原因,導致設備性能逐漸下降並最終超出正確值而引發的故障。因此具有一定的規律性,可進行狀態監測和故障預防。
3.按故障發生的原因分類
按故障發生的原因將故障分為外因故障和內因故障。外因故障是因人為操作不當或環境條件惡化等外部因素造成的故障;內因故障是因沒計或生產方面存在的缺陷和隱患而導致的故障。
4.按故障的部件分類
按故障的部件可將故障分為硬體故障和軟體故障。硬體故障是指故障因硬體系統失效。
5.按故障的嚴重程度分類
按故障的嚴重程度可將故障分為破壞性故障和非破壞性故障。破壞性故障既是突發性的又是永久性的.故障發生後往往危及設備和人身的安全:而非破壞性的故障一般是漸發性的又是局部的,故障發生後暫時不會危及設備和人身的安全。
6.按故障的相關性分類
按故障相關性可將故障分為相關故障和非相關故障。相關故障也稱間接故障,因設備其他元器件而引發。比較難診斷;非相關故障也稱直接故障,由元器件本身直接因素所引起。相對相關故障而言比較容易診斷。
除此之外。還可以按照故障的因果關係分成物理性故障和邏輯性故障,按故障的表征分為靜態故障和動態故障。按故障變數的值分為確定值故障和非確定值故障等。

特徵

設備的故障一般具有如下五個基本特徵:
(1)層次性。複雜的設備,可劃分為系統、子系統、部件、元件,表現一定的層次性,與之相關聯,設備的故障也具有層次性的特徵,即設備的故障可能出現在系統、子系統、部件、元件等不同的層次上。
(2)傳播性。元件的故障會導致部件的故障,部件的故障會引起系統的故障,故障會沿著部件一子系統一系統的路徑傳播。
(3)放射性。某一部件的故障可能會引起與之相關聯的部件發生故障。
(4)延時性。設備故障的發生、發展和傳播有一定的時間過程,設備故障的這種延時性特徵為故障的前期預測預報提供了條件。
(5)不確定性。設備故障的發生具有隨機性、模糊性、不可確知性。

SAP DB的持久性故障

定義持久性故障的標準

為了儘可能地降低由於資源中的瞬態故障引起的中斷所帶來的影響,故障監視器將重新啟動資源以回響這類故障。 對於持久性故障,需要比重新啟動資源更具破壞性的操作:
對於 SAP DB 資源,故障監視器將資源故障切換到其它節點。 SAP DB 資源是故障切換資源。
對於 SAP xserver 資源,故障監視器將使該資源脫機。 SAP xserver 是可伸縮資源。
如果在指定的重試間隔內嘗試重新啟動資源的次數超過了指定的閾值,則故障監視器將認為故障是持久性的。 為持久性故障定義標準使您能夠根據群集的性能特點和可用性要求來設定閾值和重試間隔。

閾值和重試間隔與其它特性的相關性

重新啟動一次出現故障的資源所需的最長時間是以下特性的值的總和:
Thorough_probe_interval 系統特性
Probe_timeout 擴展特性
為了確保在重試間隔內達到閾值之前您具有足夠的時間,請使用以下表達式來計算重試間隔和閾值:
retry-interval ≥ threshold × (thorough-probe-interval + probe-timeout)

用來設定閾值和重試間隔的系統特性

要設定閾值和重試間隔,請設定以下系統特性:
要設定閾值,請將 Retry_count 系統特性設定為允許的最大重啟次數。
要設定重試間隔,請將 Retry_interval 系統特性設定為所需的間隔(以秒為單位)。
為每個包含需要調節的 Sun Cluster HA for SAP DB 故障監視器的資源設定這些特性。表中顯示了這些資源的資源類型。
故障監視器
資源類型
SAP DB
SUNW.sapdb
SAP xserver
SUNW.sap_xserver

重試間隔的其它影響

除了定義持久性故障標準以外,重試間隔還影響故障監視器對以下故障做出的回響:
SAP DB 故障監視器檢測到 SAP xserver 不可用。 如果 SAP DB 故障監視器在重試間隔內兩次檢測到 SAP xserver 不可用,則 SAP DB 故障監視器將重新啟動 SAP xserver。
持久性系統錯誤。持久性系統錯誤是指在重試間隔內發生四次的系統錯誤。 如果發生持久性系統錯誤,故障監視器將重新啟動 SAP xserver。

相關詞條

熱門詞條

聯絡我們