科學工作流建模理論與動態進化方法研究

《科學工作流建模理論與動態進化方法研究》是王黎維著的博士論文

基本介紹

  • 中文名:科學工作流建模理論與動態進化方法研究
  • 外文名:Research on modeling theory and dynamic evolution method of scientific workflow
  • 關鍵字:企業管理 系統工程 工作流管理系統
  • 論文作者:王黎維
  • 指導教師:彭智勇
  • 學科專業:計算機軟體與理論
  • 學位級別:博士論文
  • 學位授予單位:武漢大學
  • 學位授予時間:2007
  • 館藏號:F270.7
  • 館藏目錄:2009\F270.7\2
中文摘要
科學工作流是近幾年發展起來的一個新興研究課題,它涉及到資料庫、工作流管理、可視化環境、容錯、服務組合和格線計算等多個學科,給目前信息科學和技術領域的研究帶來了巨大的挑戰。該技術能夠支持科學家進行數據管理和任務分析,目前已引起了廣泛的關注,並成為處理科學數據的統一機制。 本文對科學工作流中的幾個關鍵性技術進行了研究,它包括:基於資料庫的科學工作流管理框架;同時表達控制流和數據流的科學工作流模型;確保工作流進化過程中數據流正確性的實例遷移方法;數據源信息的高效跟蹤;科學工作流系統容錯等。本文研究的內容和創新工作主要包括以下幾個方面: 1.基於對象代理資料庫的科學工作流管理框架 本文提出了一個基於對象代理資料庫(TOTEM)的科學工作流管理框架。它基於對象代理資料庫對科學工作流建模,允許用戶描述所需的科學任務以及工作流執行流程的組合。通過對象代理模型中的類和代理類定義工作流中不同科學任務的輸入和輸出,通過定義任務數據間的對象代理關係及任務輸入數據類上的規則和觸發器實現工作流的自動執行。該框架意味著資料庫與工作流管理的緊密結合,允許工作流管理操作以類似於傳統數據管理操作的方式來完成。 2.數據流約束工作流網DCWF-net及其驗證 如何將控制流和數據流無縫地整合到一個模型中是正確有效地進行科學工作流建模的前提條件。在工作流建模領域,基於Petri網技術的過程描述和驗證方法具有較強的形式化優勢,其中工作流網(WF-net)是一個經典的工作流模型。然而,WF-net主要對控制流建模,而忽視了數據流建模的重要性。因此,本文對WF-net在面向工作流數據方面進行相應擴充,提出了一個數據流約束工作流網(DCWF-net)。通過對DCWF-net中數據流錯誤類型的分析,本文提出了DCWF-net的合理性約束,並給出了一個擴展遍歷樹算法來驗證DCWF-net控制結構和數據流的正確性。 3.保證數據流正確性的動態工作流進化 與簡單的控制流相比,科學工作流具有複雜的數據流結構,科學工作流設計的關鍵在於對活動之間數據流的描述。科學工作流進化必須要考慮數據流的修改對運行實例的影響,數據流的修改可能會引起如工作流實例的無源數據輸入,丟失更新等錯誤,因此,如何確保修改後數據流的正確性和一致性是一件非常複雜的間題。本文在考察了當前的一些工作流動念修改策略後,提出了實例有效遷移到修改後的模式上的標準,在此基礎上,給出了轉換當前運行實例到修改後的工作流模式的一些充分條件,以及一個轉換規則來保證這些實例能被轉換到一個正確的狀態,並保證該狀態能維持數據流的一致性和正確性。 4.基於對象代理模型的數據跟蹤 本文在分析了目前數據跟蹤方法的基礎上,研究並提出了一個基於對象代理模型的數據跟蹤方法。該方法基於對象代理資料庫對科學工作流過程的建模,任務執行完成後會將任務的輸出數據對象與輸入數據對象之間的映射關係記錄到一個映射類中。同時,由於任務的輸入數據類定義為其前驅任務的輸出數據類的代理類,因此類與代理類中的數據對象之間的映射關係也會自動記錄到系統表中。使得數據跟蹤能提供比注釋或反向查詢更高的性能,並在自動更新維持方面也能體現其優勢。同時,為了更好地追蹤數據,文中提出了部分物化數據模式,實驗顯示它具有較好的系統性能。 5.基於二次認證的科學工作流容錯 由於科學計算環境比其他環境更不可靠,在科學工作流的設計與實現中如何保證系統在出現故障時維持正常的執行,即如何進行系統容錯是一個至關重要的問題。本文針對以數據流為中心的科學工作流套用,提出了一種基於二次認證的科學工作流容錯技術。此方法將每個主要節點伺服器與一個恢復節點伺服器相關,當主要節點伺服器失敗時,能觸發恢復節點伺服器繼續處理。由於系統出錯丟失了線上數據,為了使恢復節點伺服器的狀態與主要節點伺服器出錯前的狀態保持同步,本文提出了一個二次認證的容錯方法,該方法通過對數據的二次認證保證了系統的精確恢復。

相關詞條

熱門詞條

聯絡我們