精確快速的結構級軟錯誤量化關鍵技術研究

精確快速的結構級軟錯誤量化關鍵技術研究

《精確快速的結構級軟錯誤量化關鍵技術研究》是依託上海交通大學,由付宇卓擔任項目負責人的面上項目。

基本介紹

  • 中文名:精確快速的結構級軟錯誤量化關鍵技術研究
  • 項目類別:面上項目
  • 項目負責人:付宇卓
  • 依託單位:上海交通大學
項目摘要,結題摘要,

項目摘要

隨著積體電路工藝尺寸的不斷縮小,更高的軟錯誤率和複雜的多位翻轉模式對晶片設計帶來的挑戰日益嚴峻。目前針對處理器結構的軟錯誤量化方法存在評估過程耗時過長和量化結果精度過低的問題,難以為高可靠微處理器提供精確快速的容錯設計指導。針對這些問題,本課題提出了一套面向微處理器架構的軟錯誤量化評估方案,通過程式指令分析獲得錯誤邏輯禁止關係,以此建立關鍵存儲結構的敏感狀態機率轉換圖,並利用機率圖模型實現特定部件的軟錯誤量化指標的精確快速計算。與現有類似方法相比,本課題研究的優勢體現在:(1)全面分析了軟錯誤在存儲部件中的傳播效應和禁止效應,結合涵蓋一位翻轉和多位翻轉錯誤模型的統一形式化描述方式,使得評估結果的精度大幅提高;(2)將機率圖建模方法引入軟錯誤量化分析中,結合套用場景分析制定了合理的模型化簡機制,有效加速了大規模變數情況下的邊緣機率求解,從而保證了關鍵存儲部件的精確軟錯誤量化值的快速獲取。

結題摘要

針對傳統故障注入與ACE軟錯誤量化方法的在速度和精度難以權衡的問題,本課題提出了面向複雜處理器系統的完整軟錯誤敏感性量化分析框架,包括以下三個方面:(1)在現有ACE方法基礎上,提出面向單核處理器的一位翻轉故障機率圖模型構建與推理方法、多位翻轉故障的直方圖邊界模型、面向處理器結構眾核片上網路的基於PRP的並發注入量化方法和面向MCU的預分析加速注入統計方法,通過全面的指令內和指令間故障傳播定義和高效的故障關聯推理方法,針對各類套用場景在精度和速度方面取得了較好的權衡;(2)在機率圖分析模型的基礎上,提出了基於集合操作的軟錯誤形式化表征及基於圖的暫存器視窗分析方法GBMW,以形式化方式定義了完整的故障禁止和傳播行為,獲得了體系結構敏感度(AVF)的多階分析結果,且分析時間保持在同一量級;以敏感度分析結果作為依據指導基於糾錯碼(ECC)的暫存器部分加固架構S-Shield,在基本保持加固效果的前提下,有效降低了面積開銷;(3)針對ACE方法無法分析系統部件與系統失效對應關係的不足,提出了基於全系統故障注入仿真的貝葉斯網路故障診斷模型與LSTM參數預測模型,能夠對複雜系統進行自動故障注入模擬和數據採集,通過少量觀測數據實現對系統失效模式的高精度預測。 基於以上研究內容,本課題構建了完整的處理器系統軟錯誤量化體系,綜合運用圖模型、貝葉斯網路、深度學習網路等分析方法,能夠對常規或加固系統的部件AVF和失效模式進行全面分析和預測,有利於對系統設計早期可靠性評估和驗證提供有效支撐。

相關詞條

熱門詞條

聯絡我們