多粒度可重構視覺處理晶片的設計研究與架構最佳化

多粒度可重構視覺處理晶片的設計研究與架構最佳化

《多粒度可重構視覺處理晶片的設計研究與架構最佳化》是依託西安交通大學,由梅魁志擔任項目負責人的面上項目。

基本介紹

  • 中文名:多粒度可重構視覺處理晶片的設計研究與架構最佳化
  • 項目類別:面上項目
  • 項目負責人:梅魁志
  • 依託單位:西安交通大學
中文摘要,結題摘要,

中文摘要

本項目將從視覺套用算法和視覺處理晶片架構的互動影響出發,針對在移動機器人、目標識別與跟蹤等領域的結構化和圖像檢索/分類等非結構化套用,建立面向視覺套用系統物理可實現的算法仿真與性能評估環境,探索使用新型或多源感測器輸入的視覺處理的計算降維。開展能夠滿足結構化和非結構化視覺計算的高效能通用視覺處理SoC晶片的原型系統與晶片架構最佳化的研究,包括:構建含有多種粒度的異構計算陣列,支持多層次的運行時動態配置和高度可重構的計算機制與方法,適於視覺處理數據流和控制流的片上網路與片上分散式存儲結構。預期研究成果將為視覺信息處理、未來的智慧型計算提供高效計算與微系統實現所需要的關鍵技術。

結題摘要

項目主要從視覺套用算法和視覺處理晶片架構的互動影響出發,以移動機器人、目標識別領域的手勢識別以及類人智慧型處理的層次化大規模圖像分類為研究對象,分別提出了基於多特徵融合、分組訓練、特徵共享以及快速跟蹤的手勢識別系統設計;並利用圖像類之間的視覺相關性,提出基於組的“視覺詞典”的層次化大規模圖像分類系統及其分散式並行設計。在高效能視覺處理SoC架構方面,面向大規模視覺計算套用的核間通信頻寬的不均勻與非對稱分布特點,提出了支持數據流的動態自適應分類和分層最佳化傳輸的雙層片上網路設計框架,面向輕負載的具有低偏轉率高轉發效率的無快取路由算法及其結構設計(LDBR)以及面向重負載的基於方向信息素的蟻群自適應路由算法(ACO-DP)與電路結構。同時,針對機器視覺和深度學習套用的向量運算,給出了一種最大支持32×32浮點矩陣運算的可重構計算陣列處理器設計及其編譯實現,設計並實現了具有讀預取和寫合併快取的主存控制器以滿足多核視覺處理晶片集成時的分散式片上快取存取控制。項目以GPU為異構的細粒度SIMD計算單元核,研究了SIFT算法在GPU計算時的負載均衡、指令級並行與執行緒並行調度等設計;建立了面向OpenCL的ARM Mali GPU仿真器構建及其微體系結構參數獲取,以及基於分類和多優先權佇列(CPMQ)的多任務調度。針對ARM的同構多CPU核、NEON以及GPU的多粒度協同計算,構建了Caffe分類、手勢識別等套用的並行化最佳化流程及其設計。 項目的研究成果發表SCI期刊論文9篇,其中CCF B類1篇,CCF C類7篇;國核心心期刊3篇;會議論文3篇,其中CCF C類2篇;申請國家發明專利4項。項目培養博士4名,碩士12名,並對關鍵技術進行了晶片和FPGA套用系統驗證。

相關詞條

熱門詞條

聯絡我們