深度學習算法可重構加速器關鍵技術研究

深度學習算法可重構加速器關鍵技術研究

《深度學習算法可重構加速器關鍵技術研究》是依託中國人民解放軍國防科技大學,由姜晶菲擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:深度學習算法可重構加速器關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:姜晶菲
  • 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,

中文摘要

深度學習算法已成為機器學習領域最新最重要的一類人工智慧算法,套用範圍和數據規模日益增大。由於涉及多次疊代和大規模矩陣運算,該類算法處理成為典型戲嬸的計算密集型過程,其加速技術漸成為近年的研究熱點。FPGA是實現高性能深度學習算法的有效平台,而目前的研究僅限於對深度信任網路這一種特定算法的定製實現,不能滿足該類算法集合中各種改進和變形流程的加速需求,適用性差,算法精度影響分析不足。本項目將針對主流深度學習算法集合,研究辨連笑算法流程共性和特異性,歸納統一的算法模板,建立定點化精度影響分析模型;面向FPGA特徵,提出可重構的深度學習算法異構加速器體系結構,重點研究一套有效的硬體實現和加速最佳化方法;研究加速器參數化設計方法和自動生成技術,實現一個面向深度學習算法典型套用的可重構FPGA加速器原型系統和一個加速器自動生成軟體系統,滿足算法精度要求,全面提高這類算法加速套用的性能和靈活性,套用前景廣闊。

結題摘要

深度學習算法已成為機器學習領域最新最重要的一類人工智慧算法,套用範圍和數據規模日益巴危灑增大。由於涉及多次迭陵坑她代和大規模矩陣運算,該贈再霉類算法處理成為典型的計算密集型過程,其加速技術漸成為近年的研究熱點。FPGA等低功耗平台正在成為定製化實現深度學習加速引擎的有效平台之一。 利用大規模並行的浮點部件實現深度學習網路模型代價很大,定點運算更適合定製實現大規模並行專用電路,但定點化所帶來的精度影響需要深入研究。項目針對多種典型深度學習網路模型提出了深度學習網路定點化評估模型和評測方法,承灶盼敬分析了多種深度學習網路定點化表示、歸應再狼運算策略、近似化方法對算法精度影響,給出適應硬體並行的定點化實現結論。 以定點化精度分析為研究支撐,項目提出了針對典型深度卷積網路的FPGA多級並行加速處理結構,開發了CNN網路卷積層和全連線層的多種粒度並行性,在FPGA平台上的實現結果表明,加速器可獲得相較於主流通用CPU 10倍以上的性能加速比和相較於主流GPU 10倍的性能功耗比;針對低功耗小型化套用,項目提出了能夠處理深度學習算法矩陣運算要素的超向量協處理器結構,DBN和Sparse coding網路在此結構上的實現結果表明,該結構在保證可程式靈活性的同時,可達到相較於主流CPU約9倍的性能功耗比。 為提高加速器的適用性,提出了基於高級硬體描述語言的深度學習網路加速器自動生成器,生成器能根據一定設計約束搜尋具有最優執行時間、資源代價和性能等指標的生成電路,典型深度卷積網路模型LeNet、AlexNet、VGG等的生成及測試結果表明,生成器可自動實現高性能的硬體電路,同時大大縮短了設計時間。 項目成果所提供的算法加速器可作為實際智慧型系統的加速引擎直接使用,適合套用於小型化一體化的智慧型裝備,也可用於構建更高效能的大規模機器學習處理平台。

相關詞條

熱門詞條

聯絡我們