張悠慧,現任清華大學高性能計算研究所研究員。
基本介紹
- 中文名:張悠慧
- 職業:教師
- 畢業院校:清華大學
- 學位/學歷:博士
- 專業方向:高性能處理器微體系結構、類腦計算與神經形態晶片等
- 任職院校:清華大學高性能計算研究所
個人經歷,主講課程,研究方向,學術成果,榮譽獎項,
個人經歷
工學學士 (計算機科學與技術), 清華大學, 中國, 1998;
工學博士 (計算機體系結構), 清華大學, 中國, 2002.
高性能計算技術研究所副所長(2012~);
中國計算機學會: 普及工作委員會委員(2014~);
《計算機研究與發展》編委(2014~);
下列會議的程式委員會成員或Session Chair:PAAP2011、ASC 2012、ASC 2013、全國高歡奔漏性能計算學術年會(HPC China 2013)、HPC China 2014等墊烏轎邀.
主講課程
彙編語言程式設計(本科生課程,國家級精品課、國家級精品資源共享課、校精品課);
計算機組成與系統結構(本科生,教育部-英特爾精品課程支持);存儲技術基礎 (本科生)。
教學概況
目前我是二門本科課程的主講教師,年學時為80。這些課程都是面向本科生的計算機體系結構方面的專業課程,我的教學晚嫌組理念是幫助學生建立一個計算機底層框架和語言的系統性概念。
在“彙編語言程式設計”中,強化彙編語言 “承上啟下”的特點,幫助學生和遷院形成計算機系統的整體思維,該課程已經獲得教育部的國家級精品資源共享課建設的立項支持。
在“計算機組成與系統結構”中(面向交叉信息學院開課),採用了以程式設計師的角度來進行計算機體系結構等的講解的方式,獲得了教育部-英特爾精品課程項目支持。
研究方向
高性能處理器微體系結構、類腦計算與神經形態晶片、類腦計算系統軟體。
1、GF科技創新特汽戒拳疊區項目(公開)、天機仿腦、2017/08-2019/07、主持;
2、國家自然科學基金重點項目、通用類腦計算架構模型與方法研究、2019/01-2023/12、參與;
3、重點研發計畫課題、新型加速部件技術研究、2016/06-2018/05、參與;
4、北京市科技計畫課題、面向認知計算平台的高效並行加速技術研究、2016/01-2017/12、200萬元、主持;
5、預研課題,XXX體系結構技術研究、2011/01-2015/12、主持;
6、863子課題、雲計算測試與評估系統研製、2013/01-2015/12、子課題主持;
7、863子課題、高端容錯計算機總體技術研究、2007/12-2010/12、子課題主持;
8、國家自然科學基金面上項目、支持對象數據與動態功能擴展的存儲片上多處理器體系結構研究、2008/01-2010/12、主持;
9、973課題、多計算系統資源虛擬化方法研究、2007/7- 2011/6、技術骨幹;
10、863課題、基於虛擬服務網路的可遷移個人計算模式研究與示範套用、2006/12-2008/12、主持;
11、國家自然科學基金青年基金、基於輕量級通信的集群快取機制、2003/1-2003/12、已結題、主持;
12、863課題、集群伺服器功能軟體、2002/7-2004/12、主持;
13、863課題、32位高性能嵌入式CPU研發、2002/7-2004/1、技術骨幹。
2014年以來,主要研究領域包括類腦計算體系結構/晶片/系統軟體等。類腦計算架構是後摩爾時代體系結構重大發展方向之一,其中辣迎類腦晶片及系統軟體具有基礎性作用。各國對相關研究提出了不同技術實現路徑,總體來看,軟硬體過於緊耦合是共同的核心技術瓶頸之一,會顯著增加套用開發難度,犧牲可移植性。圍繞世界上首款異構融合類腦計算晶片,研發了第一個軟硬體去耦合的類腦計算系統軟體,解決了此類問題;在“軟硬體去耦合”設計思想上更進一步的提出了“精簡指令集”類腦晶片結構,使得硬體層所需的運算功能大為簡 化,運算單元密度與互連性能極大提高,同時通過編譯/轉換軟體支持多種類型的套用層神經網路,網路推斷性能較同類晶片設計可提升三個數量級,為下一代類腦晶片探索了極具潛力的技術路線。具體研究包括脈衝神經網路/深度神經網路融合的軟體工具鏈、神經網路編譯器、相應的基於阻變存儲器的類腦晶片精簡體系結構和塊稀疏重排剪枝算法,成果分別發表在領域頂會MICRO2016、ASPLOS2018/2019與NIPS2018上,部分已開始產業化。與相關腿敬境方案相比,研究貫穿類腦計算多個層次,體現了系統整體性思維與軟硬體協同設計思想,有利於確保類腦研究上的領先地位。
之前的研究還包括高性能計算、微體系結構設計、虛擬化技術等方面。主持研究了面向科學計算的集成軟體環境核心技術,並作為軟體開發聯盟Gelato的初創成員(其成員包括Intel、HP)發布了若干個集群計算核心軟體系統(包括並行容錯計算環境、集群伺服器並行開發環境等,2004年),具備國際領先水平;作為清華微處理器-THUMP107的體系結構主要設計者,設計了該處理器的微體系結構,主頻可達500MHz(TSMC 180nm工藝,2003年);在國際上較早提出運行環境與存儲位置相分離的分散式軟體架構與雲端融合使用模式,基於套用層虛擬化技術,將現有軟體轉化為網路服務(2008年);開展了面向套用的定製處理器設計,主要採用軟體模擬以及FPGA仿真的方式,選取了“全球氣候變化數值模擬”這一代表性關鍵套用為目標,實現了定製處理器核心的FPGA原型,顯著提升了套用的效能比(2013年)。
已在國內外重要會議及雜誌上發表論文80餘篇,獲得專利13項,是若干國際期刊(包括IEEE Transactions on Computers、The Journal of Supercomputing、IEEE Access等)的審稿人。
學術成果
1. Yu Ji, Youyang Zhang, Xinfeng Xie, Shuangchen Li, Peiqi Wang, Xing Hu, Youhui Zhang*, Wenguang Chen, Yuan Xie. FPSA: A Full System Stack Solution for Reconfigurable ReRAM-based NN Accelerator Architecture. ASPLOS 2019.
2. Yu Ji, Ling Liang, Lei Deng, Youyang Zhang, Youhui Zhang*, Yuan Xie. TETRIS: TilE-matching the Tremendous Irregular Sparsity. NIPS 2018.
3. Ji Yu, Zhang Youhui*, Chen Wenguang, Xie Yuan. Bridging the Gap between Neural Networks and Neuromorphic Hardware with A Neural Network Compiler. ASPLOS 2018.
4. Peng Qu, Jin Yan, You-Hui Zhang*, Guang R. Gao. Parallel Turing Machine, a Proposal. Journal of Computer Science and Technology. March 2017, Volume 32, Issue 2, pp 269–285.
5. Yu Ji, Youhui Zhang*, Shuangchen Li, Ping Chi, Cihang Jiang, Peng Gu, Yuan Xie, Wenguang Chen. NEUTRAMS: Neural Network Transformation and Co-design under Neuromorphic Hardware Constraints. MICRO 2016.
6. Yu Ji, You-Hui Zhang*, Wei-Min Zheng. Modelling Spiking Neural Network from the Architecture Evaluation Perspective. Journal of Computer Science and Technology, Volume 31, Issue 1, pp 50–59. 2016.
7. Yu Ji, Youhui Zhang*, Wenguang Chen. Optimized Mapping Spiking Neural Networks onto Network-on-Chip. ICA3PP 2016.
8. Luping Shi, Jing Pei, Ning Deng, Dong Wang, Lei Deng, Yu Wang, Youhui Zhang*, etc. Development of a Neuromorphic Computing System. IEDM 2015(Invited).
9. Zhang Youhui*, Qu Peng, Jiang Cihang, Zheng Weimin. A Cloud Gaming System Based on User-level Virtualization and Its Resource Scheduling. IEEE Tran. On Parallel and Distributed Systems, 2015. In Publish. DOI 10.1109/TPDS.2015.2433916.
10. Cihang Jiang, Youhui Zhang* and Weimin Zheng. Software-based Lightweight Multithreading to Overlap Memory-access Latencies of Commodity Processors. ICPP 2015.
11. Li Yanhua, Zhang Youhui*, Zheng Weimin. Position-Aware Thread-Level Speculative Parallelization for Large-Scale Chip-multiprocessor. ACM International Conference on Computing Frontiers (CF 2015).
12. Hongwei Wang, Siyu Lu, Youhui Zhang*, Guangwen Yang, Weimin Zheng. Customized Network-on-Chip for Message Reduction. ICA3PP 2014.
13. Fan Jie, Jiang Song, Shu Jiwu, Zhang Youhui*, Zhen Weimin. Aegis: Partitioning Data Block for Efficient Recovery of Stuck-at-Faults in Phase Change Memory. MICRO 2013.
14. 王為,張悠慧*,姚俊,李艷華,鄭緯民。基於線性陣列處理器的GRAPES核心代碼最佳化. 《計算機學報》2013年10月刊。(中國計算機大會2013最佳論文).
15. Zhang Youhui*, Qian Ziqiang, Zheng Weimin. Employing Intelligence in Object-based Storage Devices to Provide Attribute-based File Access. SCIENCE CHINA-INFORMATION SCIENCES, Vol.56, No.3. Mar 2013.
16. Zhang Youhui*, Yang Jianfeng, Zheng Weimin. Customizing a Processor-core for Stencil Computation. Proceedings of Workshop of HPCA 2013(4th Workshop on SoCs, Heterogeneous Architectures and Workloads). Feb. 2013.
17. Youhui Zhang*, Yanhua Li, Weimin Zheng. Automatic Software Deployment Using User-level Virtualization for Cloud-Computing. Future Generation Computer Systems (FGCS),Vol.29 N0.1. Jan 2013. 323-329.
18. 張悠慧*, 李艷華, 鄭緯民. Cloudow: 一種基於用戶層虛擬化的支持現有Windows套用的軟體即服務模式運行系統及其性能最佳化。《中國科學:信息科學》 2012年03期。(第二屆中國雲計算與SaaS大會最佳論文)
19. Youhui Zhang*, Gelin Su&, Weimin Zheng. A User-space File System for On-demand Legacy Desktop Software, SCIENCE CHINA-INFORMATION SCIENCES, Vol.54,No.6,2011. 1142-1150.
20. Youhui Zhang*, Gelin Su, Weimin Zheng. Converting Legacy Desktop Applications into On-Demand Personalized Software, IEEE Transactions on Services Computing, Vol.3, No.4, 2010.
21. Youhui Zhang*, Xiaoling Wang, and Liang Hong, Portable Desktop Applications Based on P2P Transportation and Virtualization. Proceedings of the 22nd Large Installation System Administration Conference (LISA '08), San Diego, CA, 2008, pp. 133–144.
22. Youhui Zhang*, Yu Gu, Hongyi Wang, and Dongsheng Wang. Virtual-Machine-based Intrusion Detection on File-aware Block Level Storage. Proc.18th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD'06), Ouro Preto, Brazil, pp. 185-192.
23. Youhui Zhang*, Dongsheng Wang. Research on object-storage-based intrusion detection. Proceedings of the 12th International Conference on Parallel and Distributed Systems (ICPADS'06). 2006.
榮譽獎項
高等教育國家級教學成果獎二等獎:面向計算機系統能力培養的課程體系改革 (2018);
國家科技進步二等獎: 高性能集群計算機與海量存儲系統 (2007);
教育部科技進步一等獎: 高性能計算機性能測試技術 (2009);
電子學會科學技術一等獎: 高性能計算機性能測試技術 (2009);
國家級精品課主講、國家級精品資源共享課 “彙編語言程式設計”負責人;
12、863課題、集群伺服器功能軟體、2002/7-2004/12、主持;
13、863課題、32位高性能嵌入式CPU研發、2002/7-2004/1、技術骨幹。
2014年以來,主要研究領域包括類腦計算體系結構/晶片/系統軟體等。類腦計算架構是後摩爾時代體系結構重大發展方向之一,其中類腦晶片及系統軟體具有基礎性作用。各國對相關研究提出了不同技術實現路徑,總體來看,軟硬體過於緊耦合是共同的核心技術瓶頸之一,會顯著增加套用開發難度,犧牲可移植性。圍繞世界上首款異構融合類腦計算晶片,研發了第一個軟硬體去耦合的類腦計算系統軟體,解決了此類問題;在“軟硬體去耦合”設計思想上更進一步的提出了“精簡指令集”類腦晶片結構,使得硬體層所需的運算功能大為簡 化,運算單元密度與互連性能極大提高,同時通過編譯/轉換軟體支持多種類型的套用層神經網路,網路推斷性能較同類晶片設計可提升三個數量級,為下一代類腦晶片探索了極具潛力的技術路線。具體研究包括脈衝神經網路/深度神經網路融合的軟體工具鏈、神經網路編譯器、相應的基於阻變存儲器的類腦晶片精簡體系結構和塊稀疏重排剪枝算法,成果分別發表在領域頂會MICRO2016、ASPLOS2018/2019與NIPS2018上,部分已開始產業化。與相關方案相比,研究貫穿類腦計算多個層次,體現了系統整體性思維與軟硬體協同設計思想,有利於確保類腦研究上的領先地位。
之前的研究還包括高性能計算、微體系結構設計、虛擬化技術等方面。主持研究了面向科學計算的集成軟體環境核心技術,並作為軟體開發聯盟Gelato的初創成員(其成員包括Intel、HP)發布了若干個集群計算核心軟體系統(包括並行容錯計算環境、集群伺服器並行開發環境等,2004年),具備國際領先水平;作為清華微處理器-THUMP107的體系結構主要設計者,設計了該處理器的微體系結構,主頻可達500MHz(TSMC 180nm工藝,2003年);在國際上較早提出運行環境與存儲位置相分離的分散式軟體架構與雲端融合使用模式,基於套用層虛擬化技術,將現有軟體轉化為網路服務(2008年);開展了面向套用的定製處理器設計,主要採用軟體模擬以及FPGA仿真的方式,選取了“全球氣候變化數值模擬”這一代表性關鍵套用為目標,實現了定製處理器核心的FPGA原型,顯著提升了套用的效能比(2013年)。
已在國內外重要會議及雜誌上發表論文80餘篇,獲得專利13項,是若干國際期刊(包括IEEE Transactions on Computers、The Journal of Supercomputing、IEEE Access等)的審稿人。
學術成果
1. Yu Ji, Youyang Zhang, Xinfeng Xie, Shuangchen Li, Peiqi Wang, Xing Hu, Youhui Zhang*, Wenguang Chen, Yuan Xie. FPSA: A Full System Stack Solution for Reconfigurable ReRAM-based NN Accelerator Architecture. ASPLOS 2019.
2. Yu Ji, Ling Liang, Lei Deng, Youyang Zhang, Youhui Zhang*, Yuan Xie. TETRIS: TilE-matching the Tremendous Irregular Sparsity. NIPS 2018.
3. Ji Yu, Zhang Youhui*, Chen Wenguang, Xie Yuan. Bridging the Gap between Neural Networks and Neuromorphic Hardware with A Neural Network Compiler. ASPLOS 2018.
4. Peng Qu, Jin Yan, You-Hui Zhang*, Guang R. Gao. Parallel Turing Machine, a Proposal. Journal of Computer Science and Technology. March 2017, Volume 32, Issue 2, pp 269–285.
5. Yu Ji, Youhui Zhang*, Shuangchen Li, Ping Chi, Cihang Jiang, Peng Gu, Yuan Xie, Wenguang Chen. NEUTRAMS: Neural Network Transformation and Co-design under Neuromorphic Hardware Constraints. MICRO 2016.
6. Yu Ji, You-Hui Zhang*, Wei-Min Zheng. Modelling Spiking Neural Network from the Architecture Evaluation Perspective. Journal of Computer Science and Technology, Volume 31, Issue 1, pp 50–59. 2016.
7. Yu Ji, Youhui Zhang*, Wenguang Chen. Optimized Mapping Spiking Neural Networks onto Network-on-Chip. ICA3PP 2016.
8. Luping Shi, Jing Pei, Ning Deng, Dong Wang, Lei Deng, Yu Wang, Youhui Zhang*, etc. Development of a Neuromorphic Computing System. IEDM 2015(Invited).
9. Zhang Youhui*, Qu Peng, Jiang Cihang, Zheng Weimin. A Cloud Gaming System Based on User-level Virtualization and Its Resource Scheduling. IEEE Tran. On Parallel and Distributed Systems, 2015. In Publish. DOI 10.1109/TPDS.2015.2433916.
10. Cihang Jiang, Youhui Zhang* and Weimin Zheng. Software-based Lightweight Multithreading to Overlap Memory-access Latencies of Commodity Processors. ICPP 2015.
11. Li Yanhua, Zhang Youhui*, Zheng Weimin. Position-Aware Thread-Level Speculative Parallelization for Large-Scale Chip-multiprocessor. ACM International Conference on Computing Frontiers (CF 2015).
12. Hongwei Wang, Siyu Lu, Youhui Zhang*, Guangwen Yang, Weimin Zheng. Customized Network-on-Chip for Message Reduction. ICA3PP 2014.
13. Fan Jie, Jiang Song, Shu Jiwu, Zhang Youhui*, Zhen Weimin. Aegis: Partitioning Data Block for Efficient Recovery of Stuck-at-Faults in Phase Change Memory. MICRO 2013.
14. 王為,張悠慧*,姚俊,李艷華,鄭緯民。基於線性陣列處理器的GRAPES核心代碼最佳化. 《計算機學報》2013年10月刊。(中國計算機大會2013最佳論文).
15. Zhang Youhui*, Qian Ziqiang, Zheng Weimin. Employing Intelligence in Object-based Storage Devices to Provide Attribute-based File Access. SCIENCE CHINA-INFORMATION SCIENCES, Vol.56, No.3. Mar 2013.
16. Zhang Youhui*, Yang Jianfeng, Zheng Weimin. Customizing a Processor-core for Stencil Computation. Proceedings of Workshop of HPCA 2013(4th Workshop on SoCs, Heterogeneous Architectures and Workloads). Feb. 2013.
17. Youhui Zhang*, Yanhua Li, Weimin Zheng. Automatic Software Deployment Using User-level Virtualization for Cloud-Computing. Future Generation Computer Systems (FGCS),Vol.29 N0.1. Jan 2013. 323-329.
18. 張悠慧*, 李艷華, 鄭緯民. Cloudow: 一種基於用戶層虛擬化的支持現有Windows套用的軟體即服務模式運行系統及其性能最佳化。《中國科學:信息科學》 2012年03期。(第二屆中國雲計算與SaaS大會最佳論文)
19. Youhui Zhang*, Gelin Su&, Weimin Zheng. A User-space File System for On-demand Legacy Desktop Software, SCIENCE CHINA-INFORMATION SCIENCES, Vol.54,No.6,2011. 1142-1150.
20. Youhui Zhang*, Gelin Su, Weimin Zheng. Converting Legacy Desktop Applications into On-Demand Personalized Software, IEEE Transactions on Services Computing, Vol.3, No.4, 2010.
21. Youhui Zhang*, Xiaoling Wang, and Liang Hong, Portable Desktop Applications Based on P2P Transportation and Virtualization. Proceedings of the 22nd Large Installation System Administration Conference (LISA '08), San Diego, CA, 2008, pp. 133–144.
22. Youhui Zhang*, Yu Gu, Hongyi Wang, and Dongsheng Wang. Virtual-Machine-based Intrusion Detection on File-aware Block Level Storage. Proc.18th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD'06), Ouro Preto, Brazil, pp. 185-192.
23. Youhui Zhang*, Dongsheng Wang. Research on object-storage-based intrusion detection. Proceedings of the 12th International Conference on Parallel and Distributed Systems (ICPADS'06). 2006.
榮譽獎項
高等教育國家級教學成果獎二等獎:面向計算機系統能力培養的課程體系改革 (2018);
國家科技進步二等獎: 高性能集群計算機與海量存儲系統 (2007);
教育部科技進步一等獎: 高性能計算機性能測試技術 (2009);
電子學會科學技術一等獎: 高性能計算機性能測試技術 (2009);
國家級精品課主講、國家級精品資源共享課 “彙編語言程式設計”負責人;