人物經歷
教育背景
University of Delaware, DE, USA M.S. (4.0/4.0 for major) Phd Candidate 08/2007-12/2009
課題:基於多核處理器(Multi-core, GPU)的高性能計算 Computer & Information Sciences department
高性能太陽能系統設計 Electrical & Computer Engineering department
中國科學院高能物理研究所,北京,中國 M.S.(90/100) 09/2004-06/2007
課題:用OTR(Optical Transition Radiation)改善BFEL(Beijing Free Electron Laser)發射度測量,並為OTR設計高性能CCD相機獲取高清晰採樣
青島大學理學院電子信息科學與技術系,青島,中國 B.S.(93/100) 09/2000-06/2004
課題:超短電子束長的前期研究(2005年山東省優秀學士學位論文)
工作經歷
◆ 南京大學天文與空間科學學院,南京,中國 06/2014-present
1. 負責學院高性能計算實驗室機房
2. 與NVIDIA公司一起合作建立CUDA Teaching Center,負責"並行程式設計"課程
◆ 英偉達 (NVIDIA Corp), Santa Clara, CA, USA 04/2010-1/2014
1. 負責研發分子動力學常用軟體在NVIDIA Tesla系列GPU上的套用及利用CUDA(Compute Unified Device Architecture)進行性能改善。
2. 負責研發和分析基於CUDA的線性函式標準運算庫性能,主要標準庫有:CUBLAS, CUFFT,CURAND, CUSPARSE
3.負責CUDA以及GPU體系結構的培訓,教學,美國高校推廣以及發表新技術文章。
◆ 北極地區高性能計算中心國家實驗室-ARSC(Arctic Region Supercomputing Center), USA 6/2009~08/2009
1.基於NVIDIA GPU(Geforce 9800gx2)分析及改寫線性函式Sgemm,Dgemm以及Cgemm用新發布的分別OpenCL和CUDA實現的性能。
2.完成美國防部DOD(Department of Defense)資助的基於NVIDIA GPU報的高性能計算項目,並用來加速北極地區天氣預Paraview和IDV圖形化計算結果。
◆ 北極地區高性能計算中心國家實驗室-ARSC(Arctic Region Supercomputing Center), USA 06/2008~08/2008
1.基於NVIDIA GPU和IBM cell並行處理器進行北極地區煙霧檢測的大規模數據並行處理。
2.研究GPU體系結構以及CUDA並行運算架構,最佳化NVIDIA標準運算庫Lever 3 BLAS結果高於,最佳化結高於HP公司當時的參考值50-80Gflops
◆ DESY(Deutsches Elektronen-Synchrotron),漢堡,德國 12/2006~01/2007
模擬自由電子雷射電子束在3-D腔的分布以及2-D線性圖像處理
◆ SUN Microsystems China,北京,中國 01/2006~02/2006
SUN微系統系統管理員一級,二級(Solaris operating environment.8 SA288)認證
◆ Nortel Corporation, Beijing, China 06/2004~08/2004
參與設計Nortel UMTS網路協定以及接口參數:Iu, RANAP, MTP3B, etc
承擔課程
研究生:《並行程式設計導論》全校本科創新創業課程:《GPU與人工智慧》
研究課題
◆ 基於多核處理器的並行計算和最佳化 08/2007~12/2010
1.基於CUDA並行最佳化Bzip2數據壓縮算法中的BWT算法,實現GPU了上成功運行,運算速度提高8-16倍,相對與Pthread版的並行Bzip2算法,CUDA版的並行算法的運算速度至少提高了8倍
2.通過JNI和CUDA將JAVA源程式在GPU上運行,大改善可Java Grande基準測試的性能
3.基於CUDA通過並行最佳化記憶體檢測軟體Valgrind檢測時間長的問題中最適合最佳化並且時間消耗最長的函式解決記憶體
4.基於CUDA成功並行最佳化SVM-RFE算法以及Monte Carlo算法在金融分析的套用,對比於OpenMP版的算法,性能提高了至少5倍
5.用CUDA加速物理學中大規模粒子碰撞的模擬實驗並用OpenGL進行圖形可視化
◆ 利用Compressive Sensing(壓縮感知)理論進行圖像分析處理 08/2007~09/2009
1.搭建光學實驗平台,利用對數字微鏡器件(Digital Micro-mirror Device)進行硬體編程,與Rice University 合作,將超光譜圖像(4-D數組)映射到壓縮感知圖像進行分析,並完成256x256的信重號新處恢理復的以速及度光以譜及減儀數少據了分有析用,信這息項資技源術的使浪測費。量次數大少於圖像的實際像素數,可以大像的素提圖高像
2.設計商用太陽能角度調整軟體,能夠最大效率的追蹤太陽的位置,並通過C語言以及Matlab計算,得到最佳器件放置位置並參與設計太陽能接收板以及冷卻系統,將傳統的進行2-D追蹤系統簡化為光電池1-D系統,大的提高了系統的傳輸效率,節約了大量的能量。
3.在光電子&電磁場實驗室接受系統的超淨間培訓,熟練掌握E-Beam, Contact Lithography, Dry(ICP), Wet(Dielectric Etching, Metal), Thin Film(PECVD of poly-silicon, Sputterer), Metal(E-Beam Evaporator, Sputterer), Polysilicon, Optical Spectrum Analyzer(OSA)的操作。
◆ 基於中科院高能所的自由電子雷射實驗室(BFEL)的束流測量以及圖像分析 08/2005~07/2007
用光學渡越輻射(Optical Transition Radiation)改善新BFEL的發射度測量,並設計高性能CCD機獲取高清晰採樣。
學術文章
◆Ying Yu, Kehu Yang, Jianping Dai, "CCD Camera System designing for the OTR Beam Measurement”, Vol. 32, No. 1, Jan., 2008, High Energy and Nuclear Physics
◆Ying Yu, Jianping Dai, “FEL Energy Calculation of BFEL Facility”, Vol. 19, No.5, 2007, Intense Laser and Particle Beam
◆Yi Zou, Jian Zhuang, Xueping Yang, Ying Yu, Jianping Dai, “Application of PLC in EPICS control system for BFEL”, Vol.30,No.3, March 2007, High Power Laser And Particle Beams
In preparation:
◆Ying Yu, John Cavazos, “ Implementation of BWT algorithm for data compression on GPU”
◆Ying Yu, “Using the Kohonen Arithmetic for the Fingerprint Identification”