CPU/GPU協同並行計算在第一性原理電子輸運模擬中的套用

項目摘要

與非平衡格林函式結合，密度泛函理論已被成功套用於納米電子器件輸運行為的研究。然而，我們發現，器件的輸運計算比普通的密度泛函計算速度要慢很多。儘管可以採取多核並行計算，但輸運計算比普通密度泛函計算慢很多的問題依然如故，而且隨著體系的增大，問題尤為突出，有時甚至慢到令人無法接受。這直接制約了很多物理體系和物理問題的研究。為了突破這個瓶頸，採用一種新的並行方式與並行機制來加快輸運計算過程變得至關重要。GPU計算是最近發展起來的一種全新的並行模式，具有強大的並行計算能力。本項目探討將基於CUDA技術的GPU並行編程套用於納米器件的輸運計算，將影響輸運計算速度最大但非常適合在GPU上實現加速的密度矩陣計算部分、實空間求解Poisson方程部分和透射函式以及電流的計算部分移到GPU上進行，而其它部分依然在CPU上計算，以加快器件模擬的運算速度，大大縮短計算模擬的時間。

結題摘要

本項目的目標是將GPU加速技術套用到第一性原理的電子輸運計算，從而解決自洽疊代過程中的速度瓶頸問題。通過四年的研究，本項目很好的完成了預定的任務，在以下兩個方面取得了重要成果：一、程式發展：（1）編寫了自能計算、非平衡格林函式計算GPU程式，編寫CULA和CUBLAS的fortran調用程式接口；（2）發展了分塊矩陣計算算法，實現超大矩陣的矩陣相乘與矩陣求逆的GPU計算；（3）實現多GPU的k點並行和能量並行；（4）實現了矩陣相乘和求逆的多GPU並行計算。我們的測試表明，對於中等規模的體系，單個Tesla k20m卡可以實現20倍的加速；對於k點和能量E的並行，由於節點間的通訊少，因此加速比隨GPU的數目近似成線性關係；在天河系列計算機上採用24塊k40m GPU卡，與單一CPU核相比，獲得了接近700倍的加速效果。二、程式的套用：（1）針對石墨烯納米帶以及BN納米帶的電子結構和輸運性質的調控，我們開展了大量的工作；（2）設計了C60-B80分子橋器件，發現C60 dimer和B80 dimer都是不良導體，然而C60-B80則具有很好的導電性，此外預測了Cu電極表面重構對C60分子輸運性質的影響；（3）利用有機分子設計了具有特定功能的電子器件；（4）開展了單分子磁體輸運性質的研究，預測了電場誘導的自旋轉變現象，設計了基於單分子磁體的存儲器件。發表論文22篇，其中SCI收錄21篇，影響因子大於3.0的12篇。

CPU/GPU協同並行計算在第一性原理電子輸運模擬中的套用

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條