DM21

DM21

DM21,即DeepMind 21,DeepMind開發的人工智慧,能夠通過預測分子電子的分布來了解分子的特徵。它可以比現有技術更準確地計算一些分子的性質。2021年發表於《科學》。

基本介紹

  • 外文名:DM21 
  • 別名:DeepMind 21 
  • 開發商DeepMind 
  • 用途:計算一些分子的性質 
功能背景,內容,意義,

功能背景

電子控制著金屬中的電流流動,也是把分子粘在一起的“膠水”。理解分子中的電子如何運動,電子之間如何相互作用因而至關重要。
量子力學中,薛丁格方程確定電子波函式的演化,告訴我們在空間特定位置找到一個電子的機率。原則上,有了量子力學,我們就可以確定電子和原子核如何相互作用形成化學鍵,讓原本孤立的原子結合起來,形成各種分子和材料。
但要描述分子中大量電子的量子力學行為實際上非常具有挑戰性。如果從第一原理出發,追蹤分子中每一個電子的行為,只會帶來一場計算噩夢。所有帶負電荷的電子相互排斥,它們又和帶正電荷的原子核有著致命的吸引。
一種名為密度泛函理論(Density Functional Theory,DFT)的技術提供了強大的工具。1964年,Walter Kohn 和 Pierre Hohenberg 證明,只要知道電子在整個分子中的總體分布,即平均電荷密度,就足以精確計算所有相互作用。更準確地說,只要知道系統的基態電子密度 ρ,就可以確定一個泛函 E[ρ],給出對應的基態能量。這裡的泛函實際上就是“函式的函式”,由於能量是電子密度的函式,而電子密度又是空間坐標的函式,所以稱為泛函。Kohn 因為這項工作獲得了1998年諾貝爾化學獎。
DFT將包含電子-電子相互作用的多體問題簡化為一個沒有相互作用的電子在有效勢場中運動的單體問題,電子間的相互作用只是作為一個誤差項出現在這個有效勢場中,比從基本量子理論開始的計算高效得多。
科學家們提出了許多近似方法來逼近精確的泛函,儘管存在一定程度的近似,DFT仍然成為所有科學領域中套用最廣泛的技術之一。但這些近似方法都存在系統性誤差,不能捕捉到泛函的一些關鍵性質,甚至無法準確模擬像氫分子這樣簡單的物質。因此,長期困擾科學家的問題是:如何確定密度泛函的精確形式,也就是電子密度和相互作用能之間的映射?
人們很早就發現,如果近似方法滿足精確泛函的更多約束條件、擬合更多系統,近似的準確度就會提高。傳統泛函存在的許多系統性誤差,根源在於忽略了兩類分數電子約束:具有非整數總電荷的分數電荷(FC, Fractional Charge)系統,和具有非整數自旋的分數自旋(FS, Fractional Spin)系統。
雖然分數電子系統是虛構的,但真實的電荷密度可能產生具有類似特徵的情況。例如,我們通常認為電子是在特定的軌道上運動,即任意時刻下一個電子處於且僅處於一個軌道;化學反應意味著軌道重組,電子在這些軌道上重新排布——那么問題來了,實際的反應過程當然是連續發生的,電子從一個軌道遷移至另一軌道的過程如何定量描述?於是,承認假想的電子連續變化,成為正確模擬這些情形的必要條件,有助於確保泛函適用於各種物質和材料。而如果忽略分數電子約束,則會導致兩個基本問題:
(1)離域誤差。在DFT計算中,泛函通過尋找讓系統能量最低的電子構型,來決定分子的電荷密度。因此,泛函的誤差會導致計算出的電子密度存在誤差。大多數現有的密度泛函近似方法傾向於讓電子密度分散在幾個原子或分子上,以至於模擬電子實際較為定域的系統存在較大誤差。
(2)自旋對稱性破缺。現有泛函在描述化學鍵斷裂時,傾向於自旋對稱性破缺的電子構型。由於對稱性在物理和化學過程中發揮著至關重要的作用,這種並非實際存在的對稱性破缺表明,傳統的泛函存在關鍵缺陷。
誠然,計算化學家們很早就意識到了分數電子問題對於模擬反應過程以及特殊化學體系的必要性,也嘗試了各種方式“連線”相鄰的整數狀態,但能夠接近實際的卻少之又少。深度學習框架非常適合解決這類問題,只要將約束表示為數據,用大量精確的數據訓練神經網路,就可以用訓練好的神經網路計算系統的各種性質。
DM21
利用神經網路學習泛函,建立電子密度和基態能量之間的映射

內容

DeepMind團隊開發了這樣一個深度學習框架DM21,結合分子數據和兩類分數電子約束來訓練神經網路,逼近精確的泛函。
研究人員利用了來自2235個化學反應的數據集,其中1074個反應是以往未考慮分數電荷和分數自旋約束時難以準確模擬的難例。新的泛函彌補了傳統泛函的重要缺陷,在廣泛的大規模基準測試中顯示出高度的準確性。用於訓練的特徵包括但不限於空間各處的電子密度、密度梯度以及動能密度等精確數據。
DM21
DM21克服了傳統泛函的局限性
DM21 能夠更好地模擬複雜系統,表明深度學習方法可以捕捉到泛函的一些確切性質。研究人員將它套用於三類不同系統。對於帶電荷的DNA鹼基對,傳統泛函預測電荷分散在兩個分子上,但 DM21 正確地預測電荷主要定域在一個分子上。
DM21
B3LYP與DM21
圖:DFT預測電子密度在帶電荷的DNA鹼基對之間的分布,左邊是胸腺嘧啶T,右邊是腺嘌呤A。(左)傳統的泛函(B3LYP)預測電荷分散在兩個相鄰的分子上。(右)神經網路學習的泛函 DM21 正確地將電荷定域在右邊的分子上。
對於由24個氫原子高度壓縮而成的氫原子鏈,傳統的無約束泛函預測出現自旋對稱性破缺,導致氫原子鏈中出現明顯的磁化,DM21 的預測則不會出現這種自旋極化。
DM21
DM21
24個氫原子組成的氫原子鏈。(上)傳統的PBE泛函預測出現自旋對稱性破缺,導致氫原子鏈出現自旋極化。(下)DM21 預測中不會出現這種問題。
此外,由於忽略分數自旋約束,傳統泛函會高估雙環丁烷開環反應中的勢壘,DM21 的預測更接近真實情況。

意義

這項工作成功地證明,深度學習可以為改進泛函提供一個框架,幫助我們更好地理解電子間的相互作用,探索物質的內部結構。由於這種方法依賴於數據和約束條件,在領域數據持續積累的當下自然能夠不斷改進,因而代表了一條通向實際泛函的可行路徑。
更長遠看來,無論是建造穩固的橋樑,還是將火箭發射到太空,在現代工程中,計算機模擬發揮著核心作用。為了探索材料、藥物和催化領域中湧現出的新問題,如今的技術更加深入量子尺度。這項工作表明,深度學習對於在量子尺度準確模擬物質具有廣闊前景。

相關詞條

熱門詞條

聯絡我們