控制邏輯分區、負載平衡、時鐘門控粒度、調度、每時鐘周期發出指令條數等方面的改進以及其它諸多增強之處讓 Maxwell SM (亦稱“SMM”) 能夠在效率上遠超 Kepler SMX。全新的 Maxwell SM 架構讓我們能夠在 GM107中將 SM 的數量增加至五個(相比之下 GK107 中只有兩個),而晶片面積卻僅增加 25%。
負載平衡
Maxwell 效率上的提升主要歸功於全新的 Maxwell SM 架構,即 SMM 。這種全新的 SM 架構可大幅提升節能性,而且在著色器有限的工作場合中可令每個 CUDA 核心的性能提升 35%。實現這些進步需要對架構進行大量重大更改。NVIDIA 重新編寫了 SM 調度器架構和算法,使其更加智慧型,避免了不必要的停頓,同時進一步降低了調度每條指令所需的能耗。
NVIDIA 在 Maxwell 更改了 SM 的組織方式。每個 SM 分為四個獨立的處理塊,每個處理塊具備自己的指令緩衝區、調度器以及 32 個 CUDA 核心。Kepler 的方法是劃分為非2冪 (non-power-of-two) 數量的 CUDA 核心,其中一些是共享核心,這種方法現已棄用。新的劃分方法簡化了設計與調度邏輯、節省了面積與功耗、降低了計算延遲。
成對的處理塊共享四個紋理過濾單元和一個紋理高速快取。計算一級高速快取的功能也與紋理高速快取相結合,而共享顯存是一個獨立的單元(類似首款 CUDA GPU—— G80 中所使用的方法),被全部四個塊共享。