綜述
製造工藝
| 55 nm
|
核心頻率
| 633 MHz
|
流處理器頻率
| 1404 MHz
|
顯存頻率
| 1134 MHz / 2268 MHz
|
顯存容量
| 896 MB
|
顯存接口
| 448-bit
|
顯存頻寬
| 127 GB/s
|
流處理器數目
| 240
|
光柵單元
| 28
|
紋理單元
| 80
|
紋理渲染頻寬
| 50.6 GigaTexels/sec
|
接口
| 2 x Dual-Link DVI-I
|
插槽
| Dual Slot
|
電源接口
| 2 x 6-pin
|
TDP功耗
| 219 watts
|
GPU溫度極限
| 105° C
|
參數解說
關於GTX275的具體規格,從架構來看,GTX260擁有216個流處理器,即9組TPC(Texture Processing Cluster),而GTX275則擁有與GTX285一樣同為240個SP,顯然為了保證GTX275在性能上的較大優勢。當然,除了保證原有240流處理器數來提升性能外,提高 顯示卡運行頻率也是行之有效的方法。我們可看做GTX275是GTX260的高頻版本,GTX275的
核心頻率達到633MHz,
顯存頻率1134MHz(即2268MHz),總體性能上會比GTX260有大幅度升幅。但值得一提的是,NVIDIA將不會推出公版的GTX275顯示卡,而是會把設計的許可權交給各AIC廠商,屆時各廠商將會自行設計合適的方案來打造這款GTX275。並且,公版的GeForce GTX275將繼續延用GTX260的P897 PCB設計方案,製作成本比較低,有利於市場競爭。因此GTX275繼續採用了這一設計方案,畢竟在
顯存位寬上與GTX260一樣,基本上不需要改動什麼就可以直接使用原來的PCB了。
市售高端產品規格對比及發現
| GTX 275
| GTX 285
| GTX 260+
| HD 4890
|
電晶體數量
| 14億
| 14億
| 14億
| 9.56億
|
核心代號
| G200
| G200-350
| G200-103
| RV790
|
核心工藝
| 55nm
| 55nm
| 55nm
| 55nm
|
圖形核心架構
|
|
|
|
|
連線界面
| PCI-E 2.0
| PCI-E 2.0
| PCI-E 2.0
| PCI-E 2.0
|
DirectX 版本
| DirectX 10
| DirectX 10
| DirectX 10
| DirectX 10.1
|
核心頻率
| 633MHz
| 648MHz
| 575MHz
| 850MHz
|
Shader單元數量
| 240個
| 240個
| 216個
| 800個
|
Shader頻率
| 1404MHz
| 1476MHz
| 1242MHz
| 850MHz
|
紋理單元
| 80個
| 80個
| 72個
| 40個
|
顯存類型
| GDDR3
| GDDR3
| GDDR3
| GDDR5
|
顯存頻率
| 2268MHz
| 2484MHz
| 2000MHz
| 3900MHz
|
顯存容量
| 896MB
| 1024MB
| 896MB
| 1024MB
|
顯存位寬
| 448bit
| 512bit
| 448bit
| 256bit
|
顯存頻寬
| 127GB/s
| 158.9GB/s
| 112GB/s
| 124.8GB/s
|
高清視頻加速
|
|
|
|
|
技術名稱
| Purevideo HD
| Purevideo HD
| Purevideo HD
| AVIVO HD
|
H.264解碼支持
| 是
| 是
| 是
| 是
|
VC-1解碼支持
| 部分
| 部分
| 部分
| 是
|
集成數字音效卡
| 否
| 否
| 否
| 7.1聲道
|
在GTX275顯示卡上下毗鄰的兩款產品上,GTX275似乎更像是將兩者結合起來的產物,它擁有GTX285的240個流處理器數量,同時也擁有了GTX260+的448bit顯存位寬,這樣做即區分開了三者之間的性能差距,保證不會出現超頻後達到某款產品的性能,同時也更加合理的控制了顯示卡的整體成本。當然,NVIDIA自然也為GTX275顯示卡使用了55nm工藝,這一點與GTX285、GTX260+相同。
完整240個流處理器 核心架構回顧
因為NVIDIA目前的產品線橫跨兩代架構,所以我們有必要回顧一下GTX200系列產品的核心架構,也就是G200圖形核心的架構。從DirectX10發布
統一架構以來,NVIDIA一共推出過三代產品。最早的當屬G80,也就是第一代
統一架構核心,隨後的G92主要是工藝上的改變,在架構上基本延續了G80的設計。而G200圖形核心才是DirectX10後NVIDIA推出的第二代
統一架構的新核心。
讀者可能都有印象,在DX10發布時提出了一個全新概念,將Pixel Shader與Vertex Shader單元統一起來不再做區分,也就是說一個Shader單元既能夠處理Pixel運算也能夠處理Vertex運算,此外,在
統一架構當中還加入了Geometry Shader單元這個概念,同樣規Shader統一分配。在G200的第二代
統一架構當中依然遵循著這樣的原則,只是NVIDIA再次強化了這個架構。
GTX275保留了GTX285上擁有的240個
流處理器和40個紋理單元,這240個
流處理器以及40個紋理單元被平均得分為了10個陣列,每個陣列當中包含24個流處理器(被劃分為3組)以及8個紋理單元,共享L1快取。NVIDIA在大幅度增強
浮點運算能力的同時,也不忘繼續對紋理填充率的增加,相比較GTX285和GTX280,因為前者頻率更高,所以紋理填充率的數字也更高,達到了518億次/秒,而GTX280的數字為482億次/秒。
GTX275的設計模式可以進行整數運算以及
浮點運算,存儲操作,和邏輯算符,每一個
流處理器都是一個多執行緒硬體處理器,這樣的處理器將內建級流水線,每一條執行緒可以執行一條指令。GTX275的渲染流程包括頂點shaders、像素shaders、幾何shaders以及compute shaders,對於
顯示卡的流處理器,為了獲得更多的效能,執行緒在執行一個shader程式時,其他很多相應的執行緒經常也會同時執行相同的shader程式。
此外NVIDIA的
統一架構可以採用兩種不同的處理模式。對於TPC的執行,架構是MIMD(多重指令,多重數據)模式;而對於SM執行,架構就成了
SIMT(單一指令,多重執行緒)模式。
SIMT對SIMD(單一指令,多重數據)從性能和每一條可程式序兩方面加以改進。作為標量,
SIMT並沒有設定矢量寬度,所以可以全速執行運算,而不用估計矢量大小。正好相反,如果輸入數據小於MIMD或者SIMD 的寬度的話,SIMD會以低速運算。
SIMT可以確保處理器核心一直處於完全被利用狀態。
從編程人員的角度看,
SIMT模式允許每一條執行緒占據各自的路徑。由於分支過程由硬體操控,所以沒有必要在矢量寬度中管理分支。兩種模式分別對應兩種運算類型,TPC模式更適合3D渲染,也就是3D遊戲需求;而SM模式則是大規模
並行計算適合的模式,也就是基於CUDA技術的各種GPU加速運算,比如視頻編碼、比如圖形處理、比如科學計算等等。