基本介紹 AMD-ATI於2008年6月下旬發布的RV770晶片組顯示卡Radeon HD 4850,採用了經過最佳化,渲染效率更為高的統一
超標量 著色架構(Unified Superscalar Shader Architecture),內置的
流處理器 單元(stream processing units)高達800個,是RV670的2.5倍,全面支持Microsoft DirectX 10.1和Shader Model 4.1,能同時兼容DirectX 10.1、DirectX 10、DirectX 9以及OpenGL等引擎開發的3D遊戲。而且Radeon HD 4850的浮點運算能力已經達到接近1T Flops的水平。
Radeon HD 4850
規格參數 詳細介紹 核心構架分析
如果說DirectX 9.0C是像素渲染的時代,那么到了DirectX 10時代,渲染單元無疑成為了最影響顯示卡性能的架構單位之一。在末DX9時代,ATi意識到像素渲染的重要性,從R520(X1800XT)到R580(X1950XT)就通過1:3的黃金架構,暴力的提高了像素單元的數量,而得到的效果是立竿見影的。
ATi對這種“人口戰術”似乎非常偏愛,一直到了DX10時代,還是通過這種多比例的方式來提高重要的
渲染單元 ,現在在ATi的架構中,流處理器和
流處理單元 的比例就是1:5。
RV770的整體核心規格是在RV670的基礎上進行了相關的擴充以及最佳化,它的具體改進有以下幾點:
1、更多的流處理單元:RV770在流處理器組群上由原來RV670的4組擴充至10組,因此流處理器也有了2.5倍的增長,達到160個(160x5=800個流處理單元)。
2、最佳化過的紋理處理單元:和流處理器組一樣,RV770的紋理單元也由RV670的4組擴充至10組,因此紋理填充單元也由當初的16個增加至40個,增長幅度為2.5倍。
3、更新的
記憶體 架構:RV770首發支持了最新的GDDR5技術,比起RV670,RV770還加入了顯存讀/寫快取區,但在
顯存位寬 上,RV770還是保持了原來的256bit。
4、重新最佳化過架構的Render Back Ends:在架構上做了相關的最佳化,最佳化了RV770在AA特效下的性能表現。
第二代UVD
發展到今天,GPU在電腦中占有的位置無疑越來越重要,主要表示在2D/3D視頻顯示處理上。在GPU能夠實現
硬體解碼 之前,所有高清片源都要通過CPU來進行解碼,這樣其實大大占用了CPU的使用率,而視頻部分本來就應該由GPU來負責,因此在新一代的GPU中,無論nVIDIA又或是ATi都引入了高清硬體解碼的技術。而在這一方面,ATi無疑做得比nVIDIA更好,第一代UVD就能夠實現了H.264及VC-1的高清
硬解 技術,而如今隨著RV770的發布,ATi已經更新至第二代的UVD解碼器。
第二代UVD最大的改進就是支持了多流解碼,這個概念即是表示UVD2能夠支持多部高清片源同時解碼,比起nVIDIA的雙流解碼功能更為強大。而在高清片源的支持上,UVD2已經能夠支持2160P的視頻解碼了!
第二代PowerPlay技術
更低的製作工藝意味著在更小的核心體積下能夠集成更多的電晶體,ATi自RV670起就採用了55nm的先進技術,領先於競爭對手,目前RV770已經是第二代的55nm工藝
顯示核心 了。新的RV770核心面積260m㎡,而電晶體數量已經達到9.56億,接近10億的數量。
儘管在生產工藝上領先於對手,ATi還是沒有放棄節能技術上的開發,上代RV670就推出了第一代桌面級顯示卡的PowerPlay節能技術——一個類似於筆記本的節能技術,當GPU空閒時顯示卡就會自動降頻以達到節能的目的。而現在RV770又再推出了第二代的PowerPlay節能技術,而ATI也給它起了另外一個名字“Power on Demand”,最大的特色是顯示卡會根據GPU、顯存的占用率來自動調配資源。
Havok物理加速技術
我們常說的物理加速引擎主要分為PhysX和Havok兩種,其中開發的PhysX的Ageia已經被nVIDIA收購,而nVIDIA在G92和最新的GT200系列顯示卡上都加入了PhysX的物理加速功能,在以後nVIDIA將會針對支持物理加速的顯示卡推出新的驅動,用戶僅需通過更新驅動就能免費獲得顯示卡性能提升。
目前nVIDIA和Intel針對GPU和CPU展開了激烈的話題討論,雙方各執一詞,nVIDIA希望往後的發展會靠向GPU這一邊,而Intel始終堅持PC里GPU只作輔助CPU之用,而在這場口水戰中,AMD占據的位置無疑更為重要,因為目前就全球來說,僅有AMD一家擁有CPU和GPU整個組合平台,AMD認為只有合理的分配好CPU和GPU,平台才能發揮出最佳的性能表現。目前nVIDIA和Intel已經分別將兩家擁有物理技術的公司Ageia和Havok收購,作為對抗nVIDIA的PhysX物理引擎,ATi這次藉助了Intel的Havok API來展開對物理加速引擎的支持。
其實在很早之前,大量PS2、Xbox平台遊戲都已經開始採用Havok引擎,這款物理引擎現在被廣泛用於3D MAX設計和遊戲開發中,是目前世界上最快、最方便的跨平台遊戲圖形解決方案,也是現今套用最為廣泛的物理引擎之一。據AMD表示,在未來的日子裡,將會有大量遊戲開發商以他們及Havok的物理技術去創造新的3D遊戲,相信相關的開發成品已經迫在眼前。
開放式GPGPU技術
nVIDIA提出了CUDA(Compute Unified Device Architecture)這個新的基礎架構,這個架構可以使用GPU來解決商業、工業以及科學方面的複雜計算問題。無可否認,隨著GPU技術的不斷發展,GPU目前在整套PC中占有的位置已經越來越重要,而nVIDIA於早段時間推出的GeForce GTX 280除了擁有超強的圖形運算能力,同時也是一款非常出色處理器並行架構處理器,
浮點運算 能力也達到了933GFlops,是目前CPU處理器的10倍左右。
而ATi最新發布的RV770,就Radeon HD 4850來看,其浮點運算能力已經達到1TFOLPS,比起nVIDIA的新旗艦顯示卡GTX280還要高出不少,從理論來看,ATI RV770在
並行處理 能力上還是占有不少優勢的,當然還得看實際的運行效率。
ATi垂青的是由蘋果公布的OpenCL開放式標準,它其中包括了物理運算、科學、圖形工作和娛樂等多方面的協調,旨在高度利用GPU的資源,來承擔更多的工作。
GDDR5顯存
從功能上理解,我們可以將顯存看作是GPU核心與像素
渲染管線 之間的橋樑或與倉庫。顯然,顯存的容量決定“倉庫”的大小,而顯存的頻寬決定“橋樑”的寬窄,兩者缺一不可,這也就是我們常常說道的“顯存容量”與“
顯存速度 ”。更快速的顯存技術對整體3D性能表現有重大的貢獻,數據在渲染管線間傳送所花的時間通常比GPU執行功能所花的時間更長,因此提高
顯存頻寬 往往能夠比提高GPU核心頻率取得更為明顯的效果。
從上面的概念理解,我們可以知道顯存頻寬對於決定顯示卡的性能起到相當大的作用,由顯存頻寬=(
顯存位寬 x 顯存
工作頻率 )/ 8 的公式可知,決定顯存頻寬的主要有顯存位寬和顯存頻率,ATi的R600,因為配備了512bit的顯存位寬,因此它顯存頻寬達到史無前例的106GB/sec,而到了RV670,ATi通過精簡架構,將顯存位寬重新定位在256bit上,雖然通過搭配頻率更高的GDDR4顯存,在一定程度上能夠提高顯存頻寬,帶始終GDDR4存在較大延時,也導致了GDDR4對比GDDR3時沒有太大的優勢。如今ATi的Radeon HD 4870將採用GDDR5顯存,顯存頻率能夠達到3600Mhz甚至更高,這也補充了RV770 256bit
顯存位寬 的不足。
從AMD的官方資料來看,
顯存頻寬 得益於GDDR的更新換代,在近幾年有了不少的飛躍,其中DDR2——G
DDR3顯存 頻寬經歷了一次成倍的增長,而另一次顯存頻寬的大爆發,將在GDDR4——GDDR5的這段過程上發生。
ATi在顯存技術上向來走在業界的最前端,在競爭對手還是使用GDDR3顯存時,ATi的RV770已經投入到GDDR5技術了。目前投產於GDDR5顯存技術的已經有奇夢達、三星、海力士三家,而其中奇夢達更是搶先和AMD達成了合作,據了解首批出貨的Radeon HD 4870都是採用奇夢達的GDDR5顯存,額定運行頻率為3600Mhz。
我們可以看見ATI的Radeon HD4870將採用奇夢達GDDR5的
顯存顆粒 ,編號為“IDGV51-05A1F1C-40X”,理論運行頻率能夠達到4000Mhz。