詳細介紹
跑分王:全球首款Cortex-A17晶片
瑞芯微RK3288處理器採用Cortex-A17,其最大的特點就是與Cortex-A15一樣採用完全亂序執行架構,其性能提升有著立竿見影的效果。雙指令解碼、雙地址產生器(AGU)、多指令派發(multi issue)等特別架構的設計,使得Cortex-A17在指令執行效率上有相當大的提升,正是基於以上改進,在同樣的頻率下,Cortex-A17的單執行緒性能要比Cortex-A9有40%的提升,而頻率高達1.8GHz的RK3288性能較上一代RK3188有50%的性能提升。
遊戲王:Mali-T764系列GPU的晶片
在之前RK3188處理器中,瑞芯微使用的GPU Mali-400一直是RK3188的軟肋。而在最新的RK3288處理器中,GPU採用Mali T76X系列GPU,Mali T764核心最大特點是採用第三代Midgard架構,相比於T62x/65x系列GPU所採用的第二代MIDgard架構,第三代Midgard架構在內部架構上進行了重新設計,特別是大幅度改變了著色器核心的配置方式;著色器數量高達4個著色器核心,是之前的T654的兩倍;2400M/s的像素填充率和300M/s的三角形生成率相對於過去獲得了成倍的提升。
超清王:支持4Kx2K 實時硬解H.265、HDMI2.0
瑞芯微RK3288是支持4Kx2K,以及硬解H.265視頻的晶片,帶給用戶清晰的視覺享受作為更有效率的高清壓縮格式,H.265標準已經成為了各視頻網站的救命稻草。與H.264相比,H.265使用了大小浮動的編碼單位以及更先進的幀內預測模式,同畫質的情況下使用H.265的視頻可比H.264節省一半的頻寬。瑞芯微RK3288是業界首款支持4K H.265實時硬體解碼的ARM核心晶片,在視頻的支持上發揮了其以往的音視頻領域的積累優勢,真正支持4K視頻的輸出及播放。
RK3288最新GPU:Mali -T764詳解
第三代midgard架構,火力更足
mali-t764最大特色就是採用第三代midgard架構,在內部架構上進行了重新設計,大幅度改變了著色器核心的配置方式。著色器間的記憶體同步以及核心群間的scu依然保持。不過核心群間依然採用獨立的l2 快取和snoop單元,彼此之間的聯繫通過amba4匯流排實現,因此可以認為任務的分配可以根據需要實現最佳化。
同時mali-t764還支持gpgpu(通用計算圖形處理器)加速複雜和計算密集型算法或操作。rk3288還將在可穿戴設備上大放異彩。rk3288可以辨別出攝像頭畫面上運動的物體,利用高效的性能進行實時渲染,從而帶來更佳的體驗,像圖像拼接識別、面部識別、笑容識別,地標識別甚至皺眉識別這樣的套用都可以輕易實現。
mali-t764進一步加強了對不同api的支持,正式加入了對opengl es3.0、opencl 1.1、directx 11.1以及renderscript的支持。靠這些新加入的api,集成mali-t764gpu的處理器可以顯示更為精細的圖形,有機會運行在傳統的pc平台,讓pc軟體和移動軟體的相互移植變得更為方便。
ARM 幀緩衝壓縮,低記憶體頻寬享用高畫質
支持ARM 幀緩衝壓縮格式也是Mali-T764的一大亮點,這讓它可以在運行高畫質遊戲時緩解記憶體頻寬不足的壓力。很多採用Mali-400MP4+視網膜螢幕的平板在最高解析度模式下都會出現非常卡頓的現象,一大程度上就是顯存頻寬不足的體現。為解決視頻所遇到的記憶體頻寬難題,ARM 開發了 ARM 幀緩衝壓縮格式,該格式能夠提供快速、實時的無損壓縮與解壓縮。這降低整個系統對記憶體頻寬的要求,並將相應功耗降低至多達50% 。
此外,Mali-T764在支持OpenGL ES 3.0時還支持ASTC 紋理壓縮格式,除了能減少紋理材質的傳輸大小外,這也讓手持設備的高質量遊戲得以全面減少紋理材質上的頻寬耗損,維持遊戲的畫面質量又可減少頻寬。
瑞芯微RK3288與蘋果A7性能對比
著色器對比
蘋果新A7處理器採用PowerVR 6核心架構。PowerVR 6架構為統一超標量渲染引擎,著色器陣列設計,以四個著色器為一個SIMD 陣列設計。A7所採用的是IMG PowerVR G6430,4 個SIMD 陣列設計。
瑞芯微RK3288所採用的Mali-T764支持特性並不遜色於A7的PowerVR G6430。Mali-T764採用的是ARM最新的第三代MIDgard架構,也是採用當前PC上GPU一樣的統一渲染架構,特點就是在提升通用處理功能的同時,依然保持足夠的圖形處理效率,包括有64-bit雙精度浮點運算和64-bit整數運算,64-bit定址,shader單元間的記憶體同步。不過,相對於PowerVR 6430核心所採用分解矢量引擎和scalar引擎的SIMD構架,Mali-T764的運算管線採用128-bit矢量引擎設計,擁有靈活的管線配置。特別是作為Mali –T700系列的最高型號,Mali-T764通過單一的調度機制,每個核心群都會分到相同的處理任務,可以根據需要實現性能最佳化。可以說,如果從硬性配置上,兩者勢均力敵,但在運算管線設計上Mali-T764更勝一籌。
圖形處理性能,Mali-T764與G6230大致旗鼓相當
A7的PowerVR G6430的性能來看,與A6X處理器PowerVR 554MP4相差不大:同頻下浮點性能和iPad4上的SGX554MP4相同,三角填充率及紋理性能是SGX554MP4的兩倍。
?Mali-T764每個著色器都配有四個ALU(算數邏輯單元)、一個LSU(本地存儲單元)、一個紋理單元。而且Mali-T764的四個著色器族組都擁有獨立的共享L2快取的核心群,四個核心群之間則通過單一的dispatcher,每個核心群都會分到相同的處理任務。更重要的是,各個shader均擁有獨立的執行緒調度,可對各自的管線分配來自各個執行緒的程式指令,從而使得各個管線可靈活用於執行來自各自執行緒的指令,這樣如果有128條管線,那么就可以同時運行128個執行緒,而Mali-T764的shader單元最多能夠控制800個以上的執行緒。這種靈活的執行緒調度方式,讓Mali-T764的shader單元擁有更高的運算效率,甚至擁有媲美於桌面PC般的圖形性能。
Mali- T760在搭配16個核心600MHz下,色器性能峰值為326.4 GFLOPS、1066M三角形生成率及9600M像素填充率,此時完勝於A7的PowerVR G6430。由於Mali- T764隻搭配4個核心,因此性能只有Mali- T760mp16的四分之一,另外mali系列計算浮點為FP16情況下,而其他廠商GPU皆在FP32下計算,因此Mali- T760浮點性能實際上只有宣傳數值一半左右的浮點性能,mali T764FP32下浮點為81.6 GFLOPS,實際FP16下浮點大約只有40.8 GFLOPS,而G6230在600mhz下FP16為 76.8GFLOPS,因此T764性能比不上G6230,但差距不太大。
關於瑞芯微
福州瑞芯微電子有限公司(Fuzhou Rockchip Electronics Co,. Ltd.)成立於2001年,是積體電路設計公司和經國家認可的高新技術企業,精心著眼於移動網際網路、數字多媒體晶片設計,是個人移動信息終端SOC解決方案供應商。瑞芯在移動網際網路領域有多個完整的自主創新的智慧財產權群,為中國電子業發展做出積極努力。產品涵蓋Android平板電腦、Android電視機頂盒(智慧型電視)、電子書、WIFI/藍牙音頻解決方案等。瑞芯微連續五屆獲得中國芯最高榮譽。
瑞芯微總部設在福州,進行晶片核心設計及研發;在北京、深圳以及上海三地均設立分公司,為瑞芯微電子項目研發及市場業務對接平台。