NVIDIA Tesla C1060是一款處理器,存儲器頻率為1.5 GHz,記憶體頻率為800 MHz。
基本介紹
- 外文名:NVIDIA Tesla C1060
- 特性:基於新一代Fermi CUDA架構的GPU
- CUDA核心數量:448
- 尺寸規格:9.75英寸PCIe x16規格
- 編程環境:CUDA
概論,特性,規格,雜項,
概論
NVIDIA Tesla(特斯拉)是NVIDIA繼專業加速卡QUADRO及娛樂圖形卡GeForce系列後,推出的一個全新的產品線,主要套用於廣大科學研究的高性能計算需求。Tesla是一位擁有700多項專利的著名科學家,交流電和無線電的創始人,變壓器和交流電動機的發明人,提出了低損耗高壓電傳輸的概念。高中物理課本中磁感應密度的單位就是特斯拉!
TESLA的主要特色包括有:
* 業界第一個擁有128個運算處理核心的大量多執行緒架構
* 採用C語言的繪圖處理器開發環境
* 提供完整的開發工具套件(C語言編碼器、除錯器、性能分析工具、最佳化的程式庫)
* 最大規模的GPU運算獨立軟體開發(ISV)夥伴社群
* 配合現有HPC環境完美運作
NVIDIA Tesla C1060在一個計算機工作站上供了一個小型計算機集群的計算能力,支持向高效利用能源的並行計算能力的轉化。NVIDIA® Tesla™ C1060 可將工作站轉變成一個性能遠超小型集群的高性能計算機。它的計算能力甚至超過了一個小的計算機集群。這在技術專業人員的桌邊為他們提供了一個專用的計算資源,與在數據中心中的共享計算機集群相比,NVIDIA®(英偉達™) Tesla™ C1060性能更強,消耗的能源更少。Tesla C1060基於大規模並行的多核Tesla處理器。該處理器與標準的CUDA C語言編程環境緊密結合以簡化多核心編程。
特性
基於新一代Fermi CUDA架構的GPU | 與基於最新四核CPU的純CPU系統相比,該GPU以十分之一的成本和二十分之一的功耗即可實現同等的集群性能。 |
448個CUDA核心 | 每顆GPU最高可實現515 Gigaflop雙精度峰值性能,從而讓一台工作站即可實現Teraflop級甚至更高的性能。每顆GPU的單精度峰值性能超過1 Teraflop。 |
ECC存儲器 | 能夠滿足工作站計算精度與可靠性方面的關鍵需求。能夠為存儲器中的數據提供保護功能,從而為應用程式增強數據完整性和可靠性。暫存器檔案、L1/L2高速快取、共享存儲器以及DRAM均受ECC的保護。 |
台式機上的集群性能 | 與一個小型伺服器集群相比,配備多顆GPU的單台工作站能夠更快地解決大型難題。 |
每顆GPU最多配備6GB GDDR5存儲器 | 更大的數據集能夠保存在直接附屬於GPU的本地存儲器上,從而實現了性能的最大化並減少了數據傳輸的情況。 |
NVIDIA®(英偉達™)並行DataCache™ | 能夠為物理效果解算器、光線追蹤以及稀疏矩陣乘法等諸多算法加速,在這些算法中,數據地址事先都是未知的。每個流式多處理器模組均包含一個可配置的L1高速快取,所有處理器核心使用統一的L2高速快取。 |
NVIDIA®(英偉達™)GigaThread™引擎 | 通過多項技術實現了吞吐量的最大化,其中包括10倍於上一代架構的高速上下文切換、並發核心執行以及改良的執行緒塊調度。 |
異步傳輸 | 計算核心在PCIe匯流排上傳輸數據的同時還能夠處理其它數據,因而增強了系統性能。即便是地震處理這類需要大量數據傳輸的應用程式,也能夠通過事先將數據傳輸至本地存儲器的方法來最大限度提升計算效率。 |
CUDA編程環境受到各種程式語言與API的廣泛支持 | 開發人員無論選擇C語言、C++、OpenCL、DirectCompute還是選擇Fortran語言,都能夠實現應用程式的並行機制,進而利用“Fermi”GPU的創新架構。Microsoft Visual Studio開發人員可以使用NVIDIA®(英偉達™)Parallel Nsight工具。 |
高速PCIe Gen 2.0數據傳輸率 | 實現了主系統與Tesla處理器之間頻寬的最大化。讓Tesla系統能夠套用於幾乎所有具備一條開放式PCIe x16插槽且符合PCIe規範的主系統。 |
規格
尺寸規格 | 9.75英寸PCIe x16規格 |
Tesla GPU的數量 | 1 |
CUDA核心數量 | 448 |
CUDA核心頻率 | 1.15 GHz |
雙精度浮點性能(峰值) | 515 Gflops |
單精度浮點性能(峰值) | 1.03 Tflops |
專用存儲器總容量* Tesla C2050 Tesla C2070 | 3GB GDDR5 6GB GDDR5 |
存儲器頻率 | 1.5 GHz |
存儲器接口 | 384位 |
存儲器頻寬 | 144 GB/秒 |
功耗 Tesla C2050 | 238W熱設計功耗 |
系統接口 | PCIe x16 Gen2 |
散熱解決方案 | 主動式風扇散熱器 |
顯示器支持 Dual-Link DVI-I 顯示器最大解析度@ 60Hz | 1 2560x1600 |
軟體開發工具 | CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。 針對Visual Studio的NVIDIA®(英偉達™)Parallel Nsight™ |
*註:在開啟ECC功能的情況下,專用存儲器中的一部分將用於ECC數據,因此用戶可用存儲器容量將減少12.5%。(例如總容量為3 GB的存儲器將僅能為用戶提供2.68 GB的可用容量。)
雜項
該卡詳細參數如下:
規格 | 10.5" x 4.376", 雙槽 |
Tesla GPU數量 | 1 |
流處理器核心數量 | 240 |
處理器核心頻率 | 1.296 Ghz |
單精度浮點性能 | 933 GFlops |
雙精度浮點性能 | 78 GFlops |
浮點精度 | 支持IEEE 754單精度和雙精度浮點數 |
專用顯存總容量 | 4 GB |
記憶體頻率 | 800 MHz |
顯存位寬 | 512位 GDDR3 |
顯存頻寬 | 102 GB/秒 |
最大功耗 | 187.8瓦 |
系統接口 | PCI Express x16 (二代) |
輔助電源 連線器 | 兩個六針或一個八針 |
散熱方案 | 主動風扇散熱器 |
編程環境 | CUDA |
特性 | 優勢 |
大規模並行多核架構,有240個處理核心 | 在您的工作站上即可解決以前需要用大型計算機集群來運算的計算難題 |
4 GB高速存儲器 | 支持更大數據集的本地存儲,充分利用存儲器高達102GB/s的傳輸速度,把系統中的數據移動需求降到最低。 |
廣為接受,易於學習的CUDA C語言編程環境 | 簡潔高速的應用程式並行機制可充分利用GPU(圖形處理器)的多核架構 |
可擴展到多個GPU(圖形處理器)以及達到上千個處理器核心的性能 | 通過擴展到多個GPU(圖形處理器)上的數千個核心,來解決大規模的問題 |
IEEE 754單精度和雙精度浮點單元 | 在一塊晶片上獲得最高的浮點運算性能,同時滿足你的程式對精確度的需求 |
異步傳輸能力 | 可以在計算的同時進行數據傳輸,從而進一步提高系統性能 |
從GPU(圖形處理器)到板載顯存可達512位顯存位寬 | 高速GDDR3顯存、512位顯存位寬以及102 GB/秒的顯存頻寬可實現超高的數據傳輸速度 |
共享數據記憶體 | 利用低延遲的存儲器,各處理器核心群組可以緊密合作 |
高速、PCI-Express 2.0數據傳輸 | CPU與GPU(圖形處理器)之間的通信速度快、頻寬高 |
Tesla GPU(圖形處理器)產品擁有多種規格 | Tesla工作站和1U系統可以適應很廣泛的部署環境 |