特斯拉 -計算處理器

特斯拉

Tesla GPU的20系列產品家族基于代號為"Fermi"的下一代CUDA架構,支持技術與企業計算所"必備"的諸多特徵,其中包括C++支持、可實現極高精度與可擴展性的ECC存儲器以及7倍于Tesla 10系列GPU的雙精度性能。

  • 中文名稱
    特斯拉
  • 外文名稱
    Tesla

特斯拉特徵

基于新一代Fermi CUDA架構的GPU

與基于最新四核CPU的純CPU系統相比,該GPU以十分之一的成本和二十分之一的功耗即可實現同等的集群性能。

448個CUDA核心

每顆GPU最高可實現515 Gigaflop雙精度峰值性能,從而讓一台工作站即可實現Teraflop級甚至更高的性能。每顆GPU的單精度峰值性能超過1 Teraflop。

ECC存儲器

能夠滿足工作站計算精度與可靠性方面的關鍵需求。能夠為存儲器中的資料提供保護功能,從而為應用程式增強資料完整性和可靠性。暫存器檔案、L1/L2高速快取、共享存儲器以及DRAM均受ECC的保護。

台式機上的集群性能

與一個小型伺服器集群相比,配備多顆GPU的單台工作站能夠更快地解決大型難題。

每顆GPU最多配備6GB GDDR5存儲器

更大的資料集能夠儲存在直接附屬于GPU的在地存儲器上,從而實現了性能的最大化並減少了資料傳輸的情況。

NVIDIA®(英偉達?)並行DataCache?

能夠為物理效果解算器、光線追蹤以及稀疏矩陣乘法等諸多演算法加速,在這些演算法中,資料地址事先都是未知的。每個流式多處理器模組均包含一個可配置的L1高速快取,所有處理器核心使用統一的L2高速快取。

NVIDIA®(英偉達?)GigaThread?引擎

通過多項技術實現了吞吐量的最大化,其中包括10倍于上一代架構的高速上下文切換、並發核心執行以及改良的執行緒塊調度。

非同步傳輸

計算核心在PCIe匯流排上載輸資料的同時還能夠處理其它資料,因而增強了系統性能。即便是地震處理這類需要大量資料傳輸的應用程式,也能夠通過事先將資料傳輸至在地存儲器的方法來最大限度提升計算效率。

CUDA編程環境受到各種程式語言與API的廣泛支持

開發人員無論選擇C語言、C++、OpenCL、DirectCompute還是選擇Fortran語言,都能夠實現應用程式的並行機製,進而利用"Fermi"GPU的創新架構。Microsoft Visual Studio開發人員可以使用NVIDIA®(英偉達?)Parallel Nsight工具。

高速PCIe Gen 2.0資料傳輸率

實現了主系統與Tesla處理器之間頻寬的最大化。讓Tesla系統能夠套用于幾乎所有具備一條開放式PCIe x16插槽且符合PCIe規範的主系統。

特斯拉規格

尺寸規格

9.75英寸PCIe x16規格

Tesla GPU的數量

1

CUDA核心數量

448

CUDA核心頻率

1.15 GHz

雙精度浮點性能(峰值)

515 Gflops

單精度浮點性能(峰值)

1.03 Tflops

專用存儲器總容量*

Tesla C2050

Tesla C2070

3GB GDDR5

6GB GDDR5

存儲器頻率

1.5 GHz

存儲器接口

384位

存儲器頻寬

144 GB/秒

功耗

247W熱設計功耗

系統接口

PCIe x16 Gen2

散熱解決方案

主動式風扇散熱器

軟體開發工具

CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。

針對Visual Studio的NVIDIA®(英偉達?)Parallel Nsight?

相關搜尋

其它詞條