NVIDIA 公司在月初終于發布了基于代號為 Fermi 的下一代 CUDA 架構的 Tesla S2050 系列處理器,其供應商們也紛紛推出了 Tesla 20 系列的最新 GPU 計算解決方案,並聲稱擁有多個“必備的”的高性能計算功能。業內人士千呼萬喚的 Tesla 20 系列計算解決方案到底有什麼獨特之處?它與 CPU 解決方案相比,以及與上一代 GPU 解決方案相比,到底有什麼非凡的性能呢? 為了一探究竟,小編先是翻閱了大量的相關資料,又遠程試用了 AMAX 蘇州公司的 Tesla 超級計算機,終于對 GPU 高性能計算解決方案有了些基本的了解,現整理如下,供大家參考和討論。 GPU,即圖形處理器,其計算模型在一個異構計算模型中同時使用了 CPU 和 GPU,應用程序的順序部分在 CPU 上運行,計算密集型部分在 GPU 上運行,從而極大地提升了運算性能。以 AMAX 最新推出的 Tesla 20 系列計算解決方案為例,與最新的四核 CPU 解決方案相比,能夠以十分之一的成本和二十分之一的功耗實現同等超級計算性能。 這些最新的 Tesla 20 系列計算平台,一般包括:
超級圖形工作站:單一桌邊型工作站,CUDA 計算內核多達1,792 個,可提供 4.12 Teraflops 的單精度和 2.06 Teraflops 的雙精度浮點運算性能(峰值)。
1U 機架優化 GPU 服務器:1U 系統平台,配有6個熱插拔2.5 SATA 硬盤位,CUDA 計算內核多達896個,可提供2.06 Teraflops 的單精度浮點運算性能和1.03 Teraflops 的雙精度浮點運算性能(峰值)。 S2050/S2070 1U GPU 超級計算系統:提供世界上最高的計算密度,可用于部署企業部門的計算集群和數據中心。1U 系統中,配有1,792個CUDA 計算內核,可提供 4.12 Teraflops 的單精度和 2.06 Teraflops 的雙精度浮點運算性能(峰值)。 並行 GPU 高性能計算集群:每個集群可提供高達 86.52 Teraflops 的單精度和 43.26 Teraflops 的雙精度運算性能。主機系統配有高達 504GB 的專用 GPU 內存,84個12核 AMD 或6核英特爾處理器和 252TB 的熱交換共享存儲。
而業界所說的擁有多個“必備的”高性能計算功能,則是指:
ECC 內存確保計算結果的准確性和可靠性 L1/L2 緩存改善帶寬和數據共享
雙精度性能是上一代產品的7倍
CUDA 程序環境,支持多種編程語言和 API,包括 C、C++、OpenCL、DirectCompute 或 Fortran
NVIDIA® 並行數據緩存(DataCache™)技術,能夠對無法預知數據地址的算法進行加速,例如物理解算器、光線追蹤、以及稀疏矩陣乘法等等
NVIDIA® GigaThread™ 引擎通過更快的上下文切換、同時內核執行以及改善的線程塊調度功能,最大限度提升了吞吐量
田納西大學創新計算實驗室主任,Jack Dongarra 教授說 GPU 已經發展到了頗為成熟的階段,可輕松執行實際應用程序並且其運行速度已遠遠超過了使用多核系統時的速度,未來的計算架構將是並行核心 GPU 與多核 CPU 串聯運行的混合型系統。AMAX 集團主席 Jean Shih 也說其 Tesla 20 系列解決方案代表了高性能計算行業最重要的產品創新之一,可以滿足客戶最苛刻的高性能計算應用和I / O 要求。
- 新聞稿有效日期,至2010/05/16為止
聯絡人 :張衛民 聯絡電話:0512-67618188 電子郵件:marketing@amaxit.net
上一篇:磐儀科技推出寬溫COM Express CPU模組— COM-842E
下一篇:Winmail 總公司分公司集團郵箱部署詳細講解
|