為安培架構(gòu)優(yōu)化,NVIDIA正式發(fā)布CUDA 11工具包
NVIDIA是GPU加速領(lǐng)域最強平臺之一,近日了發(fā)布全新的CUDA 11版本工具包,特別為新誕生的安培架構(gòu)進行了優(yōu)化。
CUDA 11完全支持在安培新架構(gòu)上進行開發(fā),包括A100 GPU,以及基于它的DGX A100、HGX A100等多路系統(tǒng),并支持安培架構(gòu)的第三代Tensor張量核心,可針對不同數(shù)據(jù)類型加速混合精度矩陣計算,比如TF32、Bfloat16。
其他新技能:
- 多實例GPU虛擬化和GPU分區(qū),提升GPU利用率
- 優(yōu)化庫性能,包括線性代數(shù)、快速傅里葉變換(FFT)、矩陣乘法、JPEG解碼等等
- 改進編程與API,包括任務(wù)圖表、異步數(shù)據(jù)轉(zhuǎn)移、精細(xì)同步、二級緩存駐留管理等等
- 增強Nsight開發(fā)工具集,包括跟蹤、編譯、調(diào)試分析
- 完整支持各種主要CPU架構(gòu),包括x86、ARM64、Power
- CUDA C++改進編譯器性能和穩(wěn)定性、支持新的主編譯器和語言標(biāo)準(zhǔn)(包括C++17)、支持Parallel C++ STL
想要這款工具包的可以下載去用了。