英偉達又發(fā)一款圖靈架構(gòu)顯卡Tesla T4,TDP功耗只有75W
NVIDIA的圖靈架構(gòu)發(fā)布以來已經(jīng)有六款顯卡問世了,包括專業(yè)級的RTX 8000/6000/5000及消費級的RTX 2080 Ti/2080/2070顯卡。今天NVIDIA在日本GTC大會上又宣布了一款圖靈架構(gòu)的新卡——Tesla T4,有2560個CUDA核心,集成320個Tensor Core核心,F(xiàn)P32浮點性能8.1TFLOPS,INT4浮點性能最高260TFLOPS,更神奇的是這款顯卡只有75W TDP,在規(guī)模比RTX 2070顯卡還高的情況下TDP功耗低得多。
這次發(fā)布的Tesla T4顯卡主要面向AI推理應(yīng)用,使用了PCIe插槽,被動散熱設(shè)計,外觀風格跟RTX 8000及RTX 2080 Ti顯卡又不是一種風格了,看圖片更有金屬質(zhì)感。
雖然Tesla系列的專業(yè)卡跟普通消費者關(guān)系不大,不過Tesla T4的意義在于它不同于現(xiàn)有的幾款圖靈顯卡,CUDA核心數(shù)為2560個,高于RTX 2070顯卡的2304個,低于RTX 2080顯卡的2944個,考慮到后兩款顯卡使用的分別是TU104、TU106核心,Tesla T4顯卡很可能是基于完整版TU106核心的(更正:讀者提醒后者應(yīng)該是閹割版TU104核心),集成了320個Tensor核心,但沒有提到RT Core。
性能方面,Tesla T4的FP32浮點性能8.1 TFLOPS,F(xiàn)P16性能65TFLOPS,INT8、IN4性能分別是130、260TFLOPS。
顯存方面,Tesla T4配備了16GB GDDR6顯存,但是官方的給出的帶寬又只有320GB/s,如果是256bit位寬,那么320GB/s對應(yīng)的頻率就是10Gbps,頻率明顯比GDDR6顯存要低,所以這個卡要么顯存位寬有所降低,要么就是使用了低頻版GDDR6。
最神奇的是顯卡的TDP功耗只有75W,在CUDA核心數(shù)比RTX 2070顯卡2304個CUDA核心更多的情況下,TDP功耗低了100W,通常這意味著GPU核心頻率大降,但8.1TFLOPS的性能又不太可能比RTX 2070低,種種意外之處都透露著這款顯卡的圖靈核心有點不不尋常。
如果不是面向?qū)I(yè)卡市場的話,這個圖靈核心其實更合適做游戲卡,前提是放棄光線追蹤技術(shù)。