讓 T4 針對可擴(kuò)展服務(wù)器進(jìn)行了優(yōu)化,能效相比 CPU 提高了50 倍之多,大大降低了運(yùn)營成本。過去兩年, NVIDIA 推理平臺的性能提高了 10 多倍,仍然是極具能效的分布式 AI 訓(xùn)練和推理解決方案。
2、NVIDIA T4 數(shù)據(jù)中心 GPU
是完美適用于分布式計算環(huán)境的通用加速器。革命性的多精度性能可加速深度學(xué)習(xí)以及機(jī)器學(xué)習(xí)訓(xùn)練和推理、視頻轉(zhuǎn)碼和虛擬桌面。 T4 支持所有 AI 框架和網(wǎng)絡(luò)類型,性能強(qiáng)勁,效率卓越,可最大限度提高大規(guī)模部署的效用。
3、Turing Tensor 核心技術(shù)
具有多精度計算特性,實現(xiàn)了從 FP32 、 FP16 到 INT8 以及 INT4 精度的突破性 Al 性能、與 CPU 相比,它的訓(xùn)練性能高達(dá) 9 . 3 倍,推理性能高達(dá) 36 倍。