核心頻率:1304 MHz
Turbo頻率:1442 MHz
流處理單元:3584 個
核心架構(gòu):Pascal
GPU代號:GP100
生產(chǎn)工藝:16 nm
TDP功耗:235W
內(nèi)存頻率:1430 Mbps
內(nèi)存類型:HBM2
內(nèi)存位寬:4096 bit
最大顯存:16 GB
晶體管數(shù)量:15,300 million
代工廠:TSMC
核心面積:610 mm2
一級緩存:24 KB
二級緩存:4 MB
光柵單元:224
紋理單元:96
SM count:56
建議電源:550 W
公版供電:1x 8-pin
公版接口:1x DVI4x DisplayPort
總線接口:PCIe 3.0 x16
像素填充率:138.4 GPixel/s
紋理填充率:323.0 GTexel/s
顯存帶寬:732.2 GB/s
FP16:20.67 TFLOPS (2:1)
FP32:10.34 TFLOPS
FP64:5.168 TFLOPS (1:2)
DirectX:12 (12_1)
OpenGL:4.6
OpenCL:3.0
Vulkan:1.2
CUDA:6.0
Shader model:6.4
GP100容易讓人誤會,它并非是核心名,而品名就是Quadro GP100,作為這一家族的旗艦登場。Quadro GP100基于Pascal核心,單精度CUDA 3584個,雙精度CUDA 1792個,半精/單精/雙精浮點(diǎn)運(yùn)算性能分別是20.7T、10.3T和5.2T,匹配16GB HBM2顯存,帶寬高達(dá)717GB/s,功耗235W。
GP100 提供超過 20 TFLOPS 的半精度計(jì)算,可謂在 Windows 和 Linux 環(huán)境中進(jìn)行深度學(xué)習(xí)的理想開發(fā)平臺。
GP100是帕斯卡家族的旗艦核心,預(yù)計(jì)桌面上的GTX 1080 Ti、新版GTX Titan X也會使用它。
它采用臺積電16nm FinFET工藝制造,集成了153億個晶體管,比麥克斯韋GM200多了超過90%,核心面積達(dá)610平方毫米,只比28nm工藝的GM200大了區(qū)區(qū)9平方毫米。
完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。每個SM單元內(nèi)有64個FP32單精度CUDA核心(麥克斯韋、開普勒架構(gòu)分別有128個、192個),總計(jì)3840個。
每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩沖器、一個Warp調(diào)度器、兩個分派單元。
GP100核心每個SM單元的CUDA核心數(shù)量雖然只有麥克斯韋架構(gòu)的一半,但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個SM單元內(nèi)還有32個FP64雙精度CUDA核心,總計(jì)1920個,是單精度的1/2,這種比例可以更好地配合GP100核心新的數(shù)據(jù)路徑配置,更高效地處理雙精度負(fù)載。
GP100核心還有統(tǒng)一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB,可以減少對GPU DRAM的請求,從而降低整體功耗、內(nèi)存帶寬,提升性能。
整個核心還配備了240個紋理單元。
? ? ? ? ? ? ? ?Copyright 2020-2026 同袍存儲 粵ICP備2021121885號網(wǎng)站地圖