MLU370-S4加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板载24GB低功耗高带宽LPDDR5内存,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。
板卡型号 |
MLU370-S4 |
计算架构 |
Cambricon MLUarch03 |
制程工艺 |
7nm |
计算精度支持 |
FP32、FP16、BF16、INT16、INT8、INT4 |
峰值性能 |
192 TOPS (INT8) |
96 TOPS (INT16) |
|
72 TFLOPS (FP16) |
|
72 TFLOPS (BF16) |
|
18 TFLOPS (FP32) |
|
内存类型 |
LPDDR5 |
内存容量 |
24GB |
内存带宽 |
307.2 GB/s |
视频编解码 |
最高可支持至8K; 132路HEVC全高清视频解码; 24路HEVC全高清视频编码; |
图片编解码 |
图片编解码最高分辨率支持16384x16384; 4000 Frames/s 全高清图片解码; 3000 Frames/s 全高清图片编码; |
系统接口 |
x16 PCIe Gen4 |
形态 |
半高半长单槽位 |
最大热功耗 |
75W |
散热设计 |
被动 |
*测试环境:MLU370-S4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6
GPU数据:ResNet-50来自于相关产品官网,Transformer、VGG16、YOLOv3均取自实测最大吞吐性能。