寒武纪科技

产品技术

寒武纪为人工智能领域提供超高能效的通用智能芯片

MLU370-S4智能加速卡

MLU370-S4智能加速卡 面向高密度云端推理

MLU370-S4加速卡采用思元370芯片,TSMC 7nm制程,寒武纪新一代人工智能芯片架构MLUarch03加持,支持PCIe Gen4,板载24GB低功耗高带宽LPDDR5内存,板卡功耗仅为75W,相较于同尺寸GPU,可提供3倍的解码能力和1.5倍的编码能力。MLU370-S4加速卡的能效出色,体积小巧,可在服务器中实现高密度部署。

 

产品规格

板卡型号

MLU370-S4

计算架构

Cambricon MLUarch03

制程工艺

7nm

计算精度支持

FP32、FP16、BF16、INT16、INT8、INT4

峰值性能

192 TOPS (INT8)

96 TOPS (INT16)

72 TFLOPS (FP16)

72 TFLOPS (BF16)

18 TFLOPS (FP32)

内存类型

LPDDR5

内存容量

24GB

内存带宽

307.2 GB/s

vMLU实例

4个

视频编解码

最高可支持至8K;

132路HEVC全高清视频解码;

24路HEVC全高清视频编码;

图片编解码

图片编解码最高分辨率支持16384x16384;

4000 Frames/s 全高清图片解码;

3000 Frames/s 全高清图片编码;

系统接口

x16 PCIe Gen4

形态

半高半长单槽位

最大热功耗

75W

散热设计

被动

 

应用领域

性能对比

性能对比

*测试环境:MLU370-S4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6

GPU数据:ResNet-50来自于相关产品官网,Transformer、VGG16、YOLOv3均取自实测最大吞吐性能。

 

合作伙伴

浪潮
浪潮
  • 浪潮

  • 地址:具体请查看官方网站

  • 电话:400-860-0011

  • 网址:www.inspur.com