思元100是寒武纪推出的第一款智能处理板卡产品,基于寒武纪MLUv01架构。支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。
思元100加速卡的INT8理论峰值性能为32TOPS,在稀疏模式下等效理论峰值性能为128TOPS,FP16理论峰值性能为16TFLOPs,稀疏模式下等效理论峰值性能为64TFLOPs。思元100加速卡还搭载多种容量的256bit DDR4 ECC内存,可满足各类推理场景的云端计算需求。
通用智能处理器,支持各类深度学习技术,支持多模态智能处理(视觉、语音和自然语言处理),应用领域广泛。
相比GPU处理器,采用了针对深度学习和人工智能应用特点定制的指令集和处理器架构,具有更优的能效比。
寒武纪为思元100提供了一整套成熟的基础系统软件平台,具体包括应用开发、功能调试、性能调优等在内的一系列工具。
产品型号 | 思元100-C | 思元100-D |
---|---|---|
核心频率 | 1GHz(平衡模式) | |
半精度浮点运算速度(FP16) | 16 TFLOPS(关闭稀疏模式时理论峰值性能) 64 TFLOPS(打开稀疏模式时理论峰值性能) |
|
整数运算速度(INT8) | 32 TOPS (关闭稀疏模式时理论峰值性能) 128 TOPS(打开稀疏模式时理论峰值性能) |
|
内存容量 | 8GB/16GB | |
内存位宽 | 256-bit | |
内存带宽 | 102.4GB/s | |
系统接口 | x16 PCIe Gen.3 | |
外形 | 全高全长,单槽位 | 半高半长,单槽位 |
是否支持解码 | 支持解码 | 不支持解码 |
TDP功耗 | 110w | 75w |
ECC保护 | 是 | |
散热方式 | 被动散热 |