寒武纪科技

产品技术

寒武纪为人工智能系统提供超高能效的领域通用处理器

思元270系列智能加速卡

思元270系列智能加速卡 面向高能效比云端AI推理

思元270集成了寒武纪在处理器架构领域的一系列创新性技术,处理非稀疏深度学习模型的理论峰值性能提升至上一代思元100的4倍,达到128TOPS(INT8);同时兼容INT4和INT16运算,理论峰值分别达到256TOPS和64TOPS;支持浮点运算和混合精度运算。

思元270采用寒武纪MLUv02架构,可支持视觉、语音、自然语言处理以及传统机器学习等多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。

核心优势

全新寒武纪MLUv02架构

全新寒武纪MLUv02架构

MLUv02架构不是简单的从上一代升级而来,新架构基于片上网络(NOC)构建,保证思元270芯片内多达16 个张量核心的并行效率。基于硬件的片内数据压缩,提升缓存有效容量和带宽。

推理性能再进一步

推理性能再进一步

新架构在采用INT8精度进行AI推理计算时,非稀疏网络性能比第一代加速卡提升高达4倍,可为系统提供40倍于CPU的超高能效比。

 

计算弹性和可编程

计算弹性和可编程

思元270芯片支持多类神经网络,寒武纪NeuWare软件栈可以轻松部署推理环境。BANG Lang.编程环境可对计算资源做直接定制,满足多样化AI定制要求,专业而不专用。

应用领域

思元100与思元270理论峰值性能对比

理论峰值性能对比

了解更多寒武纪智能加速卡270系列产品

联系我们