寒武纪科技

产品技术

寒武纪为人工智能系统提供超高能效的领域通用处理器

寒武纪软件开发平台

Cambricon Neuware针对深度学习应用的开发和部署提供了一套完善而高效的软件栈工具,集成了多种开源的深度学习编程框架,并且提供了基于高性能编程库和编程语言等高效灵活的开发模式,以及一系列调试和调优工具。

基于寒武纪智能处理器打造的终端处理器IP产品和云端智能处理卡产品,相比传统芯片可达数量级的性能领先、成本缩减和功耗降低,并且基于Cambricon Neuware率先提出“端云一体”的智能处理思路,使其终端和云端产品可共享同样的软件开发接口和完备生态,可以方便地进行人工智能应用的开发、迁移和调优。              

在云端

在云端

寒武纪提供全套易用的开发调试调优工具

• 开发 软件开发工具包
TensorFlow/Caffe/MXNet/PyTorch/AndroidNN
CNML(机器学习编程库)
CNRT(高性能运行时库)
CNCC(编译器)

• 调试 功能调试工具包
CNGDB(调试工具)
CNQual(硬件诊断工具)

• 调优 性能调优工具
CNPerf (性能剖析)
CNMon(系统监控)

在终端

在终端

寒武纪提供快速的部署工具

• 部署 离线部署工具包
支持从Tensorflow、Caffe、mxnet等主流框架生成离线部署文件
支持arm32_linux / arm64_linux / arm64_android / windows等平台
支持处理器频率、存储带宽、以及SRAM大小的模拟

端云一体开发和部署流程

开发者可以借助云端丰富的计算资源进行算法模型的解析与调试,利用Neuware生成离线模型,并能够在任意搭载寒武纪智能终端IP的设备运行,解决了终端调试手段受硬件资源限制的问题。同时,由于该离线模式无编译过程,摆脱了对CNML与框架层的依赖,是终端部署的最佳选择。端云一体业务部署流程如下图所示:

端云一体开发和部署流程

Neuware软件栈

Neuware软件栈

相关资源