寒武纪Day 0适配DeepSeek-V4：国产AI芯片的又一次突破

2026年4月25日上午2:02 • 模型框架 • 阅读 342

4月24日，寒武纪宣布已完成对DeepSeek-V4的Day 0适配——模型发布当日即可稳定运行，适配代码已开源至GitHub。

核心看点

基于vLLM推理框架，完成285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的即时适配
通过自研融合算子库Torch-MLU-Ops，对Compressor、mHC等新结构进行专项加速
利用BangC高性能编程语言编写稀疏/压缩Attention、GroupGemm等热点算子的极致优化Kernel
全面支持TP/PP/SP/DP/EP 5D混合并行、通信计算并行、低精度量化及PD分离部署
利用MLU访存与排序加速能力，有效加速稀疏Attention、Indexer等结构

DeepSeek-V4拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。API服务已同步更新。

本文地址：https://www.163264.com/11095

赞 (0)

微信扫一扫，鼓励一下～

微信扫一扫，鼓励一下～

OpenAI发布GPT-5.5：运算速度飙升，Token成本大幅下降

上一篇 2026年4月25日上午2:02

Anthropic二级市场估值飙至1万亿美元，反超OpenAI

下一篇 2026年4月25日上午2:03