DeepSeek-V4预览版正式发布:1M超长上下文进入全员普惠时代

4月24日,DeepSeek正式发布了V4预览版,这款开源大模型带来了两个重磅升级:1M超长上下文能力,以及结构创新和Agent生态适配。这意味着,处理超长文档、视频分析、复杂代码库等场景,不再需要昂贵的闭源API。

核心看点

  • 1M上下文普惠化:DeepSeek-V4将百万级上下文窗口带入开源领域,Pro版性能接近顶级闭源模型,Flash版则主打性价比,满足不同场景需求。
  • DSA机制优化:采用动态稀疏注意力机制,大幅降低长上下文处理的计算成本,让长文本推理不再”烧钱”。
  • 双版本策略:Pro版对标GPT-4级别性能,Flash版以更低成本提供可用性,覆盖从研究到生产的全链路需求。

目前模型已在Hugging Face和ModelScope上线,开发者可以直接下载试用。对于需要处理长文档、法律合同、学术论文、代码仓库等场景的团队来说,这是一个值得关注的开源选择。

本文地址:https://www.163264.com/11145

(0)
上一篇 2天前
下一篇 2天前

相关推荐