模型框架
-
DeepSeek-V4正式发布:国产大模型迎来百万上下文时代
4月24日,深度求索(DeepSeek)正式发布V4模型预览版,这是国产开源大模型领域的又一里程碑。此次发布的V4系列包含两个版本:285B参数的DeepSeek-V4-flash和1.6T参数的DeepSeek-V4-pro,均已在发布当日实现稳定运行。 核心看点 百万级超长上下文:V4支持1M超长上下文记忆,在处理长文档、代码库分析等场景下表现突出 双版本策略:flash版…
-
OpenAI发布GPT-5.5:运算速度飙升,Token成本大幅下降
4月24日,OpenAI正式发布新一代大语言模型GPT-5.5。公司称其为”迄今为止智能程度最高、使用体验最为直观的版本”。 核心看点 相比GPT-5.4,运算速度更快、逻辑更精准,且Token消耗显著减少 适用场景广泛:从智能体编程、知识处理等企业级应用,到数学运算、科学研究等前沿领域 在操控电脑完成办公任务方面能力优于前代,科研和技术研究流程实现明显…
-
寒武纪Day 0适配DeepSeek-V4:国产AI芯片的又一次突破
4月24日,寒武纪宣布已完成对DeepSeek-V4的Day 0适配——模型发布当日即可稳定运行,适配代码已开源至GitHub。 核心看点 基于vLLM推理框架,完成285B DeepSeek-V4-flash和1.6T DeepSeek-V4-pro的即时适配 通过自研融合算子库Torch-MLU-Ops,对Compressor、mHC等新结构进行专项加速 利用BangC高性…
-
Kimi K2.6正式发布:编程能力突破,推理效率比行业主流高20%
月之暗面今日正式发布Kimi K2.6模型,在编程能力、长程任务处理及多Agent协作方面实现重大突破。据官方透露,该模型在多项权威测试中已进入行业第一梯队,性能可与国际顶尖闭源模型正面竞争。 核心看点 编程能力飞跃:K2.6在代码生成、理解和调试方面实现质的提升,成为开发者群体的强力助手 长程任务处理:支持超长上下文记忆,能够处理复杂的持续对话和多步骤任务 多Agent协作:…
-
腾讯混元3.0大模型免费上线,姚顺雨加盟后编程能力暴涨40%+
腾讯在AI大模型赛道上的”慢热”正在迎来转折。4月23日,混元3.0(英文代号Hy3)以preview版本在OpenRouter平台免费上线,标志着腾讯新一代大模型正式亮相。而这位幕后推手,正是去年被腾讯以亿元年薪挖来的AI大神——姚顺雨。 核心看点 编程能力跃升:在SWE-Bench编程测试中,混元3.0 preview得分74.4%,较上一代Hy2的…
-
小米MiMo-V2.5-Pro登顶全球开源大模型榜首,Agent能力比肩Claude Opus
4月23日,小米正式官宣:旗下旗舰AI模型 Xiaomi MiMo-V2.5-Pro 登顶全球开源大模型综合智能指数榜首,成为首个登顶该榜单的中国手机厂商。这一成绩意味着国产AI正从”追赶者”正式切换为”领跑者”。 核心看点 全球第一:MiMo-V2.5-Pro 在综合智能指数上与全球最强模型并列第一,Agent专项指数更是独占鳌…
-
小米MiMo-V2.5公测:4.3小时干完北大学生数周的活,国产大模型卷疯了
小米今日扔出一枚重磅炸弹——MiMo-V2.5系列模型正式开启公测。这次不是营销噱头,而是实打实的技术硬菜。其Pro版本在内部测试中仅用4.3小时就完成了北京大学《编译原理》课程项目,而这一任务通常需要本科生投入数周时间。 核心看点 极致效率:MiMo-V2.5-Pro用4.3小时、672次工具调用,从零实现完整SysY编译器,在隐藏测试集上斩获233/233满分,首次编译通过…
-
OpenAI GPT-5.5 意外泄露:最强智能体编程模型曝光
AI圈又炸锅了。就在OpenAI正式发布ChatGPT Images 2.0的同一日,其内部最前沿的AI模型GPT-5.5意外在Codex CLI终端界面”偷跑”,被眼尖的开发者逮个正着。 核心看点 意外泄露:网友在Codex CLI中发现GPT-5.5模型选项,标注为”最前沿的智能体编程模型”,疑似内部测试环境误部署至生产环境 …
-
OpenAI GPT-5.5意外曝光:「最前沿智能体编程模型」浮出水面
OpenAI今天发布了ChatGPT Images 2.0生图工具,但更让人兴奋的反而是「意外泄露」的GPT-5.5模型。有网友在Codex CLI终端界面中,赫然发现了这个被标注为「最前沿的智能体编程模型」的神秘模型。 核心看点 GPT-5.5意外曝光:在Codex CLI中出现,被标注为「最前沿的智能体编程模型」 多个内部模型泄露:包括oai-2.1、Arcanine、gl…
-
小米MiMo-V2.5公测:4.3小时搞定北大编译原理项目,Token成本直降50%
小米今天正式放出大招——Xiaomi MiMo-V2.5系列模型开启公测,而且即将全球开源。这套模型被官方定义为「小米迄今最强大模型」,在推理能力、Agent稳定性、多模态感知等维度全面跃升。 核心看点 4.3小时搞定北大编译原理项目:MiMo-V2.5-Pro仅用4.3小时、672次工具调用,就完成了北大本科生通常需要数周才能完成的SysY编译器项目,隐藏测试集满分233/2…
