模型框架

  • DeepSeek API重磅更新:百万Token上下文正式开放,知识库同步升级至2025年5月

    今日,DeepSeek官方API迎来重大更新,上下文长度从之前的128k直接跃升至1M tokens(百万Token),与App及网页版对齐。与此同时,知识库也同步更新至2025年5月,非联网状态下已能准确输出2025年4月的新闻内容。 核心看点 DeepSeek API上下文从128k升级至1M tokens,与客户端对齐 知识库更新至2025年5月,离线也能回答最新资讯 模…

    模型框架 2026年4月23日
  • OpenAI GPT-5.5意外偷跑!号称”最前沿智能体编程模型”,多款内部模型泄露

    今日,OpenAI意外泄露了下一代旗舰模型的消息,在开发者社区引发热议。据网友发现,在Codex CLI终端界面中突然出现了多个尚未正式发布的新模型,其中最受瞩目的GPT-5.5被标注为”最前沿的智能体编程模型”。 核心看点 OpenAI Codex CLI意外泄露GPT-5.5等多款内部模型 GPT-5.5定位为”最前沿智能体编程模型&#8…

    模型框架 2026年4月23日
  • 谷歌推出 Gemini3.1Pro 深度研究代理:支持 MCP 协议与多模态自主研究

    谷歌近日正式推出基于 Gemini 3.1 Pro 架构的深度研究工具——Deep Research 和 Deep Research Max,通过 Gemini API 提供付费层级的公开预览,旨在实现复杂研究流程的自动化。 核心功能 🚀 Deep Research 标准版:适用于实时对话场景的研究模式,能够快速整合网络信息,生成结构化的研究报告。 🔬 Deep Researc…

    模型框架 2026年4月22日
  • OpenAI GPT-5.5意外曝光:最前沿智能体编程模型悄然偷跑

    4月22日,OpenAI在正式发布ChatGPT Images 2.0生图工具的同时,一场更大的”意外”正在网络上迅速发酵——旗下最前沿的AI智能体编程模型GPT-5.5被用户发现悄然出现在Codex CLI终端界面中,引发广泛关注和热议。 核心看点 Codex CLI终端意外暴露GPT-5.5模型,标注为”最前沿的智能体编程模型&#8221…

    模型框架 2026年4月22日
  • 月之暗面正式发布Kimi K2.6模型,多项指标对标全球顶尖大模型

    月之暗面近日正式发布 Kimi K2.6 模型,这是其在大模型领域的最新力作。K2.6 在编程能力、长程任务处理及多Agent协作方面实现重大突破,并在多项权威测试中表现优异,性能可与国际顶尖闭源模型竞争。 核心能力突破 Kimi K2.6 在以下三个维度实现显著提升: 🧠 编程能力:K2.6 在编程任务处理上展现出接近行业顶尖水平的能力,能够处理复杂的多文件项目开发和调试任务…

    模型框架 2026年4月21日
  • 英伟达发布Jetson优化指南:量化Qwen3 8B可省10GB内存,边缘AI部署门槛大降

    英伟达4月20日发布了一份针对边缘设备AI部署的详细优化指南,通过在NVIDIA Jetson平台上的多层优化,最高可释放约12GB内存,让大模型在边缘设备上运行不再是难题。 核心看点 系统层优化:禁用图形桌面界面最高释放865MB内存,关闭非必要网络服务再节省约32MB 内核层调优:针对Jetson Orin系列调整Carveout保留区域可回收约68MB物理内存,利用硬件I…

    模型框架 2026年4月21日
  • 单张图片生成可行走3D世界!NVIDIA开源Lyra2.0,解决长视频空间遗忘和时间漂移难题

    核心看点:NVIDIA Research 发布 Lyra 2.0 框架,从单张图像即可生成可自由探索的 3D 场景,同时解决了长视频生成中的空间遗忘和时间漂移问题,具有广泛的应用价值。 【核心创新】 Lyra 2.0 框架通过两大技术突破实现高质量长视频生成: • 空间记忆机制:维护 3D 几何信息,用于信息路由,避免几何误差积累,确保多帧生成的空间一致性 • 自增强训练策略:…

    模型框架 2026年4月21日
  • Claude推出Claude Design!一句话变交互原型+PPT+营销物料,还能一键打包给Claude Code开发

    核心看点:Anthropic 推出全新实验性产品 Claude Design,通过文字描述、图片或文档即可生成专业级设计稿、交互原型等,极大降低非设计师创建视觉内容的门槛。 【AiBase提要】 • 支持文字、图片、文档等多种输入方式,实现对话即设计• 多格式导出并支持一键打包移交至 Claude Code 进行前端开发• 面向非设计师和设计师,加速创意到实现的流程 【核心能力…

    模型框架 2026年4月21日
  • 阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

    核心看点:阿里通义实验室推出 Fun-ASR1.5 语音识别大模型,基于统一大模型架构,单模型覆盖 30 种语言、汉语七大方言及 20 余种地方口音,典型方言场景字错误率(CER)相对下降 56.2%。 【主要功能】 • 多语言支持:单模型覆盖 30 种语言• 方言识别:无缝支持汉语七大方言体系(东北/华北/吴/闽/粤/湘/客家),以及 20 余种地方口音,连古诗词吟诵也能精准…

    模型框架 2026年4月21日
  • 阿里通义开源语音识别大模型Fun-ASR1.5:30种语言+汉语七大方言,古诗词吟诵也能精准转写

    阿里通义实验室刚放出一款语音识别领域的「重磅炸弹」——Fun-ASR1.5。这款开源大模型用一套统一的架构,覆盖了30种语言、汉语七大方言体系及20多种地方口音。更离谱的是,连古诗词吟诵这种高难度场景,它也能精准转写。 核心看点 单模型统一架构,覆盖30种语言、汉语七大方言体系及20余种地方口音 典型方言场景字错误率(CER)相对下降56.2%,5种方言识别准确率突破90% 支…

    模型框架 2026年4月21日