模型

  • 国产 AI 大模型 MiniMax 2.7 正式开源,期待 DeepSeek V4 亮相

    国产大模型阵营又迎来重要进展。MiniMax 开发商稀宇科技近日正式开源了 MiniMax 2.7 大模型,编程能力显著提升,接近国际顶尖水平。与此同时,DeepSeek V4 的发布也引起了广泛关注,预计将在 4 月下旬正式亮相。 核心看点 MiniMax 2.7 正式开源,编程能力接近 Claude Opus 等国际顶尖模型 SWE-Pro 基准测试得分表现亮眼,代码理解与…

    模型框架 2026年4月14日
  • 阿里黑科技炸场!0.6B 小模型”魔改”成 17B MoE,激活参数仅 5%,CPU 直接跑 30token/s

    阿里国际数字商业团队推出重磅研究成果——Marco-Mini-Instruct模型,通过一项名为Upcycling的技术,将仅有0.6B参数的小模型”魔改”成拥有17B参数总量的MoE(混合专家)架构,而实际激活参数仅0.86B,推理效率极高,甚至可以在普通CPU上跑到30token/s,极大降低了本地部署门槛。 【AiBase提要】 🧠 通过Upcyc…

    模型框架 2026年4月10日
  • AI 行业日报 · 2026年3月18日 | MiniMax M2.7自我进化 腾讯混元3.0将发布

    📅 2026年3月18日 | 聚焦全球AI行业最新动态 Table of Contents 🎯 今日核心要点 🧠 大模型进展 🔴 国内动态 🔵 海外动态 🎬 AI内容创作 🛡️ 平台治理与合规 🔮 趋势洞察 💡 今日行动建议 🎯 今日核心要点 要点标题 一句话说明 星级 MiniMax M2.7发布 首个深度参与自我迭代的国产Agent大模型,可承担30%-50%研发工作量 ⭐…

    AI 日报 2026年3月18日
  • 阿里通义千问技术负责人离职,谷歌 DeepMind 公开挖角:AI人才争夺战升级

    【核心事件】3月5日,阿里巴巴批准通义千问技术负责人林俊旸离职。消息传出不到1小时,谷歌DeepMind开发团队负责人Omar Sanseviero就在X平台公开喊话,向整个Qwen团队发出加盟邀请。这一罕见的公开挖角,将AI人才争夺战推向了新的高度。 一、为什么是林俊旸? 林俊旸是阿里最年轻的P10级技术负责人,通义千问系列大模型的技术掌舵者。P10在阿里技术体系里意味着什么…

    2026年3月5日
  • 高通骁龙可穿戴平台至尊版:端侧AI芯片来了,手表也能跑大模型?

    高通发布新一代可穿戴芯片,首次引入专用NPU,可直接运行20亿参数模型。这意味着什么?端侧AI时代真的要来了。

    2026年3月4日
  • AI 日报 · 2026-02-03

    AI 日报 · 2026-02-03 覆盖国内与国际 AI 行业公开报道,去重并过滤明显软文。 国内 新华社:国内科技巨头围绕“AI 入口”展开春节拉新战新华社报道腾讯、阿里等在春节前通过红包与补贴竞逐 AI 助手入口,Yuanbao、Qwen 等应用争夺用户心智。Xinhua (People.cn) 蚂蚁数科 CEO 赵闻飙发全员信,成立“大模型技术创新部”蚂蚁数科宣布成立“…

    AI 日报 2026年2月3日
  • Inception Labs 开发的一款基于扩散技术的大型语言模型(dLLM)- Mercury Coder,这玩意儿太快了……

    技术特点 Mercury Coder 是由 Inception Labs 开发的一款基于扩散技术的大型语言模型(dLLM),专为高效编程和文本生成设计。 性能表现 应用场景 优势总结 Mercury Coder 的主要优势在于其极高的生成速度和并行处理能力,同时保持了与传统模型相当的性能。它还具备纠错能力,能够生成更准确的文本和代码。 体验地址: https://chat.in…

    2025年3月8日
  • 微软开源 140 亿参数小语言 AI 模型 Phi-4

    微软于2025年1月8日在Hugging Face平台上开源了其小型语言模型Phi-4。Phi-4是微软2023年推出的小型语言模型系列的第四代产品,拥有140亿参数。该模型基于Transformer架构,采用仅解码器型架构,只关注单词之前的文本,减少了需要处理的数据量,从而降低了推理成本。 Phi-4在多个基准测试中表现优异,甚至超越了参数量更大的Llama 3.3 70B和…

    2025年1月10日
  • 字节自研视频生成模型 Seaweed 开放使用

    即梦AI宣布开放Seaweed视频生成模型,提供专业级光影布局和色彩调和,画面视觉美感和真实感。模型基于DiT架构,能实现流畅自然的大幅度运动画面。Pro版模型可实现多拍动作与多主体复杂交互,攻克多镜头切换难题,适配各种设备比例,助力专业创作者和艺术家们的创作。 登录后,在“视频生成”功能下,视频模型选择“视频 S2.0”即可体验。本次开放使用的豆包视频生成模型 Seaweed…

    2024年11月11日
  • VQAScore评测方案,搞定文生图模型评测

    VQAScore是一种新的文本到视觉生成评估指标,通过CLIP-FlanT5模型计算图像与文本提示的匹配度,优于传统CLIPScore。它使用VQA模型评估生成图像,提供简单有效的评估方法,并推出GenAI-Bench基准测试,挑战现有生成模型。 项目地址: https://linzhiqiu.github.io/papers/vqascore

    2024年11月6日