b
-
Google 发布 Gemma 4 12B 开源模型:16GB 笔记本跑全模态 AI
Google 又放大招了,这次推出的是开源模型 Gemma 4 12B。 什么是 Gemma 4 12B? 简单来说,这是 Google 最新开源的轻量级多模态 AI 模型。它最大的卖点是:不需要专门的视觉编码器或音频编码器,直接就能处理图像、音频、视频和文字。 传统多模态模型 vs Gemma 4 12B 用一个类比讲清楚: 传统多模态模型处理图片和音频的方式,类似于一个只会…
-
字节开源Lance 3B:统一多模态大模型,小身材大能量
核心看点 字节跳动开源了Lance 3B——一款统一多模态大模型。虽然只有3B参数,但在多模态任务上表现出色,证明了小模型+好架构也能打出漂亮仗。 详细解析 Lance 3B的核心特点: 统一架构:单一模型处理文本、图像等多种模态,简化了多模态AI的开发流程 轻量级:3B参数规模,部署成本低,适合边缘设备和中小型应用 开源开放:字节选择开源,有助于吸引开发者社区参与迭代 多模态…
-
字节开源Lance 3B:统一多模态大模型,小身材大能量
核心看点 字节跳动开源了Lance 3B——一款统一多模态大模型。虽然只有3B参数,但在多模态任务上表现出色,证明了小模型+好架构也能打出漂亮仗。 详细解析 Lance 3B的核心特点: 统一架构:单一模型处理文本、图像等多种模态,简化了多模态AI的开发流程 轻量级:3B参数规模,部署成本低,适合边缘设备和中小型应用 开源开放:字节选择开源,有助于吸引开发者社区参与迭代 多模态…
-
AI日报:字节开源多模态大模型Lance 3B;智谱GLM-5.1高速版发布;CapCut深度集成Gemini
核心看点 字节跳动开源统一多模态大模型Lance 3B,轻量级但能力全面 智谱发布GLM-5.1高速版,编码能力达Claude Opus 4.6的94.6% CapCut(剪映)与Gemini合作推出深度集成,AI视频创作再升级 详细解析 字节开源Lance 3B 字节跳动近日开源了统一多模态大模型Lance 3B。作为一款轻量级模型,Lance 3B在保持较小参数规模的同时,…
-
字节跳动开源Lance 3B:一个模型同时搞定看图理解和画图生成
字节跳动开源了一个3B参数的多模态模型Lance,特点是一个”脑子”同时干两件事:既能理解图片视频,又能生成和编辑图像。 以前做AI的套路是分开养两个模型,一个专门”看懂”(理解),一个专门”画画”(生成)。Lance打破了这堵墙,用共享上下文+能力解耦的设计,让理解和生成在同一个模型里搞定。 对普通人意味…
-
蚂蚁集团百灵大模型开源 Ling-2.6-flash:104B参数仅激活7.4B,推理速度最高340 tokens/s
蚂蚁集团旗下百灵大模型今日宣布正式开源 Ling-2.6-flash,这是一款总参数量 104B、激活参数仅 7.4B 的 Instruct 模型,以极低的推理成本实现了令人瞩目的性能表现。 核心看点 104B 总参、7.4B 激活:采用混合专家(MoE)架构,大幅降低推理资源需求 推理速度达 340 tokens/s:在 4 卡 H20 环境下实现极速推理,Prefill 吞…
