开源项目
-
阶跃星辰Step 3.7 Flash开源:1960亿参数,速度翻倍,性价比卷王来了
核心看点 阶跃星辰开源Step 3.7 Flash,1960亿参数MoE架构 专为智能体生产化落地设计,代码、搜索、多模态全面优化 速度翻倍,长链路智能体工作流稳定性极高 国产大模型又出一个狠角色。阶跃星辰发布了Step 3.7 Flash,而且直接开源。 先说参数。1960亿总参数,用的是MoE(稀疏混合专家)架构。MoE的好处是,虽然总参数多,但每次推理只激活一部分专家网络…
-
国产具身大模型Wall-OSS-0.5开源:预训练完直接上机器人,不用微调
国产具身智能最近有个大动作:自变量机器人开源了一个叫Wall-OSS-0.5的VLA模型,核心特性就一句——预训练完直接上机器人,不用微调。 这句话什么意思?以前做机器人AI,需要针对每个具体任务去微调模型。捡杯子做一个微调,开门又做一个微调,效率很低。Wall-OSS-0.5的零样本部署能力,意味着你拿预训练好的模型,直接丢到真实机器人上,它就能干活。 官方给的数据显示,在同…
-
字节开源Lance 3B:统一多模态大模型,小身材大能量
核心看点 字节跳动开源了Lance 3B——一款统一多模态大模型。虽然只有3B参数,但在多模态任务上表现出色,证明了小模型+好架构也能打出漂亮仗。 详细解析 Lance 3B的核心特点: 统一架构:单一模型处理文本、图像等多种模态,简化了多模态AI的开发流程 轻量级:3B参数规模,部署成本低,适合边缘设备和中小型应用 开源开放:字节选择开源,有助于吸引开发者社区参与迭代 多模态…
-
字节开源Lance 3B:统一多模态大模型,小身材大能量
核心看点 字节跳动开源了Lance 3B——一款统一多模态大模型。虽然只有3B参数,但在多模态任务上表现出色,证明了小模型+好架构也能打出漂亮仗。 详细解析 Lance 3B的核心特点: 统一架构:单一模型处理文本、图像等多种模态,简化了多模态AI的开发流程 轻量级:3B参数规模,部署成本低,适合边缘设备和中小型应用 开源开放:字节选择开源,有助于吸引开发者社区参与迭代 多模态…
-
美团开源LongCat数字人视频模型:10秒视频1分钟生成,击败主流闭源
美团龙猫团队开源了商用级数字人视频生成模型LongCat-Video-Avatar1.5,生成10秒视频只要约1分钟,而且效果全面超过主流闭源模型。 三大升级: 嘴型更准:音频编码器从Wav2Vec2换成Whisper-large,发音节奏和音素变化捕捉更细腻 手不崩了:引入GRPO技术,解决数字人视频里常见的手部畸形和动作不连贯问题 速度快15倍:采用DMD技术,推理效率大幅…
-
Cursor发布Composer2.5编码模型:以极低成本并肩GPT-5.5与Opus4.7
Cursor最近发布了 Composer2.5,这是他们最新的AI编程模型。成绩单很吓人:性能跟GPT-5.5和Opus 4.7打平,但成本不到1美元——而对手们要价11美元左右。 十倍的差价,差不多的效果。这要是真的,整个AI编程工具行业的定价逻辑都得重写。 核心看点 基于Kimi K2.5:Composer2.5基于Moonshot的Kimi K2.5检查点构建,底子很硬 …
-
蚂蚁百灵开源Ring-2.6-1T:万亿参数思考模型,推理强度可调
核心看点 蚂蚁集团百灵大模型正式开源万亿级旗舰思考模型 引入可调节Reasoning Effort机制,支持high与xhigh两种推理强度 high模式适合Agent工作流,xhigh模式适合数学/科研等高难任务 已上架Hugging Face和ModelScope 详细解析 5月16日,蚂蚁集团旗下百灵大模型宣布开源Ring-2.6-1T——一款面向真实复杂任务场景打造的万…
-
马斯克发布编程智能体Grok Build,正面硬刚Anthropic和Cursor
核心看点 xAI 推出首个专业编程 AI 智能体 Grok Build,定位开发者市场 目前仅限 SuperGrok Heavy 订阅用户使用,可通过 x.ai/cli 访问 AI 编程赛道竞争白热化:Anthropic、OpenAI、Cursor、阿里云纷纷入局 马斯克的 xAI 终于向开发者生态出牌了——发布了一款叫 Grok Build 的 CLI 编程工具。 这名字挺直…
-
Mininglamp开源Cider和Mano-P:让你的Mac秒变私有AI工作站
Mininglamp(明略科技)最近开源了两个非常实用的本地AI项目——Cider和Mano-P。这两个工具组合在一起,能让你的Mac变成一个真正的私有AI工作站,不用联网、不用上传数据,所有AI计算都在本地完成。 先说Cider。这个工具专门针对苹果M系列芯片做了深度优化,可以大幅提升大语言模型(LLM)和视觉语言模型(VLM)在Mac上的推理速度和效率。用过本地大模型的都知…
-
腾讯开源多模态深度搜索Agent方案OpenSearch-VL:让AI学会搜索+推理
腾讯混元联合多所高校发布了一个很有意思的开源项目——OpenSearch-VL。这是一个多模态深度搜索智能体的完整方案,简单理解就是:它能让AI学会像人一样{LQ}先搜索、再思考、最后回答{RQ}。 现在的AI大模型虽然能回答问题,但很多时候靠的是训练时{LQ}记住{RQ}的知识,遇到新问题或者需要查证的信息就容易瞎编。OpenSearch-VL要解决的就是这个问题:它能让AI…
