分享最实用的AI相关的开源项目

小红书开源BigMac：把多模态训练的显存与速度，从二选一中解放出来

多模态大模型训练长期存在一个让人头疼的矛盾：想省显存就得慢，想快就得烧显存。小红书开源的新方案BigMac，试图把这个问题从”二选一”变成”我全都要”。 BigMac的核心是一套多模态流水并行训练新范式。简单说，它通过一种叫准依赖安全的嵌套流水线设计，重新编排了训练过程中数据和模型的计算顺序，让GPU在同样的时间内干更多的活，还不…

开源项目 2026年7月23日

大模型

2.8万亿参数、100万词元上下文，Kimi K3把开源大模型的天花板顶到了全球最高

2026年7月16日，就在2026世界人工智能大会（WAIC 2026）开幕前夕，月之暗面（Moonshot AI）突然投下一枚”模型核弹”——正式发布新一代旗舰模型 Kimi K3。这款拥有 2.8万亿参数的模型，不仅是目前全球参数规模最大的开源大模型，更是开源阵营首次在体量上正面击穿闭源旗舰的”心理防线”。一、2.8万亿参…

2026年7月19日

开源项目

小米开源380亿参数具身大模型Xiaomi-Robotics-U0：生成效率提升83倍，拿下全球评测第一

小米在机器人领域放了个大招。 7月15日，小米正式发布并全量开源了380亿参数的多模态自回归具身生成基础模型 Xiaomi-Robotics-U0。这是行业首个能统一覆盖四类核心具身生成任务的一体化方案，打破了以往机器人场景、轨迹、视频生成模型各自为政的局面。四大能力一体化这个模型同时承载了四项能力：具身场景生成具身轨迹迁移机器人交互视频生成通用文生图与图像编辑它…

2026年7月16日

蚂蚁集团开源Avernet：多智能体协作有了新基础设施

蚂蚁集团最近开源了 Avernet V0.1，这是一个专门解决多智能体协作问题的项目。如果你正在做多个AI Agent协同工作的系统，这个项目值得关注。为什么需要Avernet？现在的AI应用越来越复杂，单个Agent往往搞不定。但多个Agent协作时，又面临一堆问题：怎么通信？怎么分工？怎么达成共识？ Avernet 的定位就是解决这些”协作层”的…

开源项目 2026年7月7日

Skill-Omni：让AI Agent真正看懂图片的开源框架

AI Agent 处理视觉任务一直是个难题。传统方式是让模型直接看图，但效果往往不理想。Skill-Omni 换了个思路——把视觉经验转化为可复用的技能。视觉经验资产化 Skill-Omni 的核心创新在于将视觉信息转化为结构化的经验资产。不是让AI每次从零开始理解图片，而是把常见的视觉模式、标准、规范沉淀为可复用的Skill。举个例子，如果你让AI检查产品设计图是否符合品…

开源项目 2026年7月7日

开源项目

百度开源3B模型Unlimited OCR：5天Star破万，刷新长文档解析纪录

百度最近开源了一个叫Unlimited OCR的模型，刚上线5天，GitHub Star就破万了。在AI开源项目里，这个速度相当惊人。更关键的是，它解决了一个很实在的问题：长文档解析。 OCR不新鲜，但长文档OCR很头疼 OCR（光学字符识别）技术已经存在很多年了。你把一张照片里的文字提取出来，现在的技术基本都能做到。但问题是，现实场景中的文档往往很长——一本电子书、一份几十…

2026年6月29日

模型变小，能力不减：新浪VibeThinker-3B开源，AI推理迎来轻量化新思路

大模型一定要”大”才好用吗？新浪最近开源的VibeThinker-3B给出了一个让人意外的答案——这个只有30亿参数的小模型，在数学、编程等高难度任务上，居然能跟那些几百亿参数的”大块头”掰掰手腕。小模型，大能量 VibeThinker-3B最吸引人的地方，是它的性价比。参数规模只有30亿，但在多个基准测试中的表现却相当亮眼。…

开源项目 2026年6月29日

开源项目

京东开源全球首个全栈视觉交互模型，AI终于能”边看边说”了

京东最近搞了个大动作——正式开源了JoyAI-VL-Interaction实时视频视觉语言交互模型。这玩意儿号称全球首个全栈开源的视觉交互模型，连整套部署系统都一并放出来了。传统AI的痛点：太被动了现在市面上的多模态模型基本都是”你问我答”的模式，用户不提问，AI就傻站着。这种被动式交互在实时监控、直播讲解这些场景里根本不够用。 JoyAI的三大革新…

2026年6月23日

小米开源全屋智能AI方案Miloco 2.0：终于有个AI管家会主动伺候你了

小米开源全屋智能AI方案Miloco 2.0：终于有个AI管家会”主动”伺候你了你有没有过这种体验：大半夜躺在床上，突然想关客厅的灯，但APP打开要加载半天，输密码又麻烦，最后算了，懒得关，凑合睡。或者更糟——家里有老人小孩，但智能家居系统像个木头人，必须得喊它、按它、戳它才动。你不主动操作，它就装死。小米最近正式发布并开源了一套新方案——Xiao…

开源项目 2026年6月22日

开源项目

小米发布并开源Xiaomi Miloco 2.0：接入OpenClaw！让AI掌控全屋智能

小米刚刚在GitHub上完整开源了全屋智能方案 Xiaomi Miloco 2.0，基于自研的MiMo大模型打造。相比初代，这次完成了底层逻辑重构——从传统的”如果A则执行B”规则触发，升级为具备自主推理能力的家庭智能体。简单说就是：以前你要一条条写自动化脚本，现在它自己就能学会你的习惯。几个核心能力：识人：通过摄像头识别家庭成员，记住每个人对灯光…

2026年6月20日