• 阿里发布数字员工QoderWake:代号”数字程序员”,根因分析从30分钟缩至2分钟

    阿里今天扔出了一颗重磅炸弹——数字员工产品 QoderWake 正式发布。阿里官方称其为”业界首个安全可控、持续进化的生产级数字员工产品”,而且已经在自家内部验证过了。 核心看点 业界首个生产级数字员工,能在真实工作中承担软件工程师、运营、分析师等岗位 ” 数字程序员”已实现全流程无人值守:反馈分类→日志分析→根因定位→自动生成修…

    应用 3小时前
  • 2.69万元起!宇树科技发布双臂人形机器人,支持多款灵巧手

    人形机器人的价格底线又被刷新了。宇树科技今天正式发布了一款双臂人形机器人,起售价仅 2.69 万元——这个价格,比不少消费级外骨骼设备还便宜。 核心看点 起售价仅2.69万元,主打上半身双臂操作 配备视觉双目算力模组,支持15~31自由度 头部模组算力达10TOPS,机身和头部各配置8核CPU 末端可更换双指、三指、五指等不同灵巧手执行器 可选固定底座或移动底盘版本 宇树这次发…

    应用 3小时前
  • 蚂蚁百灵万亿级大模型Ling-2.6-1T正式开源:1万亿参数,主打”快思考”

    蚂蚁集团旗下的百灵大模型迎来重大动作——Ling-2.6-1T 正式开源!这不是一个”为了大而大”的参数怪物,而是一头真正能打”实战”的万亿级综合旗舰模型。 核心看点 1万亿参数规模,采用MLA与Linear Attention混合架构,兼顾性能与效率 主打”快思考”策略,通过抑制过程冗余的强化奖励机制压缩…

    模型框架 3小时前
  • 苹果发布AI推理框架LaDiR:突破单一思维,让AI同时探索多条解题路径

    核心看点 并行推理机制:LaDiR让AI在回答问题前同时启动多条独立的推理路径,从随机噪声开始逐步优化,最后选出最佳答案 扩散+自回归混合架构:推理阶段使用扩散模型并行探索,最终输出阶段使用自回归模型保证连贯性 多样性鼓励机制:框架内置特殊机制防止所有路径过早收敛于同一结论,确保每条路径探索不同解题思路 实测表现优异:在LLaMA 3.1 8B和Qwen3-8B-Base上部署…

    模型框架 9小时前
  • 蚂蚁集团百灵大模型Ling-2.6-flash正式开源:104B参数,推理速度340 tokens/s

    核心看点 104B总参数-7.4B激活参数:采用混合线性架构,推理速度在4卡H20条件下最快达340 tokens/s,Prefill吞吐达Nemotron-3-Super的2.2倍 极致Token效率:在Artificial Analysis评测中,仅消耗15M tokens完成评测,约为同类模型的1/10,大幅降低商用成本 多精度版本开源:同步提供BF16、FP8、INT4…

    开源项目 9小时前
  • 英伟达发布Nemotron 3 Nano Omni全模态模型:30B-A3B MoE架构,推理吞吐量暴涨9倍

    核心看点 全模态统一:Nemotron 3 Nano Omni将视频、音频、图像和文本推理集成于单一模型,替代传统碎片化的视觉-语音-语言模型链 30B-A3B混合MoE架构:结合Mamba层(提升序列与内存效率)和Transformer层(精准推理),内存和计算效率最高提升4倍 吞吐量9倍领先:在视频推理任务中,相比其他开源全模态模型,有效系统容量最高提升约9.2倍;多文档推…

    模型框架 9小时前
  • AI 编程狂潮压垮 GitHub:平台启动底层重构,未来规模可能暴涨 30 倍

    AI 编程和智能体的普及正在让 GitHub 经历一场前所未有的增长风暴——但暴风中心的平台却有些撑不住了。 核心看点 GitHub 增长超预期:2025 年 AI 编程热潮推动使用量爆发,预计未来规模将达当前的 30 倍 平台频发故障:过去数月多次重大宕机,知名项目 Ghostty 已决定迁移出走 启动底层重构:GitHub 团队正在重构基础设施,优先级排定为:可用性 > 容…

    行业/好文 16小时前
  • 英伟达发布 Nemotron 3 Nano Omni 全模态模型:30B-A3B 混合 MoE,吞吐量飙升 9.2 倍

    英伟达近日宣布推出 Nemotron 3 Nano Omni,一款面向企业级 AI Agent 平台的开源全模态推理模型,可将视频、音频、图像和文本的多模态推理集成于单一模型中,替代传统碎片化的多模型链方案。 核心看点 30B-A3B 混合 MoE 架构:结合 Mamba 层(高效序列处理)与 Transformer 层(精准推理),计算效率最高提升 4 倍 吞吐量碾压级表现:…

    模型框架 16小时前
  • 蚂蚁集团百灵大模型开源 Ling-2.6-flash:104B参数仅激活7.4B,推理速度最高340 tokens/s

    蚂蚁集团旗下百灵大模型今日宣布正式开源 Ling-2.6-flash,这是一款总参数量 104B、激活参数仅 7.4B 的 Instruct 模型,以极低的推理成本实现了令人瞩目的性能表现。 核心看点 104B 总参、7.4B 激活:采用混合专家(MoE)架构,大幅降低推理资源需求 推理速度达 340 tokens/s:在 4 卡 H20 环境下实现极速推理,Prefill 吞…

    模型框架 16小时前
  • 通用汽车放大招:400万辆汽车将接入谷歌Gemini AI助手

    通用汽车和谷歌又来整活了!当地时间4月28日,通用汽车正式宣布,将为美国市场约400万辆2022款及更新的凯迪拉克、雪佛兰、别克、GMC车型推送谷歌Gemini AI助手。这可不是小打小闹,而是Gemini在汽车行业规模最大的一次部署。## 核心看点- 覆盖400万辆车,涉及凯迪拉克、雪佛兰、别克、GMC四大品牌- 车型范围:2022款及更新的车型- 联动车载谷歌服务 + On…

点击查看更多