-
英伟达发布Jetson优化指南:量化Qwen3 8B可省10GB内存,边缘AI部署门槛大降
英伟达4月20日发布了一份针对边缘设备AI部署的详细优化指南,通过在NVIDIA Jetson平台上的多层优化,最高可释放约12GB内存,让大模型在边缘设备上运行不再是难题。 核心看点 系统层优化:禁用图形桌面界面最高释放865MB内存,关闭非必要网络服务再节省约32MB 内核层调优:针对Jetson Orin系列调整Carveout保留区域可回收约68MB物理内存,利用硬件I…
-
字节跳动Seedance 2.0 API上线原生1080P视频生成:AI视频进入商用时代
字节跳动在AI视频生成领域又放了一个大招。4月21日,在AI创新巡展·成都站上,火山引擎宣布Seedance 2.0 API服务现已支持1080P全高清视频生成。 核心看点 原生1080P生成:该能力为模型原生能力,可直接在1080P分辨率下完成画面构建,画面细节密度与光影层次显著提升,不再依赖超分处理 影视级细节还原:在真人剧与漫改等影视场景中,人物五官、皮肤质感、骨相轮廓以…
-
华为首款鸿蒙AI眼镜发布:2499元起,支持HDR Vivid拍摄与声纹支付
华为终于入局AI眼镜赛道了。4月20日,在Pura系列及全场景新品发布会上,华为首款鸿蒙AI眼镜正式亮相,售价2499元起。 核心看点 首款支持拍摄的AI眼镜:搭载1200万像素超感光摄像头,配备1/2.8英寸大底传感器,业内首款支持HDR Vivid拍照标准,照片分辨率可达4096×3072,最高支持录制1920×1440/30fps视频 0.7秒AI闪拍:具备超清晰AI闪拍…
-
单张图片生成可行走3D世界!NVIDIA开源Lyra2.0,解决长视频空间遗忘和时间漂移难题
核心看点:NVIDIA Research 发布 Lyra 2.0 框架,从单张图像即可生成可自由探索的 3D 场景,同时解决了长视频生成中的空间遗忘和时间漂移问题,具有广泛的应用价值。 【核心创新】 Lyra 2.0 框架通过两大技术突破实现高质量长视频生成: • 空间记忆机制:维护 3D 几何信息,用于信息路由,避免几何误差积累,确保多帧生成的空间一致性 • 自增强训练策略:…
-
估值超百亿美元:国产大模型黑马DeepSeek开启首轮外部融资
核心看点:国产大模型黑马 DeepSeek 正式开启首轮外部融资,计划募集 3 亿美元,投后估值超 100 亿美元,标志着中国 AI 产业进入资源整合与商业化落地的新阶段。 【AiBase提要】 • DeepSeek 启动首次外部融资,计划募集 3 亿美元,投后估值超 100 亿美元• 由于研发成本增加和核心人才流失,DeepSeek 需要资本支持以维持竞争力• 全球 AI 领…
-
Claude推出Claude Design!一句话变交互原型+PPT+营销物料,还能一键打包给Claude Code开发
核心看点:Anthropic 推出全新实验性产品 Claude Design,通过文字描述、图片或文档即可生成专业级设计稿、交互原型等,极大降低非设计师创建视觉内容的门槛。 【AiBase提要】 • 支持文字、图片、文档等多种输入方式,实现对话即设计• 多格式导出并支持一键打包移交至 Claude Code 进行前端开发• 面向非设计师和设计师,加速创意到实现的流程 【核心能力…
-
阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系
核心看点:阿里通义实验室推出 Fun-ASR1.5 语音识别大模型,基于统一大模型架构,单模型覆盖 30 种语言、汉语七大方言及 20 余种地方口音,典型方言场景字错误率(CER)相对下降 56.2%。 【主要功能】 • 多语言支持:单模型覆盖 30 种语言• 方言识别:无缝支持汉语七大方言体系(东北/华北/吴/闽/粤/湘/客家),以及 20 余种地方口音,连古诗词吟诵也能精准…
-
阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系
核心看点:阿里通义实验室推出 Fun-ASR1.5 语音识别大模型,基于统一大模型架构,单模型覆盖 30 种语言、汉语七大方言及 20 余种地方口音,典型方言场景字错误率(CER)相对下降 56.2%。 【主要功能】 • 多语言支持:单模型覆盖 30 种语言• 方言识别:无缝支持汉语七大方言体系(东北/华北/吴/闽/粤/湘/客家),以及 20 余种地方口音,连古诗词吟诵也能精准…
-
荣耀人形机器人「闪电」破人类半马纪录夺冠:50分26秒完赛,全栈自研仅研发半年
北京亦庄的赛道上,荣耀自研人形机器人「闪电」以50分26秒跑完了半程马拉松。这个数字不仅拿下了赛事冠军,还超越了人类男子半马57分20秒的世界纪录。更夸张的是,荣耀派出的10支队伍全部晋级,包揽了赛事前三和前六名——而这款机器人的研发周期,只有半年。 核心看点 「闪电」机器人50分26秒完赛夺冠,超越人类男子半马世界纪录近7分钟 荣耀10支参赛队全部晋级,包揽赛事前三及前六名 …
-
阿里通义开源语音识别大模型Fun-ASR1.5:30种语言+汉语七大方言,古诗词吟诵也能精准转写
阿里通义实验室刚放出一款语音识别领域的「重磅炸弹」——Fun-ASR1.5。这款开源大模型用一套统一的架构,覆盖了30种语言、汉语七大方言体系及20多种地方口音。更离谱的是,连古诗词吟诵这种高难度场景,它也能精准转写。 核心看点 单模型统一架构,覆盖30种语言、汉语七大方言体系及20余种地方口音 典型方言场景字错误率(CER)相对下降56.2%,5种方言识别准确率突破90% 支…