视频

  • AI日报:Seedance2.5视频模型发布、Vidu Q3上线华为云、百川M4医疗模型亮相

    今天AI圈有几条值得关注的动态,集中在模型发布和视频生成领域。 1、火山引擎发布豆包Seedance2.5视频模型 Seedance2.5实现了30秒单段原生视频直出,支持50个全模态素材联合生成。同步发布的还有Seedream5.0 Pro(交互式精准编辑+可编辑分层设计图)和Seed-Audio 1.0(多角色对白+拟音特效零样本生成)。 火山引擎方舟大模型服务用户已超11…

    2026年6月24日
  • 生数Vidu Q3正式上线华为云:16秒声画同步,影视级AI视频生成走进「为剧而生」

    6月23日,AI视频圈迎来一记重磅——生数科技Vidu Q3多模态大模型正式上线华为云,定位”为剧而生”,直接把影视级AI视频生成的门槛砍到了大众应用级。这是继阿里通义万相、快手可灵、字节Seedance之后,国产AI视频模型的又一个”打到商用”的选手。 核心看点 16秒声画同步生成:Vidu Q3支持单段16秒视频+音频同步直出…

    应用 2026年6月23日
  • AI日报:阿里视频模型升级、豆包试水网约车、三星12万员工接入ChatGPT

    欢迎来到今天的AI日报,来看看最近AI圈又发生了哪些大事。 1. 阿里发布HappyHorse 1.1视频生成模型 阿里巴巴发布了HappyHorse 1.1视频生成模型,这次是多维度系统性升级,包括动态表现力、主体一致性、指令遵循、视觉质感和音频能力等方面。 简单来说,视频更流畅了,画面更连贯了,声音也更同步了。 2. 字节豆包灰测网约车服务 字节跳动旗下豆包APP在北京、杭…

    2026年6月23日
  • 阿里巴巴发布HappyHorse 1.1视频生成模型:多维度系统性升级,AI影视创作进入新纪元

    2026年6月22日,阿里巴巴正式发布其自研原生多模态AI视频生成大模型——HappyHorse 1.1。这款模型在1.0版本基础上,围绕动态表现力、主体一致性、指令遵循、视觉质感和音频能力五大维度进行了系统性深度优化,显著提升了视频生成的整体性能、可控性和用户体验,为短剧制作、电商广告、品牌营销、游戏CG以及专业内容创作等领域带来了革命性工具。 HappyHorse是阿里巴巴…

    2026年6月22日
  • 字节Seedance 2.0 Mini上线:单秒成本砍半,速度翻倍,电商素材生产可以更放肆

    做电商的老板们有福了——字节跳动火山引擎今天正式上线了 Seedance 2.0 Mini 视频生成模型。这个 Mini 版不是「阉割版」,是专门为「大批量、低成本」场景设计的「效率怪兽」。 两个最关键的数字 第一,成本。Mini 版的单秒视频生成成本降到 0.5 元人民币,是原版 Seedance 2.0 的一半左右。这意味着什么?以前你花 100 块能生成 30 秒广告视频…

    应用 2026年6月16日
  • 字节Seedance 2.0 Mini上线:比原版便宜30%,速度快2倍,Pro用户再省33%

    字节跳动的视频生成模型又添新成员了——Seedance 2.0 Mini,主打便宜和快。 Mini版和原版差在哪 三个关键数字: 价格便宜约 30%:API 定价大约 $0.073/秒,一条 30 秒广告视频成本约 $2.19 速度是 Seedance 2.0 Fast 版的 2 倍 画质和 Fast 版差不多,这点不缩水 说白了,Mini 就是给那些对画质要求没那么极致、但对…

    2026年6月16日
  • LobsterAI接入四大图像视频模型:一个平台搞定Seedream、Seedance、HappyHorse、MiniMax-Hailuo

    核心看点: 一次性接入Seedream、Seedance、HappyHorse、MiniMax-Hailuo四大主流模型 多模型矩阵联动,降低开发者和创作者调用多模态AI的门槛 覆盖图片生成和视频生成两大领域 做内容创作的人有个痛点:不同AI画图和视频工具各有优劣,换来换去很麻烦。LobsterAI的新动作就是解决这个问题——把四大主流图像视频生成模型整合到一个平台里。 四大模…

    应用 2026年6月1日
  • Google Gemini Omni登场:首个”万物生万物”模型,视频创作进入新纪元

    Google Gemini Omni登场:首个”万物生万物”模型,视频创作进入新纪元 核心看点:Google DeepMind正式发布Gemini Omni——一个能”从任意内容生成任意内容”的生成式模型,首发支持视频生成。这标志着生成式AI从”文本生图片/视频”的单向模式,正式迈入”任意模态互…

    Google Gemini 2026年5月23日
  • 谷歌Gemini Omni发布:一句话让AI改视频,全模态转换成现实

    核心看点 谷歌在2026 I/O大会发布Gemini Omni,宣称能”从任何输入生成任何输出” 首款模型Gemini Omni Flash聚焦视频领域,支持对话式编辑 用户可通过自然语言指令实时修改视频中的角色、场景、背景 物理一致性引擎确保生成内容符合真实物理规律 详细解析 在2026年Google I/O开发者大会上,谷歌正式推出Gemini Om…

    Google Gemini 2026年5月23日
  • 美团开源LongCat数字人视频模型:10秒视频1分钟生成,击败主流闭源

    美团龙猫团队开源了商用级数字人视频生成模型LongCat-Video-Avatar1.5,生成10秒视频只要约1分钟,而且效果全面超过主流闭源模型。 三大升级: 嘴型更准:音频编码器从Wav2Vec2换成Whisper-large,发音节奏和音素变化捕捉更细腻 手不崩了:引入GRPO技术,解决数字人视频里常见的手部畸形和动作不连贯问题 速度快15倍:采用DMD技术,推理效率大幅…

    开源项目 2026年5月22日