核心看点:NVIDIA Research 发布 Lyra 2.0 框架,从单张图像即可生成可自由探索的 3D 场景,同时解决了长视频生成中的空间遗忘和时间漂移问题,具有广泛的应用价值。
【核心创新】
Lyra 2.0 框架通过两大技术突破实现高质量长视频生成:
• 空间记忆机制:维护 3D 几何信息,用于信息路由,避免几何误差积累,确保多帧生成的空间一致性
• 自增强训练策略:让模型接触自身生成的退化输出,主动纠正漂移,从根本上解决时间漂移难题
【应用场景】
• 机器人训练:快速生成多样化 3D 训练环境
• 游戏开发:加速 3D 资产生成管道
• 虚拟世界构建:从单张照片生成可探索的 3D 空间
【开源意义】
Lyra 2.0 已开源,代码和论文均已发布至 Hugging Face。研究者和开发者可访问以下链接获取详细内容:
• 论文地址:https://huggingface.co/papers/2604.13036
NVIDIA 通过开源 Lyra 2.0,进一步降低了 3D 生成技术的应用门槛,为 AI 在空间智能领域的发展提供了新的基础设施。
本文地址:https://www.163264.com/11012