单张图片生成可行走3D世界!NVIDIA开源Lyra2.0,解决长视频空间遗忘和时间漂移难题

核心看点:NVIDIA Research 发布 Lyra 2.0 框架,从单张图像即可生成可自由探索的 3D 场景,同时解决了长视频生成中的空间遗忘和时间漂移问题,具有广泛的应用价值。

【核心创新】

Lyra 2.0 框架通过两大技术突破实现高质量长视频生成:

• 空间记忆机制:维护 3D 几何信息,用于信息路由,避免几何误差积累,确保多帧生成的空间一致性

• 自增强训练策略:让模型接触自身生成的退化输出,主动纠正漂移,从根本上解决时间漂移难题

【应用场景】

• 机器人训练:快速生成多样化 3D 训练环境
• 游戏开发:加速 3D 资产生成管道
• 虚拟世界构建:从单张照片生成可探索的 3D 空间

开源意义】

Lyra 2.0 已开源,代码和论文均已发布至 Hugging Face。研究者和开发者可访问以下链接获取详细内容:

• 论文地址:https://huggingface.co/papers/2604.13036

NVIDIA 通过开源 Lyra 2.0,进一步降低了 3D 生成技术的应用门槛,为 AI 在空间智能领域的发展提供了新的基础设施。

本文地址:https://www.163264.com/11012

(0)
上一篇 5小时前
下一篇 3小时前

相关推荐