腾讯混元3D世界模型2.0开源发布:AI从对话画图进化到造世界,无缝对接游戏引擎

腾讯今日宣布混元3D世界模型2.0(HY-World 2.0)正式发布并全面开源。这款多模态世界模型标志着AI能力从”对话”、”画图”、”捏物体”正式进化到”造世界”——能够生成包含人、物、景的完整3D世界。

核心看点

  • 多模态输入支持:文字、图片、视频均可作为输入,一键生成风格多样的可漫游3D世界
  • 直接输出可编辑3D资产:支持Mesh/3DGS/点云等多格式导出,与Unity、UE等游戏引擎无缝对接
  • 角色自由探索模式:用户可操作角色在生成场景中自由漫游,具备真实物理碰撞
  • 真实场景复刻能力:输入视频或多视角图片即可构建高精度数字孪生空间

技术架构升级

相比1.0版本,HY-World 2.0在模型架构上实现全面升级。画面精细度和真实感大幅提升,用户可自定义生成真实风、漫画风、游戏风等多种风格的3D空间。

模型采用端到端隐式学习方案,无需任何相机元数据即可从普通图片生成360度全景。配合真实全景照片和UE引擎合成数据的混合训练策略,保证了生成质量和泛化能力。

空间Agent智能漫游

混元2.0引入了自研的空间Agent技术,结合VLM与游戏自动寻路算法常用的navmesh表征,让大模型能够理解空间语义并智能规划漫游轨迹。模型会根据场景语义自动规划”环绕物体”、”最大漫游”等五类运镜轨迹,确保探索路径既自然又有趣。

应用场景展望

此次开源为多个领域带来变革可能:

  • 游戏开发:快速生成游戏地图和关卡原型,显著降低创作门槛
  • 数字孪生:室内装修预览、城市规划、文化遗产保护等场景的快速构建
  • 具身智能:为机器人训练提供可交互的仿真环境

参考链接:申请体验 | 开源代码 | 技术报告

本文地址:https://www.163264.com/10954

(0)
上一篇 2天前
下一篇 2天前

相关推荐