腾讯混元3D世界模型2.0开源:AI从’对话’进化到’造世界’

4月16日,腾讯宣布混元3D世界模型2.0(HY-World 2.0)正式发布并开源。这标志着AI技术从单纯的对话、画图、生成物体,正式进化到了能够”造世界”的新阶段。

核心看点

  • 多模态输入支持:可根据文字、图片、视频等不同类型输入,自动生成、重建和模拟完整的3D世界
  • 游戏工作流无缝对接:直接输出可二次编辑的3D资产文件(Mesh/3DGS/点云),支持导入Unity、UE等主流引擎
  • 角色自由探索:支持角色在生成的3D场景中自由漫游,具备物理碰撞效果,不限时间
  • 真实场景复刻:输入真实空间视频或多视角图片,可构建高精度数字孪生空间

技术突破

相比前代版本,HY-World 2.0在模型架构上全面升级,画面精细度和真实感大幅提升。用户可自定义生成真实风、漫画风、游戏风等多种风格的3D空间。

技术亮点包括:

  • 采用端到端隐式学习方案,无需相机参数即可生成360度全景
  • 自研空间Agent技术,结合VLM与navmesh表征,智能规划漫游轨迹
  • 精确的相机控制+细粒度视觉细节保持+空间一致性记忆机制
  • 支持”环绕物体”、”最大漫游”等五类运镜轨迹

应用场景

该技术可广泛应用于游戏开发、室内装修预览、城市规划、文化遗产保护等领域。开发者只需输入一段文字或一张图片,即可一键生成风格多样的可漫游世界,显著降低游戏地图创作门槛。

项目已开源,开发者可通过GitHub获取代码和技术报告。

本文地址:https://www.163264.com/10915

(0)
上一篇 18小时前
下一篇 6小时前

相关推荐