4月16日,腾讯宣布混元3D世界模型2.0(HY-World 2.0)正式发布并开源。这标志着AI技术从单纯的对话、画图、生成物体,正式进化到了能够”造世界”的新阶段。
核心看点
- 多模态输入支持:可根据文字、图片、视频等不同类型输入,自动生成、重建和模拟完整的3D世界
- 游戏工作流无缝对接:直接输出可二次编辑的3D资产文件(Mesh/3DGS/点云),支持导入Unity、UE等主流引擎
- 角色自由探索:支持角色在生成的3D场景中自由漫游,具备物理碰撞效果,不限时间
- 真实场景复刻:输入真实空间视频或多视角图片,可构建高精度数字孪生空间
技术突破
相比前代版本,HY-World 2.0在模型架构上全面升级,画面精细度和真实感大幅提升。用户可自定义生成真实风、漫画风、游戏风等多种风格的3D空间。
技术亮点包括:
- 采用端到端隐式学习方案,无需相机参数即可生成360度全景
- 自研空间Agent技术,结合VLM与navmesh表征,智能规划漫游轨迹
- 精确的相机控制+细粒度视觉细节保持+空间一致性记忆机制
- 支持”环绕物体”、”最大漫游”等五类运镜轨迹
应用场景
该技术可广泛应用于游戏开发、室内装修预览、城市规划、文化遗产保护等领域。开发者只需输入一段文字或一张图片,即可一键生成风格多样的可漫游世界,显著降低游戏地图创作门槛。
项目已开源,开发者可通过GitHub获取代码和技术报告。
本文地址:https://www.163264.com/10915