刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎
8440点击    2026-04-16 11:14

我让龙虾鹅在原神地图里瞎蹦跶。


智东西4月16日报道,今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。作为一款多模态的世界模型,HY-World 2.0支持文字、图片和视频等形式输入,可自动生成、重建并模拟完整的3D世界。


对于游戏行业,HY-World 2.0支持直接输出可二次编辑的Mesh、3DGS或点云等资产,可无缝导入Unity、UE等引擎,用于快速构建游戏地图和关卡原型。


相比此前的HY-World 1.5只能生成一分钟视频,HY-World 2.0不仅支持可漫游3D空间,还能生成完整角色、建筑和场景资产,实现可用、可玩。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


▲输入“生成一个温馨的绘本风格小木屋”


一句话生成3D世界不再是难题,腾讯混元3D还新增了角色模式,用户可操作角色在街道、建筑、场景中自由探索,具备物理碰撞效果。就像在游戏里一样,游戏角色可以自由穿行在生成的3D场景中。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


▲角色模式下,用户可以操作角色自由探索


与此同时,HY-World 2.0在场景完整度(物体侧面和背面)及对输入图片的遵循程度上表现更优,同样适合具身智能仿真等场景。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


对此,智东西也体验了一番,一起来看看效果如何。


在线体验:


https://3d.hunyuan.tencent.com/sceneTo3D


开源代码:


https://github.com/Tencent-Hunyuan/HY-World-2.0


技术报告:


https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf


原神、生化危机双场景复刻


角色自由漫步实感十足


首先我对文生和图生场景这个功能进行了初步体验,在操作上非常简单,输入提示词或图片,点击“立即生成”即可。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


提示词:“生成一个原神风格的空中花园迷宫,包含高低错落的平台、曲折的楼梯、藤蔓悬挂的桥梁,阳光透过彩色玻璃洒在花园中,中央有喷泉和小桥流水,整个空间充满幻想感。”


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


可以看到,无论是纵深场景的表现,还是楼梯、桥梁、彩色玻璃等细节,都有很好的还原。值得注意的是,我选定的角色还可以在生成的3D世界中自由漫步。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


角色在楼梯和桥梁等区域,均具备物理碰撞感和移动形态,走上去或走下去都自然流畅,可以测试空间结构。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


不过,受限于该场景可活动的区域过小,角色仅能在有限的范围内移动。当我选择将角色大小进行调整后,以第三人称的角色视角可以观察到该场景的更多细节。


紧接着,我们尝试以图片作为参考,生成的场景也大体保持整体一致。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


但在画质和细节表现上与文字生成结果近似,不够细腻、质感不强,这可能与网页端显示和渲染分辨率有关。


带着这个问题,我们接着尝试了视频和多视角图片的输入。


在视频参考部分,我选用了一段《生化危机》的实况视频,主人公沿街道直行。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


▲《生化危机》的实况视频


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


可以看到,模型能捕捉角色的运动轨迹,以及街道两侧的布景,路过的路人也有所呈现,但整体对3D世界的还原仍不够完整。


相比之下,多视角图片测试表现更出色。我直接使用了自带的32张三层屋檐建筑素材,模型复刻建筑外型和层级结构的效果非常惊艳。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


▲多视角图片素材


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


可以看到,建筑的细节和层次感都被很好保留,整体感很明显。


草图、文字、视频都能造世界


端到端生成360°全景


在HY-World 2.0中,输入一张草图、一段文字或一段视频,都可以快速生成连贯的3D世界。


而实现这一功能的技术要点在于,HY-World 2.0以3D为主轴,统一空间理解、生成和重建,将复杂的语义和结构自动转化为完整空间


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎




混元团队还通过真实全景照片和UE合成数据进行混合训练,保证生成质量和泛化能力。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


路径智能规划


让角色自由漫游


生成全景后,角色路径规划也是一大难题。模型结合自研空间Agent技术和Navmesh表征,实现了角色漫游路径的智能规划。


根据不同场景的语义,模型可规划出包括环绕物体、最大漫游在内的五类运镜轨迹,确保覆盖场景中关键区域,同时避免穿墙或跑飞。


借助规划好的轨迹和世界扩展,角色在生成的3D场景中能够自然漫游,路径流畅且符合空间逻辑。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


新视角生成


保证空间衔接与画面连贯


在扩展场景时,模型是如何确保新生成区域与原有空间在几何和视觉上完美衔接、不出现“穿帮”的?


其核心创新包括精确的相机控制细粒度视觉细节保持以及空间一致性记忆机制


结合记忆力机制设计及体系化的中间训练与后训练,混元团队打造出迄今业内最强的HY-WorldStereo新视角生成(NVS)模型


生成画面对输入相机实现精准跟随,多条运镜的生成结果保持空间一致、不产生冲突,并且后训练算法能够在快速扩展新区域的同时,保证画面质量不衰减。


刚刚,腾讯最新世界模型开源!一句话造出3D世界,兼容游戏引擎


最终,所有生成片段通过HY-WorldMirror 2.0整合为一个统一、可交互的3D世界。


借助定制的Depth Alignment和自适应Mask Gaussian优化算法,生成场景采用3D高斯泼溅(3DGS)表示,同时可导出高质量Mesh,直接无缝导入Unity、UE等主流游戏引擎,进行二次编辑和创作。


结语:AI造世界,更进一步


从首个开源的3D世界模型HY-World 1.0,到可实时在线交互的HY-World 1.5,再到HY-World 2.0的发布,这一系列迭代进一步拉近了AI在游戏开发、虚拟仿真等行业的落地距离。


相比过去只能生成短视频或静态模型,HY-World 2.0提供了真正可漫游、可交互、可二次编辑的3D世界,显著降低地图原型和关卡设计门槛。


随着国内外团队如李飞飞World Labs开源Spark 2.0渲染器等进展,AI世界模型正在从概念验证走向产业应用,未来在游戏、文化保护、城市规划、室内设计等场景的应用潜力巨大。


文章来自于微信公众号 "AI应用风向标",作者 "AI应用风向标"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0