腾讯发布混元3D世界模型1.0，支持文字图片生成可交互3D场景

编辑：刘余欣 | 分类：快讯 | 2025年7月28日

加入映维网会员

混元3D世界模型 1.0

（映维网Nweon 2025年07月28日）在日前举行的2025世界人工智能大会腾讯论坛中，腾讯正式发布了混元3D世界模型 1.0，并宣布全面开源。从秒级生成单个3D资产，到一键打造可漫游的3D世界，这个开源可沉浸漫游、可交互、可仿真的世界生成模型将为VR等领域带来全新的可能性。

腾讯指出，即便是无建模经验的普通用户，通过混元 3D 创作引擎，仅需一句话或者一张图即可快速生成360度沉浸式视觉空间，而生成的场景可无缝导入Vision Pro等头显设备，带来沉浸式体验。

腾讯发布混元3D世界模型1.0，支持文字图片生成可交互3D场景

过去需要专业建模团队数周才能搭建的3D虚拟世界，现在利用混元3D世界模型 1.0，只需一句文字或一张图片，几分钟内即可生成。

腾讯表示：“这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型，为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除3D世界模型外，腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。作为此次发布的亮点之一，腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术，同时支持文字和图片输入，实现了高质量、风格多样的可漫游3D场景生成。”

混元3D世界模型1.0的核心同时在于其创新的「语意层次化3D场景表征及生成算法」。所述算法将复杂3D世界解构为不同语意层级，实现前景与背景、地面与天空的智能分离，不仅生成视觉效果逼真的整体场景，而且能输出标准化的3D Mesh资产，兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真，无缝衔接AIGC技术与传统CG工作流。与全球领先的开源模型相比，

团队指出，混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。腾讯混元正逐步构建完善的3D内容生成生态。混元旗舰模型TurboS自年初发布后，保持着每月一个版本的快速迭代，在代码、理科能力和复杂指令遵循方面都有明显提升，在全球大模型权威排行榜上稳居前列。

混元TurboS创新采用了前沿的混合线性注意力机制与MoE模型架构，是大模型研发前沿分支的重要代表，这也是业界首个基于混合线性注意力机制落地的超大规模MoE模型。

基于TurboS基座，混元T1进一步提升了推理能力，混元T1综合能力国内领先，在项目级代码生成、高难度数学推理、文本写作等方面都展现出不错的效果。

端到端语音模型混元Voice、多模态理解模型混元Vision基于混元大语言模型基座打造，继承了出色的理解、认知和推理能力。在多模态理解上，今年连续发布多款模型，在LMArena Vision全球大模型权威榜单中获得国内榜首。

除本次发布即开源的混元 3D世界模型 1.0，混元还将在月底开源一系列小尺寸模型，包含0.5B、1.8B、4B、7B混合推理模型，更轻量、好部署。

更多信息请访问这个页面。