首页资讯

腾讯混元亮相WAIC 2025,发布3D世界模型及系列开源模型

时间:2025-07-27 16:30 作者:南斗之主

腾讯混元亮相WAIC 2025,发布3D世界模型及系列开源模型

7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。

除3D模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。

混元3D世界模型 1.0:一句话创造可漫游的3D世界

作为此次发布的亮点之一,腾讯混元3D世界模型1.0融合了全景图像合成与分层3D重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。过去需要专业建模团队数周才能搭建的3D虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。

混元世界模型1.0应用概览(VR,游戏开发,场景编辑,物理仿真等)

对游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程,只需输入“一座中世纪城堡,城堡塔楼宏伟壮阔,城堡周围是一座石头雕像,石头铺成的路以及美丽的花朵,卡通风格”等简单指令,模型即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。

(生成界面演示:生成3D场景资产可二次编辑)

(文生 3D 漫游场景效果展示:炽热的岩浆形成河流,在黑色熔岩的地表上流动,蒸汽雾霭)

对于无建模经验的普通用户,混元3D世界模型同样友好易用,通过混元 3D 创作引擎,仅需一句话或者一张图即可快速生成360°沉浸式视觉空间,生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验。

(VR应用场景效果展示)

混元3D世界模型1.0的核心还在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真,无缝衔接AIGC技术与传统CG工作流。


(游戏开发应用展示)

(物理仿真应用展示)

与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界,腾讯混元正逐步构建完善的3D内容生成生态。

混元基座模型持续进化,综合能力全球领先

腾讯混元的模型迭代正在悄悄加速。

混元旗舰模型TurboS自年初发布后,保持着每月一个版本的快速迭代,在代码、理科能力和复杂指令遵循方面都有明显提升,在全球大模型权威排行榜上稳居前列。混元TurboS创新采用了前沿的混合线性注意力机制与MoE模型架构,是大模型研发前沿分支的重要代表,这也是业界首个基于混合线性注意力机制落地的超大规模MoE模型。

基于TurboS基座,混元T1进一步提升了推理能力,凭借架构创新和扎实的工程能力,混元T1综合能力国内领先,在项目级代码生成、高难度数学推理、文本写作等方面都展现出不错的效果。

端到端语音模型混元Voice、多模态理解模型混元Vision基于混元大语言模型基座打造,继承了出色的理解、认知和推理能力。尤其在多模态理解上,今年连续发布多款模型,在LMArena Vision全球大模型权威榜单中获得国内榜首,在中文能力上稳居全球第一梯队。

混元在多模态生成方面布局全面,具备超高速生成高清图的实时生图能力和人物一致性可控的视频生成能力。3D生成能力全球领先,最新混元 3D 2.5 模型质感大幅提升,在上海人工智能实验室6 月评测中评测排名全球第一。同时,腾讯混元大模型在生产场景中也展现了巨大价值。全球首个AI设计智能体Lovart已首选调用混元3D模型的API接口,知名3D打印公司拓竹科技旗下的模型平台MakerWorld也已接入混元3D模型。

全面拥抱开源,共建社区生态

在会上,腾讯混元进一步明确了其全面拥抱开源的路线。

据介绍,除本次发布即开源的混元 3D 世界模型 1.0,混元还将在月底开源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更轻量、好部署。在LMArena Vision榜单拿下国内第一的多模态理解模型混元-large-vision,以及专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等也将于近期对外开源。

前不久腾讯开源的企业级混合推理大语言模型混元-A13B,在总参数80B、激活参数仅13B的情况下,效果比肩同等架构的领先开源模型,同时推理速度更快,性价比更高。该模型因其在效率和性能上的平衡,发布后在Hugging Face社区获得了较高的关注度,开源仅 3 天,就拿下模型趋势榜的第二名。

混元还开放了完整多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和 3D 生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量分别达到 1400 和 1600 个,混元3D系列模型社区下载量超过 230 万,已成为全球最受欢迎的3D开源模型。

腾讯混元 3D 世界模型 1.0:

l Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

l 项目主页:https://3d-models.hunyuan.tencent.com/world/

l 体验地址:https://3d.hunyuan.tencent.com/sceneTo3D

l Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

Top

1、菜鸡互啄?泰国柬埔寨“打烂仗”,但无人机作战水平比美国还高!

2、俄罗斯其实是三个概念构成,俄罗斯其实是三个概念构成的

3、马斯克转发懂车帝测试:我们取得了最高成绩,马斯克的车

小编推荐

当前文章:http://m.sichuan-zkha.cn/VUN/detail/ikeeql.html

相关阅读

网友评论

我要评论

发表

取消

南斗之主