IT之家 11-05
腾讯开源混元-3D:首个同时支持文生和图生的 3D 开源大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 11 月 5 日消息,腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型

▲ 文生模型

▲ 图生模型

模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产

第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建

第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构

最终该模型可以实现输入任意单视角实现三维生成

官方表示该模型的泛化能力和可控性强,可重建各类尺度物体,大到建筑,小到工具花草。

IT 之家附相关链接如下:

Github:https://github.com/Tencent/Hunyuan3D-1

Huggingface:https://huggingface.co/tencent/Hunyuan3D-1

研究论文:https://3d.hunyuan.tencent.com/hunyuan3d.pdf

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

腾讯 it之家 开源 准确
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论