跳至内容
早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。
昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。
在这个闭门会上,混元直接又为这个AI年味添砖加瓦,开源了他们最新一代的3D大模型:
甚至因为知道很多人不会部署,就想快速用一下,还贴心的做了个线上的应用,腾讯的产品体验,那还是拉满的。。。
DeepSeek、混元、智谱、通义、面壁智能,我愿称为当今的开源五虎。
说回Hunyuan3D-2.0,从模型层面看,比较屌的是用了现在AI 3D业界效果最好的一种方式,就是把模型和材质进行解藕分步生成,用这样的架构,两个子模型可以各司其职,整体效果会比只用1个模型同时去生存模型和材质效果更好。
从他们自己的跑分和盲测来看,基本达到了AI 3D开源模型里面的No.1。
代码仓库:https://github.com/tencent/Hunyuan3D-2
模型权重:https://huggingface.co/tencent/Hunyuan3D-2
demo页面:https://huggingface.co/spaces/tencent/Hunyuan3D-2
除了开源之外,他们还贴心的做了一个产品,我们一直说,模型不是产品,模型根本没有任何用户体验,只有把基于模型能力做出来的符合用户需求的产品,才是最屌的产品。
而这次,他们做的这个产品——混元3D创作引擎,才是我觉得,整场发布会里面,最牛逼的。。。
不仅免费使用,支持文生3D、图生3D、纹理生成、低多边形生成、骨骼绑定、动作驱动、草图生3D、3D风格化、3D游戏等等。
甚至,还做了一个类似Comfyui的在线3D工作流。。。
网址在此:https://3d.hunyuan.tencent.com/
先给大家看一下Hunyuan3D-2.0生成的效果。
整体相比1.0,有了巨大的进步,在几何结构上,变得更加锐利,更加精准,材质也变得更加稳定了。
不过问题也是有的,比如在人物角色上,肢体已经表现的非常好了,但是AI 3D模型的糊脸通病也还是会有概率存在。
整体模型质量上,强的起飞,而且,这玩意是开源的,这就很牛逼。
除了模型外,最酷的,我觉得还是针对游戏所做的一整套工作流方案。
如果对于3D或者游戏有了解的朋友可能会知道,在游戏开发里,游戏模型是有面数的的面数非常的重要,有经验的建模大佬都是在能省的地方就省。
在能达到差不多效果的前提下,减少面数,节省内存,能让你的游戏玩起来不卡帧。
一般来说,主机游戏项目一般主角能干到十几万面左右,但是在手游项目里,一般角色都不能超过两万面。
所以说腾讯还是太懂了游戏了,在这次3D模型生成上,就给了一个非常实用的功能:低多边形。
简单的说,就是自适应给你用最小的面数实现你想生成的最优效果。
你作为一个游戏开发,你生成出来的东西,虽然还是会有AI 3D的很难二次编辑的问题,但是已经可以修改,并且直接扔到游戏引擎里面进行渲染,这一点我觉得还是蛮酷的。
很明显就是奔着解决游戏开发中模型的实际问题而去的,毕竟,中国你要说靠游戏这事吃饭的,腾讯敢说第一,没人敢说第二。
在实验室TAB里,还有几个有趣的功能,咱真的就是说,混元给的功能实在太多了。。。
3D纹理生成和草图生3D这两个,我自己觉得还是很有用的。
贴材质讲道理其实也是很浪费时间的,那我其实就可以直接传到混元3D里,用嘴来描述一下斧子的材质。
比如我就想要一把北欧时代的战斧,大概几十秒钟,就会在原模型的基础上,把贴图就给我生成完了。
比如我现在有这么一张草图,我想把这个妹子,变成3D的,看看是什么模样。
我就问你,习惯玩各种工作流的小伙伴,看到这玩意,熟不熟悉。
但是混元说,很快就会给大家开放,可以创建自己的工作流。
这玩意,上限有多高我想都不需要我描述了,能巨幅提高3D创作管线的效率。
可以一张图进去,进行背景去除,然后直接调整为T-pose,再进行模型和纹理生成,再进行骨骼绑定,输出动作动画。
最牛逼的一步,是把任意图扔进去,能直接给你变成T-pose。
你会发现,第二步把背景去掉,而第三步,直接把人物变成了T字型的人物造型。
后续的模型生成,也会以这个T字型的图片去进行生成。
转成T字型这一步,对于3D建模管线来说,非常重要。
手臂没法自然展开,因为你根本不知道他的手在哪,腿的位置也对不上,甚至整个模型都无法正确绑定骨骼。
更别说后续动画师要给角色添加动作了,没有T字型,他们的工作量会直接爆炸。而且绝壁会想杀了你。
T字型的作用,不只是方便建模和动画,还是整个3D管线流畅运作的关键。
所以,这小小的一步,就能看出来,腾讯,是真的懂游戏开发的痛点啊。。。
而且这种节点式的可视化操作,一下子就把3D创作的门槛往下拉了好几个档次。
等3D技术再发展发展,到了Hunyuan3D-3.0、4.0,是不是以后,我们可以把真实演员的定妆照扔进去,自动去背后,一键T-pose,再直接生成影视里可用的3D人物?
甚至再进一步,配合如今的AI自动配骨骼、AI动作捕捉、实时渲染技术,感觉能直接搞出类似《曼达洛人》那种虚拟拍摄。
再说游戏领域,腾讯本身就有一票儿顶尖游戏部门,像天美、光子、魔方。
很多时候,美术资源占了项目的大半成本和周期,而AI 3D的出现恰好能先解决大批量的基础建模、贴图、优化等工作。
尤其是一些NPC、小怪、道具、场景,完全可以用Hunyuan3D批量生成,然后再让美术做微调和二次设计就行。
这样就能把宝贵的人力和时间,更多集中在核心角色、故事氛围、独特风格这些高价值环节上,把故事把游戏,做的更加牛逼。
各大厂商一波接一波猛料,还没消化完DeepSeek R1的开源,就碰上混元又抛出Hunyuan3D-2.0。
仿佛大家,约定好要在旧年结束前,把所有火药一次性点燃,来一场璀璨的新春大秀。
相信无论你是不是从业者,都能感受到那股热浪滚滚的气息。
(文:数字生命卡兹克)