腾讯混元发布视频生成大模型
腾讯发布混元视频生成大模型HunyuanVideo,具备高清质感、运动流畅及多视角切换等功能,现已开源。该模型采用Transformer设计和MLLM文本编码器,并通过3D VAE进行压缩训练,支持多种重写模式以适应不同用户需求。
腾讯发布混元视频生成大模型HunyuanVideo,具备高清质感、运动流畅及多视角切换等功能,现已开源。该模型采用Transformer设计和MLLM文本编码器,并通过3D VAE进行压缩训练,支持多种重写模式以适应不同用户需求。
腾讯开源了最新最强文生视频模型HunyuanVideo(混元),具备物理模拟、一镜到底等特性。生成的视频细节丰富,如熊猫吃火锅、神仙弹琵琶等。混元模型支持生成带音乐的视频,并在参数量上达到业界最大规模。