腾讯开源AI图生视频模型，自媒体行业的实用AI工具+1。

开源的项目太多太多。

但技术总会有更新迭代，永无止境。

见了很多红极一时的开源项目，尤其是AI行业的，为了博流量猛推一波，即使当下效果很不错，也有可能再也见不到它更新。

腾讯开源的混元系列AI视频模型一直在持续更新着，效果也越来越好了。

毕竟腾讯的混元也算是它在开源AI方面的招牌。

这种密集的论文更新也着实少见。

混元AI视频模型的开源，可以说是造福了很多自媒体从业人员，当然也有很多开发者基于混元训练了更多的AI视频模型。

今天给大家推荐的是HunyuanVideo-I2V，一个图生视频的模型，我实测效果还不错。

应用场景：

角色动画：将静态角色图转化为动态视频
特效创作：为图片添加火焰、水流等动态元素
影视短片：快速生成分镜素材或概念验证视频

不过效果好不好，我一个人说了也不算，得广大用户说了算，如果不会自己部署的话，拉到最后有链接，去官网体验下。

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

项目简介

HunyuanVideo-I2V是基于腾讯混元团队开源的 HunyuanVideo 框架研发的图像到视频生成解决方案，通过token 替换技术与多模态大模型（MLLM）深度协同，实现静态图像到高分辨率动态视频的精准转化，具有高效可控的视频生成能力。适用于角色动画、影视分镜、特效创作等场景，代码与模型完全开源。

DEMO

核心技术特点

通过 MLLM 提取图像语义 tokens 并注入视频生成流程，确保首帧视觉一致性。
支持 720P 高清与 5 秒长视频生成。
独创LoRA 微调技术，可定制头发增长、拥抱等特效。
结合 xDiT 并行推理引擎，多 GPU 协同加速生成速度达 5.64 倍。

硬件要求

GPU

最低配置：单张 NVIDIA GPU（建议显存 ≥ 60GB，支持 CUDA）。
推荐配置：80GB 显存 GPU（如 NVIDIA A100），支持更高分辨率与更长视频生成。
多卡加速：支持 xDiT 并行推理（需 2-8 张 GPU），8 卡速度提升 5.64 倍。

内存

单卡推理：720p 视频需 60GB 显存，360p 训练需 79GB 显存。
多卡并行：根据分辨率与并行度动态调整（如 8 卡 720p 生成约需 80GB / 卡）。

存储

需至少 100GB 存储空间用于模型下载与缓存。

项目链接

https://github.com/Tencent/HunyuanVideo-I2V

体验链接

https://video.hunyuan.tencent.com/

关注「开源AI项目落地」公众号

（文：开源AI项目落地）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复