阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑

阿里开源的通义万相Wan2.1-VACE模型展示了强大的视频生成与编辑功能,包括基础的文生视频、图生视频和视频生视频等初级玩法;加入编辑功能如局部抹除或替换、视频重绘、时长或背景延展等中阶玩法;高阶玩法则能将各种能力花式组合。

迈向长上下文视频生成!FAR重塑下一帧预测范式,短视频与长视频双双登顶SOTA

本文首次系统性地研究并提出了高效建模长上下文视频生成的方法,通过重构视频生成任务为逐帧预测,并引入长短时上下文的非对称patchify策略和多层KV Cache机制,实现了高效的长视频训练与长上下文视频生成。

模型随你换,素材一处管:视频&图片创作者时间与成本双重解放

文章介绍了AI聚合应用Pollo AI的优势,包括覆盖全面且支持迅速的模型、丰富的视频和图像生成功能以及素材管理等。它在图像和视频领域提供了几乎所有的生成功能,并解决了创作链路复杂的问题。