感觉阿里的万相可以关注的点:
1、支持消费级 GPU:T2V-1.3B 型号只需要 8.19 GB VRAM,所以消费级 GPU就能跑。官方说,4分钟可以在 RTX 4090 上生成 5 秒钟的480P 视频。
2、可以生成中英文文本。之前图片、视频模型这方面表现都不太好。
3、当然就是开源了。接下来,前沿模型公司应该都会考虑在工具箱里放一个开源机型。



参考文献:
[1] https://tongyi.aliyun.com/wanxiang/videoCreation
[2] https://agi.taobao.com/
[3] Huggingface的:https://huggingface.co/Wan-AI
[4] GitHub的:https://github.com/Wan-Video/Wan2.1
(文:NLP工程化)