实测万相2.1,全球首个中文文字生成开源模型,吊打Sora了?
DeepSeek开源周内,阿里发布了Wan2.1模型。该模型支持文生视频和图生视频任务,并且采用了宽松的Apache2.0协议。万相2.1在VBench评测中表现出色,但在文本生成、物理细节理解和变形处理等方面仍存在不足。通过采用3D时空变分自动编码器(Wan-VAE),模型能在消费级显卡上运行并优化内存使用和生成速度。
DeepSeek开源周内,阿里发布了Wan2.1模型。该模型支持文生视频和图生视频任务,并且采用了宽松的Apache2.0协议。万相2.1在VBench评测中表现出色,但在文本生成、物理细节理解和变形处理等方面仍存在不足。通过采用3D时空变分自动编码器(Wan-VAE),模型能在消费级显卡上运行并优化内存使用和生成速度。
DeepSeek开源的DeepGEMM库在Hopper GPU上实现FP8 GEMM,最高可达1350+ FP8 TFLOPS。它仅约300行代码,设计简洁,性能表现与专家调优的复杂库相当甚至更好,在各种矩阵形状和模型类型上均保持优势。
DeepSeek发布首个开源项目FlashMLA,专为英伟达Hopper GPU设计,实现了高效MLA解码内核,提供3000GB/s内存带宽和580TFLOPS计算性能,已在GitHub上吸引5000+星。
DeepEP是针对Hopper GPU优化的MoE模型训练与推理高效通信库,支持FP8和低延迟推理解码,通过NVLink和RDMA提升效率。
2024年12月,字节跳动豆包MarsCode、夸克AI创作平台及深度求索DeepSeek等新产品亮相,展现中国AI领域的创新活力和潜力。老牌选手如百度文心一言和Kimi也表现出色。
来自卡内基梅隆大学、斯坦福大学等的众多专家推出了全新物理仿真平台Genesis,它结合生成式AI和真实物理准确性,专为通用机器人、具身人工智能和物理AI应用设计。