Step-Video-T2V归档

阶跃星辰刚刚开源了其30B参数视频生成模型：Step-Video-T2V

上午8时 2025/02/19 作者 NLP工程化

阶跃星辰发布30B参数视频生成模型Step-Video-T2V，支持中英双语输入及可变长度视频生成，提供标准版和加速版。采用DiT架构与3D全注意力机制，使用DPO技术优化质量，配置推荐使用步骤推理步数及cfg_scale值。

下午12时 2025/02/18 作者 Founder Park

阶跃星辰开源了视频生成模型Step-Video-T2V和语音模型Step-Audio，参数量分别为300亿和67B。Step-Video-T2V在视频生成质量上表现优异；而Step-Audio是业内首个产品级的开源语音交互模型。