阶跃星辰刚刚开源了其30B参数视频生成模型:Step-Video-T2V
阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。
阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。
阶跃星辰开源了视频生成模型Step-Video-T2V和语音模型Step-Audio,参数量分别为300亿和67B。Step-Video-T2V在视频生成质量上表现优异;而Step-Audio是业内首个产品级的开源语音交互模型。