最低调的「AI 六小龙」阶跃星辰,在 DeepSeek 浪潮中交出了一份新答卷
阶跃星辰在 Step UP 生态开放日公布了其探索 AGI 的方式,重点押注智能终端。公司强调多模态能力和推理能力的重要性,并已发布11款多模态大模型和开源了Step-Video-T2V视频生成模型与Step-Audio语音模型。姜大昕认为智能体技术的发展依赖于多模态能力和推理能力,两者结合能让AI像人一样理解和行动。
阶跃星辰在 Step UP 生态开放日公布了其探索 AGI 的方式,重点押注智能终端。公司强调多模态能力和推理能力的重要性,并已发布11款多模态大模型和开源了Step-Video-T2V视频生成模型与Step-Audio语音模型。姜大昕认为智能体技术的发展依赖于多模态能力和推理能力,两者结合能让AI像人一样理解和行动。
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。
DeepSeek引发的开源大模型热潮继续升温,两天内已有5款新AI模型对外开源。阶跃星辰联合吉利汽车集团宣布将与吉利合作的两款Step系列多模态大模型向全球开发者开源,其中包含全球最大视频生成模型和首款产品级语音交互大模型等。昆仑万维也发布了首个面向AI短剧创作的视频生成模型SkyReels-V1及表情动作可控算法SkyReels-A1,加速了AI短剧行业的融合与应用。
阶跃星辰开源了视频生成模型Step-Video-T2V和语音模型Step-Audio,参数量分别为300亿和67B。Step-Video-T2V在视频生成质量上表现优异;而Step-Audio是业内首个产品级的开源语音交互模型。