最低调「六小虎」阶跃星辰开年首秀:Agent落地智能终端,印奇也来了
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
阶跃星辰发布30B参数视频生成模型Step-Video-T2V,支持中英双语输入及可变长度视频生成,提供标准版和加速版。采用DiT架构与3D全注意力机制,使用DPO技术优化质量,配置推荐使用步骤推理步数及cfg_scale值。
DeepSeek引发的开源大模型热潮继续升温,两天内已有5款新AI模型对外开源。阶跃星辰联合吉利汽车集团宣布将与吉利合作的两款Step系列多模态大模型向全球开发者开源,其中包含全球最大视频生成模型和首款产品级语音交互大模型等。昆仑万维也发布了首个面向AI短剧创作的视频生成模型SkyReels-V1及表情动作可控算法SkyReels-A1,加速了AI短剧行业的融合与应用。
阶跃星辰开源了视频生成模型Step-Video-T2V和语音模型Step-Audio,参数量分别为300亿和67B。Step-Video-T2V在视频生成质量上表现优异;而Step-Audio是业内首个产品级的开源语音交互模型。
木易介绍了国内推理模型的发展历程和比较,重点讲述了阶跃星辰的Step R-mini模型,并通过具体问题测试了其性能及思考过程,指出了其过度思考、自我否定等问题。