

自 2023 年 4 月成立以来,阶跃星辰已发布了 11 款多模态大模型,涵盖语音识别、语音生成、多模态理解、图像及视频生成等领域。今年 1 月,还推出了 Step 系列的首款推理模型 Step R-mini,进一步拓展了大模型的能力边界。阶跃星辰创始人、CEO 姜大昕表示,阶跃星辰实现 AGI 的技术路线是模拟世界、探索世界和归纳世界,这一路径贯穿了公司的发展历程。

阶跃星辰近期已开源两款多模态大模型——文生视频模型 Step-Video-T2V 和语音模型 Step-Audio,并计划于 3 月份进一步开源图生视频模型。
近期发布的两款多模态大模型中,Step-Video-T2V 参数量高达 300亿,能够直接生成 204 帧、分辨率 540P 的高质量视频;Step-Audio 则是行业内首个产品级的开源语音交互模型,尤其在汉语水平考试中表现优异。

为什么 Agent 这个概念会在眼下这个时间点变得火热,以至于很多人认为 2025 年会是 Agent 的元年?
姜大昕博士认为 Agent 爆发需要两个必要条件,一个是多模态的能力,另一个是慢思考能力。这两个能力在 2024 年的时候阶跃都取得了突破性的进展。
姜大昕:“我认为 Agent 最重要的特点是能够自主地帮助人类完成复杂任务。所谓自主,顾名思义有两层含义,一个是自动一个是主动。自动,就是 Agent 在执行任务的时候尽可能自动完成,减少或无需人类干预。所谓主动,是 Agent 能根据用户所处的环境,也就是用户的 Context 主动发起任务而不仅是被动接受任务。要达成自主完成复杂任务这个目标还需要有一些辅助的属性,例如外部工具的能力,具有长期短期记忆能力,等等。”

基于自主研发的强大模型矩阵,阶跃星辰与合作伙伴共同打造了垂直领域 Agent 和智能终端 Agent。在生态开放日中,阶跃邀请了来自金融、内容创作、新消费以及数字人领域的合作伙伴代表,以及优秀的 C 端开发者代表,分享他们在打造垂直领域 Agent 过程中的经验与收获。
除了垂直领域的 Agent,智能终端 Agent 也备受关注。许多人梦想拥有一个像《钢铁侠》中的 Jarvis 一样的智能助手,这一愿望在不久的将来将成为现实。无论是 AI 手机、PC、智能汽车、IoT 设备还是机器人,未来每一台终端设备都将配备一个 Agent。这些 Agent 将通过多模态方式与用户交互,帮助完成复杂任务。
随着底座大模型多模态能力和推理能力的不断增强,Agent 的能力也将不断演化。姜大昕博士将智能终端 Agent 的发展划分为五个阶段:
Level 1:简单任务
Agent 能够完成单一任务,通常是一个应用程序即可完成的任务。例如,打开支付宝并帮助用户在蚂蚁森林中收集能量。
Level 2:组合任务
Agent 能够完成需要多个步骤、跨越多个应用程序的任务。例如,将微信中提到的活动添加到日程中,并在活动开始前十分钟提醒用户。
Level 3:复杂任务
Agent 能够完成需要深度思考的复杂任务。例如,OpenAI 的 Deep Research 中提到的场景:用户希望购买滑雪板,Agent 需要搜索不同型号、比较价格、收集用户评论,并生成综合报告。
Level 4:主动任务执行
Agent 从被动完成任务转变为主动提示或完成任务。这需要对用户的环境和偏好有深入了解。例如,在会议中,领导提到某个话题时,Agent 默默找到相关材料并跳转到相关部分。
Level 5:情感陪伴
Agent 不仅具备智商,还具备情商。当前的聊天机器人只能通过文字与用户互动,而智能终端 Agent 能够陪伴用户在物理世界中发生的一切,真正做到感同身受,提供情绪价值和情感陪伴。


开放生态,发力终端
阶跃星辰还发布了“繁星计划”第二期,旨在为 Agent 应用开发者提供模型、算力、资本、数据和企业孵化等全方位支持。
此外,阶跃星辰将智能终端 Agent 视为大模型技术落地的核心突破点,并重点布局汽车、手机、具身智能、IoT 四大关键应用场景。
智能汽车:阶跃星辰与吉利汽车集团、智能科技公司千里科技深化技术合作,推动“AI+车”的深度融合。
手机:阶跃星辰与 OPPO 等手机厂商深度合作,将 Agent 技术集成到手机中,打造更智能的交互体验。基于阶跃 Step 系列多模态模型,OPPO 已推出“一键问屏”和“一键全能搜”功能,用户可以通过多模态视觉与 AI 交互,实现拍照问答、文档问答、识屏问答等多种功能。
具身智能:阶跃星辰与智元机器人战略合作,探索AI+具身机器人的应用场景。
IoT 终端:阶跃星辰与 TCL 等 IoT 平台和设备厂商紧密协作,推动设备间的智能化升级和体验的无缝连接。



(文:特工宇宙)