阶跃星辰,发力智能终端 Agent

内容丨特工少女
编辑丨特工十五 特工小鹏
阶跃星辰这个品牌,老粉们一定不会感到陌生。我们在 2024 年 2 月 就关注到这家,名字和理念都跟特工宇宙气味相投的大模型创业公司。
而在上周五(2.21),特工们来阶跃星辰的首次生态开放日啦!现场还见到了非常多的老朋友!比如狸谱、林间聊愈室、物圆、胃之书等…
之前对阶跃星辰的“刻板印象”是多模态能力强、低调、开放。但这一次听完整个大会,又刷新了对阶跃的认知!
接下来就让我们同步一下阶跃这次生态大会都主要分享了些什么。
阶段性成果展示与未来战略规划

自 2023 年 4 月成立以来,阶跃星辰已发布了 11 款多模态大模型,涵盖语音识别、语音生成、多模态理解、图像及视频生成等领域。今年 1 月,还推出了 Step 系列的首款推理模型 Step R-mini,进一步拓展了大模型的能力边界。阶跃星辰创始人、CEO 姜大昕表示,阶跃星辰实现 AGI 的技术路线是模拟世界、探索世界和归纳世界,这一路径贯穿了公司的发展历程。

阶跃星辰近期已开源两款多模态大模型——文生视频模型 Step-Video-T2V 和语音模型 Step-Audio,并计划于 3 月份进一步开源图生视频模型。

近期发布的两款多模态大模型中,Step-Video-T2V 参数量高达 300亿,能够直接生成 204 帧、分辨率 540P 的高质量视频;Step-Audio 则是行业内首个产品级的开源语音交互模型,尤其在汉语水平考试中表现优异。

展望 2025 年,阶跃星辰将多模态和推理能力视为智能体发展的两大关键要素。并将智能终端 Agent 定位为大模型技术落地的核心突破点,重点布局汽车、手机、具身智能及 IoT 等关键应用场景。
发力 AI Agent

为什么 Agent 这个概念会在眼下这个时间点变得火热,以至于很多人认为 2025 年会是 Agent 的元年?

姜大昕博士认为 Agent 爆发需要两个必要条件,一个是多模态的能力,另一个是慢思考能力。这两个能力在 2024 年的时候阶跃都取得了突破性的进展。

姜大昕:“我认为 Agent 最重要的特点是能够自主地帮助人类完成复杂任务。所谓自主,顾名思义有两层含义,一个是自动一个是主动。自动,就是 Agent 在执行任务的时候尽可能自动完成,减少或无需人类干预。所谓主动,是 Agent 能根据用户所处的环境,也就是用户的 Context 主动发起任务而不仅是被动接受任务。要达成自主完成复杂任务这个目标还需要有一些辅助的属性,例如外部工具的能力,具有长期短期记忆能力,等等。”

基于自主研发的强大模型矩阵,阶跃星辰与合作伙伴共同打造了垂直领域 Agent 智能终端 Agent。在生态开放日中,阶跃邀请了来自金融、内容创作、新消费以及数字人领域的合作伙伴代表,以及优秀的 C 端开发者代表,分享他们在打造垂直领域 Agent 过程中的经验与收获。

除了垂直领域的 Agent,智能终端 Agent 也备受关注。许多人梦想拥有一个像《钢铁侠》中的 Jarvis 一样的智能助手,这一愿望在不久的将来将成为现实。无论是 AI 手机、PC、智能汽车、IoT 设备还是机器人,未来每一台终端设备都将配备一个 Agent。这些 Agent 将通过多模态方式与用户交互,帮助完成复杂任务。

随着底座大模型多模态能力和推理能力的不断增强,Agent 的能力也将不断演化。姜大昕博士将智能终端 Agent 的发展划分为五个阶段:

Level 1:简单任务

Agent 能够完成单一任务,通常是一个应用程序即可完成的任务。例如,打开支付宝并帮助用户在蚂蚁森林中收集能量。

Level 2:组合任务

Agent 能够完成需要多个步骤、跨越多个应用程序的任务。例如,将微信中提到的活动添加到日程中,并在活动开始前十分钟提醒用户。

Level 3:复杂任务

Agent 能够完成需要深度思考的复杂任务。例如,OpenAI 的 Deep Research 中提到的场景:用户希望购买滑雪板,Agent 需要搜索不同型号、比较价格、收集用户评论,并生成综合报告。

Level 4:主动任务执行

Agent 从被动完成任务转变为主动提示或完成任务。这需要对用户的环境和偏好有深入了解。例如,在会议中,领导提到某个话题时,Agent 默默找到相关材料并跳转到相关部分。

Level 5:情感陪伴

Agent 不仅具备智商,还具备情商。当前的聊天机器人只能通过文字与用户互动,而智能终端 Agent 能够陪伴用户在物理世界中发生的一切,真正做到感同身受,提供情绪价值和情感陪伴。

开放生态,发力终端

阶跃星辰还发布了“繁星计划”第二期,旨在为 Agent 应用开发者提供模型、算力、资本、数据和企业孵化等全方位支持。

此外,阶跃星辰将智能终端 Agent 视为大模型技术落地的核心突破点,并重点布局汽车、手机、具身智能、IoT 四大关键应用场景。

智能汽车:阶跃星辰与吉利汽车集团、智能科技公司千里科技深化技术合作,推动“AI+车”的深度融合。

手机:阶跃星辰与 OPPO 等手机厂商深度合作,将 Agent 技术集成到手机中,打造更智能的交互体验。基于阶跃 Step 系列多模态模型,OPPO 已推出“一键问屏”和“一键全能搜”功能,用户可以通过多模态视觉与 AI 交互,实现拍照问答、文档问答、识屏问答等多种功能。

具身智能:阶跃星辰与智元机器人战略合作,探索AI+具身机器人的应用场景。

IoT 终端:阶跃星辰与 TCL 等 IoT 平台和设备厂商紧密协作,推动设备间的智能化升级和体验的无缝连接。

    (文:特工宇宙)

    欢迎分享

    发表评论