阶跃星辰CEO姜大昕谈大模型最新技术趋势
阶跃星辰CEO姜大昕认为多模态是实现AGI的必经之路,并坚持全线布局。公司发布22款自研基座模型,平均每月发布一款基础大模型,因此被称为‘多模态卷王’。目前其覆盖文字、语音、图像、视频、音乐等全系列,其中16款为多模态模型。姜大昕强调了多模态在应用中的重要性,并指出智能终端Agent是其发力方向。
阶跃星辰CEO姜大昕认为多模态是实现AGI的必经之路,并坚持全线布局。公司发布22款自研基座模型,平均每月发布一款基础大模型,因此被称为‘多模态卷王’。目前其覆盖文字、语音、图像、视频、音乐等全系列,其中16款为多模态模型。姜大昕强调了多模态在应用中的重要性,并指出智能终端Agent是其发力方向。
阶跃星辰表示将继续坚持基础大模型研发,并强调多模态理解生成一体化的重要性。公司已发布22款基座模型,其中16款为多模态模型。姜大昕解释称,多模态理解生成一体化意味着用一个模型同时完成理解和生成任务,而非三段式过程。他认为这需要更强的综合实力,目前在语言和视觉领域的理解生成一体化研究进展正积极推进。
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
阶跃星辰创始人姜大昕详解多模态模型在AGI实现中的重要性及技术路径。他指出多模态是实现AGI的必经之路,并强调了多模态理解生成一体化的关键作用。目前多模态模型仍处于探索期,尚未出现像语言模型界的Transformer一样的可拓展架构。姜大昕还介绍了阶跃星辰在智能终端Agent、机器人等领域的应用策略及对未来技术演进路线的看法。
阶跃星辰在北京举行媒体沟通会,预计发布满血版推理模型Step R1及先进图片编辑模型。创始人姜大昕强调多模理解生成一体化是建立世界模型的最佳路径,未来将聚焦智能终端Agent和AGI方向。
3月10日,《做多中国行》上市公司行走进上海徐汇的阶跃星辰/财跃星辰。活动吸引超过30名投资者参与,双方介绍大模型应用及生态合作。阶跃星辰发布11款多模态大模型,涵盖语音识别、图像生成等,包括全球参数量最大的开源视频生成模型和业内首款产品级开源语音交互模型。
全球开发者先锋大会在上海落幕,多家厂商押注大模型和智能体方向。上海市启动模塑申城开源创新生态建设行动,旨在构建产业生态并挖掘培育AI项目。多个企业宣布开源计划,如百度文心大模型4.5将开源,阶跃星辰发布多模态大模型并宣布押注智能体方向。大会强调了布局语料、开发者生态的重要性。
阶跃星辰在上海举办首届Step UP生态开放日,透露多模态推理和Agent智能体技术作为未来重点关注方向,并发布全新升级的‘繁星计划’2.0。
阶跃星辰在 Step UP 生态开放日公布了其探索 AGI 的方式,重点押注智能终端。公司强调多模态能力和推理能力的重要性,并已发布11款多模态大模型和开源了Step-Video-T2V视频生成模型与Step-Audio语音模型。姜大昕认为智能体技术的发展依赖于多模态能力和推理能力,两者结合能让AI像人一样理解和行动。