多模态模型
谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?
般会把最好的模型留到 I/O 大会上发布。但在 Gemini 时代,谷歌很可能会在三月的某个周二突然
字节最强多模态模型登陆火山引擎!Seed1.5-VL靠20B激活参数狂揽38项SOTA
字节推出视觉-语言多模态大模型Seed1.5-VL,具备更强的通用多模态理解和推理能力,在视频理解、视觉推理等方面表现突出。
阿里的移动端多模态大模型APP – MNN 又更新了
阿里的MNN移动端多模态大模型APP更新支持Qwen-2.5-omni-3b和7b,可以实现文本到文本、图像到文本等多种生成任务,提供速度优化的开发参考。
多模态=AGI入场券?阶跃星辰姜大昕:死磕基座大模型,探索多模态理解生成一体化
阶跃星辰表示将继续坚持基础大模型研发,并强调多模态理解生成一体化的重要性。公司已发布22款基座模型,其中16款为多模态模型。姜大昕解释称,多模态理解生成一体化意味着用一个模型同时完成理解和生成任务,而非三段式过程。他认为这需要更强的综合实力,目前在语言和视觉领域的理解生成一体化研究进展正积极推进。
对话阶跃星辰创始人姜大昕:多模态模型还没出现GPT-4时刻,坚持追求「智能上限」
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
对话阶跃星辰创始人:2年发16款多模态模型,实现AGI的必经之路
阶跃星辰创始人姜大昕详解多模态模型在AGI实现中的重要性及技术路径。他指出多模态是实现AGI的必经之路,并强调了多模态理解生成一体化的关键作用。目前多模态模型仍处于探索期,尚未出现像语言模型界的Transformer一样的可拓展架构。姜大昕还介绍了阶跃星辰在智能终端Agent、机器人等领域的应用策略及对未来技术演进路线的看法。