对话阶跃星辰创始人姜大昕:多模态模型还没出现GPT-4时刻,坚持追求「智能上限」
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
AI 大模型领域竞争激烈,阶跃星辰专注于多模态模型研发。创始人姜大昕认为 AGI 追求智能上限是当务之急,并描绘了模型三步曲演进路线。
阶跃星辰创始人姜大昕详解多模态模型在AGI实现中的重要性及技术路径。他指出多模态是实现AGI的必经之路,并强调了多模态理解生成一体化的关键作用。目前多模态模型仍处于探索期,尚未出现像语言模型界的Transformer一样的可拓展架构。姜大昕还介绍了阶跃星辰在智能终端Agent、机器人等领域的应用策略及对未来技术演进路线的看法。
AI 编程产品分为Cursor、Windsurf等IDE类产品和Vibe Coding类产品。Figma推出的新产品Figma Make支持导入Figma设计稿,并且能够直接修改设计稿中的元素,展示插画图片素材,具备接入地图API等功能。
谷歌在I/O开发者大会上发布了新版Gemini 2.5 Pro Preview,该模型已在网页版、App端和开发者平台全面上线,并提供免费的25次每日使用额度。它被认为目前是地表最强且免费的多模态模型,尤其擅长编程任务。此外,新版还支持100万 tokens 上下文,具备强大的推理能力和前端UI优化能力。
Aitrainee介绍并评测了阿里巴巴发布的Qwen3模型系列,包括多种参数规模的MoE和Dense模型,并展示了其在性能、多语言支持和推理预算方面的优势。
复杂文档处理是AI的基础但门槛高。常见文本类文档如Word/PDF格式复杂难处理,影响RAG应用效果。为提高效率,可将多种文档统一转为HTML或Markdown格式,并进行进一步处理。