字节开源视觉-语言多模态大模型,AI理解现实世界的能力越来越强了。 下午11时 2025/05/23 作者 开源AI项目落地 字节开源的Seed1.5-VL是视觉-语言多模态大模型,支持多种复杂任务如盲人判断红绿灯和智能导盲。其包含5.32亿参数视觉编码器和200亿激活参数混合专家大语言模型,已在多个公开基准中表现出色。