阿里开源超强多模态模型!70亿参数干翻谷歌,看一眼秒出食谱,唠嗑更像人,还能视频聊天

阿里巴巴通义千问发布新一代端到端多模态旗舰模型Qwen2.5-Omni-7B,支持实时处理文本、图像、音频和视频等多种输入形式,并在多模态理解基准测试OmniBench上表现优异。